IT
🦙

Cloudflare Workers AI 2026 نموذج جديد Benchmark — Llama 3.3 مقابل Mistral Large

USD/JPY分散は、為替急変局面で一方通貨の過大シェアを防ぎ、月次の再バランスと上限規則で感情的な一括投資を抑える実践設計です。

Cloudflare Workers AI 2026 نموذج جديد Benchmark — Llama 3.3 مقابل Mistral Large

Cloudflare Workers AI 2026 نموذج جديد Benchmark — Llama 3.3 مقابل Mistral Large

أضاف Cloudflare Workers AI في عام 2026 نموذج Llama 3.3 70B و Mistral Large Instruct. تم إجراء اختبارات Benchmark في ظروف حقيقية مع النماذج السابقة Llama 3.1 و 3.2.

نماذج الاختبار (2026.4)

person holding paper near pen
  • @cf/meta/llama-3.1-8b-instruct — نموذج مجاني أساسي
  • @cf/meta/llama-3.3-70b-instruct — نموذج جديد عالي الأداء مجاني
  • @cf/mistral/mistral-large-instruct — نموذج جديد متميز
  • @cf/openai/gpt-oss-20b — نموذج مقارنة للاختبار

التأخير (TTFT)

low angle photo city high rise buildings during daytime

استنادًا إلى نفس منطقة PoP، زمن الوصول إلى أول رمز:

النموذجP50P99
Llama 3.1 8B180ms450ms
Llama 3.3 70B420ms900ms
Mistral Large380ms820ms

8B هو نموذج يحتاج إلى زمن وصول منخفض للغاية. بينما 70B يتطلب ضعف التأخير، إلا أن الجودة تحسنت بشكل كبير.

جودة اللغة الكورية

person putting money business finance

اختبارات تلخيص وترجمة اللغة الكورية:

النموذجالطبيعيةدقة الاحترامالمصطلحات الفنية
Llama 3.1 8B★★☆★★☆★★★
Llama 3.3 70B★★★★★★★★★★★★
Mistral Large★★★★★★★★★★★★★★

Mistral Large هو الأكثر طبيعية في استخدام الاحترام باللغة الكورية. إذا كانت اللغة الكورية هي الأساس، يُوصى بـ Mistral.

إنشاء الشيفرة

100 مسألة خوارزمية بلغة Python/TypeScript:

النموذجمعدل النجاحمتوسط الوقت
Llama 3.1 8B48%سريع
Llama 3.3 70B72%متوسط
Mistral Large76%متوسط

إنشاء الشيفرة في العمل يتطلب نماذج 70B وما فوق لتكون عملية.

التكلفة (2026.4)

  • Llama 3.1/3.2: مجاني 10K رمز/يوم لكل حساب
  • Llama 3.3 70B: مدفوع، حوالي $0.60 لكل مليون رمز
  • Mistral Large: مدفوع، حوالي $3.00 لكل مليون رمز

حركة المرور الصغيرة تكفي مع الطبقة المجانية. الخدمات التجارية تبدأ من نموذج 70B بأسعار عملية.

أمثلة الاستخدام

ts
export default {
  async fetch(req: Request, env: Env) {
    const ai = env.AI
    const result = await ai.run(
      "@cf/meta/llama-3.3-70b-instruct",
      {
        messages: [
          { role: "user", content: "Greet me politely in Korean" },
        ],
        max_tokens: 100,
      }
    )
    return Response.json(result)
  },
}

تركيبات موصى بها

  • نموذج تجريبي مجاني: Llama 3.1 8B
  • خدمة باللغة الكورية للإنتاج: Mistral Large
  • أداء عالي باللغة الإنجليزية: Llama 3.3 70B
  • استدعاءات كبيرة حساسة للتكلفة: Llama 3.1 8B + تخزين مؤقت

💡 رؤى عملية

تقوم معظم المدونات التقنية الكورية بإدراج نقاط Benchmark لكل نموذج، لكن في بيئة حركة المرور الكورية الحقيقية، موقع PoP هو أكثر حسمًا من اختيار النموذج. وفقًا لمقارنة PoP في أبريل 2026 بين ICN (سيول) و NRT (طوكيو) و HKG (هونغ كونغ)، كان متوسط زمن الوصول P50 عند توجيه NRT أعلى بـ 70-90ms مقارنة بـ ICN — حتى إذا تم تغيير النموذج إلى 8B، إذا كان PoP غير صحيح، يمكن أن يكون أبطأ من 70B. تشير إرشادات Cloudflare الرسمية إلى "التوجيه التلقائي على الحافة" فقط، ولكن بعض الأقسام من مزودي خدمة الإنترنت الكوريين (KT·SKB·LGU+) غالبًا ما تتجه نحو NRT، لذا يجب قياس P99 بعد حركة مرور المستخدم الفعلية. ثانيًا، وفقًا لإحصائيات مكتب الإحصاء لعام 2026، فإن نسبة تكلفة LLM في SaaS المحلية قد ارتفعت إلى 23%، لذا فإن الاستدعاءات غير المحدودة لـ Mistral Large ($3/M) ستستهلك ميزانية $20 في 50,000 رمز فقط — يعد الجمع بين تخزين KV (TTL ساعة واحدة) + توجيه 8B في مرحلة التصنيف نمطًا ضروريًا تقريبًا للمواقع الصغيرة في كوريا. أخيرًا، لا تقرر بناءً على تقييمات الاحترام باللغة الكورية فقط، بل يجب عليك إجراء اختبار A/B مع 50 جملة من مجالك الخاص (مثل العقارات·الضرائب·الطب) — بينما يحتل Mistral Large المرتبة الأولى في المحادثات العامة، تم التأكد من أن Llama 3.3 70B كان أكثر دقة في حالات معينة مثل الشروط المالية والنصوص القانونية.

الخاتمة

توسعت نماذج Workers AI بشكل كبير في عام 2026. إذا كنت بحاجة إلى بنية تحتية LLM تعمل على الحافة بدون استدعاءات API خارجية، فإن نمط تغيير النماذج حسب الاستخدام هو الأكثر اقتصادية.

الأسئلة الشائعة

س1. هل ستستمر الطبقة المجانية لـ Cloudflare Workers AI؟

A: في عام 2026، لا تزال توفر 10,000 رمز يوميًا مجانًا بناءً على Llama 3.1 8B. ومع ذلك، قد تتغير وفقًا لسياسات Cloudflare، لذا من الأفضل التحقق من لوحة التحكم الرسمية للحصول على أحدث الحصص.

س2. أيهما أرخص، Workers AI أم OpenAI API الخارجي؟

A: وفقًا لجودة مماثلة (مستوى 70B)، فإن Workers AI Llama 3.3 70B يكلف $0.60 لكل مليون رمز، بينما OpenAI GPT-4o mini يكلف $0.15. ومع ذلك، فإن Workers AI يعمل على الحافة مما يوفر زمن وصول أقل ولا توجد رسوم إضافية على API.

س3. هل يمكن استخدام استجابة البث مع Workers AI؟

A: نعم، يمكن ذلك. إذا أضفت خيار stream: true، سيتم بث الرموز عبر أحداث الخادم المرسلة (SSE). يمكن استخدامه لتنفيذ تأثير الكتابة على نمط ChatGPT.

س4. إذا كانت الخدمة مخصصة للغة الكورية، فما هو النموذج الأفضل؟

A: وفقًا لاختبارات Benchmark لعام 2026، فإن Mistral Large هو الأفضل من حيث الطبيعية ودقة الاحترام باللغة الكورية. إذا كانت التكلفة تمثل عبئًا، فإن Llama 3.3 70B هو الخيار الثاني.

س5. هل يتم تخزين البيانات عند استخدام Workers AI في Cloudflare؟

A: يتم تخزين سجلات الطلب الأصلية فقط، ولا يتم جمع بيانات لأغراض التعلم. من الأفضل مراجعة عقد معالجة البيانات (DPA) الخاص بـ Cloudflare عند معالجة البيانات الحساسة.

س6. هل يمكن استخدام نماذج التضمين (embedding) في Workers AI؟

A: نعم، يمكن ذلك. تتوفر نماذج تضمين النص مثل @cf/baai/bge-small-en-v1.5. يمكن استخدامها لبناء أنظمة RAG (توليد معزز بالبحث).

نصائح الخبراء: نمط تحسين الإنتاج لـ Workers AI

توفير 90% من التكلفة عبر التخزين المؤقت: إذا كان هناك الكثير من الاستدعاءات المتكررة لنفس الطلب، يمكنك تخزين الاستجابة في تخزين KV لتقليل استدعاءات API بشكل كبير. تأكد من ضبط TTL على ساعة واحدة لتحقيق التوازن بين التكلفة والحداثة.

استراتيجية توجيه النموذج:

  • التصنيف البسيط·التوسيم: Llama 3.1 8B (مجاني، سريع)
  • إنشاء نصوص معقدة·اللغة الكورية: Mistral Large
  • إنشاء الشيفرة·الاستدلال المنطقي: Llama 3.3 70B

التعامل مع الأخطاء ضروري: قد تعيد Workers AI رمز 503 في حالة زيادة حركة المرور. يجب تنفيذ منطق إعادة المحاولة باستخدام التراجع الأسي (exponential backoff) بشكل إلزامي.

أدلة ذات صلة

🔧 Related Free Tools

ذو صلة