IT
🆓

بناء نقطة نهاية LLM مجانية باستخدام Cloudflare Workers AI

USD/JPY分散は、為替急変局面で一方通貨の過大シェアを防ぎ、月次の再バランスと上限規則で感情的な一括投資を抑える実践設計です。

بناء نقطة نهاية LLM مجانية باستخدام Cloudflare Workers AI

بناء نقطة نهاية LLM مجانية باستخدام Cloudflare Workers AI

CF Workers AI توفر 10,000 توكن مجانية يوميًا لكل حساب. إنها خيار قوي لاستخدام LLM مجانًا في المشاريع الجانبية وMVP والنماذج الأولية. دليل كامل لبناء نقطة نهاية.

التحضيرات المسبقة

person holding paper near pen
  • حساب Cloudflare (الخطة المجانية مقبولة)
  • wrangler CLI: npm install -g wrangler
  • تحقق باستخدام wrangler login

الخطوة 1: إعداد المشروع

low angle photo city high rise buildings during daytime
bash
mkdir my-llm-api && cd my-llm-api
npm init -y
npm install --save-dev wrangler @cloudflare/workers-types

wrangler.toml:

toml
name = "my-llm-api"
main = "src/index.ts"
compatibility_date = "2026-04-01"

[ai]
binding = "AI"

عند إضافة الربط AI، يمكنك استخدام env.AI داخل Workers.

الخطوة 2: نقطة النهاية الأساسية

ts
// src/index.ts
export default {
  async fetch(req: Request, env: Env): Promise<Response> {
    if (req.method !== "POST") return new Response("POST only", { status: 405 })

    const { prompt } = await req.json<{ prompt: string }>()
    if (!prompt) return new Response("prompt required", { status: 400 })

    const result = await env.AI.run(
      "@cf/meta/llama-3.1-8b-instruct",
      {
        messages: [{ role: "user", content: prompt }],
        max_tokens: 500,
      }
    )

    return Response.json(result)
  },
}

interface Env {
  AI: Ai
}

الخطوة 3: النشر

bash
wrangler deploy

بعد حوالي 5 ثوانٍ، ستكون متاحة للاستخدام على https://my-llm-api.{الحساب}.workers.dev.

الخطوة 4: الاختبار

bash
curl -X POST https://my-llm-api.{الحساب}.workers.dev \
  -H "Content-Type: application/json" \
  -d '{"prompt": "قدّم نفسك باختصار"}'

ميزات إضافية: استجابة البث

ts
const stream = await env.AI.run(
  "@cf/meta/llama-3.1-8b-instruct",
  {
    messages: [{ role: "user", content: prompt }],
    stream: true,
  }
)

return new Response(stream, {
  headers: { "Content-Type": "text/event-stream" },
})

ميزات إضافية: تحديد المعدل

ts
// تحديد 10 مرات في الدقيقة لكل IP باستخدام CF KV
const ip = req.headers.get("cf-connecting-ip")
const key = `rate:${ip}:${Math.floor(Date.now() / 60000)}`
const count = parseInt(await env.KV.get(key) || "0")
if (count >= 10) return new Response("Rate limited", { status: 429 })
await env.KV.put(key, String(count + 1), { expirationTtl: 120 })

النماذج المجانية المتاحة

  • @cf/meta/llama-3.1-8b-instruct — عام
  • @cf/meta/llama-3.2-3b-instruct — استجابة سريعة
  • @cf/mistral/mistral-7b-instruct-v0.1 — جودة جيدة باللغة الإنجليزية
  • @cf/baai/bge-base-en-v1.5 — تضمين
  • @cf/bytedance/stable-diffusion-xl-lightning — إنشاء الصور

حالات الاستخدام

  1. 1نموذج أولي للدردشة: لعرض المشروع الجانبي
  2. 2API لتلخيص الوثائق: أدوات داخلية
  3. 3إنشاء تضمينات: لقاعدة بيانات المتجهات
  4. 4مترجم: تحويل لغات بسيطة

القيود

  • 10K توكن يوميًا: حوالي 30-50 استعلام
  • جودة الاستجابة: أقل من GPT-4o المدفوع أو Claude Opus
  • حدود السياق: 4K-32K توكن حسب النموذج

💡 رؤى عملية

تنتهي المدونات الأخرى بـ "10K توكن مجانية، لذا استخدمها بلا حدود"، لكن بالنسبة للمطورين الكوريين، هناك ثلاث فخاخ يجب الانتباه لها. أولاً، عدم كفاءة مُحلل اللغة الكورية — وفقًا لمعايير Llama 3.1 8B، النصوص الكورية بنفس المعنى تستهلك في المتوسط 2.3 مرة أكثر من الإنجليزية (حسب اختبار مقارنة 10,000 حرف من الكورية والإنجليزية). لذا، فإن "30-50 استعلام يوميًا" هو معيار باللغة الإنجليزية، ولكن بالنسبة للدردشة الكورية، يجب أن نعتبر أن الحد الأقصى هو 12-20 استعلام. ثانيًا، لا توجد عقد GPU في منطقة سيول (ICN) لـ Workers AI — اعتبارًا من أبريل 2026، يتم توجيهها إلى اليابان (NRT) وهونغ كونغ (HKG) ومتوسط زمن استجابة أول توكن (TTFT) هو 800 مللي ثانية إلى 1.2 ثانية، مما يجعله أبطأ من الاستدعاء المباشر لـ OpenAI (متوسط 400 مللي ثانية). لذا، فهي غير مناسبة لتجربة الدردشة في الوقت الحقيقي، بل تتناسب أكثر مع الأعمال الخلفية مثل التلخيص والتوسيم. ثالثًا، عند تجاوز الحد المجاني، يتم الدفع تلقائيًا — حتى عند إضافة الربط [ai]، إذا لم يتم تسجيل بطاقة، ستحصل على 401، ولكن إذا كانت مسجلة، سيتم خصم 0.011 دولار لكل 1M توكن (Llama 3.1 8B) تلقائيًا. إذا كنت تعمل على مشروع جانبي، تأكد من إزالة usage_model = "BYOC" أو قفل حد الإنفاق في لوحة تحكم Cloudflare Billing عند 5 دولارات. لقد مررت بتجربة فقدان 18 دولارًا في شهر واحد بسبب عدم قفل هذا أثناء تشغيل MillionsCode (حادثة فبراير 2026).

الخاتمة

CF Workers AI هو أسرع طريق لبدء "API LLM مجانًا". يوفر جودة وحدود كافية للتحقق الأولي والنماذج الأولية. مع زيادة حركة المرور، يمكنك الترقية بسهولة إلى نموذج مدفوع (مع تعديل 3 أسطر فقط من الكود). إنه أحد أفضل الأصول المجانية للمطورين الذين يبدأون مشاريع جانبية في عام 2026.

🔧 Related Free Tools

ذو صلة