IT٢١ أبريل ٢٠٢٦

🆓

بناء نقطة نهاية LLM مجانية باستخدام Cloudflare Workers AI

دليل عملي حول بناء نقطة نهاية LLM مجانية باستخدام Cloudflare Workers AI مع نقاط فحص أساسية ومخاطر وأدوات مرتبطة لاتخاذ قرار أفضل.

بناء نقطة نهاية LLM مجانية باستخدام Cloudflare Workers AI

CF Workers AI توفر 10,000 توكن مجانية يوميًا لكل حساب. إنها خيار قوي لاستخدام LLM مجانًا في المشاريع الجانبية وMVP والنماذج الأولية. دليل كامل لبناء نقطة نهاية.

التحضيرات المسبقة

بناء نقطة نهاية LLM مجانية باستخدام Cloudflare Workers AI visual reference 1

حساب Cloudflare (الخطة المجانية مقبولة)
wrangler CLI: npm install -g wrangler
تحقق باستخدام wrangler login

الخطوة 1: إعداد المشروع

bash

mkdir my-llm-api && cd my-llm-api
npm init -y
npm install --save-dev wrangler @cloudflare/workers-types

wrangler.toml:

toml

name = "my-llm-api"
main = "src/index.ts"
compatibility_date = "2026-04-01"

[ai]
binding = "AI"

عند إضافة الربط AI، يمكنك استخدام env.AI داخل Workers.

الخطوة 2: نقطة النهاية الأساسية

// src/index.ts
export default {
  async fetch(req: Request, env: Env): Promise<Response> {
    if (req.method !== "POST") return new Response("POST only", { status: 405 })

    const { prompt } = await req.json<{ prompt: string }>()
    if (!prompt) return new Response("prompt required", { status: 400 })

    const result = await env.AI.run(
      "@cf/meta/llama-3.1-8b-instruct",
      {
        messages: [{ role: "user", content: prompt }],
        max_tokens: 500,
      }
    )

    return Response.json(result)
  },
}

interface Env {
  AI: Ai
}

الخطوة 3: النشر

bash

wrangler deploy

بعد حوالي 5 ثوانٍ، ستكون متاحة للاستخدام على https://my-llm-api.{الحساب}.workers.dev.

الخطوة 4: الاختبار

bash

curl -X POST https://my-llm-api.{الحساب}.workers.dev \
  -H "Content-Type: application/json" \
  -d '{"prompt": "قدّم نفسك باختصار"}'

ميزات إضافية: استجابة البث

const stream = await env.AI.run(
  "@cf/meta/llama-3.1-8b-instruct",
  {
    messages: [{ role: "user", content: prompt }],
    stream: true,
  }
)

return new Response(stream, {
  headers: { "Content-Type": "text/event-stream" },
})

ميزات إضافية: تحديد المعدل

// تحديد 10 مرات في الدقيقة لكل IP باستخدام CF KV
const ip = req.headers.get("cf-connecting-ip")
const key = `rate:${ip}:${Math.floor(Date.now() / 60000)}`
const count = parseInt(await env.KV.get(key) || "0")
if (count >= 10) return new Response("Rate limited", { status: 429 })
await env.KV.put(key, String(count + 1), { expirationTtl: 120 })

النماذج المجانية المتاحة

@cf/meta/llama-3.1-8b-instruct — عام
@cf/meta/llama-3.2-3b-instruct — استجابة سريعة
@cf/mistral/mistral-7b-instruct-v0.1 — جودة جيدة باللغة الإنجليزية
@cf/baai/bge-base-en-v1.5 — تضمين
@cf/bytedance/stable-diffusion-xl-lightning — إنشاء الصور

حالات الاستخدام

1نموذج أولي للدردشة: لعرض المشروع الجانبي
2API لتلخيص الوثائق: أدوات داخلية
3إنشاء تضمينات: لقاعدة بيانات المتجهات
4مترجم: تحويل لغات بسيطة

القيود

10K توكن يوميًا: حوالي 30-50 استعلام
جودة الاستجابة: أقل من GPT-4o المدفوع أو Claude Opus
حدود السياق: 4K-32K توكن حسب النموذج

💡 رؤى عملية

تنتهي المدونات الأخرى بـ "10K توكن مجانية، لذا استخدمها بلا حدود"، لكن بالنسبة للمطورين الكوريين، هناك ثلاث فخاخ يجب الانتباه لها. أولاً، عدم كفاءة مُحلل اللغة الكورية — وفقًا لمعايير Llama 3.1 8B، النصوص الكورية بنفس المعنى تستهلك في المتوسط 2.3 مرة أكثر من الإنجليزية (حسب اختبار مقارنة 10,000 حرف من الكورية والإنجليزية). لذا، فإن "30-50 استعلام يوميًا" هو معيار باللغة الإنجليزية، ولكن بالنسبة للدردشة الكورية، يجب أن نعتبر أن الحد الأقصى هو 12-20 استعلام. ثانيًا، لا توجد عقد GPU في منطقة سيول (ICN) لـ Workers AI — اعتبارًا من أبريل 2026، يتم توجيهها إلى اليابان (NRT) وهونغ كونغ (HKG) ومتوسط زمن استجابة أول توكن (TTFT) هو 800 مللي ثانية إلى 1.2 ثانية، مما يجعله أبطأ من الاستدعاء المباشر لـ OpenAI (متوسط 400 مللي ثانية). لذا، فهي غير مناسبة لتجربة الدردشة في الوقت الحقيقي، بل تتناسب أكثر مع الأعمال الخلفية مثل التلخيص والتوسيم. ثالثًا، عند تجاوز الحد المجاني، يتم الدفع تلقائيًا — حتى عند إضافة الربط [ai]، إذا لم يتم تسجيل بطاقة، ستحصل على 401، ولكن إذا كانت مسجلة، سيتم خصم 0.011 دولار لكل 1M توكن (Llama 3.1 8B) تلقائيًا. إذا كنت تعمل على مشروع جانبي، تأكد من إزالة usage_model = "BYOC" أو قفل حد الإنفاق في لوحة تحكم Cloudflare Billing عند 5 دولارات. لقد مررت بتجربة فقدان 18 دولارًا في شهر واحد بسبب عدم قفل هذا أثناء تشغيل MillionsCode (حادثة فبراير 2026).

الخاتمة

CF Workers AI هو أسرع طريق لبدء "API LLM مجانًا". يوفر جودة وحدود كافية للتحقق الأولي والنماذج الأولية. مع زيادة حركة المرور، يمكنك الترقية بسهولة إلى نموذج مدفوع (مع تعديل 3 أسطر فقط من الكود). إنه أحد أفضل الأصول المجانية للمطورين الذين يبدأون مشاريع جانبية في عام 2026.

🔧 أدوات مجانية مرتبطة

💰

RPM Revenue Calculator

AdSense monthly revenue calc

📝

Word Counter

Real-time word & character count

💱

Currency Converter

Live currency conversion

⚡

BMI & Calorie Calc

BMI & TDEE calculator

الخطوة التالية

تابع من هذا الدليل

ذو صلة

IT7 طرق عملية لتحقيق INP 200ms في 2026

Practical guide to 7 طرق عملية لتحقيق INP 200ms في 2026, with a clear checklist,...

ITRTX 5070 مقابل RTX 5080: دليل شراء GPU لتدريب الذكاء الاصطناعي

دليل شراء عملي يقارن بين RTX 5070 وRTX 5080 لتدريب الذكاء الاصطناعي، ويغطي VRAM،...

IT6 طرق لتحقيق دخل جانبي باستخدام ChatGPT — دليل عملي ومجرّب لتحقيق الربح في 2026

دليل عملي حول 6 طرق لتحقيق دخل جانبي باستخدام ChatGPT — دليل عملي ومجرّب لتحقيق ...

IT2026 ChatGPT مقابل Claude مقابل Gemini — مقارنة أداء وسعر وطرق استخدام روبوتات الدردشة بالذكاء الاصطناعي

دليل عملي حول 2026 ChatGPT مقابل Claude مقابل Gemini — مقارنة أداء وسعر وطرق است...

المدونة الأدوات المراكز مختارات المالية