تعرّف على كيفية تتبّع استهلاكك من الرصيد، وفهم آلية احتساب الرموز (Tokens)، وتحسين طلباتك لخفض التكلفة.
يمكنك الاستعلام عن رصيدك الحالي برمجيًا في أي وقت عبر نقطة النهاية التالية:
GET https://llmapi.resayil.io/api/billing/subscription
Authorization: Bearer YOUR_API_KEY
يعيد الطلب الناجح استجابةً بتنسيق JSON تحتوي على تفاصيل الاشتراك وإجمالي الرصيد المتبقي:
{
"tier": "free",
"status": "active",
"expires_at": null,
"credits": 842.50
}
حقل credits يمثّل رصيدك المتاح حاليًا. تُخصم الرصيدة مع كل طلب بحسب عدد الرموز والنموذج المستخدَم.
يقيس النظام استهلاكك بالرموز (Tokens). الرمز الواحد يعادل تقريبًا أربعة أحرف باللغة الإنجليزية، أو كلمة إلى كلمة ونصف. كل طلب يحتسب نوعين من الرموز:
تظهر هذه القيم في حقل usage ضمن كل استجابة:
{
"usage": {
"prompt_tokens": 42,
"completion_tokens": 118,
"total_tokens": 160
}
}
لا تُخصم الرموز بمعدل ثابت لجميع النماذج. يعتمد النظام على معامل ضرب خاص بكل نموذج يعكس تكلفته التشغيلية:
| نوع النموذج | معامل الضرب | أمثلة |
|---|---|---|
| النماذج القياسية | 0.5× – 1.5× | Mistral, Llama 3, Neural Chat |
| النماذج المتقدمة | 2× – 3.5× | GPT-4o, Claude 3.5, Gemini Pro |
مثال: إذا أرسلت طلبًا بـ 200 رمز إجماليًا باستخدام نموذج محلي بمعامل 1×، يُخصم 200 رصيدة. نفس الطلب عبر نموذج سحابي بمعامل 3×، يُخصم 600 رصيدة.
ملاحظة: يمكنك الاطلاع على معامل الضرب الدقيق لكل نموذج في صفحة النماذج المتاحة.
يدعم LLM Resayil وضعَي الاستجابة: الكاملة (non-streaming) والبث الفوري (streaming عبر stream: true). آلية احتساب الرموز متطابقة في كلا الوضعين — الفارق يكمن في طريقة استلام البيانات فحسب:
الخصم من الرصيد يتمّ بعد اكتمال الاستجابة بالكامل في كلتا الحالتين. لا يتأثر إجمالي الرموز المحتسبة بطريقة الاستلام.
يحتفظ النظام بطابع زمني (last_used_at) لكل مفتاح API، يُحدَّث بدقة كل دقيقة لتقليل الضغط على قاعدة البيانات. يمكنك مشاهدة هذه القيمة في صفحة مفاتيح API في لوحة التحكم.
يُفيد هذا المؤشر في رصد النشاط غير المعتاد أو التحقق من أن التطبيق يستخدم المفتاح الصحيح. إن رأيت مفتاحًا لم يُستخدَم منذ فترة طويلة، يُنصح بإلغائه وإنشاء مفتاح جديد.
اتبع هذه الممارسات لخفض تكلفة طلباتك دون التضحية بالجودة:
نصيحة: جرّب نماذج مختلفة على مهامك وقارن جودة الاستجابة بالتكلفة. في كثير من الحالات، يؤدي نموذج محلي بسرعة أعلى وتكلفة أقل نفس المهمة بشكل ممتاز.