Google: Gemma 3n 4B
Google: Gemma 3n 4B هو نموذج نصي مخصص لـفهم الرؤية واللغة. يجمع بين معالجة الإدخال متعدد الوسائط، معالجة الصوت وسياق بحجم 33K tokens وملف منخفض التكلفة لتقديم عمل موثوق في audio understanding and multimodal input. وهو خيار عملي عندما تكون زمن الاستجابة والتكلفة والإنتاجية مهمة، خصوصًا للفرق التي تحتاج إلى مخرجات ثابتة ونشر مرن ومساحة للتوسع.
Input
$0.06/1M
Output
$0.12/1M