Baidu: ERNIE 4.5 VL 424B A47B
Baidu: ERNIE 4.5 VL 424B A47B هو نموذج متعدد الوسائط مخصص لـفهم الرؤية واللغة. يجمع بين معالجة الإدخال متعدد الوسائط، فهم الصور وسياق بحجم 123K tokens وملف متوازن التكلفة لتقديم عمل موثوق في vision-language understanding and content analysis. وهو خيار عملي عندما تكون الجودة والسرعة والتكلفة مهمة، خصوصًا للفرق التي تحتاج إلى مخرجات ثابتة ونشر مرن ومساحة للتوسع.
Input
$0.42/1M
Output
$1.25/1M
Cached
$0.06/1M
Batch
$0.28/1M