Qwen: Qwen VL Max
Qwen: Qwen VL Max هو نموذج متعدد الوسائط مخصص لـفهم الرؤية واللغة. يجمع بين معالجة الإدخال متعدد الوسائط، فهم الصور وسياق بحجم 131K tokens وملف متوازن التكلفة لتقديم عمل موثوق في vision-language understanding and content analysis. وهو خيار عملي عندما تكون الجودة والسرعة والتكلفة مهمة، خصوصًا للفرق التي تحتاج إلى مخرجات ثابتة ونشر مرن ومساحة للتوسع.
Input
$0.52/1M
Output
$2.08/1M
Cached
$0.40/1M
Batch
$0.26/1M