Qwen: Qwen VL Plus
Qwen: Qwen VL Plus هو نموذج متعدد الوسائط مخصص لـفهم الرؤية واللغة. يجمع بين معالجة الإدخال متعدد الوسائط، فهم الصور وسياق بحجم 131K tokens وملف منخفض التكلفة لتقديم عمل موثوق في vision-language understanding and content analysis. وهو خيار عملي عندما تكون الجودة والسرعة والتكلفة مهمة، خصوصًا للفرق التي تحتاج إلى مخرجات ثابتة ونشر مرن ومساحة للتوسع.
Input
$0.14/1M
Output
$0.41/1M
Cached
$0.03/1M
Batch
$0.10/1M