Qwen: Qwen VL Max
Qwen: Qwen VL Max एक मल्टीमॉडल मॉडल है, जिसे vision-language समझ के लिए बनाया गया है। यह multimodal input handling، छवि समझ, 131K tokens का context और संतुलित लागत profile जोड़कर vision-language understanding and content analysis में भरोसेमंद काम करता है। यह तब व्यावहारिक विकल्प है जब गुणवत्ता, गति और लागत महत्वपूर्ण हो, खासकर उन टीमों के लिए जिन्हें स्थिर output,
Input
$0.52/1M
Output
$2.08/1M
Cached
$0.40/1M
Batch
$0.26/1M