Qwen: Qwen3 VL 235B A22B Instruct
Qwen: Qwen3 VL 235B A22B Instruct एक मल्टीमॉडल मॉडल है, जिसे vision-language समझ के लिए बनाया गया है। यह multimodal input handling، छवि समझ, 262K tokens का context और कम लागत profile जोड़कर image and video understanding में भरोसेमंद काम करता है। यह तब व्यावहारिक विकल्प है जब गुणवत्ता, गति और लागत महत्वपूर्ण हो, खासकर उन टीमों के लिए जिन्हें स्थिर output,
Input
$0.20/1M
Output
$0.88/1M
Cached
$0.11/1M
Batch
$0.10/1M