Baidu: ERNIE 4.5 VL 28B A3B
Baidu: ERNIE 4.5 VL 28B A3B एक मल्टीमॉडल मॉडल है, जिसे vision-language समझ के लिए बनाया गया है। यह multimodal input handling، छवि समझ, 30K tokens का context और कम लागत profile जोड़कर vision-language understanding and content analysis में भरोसेमंद काम करता है। यह तब व्यावहारिक विकल्प है जब गुणवत्ता, गति और लागत महत्वपूर्ण हो, खासकर उन टीमों के लिए जिन्हें स्थिर output,
Input
$0.14/1M
Output
$0.56/1M
Cached
$0.01/1M
Batch
$0.05/1M