Baidu: ERNIE 4.5 VL 424B A47B
Baidu: ERNIE 4.5 VL 424B A47B एक मल्टीमॉडल मॉडल है, जिसे vision-language समझ के लिए बनाया गया है। यह multimodal input handling، छवि समझ, 123K tokens का context और संतुलित लागत profile जोड़कर vision-language understanding and content analysis में भरोसेमंद काम करता है। यह तब व्यावहारिक विकल्प है जब गुणवत्ता, गति और लागत महत्वपूर्ण हो, खासकर उन टीमों के लिए जिन्हें स्थिर output,
Input
$0.42/1M
Output
$1.25/1M
Cached
$0.06/1M
Batch
$0.28/1M