Google: Gemma 3n 4B
Google: Gemma 3n 4B è un modello testo pensato per comprensione visione-linguaggio. Unisce la gestione multimodale degli input e l’elaborazione audio, un contesto di 33K tokens e un profilo a basso costo per un lavoro affidabile in audio understanding and multimodal input.
Input
$0.06/1M
Output
$0.12/1M