Google: Gemma 3n 4B
Google: Gemma 3n 4B — это текстовой‑модель для понимание «зрение-язык». Она сочетает обработку мультимодальных входов и обработку аудио, контекст 33K tokens и профиль недорогой, обеспечивая надёжную работу в задачах audio understanding and multimodal input.
Input
$0.06/1M
Output
$0.12/1M