Mistral: Voxtral Small 24B 2507
Mistral: Voxtral Small 24B 2507 — это аудио‑модель для понимание «зрение-язык». Она сочетает обработку мультимодальных входов и обработку аудио, контекст 32K tokens и профиль недорогой, обеспечивая надёжную работу в задачах audio understanding and multimodal input.
Input
$0.10/1M
Output
$0.30/1M
Cached
$0.01/1M
Batch
$0.05/1M