Google: Gemini 2.0 Flash
Google: Gemini 2.0 Flash é um modelo áudio criado para compreensão visão-linguagem. Ele combina o tratamento multimodal de entradas e a compreensão de imagens, um contexto de 1M+ tokens e um perfil baixo custo para entregar trabalho confiável em audio understanding and multimodal input.
Input
$0.10/1M
Output
$0.40/1M
Cached
$0.03/1M
Batch
$0.07/1M