OpenAI: GPT-4o Audio
OpenAI: GPT-4o Audio ist ein Audio-Modell für Vision-Sprache-Verständnis. Es verbindet multimodale Eingabeverarbeitung und Audioverarbeitung, einen Kontext von 128K tokens und ein Premium-Profil für zuverlässige Arbeit über audio understanding and multimodal input.
Input
$2.50/1M
Output
$10.00/1M
Cached
$0.25/1M
Batch
$1.25/1M