OpenAI: GPT-4o Audio
OpenAI: GPT-4o Audio هو نموذج صوتي مخصص لـفهم الرؤية واللغة. يجمع بين معالجة الإدخال متعدد الوسائط، معالجة الصوت وسياق بحجم 128K tokens وملف فئة مميزة لتقديم عمل موثوق في audio understanding and multimodal input. وهو خيار عملي عندما تكون الجودة والسرعة والتكلفة مهمة، خصوصًا للفرق التي تحتاج إلى مخرجات ثابتة ونشر مرن ومساحة للتوسع.
Input
$2.50/1M
Output
$10.00/1M
Cached
$0.25/1M
Batch
$1.25/1M