Meta: Llama 3.1 8B Instruct
Meta: Llama 3.1 8B Instruct एक टेक्स्ट मॉडल है, जिसे सामान्य चैट, विश्लेषण और production use के लिए बनाया गया है। यह कम latency और efficient inference, 16K tokens का context और कम लागत profile जोड़कर general chat, analysis, and production workloads में भरोसेमंद काम करता है। यह तब व्यावहारिक विकल्प है जब latency, cost और throughput महत्वपूर्ण हो,
Input
$0.02/1M
Output
$0.05/1M
Cached
$0.01/1M
Batch
$0.01/1M