NVIDIA: Llama 3.1 Nemotron 70B Instruct
NVIDIA: Llama 3.1 Nemotron 70B Instruct é um modelo texto criado para chat geral, análise e uso em produção. Ele combina desempenho geral estável, um contexto de 131K tokens e um perfil custo equilibrado para entregar trabalho confiável em general chat, analysis, and production workloads.
Input
$1.20/1M
Output
$1.20/1M
Cached
$0.01/1M
Batch
$0.06/1M