Qwen: Qwen3 VL 235B A22B Instruct
Qwen: Qwen3 VL 235B A22B Instruct é um modelo multimodal criado para compreensão visão-linguagem. Ele combina o tratamento multimodal de entradas e a compreensão de imagens, um contexto de 262K tokens e um perfil baixo custo para entregar trabalho confiável em image and video understanding.
Input
$0.20/1M
Output
$0.88/1M
Cached
$0.11/1M
Batch
$0.10/1M