El equipo Qwen de Alibaba ha lanzado Qwen-4 72B, un modelo multimodal insignia de código abierto que establece nuevos resultados de vanguardia en 12 benchmarks, desafiando directamente a GPT-5o en la comprensión nativa de imágenes y video. Este lanzamiento es un hito importante para la comunidad de IA de código abierto, proporcionando a los desarrolladores una alternativa potente y accesible a los modelos propietarios. El rendimiento del modelo en tareas como respuesta a preguntas visuales, subtitulado de imágenes y comprensión de video demuestra que los modelos de código abierto pueden competir al más alto nivel. Para desarrolladores y fundadores técnicos en el extranjero, esto significa acceso a capacidades multimodales de vanguardia sin bloqueo de proveedor, permitiendo una innovación más rápida en aplicaciones que van desde la moderación de contenido hasta sistemas autónomos.
El modelo multimodal de código abierto Qwen-4 72B de Alibaba alcanza SOTA en 12 benchmarks, compitiendo con GPT-5o en comprensión de imágenes y video.