El modelo multimodal de código abierto Qwen-4 72B supera a GPT-5o en 12 benchmarks

El modelo multimodal de código abierto Qwen-4 72B de Alibaba alcanza SOTA en 12 benchmarks, compitiendo con GPT-5o en comprensión de imágenes y video.

El equipo Qwen de Alibaba ha lanzado Qwen-4 72B, un modelo multimodal insignia de código abierto que establece nuevos resultados de vanguardia en 12 benchmarks, desafiando directamente a GPT-5o en la comprensión nativa de imágenes y video. Este lanzamiento es un hito importante para la comunidad de IA de código abierto, proporcionando a los desarrolladores una alternativa potente y accesible a los modelos propietarios. El rendimiento del modelo en tareas como respuesta a preguntas visuales, subtitulado de imágenes y comprensión de video demuestra que los modelos de código abierto pueden competir al más alto nivel. Para desarrolladores y fundadores técnicos en el extranjero, esto significa acceso a capacidades multimodales de vanguardia sin bloqueo de proveedor, permitiendo una innovación más rápida en aplicaciones que van desde la moderación de contenido hasta sistemas autónomos.