Qwen-4 72B Open-Source Multimodales Modell übertrifft GPT-5o auf 12 Benchmarks

Alibabas Qwen-4 72B Open-Source Multimodales Modell erreicht SOTA auf 12 Benchmarks und konkurriert mit GPT-5o bei Bild- und Video-Verständnis.

Das Qwen-Team von Alibaba hat Qwen-4 72B veröffentlicht, ein Open-Source-Multimodal-Flaggschiffmodell, das auf 12 Benchmarks neue Spitzenwerte erzielt und GPT-5o direkt beim nativen Bild- und Videoverständnis herausfordert. Diese Veröffentlichung ist ein wichtiger Meilenstein für die Open-Source-KI-Community und bietet Entwicklern eine leistungsstarke, zugängliche Alternative zu proprietären Modellen. Die Leistung des Modells bei Aufgaben wie visueller Fragebeantwortung, Bildunterschrift und Videoverständnis zeigt, dass Open-Source-Modelle auf höchstem Niveau konkurrieren können. Für Übersee-Entwickler und technische Gründer bedeutet dies Zugang zu hochmodernen multimodalen Fähigkeiten ohne Vendor-Lock-in, was schnellere Innovationen in Anwendungen von der Inhaltsmoderation bis zu autonomen Systemen ermöglicht.