Qwen-4 72B オープンソースマルチモーダルモデル、12ベンチマークでGPT-5oを凌駕

AlibabaのQwen-4 72Bオープンソースマルチモーダルモデルが12ベンチマークでSOTAを達成、画像・動画理解でGPT-5oに匹敵。

AlibabaのQwenチームは、オープンソースのマルチモーダルフラッグシップモデルQwen-4 72Bをリリースしました。このモデルは12のベンチマークで新たなSOTAを達成し、ネイティブな画像・動画理解においてGPT-5oに直接挑戦します。このリリースはオープンソースAIコミュニティにとって大きなマイルストーンであり、開発者にプロプライエタリモデルに代わる強力でアクセスしやすい選択肢を提供します。視覚的質問応答、画像キャプション、動画理解などのタスクでのパフォーマンスは、オープンソースモデルが最高レベルで競争できることを示しています。海外の開発者や技術創業者にとって、これはベンダーロックインなしに最先端のマルチモーダル機能にアクセスできることを意味し、コンテンツモデレーションから自律システムに至るまでのアプリケーションでの迅速なイノベーションを可能にします。