🖼 Alibaba発「Qwen-Image」登場 — テキスト描画性能で業界を席巻

2025年8月4日、AlibabaのAI研究チームQwenが、新たな画像生成AI**「Qwen-Image」を発表しました。
このモデルは、従来の画像生成AIが苦手としてきた「複数行にわたるテキスト描画」を高精度で実現できるのが最大の特徴です。特に中国語や英語など複数言語の混在テキストを正確に再現**する能力が注目されています。

さらに、Qwen-Imageはテキスト描画だけでなく、実写風・イラスト風・水墨画風など多様なスタイルの画像生成や高品質な画像編集も可能とされています。

日常に身近な雑学コラム・ニュース（Open NewTab）

✨ 最大の特徴は「高精度なテキスト描画」
1. 主な描画能力
📊 他モデルとの比較でトップクラスのスコア
🎨 高品質な画像生成・編集機能も搭載
💾 モデルデータ公開と利用方法
🔮 まとめ：Qwen-Imageが変える画像生成の未来

✨ 最大の特徴は「高精度なテキスト描画」

多くの画像生成AIは、テキスト描画になると文字が崩れたり誤字が発生する課題を抱えています。
しかしQwen-Imageは、独自の**マルチモーダル拡散変換器（MMDiT）**技術を採用し、画像部分とテキスト部分に異なる重み付けを行うことで、この課題を克服しました。

主な描画能力

複数行の中国語文章を正確に描写
英語と中国語を同一画像内に自然に配置
テキスト位置をピクセル単位で指定可能
例）スライド資料風の画像生成

この能力により、広告画像やプレゼン資料、マンガの吹き出しなど、文字を含むクリエイティブ制作が格段にやりやすくなります。

Qwen-Imageは画像内のテキストの位置を細かく指定することも可能で、以下のようなスライド風画像を生成することもできます。

以下の図は、「Qwen-Image(青色)」「GPT Image 1 [High](緑色)」「Seedream 3.0(水色)」のテキスト描画性能を比較したものです。Qwen-Imageは中国語の描画性能でトップのスコアを示し、英語の描画性能でも一部のテストでGPT Image 1 [High]を超える性能を示しました。