Krea 2 オープンウェイト 12B テキスト‑ツー‑イメージモデルリリース
Krea 2 オープンウェイト 12B テキスト‑ツー‑イメージモデルリリース
Krea 2 がオープンウェイト 12B テキスト‑ツー‑イメージモデルを公開
Krea は、12 億パラメータのテキスト‑ツー‑イメージモデル Krea 2 Turbo と Krea 2 RAW の重みを公開し、データキュレーション、アーキテクチャ、トレーニングパイプライン、インフラストラクチャを解説した包括的な技術レポートを同時に提供しました。このリリースは、プロダクションレベルの拡散モデルをめったに見られない形でオープンソース化し、個人や小規模事業者向けの寛容なライセンスを付与しています。
2 つのチェックポイントは異なるユースケースを対象
- Krea 2 Turbo は、ガイダンスとタイムステップで蒸留されたチェックポイントで、超高速推論向けに設計されています。CPU での効率的な実行のために GGUF 形式で既に提供されています。
- Krea 2 RAW は、蒸留されていないチェックポイントで、研究、ファインチューニング、さらなる実験を目的としています。中間トレーニング段階と最終トレーニング段階の両方でリリースされており、画像生成コミュニティでは珍しい取り組みです。
"私たちは中間トレーニング段階と最終トレーニング段階の両方で 2 つのチェックポイントをリリースしています。これは画像・マルチメディアコミュニティでは稀なことなので、このリリースに誇りを感じずにはいられません。" – Diego Rodriguez, Krea 共同創業者兼 CTO
技術レポートはエンドツーエンドパイプラインを網羅
添付のレポート(https://www.krea.ai/blog/krea-2-technical-report)では、以下を詳述しています。
- データキュレーションとキャプショニング – 数十億の画像‑テキストペアの収集、フィルタリング、注釈方法。
- モデルアーキテクチャ – Qwen‑3‑VL ビジョン‑言語エンコーダと VAE デコーダを基盤とした拡散バックボーン。
- ポストトレーニングと RL パイプライン – スタイル遵守とプロンプト拡張のための強化学習ベースのファインチューニング。
- インフラストラクチャ – 12B モデルを大規模に学習させるための分散トレーニングスタック、ストレージ構成、コスト最適化戦略。
品質は主要なクローズドソースモデルに匹敵
Artificial Analysis ベンチマークの結果、Krea 2 はテキスト‑ツー‑イメージ品質において Nano Banana と同等であることが示されています(完全オープンソースである点が特徴です)。
"Artificial Analysis のテキスト‑ツー‑イメージベンチマークにおいて、画像品質は Nano Banana と同等です。" – Diego Rodriguez
ライセンスとアクセス性
Krea 2 は、個人や小規模事業者による商用利用を許可する寛容なライセンスの下でリリースされています。モデルは Hugging Face(https://www.krea.ai/krea-2/huggingface)にホストされ、コードベースは GitHub(https://www.krea.ai/krea-2/github)で入手可能です。
コミュニティの反応と今後の方向性
- 幅広いスタイル対応 – コメント投稿者は「manifold を広く保つ」哲学を称賛しており、限定的なプリセットではなく多様な芸術スタイルに対応できるモデルを目指しています。
- イメージ‑ツー‑イメージの最前線 – 一部ユーザーは、Krea 2 がテキスト‑ツー‑イメージ生成で優れている一方、次の大きな課題は堅牢なイメージ‑ツー‑イメージ編集であると指摘しています。Nano Banana 2 や Images 2.0 などの新モデルがすでにこの領域で進展しています。
- 技術的深さへの評価 – トレーニングインフラに関する詳細な記述が、コミュニティにとって貴重なリソースとして評価されています。
"オープンウェイトモデルが増えるのは嬉しいですし、詳細な記述にも本当に感謝しています。‘manifold を広く保つ’ アプローチも好きです… 画像モデルの次なるフロンティアは堅牢な I2I です。"
始め方
- モデルをダウンロード – Hugging Face リポジトリから、速い推論が必要なら Turbo、研究目的なら RAW を選択してください。
- レポートを読む – 技術レポートには、データパイプライン、モデルアーキテクチャ、トレーニングハイパーパラメータのステップバイステップ詳細が記載されています。
- 実験する – 提供されている推論スクリプトを使用するか、既存の拡散パイプラインにモデルを組み込んでみてください。GGUF 変換された Turbo チェックポイントは低リソースの CPU 使用を可能にします。
- 貢献する – オープンソースライセンスは、コミュニティからの貢献、ファインチューニング、下流アプリケーションの開発を奨励しています。
結論:Krea 2 は、2 つの異なるチェックポイント、徹底した技術レポート、寛容なライセンスを備えた最先端のオープンウェイトテキスト‑ツー‑イメージ生成を実現し、高品質拡散モデルの民主化に向けた重要な一歩を示しています。