新一代開源 AI 圖像生成/編輯模型 FLUX.2 發佈

近日，德國 AI 公司 Black Forest Labs（BFL）正式發佈 “FLUX.2”——他們迄今為止最強大的文本-圖像生成／編輯模型，目標不僅是“炫技展示”，而是真正服務於專業創作與產業級視覺工作流。

據介紹，FLUX.2支持多參考圖生成（最多10張），提升角色、風格一致性；優化光照、紋理細節，適用於產品攝影、UI設計等場景。此外新增結構化JSON提示詞控制，支持十六進制顏色代碼精準配色，強化複雜排版、多語言（含中文）文本渲染能力。

FLUX.2 版本劃分：

FLUX.2 [pro]：閉源商用版本，圖像質量對標頂級閉源模型，生成速度更快、成本更低。
FLUX.2 [flex]：允許調整步數、引導規模等參數，平衡質量與速度，擅長文本與細節渲染。
FLUX.2 [dev]：32B參數開源版本（需授權商用），集成文生圖、多圖編輯功能，支持本地部署（需RTX 4090及以上顯卡），Hugging Face已開源權重。
FLUX.2 [klein]（待發布）：Apache 2.0協議的開源輕量版，通過蒸餾保留核心能力。

FLUX.2 亮點如下：

專業級畫質 + 高分辨率：FLUX.2 支持生成和編輯高達 4 百萬像素（4 MP）圖像，畫面細節、材質、光照、空間感都接近攝影級真實感。
多圖參考 (Multi-reference) + 風格／角色／產品一致性：用户可以輸入多張參考圖像（最多 6–10 張），FLUX.2 能保持風格、角色、產品外觀的一致性，這對廣告圖、系列海報、產品展示等應用尤為關鍵。
優異的文本與排版渲染能力：相比此前很多生成模型容易“字母混亂”或“假文本”，FLUX.2 能生成清晰、可讀的文字，適合海報、UI mock-up、信息圖 (infographics)、跨語言內容等場景。
物理世界感 + 語義理解 + 佈局／構圖控制：模型對於光照、陰影、反射、透視、材質表現有更好的理解，也能按照結構化提示 (structured prompts) 生成複雜構圖 —— 幾乎可以 “把腦中的設計圖變成照片”。
開放-核心 (open-core) 策略 + 多種版本選擇：FLUX.2 提供從開源／開權重 (open-weight) 的 “Dev” 版本，到針對商業用户優化的 “Pro”/“Flex” 版本。對於研究者、設計師、創意團隊、公司都具有靈活選擇空間。

實測顯示，與Google Nano Banana Pro相比，FLUX.2在CCD相機風格還原、結構化場景生成上表現更優，但世界知識理解（如動漫角色）仍存在差距。開源版本FLUX.2 [dev]生成單圖成本約0.03美元，在多圖編輯任務中優於同類開源模型。

FLUX.2 開源地址：https://github.com/black-forest-labs/flux2

發佈評論