近日,德國 AI 公司 Black Forest Labs(BFL)正式發佈 “FLUX.2”——他們迄今為止最強大的文本-圖像生成/編輯模型,目標不僅是“炫技展示”,而是真正服務於專業創作與產業級視覺工作流。
據介紹,FLUX.2支持多參考圖生成(最多10張),提升角色、風格一致性;優化光照、紋理細節,適用於產品攝影、UI設計等場景。此外新增結構化JSON提示詞控制,支持十六進制顏色代碼精準配色,強化複雜排版、多語言(含中文)文本渲染能力。
FLUX.2 版本劃分:
- FLUX.2 [pro]:閉源商用版本,圖像質量對標頂級閉源模型,生成速度更快、成本更低。
- FLUX.2 [flex]:允許調整步數、引導規模等參數,平衡質量與速度,擅長文本與細節渲染。
- FLUX.2 [dev]:32B參數開源版本(需授權商用),集成文生圖、多圖編輯功能,支持本地部署(需RTX 4090及以上顯卡),Hugging Face已開源權重。
- FLUX.2 [klein](待發布):Apache 2.0協議的開源輕量版,通過蒸餾保留核心能力。
FLUX.2 亮點如下:
-
專業級畫質 + 高分辨率:FLUX.2 支持生成和編輯高達 4 百萬像素(4 MP)圖像,畫面細節、材質、光照、空間感都接近攝影級真實感。
-
多圖參考 (Multi-reference) + 風格/角色/產品一致性:用户可以輸入多張參考圖像(最多 6–10 張),FLUX.2 能保持風格、角色、產品外觀的一致性,這對廣告圖、系列海報、產品展示等應用尤為關鍵。
-
優異的文本與排版渲染能力:相比此前很多生成模型容易“字母混亂”或“假文本”,FLUX.2 能生成清晰、可讀的文字,適合海報、UI mock-up、信息圖 (infographics)、跨語言內容等場景。
-
物理世界感 + 語義理解 + 佈局/構圖控制:模型對於光照、陰影、反射、透視、材質表現有更好的理解,也能按照結構化提示 (structured prompts) 生成複雜構圖 —— 幾乎可以 “把腦中的設計圖變成照片”。
-
開放-核心 (open-core) 策略 + 多種版本選擇:FLUX.2 提供從開源/開權重 (open-weight) 的 “Dev” 版本,到針對商業用户優化的 “Pro”/“Flex” 版本。對於研究者、設計師、創意團隊、公司都具有靈活選擇空間。
實測顯示,與Google Nano Banana Pro相比,FLUX.2在CCD相機風格還原、結構化場景生成上表現更優,但世界知識理解(如動漫角色)仍存在差距。開源版本FLUX.2 [dev]生成單圖成本約0.03美元,在多圖編輯任務中優於同類開源模型。
FLUX.2 開源地址:https://github.com/black-forest-labs/flux2