Z-Image 標準版正式開源發佈,專為微調而生的圖像生成基座模型

新聞
HongKong
7
10:29 AM · Jan 28 ,2026

Z-Image(造相)團隊正式開源Z-Image標準版。作為Z-Image系列的主要社區基礎模型,標準版是非蒸餾的完整模型,在生成質量、風格靈活性和二次開發支持上更具優勢,旨在為社區開發者提供一個強大且靈活的圖像生成底座,釋放更多定製化開發和精細微調的可能性。

Z-Image標準版作為一個非蒸餾的完整模型,優於其蒸餾版本Z-Image-Turbo,支持完整CFG、負向提示詞控制,可避免”相同臉”問題,生成多樣性更高。模型採用創新的 S3-DiT 架構,訓練流程包括預訓練、有監督微調(SFT)和強化學習三階段,當前處於 SFT 階段。

核心特性

多樣的美學與藝術風格

Z-Image在保持高度照片寫實性的同時,支持更廣泛的藝術風格。與通過強化學習高度優化寫實效果的Turbo版本不同,標準版模型保留了更多風格多樣性,更適合動漫、數字藝術、插畫等創意類型的生成,能夠滿足不同創作場景對藝術表現力的需求。

面向社區的微調友好型基座

作為一個非蒸餾的基礎生成模型,Z-Image特別適合社區開發者進行二次開發和定製化微調(LoRA、ControlNet等)。

  • 完整CFG支持

    與通常繞過分類器自由引導的蒸餾模型不同,標準版模型保留了完整的CFG支持,實現精確的提示詞控制

  • 訓練穩定性強

    模型的內部多樣性和權重分佈使其在下游訓練時更容易學習新概念,相比低步數變體具有更好的訓練穩定性

更高的生成多樣性

Z-Image 專注於解決現代生成器常見的同質化問題:

  • 避免"相同臉"問題

    不同的隨機種子能夠生成明顯不同的面孔和構圖,每次生成都具有獨特性

  • 多主體場景優化

    在包含多人的提示詞中,標準版模型能生成具有獨特特徵的不同個體,避免了高速模型中常見的"克隆效應"

Negative Prompt增強控制

Z-Image 對負面提示詞(Negative Prompt)的響應尤為敏感和有效。開發者可以通過精心設計的負面提示詞,更精確地控制生成內容,避免不希望出現的元素,實現更加可控的圖像生成。

在線體驗地址:https://www.modelscope.cn/aigc/imageGeneration
模型下載地址:https://modelscope.cn/models/Tongyi-MAI/Z-Image

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.