Z-Image-Turbo 是一款由阿里通義實驗室開源的圖像生成模型,最大的特點就是對普通電腦用户極其友好。它能讓主流的遊戲顯卡就能生成高質量的圖片。
https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
它的特點如下:
- 極低的硬件門檻:量化版本最低僅需 6GB 顯存即可運行。
- 極快的生成速度:採用8步採樣技術,在消費級顯卡上可實現秒級出圖。
- 出色的圖像質量: 以60億(6B)參數實現了媲美更大模型的照片級真實感,在皮膚、髮絲、光影等細節上表現優異。
- 強大的中文理解與文字渲染:對中文提示詞理解精準,甚至有用户反饋用中文提示能獲得更好效果。能在圖片中準確生成中英文字符,適合做海報、Logo設計。
- 豐富的控制與編輯能力:支持通過 “Z-Image-Edit”工具 用自然語言指令修改圖片(如替換背景、調整表情)
- 完全開源與免費:模型採用 Apache 2.0 協議在GitHub、Hugging Face等平台開源,允許個人和商業使用。零成本使用,沒有次數限制,且有活躍社區提供大量教程、微調模型(LoRA)和資源
Mac下使用
之前我在Mac下嘗試使用 ComfyUI 來配置,生成的圖全黑(機器配置: Apple M4, 內存 24GB),沒能走通,現在改用Draw Things,下載地址:
https://drawthings.ai/downloads/
其中的最新版本 1.20251207.0 就支持了 Z-Image。
軟件安裝完成後,打開需要下載對應模型:
這些模型被下載到 /Users/賬號名/Library/Containers/com.liuliu.draw-things/Data/Documents 目錄下:
- 4.6G的
z_image_turbo_1.0_q6p.ckpt是Z Image Turbo 1.0 (6-bit)模型用的 - 6GB的
z_image_turbo_1.0_q8p.ckpt文件是Z Image Turbo 1.0模型用的 - 4.53G的
qwen_3_vl_4b_instruct_q8p.ckpt文件,是文本理解器,將你輸入的文字提示詞(如“一隻貓”)轉化為模型能理解的數學表示,直接影響生成內容是否準確。
生成圖期間,Draw Things 的內存消耗維持在6G左右,變化不大。
實際負載並不高
測試效果
模型:Z Image Turbo 1.0 (6-bit)
提示詞:
一位年輕亞洲女子(演員:楊冪)在夜晚的温泉中放鬆身心,胸前僅圍着一條薄薄的毛巾,表情羞澀又迷人,眼神帶着誘惑,周遭蒸汽環繞,月光灑落在濕潤的皮膚上,高質感8K,精緻細節。
耗時: 89.07秒
模型:Z Image Turbo 1.0
提示詞:
一張高分辨率的隨機側拍抓拍,拍攝的是一位顏值出眾的年輕東亞女性,取景聚焦全身。她站在老舊居民樓的樓道門口,穿着淺粉色無袖針織吊帶
和淺灰色運動短褲,腳上踩着一雙磨白的米色人字拖,腳踝沾着些許水漬。樓道門口的水管
在滴水,她正彎腰用手接水玩,水花濺到小腿上,形成細小的水珠。她的頭髮紮成一個鬆散
的丸子頭,幾縷碎髮被汗水粘在額頭和頸後,側臉線條流暢優美,嘴角上揚着,露出一抹隨
性又甜美的笑容,眼神清亮如溪。周圍環境十分平凡:身後是褪色掉漆的樓道鐵門,牆面布
滿污漬和小廣告的殘留痕跡,旁邊堆着幾個舊花盆和紙箱,光線是午後的側逆光,臉部有些
輕微欠曝,畫面因抓拍有輕微傾斜。但她的美貌極具衝擊力,那種自然鬆弛的狀態,讓破舊
的環境反而成了襯托,完全讓人忽略畫面的不完美。
耗時:90.95秒
模型:Z Image Turbo 1.0
提示詞:
中國風海報設計,春節主題,
標題文字"新春大吉",字體毛筆書法風格,
中心是紅色燈籠和金色祥雲,紅金配色為主,
對稱式構圖,上下留白,
邊框裝飾有梅花圖案和祥雲紋樣,
平面設計風格,精緻細膩,
高清,矢量風格,商業設計水準
耗時:84.27秒
模型:Z Image Turbo 1.0
提示詞:
一位白髮老漁夫,在清晨的挪威峽灣,修補漁網。臉龐佈滿皺紋,眼神深邃,雙手粗糙。晨霧瀰漫,冷色調光線,超寫實攝影,細節驚人,f/1.8大光圈。
耗時:83.45秒
模型:Z Image Turbo 1.0
提示詞:
山區湖泊,秋季黃昏時分,
湖面倒映着遠山和彩霞,天空有橙紅色晚霞,
温暖的夕陽光線照亮山峯,金黃色調,
前景是湖邊的枯木和石頭,中景是平靜的湖面,遠景是層疊的山巒,
風光攝影風格,Ansel Adams安塞爾·亞當斯風格,
廣角鏡頭,16-35mm,
高清,國家地理雜誌水準,細節豐富
耗時:85.17秒
模型:Z Image Turbo 1.0
提示詞:
未來感咖啡廳,內部充滿巨大的、發光的植物。一個穿着霓虹夾克的人坐在櫃枱前。賽博朋克風格,強烈的霓虹燈光(藍色與粉色)與深陰影對比,空氣中可見的光塵,電影質感。
耗時:84.19秒
模型:Z Image Turbo 1.0
提示詞:
圖書館的魔法大戰,一位年輕法師用光之咒語對抗陰影怪物。書本在空中飛舞,書架倒塌。動態視角,充滿動感和魔力粒子,史詩級奇幻藝術,Greg Rutkowski風格。
耗時:84.69秒
模型:Z Image Turbo 1.0
提示詞:
從貓咪的視角仰望,巨大的傢俱,巨大的拖鞋。陽光透過窗户在地板上形成光斑,空氣中飄着絨毛。超廣角鏡頭,微距細節,温馨又夢幻,膠片質感。
耗時:84.97秒
從貓咪的視角仰望 這個沒做到。
模型:Z Image Turbo 1.0
提示詞:
“星際山水”:將中國宋代山水畫的構圖、筆觸與墨韻,與銀河星雲、外星山峯相結合。水墨淡彩,留白處是星空,寧靜而浩瀚。
耗時:84.98秒
帶引號的理解成圖上文字了。
模型:Z Image Turbo 1.0
提示詞:
用液態金屬和玻璃幾何體構建的一隻鳳凰,正在展翅。背景是極簡的漸變色。3D渲染,工作室燈光,高反光表面,乾淨、高級、概念藝術。
耗時:86.19秒
模型:Z Image Turbo 1.0
提示詞:
一個打開的復古懷錶,內部機械齒輪極其複雜精密,正在緩緩轉動。錶盤上雕刻着星空圖。微距攝影,焦點在中央齒輪,黃銅與藍鋼質感,背景虛化。
耗時:90.59秒
數字有變形的
模型:Z Image Turbo 1.0
提示詞:
一塊正在融化的奶酪,拉出完美的、閃亮的絲線。背景是木製砧板和熟食。食物攝影,捕捉粘稠質感,戲劇性側光,令人垂涎,超高清晰度。
耗時:83.19秒
模型:Z Image Turbo 1.0
提示詞:
荒野女巫,她穿着由苔蘚、樹皮、乾花和藤蔓編織的長袍,手持一根發芽的木杖。頭髮是飄逸的蕨類植物,眼神温柔而神秘。站在古老的森林中,概念角色設計,全身像。
耗時:88.14秒
模型:Z Image Turbo 1.0
提示詞:
一座建在巨型海龜背上的蒸汽朋克風格移動城市,煙囱冒着煙,風帆展開。夕陽下,在海面上航行。廣闊的場景,充滿想象力,數字繪景,大師級構圖。
耗時:82.57秒
總結
雖然有些圖生成的有些缺陷,但是總的來説,Z-Image-Turbo 的核心價值在於它極大地 democratize(民主化)了高質量AI圖像生成的能力,讓技術不再是擁有頂級硬件用户的特權。