目錄
- 前言
- 第一局:人像攝影交鋒
- 第二局:商業用圖比拼
- 第三局:信息圖表對戰
- 第四局:多格漫畫對決
- 小結
不知道大家有沒發現?同樣的模型,在即夢上生成的結果就是比豆包好。
可能即夢在seedream系列模型的基礎上自己做了些許優化吧,豆包就是原汁原味的模型。
這不,這週一我發現即夢4.5悄悄更新了,加上字節seedream4.5模型上週在豆包上線,我還想驗證一下我的猜想,於是隨便整了一張圖,結果確實同我的感受是一樣的。同樣的模型,即夢上生成的效果更好(沒有空間邏輯問題)。
(上由豆包生成,下由即夢生成)
官方説seedream4.5在主體一致性、空間邏輯、排版佈局、語言理解、細節修復能力上都有所增強。
不知即夢4.5能與Nano banana pro(以下簡稱pro)對打不?現在我組了幾局,邀請屏幕前好奇的你同我一起觀戰。
因部分案例與上篇相同,大家請看上一篇(生圖界的NO.1,Nano banana pro是近乎萬能的神!)查找相同案例下pro的生成圖:
(PS:除表情包外,文中所有圖片皆由AI生成。提示詞請見評論區)
第一局:人像攝影交鋒
全家福
這考驗的是模型“多張參考圖融合+攝影參數理解+空間邏輯應用”的能力。
(即夢4.5生成)
結果下來就是,即夢4.5整體不如pro聰明、靈活。
比如即夢4.5光寫“全家福”會以抓拍形式呈現,需要寫出“面對鏡頭”才會都看鏡頭,不會自動去除原來場景的其他人物;對攝影參數敏感度不高,參數差距較大的生成的圖差距不太大。
即夢4.5創新能力挺好,不過也不知是否為恃才傲物,創新沒用對地方,生圖有時候多出自創的人物,有時候又把控不足,出現兩個一模一樣的人。
不過與以前的自己相比,它的顏色處理和空間邏輯確實提升了,愛因斯坦的臉色比pro還要自然。它的人物姿勢也比pro自然些。
寫真組圖
這次加大難度,考了即夢4.5“一致性保持+空間邏輯應用+異尺寸批產+複雜場景生成”等多項功能的組合能力。
先説結果,即夢4.5一致性有瑕疵,除空間邏輯之外的物理邏輯崩了,無法實現批批產異尺寸的圖,整體質感比不上pro。
看吧,即夢4.5的人物形象變了,大多髮型散了,最後一張眼影突現,最後排第二張人臉崩了;部分元素不符合場景,比如最後排第一張耳語像一起自拍,最後排行走的倒影、燈的背景太假了。而pro只有1個錯誤(第一張不符合提示詞要求的“手捧”)
尺寸選擇雖然有個“智能尺寸”選項,但這意思是批量圖是同一個尺寸,但不是2:3、16:9等這些常見的尺寸。
即夢中碰到不能用的圖,大家單張修改吧,至少對比之前的版本,修改的次數少些了~
人像攝影這局,pro勝出,不過即夢4.5進步挺大。
第二局:商業用圖比拼
宣傳用圖
這考驗的是模型“中文字體渲染+排版配色”的能力。
即夢4.5這回過關了。
(即夢4.5生成)
它的宣傳單設計得還不錯,懂字號大小,整體符合要求,文字也沒啥問題,可以直接商用。
雜誌封面可能因為涉及肖像權,明星圖片無法上傳,它也不會智能生成對應人臉。
(即夢4.5生成)
(pro生成)
即夢4.5生成的人物姓名有問題,不過問題不大,再次修改即可。
再看pro,它在明星人臉方面靈活多了,無論是否上傳明星圖,都能生成對應人臉。不過也有瑕疵,人臉可能多生成幾次就對應不上了,字體顏色不太符合要求。
總之,雜誌封面上,pro離直接商用更近一些。
專業設計
此處考察的是模型“材質還原+物理規律+空間邏輯+美學渲染”的能力。
就比如機械結構圖:
(即夢4.5生成)
(pro生成)
先拋開準確性和實用性不談,只看非專業的我們能看明白的地方。即夢4.5圖上的文字或數字有些有誤或不清楚,有些視圖還是會重複,但pro就沒有這些問題。
另外,在我生成過程中,我發現,即夢4.5不會考慮你的潛在需求,不像pro會從提示詞中讀懂你的“潛台詞”。就比如材質信息和註釋,我要在提示詞中點名了,即夢4.5才能生成出來。
再來看室內設計圖:
(平面佈局圖-即夢4.5生成)
(平面佈局圖-pro生成)
就平面佈局圖而言,兩者大致看都有模有樣,不過細看就會發現有明顯問題。即夢4.5多處明顯不符合邏輯——室內尺寸大於外牆尺寸、客衞2個馬桶、功能區標註有誤、標註的尺寸不完整;而pro只有即夢4.5的室內尺寸問題。
(裝修效果圖-即夢4.5生成)
(裝修效果圖-即夢4.5生成-更改沙發面料)
(裝修效果圖-pro生成)
就裝修效果圖而言,兩者裝修風格都OK,只是即夢4.5的材質有問題(材質不是羊羔絨),亂搞創新(平面佈局圖印牆上),pro就一處問題(物品放置不會還原平面佈局圖樣子)。
商業用圖這局,pro勝出。
第三局:信息圖表對戰
此處考察即夢4.5“事實準確+增強知識庫”的能力。
我是沒想到,一句話要求下,即夢4.5連這類純依靠增強知識庫的圖都能生成,還挺好看,畢竟我之前試4.0的多文字知識卡片時,自己輸入圖上文字,它都狀況百出。
果然是進步很多呀~
不過對比pro,即夢4.5還是暴露出諸多毛病。
(即夢4.5生成-肝硬化科普)
(即夢4.5生成-電子墨水屏技術特點)
(pro生成-電子墨水屏技術特點)
最突出的就是圖上信息量明顯少於pro,其次是筆畫多的文字有誤,數據圖表美觀但作圖大多不符合邏輯。
這一局,還是pro勝出,不過即夢4.5有大大進步~
第四局:多格漫畫對決
這個終極對決,不用我説,大家想必也知曉誰是本次的贏家了。
對,就是pro,前面就埋下了伏筆。畢竟這局考驗的能力太多了,劇情設計、增強知識庫、事實準確、構圖設計、一致性得都強才行。
還是放個即夢4.5的生成圖,大家圖一樂吧~
(無參考圖的漫畫-即夢4.5生成)
(上傳角色參考圖的漫畫-即夢4.5生成)
即夢4.5的劇情邏輯、人物一致性、科普知識、圖表準確性上都有問題,尤其是前兩個問題更突出,甚至有時不按要求直接生成6張一模一樣的多格漫畫。
小結
目前即夢4.5還是沒辦法對pro貼臉開大,畢竟雙方實力太懸殊了。
相比pro,使用過程中,即夢4.5莫名其妙的禁詞和限制多樣的圖片讓人心中窩火、創作積極性下降。
生成結果上,字節的生圖模型在懂“潛台詞”、保持一致性、增強物理邏輯、造複雜構圖、增強數據庫、運用攝影參數等方面都需要加強。
不過相比過去的自己,seedream系列模型已經有了階梯式地提升了,未來我們還會看見更璀璨奪目的它!
今天的分享就到這裏了。若你對即夢4.5和Nano banana pro有自己的感悟,過歡迎在評論區分享,也歡迎大家小綠泡討論哦~
關注ChooseAI,和我們一起探索AI時代!