前言
近期,火山引擎發佈了豆包編程相關模型:Doubao-Seed-Code。
按照介紹推文來看,Doubao-Seed-Code是國內首個具備視覺理解能力的編程模型,可參考手繪稿、UI設計封面或給予目標網站的配色等,自主完成樣式修復和Bug修復,大幅提升前端開發效率。除此之外,原生支持 256K 長上下文, 輕鬆處理長代碼文件、多模塊依賴等複雜場景,實現端到端自主編程,全棧開發友好,前端能力突出。
在國內市場中,DeepSeek V3.1、Kimi K2、GLM 4.6、MiniMax M2 等 Coding 模型均不具備視覺理解能力,或需要依賴MCP實現,將圖片轉化成語義描述供模型理解,過程中信息折損會很大,效果遠不及原生VLM能力;
一個強大的知識大腦加上可理解的視覺神經,回答或許可以不再是盲盒式地自我輸出。
嗯,這對於在工作中日常和產品經理battle或想工作增效的開發人員來説是一個不可多得的"幫手",也因時常關注國內市場的大模型更新狀態,所以這段時間閒暇之餘對Doubao-Seed-Code進行了一些測試。
安裝使用
看了介紹,我在Windows 11 安裝了Claud Code,對底層調用模型進行更換,無需集成環境或其他MCP,相對於測評來説也比較方便。
首先在火山方舟上,開通這個模型的API Key。如果只是想輕量級體驗的話,也可以通過火山引擎體驗中心,選擇Doubao-Seed-Code。
安裝Calude Code
基礎環境要求:
- 安裝Node.js 18+
- 安裝Git for windows
- 就這麼簡單!安裝完基礎環境在命令行界面(WIN + R ——不用我教吧),執行以下命令安裝。
npm install -g @anthropic-ai/claude-code
- 安裝結束後,執行以下命令查看安裝結果。
claude --version
使用PowerShell配置環境變量
完場Claude Code安裝後,配置以下環境變量。
- ANTHROPIC_BASE_URL:https://ark.cn-beijing.volces.com/api/coding
- ANTHROPIC_AUTH_TOKEN:<你的API Key>
- ANTHROPIC_MODEL: doubao-seed-code-preview-latesdt。
一步一步來,步驟如下:
- 在PowerShell中執行以下命令,設置環境變量。
# 去平台複製一下自己的api Key,其他不變
setx ANTHROPIC_AUTH_TOKEN <YOUR ARK_API_KEY>
setx ANTHROPIC_BASE_URL https://ark.cn-beijing.volces.com/api/coding
setx ANTHROPIC_MODEL doubao-seed-code-preview-latest
- 在新的PowerShell窗口執行以下命令,檢查環境變量是否生效。
echo $env:ANTHROPIC_AUTH_TOKEN
echo $env:ANTHROPIC_BASE_URL
echo $env:ANTHROPIC_MODEL
使用Claude Code
啓動Claude Code:進入項目目錄,執行claude命令,即可開始使用Claude Code。
# 進入你自己的項目目錄
cd my-project
# 啓動Claude-Code
claude
模型狀態驗證:輸入/status確認模型狀態
Model後面跟着“doubao-seed-code-preview-latest”就是成功接上了!
功能測評
視覺理解能力
首先先測試一下模型的視覺理解能力,畢竟都這麼宣傳了,指定有它的優勢之處。我的想法是:給它一個前端頁面需求的手繪稿,然後參考某個網站的截圖配色,生成對應的前端代碼。
手繪稿:
參考蘋果官網截圖:
prompt:@AIlearning.jpg @mytheme2.png 我需要生成一個前端頁面,為了展示在線學習網站的錯題展示頁面,主要以康奈爾筆記法結構展示,同時旁邊有一個AI小助手供學習者提問。具體佈局請參考我給出的手繪稿,網站的配色請參考我給出的網站截圖。
第一次生成的效果就還可以,結構分佈上和我的手繪稿差不多,配色也完美參考了我上傳的網站截圖配色,因此我沒有做二次的prompt調整。只是在一些細節問題上,需要二次去頁面上的內容作細化調整。在頁面上,它自己生成了一些數學公式,但是卻沒有正常顯示。針對這個問題我對它提出了疑問。(寫代碼就像聊天一樣!( •̀ ω •́ )y)
改進後,就能正常顯示數學公式,只不過加載的時候有一點點慢。
工作協助式編程
我在日常工作中,會有想到一些協助日常工作的工具,比如説會議備忘錄、事件輕重緩急頁面展示,或者弄一個攝證王的專屬考試倒計時的可視化日曆。那這次我就做一個工作備忘錄。
prompt:用HTML寫一個聖誕主題色的工作備忘錄
第一次生成的頁面效果還是一般,通過微調prompt,嘗試對其增加更多的提示要求。
模型支持上下文,用@方法引用要參考的圖片
第二次prompt:@mytheme.png 結合這張圖片的風格再次修改
再次生成的效果比之前更順眼了,弱化組件線條感,配色也更好看一些,同時也保留了聖誕元素。
興趣便利可視化
基金作為我的日常興趣愛好項,俺正好也可以利用這個模型寫一個基金收益模擬器。
prompt:用HTML寫一個基金定投計劃以及收益率監控,提示加倉止盈點
這次我沒有參考任何配色,僅僅讓其自動生成對應的頁面,我對其審美打個84分。如果還有時間的話,我還可以考慮加入爬蟲or其他監控程序,每天自動跟蹤最新基金淨值,當然這可以放在後續完善工作進行。
小遊戲可視化
我看有其他的大佬們完成了小遊戲的測評,那麼我這次也嘗試實現一個經典款的遊戲——憤怒的小鳥。
prompt:用HTML製作一款經典遊戲“憤怒的小鳥”
第一次生成後,不依賴任何組件,在頁面上僅僅只是通過鼠標的拖拽,就可以發射小鳥,完美實現了基本的遊戲玩法。那麼我將惡趣味一下,將小鳥換成老鼠,看看以它自己的審美會生成什麼。
prompt:是Angry Bird遊戲哦。同時把鳥換成老鼠看看,並命名為angry-mice
嗯,我感覺這隻老鼠好像比小鳥還好看一些。
總結
總體測試下來,我對效果還是比較滿意的。在視覺理解能力和編程能力上,能夠基本滿足我的prompt要求,生成的代碼可以直接運行查看。但如何更好地優化可視化界面,完成人類與計算機之間的交互工作,還是得慢慢針對性調整與探索。希望國產大模型越做越好。
另外值得一提的是,目前它的調用價格很便宜,現在有一個 Coding Plan