國產首款視覺理解能力模型-Claude Code測評詳情 - Code,PowerShell,API,代碼人生袁袁袁袁滿博客

前言

近期，火山引擎發佈了豆包編程相關模型：Doubao-Seed-Code。

按照介紹推文來看，Doubao-Seed-Code是國內首個具備視覺理解能力的編程模型，可參考手繪稿、UI設計封面或給予目標網站的配色等，自主完成樣式修復和Bug修復，大幅提升前端開發效率。除此之外，原生支持 256K 長上下文，輕鬆處理長代碼文件、多模塊依賴等複雜場景，實現端到端自主編程，全棧開發友好，前端能力突出。

在國內市場中，DeepSeek V3.1、Kimi K2、GLM 4.6、MiniMax M2 等 Coding 模型均不具備視覺理解能力，或需要依賴MCP實現，將圖片轉化成語義描述供模型理解，過程中信息折損會很大，效果遠不及原生VLM能力；

一個強大的知識大腦加上可理解的視覺神經，回答或許可以不再是盲盒式地自我輸出。

嗯，這對於在工作中日常和產品經理battle或想工作增效的開發人員來説是一個不可多得的"幫手"，也因時常關注國內市場的大模型更新狀態，所以這段時間閒暇之餘對Doubao-Seed-Code進行了一些測試。

安裝使用

看了介紹，我在Windows 11 安裝了Claud Code，對底層調用模型進行更換，無需集成環境或其他MCP，相對於測評來説也比較方便。

首先在火山方舟上，開通這個模型的API Key。如果只是想輕量級體驗的話，也可以通過火山引擎體驗中心，選擇Doubao-Seed-Code。

安裝Calude Code

基礎環境要求：

安裝Node.js 18+
安裝Git for windows

就這麼簡單！安裝完基礎環境在命令行界面（WIN + R ——不用我教吧），執行以下命令安裝。

npm install -g @anthropic-ai/claude-code

安裝結束後，執行以下命令查看安裝結果。

claude --version

使用PowerShell配置環境變量

完場Claude Code安裝後，配置以下環境變量。

ANTHROPIC_BASE_URL：https://ark.cn-beijing.volces.com/api/coding
ANTHROPIC_AUTH_TOKEN：<你的API Key>
ANTHROPIC_MODEL: doubao-seed-code-preview-latesdt。

一步一步來，步驟如下：

在PowerShell中執行以下命令，設置環境變量。

# 去平台複製一下自己的api Key，其他不變
setx ANTHROPIC_AUTH_TOKEN <YOUR ARK_API_KEY>
setx ANTHROPIC_BASE_URL https://ark.cn-beijing.volces.com/api/coding
setx ANTHROPIC_MODEL doubao-seed-code-preview-latest

在新的PowerShell窗口執行以下命令，檢查環境變量是否生效。

echo $env:ANTHROPIC_AUTH_TOKEN
echo $env:ANTHROPIC_BASE_URL
echo $env:ANTHROPIC_MODEL

使用Claude Code

啓動Claude Code：進入項目目錄，執行claude命令，即可開始使用Claude Code。

# 進入你自己的項目目錄
cd my-project
# 啓動Claude-Code
claude

模型狀態驗證：輸入/status確認模型狀態

Model後面跟着“doubao-seed-code-preview-latest”就是成功接上了！

功能測評

視覺理解能力

首先先測試一下模型的視覺理解能力，畢竟都這麼宣傳了，指定有它的優勢之處。我的想法是：給它一個前端頁面需求的手繪稿，然後參考某個網站的截圖配色，生成對應的前端代碼。

手繪稿：

國產首款視覺理解能力模型-Claude Code測評_PowerShell

參考蘋果官網截圖：

國產首款視覺理解能力模型-Claude Code測評_Code_02

prompt：@AIlearning.jpg @mytheme2.png 我需要生成一個前端頁面，為了展示在線學習網站的錯題展示頁面，主要以康奈爾筆記法結構展示，同時旁邊有一個AI小助手供學習者提問。具體佈局請參考我給出的手繪稿，網站的配色請參考我給出的網站截圖。

國產首款視覺理解能力模型-Claude Code測評_API_03

第一次生成的效果就還可以，結構分佈上和我的手繪稿差不多，配色也完美參考了我上傳的網站截圖配色，因此我沒有做二次的prompt調整。只是在一些細節問題上，需要二次去頁面上的內容作細化調整。在頁面上，它自己生成了一些數學公式，但是卻沒有正常顯示。針對這個問題我對它提出了疑問。（寫代碼就像聊天一樣！( •̀ ω •́ )y）

國產首款視覺理解能力模型-Claude Code測評_Code_04