DeepSeek V3.2 正式版:強化 Agent 能力,融入思考推理

新聞
HongKong
12
07:27 PM · Dec 01 ,2025

DeepSeek發佈兩個正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方網頁端、App和API均已更新為正式版DeepSeek-V3.2。Speciale版本目前僅以臨時API服務形式開放,以供社區評測與研究。

下面是官方公告:

兩個月前,我們發佈了實驗性的 DeepSeek-V3.2-Exp,並收到了眾多熱心用户反饋的對比測試結果。目前未發現 V3.2-Exp 在任何特定場景中顯著差於 V3.1-Terminus,這驗證了 DSA 稀疏注意力機制的有效性。也感謝廣大用户一直以來的積極反饋與支持,為我們的持續創新注入了更多信心與動力。

今天,我們同時發佈兩個正式版模型:

DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

官方網頁端、App 和 API 均已更新為正式版 DeepSeek-V3.2,歡迎使用。Speciale 版本目前僅以臨時 API 服務形式開放,以供社區評測與研究。

新模型技術報告已同步發佈:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf

 

推理能力全球領先

  • DeepSeek-V3.2 的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用 Agent 任務場景。在公開的推理類 Benchmark 測試中,DeepSeek-V3.2 達到了 GPT-5 的水平,僅略低於 Gemini-3.0-Pro;相比 Kimi-K2-Thinking,V3.2 的輸出長度大幅降低,顯著減少了計算開銷與用户等待時間。

  • DeepSeek-V3.2-**Speciale 的目標是將開源模型的推理能力推向極致,探索模型能力的邊界。V3.2-Speciale 是 DeepSeek-V3.2 的長思考增強版,同時結合了 DeepSeek-Math-V2 的定理證明能力。該模型具備出色的指令跟隨、嚴謹的數學證明與邏輯驗證能力,在主流推理基準測試上的性能表現媲美 Gemini-3.0-Pro(見表1)。更令人矚目的是,V3.2-Speciale 模型成功斬獲 IMO 2025(國際數學奧林匹克)、CMO 2025(中國數學奧林匹克)、ICPC World Finals 2025(國際大學生程序設計競賽全球總決賽)及 IOI 2025(國際信息學奧林匹克)金牌**。其中,ICPC 與 IOI 成績分別達到了人類選手第二名與第十名的水平。

Tips:在高度複雜任務上,Speciale 模型大幅優於標準版本,但消耗的 Tokens 也顯著更多,成本更高。目前,DeepSeek-V3.2-Speciale 僅供研究使用,不支持工具調用,暫未針對日常對話與寫作任務進行專項優化。

表1:DeepSeek-V3.2 與其他模型在各類數學、代碼與通用領域評測集上的得分(括號內為消耗 Tokens 總量約數)

 

思考融入工具調用

  • 不同於過往版本在思考模式下無法調用工具的侷限,DeepSeek-V3.2 是我們推出的首個將思考融入工具使用的模型,並且同時支持思考模式與非思考模式的工具調用。我們提出了一種大規模 Agent 訓練數據合成方法,構造了大量「難解答,易驗證」的強化學習任務(1800+ 環境,85,000+ 複雜指令),大幅提高了模型的泛化能力。

表2:DeepSeek-V3.2 與其他模型在各類智能體工具調用評測集上的得分

  • 如表 2 所示,DeepSeek-V3.2 模型在智能體評測中達到了當前開源模型的最高水平,大幅縮小了開源模型與閉源模型的差距。值得説明的是,V3.2 並沒有針對這些測試集的工具進行特殊訓練,所以我們相信,V3.2 在真實應用場景中能夠展現出較強的泛化性。

示例為通過 LobeChat 使用 DeepSeek-V3.2 的深度思考+工具調用能力得到更加詳細準確的回覆

 

開源

  • DeepSeek-V3.2

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2

ModelScope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

  • DeepSeek-V3.2-Speciale

HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

ModelScope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

網頁端、APP 與 API 更新

DeepSeek-V3.2 是我們當前正式提供服務的模型,官網網頁、APP、API 模型均已由 DeepSeek-V3.2-Exp 升級為正式版 DeepSeek-V3.2,使用方式不變。

同時,為了方便社區評測與研究,我們非正式部署了 DeepSeek-V3.2-Speciale 的 API 服務,API 用户可以通過設置

base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"

訪問該模型。該模型 API 價格不變,只支持思考模式下的對話功能,不支持工具調用等功能,最大輸出長度默認為 128K,支持時間截止至北京時間 2025-12-15 23:59。

 

思考模式下的工具調用

本次 API 更新支持了 DeepSeek-V3.2 思考模式下的工具調用能力。當前在思考模式下,模型能夠經過多輪的思考 + 工具調用,最終給出更詳盡準確的回答。下圖為思考模式下進行工具調用的 API 請求示意圖:

  • 在回答問題 1 過程中(請求 1.1 - 1.3),模型進行了多次思考 + 工具調用後給出答案。在這個過程中,用户需回傳思維鏈內容(reasoning_content)給 API,以讓模型繼續思考。

  • 在下一個用户問題開始時(請求 2.1),需刪除之前的思維鏈,並保留其它內容發送給 API。

  • 更詳細的使用方法請參考 API 文檔:

    https://api-docs.deepseek.com/zh-cn/guides/thinking_mode

DeepSeek-V3.2 的思考模式也增加了對 Claude Code 的支持,用户可以通過將模型名改為 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 鍵開啓思考模式進行使用。但需要注意的是,思考模式未充分適配 Cline、RooCode 等使用非標準工具調用的組件,我們建議用户在使用此類組件時繼續使用非思考模式。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.