清華大學自然語言處理實驗室、中國人民大學、面壁智能與 OpenBMB 開源社區聯合發佈並開源 AgentCPM-Report,一個本地化、私有化、擁有 SOTA 性能的深度調研智能體。
AgentCPM-Report 核心亮點
-
極致效能,以小博大:通過平均 40 輪的深度檢索與近 100 輪的思維鏈推演,實現對信息的全方位挖掘與重組,讓端側模型也能產出邏輯嚴密、洞察深刻的萬字長文,在深度調研任務上以 8B 參數規模達成與頂級閉源系統的性能對標。
-
物理隔絕,本地安全:專為高隱私場景設計,支持完全離線的本地化敏捷部署,徹底杜絕雲端泄密風險。基於 UltraRAG 框架,它能高效掛載並理解您的本地私有知識庫,讓核心機密數據在“不出域”的前提下,安全地轉化為極具價值的專業決策報告。
據介紹,AgentCPM-Report 之所以能以 8B 參數媲美閉源系統源於兩大技術創新:
創新一:“寫作即推理”模式,讓思考更貼近人腦
傳統方案試圖讓模型“一口氣”生成完整大綱或內容,容易造成產出報告的邏輯崩塌,對於小模型來説是更是難上加難。AgentCPM-Report 創新性地採用了“邊寫作,邊規劃”的迭代精煉框架打破這一侷限:
-
兩階段循環:系統在 “起草” 與 “深化” 兩個狀態間不斷交替。就像人類專家一樣,寫完一段草稿後,會立即停下來反思:“有沒有需要補充的地方?側重點應該是怎樣的?”,然後回頭擴展章節、補充檢索、填充新內容。
-
漸進式優化:將宏大的萬字長文任務,拆解為一系列可執行的微小目標。模型在每一輪循環中只需解決當下的局部問題,從而在較小的參數規模條件下產出邏輯嚴密、細節豐富的長篇報告。
創新二:“多階段智能體學習”,全方位能力提升
01 四大核心能力拆解
將完整報告協作拆解為四個核心能力模塊,並針對性地進行強化訓練:
🔍 智能檢索能力:以“召回率”為核心優化指標,確保檢索內容高度相關,為寫作奠定堅實基礎;
📝 流暢寫作能力:建立多維度質量評估體系,從內容深度到表達清晰度全面把關;
🗺️ 科學規劃能力:對生成大綱進行結構化評估,確保報告邏輯嚴謹、層次分明;
🎯 精準決策能力:採用“軌跡剪枝”技術,構造高質量數據,解決“何時停止深化”的關鍵決策問題。
02 三階段訓練法:從入門到精通
-
有監督微調:高質量範文引導,掌握寫作基本範式;
-
原子能力強化:針對每項核心原子能力進行專項提升;
-
全流程優化: 端到端全鏈路強化學習,以最終報告質量為唯一目標,打通所有能力關節。
AgentCPM-Report 開源地址
- GitHub:https://github.com/OpenBMB/AgentCPM
- HuggingFace:https://huggingface.co/openbmb/AgentCPM-Report
- ModelScope:https://modelscope.cn/models/OpenBMB/AgentCPM-_Report
- GitCode:https://gitcode.com/OpenBMB/AgentCPM
- 魔樂社區:https://modelers.cn/models/OpenBMB/AgentCPM-Report