月之暗面發佈並開源 Kimi K2.5 模型:
- 它是 Kimi 迄今最智能的模型,在 Agent、代碼、圖像、視頻及一系列通用智能任務上取得開源 state-of-the-art 表現。
- 也是 Kimi 迄今最全能的模型,原生的多模態架構設計,同時支持視覺與文本輸入、思考與非思考模式、對話與 Agent 任務。
- Kimi K2.5 讓智能更加觸手可及。通過將視覺理解與推理、代碼、Agent 等能力結合,K2.5 降低了用户與 AI 的交互門檻:當語言難以準確描述時,可拍照、截圖或錄屏傳給 Kimi,突破文字表達的限制。
- Kimi K2.5 讓人人精通 Office。K2.5 模型將 Kimi Agent 能力擴展到日常辦公領域,開始掌握 Word、Excel、PPT、PDF 等常用軟件的中高階技能,助用户直接交付準專業水平的辦公文檔。
根據介紹,Kimi K2.5 進一步提升了開源模型的代碼水平,尤其是在前端開發領域。K2.5 模型支持從簡單的自然語言對話生成完整的前端界面,並能有效處理交互式佈局及滾動觸發等動態效果。
K2.5 還通過融合視覺能力降低了編程的門檻:用户可以直接傳一段錄屏。Kimi K2.5 能自動拆解背後的交互邏輯,並用乾淨、專業的代碼將其從頭到尾復現出來。
並首次引入了「Agent 集羣」能力,K2.5 能根據任務需求,現場調度多達 100 個分身,並行處理 1500 個步驟。在大規模搜索(wide search)場景下,與單 Agent 執行相比,Agent 集羣將達成目標性能所需的最少關鍵步驟減少了 3 到 4.5 倍,且隨着目標要求的提升,節省幅度進一步擴大;通過並行化,實際運行時間(wall clock)最高可縮短 4.5 倍。
Agent 集羣的規模化訓練極具挑戰。為此,項目團隊重構了強化學習基建,並專門優化了訓練算法,以確保能達到極致的效率和性能。目前,這一實驗性功能已開啓 Beta 測試,並將於近期逐步開放。
K2.5 提供了四種模式,目前已可在 Kimi.com 或者 Kimi App 上使用:
- 快速模式:提供最快的響應體驗;
- 思考模式:可以用來解答覆雜問題;
- Agent 模式:擅長深度研究、PPT、Excel、Word、PDF和網頁生成等任務;
- Agent集羣模式:適合需要並行處理的複雜任務。
同時,月之暗面還宣佈推出Kimi Code。它不僅能在終端裏直接運行,還能無縫集成到 VSCode、Cursor、JetBrains 和 Zed 等主流編輯器中。Kimi Code 可充分發揮 K2.5 的多模態優勢,支持直接輸入圖片和視頻進行編程輔助,並能自動發現並將你現有的技能遷移到新的工作流中。
Kimi Code Bench 是其內部的代碼能力評測基準,涵蓋從構建、調試、重構、測試到腳本編寫等多種端到端任務,支持多種編程語言。在評估中,搭載了 K2.5 的 Kimi Code,相比之前的 Kimi 模型有了大幅度的提升。