MiniMax M2.1:多語言編程 SOTA,為真實世界複雜任務而生

新聞
HongKong
0
02:34 PM · Dec 23 ,2025

MiniMax M2.1 已正式發佈,官方公告寫道:

在 M2.1 中,我們致力於提升真實世界複雜任務中的表現:重點聚焦於更多編程語言和辦公場景的可用性,並在這個領域做到最好的水平。

MiniMax M2.1 具體模型亮點如下:

  • 卓越多編程語言能力:在 M2.1 中,我們系統性提升了 Rust / Java / Golang / C++ / Kotlin / Objective-C / TypeScript / JavaScript 等語言的能力,多語言任務整體表現達到業內領先水平,覆蓋從底層系統到應用層開發的完整鏈路。

  • WebDev 與 AppDev:針對業界普遍存在的移動端開發短板,M2.1 顯著加強了原生 Android / iOS 開發能力。 同時,我們系統性提升了模型在 Web 與 App 場景中的設計理解與美學表達能力,能夠出色地構建複雜交互、3D 科學場景模擬與高質量可視化表達,推動 vibe coding 成為可持續、可交付的生產實踐。

  • 複合指令約束提升,辦公場景變為可能:作為開源模型中率先系統性引入 Interleaved Thinking 的模型系列,M2.1 systematic problem-solving 能力再次升級。模型不僅關注代碼執行是否正確,同時關注模型對“複合指令約束”的整合執行能力,在真實辦公場景具備更高的可用性。

  • 更簡潔高效的回覆:相比 M2,MiniMax M2.1 的模型回覆以及思維鏈更加簡潔,在實際編程與交互體驗中,響應速度顯著提升,Token 消耗明顯下降,在 AI Coding 與 Agent 驅動的連續工作流中更加流暢和高效。

  • 出色的 Agent / 工具腳手架泛化能力:M2.1 在各類編程工具與 Agent 框架中均有出色表現。在 Claude Code、Droid(Factory AI)、Cline、Kilo Code、Roo Code、BlackBox 等工具中展現一致且穩定的效果,並對 Skill.md、Claude.md / agent.md / cursorrule、Slash Command 等 Context Management 機制提供可靠支持。

  • 高質量對話和寫作:M2.1 不再只是“代碼能力更強”,在日常對話、技術説明與寫作場景中,也能提供更具細節與結構性的回答。


 

基準測試概覽

在軟件工程相關場景的核心榜單上,MiniMax M2.1 相比於 M2 有了顯著的提升,尤其是在多語言場景上,超過 Claude Sonnet 4.5 和 Gemini 3 Pro,並接近 Claude Opus 4.5。

我們在不同 coding agent 框架上測試了 SWE-bench Verified,結果表明 MiniMax M2.1 具有良好的框架泛化性和穩定的表現。而在公開的測試用例生成、代碼性能優化,以及自建的代碼審閲(SWE-Review)、指令遵從(OctoCodingBench)等細分場景的榜單上,MiniMax M2.1 相比 M2 都表現出了全面的提升,持平或超過 Claude Sonnet 4.5。

為了衡量模型“從零到一”構建完整、可運行應用程序的全棧能力,我們構建並開源了全新基準 VIBE (Visual & Interactive Benchmark for Execution in Application Development),涵蓋了 Web、仿真 (Simulation)、Android、iOS 及後端 (Backend) 五大核心子集。不同於傳統基準,通過創新的 Agent-as-a-Verifier (AaaV) 範式,VIBE 能夠自動評估生成的 Application 在真實運行環境中的交互邏輯與視覺美感。這個評測集稍後將在 Github 上開源。

VIBE:https://huggingface.co/datasets/MiniMaxAI/VIBE

MiniMax-M2.1 在 VIBE 綜合榜單中表現卓越,以平均 88.6 分的成績展現了接近 Claude Opus 4.5 的全棧構建能力,並在幾乎所有子集上都顯著優於 Claude Sonnet 4.5。

在辦公場景、長程工具調用和綜合智能指數上,MiniMax M2.1 相比 M2 也表現出穩步提升,體現了模型解決更多真實世界複雜任務的能力。

 

如何使用

MiniMax M2.1 API 已在開放平台上線:https://platform.minimaxi.com/docs/guides/text-generation

基於 MiniMax M2.1 的通用 Agent 產品 MiniMax Agent 現已全面開放使用:https://agent.minimaxi.com/

開源以及本地部署使用:https://huggingface.co/MiniMaxAI/MiniMax-M2.1 (為了保證 M2.1 的使用精度,我們在與多個部署平台對齊測試,並在幾天後全面開源權重)

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.