MiniMax M2.1 已正式發佈，官方公告寫道：

在 M2.1 中，我們致力於提升真實世界複雜任務中的表現：重點聚焦於更多編程語言和辦公場景的可用性，並在這個領域做到最好的水平。

MiniMax M2.1 具體模型亮點如下：

卓越多編程語言能力：在 M2.1 中，我們系統性提升了 Rust / Java / Golang / C++ / Kotlin / Objective-C / TypeScript / JavaScript 等語言的能力，多語言任務整體表現達到業內領先水平，覆蓋從底層系統到應用層開發的完整鏈路。
WebDev 與 AppDev：針對業界普遍存在的移動端開發短板，M2.1 顯著加強了原生 Android / iOS 開發能力。同時，我們系統性提升了模型在 Web 與 App 場景中的設計理解與美學表達能力，能夠出色地構建複雜交互、3D 科學場景模擬與高質量可視化表達，推動 vibe coding 成為可持續、可交付的生產實踐。
複合指令約束提升，辦公場景變為可能：作為開源模型中率先系統性引入 Interleaved Thinking 的模型系列，M2.1 systematic problem-solving 能力再次升級。模型不僅關注代碼執行是否正確，同時關注模型對“複合指令約束”的整合執行能力，在真實辦公場景具備更高的可用性。
更簡潔高效的回覆：相比 M2，MiniMax M2.1 的模型回覆以及思維鏈更加簡潔，在實際編程與交互體驗中，響應速度顯著提升，Token 消耗明顯下降，在 AI Coding 與 Agent 驅動的連續工作流中更加流暢和高效。
出色的 Agent / 工具腳手架泛化能力：M2.1 在各類編程工具與 Agent 框架中均有出色表現。在 Claude Code、Droid（Factory AI）、Cline、Kilo Code、Roo Code、BlackBox 等工具中展現一致且穩定的效果，並對 Skill.md、Claude.md / agent.md / cursorrule、Slash Command 等 Context Management 機制提供可靠支持。
高質量對話和寫作：M2.1 不再只是“代碼能力更強”，在日常對話、技術説明與寫作場景中，也能提供更具細節與結構性的回答。

基準測試概覽

在軟件工程相關場景的核心榜單上，MiniMax M2.1 相比於 M2 有了顯著的提升，尤其是在多語言場景上，超過 Claude Sonnet 4.5 和 Gemini 3 Pro，並接近 Claude Opus 4.5。

我們在不同 coding agent 框架上測試了 SWE-bench Verified，結果表明 MiniMax M2.1 具有良好的框架泛化性和穩定的表現。而在公開的測試用例生成、代碼性能優化，以及自建的代碼審閲（SWE-Review）、指令遵從（OctoCodingBench）等細分場景的榜單上，MiniMax M2.1 相比 M2 都表現出了全面的提升，持平或超過 Claude Sonnet 4.5。

為了衡量模型“從零到一”構建完整、可運行應用程序的全棧能力，我們構建並開源了全新基準 VIBE (Visual & Interactive Benchmark for Execution in Application Development)，涵蓋了 Web、仿真 (Simulation)、Android、iOS 及後端 (Backend) 五大核心子集。不同於傳統基準，通過創新的 Agent-as-a-Verifier (AaaV) 範式，VIBE 能夠自動評估生成的 Application 在真實運行環境中的交互邏輯與視覺美感。這個評測集稍後將在 Github 上開源。

VIBE：https://huggingface.co/datasets/MiniMaxAI/VIBE

MiniMax-M2.1 在 VIBE 綜合榜單中表現卓越，以平均 88.6 分的成績展現了接近 Claude Opus 4.5 的全棧構建能力，並在幾乎所有子集上都顯著優於 Claude Sonnet 4.5。

在辦公場景、長程工具調用和綜合智能指數上，MiniMax M2.1 相比 M2 也表現出穩步提升，體現了模型解決更多真實世界複雜任務的能力。

如何使用

MiniMax M2.1 API 已在開放平台上線：https://platform.minimaxi.com/docs/guides/text-generation

基於 MiniMax M2.1 的通用 Agent 產品 MiniMax Agent 現已全面開放使用：https://agent.minimaxi.com/

開源以及本地部署使用：https://huggingface.co/MiniMaxAI/MiniMax-M2.1 （為了保證 M2.1 的使用精度，我們在與多個部署平台對齊測試，並在幾天後全面開源權重）

MiniMax M2.1：多語言編程 SOTA，為真實世界複雜任務而生

基準測試概覽

如何使用

發佈評論

Product

Company

Support

Company

MiniMax M2.1：多語言編程 SOTA，為真實世界複雜任務而生

基準測試概覽

如何使用

發佈 評論

發佈評論