DeepSeek 開源代碼倉庫出現神秘標識符“MODEL1”

新聞
HongKong
10
07:31 PM · Jan 21 ,2026

近日,DeepSeek 團隊向其核心推理內核 FlashMLA 推送了一系列更新,而在這些提交中,一個此前從未公開亮相的模型命名 “MODEL1” 引發了社區的高度關注。

多位社區開發者推測,MODEL1 很可能正是 DeepSeek 內測中的 V3 終極版本(V4 模型),也有人猜測它可能代表一個完全獨立於 V 系列的新模型。

據介紹,DeepSeek 團隊為 FlashMLA 提交更新的這一系列代碼橫跨 114 個文件,其中有 28 處都提到了未知的 “MODEL1” 大模型標識符。該標識符與已知的現有模型 “V32”(即 DeepSeek-V3.2)被並列或區別提及。

根據代碼上下文分析,“MODEL1” 很可能代表一個不同於現有架構的新模型。

開發者分析認為,“MODEL1” 與 “V32” 在關鍵技術上存在區別,主要體現在鍵值(KV)緩存的佈局、稀疏性處理方式以及對 FP8 數據格式的解碼支持等方面。這些差異表明新架構可能在內存優化和計算效率上進行了針對性設計。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.