12 月 9 日,國內領先的生成式人工智能公司智譜AI正式宣佈將其核心 AI Agent 模型 AutoGLM 完全開源,標誌着具備手機操作能力的 AI 技術從“大廠專利”向全行業開放邁出關鍵一步。此次開源的內容包括 Phone Agent 框架、9 B 參數規模的 AutoGLM‑Phone‑9B 模型、完整的工具鏈、Demo 以及 Android 適配層,採用雙許可證模式,旨在降低開發者門檻,讓更多廠商和個人能夠基於同一底座打造 AI 原生手機。
背景:豆包手機引發的“入口爭奪”
今年 8 月,智譜旗下的“豆包手機”憑藉 AI 直接操控系統、實現“一鍵點單、自動登錄”等功能迅速走紅,成為業界爭相模仿的標杆。然而,隨着流量入口的價值被放大,多個手機廠商相繼推出自研 AI 助手,形成了激烈的競爭格局,甚至出現了對“超級入口”壟斷的擔憂。在此背景下,智譜選擇以開源方式“打破壁壘”,讓 AI 手機的關鍵技術不再被單一企業獨佔。
技術亮點:Phone Agent + 雙層架構
AutoGLM 採用“規劃層+定位層”雙層架構,解決了傳統模型“看得懂但點不準”的痛點。模型在 32 個月研發期間,引入了雲端虛擬手機集羣訓練,顯著提升了跨 App 操作的泛化能力,已支持 50 餘高頻中文應用,包括外賣、機票、購物等場景。在實際測試中,AutoGLM 能完成跨平台比價、自動填寫表單等複雜任務,並在涉及驗證碼等敏感操作時主動停留,遵循安全規則,體現了對用户隱私的“分寸感”。
行業影響:護城河被削、生態加速
智譜 AutoGLM 的開源被視為“Phone Agent 不再是大廠專利”,意味着手機廠商的技術護城河正在被填平。業內人士指出,隨着開源基建的普及,未來會有更多開發者進入 AI 手機生態,硬件溢價空間將被壓縮,原本 3499 元的豆包手機定價或將被更平價的產品所取代。與此同時,AutoGLM 支持的多 App 能力為無障礙、效率提升等細分場景提供了技術可能,預計將催生一批針對特定人羣的創新應用。
市場前景與挑戰
智譜 AutoGLM 部門負責人劉瀟在接受《科創板日報》採訪時表示,AI 手機為移動互聯網注入了 Agent 自主執行的新增流量,但真正的生態繁榮仍需依賴 AI 手機的普及以及與各 App 生態的深度磨合,短期內仍面臨隱私合規、跨平台適配等挑戰。他補充,開源的初衷是讓行業共同擁有和打磨這一本公共底座,避免少數企業壟斷關鍵入口,從而推動 AI 手機向更安全、開放的方向發展。
結語
從“AI 能不能操作手機”到“AI 手機已經起風”,智譜 AutoGLM 的開源讓這場技術革命從概念走向可落地的公共資源。無論是大廠搶佔入口的競爭,還是中小開發者的創新突破,都將在這一開放平台上展開。可以預見,未來十年,手機交互方式將從“人操作機器”轉向“機器替人操作”,而 AutoGLM 正是這場轉型的關鍵起點。