智譜開源“會操作手機的 AI Agent”:AutoGLM

新聞
HongKong
8
10:30 AM · Dec 09 ,2025

智譜宣佈開源其核心AI Agent模型AutoGLM。該模型被業界視為全球首個具備“Phone Use”(手機操作)能力的AI Agent,能夠穩定完成外賣點單、機票預訂等長達數十步的複雜操作流程。

我們開源的,是一整套可以「拿來就用」的能力,而不僅僅是一份概念説明。

具體包括:

  • 訓練好的核心模型;
  • Phone Use 能力框架與工具鏈;
  • 可直接跑通的 Demo,覆蓋 50+ 高頻中文 App;
  • 針對 Android 的適配層與示例工程;
  • 文檔、快速上手指南。

模型會以 MIT 開源許可證的形式開放,而所有代碼會以 Apache-2.0 開源許可證的形式,託管在 GitHub 倉庫(github.com/zai-org/Open-AutoGLM)中。

此次開源意味着硬件廠商、手機廠商和開發者均可基於AutoGLM,在自己的設備或系統中復現一個能“看懂”屏幕、並模擬真人進行點擊、輸入、滑動的AI助手。

目前,AutoGLM已支持微信、淘寶、抖音、美團等超過50個高頻中文應用的核心場景,其自動化操作能力與此前引發熱議的“豆包手機”演示相似。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.