OpenAGI 基金會推出號稱全球最好的 Computer Use 基座模型:Lux

新聞
HongKong
16
06:44 PM · Dec 04 ,2025

OpenAGI 基金會近日發佈了其首個“computer-use”基座模型,名為 Lux。官方稱它是“世界上最好、最快、最便宜的 computer-use 模型”,並且已經通過其 SDK 對外開放,因此任何開發者或公司都可以使用它來構建自動化、代理式應用。

Lux 提供了三種運行模式,以適應不同類型的任務。

  • Actor 模式:適合明確、簡單、單步任務。執行速度快。
  • Thinker 模式:適合模糊、多步、複雜目標 — 模型會將大目標拆解成多個子任務並逐步執行。
  • Tasker 模式:用户可傳入一組具體的步驟(Python 列表形式),Lux 會逐步執行,遇失敗會重試直到完成 — 對複雜、需要精準控制的任務最為適合。

Lux 支持多種 Agent 應用:自動化軟件質量保證工作流程、深度研究、社交媒體管理、在線商店管理、數據錄入和批量操作等等。

在“Online-Mind2Web benchmark”(涵蓋超過 300 個現實、基於 Web 的 computer-use 任務)測評中,Lux 獲得了 83.6 的成績。相比之下,它超過了來自其他主要 AI 實驗室的模型:例如 Gemini CUA(69.0)、 OpenAI Operator(61.3) 和 Claude Sonnet 4(61.0)。

此外在速度和成本上也有優越表現:Lux 每一步操作約需 1 秒,而其他模型通常約 3 秒;而且據稱其成本比傳統模型低 10 倍。

與傳統的大語言模型(LLM)主要通過被動「閲讀」互聯網內容不同,Lux 的訓練採用了一種被稱為“Agentic Active Pre-training”(主動代理式預訓練) 的方法。模型通過主動在數字環境中“做事”、與環境交互、探索並學習,而不是單純記憶文本。這樣訓練出的模型在實際操作任務時更有效、更“懂動作”。

OpenAGI 基金會已將用於訓練 Agent 模型的數據引擎和基礎設施 OSGym 開源。OSGym 具有極高的可擴展性,能夠泛化到各種計算機使用任務,並行運行數千個操作系統副本,每分鐘生成超過一千個數據點。

詳情參見技術報告和 GitHub 代碼庫。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.