OpenAGI 基金會推出號稱全球最好的 Computer Use 基座模型：Lux

OpenAGI 基金會近日發佈了其首個“computer-use”基座模型，名為 Lux。官方稱它是“世界上最好、最快、最便宜的 computer-use 模型”，並且已經通過其 SDK 對外開放，因此任何開發者或公司都可以使用它來構建自動化、代理式應用。

Lux 提供了三種運行模式，以適應不同類型的任務。

Actor 模式：適合明確、簡單、單步任務。執行速度快。
Thinker 模式：適合模糊、多步、複雜目標 — 模型會將大目標拆解成多個子任務並逐步執行。
Tasker 模式：用户可傳入一組具體的步驟（Python 列表形式），Lux 會逐步執行，遇失敗會重試直到完成 — 對複雜、需要精準控制的任務最為適合。

Lux 支持多種 Agent 應用：自動化軟件質量保證工作流程、深度研究、社交媒體管理、在線商店管理、數據錄入和批量操作等等。

在“Online-Mind2Web benchmark”（涵蓋超過 300 個現實、基於 Web 的 computer-use 任務）測評中，Lux 獲得了 83.6 的成績。相比之下，它超過了來自其他主要 AI 實驗室的模型：例如 Gemini CUA（69.0）、 OpenAI Operator（61.3）和 Claude Sonnet 4（61.0）。

此外在速度和成本上也有優越表現：Lux 每一步操作約需 1 秒，而其他模型通常約 3 秒；而且據稱其成本比傳統模型低 10 倍。

與傳統的大語言模型（LLM）主要通過被動「閲讀」互聯網內容不同，Lux 的訓練採用了一種被稱為“Agentic Active Pre-training”（主動代理式預訓練）的方法。模型通過主動在數字環境中“做事”、與環境交互、探索並學習，而不是單純記憶文本。這樣訓練出的模型在實際操作任務時更有效、更“懂動作”。

OpenAGI 基金會已將用於訓練 Agent 模型的數據引擎和基礎設施 OSGym 開源。OSGym 具有極高的可擴展性，能夠泛化到各種計算機使用任務，並行運行數千個操作系統副本，每分鐘生成超過一千個數據點。

詳情參見技術報告和 GitHub 代碼庫。

發佈評論

Product

Company

Support

Company

OpenAGI 基金會推出號稱全球最好的 Computer Use 基座模型：Lux

發佈 評論

發佈評論