IBM 近日發佈了名為 CUGA 的開源 AI agent 項目,旨在讓構建智能 agent 變得更容易、更靈活、更可控制。
據介紹,CUGA(Configurable Generalist Agent,可配置通用智能體)是一個開源的通用 AI 智能體框架,旨在幫助開發者輕鬆構建、配置和部署智能 agent,支持跨 API、Web 等複雜任務的自動化執行。它專注於解決傳統 agent 在複雜場景下容易失敗的問題。
CUGA 專為 Web 和 API 環境中的複雜多步驟任務設計。該 Agent 在主流基準測試中表現優異,位列 AppWorld 榜首,並在 WebArena 測試中達到頂級水平。其核心能力包括靈活平衡性能與成本的可配置推理模式,支持從快速啓發式到深度規劃的多種選項。
CUGA 具備計算機使用能力,可無縫結合 UI 交互與 API 調用,並通過 OpenAPI 規範、MCP 服務器和 LangChain 實現多工具集成,快速連接 REST API、自定義協議和 Python 函數。此外,CUGA 具有可組合性,可作為工具暴露給其他 Agent 以支持嵌套推理和多 Agent 協作。
開源地址:https://github.com/cuga-project/cuga-agent