Anthropic 發佈了新旗艦模型 Claude Opus 4.5,主打更強的工程能力、長任務表現與代理(Agent)執行效率,目標成為“軟件開發、電腦使用與自動化任務”領域的最強通用模型之一。
工程與性能大幅提升
-
在多項軟件工程基準中取得領先成績,長鏈條推理和複雜編碼任務表現顯著增強。
-
在長會話、代理執行、多步驟工具調用上進行了系統性強化,更適用於處理持續數小時甚至跨天的任務。
-
Token 效率進一步改善,以更少的輸入獲得更高質量輸出。
開發者功能升級
-
新增 “effort 參數”:可調節模型運行模式,讓用户在“更快、更省 token”與“高精度、全力輸出”之間自由切換。
-
上下文壓縮、長期記憶、高級工具調用等能力得到優化,使模型在處理跨文檔、跨應用的任務時更穩定。
-
產品層面強化了在 Excel、Chrome 以及桌面應用中的實用體驗。
安全強化與對齊升級
-
官方將其稱為迄今為止最穩健的安全對齊版本。
-
對提示注入(prompt injection)防禦能力提升,使模型在開放任務中更難被惡意操控。
面向企業與團隊的開放
-
通過應用、API 與多個主流雲平台同步提供。
-
定價為輸入5美元/百萬token,輸出25美元/百萬token,使得旗艦能力更廣泛可及。
更多介紹查看:https://www.anthropic.com/news/claude-opus-4-5