OpenAI 啓用 AI 模擬黑客攻擊

OpenAI 開發了一套“自動化攻擊者”系統，通過模擬真實黑客的攻擊手段，對 ChatGPT Atlas 進行全天候的壓力測試。

這套系統的核心在於對抗提示注入（Prompt Injection）攻擊。在這種攻擊中，惡意第三方會悄悄向 AI 代理髮送指令，誘導其執行違背用户意願的操作，例如在用户不知情的情況下轉發敏感郵件或刪除雲端文件。

OpenAI 的“自動化攻擊者”利用了先進的強化學習技術，能夠自主發現人類紅隊測試中未曾察覺的新型攻擊路徑。

在一次實際演示中，這個 AI 攻擊者成功模擬了誘導 Atlas 向公司 CEO 發送辭職信的場景。雖然 Atlas 的防禦機制最終攔截了這一請求並提醒了用户，但 OpenAI 坦言，安全博弈是一場持久戰。由於代理式瀏覽器需要深度介入用户的數字化生活（如訪問郵件、日曆等），其便利性本身也帶來了更大的風險暴露面。

不過 OpenAI 也在最新報告中警示稱，由於 AI 代理的本質特性，這類安全威脅可能永遠無法被徹底“根治”。

發佈評論

Product

Company

Support

Company

OpenAI 啓用 AI 模擬黑客攻擊

發佈 評論

發佈評論