OpenAI 啓用 AI 模擬黑客攻擊

新聞
HongKong
0
11:34 AM · Dec 24 ,2025

OpenAI 開發了一套“自動化攻擊者”系統,通過模擬真實黑客的攻擊手段,對 ChatGPT Atlas 進行全天候的壓力測試。

這套系統的核心在於對抗提示注入(Prompt Injection)攻擊。在這種攻擊中,惡意第三方會悄悄向 AI 代理髮送指令,誘導其執行違背用户意願的操作,例如在用户不知情的情況下轉發敏感郵件或刪除雲端文件。

OpenAI 的“自動化攻擊者”利用了先進的強化學習技術,能夠自主發現人類紅隊測試中未曾察覺的新型攻擊路徑。

在一次實際演示中,這個 AI 攻擊者成功模擬了誘導 Atlas 向公司 CEO 發送辭職信的場景。雖然 Atlas 的防禦機制最終攔截了這一請求並提醒了用户,但 OpenAI 坦言,安全博弈是一場持久戰。由於代理式瀏覽器需要深度介入用户的數字化生活(如訪問郵件、日曆等),其便利性本身也帶來了更大的風險暴露面。

不過 OpenAI 也在最新報告中警示稱,由於 AI 代理的本質特性,這類安全威脅可能永遠無法被徹底“根治”。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.