360 發佈《大模型安全白皮書》

新聞
HongKong
14
03:17 PM · Nov 10 ,2025

在2025年世界互聯網大會烏鎮峯會上,360數字安全集團正式發佈國內首份《大模型安全白皮書》,系統性揭示大模型全生命週期中的五大核心風險,並首次提出“外掛式安全 + 平台原生安全”雙軌治理框架,為高危AI時代拉起一道縱深防禦屏障。

白皮書指出,大模型的安全威脅已形成跨層級、強耦合的複雜矩陣,涵蓋五大維度:

  • 基礎設施層:算力集羣、訓練平台遭攻擊可能導致模型被投毒或竊取;
  • 內容層:生成虛假信息、違規內容或“AI幻覺”引發社會風險;
  • 數據與知識庫層:訓練數據泄露、知識庫被污染將動搖模型可信根基;
  • 智能體層(Agent):自主決策的AI代理若被操控,可能執行惡意任務;
  • 用户端層:提示注入、越權訪問等攻擊可繞過防護直接操控模型行為。

面對這一多維威脅,360提出雙軌並行的安全策略:

  • “外掛式安全”:在模型外部部署監測、過濾與審計系統,如內容合規網關、異常行為檢測;
  • “平台原生安全”:將安全能力內嵌至大模型研發、訓練、部署、推理各環節,實現“安全即代碼”。

基於該理念,360已構建覆蓋數據脱敏、模型加固、內容過濾、Agent行為審計、API防護、紅藍對抗、安全合規等七大核心能力的全鏈路解決方案,並在金融、製造、政務等多個行業落地實踐。

360強調,單靠企業防護遠遠不夠。未來將聯合產學研各方,推動大模型安全標準制定、威脅情報共享與開源安全工具共建,打造開放、協同、可信的AI安全生態。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.