![]()
封面新聞記者 雷強
11月8日,在世界互聯網大會烏鎮峰會上,360數字安全集團正式發布《大模型安全白皮書》(以下簡稱“白皮書”)。該白皮書首次系統性闡釋大模型運行時的五大關鍵風險,建設性地提出“外筑‘以模治模’動態屏障,內固‘平臺原生’安全底座”的核心理念,并源于實戰,提供了可落地的安全解決方案,為大模型應用拉起了全鏈路安全防線,助力推動人工智能行業向“安全、向善、可信、可控”方向穩健發展。
大模型安全呈多維復雜態勢,挑戰成指數級
隨著大模型技術加速滲透政務、金融、能源、醫療等重點行業,一個不容忽視的現實是——AI越智能,安全風險越致命。
白皮書以2025年國內外多起典型大模型安全事件為切入點,系統性歸納了威脅大模型安全的五大關鍵風險:
首先是基礎設施安全風險,包括設備控制、供應鏈漏洞、拒絕服務攻擊以及算力資源濫用等問題;其次是內容安全風險,涉及不符合核心價值觀、虛假或違規內容、大模型幻覺,以及提示注入攻擊等;第三類是數據與知識庫安全風險,數據泄露、越權訪問、隱私濫用和知識產權問題日益突出;第四是智能體安全風險,隨著智能體自主性增強,插件調用、算力調度、數據流轉等環節的安全邊界更加模糊;最后是用戶端安全風險,包括權限控制、API調用監控、惡意腳本執行以及MCP執行安全等。
這些風險相互交織,形成傳統安全方案難以應對的復雜威脅矩陣,嚴重威脅個人權益、企業發展乃至國家安全。
“外掛式安全 + 平臺原生安全”雙軌安全體系
面對上述復雜挑戰,白皮書基于實戰經驗,給出了“外掛式安全 + 平臺原生安全”雙軌治理策略 —— 前者像 AI 的 “外部保鏢”,靈活應對實時風險;后者像 AI 的“內置鎧甲”,從根源筑牢安全基礎,兩者配合形成全鏈路防護網。
外掛式安全側重模型外部防護,通過“以模治模”實現對算力主機、軟件生態、輸入輸出內容及模型幻覺的主動監測與防御。
該方式具備兩大優勢:一是適配性強、部署成本低,可作為通用組件快速接入不同企業環境,避免重復開發;二是響應迅速,具備獨立監測與攔截機制,可在毫秒級別識別并阻斷實時威脅,如異常算力消耗或惡意內容。
平臺原生安全則聚焦大模型數據、知識庫、智能體及客戶端等環節,將安全能力嵌入核心組件,強化配套組件安全與全流程合規管控。
360方面表示,外掛式安全如同“建成后加裝的防盜系統”,平臺原生安全則如“建造時內置的防火結構”,二者協同,從外至內構筑大模型的安全防線。通過這一體系,360實現了主動發現、動態演進的安全檢測能力,有效應對復雜多變的大模型安全威脅。





京公網安備 11011402013531號