亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

AI模型守法率提升11%,港科大首次用法案構建安全benchmark

IP屬地 中國·北京 新智元 時間:2025-10-22 12:11:40


新智元報道

編輯:LRST

香港科技大學KnowComp實驗室提出基于《歐盟人工智能法案》和《GDPR》的LLM安全新范式,構建合規測試基準并訓練出性能優異的推理模型,為大語言模型安全管理提供了新方向。

大語言模型(LLM)展現了卓越的能力從而廣泛普及,這同時也凸顯了LLM安全的至關重要性。然而,現有安全方法缺乏嚴謹系統的保護機制,無法確保應對現代LLM系統復雜微妙行為時的安全性。

為此,香港科技大學KnowComp實驗室從法律合規視角切入LLM安全研究,提出「安全合規」新范式:Safety Compliance


論文連接:https://arxiv.org/pdf/2509.22250

研究人員將已建立的相關法律框架確立為定義和衡量安全的黃金標準,包括作為歐洲AI與數據安全核心法規的《歐盟人工智能法案》(EU AI Act)和《通用數據保護條例》(GDPR)。

為彌合LLM安全與法律合規之間的差距,首先基于法律條文構建LLM安全場景,建造全新的安全合規benchmark,該研究發現現有最先進的LLM在該benchmark上效果不好。

為提升LLM的安全合規能力,使用強化學習GRPO方法對Qwen3-8B模型進行微調,構建出能夠有效增強安全合規能力的推理模型:Compliance Reasoner。

實驗表明,其在新benchmark測試中表現優異,在EU AI Act和GDPR有關的安全數據案例上分別實現+10.45%和+11.85%的性能提升。

論文第一作者是來自香港科技大學的博士生胡文彬,他研究的領域是大語言模型的安全與隱私。

他在ACL、EMNLP等頂級人工智能學術會議上發表了多篇論文,工作涵蓋了大模型安全與合規、情景化隱私保護、基于強化學習訓練的大模型安全衛士、可信AI Agent通信協議等前沿領域。


整體框架示意圖:1. 首先通過以法律條文為種子數據構建安全合規benchmark。2. 隨后利用強化學習GRPO訓練得到安全合規的推理模型Compliance Reasoner。3. 最終運用該模型將已存在的安全數據有效對齊至合規領域。

構建Benchmark

由于目前缺乏安全合規性的研究成果,首先需要建立一個benchmark。通過將法律條文作為種子數據,利用DeepSeek-V3.1的強大思維能力合成出安全合規案例。

把法律法規作為合成數據的種子數據

建立一個種子數據池,用于合成安全合規案例。

首先,由于法律框架本身具有層級化特征,以樹狀結構對法律框架進行形式化建模。法律樹可表示為T = (V,E),其中每個節點vi ∈V存儲著不同層級的法規條款。

隨后遍歷T中所有從根節點到葉節點的路徑,以窮盡捕捉法規間的邏輯關聯。

具體而言,對于給定路徑 P= {v1, v2,..., vn}(其中v1為根節點,vn為葉子節點),通過串聯路徑中各節點生成種子數據:Sp = concat(v1, ..., vn)。

該方法確保每個種子數據點都能呈現語境完整、邏輯連貫的法律合規鏈條。所有枚舉路徑構成法規種子池,用于合成安全合規數據。

合成安全合規數據

基于已創建的種子數據,遍歷種子數據庫并采用最先進的推理模型之一的DeepSeek-V3.1來生成仿真的LLM安全場景。指導DeepSeek-V3.1模擬真實法律案件的分析流程,該模型通過以下核心法律分析要素進行綜合推理:

涉案主體:明確原告、被告及相關第三方

事實背景:完整陳述導致LLM安全場景的事件脈絡

法律爭議點:援引相關條款指出具體法律問題

論點摘要:歸納原告、被告及其他利益相關方的主張

司法管轄:闡明管轄權限及相關背景

通過此流程,模型可為LLM安全案例生成全面、合理且貼近現實的數據。

最終為EU AI Act與GDPR分別合成了1,684個和1,012個安全合規案例樣本。

人類驗證與評估

為了評估合成的安全合規數據的質量,該工作做了詳盡的人類驗證。

該評估由三位攻讀計算語言學與法學的博士生組成的評估小組完成,對于EU AI Act和GDPR兩個領域分別隨機抽取50個合成數據樣本進行評估。它的評價體系基于以下的三大維度:

Alignment:確保生成的案例與對應法規條款保持一致。

Coherence:保證安全案件情境發展符合自然邏輯與真實合理性。

Relevance:確保案例背景與大語言模型安全領域緊密關聯。

采用1分(最低)至5分(最高)的評分體系進行初步評定,隨后將得分標準化為百分比形式。

結果表明,合成數據在三大維度上均表現優異,綜合評分均達到95%以上。

訓練安全合規的推理模型

Compliance Reasoner

為增強大語言模型在安全合規方面的推理能力,采用強化學習算法訓練了一個名為"合規推理器"的推理模型。

基于蒸餾數據的冷啟動

在開展強化學習訓練前,通過冷啟動機制建立初始安全推理能力對于構建高效推理模型至關重要。通過DeepSeek-V3.1模型來蒸餾出推理軌跡來得到冷啟動數據。

同時,精心構建提示詞模板,引導該模型生成基于法律條文的針對安全合規案件分析的逐步推理。

基于這些蒸餾數據,采用監督微調訓練策略對Qwen3-8B模型實施冷啟動。

強化學習算法與獎勵設計

在冷啟動后的Qwen3-8B模型基礎上,采用分組相對策略優化算法(GRPO)進行模型訓練。

該工作設計有效的獎勵函數,精心構建了基于規則的rule-based獎勵函數。該獎勵函數由兩個部分加權平均組成:

1. 安全合規獎勵:通過分析模型的輸出結果來驗證安全合規性。只需從響應內容中直接提取判定結果與真實結果進行比對即可得到獎勵分數。

2. 格式獎勵:為確保輸出范式與基礎模型保持一致從而保持基礎能力,在GRPO訓練的獎勵函數中引入了格式獎勵項。

當模型輸出符合以下格式的時候獲得獎勵:


既有的安全數據對齊到合規上

盡管已經存在的LLM安全數據缺乏系統化的安全分類體系,但這些數據囊括了大量不安全的基礎行為模式。這些基礎行為可作為有價值的種子數據,用于生成更多安全合規數據。

Compliance Reasoner能夠作為連接安全規范與法律合規的有效對齊工具,將已經存在的其他的LLM安全benchmark數據有效對齊至該工作提出的安全合規領域。

該工作收集了來自Aegis-2.0、WildGuard、OpenAI Mod和SafeRLHF的數據,合成詳細的安全合規場景。

該方法為將已有安全數據對齊至安全合規任務提供了通用解決方案。

實驗結果

結論1:Compliance Reasoner在安全合規任務上顯著超越所有最先進的大語言模型baseline,包括通用模型和安全衛士。

結論2:當前安全衛士在合規性方面表現欠佳,性能甚至普遍低于通用模型。


結論3:Compliance Reasoner能夠有效將已存在的安全benchmark數據對齊至合規要求。

使用Compliance-Reasoner-GRPO模型為現有安全數據匹配對應法律章節,其在Aegis-2.0、WildGuard、OpenAI Mod和SafeRLHF數據集中,章節匹配缺失率僅分別為19.86%、15.73%、16.19%和15.73%,這表明現有數據具有向安全合規領域泛化的巨大潛力。

為深入揭示已存在的安全數據與法律框架的關聯性,進一步分析了這些數據在EU AI Act和GDPR各章節的分布情況。


結論4:合規推理器能夠以既有安全數據為種子,有效生成高質量的新型安全合規數據。

基于該文章提出的方法論,以已存在的安全數據作為種子,引導模型生成符合法律框架的合規案例。為評估新生成數據的質量,該文章按照方法論章節中的相同的流程進行了額外的人類評估。

經三位博士生綜合評定,新數據在法律規范對齊性、邏輯連貫性及場景相關性三個維度分別獲得97.6%、95.6%和97.2%的評分。

結論5:大多數語言模型在新生成的安全合規數據上表現欠佳。

使用三個通用大模型和三個安全衛士模型重新評估了LLM baseline在新生成安全合規數據上的表現。


大多數模型均呈現較低性能,這凸顯了該領域仍需進一步提升的必要性。

總結

研究人員從安全合規的視角重新審視大語言模型安全問題。

以《歐盟人工智能法案》(EU AI Act) 和《通用數據保護條例》(GDPR) 視為LLM安全的黃金標準,重新構筑LLM安全的范式。

基于這一理念,以法律條文構建benchmark數據,采用GRPO方法在新數據上訓練出更加安全合規的推理模型,并將既有安全數據有效對齊至合規數據領域。

研究人員呼吁LLM安全社區的研究者們一起關注安全合規這一治理LLM安全的新方向。

參考資料:

https://arxiv.org/pdf/2509.22250

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

国产精品天天狠天天看| 无颜之月在线看| 国产福利91精品一区| 国产探花一区二区三区| 国产免费久久av| 精品一区二区在线免费观看| 一区二区日韩在线观看| 亚洲精品一区在线观看| 成人久久久精品乱码一区二区三区| 日韩欧美高清在线观看| 国产精品天天av精麻传媒| 久久人人爽人人爽爽久久| 日韩和欧美一区二区| 国产精品后入内射日本在线观看| 日韩在线视频播放| 人人爽人人爽人人片av| 超碰日本道色综合久久综合| 中文字幕+乱码+中文字幕明步 | 成人激情五月天| 91精品视频一区| 亚洲精品久久久久久下一站| 中文字幕第一区综合| 奇米精品一区二区三区在线观看| 日本网站免费观看| 天堂а√在线中文在线 | 欧美 日韩 激情| 97久久超碰福利国产精品…| 日本不卡的三区四区五区| 97超级碰碰| 97精品国产露脸对白| 欧美成人黑人猛交| 亚洲欧美久久久久一区二区三区| 久久精品电影网| 久久亚洲欧美国产精品乐播| 精品人妻无码一区二区色欲产成人 | 午夜激情影院在线观看| 成人做爰www看视频软件| 中文字幕在线观看日| 欧美一级视频在线播放| 国产综合在线视频| 亚洲同性同志一二三专区| 国产xxxxxx| 免费无遮挡无码永久在线观看视频| 国产激情综合五月久久| 精品亚洲国产视频| 国产一区二区久久精品| 中文字幕第四页| www.88av| 久久精品国产亚洲精品2020| 在线播放亚洲一区| 精品女厕一区二区三区| 日本电影亚洲天堂一区| 精品亚洲aⅴ在线观看| 3d蒂法精品啪啪一区二区免费| 成人三级在线| 亚洲综合日韩中文字幕v在线| 精品精品国产国产自在线| 亚洲福利国产精品| 久久品道一品道久久精品| 日本成人超碰在线观看| 99在线免费视频观看| 俺去亚洲欧洲欧美日韩| 国产精品都在这里| 久久免费少妇高潮久久精品99| 欧美日韩一区不卡| 丝袜美腿亚洲综合| 亚洲国产精品久久久久婷蜜芽| 日韩视频精品| 精品国产二区在线| 国产精品国产亚洲精品看不卡| 给我看免费高清在线观看| 精品少妇一二三区| 日韩精品一卡二卡三卡四卡无卡| 美女国产一区二区| 亚洲男人第一天堂| 香蕉成人在线视频| 高清中文字幕mv的电影| www.桃色.com| 欧美xxxx吸乳| 91免费在线视频| 91香蕉亚洲精品| 亚洲精品日韩在线观看| 欧美人与物videos另类| 国产色综合一区二区三区| 精品女同一区二区三区在线播放| 夜夜亚洲天天久久| 91高清在线观看| 日韩精品高清视频| 国产三区精品| 欧美熟妇精品一区二区| 在线看成人av| 日日骚av一区二区| 日韩欧美123区| 免费成人深夜蜜桃视频| 亚洲成a人片在线www| 日本在线观看a| 欧美综合77777色婷婷| 91a在线视频| 日韩亚洲不卡在线| 久久精品国产sm调教网站演员| 国产又黄又大又粗视频| 女教师高潮黄又色视频| 国产欧美精品在线| 99re视频在线播放| 国内精品一区二区| 中文字幕一区二区中文字幕| 国产黑丝在线观看| 久久精品国产一区二区三| 91九色最新地址| 6080yy精品一区二区三区| 密臀av一区二区三区| 亚洲免费成人在线视频| 中国黄色片免费看| 午夜激情av在线| 成人网站免费观看| 日韩 欧美 精品| 成年人在线观看av| 无码国产69精品久久久久网站 | 五月天在线免费视频| 国产网站免费在线观看| 久久久亚洲精品无码| 国产主播精品在线| 国产经典久久久| 国产三级三级看三级| 一级黄色大片免费观看| 99久久精品免费精品国产| 欧美日韩一级二级| 精品国产三级电影在线观看| 亚洲福利影片在线| 97视频免费看| 欧美精品二区三区四区免费看视频 | 美乳视频一区二区| 精品亚洲永久免费| 波多野结衣高清视频| 在线免费看黄色片| 亚洲精品国产精品乱码| 丝袜美腿一区二区三区| 一区二区三区中文字幕电影 | 波多野结衣欲乱| 蜜臀av国产精品久久久久 | 久久久久久久综合狠狠综合| 一区二区三区成人在线视频| 亚洲女人天堂色在线7777| 在线免费观看羞羞视频一区二区| 亚洲最色的网站| 久久久久高清精品| 成人av在线播放网址| 国产成a人亚洲| 亚洲精品成a人在线观看| 国产成人精品视频在线| 成人看片人aa| 人妻无码视频一区二区三区| 欧美国产日韩在线观看成人| 一区二区三区毛片| 国产传媒一区二区三区| 国产无套粉嫩白浆内谢| 国产精品久久久久久久久久久免费看 | 97成人在线视频| 夜夜爽99久久国产综合精品女不卡| 国产精选久久久久久| 日韩免费av片在线观看| 国产精品女视频| 亚洲一区二区三区xxx视频| 日韩和欧美的一区二区| 中日韩精品一区二区三区| 亚洲国产精品suv| 国产欧美日本一区二区三区| 国产一区二区欧美日韩| 国产黄色特级片| 2017欧美狠狠色| 国严精品久久久久久亚洲影视| 无码人妻精品一区二区蜜桃色欲| 91久久线看在观草草青青| 国产精品久久激情| 国产精品自拍视频在线| 日韩av大片在线观看| 国产a级毛片一区| 欧美精品免费视频| 国产91亚洲精品一区二区三区| 91人人澡人人爽人人精品| 一区二区xxx| 短视频在线观看| 免费黄色av片| 老司机精品视频在线| 91精品国产色综合久久ai换脸 | 波多野结衣在线aⅴ中文字幕不卡| 欧美日韩不卡一区二区| 亚洲一区二区三区精品动漫| 国产v综合v亚洲欧| 欧美一级二级三级九九九| 国产69精品一区二区亚洲孕妇| 日韩av男人的天堂| 插吧插吧综合网| 国产一区日韩二区欧美三区| 精品国产成人系列| 日日骚一区二区网站| 国产在线视频第一页| 亚洲精品国产品国语在线app| 欧美福利视频网站| 91天堂在线视频| 成人av在线播放观看| 国产伦理片在线观看| 国产区精品在线| 一区二区三区不卡视频| 成人a级免费视频| 欧美做爰啪啪xxxⅹ性| 亚洲激情一区二区| 黄色免费网址大全| 亚洲男人天堂一区| 亚洲午夜精品久久久久久人妖| 亚洲一区二区三区四区不卡| 午夜免费看毛片| 亚洲自拍另类综合| 日本成年人网址| 国产一区二区女| 国产成人aa精品一区在线播放| 精品人妻一区二区三区日产| 国产成人精品亚洲777人妖 | 免费看成人av| 911av视频| 亚洲综合伊人久久| 精品久久国产视频| 天天射综合影视| 国产成人精品电影久久久| 久久久99999| 亚洲大片一区二区三区| 97超级碰碰碰| 国产在线免费视频| 在线观看av不卡| 国产 xxxx| 欧美在线 | 亚洲| 亚洲无线码一区二区三区| 久久电影网电视剧免费观看| 精品视频在线播放色网色视频| 免费高清视频在线观看| 久久久国产一区二区三区四区小说 | 4438x成人网最大色成网站| 制服 丝袜 综合 日韩 欧美| 亚洲精品视频播放| 成人黄色免费网| 亚洲自拍偷拍区| 日本视频一区二区| 成人三级在线| 视频一区二区中文字幕| 色悠悠久久久久| 国产成人在线综合| 粉嫩嫩av羞羞动漫久久久| 8050国产精品久久久久久| 久久久久久久国产精品毛片| 国产精品高清亚洲| 久久成年人免费电影| 一区二区三区 日韩| 日韩精品欧美成人高清一区二区| 亚洲精品美女久久久久| 超碰av在线免费观看| 久久久精品2019中文字幕之3| 日本一区视频在线观看| 亚洲国产一二三区| 欧美尤物巨大精品爽| 国产精品第108页| 国产精品直播网红| 亚洲精品精品亚洲| 一级片手机在线观看| 欧美黑人性视频| 国产一区二三区| 免费在线观看的av网站| 亚洲国产成人av网| 精品久久久久久久无码| 亚洲激情中文1区| 亚洲人成网站在线播放2019| 国产成人精品午夜视频免费| 久久青青草原| 欧美国产日韩精品免费观看| 一区二区精品在线观看| 91麻豆视频在线观看| 日韩精品欧美国产精品忘忧草 | 日韩欧美国产系列| 欧美久久久久久久久久久久| 久久精品成人动漫| 日本熟伦人妇xxxx| 国产一区二区成人| 亚洲天堂自拍偷拍| 国产成人综合久久| 国产午夜三级一区二区三| 国产又大又粗又爽的毛片| 成人免费网站在线观看| 一区二区高清在线| 91精品国产高清一区二区三蜜臀| 国产精品久久久久久久久男 | 国产日韩欧美日韩| 日韩一卡二卡在线| 国产精品初高中精品久久| 久久婷婷麻豆| 九色91国产| 久久精品欧美一区二区三区不卡| 亚洲永久激情精品| 奇米影视一区二区三区| 国产日韩欧美视频在线| 一级特黄免费视频| 不卡毛片在线看| 久久国产黄色片| 成人看片在线| 亚洲精品欧美激情| av黄色在线免费观看| 日韩欧美国产一区在线观看| 日本少妇久久久| 国产精品美女免费看| 中文字幕在线视频一区| 中文亚洲av片在线观看| 不卡av免费在线| 久久久久国产一区二区三区| 午夜影视日本亚洲欧洲精品| 最新黄色网址在线观看| 日本精品一区二区三区四区| 91精品免费观看| www亚洲视频| 午夜欧美不卡精品aaaaa| 韩国女主播成人在线观看| 国产一区二区在线视频播放| 色诱亚洲精品久久久久久| 中文字幕日韩一级| 国产日韩精品久久| 国产成人精品免费| 2021国产视频| 亚洲国产综合色| 国产偷人妻精品一区| 中文字幕欧美精品在线| 精品乱码一区内射人妻无码 | 久久久久久久香蕉网| 99re这里只有精品视频首页| 黄色片视频在线免费观看| 亚洲国产一区二区三区四区| 午夜精品小视频| 亚洲综合123| 一区二区三区av在线| 另类少妇人与禽zozz0性伦| 91国偷自产一区二区三区观看| 国产专区综合网| 亚洲毛片亚洲毛片亚洲毛片| 亚洲精品自在在线观看| 一区二区成人av| 视频一区二区不卡| 久久精品一区二区免费播放| 国内精品400部情侣激情| 奇米色一区二区三区四区| 91蝌蚪视频在线观看| 日韩欧美国产高清| 视频一区二区三区中文字幕| 久久国产精品视频在线观看| 在线观看免费成人| 9i看片成人免费看片| 国产精品久久久久久久免费大片| 亚洲免费大片在线观看| 天海翼在线视频| 高清av免费一区中文字幕| 欧美中文字幕一区二区三区 | 一区二区成人在线观看| 久久99久久98精品免观看软件 | 亚洲精品日韩专区silk| 六月婷婷综合网| 欧美丰满少妇人妻精品| 欧美重口乱码一区二区| 亚洲激情国产精品| 性高潮久久久久久久久久| 91福利国产成人精品播放| 日韩在线观看网站| 久久久99久久| 国产精品7777777| 老太脱裤让老头玩ⅹxxxx| 亚洲欧洲av一区二区| 国产不卡在线视频| 丰满少妇高潮一区二区| 国产传媒一区二区| 亚洲黄色www网站| 精品福利视频导航| 免费观看黄色一级视频| 99久久久无码国产精品性波多 | 日韩丰满少妇无码内射| 亚洲一二三区精品| 久久久久久久久久久人体| 26uuu色噜噜精品一区二区| 精品久久久久久电影| 97人人模人人爽人人喊中文字| 天天夜碰日日摸日日澡性色av| 国产一级片视频| 99国内精品久久| 日韩精品视频免费专区在线播放 | 精品一区二区三区视频日产| 国产亚洲精品成人a| 日日噜噜夜夜狠狠视频欧美人| 欧美日韩mp4| 成人av片网址| av在线网站观看| 国产成人av电影在线| 日韩成人在线观看| 亚洲精品一区二区毛豆| 欧美黄色一区二区三区| 99精品久久99久久久久| 深夜福利国产精品| 日本十八禁视频无遮挡| 中文字幕久久熟女蜜桃| 亚洲已满18点击进入久久| 日韩免费在线免费观看| 亚洲av无码久久精品色欲| 日韩有码一区二区三区| 欧美成人精品3d动漫h| 日韩精品国内| 九一国产在线观看| 亚洲国产中文字幕| 91精品在线一区|