谷歌推出新方法：訓練數據量減少 1 萬倍，提升模型精準度

IP屬地中國·北京 編輯：趙云飛 Chinaz 時間：2025-08-25 16:26:39

近日，谷歌在其研究中提出了一種新穎的主動學習篩選流程，旨在大幅降低微調大型語言模型所需的訓練數據量。根據實驗結果，這種方法能夠將訓練數據量降低至原來的1萬分之一，同時提高模型與人類專家判斷的一致性達65%。在實際應用中，如廣告內容分類、金融數據安全分析等領域，對高保真訓練數據的需求一直很高，但篩選出符合要求的數據不僅難度大，成本也極為昂貴。
圖源備注：圖片由AI生成，圖片授權服務商Midjourney
這一新方法從一個零樣本或少樣本的初始模型開始，用戶通過提示定義目標內容，比如詢問某廣告是否為 “點擊誘餌”。初始模型會將廣告標記為點擊誘餌或良性，并生成一個大型標記數據集。然而，初始數據集常常存在嚴重的類別不平衡，導致模型的準確識別能力較弱。
為了解決這一問題，研究者將模型標記為點擊誘餌和良性廣告的內容進行分組，發現部分組之間存在重疊，說明模型在這些內容上容易判斷錯誤。因此，研究者可以從這些重疊組中挑選樣本對，交由專家進行判斷，以此來控制審核成本，并優先選擇能覆蓋多種情況的樣本對。這樣得到的樣本既有價值，又涵蓋了各種可能出錯的情形。
在模型微調過程中，專家提供的標注被分為兩組，一組用于評估模型一致性，另一組則用于模型的微調。這一過程將不斷重復，直到模型的表現達到與人類專家相近的水平。
谷歌的實驗使用了 Gemini Nano-1和 Nano-2兩款模型，并針對兩個復雜度不同的任務進行了測試。在測試中，每個任務都使用了約10萬條眾包標注數據，盡管這些數據嚴重不平衡。結果表明，專家之間的判斷一致性很高，而眾包標簽與專家判斷的一致性則相對一般。通過新方法，32.5億參數的模型在低難度任務上的對齊度顯著提升，使用的數據量僅為250-450條，較原來的10萬條大幅減少，仍能取得良好的效果。
綜上所述，谷歌的新方法證明了只需少量高質量的數據，且確保專家標注一致性超過0.8，大型模型也能在訓練時獲得出色的表現。
劃重點:

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

TikTok簽署協議，將美國業務出售給甲骨文等主導的合資企業

谷歌安卓16調整Emoji表情設計，風格向iOS靠攏

周受資內部信曝TikTok美國方案；騰訊辟謠元寶由真人運營丨邦早報

TikTok美國業務新進展：字節保留電商、廣告等，引入三方組新合資公司負責數據安全

AI浪潮下，10年后的頂尖高校拼什么？丨GAIR 2025

極數迭代CEO佟顯喬：具身智能的數據工程解決方案思考丨GAIR 2025

全站最新

TikTok簽署協議，將美國業務出售給甲骨文等主導的合資企業

谷歌安卓16調整Emoji表情設計，風格向iOS靠攏

周受資內部信曝TikTok美國方案；騰訊辟謠元寶由真人運營丨邦早報

TikTok美國業務新進展：字節保留電商、廣告等，引入三方組新合資公司負責數據安全

熱門推薦

授權亂象頻出，誰的同仁堂？

當“野性消費”退潮：鴻星爾克留下了什么？

英氏控股的優勢只有品牌和廣告嗎？

為什么蘋果、華為，都干不過小天才？

豪擲10億美金投資OpenAI！迪士尼終于對AI妥協了？（深度觀察）

從“寧王”到“易中天”，時代的“魚群”在遷徙

阿維塔赴港IPO：一場針對“依附者”的價值審視

“鐵飯碗”銀行也開始末位淘汰了？普通人有機會，但沒退路

君樂寶，想要逃出伊利、蒙牛的“五指山”

5 個月估值翻 3 倍！瑞典 AI 巨頭 Lovable 獲 3.3 億美元 B 輪融資

十億流量瞬間清零!YouTube 永久封禁兩大 AI 虛假預告片“鼻祖”頻道

OpenAI 更新 ChatGPT 以強化未成年人保護措施

告別信息淹沒！ChatGPT 推出聊天置頂功能，讓重要對話觸手可及

Meta 官宣2026上半年發布 Mango 系列下一代模型

ChatGPT 移動應用全球用戶支出突破 30 億美元