亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當前位置: 首頁 ? 資訊 ? 新科技 ? 正文

英偉達最新技術分享:手把手教你用Llama 3.1合成數據改進模型!附代碼

IP屬地 中國·北京 編輯:鄭佳 新智元 時間:2024-07-29 14:08:12

報道

編輯:喬楊 好困

適逢Llama 3.1模型剛剛發布,英偉達就發表了一篇技術博客,手把手教你如何好好利用這個強大的開源模型,為領域模型或RAG系統的微調生成合成數據。

Epoch AI上個月剛剛發文預言「數據墻」迫近,結果英偉達轉頭就甩出了340B開源巨獸Nemotron。

真實數據稀缺可能不再是問題了,Nemotron 9T token的預訓練預料中,98%都是合成數據。

也許你還對合成數據存在顧慮,或者不知道如何應用LLM驅動數據生成。或許,英偉達的這篇博客可以提供答案。

原文地址:https://developer.nvidia.com/blog/creating-synthetic-data-using-llama-3-1-405b/?linkId=100000275486093

首先我們需要理解,用LLM合成數據的本質究竟是什么?

合成數據并不是「從無到有」地創造新信息,而是對現有信息進行轉換,生成不同的變體。

實際上,合成數據在AI領域的應用已經有十多年的歷程,比如物體檢測或分類系統中曾經的數據增強技術。

那么,LLM帶來了什么新變化呢?

從「需求端」來看,由于模型需要大量訓練語料,合成數據的動機被大大增強。

而在「供給端」,生成式語言模型也為合成數據技術帶來了質的改變。

用合成數據微調基座模型,可以更好地應用于實際場景。例如,在金融領域改進風險評估、在零售領域優化供應鏈、在電信領域提升客戶服務,以及在醫療領域改善患者護理等等。

尤其是405B開源巨獸Llama 3.1最近正式上線,既可用于批處理和在線推理,也可以作為基座模型,進行特定領域的專門預訓練或微調。

尤其是考慮到Llama 3.1有如此大的參數規模,加上豐富的15.6T token訓練數據,非常適合用于數據生成。

這篇博客文章將介紹幾個合成數據的生成與應用案例,并就其中一個進行深入探討。

合成數據的生成是推動GenAI在特定領域應用的關鍵工作流程 將最新的Llama 3.1與英偉達Nemotron-4 340B獎勵模型配合使用,非常適用于生成合成數據

要讓LLM生成基于最新信息的有根據的響應,構建RAG流程十分重要,而且模型響應的準確性取決于流程的質量。

LLM合成數據如何應用于GenAI

改進語言模型

要通過合成數據來微調模型,大致有兩種方法——知識蒸餾(knowledge distillation)和自我改進(self-improvement)。

知識蒸餾是將大模型的能力轉移到較小模型的過程,但不是簡單地在同一個數據集上訓練兩個模型,因為較小模型很難學習到底層數據的準確表征。

在這種情況下,我們可以先讓大模型完成任務,再使用這些數據指導小模型進行。

自我改進則是讓同一個模型評判自己的推理過程,常被用于進一步磨練模型的能力。

讓我們來看看如何實現這一目標。訓練語言模型通常包括三個步驟:預訓練、微調和對齊(alignment)。

預訓練

預訓練通常需要極其龐大的語料庫,使模型了解語言的一般結構。

Llama 3.1、GPT-4這種通用LLM,一般需要互聯網規模的數據。而特定領域的LLM(如幾何學、放射學、電信行業等)則需要注入相關的領域信息,這個過程被稱為領域自適應預訓練(Domain Adaptive Pretraining,DAPT)。

除了要貼近相關領域,另一種在預訓練階段使用合成數據的例子當屬Phi-1.5模型,目的是注入邏輯推理能力。

微調

掌握了語言的一般結構后,下一步就是微調,讓模型更好地遵循指令、完成特定任務。

比如,要讓模型提高邏輯推理能力、實現更好的代碼生成和函數調用,或者提升閱讀理解類任務的表現,都可以通過微調來實現。

Self-Instruct、WizardCoder、Alpaca等模型都通過創建特定領域的數據并進行微調,來定向提升模型能力。

對齊

最后,我們希望確保模型響應的風格和語氣與用戶期望一致,例如聽起來像對話、具有適當的詳細程度、復雜性、一致性等。

可以創建一個包含指令模型(instruct model)和獎勵模型(reward model)的流水線來實現這個需求。

先讓模型對同一問題創建多個響應,然后讓獎勵模型對這些相應的質量進行反饋。這種方法屬于從AI反饋中進行強化學習(Reinforcement Learning from AI Feedback, RLAIF)。

改進其他模型和系統

除了改善語言模型本身,合成數據還可以應用于LLM鄰接模型(LLM-adjacent model)以及LLM驅動的流水線。

最經典的例子就是檢索增強生成(Retrieval Augmented Generation,RAG),先用嵌入模型來檢索相關信息,再讓語言模型生成最終答案。

在這個過程中,我們可以使用LLM來解析底層文檔和合成數據,從而評估并微調嵌入模型。

類似于RAG,任何智能體(Agentic)流水線都可以被評估,其組件模型也可以被微調,實現方式就是用LLM驅動的智能體來構建模擬。

這些模擬還可以用于研究行為模式,此外,也可以在LLM中設定特定角色,以針對特定任務進行大規模數據生成。

使用合成數據評估RAG

為了更好地理解上述討論,我們來思考一個基本的流程,應用于一個具體的用例——為檢索過程生成評估數據。

下述流程的實現代碼已經上傳至GitHub。

項目地址:https://github.com/NVIDIA/NeMo-Curator/tree/main/tutorials/synthetic-retrieval-evaluation

要創建用于評估檢索流程的數據,主要面臨以下2個挑戰:

多樣性:問題不應只關注信息的單一方面或僅包含提取性問題 復雜性:生成的問題應需要一些推理或多個證據來回答

我們將重點關注多樣性,但為了探索復雜性角度——關鍵是找到具有重疊信息點的內容塊。找到重疊信息的幾種方法包括計算句子級語義的Jaccard相似度,并利用長上下文模型找到同一文檔的不同塊之間的關聯。

多樣性源自不同的視角,比如考慮如下文本:

對于同一篇文檔,金融分析師可能對兩家公司合并前后的財務狀況感興趣,法律專家可能關注公司面臨的來自FTC、歐盟和其他方的法律審查,記者則希望了解事實要點。

所有這些都是有效的視角和用戶角色。由于他們以不同的視角看待相同的信息,因此評估流程也需要適應這些視角。

因此,讓我們設計一個評估流程,該流程以文檔和用戶角色作為輸入,并以符合角色的語氣輸出問題。

圖1. 三步流程的概述:生成用于評估檢索過程的合成數據

如圖1所示,這個評估流程有三個主要步驟。

步驟1:生成所有可能的問題

這些問題都是用戶角色可能感興趣的。

步驟2:篩選出相關的問題

從生成的問題中篩選出最相關和有價值的問題。

步驟3:引入用戶角色的寫作風格

將篩選出的問題轉換為符合用戶角色寫作風格的形式。

通過這三個步驟,可以確保不同用戶角色獲得他們所需的信息,并以他們熟悉的方式呈現。

步驟1:生成問題

在生成問題之前,我們需要先讀取文檔并將其分成若干塊(chunk)。

然后,讓LLM從給定的文本塊中,為每個用戶角色提取感興趣的點。

所謂的「用戶角色」(persona),實際上就是對潛在用戶的描述,比如:

由于多個用戶角色可能有相似的興趣點,因此需要使用嵌入模型來進行語義去重,從而為每個角色映射出段落中不同的相關信息。

多樣性的另一個方面是問題類型。

我們需要提出各種類型的問題,如提取性、抽象性、比較性的問題,而不僅僅是簡單的「如何/什么」問題。因此,下一步是根據段落中的信息,確定每個興趣點適用的問題類型。

最后,利用文本塊-興趣點-問題類型的三元組,生成所有可能的問題。通過用戶角色和問題類型,開發人員可以將生成的問題引導到用戶會問的類型上。

步驟2:過濾問題

生成問題之后,下一步就是過濾并提取最有用的子集。首先,我們需要對所有生成的問題進行去重,因為不同的興趣點可能會利用相鄰的信息點,導致問題重疊。

接下來,我們使用LLM來判斷問題與段落的相關性,確保這些問題能夠完全通過段落中的信息回答。然后,我們將所有相關問題重寫為對話語氣。最后,我們會進行另一次過濾,分類并剔除那些可能過于籠統的問題。

步驟3:注入用戶角色風格

在前兩步中,我們創建并篩選了多樣化的問題。最后一步是將用戶角色的寫作風格融入到問題中。

使用LLM,我們首先根據給定的用戶角色描述來制定寫作風格。然后,基于這些寫作風格重新改寫問題。

比如,可以這樣描述用戶角色的寫作風格:

在這個三步流程結束后,我們得到了如下問題:

鑒于現行的監管框架,擬議的合并還需要遵守哪些額外的政策指令,才能獲得相關部門的批準? SolarPower和GreenTech合并的哪些具體方面目前正在接受相關監管部門的審查? 如果在大筆買斷之后,GreenTech的研發中心保持單飛狀態,那些天才會被炒魷魚嗎?

可以看出,前兩個問題很像Padma的語氣,而第三個問題似乎是Aaron會問的。

這些問題各自包含了真實標簽,對應特定的文本塊,因此不僅限于這一個用例,可以用于評估各種檢索流程。

參考資料:

https://developer.nvidia.com/blog/creating-synthetic-data-using-llama-3-1-405b/?ncid=so-twit-933996&linkId=100000275486093

免責聲明:本網信息來自于互聯網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益,請及時聯系我們,本站將會在24小時內處理完畢。

内射一区二区三区| 日韩美女在线观看| 极品魔鬼身材女神啪啪精品| 日韩av理论片| 中文字幕日韩av资源站| 妖精视频在线观看| 亚洲国产精品专区久久| 91黄色在线视频| 精品va天堂亚洲国产| 国产高清免费观看| 538在线视频观看| 日韩免费不卡av| 欧美午夜不卡在线观看免费| 污污视频在线免费看| 免费人成视频在线播放| 国产有码在线一区二区视频| 中文字幕在线不卡国产视频| 3d动漫精品啪啪一区二区下载| 日韩精品免费电影| 国产91av在线播放| 制服诱惑一区| wwwwxxxxx欧美| bt天堂新版中文在线地址| 亚洲欧美日韩精品久久| 蜜桃视频在线观看一区| wwwjizzjizzcom| 欧美性猛交丰臀xxxxx网站| 欧美色图校园春色| 国产亚洲精品久久久久久777| 亚洲欧美高清视频| 在线观看你懂的视频| 欧美黑人3p| 中文字幕精品久久| 亚洲精品老司机| 国产毛片一区二区三区va在线| 国产aaaaa毛片| 欧美高清激情视频| 日韩av电影一区| 国产爆乳无码一区二区麻豆| 日韩成人高清在线| 青青草国产成人av片免费| 亚洲成人自拍视频| 欧美日韩亚洲精品内裤| a天堂在线观看视频| 一级黄色片在线免费观看| 亚洲精品福利资源站| 国产视频一区二区三区四区五区| 在线成人性视频| 亚洲午夜日本在线观看| 懂色av懂色av粉嫩av| 翡翠波斯猫1977年美国| 在线精品视频视频中文字幕| 亚洲一区免费在线观看| 日韩精品欧美精品| 日本欧美一区二区三区不卡视频| 狠狠精品干练久久久无码中文字幕| 亚洲精品在线观看视频| 日韩精品一二三区| 波多野结衣作品集| 九九热最新视频//这里只有精品| 丁香六月久久综合狠狠色| 91国内在线播放| 亚洲剧情一区二区| 日本人妖一区二区| 久久黄色免费网站| 中文字幕乱码一区二区三区| 欧美不卡视频一区| 麻豆精品一二三| 日韩亚洲欧美精品| 欧美一区二区三区不卡| 日本久久一级片| 久久精品国产亚洲av久| 欧美国产日韩激情| 精品综合久久久| 91av在线不卡| 欧美日韩精品一区二区三区四区 | 亚洲成人激情视频| 久久中文在线| 女人和拘做爰正片视频| 欧美一级二级在线观看| 国产精品自拍电影| 小毛片在线观看| 伊人色综合影院| 亚洲国产美女久久久久| 国产一区二区三区久久悠悠色av| 国产亚洲精品精品精品| 俺去啦;欧美日韩| 亚洲欧美日韩在线不卡| 亚洲熟妇无码久久精品| 精品无码在线观看| 色天使在线观看| 国产大尺度在线观看| 国产精品99久久久久久久久| 欧美妇女性影城| 精品一区二区三区免费| 成人一区二区三| 91精品国产网站| 五月综合激情婷婷六月色窝| 少妇无套内谢久久久久| 中文字幕一区二区三区最新| 国产一区二区三区视频免费| 精品国产精品自拍| 99精品久久只有精品| 免费看91的网站| 天堂精品一区二区三区| 精品久久久999| aaa国产视频| 国产69视频在线观看| 好看的日韩精品| 国产69精品99久久久久久宅男| 亚洲电影免费观看高清| 欧美日韩在线精品一区二区三区激情| 亚洲综合在线观看视频| 豆国产96在线|亚洲| 亚洲老妇色熟女老太| 亚洲第一视频区| 亚洲一区二区三区乱码| 精品亚洲一区二区三区四区五区| av亚洲精华国产精华精华| 蜜桃视频最新网址| 欧美一级欧美一级| 亚洲人成77777在线观看网| 成人av在线资源网站| 刘亦菲久久免费一区二区| 欧美成人精品一区二区免费看片| 能看毛片的网站| 国产一区在线观| 一区二区欧美亚洲| 天天av天天翘天天综合网色鬼国产| 欧美人妻一区二区三区| 日韩一区二区三区不卡视频| 日韩欧美亚洲精品| 91在线精品观看| 日韩av色综合| 欧美成人免费大片| 在线观看欧美日本| 国产三级精品视频| 天堂在线资源8| 啦啦啦免费高清视频在线观看| 69夜色精品国产69乱| 国产视频三区四区| 人妻aⅴ无码一区二区三区| 亚洲综合伊人久久| 蜜臀av午夜一区二区三区| 日韩高清在线播放| 国产精品毛片a∨一区二区三区|国| 亚洲成人教育av| 中文字幕中文字幕在线一区| 日韩中文字幕亚洲一区二区va在线| 欧美三级 欧美一级| www婷婷av久久久影片| 久久综合久久八八| 亚洲电影一级黄| 中文字幕乱码日本亚洲一区二区| 成人小视频在线观看| 日本人妻熟妇久久久久久 | 国产精品国产三级国产专业不 | 国产视频视频一区| 91亚洲精品国偷拍自产在线观看 | 亚洲人成伊人成综合网久久久| 亚洲高清福利视频| 日韩亚洲欧美一区| 日韩欧美在线不卡| 欧美一级国产精品| 91传媒视频在线播放| 亚洲人成7777| 免费成人你懂的| 精品免费囯产一区二区三区 | 亚洲国产精品va在线| 美腿丝袜亚洲三区| 一区二区三区四区免费| 女女同性女同一区二区三区91| 亚洲美女中文字幕| 色欧美88888久久久久久影院| 国产精品久久久久三级| 国产自产高清不卡| 一级黄色在线视频| 91香蕉一区二区三区在线观看| 天天躁日日躁狠狠躁av麻豆男男 | 一区二区激情小说| 亚洲在线成人精品| 欧美午夜久久久| 欧美日韩国产色视频| 亚洲欧美另类小说| 国产日韩在线不卡| 国产在线播精品第三| 一区二区三区免费在线| 国产剧情在线视频| 久久久久久久久久久久久久久| 男女一区二区三区| 日日夜夜精品网站| 欧美精品18videos性欧| 精品视频一区二区三区免费| 欧美一区二区三区视频| 亚洲第一天堂av| 亚洲国产精品高清久久久| 一本到三区不卡视频| 久久一区中文字幕| 少妇无套高潮一二三区| 六月婷婷激情网| 91久久精品美女| 国产精品视频不卡| 日韩免费不卡av| av资源一区二区| 天堂一区二区三区| 少妇高潮喷水久久久久久久久久| 国产3p在线播放| 国产真人做爰视频免费| 久久久久久久黄色| 五月婷婷开心网| a片在线免费观看| 日韩久久久久久久久久| 成人av网站在线播放| 蜜桃精品一区二区| 小早川怜子久久精品中文字幕| 中文字幕人妻一区| 国产精品欧美性爱| 久久久久99精品成人片| 亚洲精品日产aⅴ| 欧美中文在线观看| 97精品一区二区视频在线观看| 亚洲自拍高清视频网站| 久久久影院一区二区三区| 亚洲资源在线看| 成人激情av在线| 亚洲一区二区三区乱码aⅴ蜜桃女| 91午夜在线播放| 亚洲电影免费观看高清完整版在线观看| 欧美一区二区精品在线| 日韩视频一区二区三区在线播放| 亚洲精品xxxx| 5566日本婷婷色中文字幕97| 亚洲五月六月| 日韩精品一区二区三区久久| 少妇愉情理伦片bd| 免费在线观看av网址| 91麻豆国产在线| 成人黄色在线看| 亚洲精品中文在线影院| 亚洲一区二区视频在线| 欧美性xxxx18| 午夜精品免费在线观看| 在线视频国内自拍亚洲视频| 色婷婷久久综合| 亚洲第一福利在线观看| 91福利国产精品| 欧美午夜宅男影院在线观看| 亚洲成人动漫一区| 亚洲精品国精品久久99热一| 欧美黄色片视频| 国产精品视频精品| 亚洲综合第一页| 久久99精品久久久久久青青日本| 亚洲三区在线| 91成人在线看| 99国精产品一二二线| 欧美精品亚洲精品| 品久久久久久久久久96高清| 一区二区视频在线观看| 日本wwww视频| 五月六月丁香婷婷| 天天操精品视频| 污污网站免费观看| 白嫩少妇丰满一区二区| 欧美精品一区免费| 久久久久久人妻一区二区三区| 91传媒免费视频| 99热都是精品| 成人手机视频在线| 18视频在线观看娇喘| 一区二区三区四区视频在线观看| 日本一区二区视频| 日韩av一区二区三区美女毛片| 欧美极品色图| 日韩av一区二区三区美女毛片| 美媛馆国产精品一区二区| 国偷自产av一区二区三区小尤奈| 97欧洲一区二区精品免费| 成人免费福利视频| 99久久综合狠狠综合久久止| 99免费在线观看视频| 国产视频不卡| 欧美另类视频在线| 日韩国产伦理| 中文字幕第一页亚洲| 国自产拍偷拍精品啪啪一区二区| 成人在线免费观看av| 美女少妇一区二区| 色哟哟免费视频| 性欧美13一14内谢| 亚洲图片第一页| 久久高清无码视频| 久久精品视频2| 性一交一乱一乱一视频| 久久综合图片| 成人性生交大片免费看视频在线| 亚洲国产精品精华液2区45| 亚洲欧洲成人av每日更新| 亚洲高清视频在线| 欧美日本不卡视频| 亚洲精品av在线| 欧美大胆在线视频| 国产精品久久久久91| 国产欧美日韩综合精品二区| 亚洲精品一区二区三区蜜桃久| 免费在线看黄色片| 污污的视频免费观看| a毛片毛片av永久免费| 日韩字幕在线观看| 亚洲AV无码精品自拍| 国产综合色精品一区二区三区| 91视频免费播放| 亚洲天堂福利av| 欧美伊人精品成人久久综合97| 亚洲一区二区av电影| 欧美日韩在线电影| 中文一区二区视频| 国产精品草莓在线免费观看| 久久国产日韩欧美| 蜜桃传媒一区二区三区| 麻豆av免费看| 国产盗摄x88av| 国产喷水吹潮视频www| 国产精品一区免费在线观看| 亚洲欧美另类图片小说| 欧美精品久久天天躁| 久久精品成人动漫| 成人免费在线网址| 国产四区在线观看| 极品白嫩少妇无套内谢| 国产精品成人av久久| 亚洲精品久久久久久动漫器材一区 | 精品国产一区二区三区av性色| 精品精品国产国产自在线| 99国产超薄丝袜足j在线观看| 亚洲 欧美 综合 另类 中字| 久久久久久久久免费看无码| 综合久久中文字幕| 丁香天五香天堂综合| 亚洲成人自拍一区| 日韩精品在线私人| 国产精品国模在线| 女人被男人躁得好爽免费视频 | 在线免费观看羞羞视频一区二区| 久久久噜噜噜久久| 欧洲亚洲一区| 午夜免费福利网站| 黑人一级大毛片| 国产高清久久久| 色网站国产精品| 欧美成人免费全部| 亚洲春色综合另类校园电影| 性xxxxxxxxx| 中文区中文字幕免费看| 91香蕉视频mp4| 日韩一卡二卡三卡国产欧美| 538国产精品视频一区二区| 国产又大又长又粗又黄| 免费在线观看a视频| 色一情一乱一区二区三区| 国产精品女同一区二区三区| 欧美精品一区二区三区一线天视频 | 国产v综合v亚洲欧| 91成人看片片| 91福利视频在线观看| 男女超爽视频免费播放| 欧美在线视频第一页| 久久精品国产一区二区三区免费看| 日韩欧美在线视频观看| 97涩涩爰在线观看亚洲| 中文字幕一区二区三区在线乱码 | 99久久伊人网影院| 亚洲国模精品一区| 国产日韩一区欧美| 亚洲成人av免费在线观看| 国产99久一区二区三区a片| 亚洲欧美一区二区三区国产精品| 中文字幕日韩有码| 亚洲人一区二区| 国产一区二区精彩视频| 国产综合色产在线精品| 欧美一区二区三区在线视频| 国产欧美日韩91| 一区二区免费av| 国产精品女同一区二区| 一区二区三区日韩精品| 国内久久久精品| 在线看的黄色网址| 99国产精品久久久久99打野战| 亚洲精品视频自拍| 97视频在线免费观看| 日本爱爱免费视频| 亚洲网站免费观看| 婷婷六月综合网| 国产免费一区视频观看免费 | 唐朝av高清盛宴| 99热国产精品| 亚洲欧美国产精品久久久久久久| 日韩精品一区二区三区外面| 2025国产精品自拍| 99久久免费视频.com| 深夜福利一区二区| 国产1区2区3区中文字幕| 国产亚洲欧美在线精品| 亚洲成人一区二区在线观看| 日本国产欧美一区二区三区| 潘金莲一级淫片aaaaa| 麻豆久久一区二区| 亚洲精品美女免费| 黄色录像特级片|