記者 黃永進 發自上海
11月12日,百度世界大會上,百度董事長李彥宏透露,百度文心大模型日調用量達到了15億次,半年增長率達7.5倍。
“過去24個月,AI行業發生的最大變化是什么?是大模型基本消除了幻覺。”11月12日,百度創始人李彥宏在百度世界2024大會上,發表了主題為應用來了的演講,發布兩大賦能應用的AI技術:檢索增強的文生圖技術(iRAG)和無代碼工具“秒噠”。文心iRAG用于解決大模型在圖片生成上的幻覺問題,極大提升實用性;無代碼工具“秒噠”讓每個人都擁有程序員的能力,將打造數百萬“超級有用”的應用。

?截至11月初,百度文心大模型的日均調用量已經超過15億,相較一年前首次披露的5000萬次,增長約30倍。李彥宏表示,“這條陡峭的增長曲線,代表著過去兩年中國大模型應用的爆發。”演講中,李彥宏再次強調,智能體是AI應用的最主流形態,即將迎來爆發點,它將成為AI原生時代,內容、信息和服務的新載體。
過去24個月,AI行業的最大變化是大模型基本消除了幻覺
“去年三月,文心一言發布的時候,我們說百度大模型的特色是知識增強、檢索增強。后來發現,檢索增強不是百度特色,而是逐步成為了行業的共識。”
李彥宏表示,檢索增強的意義在于讓大模型基本消除了幻覺。他認為即使是文學創作,也需要故事前后保持一致。
“所以,如果你要問我,過去這24個月,對這個行業而言,最大的變化是什么?我的回答一定是,大模型基本消除了幻覺,它回答問題的準確性大幅提升了,這讓AI從‘一本正經的胡說八道’,變得可用、可被信賴。我們知道,大模型是一個概率模型,生成的內容具有不確定性。采用RAG技術后,大模型會利用檢索到的信息來指導文本或答案的生成,從而極大地提高了內容的質量和準確性。”
如今,文字層面的RAG已經做得很好了,但是圖像等多模態內容和RAG的結合還不夠。他以一個開源模型生成的一張北京天壇的圖片為例,真正的天壇是3層,但模型生成了4層,這是文生圖比較典型的幻覺現象。這種幻覺現象,今天仍然很普遍,所以今天的多模態大模型,沒有什么成規模的應用出來,就是幻覺沒有解決。
“今年年初,我們決定要解決圖像生成的幻覺問題。我們開發了一項顛覆性的技術叫做iRAG,就是image based RAG,檢索增強的文生圖技術。之前,完全基于大語言模型的文生圖系統,生成的圖片常常是“一眼假”,甚至是邏輯不合常理。百度的iRAG,將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,就可以生成各種超真實的圖片,整體效果遠遠超過文生圖原生系統,去掉了機器味兒。”李彥宏表示,“隨著AI生成圖片的可用性大大提高,它的應用空間也隨即打開了。比如在品牌宣傳場景,以前拍這樣一組海報動輒需要一二十萬,甚至大幾十萬,但是現在創作的成本接近于0。簡單說來,iRAG的商業價值體現在:無幻覺、超真實、沒成本,立等可取。”
當基礎模型能力就緒,我們即將迎來AI應用的群星閃耀時刻
“基礎模型能力就緒,我們即將迎來AI應用的群星閃耀時刻。每一個應用都是一顆星,每一個應用都將成為改變世界的力量。那么AI應用從哪里來?到哪里去?有兩大AI應用方向:一個是智能體,另一個是產業應用。”
“智能體是AI應用的最主流形態,即將迎來它的爆發點。今天,全球所有頂尖科技公司都很關注智能體,但像百度這樣把智能體作為最重要戰略方向的并不多。我認為,做智能體很像PC時代做網站,或者是移動時代做自媒體賬號。不同之處是智能體更像人,更智能,更像你的銷售,你的客服,你的助理。智能體可能會變成AI原生時代,內容、信息和服務的新載體。”
“目前,文心智能體平臺上,已經吸引了15萬家企業和80萬名開發者參與,覆蓋的應用場景非常非常多。文心智能體平臺的TOP100智能體是我們基于智能體的分發量、平均對話輪次、用戶喜愛度等指標綜合遴選出來的。有角色類的,像農民院士智能體,有工具類、行業類的智能體,更有職場、情感、娛樂等類型的智能體。”





京公網安備 11011402013531號