“目前大模型并沒有真正理解自然語言,僅僅是表象上產生了文字。”
當下大模型發(fā)展如火如荼,熱度不減,擁抱AI、推進智能化轉型,成為企業(yè)發(fā)展中亟待解決的問題。
8月9日,致遠互聯(lián)第15屆用戶大會在武漢舉行,聚焦協(xié)同管理行業(yè)、圍繞“AI-COP讓組織智能進化”的主題,學界、企業(yè)界人士展開討論與交流。
復旦大學計算與智能創(chuàng)新學院教授、復旦大學眸思大模型項目首席科學家、上海市智能信息處理重點實驗室副主任張奇在大會上表示:“目前大模型還處于記憶層面,并不能真正去理解自然語言。它僅僅是表象上產生了文字。”
復旦大學張奇:AI-COP讓組織智能進化
作為在自然語言處理領域深耕20余年的行業(yè)“老兵”,張奇言簡意賅解答了大模型發(fā)展中的兩個關鍵問題:一是大模型問什么落地難?二是大模型適用于什么方面,如何才能落地?
大模型為什么落地難
全數(shù)據(jù)驅動的大模型,實現(xiàn)“類人推理”面臨巨大挑戰(zhàn)。
隨著大模型的開源,用戶數(shù)劇增,大模型訓練的數(shù)據(jù)庫越來越龐大。但這并不意味著,大模型學會了理解,具備了“類人推理”的能力。問題的關鍵在于大模型的能力邊界,這也是是學界與業(yè)界不斷研究探索的問題。
大模型的學習方式與人類的學習方式是完全不同的兩種范式。張奇認為,人類的學習模式是層層遞進的,在這個學習過程中人類培養(yǎng)起了學習能力,具備了獨立思考和推理判斷的能力。但當前大模型的“學習”是模塊式的,其學習掌握的內容來自訓練過程中相關模塊數(shù)據(jù)的輸入,這一過程并不能助其建構起推理能力。
大模型習得的是一個個分離的“圓圈”。張奇解釋稱,“如果做可控的實驗,在預訓練階段把小學應用題全部去掉,放入大量高考題。結果就是該大模型高考可以考到145分,小學應用題得分卻很低。“
在訓練過程中可以發(fā)現(xiàn),目前大模型在解答高考題方面,其分數(shù)能夠達到985院校的分數(shù)錄取要求。但如果對簡單題目做“變形”處理,大模型給出的答案準確率也會下降很多。
舉例來看,在一道小學數(shù)學題目中添加一個簡單的、與解題無關的條件后,GPT-o1-mini模型給出的答案從開始的90多分下降了17.5分。而更小一點的模型結果則從80多分下降到不足20分,這樣的答案差距僅僅是因為在題目中添加了一個不相關的條件。
因此,張奇認為:“現(xiàn)在大模型依然是統(tǒng)計記憶學習的范式,所以它不能建立因果的關聯(lián)。”
除此之外對大模型能力邊界的測試還包括這樣一則案例,即“將56個1相加,在其中穿插兩個11,要求大模型計算答案”,結果大模型思考10分鐘后,并未給出準確答案。
張奇認為大模型相較于小模型有四項不同的能力,包括長上下文建模和多任務學習能力。因為此前,小模型最多可以做512個token、大約700個漢字,且小模型只能處理單一任務,所以大模型要實現(xiàn)的是長上下文建模和多任務學習能力,才能體現(xiàn)出它的進步之處。此外,大模型還需要具備多任務間的跨語言遷移能力和文本生成能力。以上四項能力構成了大模型落地的關鍵。
小場景+大數(shù)據(jù)=落地效果好
大模型落地的關鍵是選擇合適的應用場景。
德勤此前發(fā)布的一則數(shù)據(jù)圖表顯示,AI最適宜幫助人們完成的是“人類能夠便捷高效的作出判斷的”工作,例如創(chuàng)作一幅圖畫或者撰寫一個笑話等。張奇說,“既代替了大量的人工,又使輸出的結果非常容易判定,掃一眼就知道結果,這樣的場景是非常適合大模型完成的。”
但當前對大模型任務執(zhí)行結果的驗證也成為束縛其應用場景拓展的一大因素。以船廠圖紙的審核為例,通過大模型審核圖紙重的錯誤過程中,“模型做的再好,也只能做到95分。”張奇稱。這意味著,需要人力對大模型執(zhí)行結果進行驗證和審核。所以,從這個意義上來看,大模型任務完成達到95分亦或是60分,已經(jīng)不再有區(qū)別。因為人力審核校驗成為難以避免的環(huán)節(jié)。
因此,無論是大模型還是小模型,其只是一種工具,找到適配的場景才是大模型落地的關鍵。基于該判斷,場景越小,數(shù)據(jù)越多,則AI的任務執(zhí)行結果會越好。
除了找到合適的應用場景,商業(yè)價值是大模型落地難以回避的問題。
張奇對此表示,大模型非常容易在很多場景下做到70分,但是做到90分是非常困難的。
因此,不需要神化或擬人化模型,它的本質依然是記憶學習。區(qū)別在于,當大模型體量更大的時候,能夠完成的任務更多,技術層面需要做的則是根據(jù)實際應用場景對模型進行逐項優(yōu)化。
對于企業(yè)而言,2025是爭取市場份額的關鍵節(jié)點。張奇表示,企業(yè)要積極擁抱AI,找到核心應用場景并實現(xiàn)應用效果的提升,將成為搶占市場份額的重要路徑。



京公網(wǎng)安備 11011402013531號