亚洲狼人综合干_国产成人自拍网_97久草视频_日韩欧美在线网站_国产福利精品av综合导导航_粉嫩13p一区二区三区_成年人视频网站免费观看_国产亚洲综合久久_秋霞精品一区二区三区_国产精品99久久久久久久久_美女日韩在线中文字幕_久久免费在线观看

當(dāng)前位置: 首頁(yè) ? 資訊 ? 新科技 ? 正文

楊植麟、姜大昕、朱軍云棲激辯:我們對(duì)大模型發(fā)展的預(yù)測(cè),都過于保守了

IP屬地 中國(guó)·北京 編輯:鄭佳 36氪 時(shí)間:2024-09-19 19:00:10

阿里云

整理|鄧詠儀 周鑫雨 王奕昕 況澤宇

編輯|蘇建勛

大模型的發(fā)展曲線,停滯了嗎?

這是過去一段時(shí)間里,全球AI界都在熱烈討論的問題——這不僅是AI應(yīng)用落地的關(guān)鍵因素,更關(guān)乎著AGI(通用人工智能)的終極目標(biāo)能否實(shí)現(xiàn)。

不過,近期OpenAI新模型o1的推出,仿佛給AGI(通用人工智能)的發(fā)展周期“再續(xù)命”:o1將強(qiáng)化學(xué)習(xí)(RL)路線和大模型的結(jié)合,讓大模型的思考、推理能力有了質(zhì)的提升。

這被稱為是GPT-4在2023年發(fā)布以來,大模型里程碑式的進(jìn)展。但同時(shí),也有人提出不一樣的意見——進(jìn)展也不過如此。

可以確定的是,這為學(xué)術(shù)、產(chǎn)業(yè)界帶來了全新的、不確定的變量。o1發(fā)布后,我們?cè)撊绾卫^續(xù)AGI的探尋之路?對(duì)所有在AI應(yīng)用創(chuàng)業(yè)者而言,機(jī)會(huì)更多了,還是更少了?

在今天的阿里云棲大會(huì)開幕式圓桌上,包括極客公園創(chuàng)始人張鵬,以及國(guó)內(nèi)的明星大模型創(chuàng)業(yè)廠商——月之暗面創(chuàng)始人楊植麟、階躍星辰創(chuàng)始人姜大昕,以及來自多模態(tài)大模型廠商生數(shù)科技的首席科學(xué)家朱軍,就帶來了一場(chǎng)激辯。

對(duì)話中,幾位嘉賓不僅回顧了過去18個(gè)月以來,包括GPT-4、特斯拉FSD等大模型領(lǐng)域的關(guān)鍵發(fā)展事件。對(duì)o1發(fā)布后的大模型時(shí)代,形成的共識(shí)也更多:

比如,對(duì)于o1所代表的多模態(tài)融合的進(jìn)展,幾位嘉賓都表達(dá)出了極大的認(rèn)可,以及對(duì)未來發(fā)展預(yù)期的樂觀態(tài)度。

階躍星辰創(chuàng)始人姜大昕表示,如果說GPT-4在Scaling Law上的實(shí)踐,是模擬人腦系統(tǒng)1的能力;那么o1的發(fā)布,就展現(xiàn)出了LLM(大語(yǔ)言模型)能夠有的推理、思考能力,相當(dāng)于是人腦系統(tǒng)2(慢思考)的潛力。“這極大地提升了AI的能力上限。”他表示。

“這種不同模態(tài)之間的轉(zhuǎn)化、交互和生成其實(shí)會(huì)變得越來越成熟,AI的發(fā)展整體還是在極大加速中?!痹轮得鎰?chuàng)始人楊植麟說,接下來,訓(xùn)練和推理的算力還會(huì)有大幅的增長(zhǎng)。

他還補(bǔ)充,對(duì)于AI應(yīng)用領(lǐng)域的創(chuàng)業(yè)者,要找到GPT-4等通用大模型做得不夠好的場(chǎng)景,變得更重要。o1帶來的更多機(jī)會(huì),則會(huì)讓AI產(chǎn)品的形態(tài)發(fā)生變化——?jiǎng)?chuàng)業(yè)者需要尋找新的PMF(product market fit),在用戶體驗(yàn)因延遲下降和最終結(jié)果質(zhì)量上升之間,尋找平衡。

生數(shù)科技首席科學(xué)家朱軍則再度提出了AGI發(fā)展的L1-L5階段。他表示,如今我們還處于L2的發(fā)展早期,但AI仍在加速發(fā)展中,未來18個(gè)月甚至有可能出現(xiàn)L4級(jí)的突破——現(xiàn)在業(yè)界的對(duì)AI未來的整體預(yù)測(cè),都過于保守了。

以下為《通往AGI的大模型發(fā)展之路》的圓桌內(nèi)容,由智能涌現(xiàn)整理編輯:

張鵬:今天非常榮幸、非常開心我們有機(jī)會(huì)來到云棲大會(huì),同時(shí)也跟幾位在國(guó)內(nèi)大模型領(lǐng)域的探索者探討模型技術(shù)的進(jìn)展。剛才在吳總的演講里,我相信很多人都感受到了他對(duì)大模型和這一波AGI發(fā)展的強(qiáng)烈信心,甚至明確地指出這不是移動(dòng)互聯(lián)網(wǎng)的延展,它可能是一次對(duì)物理世界的新的變革。

當(dāng)然,我覺得我們這個(gè)環(huán)節(jié),可能要把他的結(jié)論做一下思維鏈的解構(gòu),第一步就是,要看一看模型的技術(shù)到底進(jìn)展怎么樣,在過去的18個(gè)月里和未來的18個(gè)月里,總結(jié)和展望都是怎么樣的。

我們先從對(duì)于過去的一些的看法來說,從ChatGPT的發(fā)布引發(fā)了整個(gè)世界對(duì)于AGI這件事的理解,到現(xiàn)在可能也差不多18個(gè)月的世界。各位的感受是怎么樣的?模型技術(shù)的發(fā)展是在加速還是在減速?

我們都是在看你們打游戲的人,那今天我們把打游戲的人請(qǐng)到現(xiàn)場(chǎng),聽聽他們的感受。

要不大昕先來幫我們分享一下,你怎么看?過去18個(gè)月AGI的發(fā)展是在加速還是減速?

姜大昕:我覺得過去18個(gè)月其實(shí)感覺是在加速,速度還是非??臁R?yàn)楫?dāng)我們?nèi)セ仡欉^去18個(gè)月發(fā)生的大大小小的AI事件以后,我們可以從兩個(gè)維度去看:一個(gè)是數(shù)量的角度,一個(gè)是質(zhì)量的角度。

從數(shù)量的角度來看,基本上還是每個(gè)月都會(huì)有新的模型、新的產(chǎn)品、新的應(yīng)用這樣涌現(xiàn)出來。比如單從模型來看的話,OpenAI 2月份發(fā)了Sora。我記得當(dāng)時(shí)還是過年的時(shí)候,把大家轟炸了一下;5月份出了個(gè)GPT-4 o,然后上周又出了o1。

OpenAI的老對(duì)手Anthropic有Claude 3-3.5的系列,再加上Google的Gemini系列、X1的Grok系列、meta的Llama系列等等?;仡欉^去一年,我們的感覺還是GPT-4是一家獨(dú)大、遙遙領(lǐng)先,到了今年就變成了群雄并起、你追我趕的局面。所以感覺各家是在提速的。

從質(zhì)量的角度來看,我覺得有三件事情可能給我的印象非常的深刻:

第一件事情就是GPT-4o的發(fā)布。

這是在多模態(tài)融合的領(lǐng)域,再上了新的臺(tái)階。在GPT-4o之前,有比如GPT-4v,是一個(gè)視覺的理解模型,有DALL·E、 Sora等視覺的生成模型。還有Whisper 和Voice Engine的聲音模型,原本這些孤立的模型,到了4o這里都融合在了一起。

為什么融合這件事情非常重要?因?yàn)槲覀兊奈锢硎澜绫旧砭褪且粋€(gè)多模態(tài)的世界,所以多模態(tài)融合,一定是有助于我們更好地為我們的物理世界建模,去模擬世界的。

第二件事情,是特斯拉發(fā)布的FSD V12。

大家知道它是一個(gè)端到端的大模型,它把感知信號(hào)直接變成控制序列。而自駕這件事情我覺得它是非常有代表性的,它是從數(shù)字世界走向物理世界的真實(shí)的應(yīng)用場(chǎng)景。

所以我覺得FSD V12它的成功意義不僅在于自駕本身,這套方法論可以認(rèn)為是為將來的智能設(shè)備如何和大模型相結(jié)合,更好地去探索物理世界指明方向。

那第三件事情,就是上周OpenAI發(fā)布的o1。

我對(duì)它的理解就是,他第一次證明了語(yǔ)言模型其實(shí)也可以有人腦的慢思考系統(tǒng) 2的能力,而我們覺得系統(tǒng)2的能力它是歸納系數(shù)所必備的一個(gè)前提條件,是一個(gè)基礎(chǔ)的。所以我們一直認(rèn)為 AGI 的遠(yuǎn)近路線可以分為模擬世界、探索世界、最后歸納世界,而過去幾個(gè)月的時(shí)間,我們看到GPT-4o v、 FSDV12和o1分別在這三個(gè)階段或者三個(gè)方向上都取得了非常大的突破,而且更重要的是為將來的發(fā)展也指明了一個(gè)方向。

智駕是一個(gè)端到端的大模型,它把感知信號(hào)直接變成控區(qū),而智駕這件事情我覺得它是非常有代表性的,是從數(shù)字世界走向物理世界的真實(shí)的應(yīng)用場(chǎng)景。FSD V12它的成功意義不僅在于智駕本身??梢哉f,這套方法論是為將來的智能設(shè)備如何和大模型相結(jié)合,更好地去探索物理世界指明了一個(gè)方向。

第三件事情就是上周OpenAI發(fā)布的o1。我對(duì)他的理解是,它第一次證明了語(yǔ)言模型也可以有人腦的慢思考、系統(tǒng) 2 的能力,而我們覺得系統(tǒng) 2 的能力它是歸納式,必備的一個(gè)前提條件,是一個(gè)基礎(chǔ)的。

我們一直認(rèn)為,AGI 的遠(yuǎn)近路線可以分為:模擬世界-探索世界-歸納世界。過去幾個(gè)月的時(shí)間,我們看到GPT4O v、FSD V12和o1,分別在這三個(gè)階段、方向上都取得了非常大的突破,更重要的是,為將來的發(fā)展也指明了一個(gè)方向,所以我覺得無論是從數(shù)量還是質(zhì)量來說,都是可圈可點(diǎn)。

△姜大昕

張鵬:感覺對(duì)于期待的領(lǐng)域,其實(shí)我們都看到了廣泛的突破和進(jìn)展。植麟,你的體感是怎么樣呃?投身其中的人,可能會(huì)跟我們外邊看游戲的人不一樣。

楊植麟:我覺得AI整體還是處于加速發(fā)展的階段,可以從兩個(gè)維度來看。

第一個(gè)維度是縱向的維度,AI的智商是一直在提升的。主要是看現(xiàn)在的反應(yīng)方式,還有看文本模型能做到多好。

第二是橫向的發(fā)展。除了文本模型之外,像剛才張總提到的,有各種不同的模態(tài),這些模態(tài)其實(shí)也在橫向發(fā)展,更多是說讓模型具備更多的技能,可以完成更多的任務(wù)。同時(shí),跟縱向的智商的發(fā)展相結(jié)合。

在這兩個(gè)維度上,我覺得都看到了非常大的進(jìn)展。比如說在縱向的維度上,它其實(shí)智商是一直在提升的,對(duì)吧?比如說生圖、數(shù)學(xué)競(jìng)賽能力可能去年是完全不及格,到今年可能已經(jīng)能做到 90 多分。

代碼,基本上也是一樣,能夠擊敗很多專業(yè)的編程選手。包括hins?也產(chǎn)生了很多新的應(yīng)用機(jī)會(huì),像現(xiàn)在比較流行的類似 cursor 的這樣的,通過自然語(yǔ)言直接去寫代碼,這樣的軟件也越來越多,我覺得這個(gè)其實(shí)是很多技術(shù)發(fā)展的結(jié)果。

如果去看很多具體的技術(shù)指標(biāo),比如語(yǔ)言模型能支持的上下文長(zhǎng)度,去年這個(gè)時(shí)間點(diǎn),大部分模型都只能支持 4 - 8 k 的 context sense,今天看你會(huì)發(fā)現(xiàn) 4 - 8 k 已經(jīng)是非常非常低,現(xiàn)在 128 K 已經(jīng)是標(biāo)配。已經(jīng)有很多可以支持1M,甚至是10m長(zhǎng)文本的長(zhǎng)度,這也是后面模型智商不斷提升的基礎(chǔ)。

最近的很多進(jìn)展,它其實(shí)不光只是做scaling,scaling 還是會(huì)持續(xù),很多進(jìn)展其實(shí)來自于后訓(xùn)練算法的優(yōu)化、數(shù)據(jù)的優(yōu)化。優(yōu)化的周期會(huì)更短。周期更短,導(dǎo)致你整體的AI 的發(fā)展節(jié)奏也會(huì)進(jìn)一步加快。我們最近在數(shù)學(xué)上看到的很多進(jìn)展,也得益于技術(shù)的發(fā)展。

橫向上,當(dāng)然也產(chǎn)生了很多新的這樣的突破,當(dāng)然,視頻生成上的 Sora 可能是影響力最大的。最近有特別多新的產(chǎn)品的技術(shù)出來,可能現(xiàn)在你已經(jīng)可以通過論文,直接生成基本上你看不出來是真是假的Podcast,一個(gè)雙人對(duì)話。

類似這樣的,這種不同模態(tài)之間的轉(zhuǎn)化、交互和生成其實(shí)會(huì)變得越來越成熟,所以我覺得AI整體是在加速的過程中的。

△楊植麟

張鵬:感覺這些技術(shù),其實(shí)還在加速地去擴(kuò)展它帶來的變化和創(chuàng)新。雖然,可能我們客觀上看好像沒有說再長(zhǎng)出某個(gè) Super APP,但如果我們拋掉 super APP 的視角,去看技術(shù),反而能被看到它的真正的進(jìn)展,這可能是更加理性客觀的視角。

朱軍老師,你會(huì)怎么總結(jié)這 18 個(gè)月到底說 AGI 的技術(shù),到底是經(jīng)歷了什么樣的發(fā)展?有什么可以總結(jié)的進(jìn)步的臺(tái)階?

朱軍:其實(shí)AGI 里,可能大家最關(guān)注的還是大模型。去年和今年都發(fā)生很多重要的變化了。整個(gè)進(jìn)展,我是非常同意的,在加快。

我想補(bǔ)充一點(diǎn),比如我在解析的問題,速度其實(shí)也在變快,就我們說它的 learning curve 在變得更抖,原來看語(yǔ)言模型的話,大概是從2018 年,植麟也算最早去做這個(gè)。到今年的話大概走了五六年的路。

從去年開始,上半年大家還是關(guān)注語(yǔ)言模型,下半年的話就開始討論多模態(tài),從多模態(tài)理解再到多模態(tài)生成。

再回頭看的話,覺得像圖像或者視頻。視頻其實(shí)最明顯。從今年2月份(Sora發(fā)布),當(dāng)時(shí)很多人是被震驚到了。對(duì)沒有公開的技術(shù),怎么去突破技術(shù),有很多討論。

事實(shí)上,我們整個(gè)行業(yè)大概用了半年的時(shí)間,已經(jīng)做到了可以去用的,時(shí)空一致性的很好的產(chǎn)品效果,大概走了半年的路。

我覺得加速的最核心的原因在于,現(xiàn)在大家對(duì)技術(shù)路線的認(rèn)知和準(zhǔn)備上,其實(shí)達(dá)到了比較好的程度。

當(dāng)然,我們還有物理的條件,比如說像云基礎(chǔ)設(shè)施、計(jì)算資源的這種準(zhǔn)備上,不像ChatGPT當(dāng)時(shí)出的時(shí)候了,當(dāng)時(shí)大家更多是不知所措,很多人可能沒準(zhǔn)備好去接受,中間是又花了很長(zhǎng)的時(shí)間去學(xué)習(xí)、去掌握。

當(dāng)我們掌握了之后,再看現(xiàn)在技術(shù)的進(jìn)展,再去做新的問題,其實(shí)速度是越來越快的。當(dāng)然,不同的模型能力,輻射到實(shí)際用戶的角度來說,有一些快慢之分,也會(huì)分行業(yè)。

從廣泛的角度來說,大家可能沒感知到。單從技術(shù)來說,現(xiàn)在技術(shù)發(fā)展曲線是越來越陡峭的。要預(yù)測(cè)未來的話,就是包括像更高階的AGI發(fā)展 ,我是比較樂觀的,可能更比之前會(huì)以更快的速度來去實(shí)現(xiàn)。

△朱軍

張鵬:從三位的視角來看,如果外界有人說 AGI 怎么發(fā)展變慢了,你們可能的簡(jiǎn)單的一句話就是:你還想要怎樣?這18個(gè)月已經(jīng)讓我們每個(gè)人都目不暇接了。說到這,其實(shí)最近剛剛出的o1的新模型,在專業(yè)人群里也形成非常多的影響,現(xiàn)在還有很豐富的討論。正好我們既然都在這個(gè)平臺(tái),三位都對(duì)這件事有自己的見解,我們就在這來討論一下。

大昕,你怎么看o1?很多人認(rèn)為,這是AGI的發(fā)展階段的一個(gè)重要進(jìn)步,我們?cè)趺蠢斫膺@個(gè)階段?

姜大昕:確實(shí)我看到了一些非共識(shí),就是有些人覺得意義很大,有些人覺得也不過如此。

我覺得大家如果去試用o1的話,可能第一印象是,推理確實(shí)非常的驚艷。我們?cè)嚵撕芏嗟膓uery,覺得推理確實(shí)上了一個(gè)很大臺(tái)階。

它背后的意義,我能想到的有兩點(diǎn),第一是,它第一次證明了其實(shí)說large language model,就是語(yǔ)言模型,是可以有人腦的慢思考、系統(tǒng)2的能力。

以前的GPT的范式,或者GPT的訓(xùn)練,是叫predict next token(預(yù)測(cè)下一個(gè))。只要這樣訓(xùn)練,就注定了它一定只有system 1的啊。而 O1 它是用了強(qiáng)化學(xué)習(xí)的訓(xùn)練框架,所以有系統(tǒng)2 的能力。

系統(tǒng)1的體現(xiàn),就是它是直線型思維。就像我們看到GPT 4,它有的時(shí)候可以把復(fù)雜的問題拆解成很多步,然后分步地去解決,但它還是一個(gè)直線型。

系統(tǒng)2和系統(tǒng)1最大的區(qū)別,就在于系統(tǒng)2能夠去探索不同的路徑,他可以自我反思、糾錯(cuò),然后不斷地試錯(cuò),直到找到一個(gè)正確的途徑,這是系統(tǒng) 2 的特點(diǎn)。

所以這次的o1,是把以前的模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合起來了,使得一個(gè)模型同時(shí)有了人腦系統(tǒng)1和系統(tǒng)2的能力,意義是非常大的。

第二,它帶來了scaling law(縮放定理)新的方向。

o1實(shí)際上想試圖回答的一個(gè)問題,是RL(強(qiáng)化學(xué)習(xí))究竟怎么泛化?因?yàn)閺?qiáng)化學(xué)習(xí),不是OpenAI第一個(gè)做的。

DeepMind一直走的就是強(qiáng)化學(xué)習(xí)路線,從AlphaGo到AlphaFold到Alpha Geometry,其實(shí)Google在強(qiáng)化學(xué)習(xí)上是非常厲害的。

但是以前的強(qiáng)化學(xué)習(xí)的場(chǎng)景都是為特定場(chǎng)景去設(shè)計(jì),Alphago只能下圍棋,Alpha Fold只能去預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu)。

所以,這次o1的出現(xiàn)是在模型RL(強(qiáng)化學(xué)習(xí))的通用性和泛化性上,上了一個(gè)大臺(tái)階,而且它 scale 到了很大的規(guī)模。所以,我是把它看成scaling的新的帶來的一個(gè)技術(shù)的新的范式,我們不妨稱之為RL Scaling。

而且我們看到其實(shí)有意思的一點(diǎn)就是,o1并沒有到一個(gè)很成熟的階段,還是一個(gè)開端。但我覺得這恰恰是讓人覺得非常地興奮,這就等于OpenAI跟我們說:

誒,我找到了一條上限很高的道路。如果你仔細(xì)去思考它背后的方法的話,你會(huì)相信,這條路實(shí)際上是能夠走得下去。

所以,o1從能力上來講,我覺得它展示了LLM肯定有系統(tǒng)2的能力。從技術(shù)上來講,它帶來了一個(gè)新的 scaling 的范式,所以我覺得它的意義很大。

張鵬:聽起來的,你雖然說現(xiàn)在有非共識(shí),但感覺你這是非??春茫苷J(rèn)同。朱軍老師怎么看、怎么評(píng)價(jià)o1帶來的階段進(jìn)展?

朱軍:它代表著一種顯著的質(zhì)變,因?yàn)槲覀円矊?duì)AGI也大概做了一些分級(jí),學(xué)術(shù)界、產(chǎn)業(yè)界都有L1到L5的區(qū)分:

L1相當(dāng)于是聊天機(jī)器人,ChatGPT類的應(yīng)用,之前大家都做了很多;

L2就是推理者,可以做復(fù)雜問題的深度思考、推理;

L3是智能體,回應(yīng)剛才吳總講的,就是從數(shù)字世界走向物理世界,模型要去改變,要去交互;

L4是創(chuàng)新者,要去發(fā)現(xiàn)、創(chuàng)造一些新的東西、新的知識(shí);

L5是組織者,可以去協(xié)同或者是有某種組織的方式,來更高效運(yùn)轉(zhuǎn)。

這是大家對(duì)AGI L1 到 L5 的分級(jí),每一級(jí)的也有相應(yīng)narrow(專有能力) 和 general (泛化能力)的區(qū)分?,F(xiàn)在在某些 task (任務(wù))上可能就展示出來了,比如o1在 L2 的 narrow 場(chǎng)景下,在一些特定任務(wù)下已經(jīng)實(shí)現(xiàn)了,可以達(dá)到人類高階智能的水平。

從分級(jí)的角度來看,o1確實(shí)代表著整個(gè)行業(yè)的巨大進(jìn)步。技術(shù)上,它實(shí)際上,是把過去我們?cè)趶?qiáng)化學(xué)習(xí)上做的很多東西,在大規(guī)模的基座模型上scale up,做出來了效果,這是工程上對(duì)行業(yè)產(chǎn)生的實(shí)際觸動(dòng)。

當(dāng)然,這也會(huì)觸發(fā)或者激發(fā)出未來的很多探索,研發(fā)大概會(huì)走向從 narrow 到 general 的躍遷。剛才講到速度,我相信變化可能會(huì)發(fā)生得很快,因?yàn)榇蠹乙呀?jīng)有很多準(zhǔn)備了。我也期待,這個(gè)領(lǐng)域?qū)2做得更好,甚至更高階的智能可以實(shí)現(xiàn)。

張鵬:感覺你對(duì)實(shí)際上AGI的L2層面,明確的路徑和階段性的成果,這個(gè)定義已經(jīng)很高了,之前都在L1的層面。當(dāng)然,要到吳總(吳泳銘)的期望的層面,擁抱、改變物理世界,其實(shí)最終還要往前走,到了 L3,可能這件事就真的會(huì)完整的系統(tǒng)性的發(fā)生。

再回到植麟這邊,這次發(fā)布o(jì)1后, Sam Altman也熱情洋溢地說:我們認(rèn)為這是一次新的范式的革命。當(dāng)然,Sam就很會(huì)演講,也很會(huì)表達(dá)。你怎么看?我們?cè)趺蠢斫馑f的話,你是否認(rèn)同這是一次范式變革?

楊植麟:o1確實(shí)意義很大,主要的意義在于提升了AI 的上限。AI到底是可以提升5%、10%的生產(chǎn)力,還是說這是10倍的GDP提升?最重要的問題就是:你能不能通過強(qiáng)化學(xué)習(xí)去進(jìn)一步的scaling,所以我覺得o1是完全提升AI上限的東西。

如果我們回看AI歷史上七八十年的發(fā)展,唯一有效定理的就是scaling,唯一有效的就是去加更多的算力。但是,o1提出來之前,很多人在研究強(qiáng)化學(xué)習(xí),但是可能都沒有非常確切的答案。如果強(qiáng)化學(xué)習(xí)跟大語(yǔ)言模型的pre- training(預(yù)訓(xùn)練)、 post-training(后訓(xùn)練)這些東西整合,能不能持續(xù)地提升模型能力?

GPT 4這一代模型的提升,更多的是確定性的提升,在一樣的范式下,讓規(guī)模變得更大,肯定會(huì)有確定性的提升,但o1的提升并不是完全確定性的提升。

之前可能大家會(huì)擔(dān)心,現(xiàn)在互聯(lián)網(wǎng)上大部分的優(yōu)質(zhì)數(shù)據(jù)都已經(jīng)被使用完了。你就算繼續(xù)使用這個(gè)數(shù)據(jù),也沒有更多的數(shù)據(jù)可以挖掘,所以你原來的范式可能會(huì)遇到問題。但是要讓 AI 有效,你又要需要進(jìn)一步的scaling,那你 scaling 從那里來?

所以o1其實(shí)很大程度上是解決了這個(gè)問題,或者說至少是證明了初步可行。初步可行的情況下,可能我們會(huì)有越來越多的人可以去投入去做這個(gè)事情,最終要做到十倍GDP的效果是有可能的,這是很重要的開端。

當(dāng)然,我覺得這種變化將會(huì)對(duì)很多產(chǎn)業(yè)格局產(chǎn)生影響,特別是對(duì)創(chuàng)業(yè)公司的新機(jī)會(huì)來說也會(huì)帶來一些變動(dòng)。

比如,其中一個(gè)關(guān)鍵點(diǎn)在于訓(xùn)練和推理過程中算力占比的變化。這個(gè)變化并不是說訓(xùn)練算力會(huì)下降,實(shí)際上,訓(xùn)練算力可能還會(huì)持續(xù)提升。

與此同時(shí),推理算力的提升速度可能會(huì)更快。這種比例的變化,本質(zhì)上會(huì)帶來很多新的機(jī)會(huì),尤其是創(chuàng)業(yè)公司可能在其中發(fā)現(xiàn)全新的發(fā)展方向與機(jī)會(huì)。

如果一家公司達(dá)到了某個(gè)算力門檻,它其實(shí)可以在此基礎(chǔ)上進(jìn)行很多算法的創(chuàng)新,甚至可以在基礎(chǔ)模型上取得顯著進(jìn)展,所以我認(rèn)為這非常重要。

對(duì)于那些算力相對(duì)較少的公司,它們也可以通過post-training的方式,在特定領(lǐng)域內(nèi)實(shí)現(xiàn)最優(yōu)效果,這也會(huì)促使更多產(chǎn)品和技術(shù)解決方案的出現(xiàn)。

整體上,這為創(chuàng)業(yè)公司帶來了更多的想象空間,至少在創(chuàng)業(yè)相關(guān)的領(lǐng)域中,機(jī)會(huì)與潛力被大大拓展了。

張鵬:這次所謂的范式變化,核心在于解決了scaling law中,我們接下來要scaling什么的問題,擴(kuò)展什么樣的東西。

我們看到了一個(gè)全新的路徑,剛才你也提到,未來可擴(kuò)展的創(chuàng)新路徑變得更多,可探索的方向也變多了,而不是原來那種收縮的,甚至遇到阻礙的狀態(tài)。

當(dāng)然,我覺得今天看起來三位對(duì)GPT-o1帶來的這次變化都非常興奮,但這也是大家現(xiàn)在比較關(guān)心的問題。畢竟今年的變化還主要集中在一些比較明確的場(chǎng)景上。

我想請(qǐng)教朱軍老師,當(dāng)我們將強(qiáng)化學(xué)習(xí)引入這個(gè)體系,成為一個(gè)新的范式之后,我們是否能看到能力的明顯泛化?今天你會(huì)發(fā)現(xiàn),它在局部的能力表現(xiàn)非常出色,提升也很顯著。但如果要實(shí)現(xiàn)泛化,這條路徑和確定性是否已經(jīng)明確?

朱軍:這個(gè)問題確實(shí)值得深入思考?,F(xiàn)在的技術(shù)往往是在特定任務(wù)上取得突破后,我們?cè)倏紤]如何將其擴(kuò)展到更廣泛的任務(wù)和能力上。

強(qiáng)化學(xué)習(xí)的角度來說,比如交通領(lǐng)域的AI實(shí)現(xiàn)路線,雖然它還沒有完全解決高度泛化的問題,但從科研的積累和解讀上,我們可以看到它可能涉及的技術(shù)路徑。

相比之下,像ChatGPT這樣開放性較強(qiáng)的系統(tǒng),當(dāng)前的一些應(yīng)用顯然沒有那么開放。

在強(qiáng)化學(xué)習(xí)中,一個(gè)很重要的問題是過程監(jiān)督數(shù)據(jù)的獲取。它與結(jié)果導(dǎo)向的監(jiān)督(如ARPU)有所不同。你需要對(duì)每個(gè)思考過程的步驟進(jìn)行標(biāo)注,這樣的數(shù)據(jù)獲取難度較大,因?yàn)樗枰獙I(yè)人員提供高價(jià)值的標(biāo)注數(shù)據(jù)。

此外,在跨領(lǐng)域遷移時(shí),比如自動(dòng)駕駛或其他更開放的場(chǎng)景中,reward model的定義就變得更加復(fù)雜了。對(duì)于定理證明或編程等有明確答案的任務(wù),獎(jiǎng)勵(lì)是比較清晰的,獎(jiǎng)勵(lì)函數(shù)也明確。

但是在更開放的應(yīng)用中,比如自動(dòng)駕駛、虛擬替身、甚至技術(shù)創(chuàng)作中的生成視頻和語(yǔ)言內(nèi)容,界定“好”與“壞”的標(biāo)準(zhǔn)就變得模糊,評(píng)價(jià)標(biāo)準(zhǔn)因人而異。

在這種情況下,技術(shù)面臨很多挑戰(zhàn),例如如何定義獎(jiǎng)勵(lì)模型、如何收集數(shù)據(jù),以及如何高效地實(shí)現(xiàn)scaling。不過,大家已經(jīng)看到了這條路的曙光,未來的探索方向也逐漸明晰。

結(jié)合當(dāng)前更強(qiáng)大的基礎(chǔ)設(shè)施,我們可能會(huì)比之前更快實(shí)現(xiàn)跨領(lǐng)域遷移的效果。與上一個(gè)時(shí)代相比,比如Alphago遷移到其他領(lǐng)域,如今我們擁有更好的模擬器和一些AGI生成方法來構(gòu)建環(huán)境,這些技術(shù)加持會(huì)加速進(jìn)展,效果提升將更容易實(shí)現(xiàn)。

從我的角度來看,目前還沒有一個(gè)公開的、明確的泛化路徑,但可以確定的是,探索的空間和潛力是巨大的。

張鵬:這個(gè)問題我真的想再追問一下植麟就是看起來是這樣的一個(gè)狀態(tài),我估計(jì)你可能也是這個(gè)理解,當(dāng)然你也可以表達(dá)一下個(gè)人的看法。

但我其實(shí)想問的是說這個(gè)狀態(tài),比如像你這樣的創(chuàng)業(yè)公司是好事,是壞事,那你看到那個(gè)東西時(shí)候,你會(huì)影射到自己未來要做的手術(shù)會(huì)是什么心理狀態(tài)?你會(huì)怎么分析這個(gè)環(huán)境?

楊植麟:我覺得這其實(shí)是個(gè)很好的機(jī)會(huì),因?yàn)橛幸粋€(gè)新的技術(shù)變量,是一個(gè)新的技術(shù)維度。然后或多或少我們之前也有一些投入,但是可能現(xiàn)在會(huì)變成一個(gè)組織,然后在這個(gè)組織下面,我覺得我們有非常多的新的機(jī)會(huì)。一方面是,剛剛朱老師提到的怎么去泛化的問題,然后另一方面就是可能就說在這過程中可能還有一些基礎(chǔ)的技術(shù)問題可能不完全解決。

就是因?yàn)榭赡芩诵南竦讓由婕暗接?xùn)練跟推理,可能兩個(gè)東西要同時(shí)去 scaling。

但這里面可能很多性質(zhì),我覺得今天也許也沒有被完全探索清楚,然后包括剛剛提到的過程監(jiān)督的這些問題,可能中間的一些幻覺也會(huì)給它的效果帶來很大的傷害,所以這些問題我覺得都很值得研究。

但如果能夠做好的話,那其實(shí)是可以把現(xiàn)在的很多能力去上一個(gè)臺(tái)階,所以我覺得還是像我剛剛說的,就是對(duì)我們來講可能會(huì)有更多通過這種基礎(chǔ)創(chuàng)新,然后能夠去提前一些突破的機(jī)會(huì).

張鵬:有不確定其實(shí)是好事,對(duì)吧?有確定的方向,有不確定的路徑,對(duì)創(chuàng)業(yè)公司反而是好事,否則就沒有創(chuàng)業(yè)公司的事了。

那我再回到大昕這邊,其實(shí)剛才植麟也提到了一點(diǎn),我覺得這是個(gè)很有意思的問題。

過去我們常常提到“算法、算力和數(shù)據(jù)”這三個(gè)要素,作為討論AGI時(shí)的關(guān)鍵三角形。

這次看起來,在算法層面已經(jīng)出現(xiàn)了一些范式的變化。相應(yīng)的,算力和數(shù)據(jù)這兩個(gè)要素,在這個(gè)三角形中會(huì)產(chǎn)生怎樣的連鎖反應(yīng)?能不能幫我們推理一下?

姜大昕:對(duì),我認(rèn)為算法、算力和數(shù)據(jù)三者的連鎖關(guān)系依然存在,RL的確帶來了算法層面的變化。至于這種變化對(duì)算力的影響,我認(rèn)為有兩點(diǎn):一是確定的,另一點(diǎn)則不太確定。

首先,確定的是,正如剛才兩位所提到的,在推理側(cè)的計(jì)算需求將會(huì)成倍增長(zhǎng)。這就是OpenAI在其博客中提到的“inference-time scaling”。

與此同時(shí),對(duì)推理芯片性能的要求也會(huì)顯著提高??梢韵胂?,OpenAI在GPT-o1背后可能使用了H100芯片,每次處理一個(gè)問題往往需要消耗十幾秒甚至幾十秒。如果我們要加快推理速度,對(duì)芯片的性能要求必然會(huì)進(jìn)一步提升。

接下來,大概率會(huì)確定的點(diǎn)是,在RL(強(qiáng)化學(xué)習(xí))訓(xùn)練階段,所需的算力不會(huì)比當(dāng)前少。這種對(duì)于算力的非線性需求仍將持續(xù)上升。

為什么這么說呢?

因?yàn)樵赗L階段,尤其是進(jìn)行self-play(自我博弈)時(shí),數(shù)據(jù)量是可以無上限生成的。就像剛才提到的,self-play數(shù)據(jù)量理論上是可以無限擴(kuò)展的。OpenAI在訓(xùn)練草莓模型時(shí),使用了上萬張H100顯卡,持續(xù)訓(xùn)練了幾個(gè)月時(shí)間。而目前GPT-o1還處于預(yù)覽階段,訓(xùn)練尚未完成,所以訓(xùn)練的代價(jià)是非常高的。

所以我覺得如果我們追求的是一個(gè)通用的、有泛化能力的推理模型,而不是為某個(gè)特定場(chǎng)景所設(shè)計(jì)的一個(gè)的模型的話,那么它可能訓(xùn)練所需要的計(jì)算量并不小。

那還有一個(gè)就是我不太確定的,就是在self play的時(shí)候,我們用的主模型它的參數(shù)量要不要再繼續(xù)scale(擴(kuò)大規(guī)模),讓它產(chǎn)生更好的推理路徑?

因?yàn)楝F(xiàn)在有一個(gè)大家有個(gè)普遍的觀點(diǎn),就是說GPT-4到了萬億參數(shù)以后,你再去 scale它的參數(shù),那么它的收益的邊際是在下降。

但如果這個(gè)方法它產(chǎn)生一個(gè)放大器的作用,它能夠加倍你的收益的話,那么是不是總的收益 ROI 又打正?所以這是一個(gè)不太確定的事情,可以留待后續(xù)驗(yàn)證。

面去驗(yàn)證,如果這個(gè)結(jié)論成立的話,算力的需求增長(zhǎng)可能會(huì)回到平方增長(zhǎng)的軌道,計(jì)算量等于參數(shù)量乘以數(shù)據(jù)量。所以,我的感覺是,RL帶來的無論是推理側(cè)還是訓(xùn)練側(cè),對(duì)算力的需求都在增長(zhǎng)。

至于數(shù)據(jù)方面,在RL階段我們主要依賴兩類數(shù)據(jù):一是少量的人工合成數(shù)據(jù),二是大量通過self-play生成的機(jī)器數(shù)據(jù)。雖然數(shù)據(jù)量可以很大,但數(shù)據(jù)質(zhì)量至關(guān)重要。

因此,如何設(shè)計(jì)生成數(shù)據(jù)的算法,以及主模型在self-play過程中的能力將變得非常關(guān)鍵。

張鵬:我覺得剛才大家對(duì)于GPT-o1帶來的范式的一些變化做了很好的拆解,但我覺得今天三位,也都是創(chuàng)業(yè)者,也都在做自己的對(duì)應(yīng)的公司,有自己的團(tuán)隊(duì)要往前去發(fā)展,其實(shí)我們不妨再推理一下。

我想問朱軍老師,最近的一些技術(shù)進(jìn)展,會(huì)對(duì)未來的產(chǎn)品或者說一些技術(shù)最終落到產(chǎn)業(yè)里有什么明確的推動(dòng)?有沒有階段性的一些總結(jié)和觀察?

朱軍:我覺得現(xiàn)在是這樣,大模型或者叫我們叫大規(guī)模預(yù)訓(xùn)練這種技術(shù),它還是代表著整個(gè)范式的變化,因?yàn)樗牟还馐钦Z(yǔ)言到多模態(tài)再到空間智能,其實(shí)重點(diǎn)是說我怎么去讓智能體能夠有交互,能夠在這個(gè)過程中去學(xué)習(xí)。

我想問問植麟, Kimi是在今年引發(fā)了大家很多關(guān)注的產(chǎn)品,發(fā)展得也很好,你覺得這一波的AI新變化,接下來會(huì)對(duì)相關(guān)產(chǎn)品會(huì)帶來什么樣的連鎖反應(yīng)?

能不能也幫我們推理一下?你會(huì)看到他的時(shí)候腦子里會(huì)怎么想?這個(gè)變化會(huì)如何發(fā)生?

楊植麟:這是個(gè)很好的問題。我覺得我們現(xiàn)在其實(shí)還是處于產(chǎn)業(yè)發(fā)展的早期階段。在早期階段,有一個(gè)特點(diǎn)是技術(shù)驅(qū)動(dòng)產(chǎn)品的比例會(huì)更高。

所以很多時(shí)候,產(chǎn)品的開發(fā)其實(shí)是在觀察當(dāng)前技術(shù)的發(fā)展,然后盡量把它的價(jià)值最大化。我們可以根據(jù)新的技術(shù)進(jìn)展,反推我們的產(chǎn)品應(yīng)該做出哪些調(diào)整。現(xiàn)在的技術(shù)發(fā)展有幾個(gè)關(guān)鍵點(diǎn)。

首先,我認(rèn)為這里有很多探索新PMF的機(jī)會(huì)。

因?yàn)樾枰M(jìn)行系統(tǒng)二的思考,這導(dǎo)致了延遲的增加,而這種延遲對(duì)用戶來說是一個(gè)負(fù)面的體驗(yàn),所有用戶都希望能盡快拿到結(jié)果。

第二點(diǎn)是,這種新技術(shù)確實(shí)能提供更好的輸出,帶來更優(yōu)質(zhì)的結(jié)果,甚至可以完成一些更復(fù)雜的任務(wù)。

所以,探索新PMF其實(shí)是在“用戶體驗(yàn)因延遲下降”和“最終結(jié)果質(zhì)量上升”之間,尋找一個(gè)平衡點(diǎn)。

你要確保增量?jī)r(jià)值大于體驗(yàn)的損失,這是非常重要的。我覺得,高價(jià)值的產(chǎn)品可能會(huì)率先出現(xiàn)一些突破。因?yàn)槿绻闶且粋€(gè)娛樂場(chǎng)景,很可能用戶無法容忍延遲的增加,所以這是一點(diǎn)非常重要的考量。

接下來,我覺得產(chǎn)品形態(tài)也會(huì)發(fā)生變化。

因?yàn)橄到y(tǒng)二的思考方式導(dǎo)致了現(xiàn)在這種同步、即時(shí)的聊天型產(chǎn)品形態(tài)可能會(huì)有所改變。

未來的 AI 可能不再僅僅是思考 20 秒或 40 秒,它可能需要幾分鐘,甚至更長(zhǎng)的時(shí)間去調(diào)用各種工具、執(zhí)行任務(wù)。

因此,產(chǎn)品形態(tài)可能會(huì)更接近人類,真正成為一個(gè)assistant(助手)的概念,幫助你完成復(fù)雜的任務(wù)。在這個(gè)過程中,產(chǎn)品形態(tài)的設(shè)計(jì)也會(huì)發(fā)生很大的變化。所以我覺得這里有很大的想象空間。

張鵬:其實(shí)我們剛才聊到了GPT-o1帶來的變化,我們也看到在AGI里也有一些其他的變化,比如像李飛飛的空間智能,包括自動(dòng)駕駛、機(jī)器人等等具身智能方面的變化。我想問朱軍老師,最近的一些技術(shù)進(jìn)展,會(huì)對(duì)未來的產(chǎn)品或者說一些技術(shù)最終落到產(chǎn)業(yè)里有什么明確的推動(dòng)?有沒有階段性的一些總結(jié)和觀察?

朱軍:我覺得現(xiàn)在是這樣,大模型或者叫我們叫大規(guī)模預(yù)訓(xùn)練這種技術(shù),它還是代表著整個(gè)范式的變化,因?yàn)樗牟还馐钦Z(yǔ)言到多模態(tài)再到空間智能,其實(shí)重點(diǎn)是說我怎么去讓智能體能夠有交互,能夠在這個(gè)過程中去學(xué)習(xí)。

從智能的角度來看,從包括從 AGI 發(fā)展上來看,它是必然的,因?yàn)闆Q策交互實(shí)際是智能里面非常核心能力的體現(xiàn),我們其實(shí)每時(shí)每刻都在做這決策,對(duì)吧?

我們面對(duì)的是一個(gè)未知的開放環(huán)境,所以對(duì)于智能來說的話,它的發(fā)展的路徑上就在整個(gè)的規(guī)劃里面,大家也是朝這個(gè)方向在走。

現(xiàn)在所有這些進(jìn)展,包括剛才討論很多的GPT-o1,也包括視頻生成、3D生成,其實(shí)大家都是最后要指向的有兩個(gè)方向:

一個(gè)是給消費(fèi)者的數(shù)字內(nèi)容,也就是說它看上去很好看、很自然,然后能夠講故事,讓大家甚至能夠去交互。

另外一個(gè)方向指向?qū)嶓w,指向物理世界,也就是生產(chǎn)力的提升。這其中現(xiàn)在可能最好的一個(gè)結(jié)合點(diǎn)就是和機(jī)器人。我們也看到很好的進(jìn)展,比如像預(yù)訓(xùn)練的范式能夠讓機(jī)器人的能力具有通用性。

比如我們自己實(shí)驗(yàn)室也做過,像四足機(jī)器人,過去機(jī)器人在不同場(chǎng)地跑起來,都需要用很多的人工去調(diào)參。

但現(xiàn)在其實(shí)用AI生成一些合成數(shù)據(jù)去大規(guī)模的訓(xùn)練,訓(xùn)練出來的策略可以裝灌到機(jī)器人上,相當(dāng)于換了一副大腦,就可以讓它的四肢能夠去更好地卸東西。它可以用同樣一套策略來去做各種場(chǎng)地的適應(yīng)。

就像剛才講到智能體是AGI的L3,現(xiàn)在L1、L2有進(jìn)展之后,后面肯定會(huì)提升到L3里面,讓機(jī)器人更好地去做推理規(guī)劃,然后更好地、更高效地和環(huán)境做交互,然后更好地完成復(fù)雜任務(wù)。

現(xiàn)在很多時(shí)候任務(wù)相對(duì)來說還是分散的,需要簡(jiǎn)化定義。未來可能很快我們會(huì)看到機(jī)器人可以接受復(fù)雜的指令,通過它內(nèi)嵌的思維鏈、或者過程學(xué)習(xí)的方式,能夠完成復(fù)雜任務(wù),到那時(shí)候機(jī)器人的能力又有很巨大的提升。

張鵬:作為創(chuàng)業(yè)公司,肯定也在面臨著今天的現(xiàn)實(shí)的產(chǎn)業(yè)的環(huán)境。我想問問大昕,在過去18個(gè)月,包括這次的o1,會(huì)對(duì)你的心態(tài)有什么影響和改變嗎?未來作為創(chuàng)業(yè)公司,是有了更大的創(chuàng)新空間嗎,怎么看未來技術(shù)創(chuàng)業(yè)的走向?

姜大昕:從兩個(gè)角度看,一個(gè)是創(chuàng)新的點(diǎn),我覺得RL出來確實(shí)和前面GPT的范式不太一樣。GPT是predict next token,從2018年GPT-1出來一直到GPT-4,除了加了一個(gè)MoE(混合專家模型)以外,其實(shí)沒有什么太多的很新的東西在里邊。

我覺得o1還是初始階段。剛才兩位也談到強(qiáng)化學(xué)習(xí)究竟怎么和大模型相結(jié)合,能夠做到泛化,這件事情我覺得有非常多的問題值得去探索。

剛才植麟也談到,包括我們?cè)谧鏊阉髀窂降臅r(shí)候,需不需要人工干預(yù)去幫它找到更好的路徑等等,包括self play的題目從哪里來,答案怎么去找,這些都是新的、未知的領(lǐng)域。我相信在未來的這一段時(shí)間里,肯定會(huì)有很多加速的技術(shù)發(fā)展。對(duì)我們創(chuàng)業(yè)公司來說,在創(chuàng)新上肯定是有很多的機(jī)會(huì)。

但另一方面,我覺得要面對(duì)算力的挑戰(zhàn)。

在推理側(cè)也好、在訓(xùn)練側(cè)也好,它所需要的算力還是不小,尤其是當(dāng)我們需要去追求通用性的、能夠泛化的推理模型的時(shí)候。我們內(nèi)部經(jīng)常調(diào)侃,“講卡傷感情,沒卡沒感情”,我們后面又加了一句,叫“用卡費(fèi)感情”。

但如果我們追求的目標(biāo)就是AGI的話,那你付出再多還是要堅(jiān)持下去。因?yàn)槿绻凑誗caling Law繼續(xù)往下走,其實(shí)能玩的玩家就會(huì)變得越來越少,因?yàn)橐ヅ涞馁Y源太多了。

張鵬:現(xiàn)在你覺得資源的門檻有降低嗎?還是說要繼續(xù)拼算力上的資源?你怎么去整合這么多的集團(tuán)資源?工程上要做得更好,是核心點(diǎn)嗎?

姜大昕:要分成兩種不同的創(chuàng)新。一種是基礎(chǔ)模型就是奔著AGI去的,我就是要做通用的泛化性能高的,那投入是很大。而且我們看到國(guó)外的巨頭不約而同都是一年幾十億美金、上千億美金這樣的規(guī)劃。

但是另外一方面,我覺得還有大量的創(chuàng)新的空間實(shí)際上是去做應(yīng)用

今天所展現(xiàn)出來的智能,后來再加上智能體Agent的框架,已經(jīng)能夠解決我們其實(shí)很多的問題了,就像朱軍老師說兩類問題——數(shù)字系列、物理系列的問題——我們都可以再往前走。今年o1出來以后,把強(qiáng)化學(xué)習(xí)又泛化到了更高的階段,像植麟說的,它的上限變得更高了,所以我覺得這里面還有大量的機(jī)會(huì)。

楊植麟:首先,像DAU和你剛說的這些數(shù)據(jù),我覺得肯定是要抓的指標(biāo)。我覺得可能分成幾個(gè)層面:

第一個(gè)層面,一個(gè)產(chǎn)品首先要有價(jià)值,或者滿足了用戶的真實(shí)需求,這是本質(zhì),可能跟AI沒有太大的關(guān)系,所以可能又有更多的前置指標(biāo),比如留存。

第二個(gè)點(diǎn)是跟AI更相關(guān)的,就是說不光要有價(jià)值,也要有增量的價(jià)值,這個(gè)增量?jī)r(jià)值可能相較于市面上已有的AI產(chǎn)品,或者說是更通用的。我覺得接下來肯定會(huì)有通用的AI 產(chǎn)品,這也是我們正在做的事情。

但在通用產(chǎn)品之外,比如ChatGPT之外,其實(shí)可能還會(huì)有大量的機(jī)會(huì)。這些 AI 產(chǎn)品機(jī)會(huì),要相比于通用產(chǎn)品產(chǎn)生增量?jī)r(jià)值,產(chǎn)生你在ChatGPT里面做不了的事情,或者說做起來體驗(yàn)很差的事情。

一般你的增量?jī)r(jià)值會(huì)產(chǎn)生在幾個(gè)方面:一方面,有可能交互方式是完全不一樣,或者是不同的入口,背后對(duì)應(yīng)了不同的資源。通過這種方式去產(chǎn)生增量?jī)r(jià)值,我覺得會(huì)很重要的一個(gè)事情。

然后第三個(gè)維度,我覺得是不光有價(jià)值,而且要隨著技術(shù)的發(fā)展,市場(chǎng)規(guī)模應(yīng)該越來越大,而不是越來越小。比如說如果你是專門研究prompt engineering,那你可能現(xiàn)在會(huì)有一個(gè)風(fēng)險(xiǎn):也許接下來的需求會(huì)越來越少。

但是,如果是說目前已經(jīng)能產(chǎn)生一定的PMF的產(chǎn)品,但還沒有泛化到一個(gè)很主流的群體,有可能是因?yàn)槟愕募夹g(shù)不夠強(qiáng)。那這時(shí)候再搭配上第二點(diǎn),也就是說你有增量?jī)r(jià)值、市場(chǎng)又越來越大的話,那它可能就是一個(gè)好的AI機(jī)會(huì)。

總結(jié)就是:數(shù)據(jù)是要看,但是在看數(shù)據(jù)之前先看產(chǎn)品存在的邏輯。如果它是成立的,數(shù)據(jù)又能證明,可能這就是一個(gè)值得投的公司。

張鵬:在下一個(gè)18個(gè)月里,你們期待看到什么樣的進(jìn)展?

朱軍:因?yàn)楝F(xiàn)在整個(gè)AI技術(shù)處于加速狀態(tài),我們的預(yù)測(cè)通常會(huì)過于保守。

如果回到你的問題,我預(yù)想未來18個(gè)月可能比較令人興奮的一個(gè)進(jìn)展,我希望看到AGI的L3已經(jīng)基本上實(shí)現(xiàn)至少在智能體,比如我們說的世界模型的創(chuàng)建生成、虛實(shí)融合,至少在一些特定場(chǎng)景下的決策能力的巨大的提升。其實(shí)它會(huì)利用我們今天講到的推理、感知等等。在特定場(chǎng)景里,已經(jīng)不是“Copilot”,而是“Auto Pilot”。

與此同時(shí),因?yàn)槲仪耙欢螘r(shí)間領(lǐng)了一個(gè)任務(wù),對(duì)L4做專門的分析:到底我們?nèi)笔裁??其?shí)最后調(diào)研或者是分析下來,你會(huì)發(fā)現(xiàn)如果我們要做科學(xué)發(fā)現(xiàn)或者做創(chuàng)新,它需要的那些能力,可能目前是散落在各個(gè)角落里面,當(dāng)然現(xiàn)在可能還缺一個(gè)系統(tǒng)怎么把這些東西集成在一起,給它做work。

所以我覺得如果更激進(jìn)一點(diǎn),我甚至覺得未來18個(gè)月可能在L4上也會(huì)有顯著的進(jìn)展。

當(dāng)然這里面我講的是嚴(yán)肅的科學(xué)發(fā)現(xiàn),其實(shí)L4還有一些創(chuàng)意的表達(dá),目前我們?cè)谀撤N意義上已經(jīng)達(dá)到了,比如說藝術(shù)創(chuàng)造、圖生視頻,一定程度上它已經(jīng)幫大家放大你的想象,或者讓你的想象可以具象化。

所以,我還是比較樂觀的,至少L3,或者未來的L4有一些苗子了。

張鵬:到今年年底前,你們自己有什么進(jìn)展,能提前透露嗎?

朱軍:到今年年底,我肯定是希望將我們本來做的視頻模型能夠以更加高效、更可控的方式提供給大家。

可控,比如你想表達(dá)一個(gè)故事,不是簡(jiǎn)單地將一段話或者一個(gè)圖片給它動(dòng)起來,我們是希望你可以連續(xù)地講,而且它不光是人的一致性,還包括物體等各種主題的一致性,還包括交互性;

高效,它一方面解決對(duì)算力成本的考量,因?yàn)槟闳绻胍?wù)很多人,讓大家用的話,首先你成本要降下來,不然這個(gè)本身就是燒錢,一直賠錢。

另外更重要的,還是從體驗(yàn)上。就使用者來說,因?yàn)樗氡磉_(dá)自己的創(chuàng)意,他可能需要多次和系統(tǒng)來交互,一方面是驗(yàn)證,另外一方面是啟發(fā),所以這個(gè)過程也需要你的模型系統(tǒng)能夠比較高效,比如說終極目標(biāo)達(dá)到實(shí)時(shí),能夠讓大家快速嘗試。

等到這個(gè)階段,我相信大家的用戶體驗(yàn),包括用戶量都會(huì)有一個(gè)巨大的提升,這是我們今年想重點(diǎn)突破的。當(dāng)然長(zhǎng)遠(yuǎn)的話,可能明年18個(gè)月會(huì)走向?qū)嶓w的虛實(shí)融合的場(chǎng)景了。

張鵬:3個(gè)月的目標(biāo)和18個(gè)月的,對(duì)未來的期待都是很明確的。植麟呢?我覺得這是挺好的概念,你既可以說說18個(gè)月,也可以講未來3個(gè)月會(huì)有什么進(jìn)展。

楊植麟:我覺得接下來最重要的milestone(里程碑)可能是開放性的強(qiáng)化學(xué)習(xí)。你可能真的能在產(chǎn)品上跟用戶去交互,在一個(gè)真實(shí)的環(huán)境里面去完成任務(wù),然后自己去計(jì)劃。當(dāng)然我覺得o1其實(shí)已經(jīng)一定程度上說明,這個(gè)方向有比之前更強(qiáng)的確定性,我覺得這會(huì)是一個(gè)重要的里程碑,可能也是AGI路上現(xiàn)在僅剩唯一的重要問題。

張鵬:所以關(guān)鍵問題是,期待未來18個(gè)月要有新的突破和進(jìn)展?

楊植麟:對(duì),應(yīng)該是能看到很多進(jìn)展。在AI領(lǐng)域,18個(gè)月其實(shí)很長(zhǎng)。

張鵬:對(duì),18個(gè)月已經(jīng)是很長(zhǎng)了,如果看過去18個(gè)月走的路。那你未來三個(gè)月里,會(huì)有什么可以透露?

楊植麟:我們還是希望能在產(chǎn)品的技術(shù)上持續(xù)的創(chuàng)新,至少在一兩個(gè)重要領(lǐng)域能夠做到世界最好,但是這個(gè)有新的進(jìn)展會(huì)盡快跟大家分享。

張鵬:看似沒透露,但是實(shí)際上我覺得后頭應(yīng)該會(huì)看到他的進(jìn)展。大昕呢?你怎么看18個(gè)月和未來三個(gè)月的進(jìn)展?

姜大昕:第一我也很期待強(qiáng)化學(xué)習(xí)能夠進(jìn)一步泛化。另外一個(gè)方向,其實(shí)我也很期待,應(yīng)該說期待了很久,就是在視覺領(lǐng)域的理解和生成一體化。

在文字領(lǐng)域,GPT已經(jīng)做到了理解生成一體化,但是在視覺領(lǐng)域這個(gè)問題非常難,所以在目前為止,我們看到的視覺理解和生成這兩個(gè)模型是分開的,即使像剛才說多模融合GPT-4o,大家仔細(xì)去看,它其他模態(tài)都解決了,唯獨(dú)不能生成視頻,所以這是一個(gè)懸而未決的問題。

它為什么很重要呢?如果我們解決了視頻理解生成一體化,那么我們就可以徹底地建立一個(gè)多模的世界模型。有一個(gè)多模的世界模型以后,可以幫助我們真正地去產(chǎn)生非常長(zhǎng)的視頻,也就是解決Sora目前的技術(shù)缺陷。

還有就是,它可以和具身智能相結(jié)合,它可以作為機(jī)器人的大腦去幫助智能體更好地去探索物理世界,所以我也是非常期待的。

張鵬:年底之前,你這邊會(huì)有什么我們值得期待的進(jìn)展嗎?

姜大昕:我也是期待一方面模型或者技術(shù)的進(jìn)步,另外是產(chǎn)品能夠帶給我們的用戶更多的、更好的體驗(yàn)。

階躍有一款產(chǎn)品叫做躍問,跳躍的躍,問答的問,那么在上面的用戶是可以體驗(yàn)我們最新的萬億參數(shù)的MoE模型。它不光是理科很強(qiáng),而且文學(xué)創(chuàng)作能力也很強(qiáng),經(jīng)常給大家?guī)硪恍@喜。躍問上還有一個(gè)新的功能叫“拍照問”,我們看到用戶經(jīng)常拍張照片去問食物的卡路里,去問寵物的心情,去問一個(gè)文物的前世今生。

包括meta眼鏡的發(fā)布,還有Apple Intelligence今年都突出了視覺交互的功能,所以我們?cè)谲S問上也有體現(xiàn),而且我們會(huì)努力一步一步把這個(gè)功能做得越來越好。

張鵬:今天我們已經(jīng)其實(shí)略微超時(shí)了,但是其實(shí)我感覺我們討論剛剛開始,還有很多值得持續(xù)去深入的。

當(dāng)然可能要在未來不斷的 AI 的前進(jìn)的過程之中,我們?cè)侔堰@種討論繼續(xù)下去??赡芊催^來我們至少能看到的是 AI、AGI的發(fā)展還在提速,這些技術(shù)還是讓人充滿了期待。

感謝今天幾位的分享,也謝謝大家的聆聽,謝謝。

封面來源|阿里云

免責(zé)聲明:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。

全站最新
国产精品伦理一区| 国产精品美女www爽爽爽视频| 欧美国产精品中文字幕| 国内精品国产成人国产三级| 丰满岳乱妇一区二区| www.射射射| 欧美一区2区三区4区公司二百| 青草热久免费精品视频| 中文字幕在线观看日韩| 欧美精品欧美精品系列| 欧洲av在线精品| 欧美视频在线看| 婷婷综合在线观看| 亚洲精品乱码久久久久久黑人 | 久草福利在线观看| 国产91在线视频观看| 国产一二三四区在线观看| 亚洲综合精品一区二区| 欧美在线视频在线播放完整版免费观看| 日韩精品视频在线免费观看| 亚洲成人精品久久| 日韩欧美成人激情| 日韩一区二区三区免费看 | 欧美体内she精高潮| 欧美一级一级性生活免费录像| 欧美日韩中文在线| 日韩欧美你懂的| 神马国产精品影院av| 国内揄拍国内精品| 国产精品极品美女粉嫩高清在线| 国产91色在线|免| 99影视tv| 在线亚洲美日韩| 日韩av在线综合| 97精品人人妻人人| 美女视频久久久| 免费人成年激情视频在线观看| 国产第一页在线播放| 麻豆疯狂做受xxxx高潮视频| 日韩成人免费观看| 99国产揄拍国产精品| 久久亚洲不卡| 成人午夜在线免费| 久久一二三四区| 中文字幕人妻色偷偷久久| 国产成人久久精品77777综合 | 蜜桃av噜噜一区| 国产麻豆精品95视频| 99久久精品免费看国产| 日本乱码高清不卡字幕| 亚洲三级 欧美三级| 热久久免费视频精品| 国产精品伊人日日| 日韩黄色片在线| wwwxxxx在线观看| 黄色在线观看免费| www.国产.com| 精品在线观看免费| 国产精品久久久久久久久免费樱桃 | 亚洲成av人片在线| 视频一区欧美精品| 亚洲第一搞黄网站| 日韩国产精品一区二区| 九九久久久久99精品| 亚洲国产日韩一区二区| 亚洲欧美激情在线观看| 亚洲一二三不卡| 91久久精品国产| 欧美日韩高清一区| 丁香婷婷综合色啪| 免费欧美在线视频| www.色小姐com| 欧美亚洲一区二区在线| 亚洲精品在线三区| 一级特黄aaa大片| 午夜电影一区二区| www.亚洲黄色| 蜜臀精品一区二区| 成年人精品视频| 一区二区三区日韩精品| 欧美大片免费播放器| www.亚洲人.com| 国产精品1区2区| 亚洲综合欧美在线| 欧美日韩黄色一区二区| 丰满的亚洲女人毛茸茸| 美女国内精品自产拍在线播放| www.五月婷婷.com| 成人av资源网| 久久久.com| 久久精品香蕉视频| 在线观看不卡一区| www久久久久久久| 一个色综合导航| 国产免费一区二区三区四区| 成人97在线观看视频| 91极品身材尤物theporn| 国产精品一区二区三区在线播放 | 国产熟女高潮视频| 五月激情综合色| 午夜在线观看一区| 日韩日本欧美亚洲| 日韩中文字幕综合| 亚洲美女搞黄| 亚洲国产综合人成综合网站| 日本少妇色视频| 久久精品国产一区二区电影| 免费看黄网站在线观看| 日本一区二区高清视频| 亚洲你懂的在线视频| 欧美在线视频第一页| 国产午夜精品一区| 欧洲人成人精品| 精品黑人一区二区三区在线观看| 亚洲国产精品女人| 日韩午夜激情av| 亚洲va天堂va欧美ⅴa在线| 国产欧美综合一区| 精品国产乱码久久久久久久久| www.xxxx国产| 亚洲图片都市激情| 日韩欧美国产成人| 中文字幕在线观看国产| 黄色一级视频播放| 精品对白一区国产伦| 国产精品久久久久久久免费看| 国产亚洲一区在线播放| 欧美性欧美巨大黑白大战| 日韩精品一区二区三| 精品国产一区二区三区麻豆小说| 大桥未久av一区二区三区| 91精品国产高清一区二区三密臀| 国产精品视频看| 97精品一区二区视频在线观看| 热久久一区二区| 91人人澡人人爽人人精品| 亚洲人成电影网站色…| 色婷婷av一区二区三区之e本道| 成 年 人 黄 色 大 片大 全| 日韩精品在线免费观看| 日本欧美一区二区三区| 丰满少妇一区二区三区专区| 日韩在线观看免费网站| 激情综合五月天| 最近2019年中文视频免费在线观看| 欧美一区二区三区成人片在线| 精品久久一二三| 久久在线精品视频| 国产精品污网站| 国产午夜免费福利 | av中文在线播放| 国模吧无码一区二区三区| 国产欧美一区二区三区四区| 91精品国产欧美一区二区18| 精品一区二区免费在线观看| 免费黄色激情视频| 91传媒免费视频| 国产91免费观看| 欧美一级精品在线| 99re热这里只有精品视频| 精品91久久久| 国产黄色一区二区三区| 国产高清自拍一区| 一区二区三区视频在线| 黄色91在线观看| 美女网站在线免费欧美精品| 国产这里有精品| 色噜噜狠狠一区二区| 国产麻豆乱码精品一区二区三区 | 五月天婷婷亚洲| 久久精品国产综合精品 | 久久精品国产亚洲AV无码麻豆| 91激情视频在线| 日本高清一区| 国产精品自拍偷拍| 久久综合久久美利坚合众国| 欧美群妇大交群的观看方式 | 中文字幕中文字幕99| 国产精品91久久| 欧美日产国产成人免费图片| 欧美日韩一区二区不卡| 91麻豆产精品久久久久久| 亚洲欧美一区二区三区在线观看 | 992tv成人免费视频| 欧美精品一二三区| 99久久亚洲一区二区三区青草 | 欧美在线免费观看视频| 午夜国产精品一区| 一二三四社区欧美黄| 亚洲欧美在线视频| 1000部国产精品成人观看| 99热精品一区二区| 蜜臂av日日欢夜夜爽一区| www.成人在线观看| 国产精品主播一区二区| 最近中文字幕在线免费观看| 日本一二三区不卡| 亚洲中文字幕一区| 日韩在线一级片| 看全色黄大色大片| 成人免费看片'免费看| 国产精品久久亚洲7777| 91精品久久久久久久久| 色哟哟入口国产精品| 精品日韩在线观看| 欧美日本一区二区三区| 亚洲成人在线免费| 亚洲精品少妇30p| 亚洲视频一区在线| 国产欧美精品日韩区二区麻豆天美| 久久丁香综合五月国产三级网站| 国产高中女学生第一次| 国产夫妻在线观看| 一级黄色大毛片| 最近国语视频在线观看免费播放| 日韩av电影网址| 欧美交换国产一区内射| 欧美成人精品欧美一级| 精品人妻一区二区三区四区| 免费观看一级一片| 91精品人妻一区二区三区蜜桃欧美| 亚洲av无码一区二区三区观看| 噜噜噜在线视频| 黄色录像一级片| 久久久久久久久久免费视频| 日韩av在线播放观看| 在线观看日韩一区二区| 一级特黄aaa大片| 色丁香婷婷综合久久| 日韩成人精品在线观看| 美女久久网站| 成人综合激情网| 国产欧美日韩综合精品一区二区 | 特级西西人体4444xxxx| 少妇大叫太粗太大爽一区二区| 波多野在线播放| 丰满少妇被猛烈进入一区二区| 久久久久性色av无码一区二区| 久久久久中文| 午夜伦理一区二区| 久久成人综合视频| 亚洲免费久久| 精品欧美一区二区久久久| 少妇无码一区二区三区| 国产精品免费久久| 精品国产制服丝袜高跟| 国产精品久久久久久久久久久久久 | 中文字幕在线一区二区三区| 日韩欧美成人一区二区三区| 久久精品91| 有码一区二区三区| 亚洲视频axxx| 91免费人成网站在线观看18| 人妻少妇精品无码专区二区| 国产手机在线观看| 一级特黄色大片| 国产精品一区在线| 亚洲专区一二三| 中国人与牲禽动交精品| 1区1区3区4区产品乱码芒果精品| 欧美不卡在线播放| 日韩一级av毛片| 国产白浆在线观看| 国产精品二三区| 日韩成人xxxx| 国产精品综合久久久| 成人性免费视频| 麻豆成人在线视频| 懂色av中文一区二区三区 | 人妻av无码专区| 美女av免费看| 美女诱惑一区二区| 欧美日本国产视频| 国产不卡在线观看| 青青视频在线播放| 91video| 国产精品久久一卡二卡| 久久精品这里热有精品| 91免费视频黄| 激情五月婷婷在线| 国产1区2区3区精品美女| 555夜色666亚洲国产免| 91久久国产自产拍夜夜嗨| 精品人妻在线视频| 日本欧美一区二区三区| 一本到不卡免费一区二区| 国产精品69av| 精人妻一区二区三区| 少妇高潮久久久| 91精品国产欧美日韩| av一区二区三区在线观看| 在线看免费毛片| 性生活视频软件| 色香蕉成人二区免费| 国产精品免费一区二区三区在线观看| 国产精品久久AV无码| 黄色小说综合网站| 在线成人一区二区| 不要播放器的av网站| 欧美 日韩 国产 成人 在线 91| 好吊色视频一区二区| 91精品国产欧美日韩| 亚洲国产成人不卡| 中文字幕免费观看视频| 精品成人乱色一区二区| 精品一区二区国产| 特级毛片www| 在线视频国内一区二区| av资源站久久亚洲| 国产主播在线观看| 亚洲地区一二三色| 狠狠色综合网站久久久久久久| 久久久久99精品| 欧美日韩久久久久久| 狠狠色噜噜狠狠色综合久| 精品国产av一区二区三区| 影音先锋日韩有码| 成人做爰视频网站| 日韩精品中文字幕一区二区三区| 一级黄色特级片| 亚洲资源中文字幕| 99re在线视频免费观看| ...xxx性欧美| av免费播放网址| 成人欧美一区二区三区视频网页| 亚洲一区三区| eeuss国产一区二区三区 | 成品人视频ww入口| 91亚洲精品一区二区乱码| 日本视频一区二区不卡| 奇米色777欧美一区二区| 91中文精品字幕在线视频| 精品国产av一区二区| 亚洲精品综合精品自拍| 特大黑人巨人吊xxxx| 欧美性xxxxxxx| 尤物国产在线观看| 中文字幕一区二区三区视频| 欧美日韩天天操| 欧美特黄一级视频| 91精品国产九九九久久久亚洲| 欧美日韩中文视频| 亚洲少妇中文在线| 国产一区二区播放| 亚洲精品福利资源站| 级毛片内射视频| 精品日韩99亚洲| 91精品少妇一区二区三区蜜桃臀| 精品国产91久久久久久久妲己 | 久久久午夜精品理论片中文字幕| 欧美日韩视频在线一区二区观看视频| 粉嫩av一区二区夜夜嗨| 国产精品爽黄69| 亚洲三区在线播放| 国产精品一区二区三区在线| 久久一区二区三区四区五区 | 久久精品中文字幕一区二区三区| 手机看片福利永久| 成人激情视频网| 免费成人在线观看视频| 精品免费视频123区| 国产一区二区三区国产| 日韩精品久久一区| 国产女人aaa级久久久级| 日本男女交配视频| 亚洲高清免费在线| 日本三级日本三级日本三级极| 精品奇米国产一区二区三区| 91香蕉视频在线播放| xvideos亚洲人网站| www.成人免费视频| 国产精品久久国产精品| 成人av网址在线观看| 波多野结衣家庭教师在线| 午夜久久久久久| 在线免费看黄视频| 久久精品国产电影| 男人天堂网在线视频| 欧美一区免费视频| 亚洲你懂的在线视频| 中文视频在线观看| 亚洲毛片在线免费观看| 中文字幕免费视频观看| 九色视频成人porny| 亚洲一二三四久久| 免费中文字幕日韩| 91在线看www| 一区二区三区视频在线看| 亚洲第一页av| 日韩免费观看高清| 国产欧美日韩精品一区| 五月天综合视频| 国产精品高潮呻吟久久av无限| 91丨porny丨在线| 亚洲观看黄色网| 欧美在线观看视频| 国产精品国产三级国产aⅴ原创| 欧美精品欧美极品欧美激情| 欧美在线亚洲一区| 中文字幕国产一区二区| 韩国一级黄色录像| 亚洲综合成人婷婷小说| 亚洲国产日韩综合久久精品| 免费在线一区二区三区| 国产麻豆电影在线观看| 51午夜精品国产| 美女诱惑黄网站一区| 2一3sex性hd| 九九99玖玖| 亚洲色图偷窥自拍|