AI進(jìn)化成人的速度，可能比你想象的還慢。。。

IP屬地中國·北京 差評XPIN 時(shí)間：2025-11-12 00:06:39

吹了這么久AI，到底嘛時(shí)候才能超越人類啊？
其實(shí)，圈內(nèi)人對 AI 都有一個(gè)終極期望，就是實(shí)現(xiàn) AGI （通用人工智能），說白了，就是造出“和人一樣聰明的AI”。
咱去馬斯克的社交平臺上逛一圈，會發(fā)現(xiàn)他三句不離AGI。。

OpenAI的奧特曼也在瘋狂預(yù)言，AGI即將到來，也就這三五年的事兒了。

但這玩意，到底咋衡量呢？俗話說得好，人和人的區(qū)別，比人和豬的區(qū)別還大。。到底啥水平，才能和人一樣聰明啊？
就連天天為了AGI吵架的大佬們，也根本說不出來，AGI到底是個(gè)啥。。

合著都在這虛空對線是吧。
所以最近，一幫頂尖大佬看不下去了，幾十號人聯(lián)手發(fā)了篇論文，作者還是全明星陣容，包括圖靈獎(jiǎng)得主、谷歌前 CEO 等等，他們聯(lián)合起來，給出了目前為止第一個(gè) AGI 的量化定義。
他們也順便用GPT模型做了個(gè)測試，結(jié)果顯示，如果AGI是100分，GPT-5只有58分，不及格的水平。

這幫大佬的核心觀點(diǎn)是：AGI，就是一種能達(dá)到“一個(gè)受過良好教育的成年人”的能力的人工智能。
他們把心理學(xué)中一個(gè)最權(quán)威的理論，CHC 理論，給AI搬過來了。
CHC 的觀點(diǎn)，簡單來說，就是智力這玩意，不是一個(gè)單一的標(biāo)準(zhǔn)能衡量的東西，需要多維度考察。
說白了，這就和高考差不多。一門課強(qiáng)根本不夠，你得門門都強(qiáng)，才證明你厲害。

所以，他們把 AI 的能力分成了 10 個(gè)核心能力，每個(gè)占了 10% 的分。它們分別是：
(K) 通識知識、(RW) 讀寫能力、(M) 數(shù)學(xué)能力、(R) 即時(shí)推理、(WM) 工作記憶、(V) 視覺處理、(A) 聽覺處理、(S) 反應(yīng)速度、(MS) 長期記憶存儲、 (MR) 長期記憶檢索。
這里面比較抽象的，可能就是工作記憶和長期記憶了。
工作記憶，其實(shí)就是短期記憶，就是說我剛剛提過的東西，你現(xiàn)在還能記得起來；而長期記憶就是，AI通過跟我的對話，永久性學(xué)到了新東西，就像你上過學(xué)，即使你畢業(yè)了，“奇變偶不變”還刻在你DNA里一樣。。

每一種能力，他們都會叫AI測試，也就是寫他們精心準(zhǔn)備的測試題。比如(R) 即時(shí)推理這一塊，他們就專門找了些略微燒腦的問題，比如：
“David認(rèn)識張先生的朋友Jack，Jack認(rèn)識David的朋友林女士。認(rèn)識Jack的人都有碩士學(xué)位，認(rèn)識林女士的人都是上海人。所以誰既是上海人又有碩士學(xué)位？”（測試你是不是AI的時(shí)候到了）
他們找了OpenAI的兩員大將，GPT-4（2023）和 GPT-5（2025）來考試。結(jié)果，GPT-4 總分 27。 GPT-5 總分 58，合計(jì)也沒達(dá)到100分。
而且，咱來看看這成績單，有拉滿的，也有拉褲兜的，純純嚴(yán)重偏科。

比如 GPT-5，在通識(K)、讀寫(RW)、數(shù)學(xué)(M)這幾項(xiàng)上，直奔 9 分 10 分。所以說目前來看，這幾項(xiàng)是AI的強(qiáng)項(xiàng)。
而 (MS) 長期記憶存儲這項(xiàng)，GPT-5純純大光頭，3-4分的也有一堆。而GPT-4更不用說，好幾項(xiàng)都是0分。
這一項(xiàng)其實(shí)考的是， AI 能不能持續(xù)學(xué)習(xí)獲得信息。因?yàn)檎撐陌l(fā)現(xiàn)，現(xiàn)在的 AI 根本就是個(gè)健忘癥，你今天教它的東西，明天它就忘得一干二凈。

他們做測試的方法，就是第一天跟AI講一些東西，然后第二天單開一個(gè)對話，再讓AI回想。
都不用猜，包想不起來的，大伙用過都知道，新開窗口就會清空記憶，那得分不是0就怪了。。
有的人會反駁，現(xiàn)在的AI早就有永久記憶了。但文章中其實(shí)譴責(zé)了這一點(diǎn)，現(xiàn)在AI的記憶，根本不是真正的記憶，他們只是在假裝自己有記憶。
作者們把這招叫做 “能力扭曲” ，即利用某些領(lǐng)域的優(yōu)勢來彌補(bǔ)其他領(lǐng)域的嚴(yán)重弱點(diǎn)，創(chuàng)造出一種“AI真有能力”的錯(cuò)覺。像現(xiàn)在的AI記憶，其實(shí)就是在瘋狂卷上下文長度，或者通過知識庫來實(shí)現(xiàn)，實(shí)際上就是外掛，模型本身是一點(diǎn)記憶都沒有。
除了記憶力，長期記憶檢索ai們也很拉，說白了，就是檢測幻覺，別睜眼說瞎話。

當(dāng)然，還有一項(xiàng)大伙都很拉的功能，(V) 視覺處理。 GPT-4是0分，而GPT-5進(jìn)化過后，也只來到4分。
它考的不是簡單的“這圖里有啥”，考的是視覺推理。這對大模型來說，可就難多了。比如說，咱來試一道：
“下面這 4 個(gè) 2D 展開圖里，哪一個(gè)不能折成左邊那個(gè)立方體？”

還真有點(diǎn)難度，但我們?nèi)祟惿约铀妓鳎€是能做出來的。我也去求證了下Gemini，結(jié)果確實(shí)是無法戰(zhàn)勝。

這也說明，AI的眼睛和腦子，目前配合的不是很好，還沒有人類這種，邊看邊想就解決問題的能力。
當(dāng)然，這份報(bào)告，肯定還是不夠完美的。除了這十個(gè)維度，人腦還有聯(lián)想等其他難以名狀的能力，人類可太復(fù)雜了，不是幾道題就能測明白的。
但它最大的價(jià)值，是給當(dāng)下的 AI 做了一次全面診斷：AI現(xiàn)在還是瘸腿，在一些人類最基本的認(rèn)知能力上，仍然有嚴(yán)重的缺陷。
而且，現(xiàn)在的 AI 廠商會還用一些捷徑，來掩蓋這些弱點(diǎn)。
因此，這篇文章也在給大家敲警鐘：這樣搞出來的 AI，是到不了 AGI 的。
但奧特曼在前一陣的直播里還說了，AGI在路上了，我只能說，走著瞧了。

當(dāng)然，俺覺得，這套標(biāo)準(zhǔn)本身也有不小的槽點(diǎn)。
人家AGI ，憑啥非要模仿人類啊？它很可能是一種完全不同的智能。硬拿人類的 CHC 理論去套 AGI，是否有點(diǎn)刻舟求劍的意味了。
而且，這標(biāo)準(zhǔn)定得也有點(diǎn)高了。講實(shí)話，AI 要能達(dá)到一個(gè)“沒受過教育的小孩”的水平，就已經(jīng)無敵了。更別提有相當(dāng)一部分人類，自己都通不過這個(gè)測試。。
不過，不管怎么吐槽，有人提出標(biāo)準(zhǔn)就是好事。
它最大的意義，是終于把 AGI 這個(gè)話題從玄學(xué)的范疇，拉回到了一個(gè)可以討論的具體問題上。
就算這個(gè)標(biāo)準(zhǔn)不完美，它也會逼著整個(gè)行業(yè)開始思考，我們到底在追求什么，以及我們到底缺了什么。
這總比大家都在吹牛，說自己快要實(shí)現(xiàn) AGI要強(qiáng)得多。
撰文：不咕
編輯：江江&面線
美編：萱萱
圖片、資料來源：
A Definition of AGI, Arxiv
OpenAI, X，部分圖源互聯(lián)網(wǎng)

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請及時(shí)聯(lián)系我們，本站將會在24小時(shí)內(nèi)處理完畢。

同類資訊

重大突破！嫦娥六號“土特產(chǎn)”中發(fā)現(xiàn)“鐵銹”意味著什么？

微軟AI營銷用力過猛，Win11 Copilot調(diào)大字體演示出紕漏

AI重磅！英偉達(dá)，即將發(fā)布！

高德地圖：正推進(jìn)車載導(dǎo)航“鷹眼守護(hù)”功能

AI無界·萬物新生，大灣區(qū)國際創(chuàng)客峰會在深圳開幕

Win11演進(jìn)AI系統(tǒng)策略惹眾怒：微軟安撫開發(fā)者，始終傾聽反饋

全站最新

重大突破！嫦娥六號“土特產(chǎn)”中發(fā)現(xiàn)“鐵銹”意味著什么？

微軟AI營銷用力過猛，Win11 Copilot調(diào)大字體演示出紕漏

AI重磅！英偉達(dá)，即將發(fā)布！

高德地圖：正推進(jìn)車載導(dǎo)航“鷹眼守護(hù)”功能

熱門推薦

科技昨夜今晨1116：我國“準(zhǔn)航母”四川艦鋒芒初試

重大突破！嫦娥六號“土特產(chǎn)”中發(fā)現(xiàn)“鐵銹”意味著什么？

微軟AI營銷用力過猛，Win11 Copilot調(diào)大字體演示出紕漏

AI重磅！英偉達(dá)，即將發(fā)布！

香港故事｜從內(nèi)地到香港，他們一路追逐“飛行夢”

零跑汽車2025年銷量破50萬臺提前達(dá)標(biāo)

新能源重卡深向科技向港交所遞交招股書

高德地圖：正推進(jìn)車載導(dǎo)航“鷹眼守護(hù)”功能

AI無界·萬物新生，大灣區(qū)國際創(chuàng)客峰會在深圳開幕

Win11演進(jìn)AI系統(tǒng)策略惹眾怒：微軟安撫開發(fā)者，始終傾聽反饋

2025西麗湖論壇舉辦：AI驅(qū)動科學(xué)發(fā)現(xiàn)與產(chǎn)業(yè)未來新范式

隔空敲鼓、AI秒出圖！高交會這些國產(chǎn)“黑科技”太驚艷

從好萊塢特效到AI芯片的十年之約：SIGGRAPH Asia 2025登陸香港！

自主HHG技術(shù)讓國產(chǎn)EUV光源破局啟航

AI驅(qū)動的泰迪熊竟能教兒童點(diǎn)燃火柴，制造商FoloToy宣布停售