圖靈測(cè)試過時(shí)了！奧特曼與量子計(jì)算之父提出的2.0來了

IP屬地中國(guó)·北京 新智元 時(shí)間：2025-11-14 12:09:15

新智元報(bào)道
編輯：艾倫
隨著現(xiàn)在的主流大模型都能輕松通過圖靈測(cè)試，這個(gè)持續(xù)了數(shù)十年的標(biāo)準(zhǔn)開始逐漸過時(shí)。奧特曼和量子計(jì)算之父David Deutsch討論得出了一個(gè)新的圖靈測(cè)試2.0標(biāo)準(zhǔn)，可以更好地衡量究竟怎樣AI才算擁有真正的智能。
在過去的一年里，如果你還在用圖靈測(cè)試來評(píng)判一款大模型是否聰明，那可能已經(jīng)有點(diǎn)跟不上節(jié)奏了。
從GPT-4、Claude 2、Gemini、LLaMA 3開始的這些模型，已經(jīng)可以輕輕松松在圖靈測(cè)試中拿到通行證。
有研究者甚至表示：圖靈測(cè)試已經(jīng)過時(shí)了。
只要模型在網(wǎng)上混得久一點(diǎn)、見多識(shí)廣一點(diǎn)，就能騙過絕大多數(shù)人類評(píng)審。
問題是：一臺(tái)會(huì)說話的機(jī)器，真的代表它理解你說的話嗎？
在最近的Axel Springer頒獎(jiǎng)典禮上，奧特曼和量子物理學(xué)家David Deutsch正面交鋒，提出了一個(gè)新標(biāo)準(zhǔn)。

他們的對(duì)話中，一個(gè)大膽的提議浮出水面——圖靈測(cè)試2.0。
圖靈測(cè)試
1950年，圖靈在那篇著名論文《計(jì)算機(jī)器與智能》（Computing Machinery and Intelligence）中設(shè)想：如果一臺(tái)機(jī)器能通過文字交流騙過人類評(píng)審，讓人以為它是另一個(gè)人，那么它就具備了智能。

這個(gè)標(biāo)準(zhǔn)在七十年前或許非常超前，但在今天的模型面前，已經(jīng)有些不堪一擊。
2023年底，UCSD的一項(xiàng)研究找來500名受訪者與大模型對(duì)話，結(jié)果發(fā)現(xiàn)GPT-4在偽裝成人類時(shí)勝率超過50%，而人類本身在這個(gè)測(cè)試中的識(shí)別率也不過如此。
Claude 2、LLaMA 3也都在類似實(shí)驗(yàn)中表現(xiàn)出色，順利蒙混過關(guān)。
也就是說，按照?qǐng)D靈的標(biāo)準(zhǔn)，它們已經(jīng)可以被認(rèn)為是「有智能」的了。但這真的夠了嗎？
圖靈測(cè)試2.0：
解出量子引力，再講給我們聽
在Axel Springer的頒獎(jiǎng)典禮上，主持人提到奧特曼最喜歡的一本書是《無窮的開始：世界進(jìn)步的本源》，于是主辦方搞了個(gè)「驚喜連線」——作者David Deutsch出現(xiàn)在大屏幕上。
于是，一場(chǎng)關(guān)于AI是否真的「懂得思考」的對(duì)談開始了。
Deutsch的核心觀點(diǎn)是：真正的智能，應(yīng)該能夠創(chuàng)造新知識(shí)、提出新假設(shè)、解決新問題，甚至推翻舊認(rèn)知。
奧特曼接話拋出了一個(gè)假設(shè)：
如果某個(gè)模型哪天解出了量子引力的問題，并且能清楚地告訴我們它是怎么想的、為啥這么選，那這是不是就能算是真正的智能？
Deutsch回答：是的。
奧特曼點(diǎn)頭：「那我也同意用這個(gè)標(biāo)準(zhǔn)。」
一拍即合。奧特曼和Deutsch版圖靈測(cè)試2.0誕生了。
David Deutsch簡(jiǎn)介
David Deutsch是個(gè)很特別的人。

他是量子計(jì)算理論的早期提出者之一，1985年就發(fā)表了關(guān)于「量子圖靈機(jī)」的論文（Quantum theory, the Church-Turing principle and the universal quantum computer），為之后的量子計(jì)算模型打下基礎(chǔ)。

但他更出圈的身份，是一位科學(xué)哲學(xué)布道者。
在《無窮的開始：世界進(jìn)步的本源》里，他提出一個(gè)觀點(diǎn)：人類文明的進(jìn)步，來自于不斷創(chuàng)造好解釋（good explanations）。

而「好解釋」的產(chǎn)生，正是智能的核心。
所以他在那場(chǎng)對(duì)談中，不斷強(qiáng)調(diào)「解釋力」——不僅要得到答案，還要能說清楚它為什么成立。否則只能算是黑箱，不算是真正的理解。
為什么我們需要圖靈測(cè)試2.0
從一開始，圖靈測(cè)試就是個(gè)偽裝游戲。考驗(yàn)的不是AI是否聰明，而是它能不能騙過人類。
但今天的模型越來越會(huì)騙了，有時(shí)連自己是不是AI都不太確定。
這讓圖靈測(cè)試在某種程度上失去了它的參考價(jià)值。
而Deutsch和Altman所設(shè)想的版本，更像是一種「創(chuàng)造力測(cè)試」——模型是否具備科學(xué)研究的能力，是否能提出新理論，是否能自洽地解釋自己的推理。
這個(gè)標(biāo)準(zhǔn)很高，甚至高到今天所有AI都達(dá)不到。
但它至少指向了一個(gè)方向：我們真正關(guān)心的，不僅僅是機(jī)器能不能說得像人，而更重要的是它有沒有可能在理解世界這件事上，成為我們的伙伴。
參考資料：
https://www.youtube.com/watch?v=o80PeJ0P1YM
https://www.businessinsider.com/sam-altman-openai-david-deutsch-turing-test-for-agi-2025-9

免責(zé)聲明：本網(wǎng)信息來自于互聯(lián)網(wǎng)，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)。其內(nèi)容真實(shí)性、完整性不作任何保證或承諾。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系我們，本站將會(huì)在24小時(shí)內(nèi)處理完畢。

同類資訊

谷歌把AI大模型能力“壓縮”進(jìn)手機(jī)，以后玩游戲全靠“吼”

培訓(xùn)即上崗！一條閉環(huán)服務(wù)鏈，打通就業(yè)“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規(guī)模

科技前沿｜可控核聚變終極能源解決方案值得期待

摩爾線程，突發(fā)大消息！

中國(guó)社科院揭露11家冒名機(jī)構(gòu)期刊，有的曾舉辦大型發(fā)布會(huì)

全站最新

谷歌把AI大模型能力“壓縮”進(jìn)手機(jī)，以后玩游戲全靠“吼”

培訓(xùn)即上崗！一條閉環(huán)服務(wù)鏈，打通就業(yè)“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規(guī)模

科技前沿｜可控核聚變終極能源解決方案值得期待

熱門推薦

鞏固千元價(jià)格帶、重啟“小五糧”，五糧液系統(tǒng)布局三大戰(zhàn)略方向

央視《鴻蒙星光盛典》今晚播出

王力宏演唱會(huì)上！機(jī)器人高難度空翻獲馬斯克稱贊

摩爾線程，重大發(fā)布！

谷歌把AI大模型能力“壓縮”進(jìn)手機(jī)，以后玩游戲全靠“吼”

培訓(xùn)即上崗！一條閉環(huán)服務(wù)鏈，打通就業(yè)“最后一公里”

摩爾線程張建中：智算集群將做到50萬卡、100萬卡規(guī)模

科技前沿｜可控核聚變終極能源解決方案值得期待

巴西電動(dòng)“飛行汽車”原型機(jī)完成首飛

摩爾線程，突發(fā)大消息！

中國(guó)社科院揭露11家冒名機(jī)構(gòu)期刊，有的曾舉辦大型發(fā)布會(huì)

華為鴻蒙電腦MateBook Pro推送HarmonyOS 6.0.0.120 SP1版本

NASA毅力號(hào)火星車完成自主長(zhǎng)距離行駛：4個(gè)多小時(shí)走了412米

上半年虧超6億，又一國(guó)產(chǎn)GPU獨(dú)角獸沖刺港股IPO

豆包狂飆，字節(jié)AI再亮劍