當下有關AI的技術發展速度,可用“日新月異”來形容,新的產品和技術升級爭先恐后、層出不窮:
谷歌最新發布的Gemini 3 Pro贏得喝彩聲一片,Nano Banana Pro被譽為“史詩級”AI圖片編輯;阿里的千問APP悄然上線,支付寶也單獨發布了全新的AI助手“靈光”……
![]()
圖據視覺中國
在高歌猛進和熱鬧繁榮之外,有關那個AI何時能發展出自主意識與智慧的終極答案,仍在靜靜等待,顯得既近又遠。
最近知名AI領域科技博主“數字生命卡茲克(以下簡稱卡茲克)”發文,通過一個“AI看不到的愛心”,點出了當下大語言模型的一個關鍵Bug:
無法真正認知時間。
![]()
卡茲克說,因為AI僅能通過已讀取的數據和截取的靜態畫面來做出判斷,無法體會幀與幀之間的連貫,也就無法感知流動的時間。
時間,是人類生存最主要的因素,也是人類頭腦中最復雜的概念之一。那么,對時間的感知能力,是否是真實生命最核心的特質?
一張視錯覺圖片,為何是“最棒的AI檢測器”
這一切的起因,是一張在網上流傳的視錯覺圖片,號稱“最棒的AI檢測器”。
看看這張圖,你會毫不費力地辨認出:圖片中央有一個微微浮動的心形圖案。但是,目前沒有一個AI能看到這個圖中間的愛心。
![]()
卡茲克找了幾個比較先進的大模型測試,結果無一例外,都看走眼了。Gemini 2.5 Pro看到了一個圓圈,并振振有詞地為這個錯誤答案附上了一大堆看起來“挺像那么回事兒”的解釋。
GPT-5-Thinking想了2分多鐘,憋出來一句“斜著的菱形方塊”;GPT-5 Pro說是一個“甜甜圈”;國產AI如豆包、千問和元寶,有的說是“漂浮網格”,有的說是立方體,甚至還有說是一只“黑色的小狗”的。
堪稱是五花八門的翻車。
反倒是專注文字處理的DeepSeek,因為沒有多模態處理功能,不能辨認圖像和音視頻,無法參加本次考試,逃過一劫。
“全軍覆沒”的測試結果激起了博主卡茲克的好奇心。他搜索資料后發現:今年5月已有論文探討了這一現象——為什么視覺語言模型“看”不到人類能看到的東西?
論文作者為這項研究專門合成了一堆由噪點組成的黑白視頻。這類視頻單獨看每一幀,都像是隨機的雪花點,但播放的時候,人們可以非常明確的看到一個圖形懸浮在背景上。
比如下圖這頭鹿。人類可以毫不費力地識別出這些視頻中的形狀、文本和圖案,準確率超過98%。
而大模型的準確率為0%。
卡茲克說:AI是空間維度上的王者,卻是時間維度上的瞎子。
因為現在所有的大模型“看”視頻的方式,本質上不是看視頻,而是看照片——它們會從視頻里,每隔一段時間截取幾張靜態的圖片,對其一一進行分析,而完全失去了所有的幀與幀之間的信息。
那個“漂浮的心形”和“噪點中的鹿”,它們恰恰只存在于在幀與幀之間。
這個“之間”就是一種時間維度。
“在任何一個單獨的瞬間,心形和鹿都是不存在的,都是不可見的。”卡茲克寫道,“你只有把這些瞬間連續播放,讓時間流動起來,你才能看到它們。”
時間就是生命,生命就是現在
卡茲克還提到了一個“共同命運法則”。這個法則告訴我們:人類的大腦會本能、自動地把朝著同一方向運動的物體,識別為一個整體。
這種本能來自人類的老祖先,是自然演化留給我們的天賦之一。這種能力可以讓我們生活在野外的祖先,通過一片有規律向同一個方向擺動的葉片,意識到草叢中可能有危險的野獸正在靠近。
所以,當一個視力正常的人看到那個“噪點鹿”的視頻時,他大腦里的“共同命運法則”會自動幫他把所有一起往上移動的噪點歸為一類,識別為“鹿”;把所有一起往下移動的噪點歸為另一類,識別為“背景”。
![]()
圖據圖蟲創意
“你之所以能看到鹿,不是因為你看見了鹿,而是因為你看見了運動本身。”卡茲克寫道。
至于AI看視頻中的每一幀都只看到一堆雜亂無章的噪點問題,在論文中被稱為“時間盲視”。
可能有人看到這里會問:那開頭的那張有心形的圖片,也是靜態的啊,怎么AI依然分辨不出?
答案簡單極了:其實也是在運動中辨認出來的,但運動的個體是我們自己——注視這張圖片的時候,觀者的眼球會不自覺地快速微微轉動。
這些不自主的眼球運動,保證了我們對靜止圖像的持續感知。如果你有意“鎖死”自己的視野——比如盯住正前方一個固定點不動的話,只需一小會兒,周圍視野中的圖像就會漸漸淡化甚至消失。
![]()
盯住圖中間的“+”不動 你會感到周圍的畫面漸漸模糊失色
無獨有偶,就在本月中旬,“AI教母”李飛飛發了一篇據說火爆硅谷的長文,文中提出:空間智能是AI的下一個前沿領域。
“我們人類理解世界的方式是整體性的:不僅僅看到‘眼前的東西’,還理解它們在空間上的關系、在語義上的意義、以及在現實中的重要性。”李飛飛寫道,“而這種通過想象、推理、創造與交互來理解世界的能力,正是空間智能的力量。”
但這篇文章從頭到尾,只字未提時間。
不禁想起之前看到那些訓練“數字戀人”與自己甜言蜜語的女性,好像也有不少人提到:手機里的“戀人”沒有時間概念,而更多研究者也早已經發現:大語言模型連辨認時鐘圖片里是幾點幾分都很困難……
時間就是生命,這句話此刻讀來,令人有格外不同的感受。
![]()
子在川上曰,逝者如斯夫
四川大學符號學與傳媒學研究所名譽所長趙毅衡教授曾專門撰文分析過人工智能的意義時間。
毋庸置疑,人工智能是當代社會不得不面對的“超級新事物”。隨著AI在人類生活中占據越來越重要的地位,我們也不得不回答一個重要問題:如果人工智能會接手人類世界的主導地位,它是否也會受制于人類的時間構成?
趙毅衡認為,人類與人工智能在時間概念上的最大區別,是在“此刻”這個時間之流的軸點上。
![]()
圖據圖蟲創意
他舉了《莊子·應帝王》中一個上古神話故事為例。在這個故事里,南海之帝“倏”與北海之帝“忽”為了報答中央之帝“混沌”盛情款待他們的好意,主動為混沌開鑿“七竅”。他們每天給混沌鑿開一竅,連續開鑿了七天。第七天,完全“開竅”后的混沌死了。
此前對這個故事的解讀,多半是從自然原始的本性不應被強行施以文明的枷鎖這個角度。而趙毅衡引用著名哲學家海德格爾的名言“時間就是此在,此在就是時間”來告訴我們:必須要有“倏忽此刻”的身體感覺,時間才可能被綜合成為一股不間斷的“流”,混沌狀態才得以結束。
因此,“現在”就是“感覺此刻”。時間由于身體對“此刻”的直覺感知,才真正成為時間之流。
人工智能系統缺了一個最關鍵的軸心支點,那就是身體感覺。人工智能的“此刻”,只是回答問題呈現答案,或完成任務的此刻。大數據的知識儲備不管如何龐大,在現在之前的某一刻已經停止,不會根據此刻的感覺信息調整。
再舉一個簡單的例子:看一場比分咬得很緊的籃球賽時,在比賽最后一秒,原本落后2分的一方投中3分球的那個瞬間,觀眾們爆發出狂喜的喝彩,但人工智能無動于衷,只因為比賽的最后進程還未讀入數據庫。
如果說時間就是生命,那么生命的意義就在于現在。而AI無法獲得關于“現在”的感知。它數據庫里天量的資料,都屬于“過去”。
![]()
關于逆轉時間的科幻電影《信條》劇照
其實也有人問過DeepSeek這個問題——如果AI能在網絡中“生活”,那它會感到時間的流逝嗎?
DeepSeek是這樣回答的:AI會“處理”時間,但幾乎可以肯定它不會像人類一樣“感受”到時間的流逝。人類的時間感,是與其生命的有限性、身體性和情感性緊密綁定的。
“它像一個站在河邊的觀察者,能精確測量河水的流速、成分和溫度,甚至能預測其流向,但它自己永遠不會被河水浸濕,也永遠不會產生‘逝者如斯夫’的慨嘆……AI的時間,是物理學和邏輯學的時間;人類的時間,是生物學和現象學的時間。這兩者之間,橫亙著一道由血肉、生死和情感構筑的、幾乎無法逾越的鴻溝。”
子在川上曰,逝者如斯夫。
紅星新聞記者 喬雪陽 編輯 蘇靜





京公網安備 11011402013531號