Casey Harrell 輕微地移動自己的嘴巴,發出難以辨析的聲音。
他的第一道「題」是:
What good is that?(那有什么用?)
理想情況是,嘗試講出這句話時,Harrell 大腦產生的信號會通過腦機接口完成解碼,在屏幕上打出這幾個詞語。
第一次嘗試后,研究團隊不得不把測試停下來。

Harrell 哭了,他的妻子兼照料者 Levana Saxon 哭了,BrainGate 研究團隊哭了。
他第一次嘗試就成功了。這是因「漸凍癥(肌萎縮性脊髓側索硬化癥,簡稱 ALS)」而癱瘓并失去說話能力的 Harrell 在過去五年來第一次「說話」。
大家的情緒都很激動,測試不得不暫停一下。
無法溝通,為何是「痛中之痛」?

Casey Harrell
我感覺自己就像活在一場慢速播放的車禍之中。
Harrell 這樣形容確診漸凍癥后的生活。
這個目前仍未找到治愈方法的疾病,會讓患者失去對肌肉的控制能力,導致癱瘓、進食困難、失語,甚至無法控制呼吸所需的肌肉。
你知道自己會失去這一切,但你不知是何時。
那個感覺就是,我們完全不知道我們會在什么時候失去哪個肢體能力,特定能力又能保留多久。
我們真的就是某天突然醒來,就發現「這動不了了。從此這方面就要人幫助才行了。」
Harrell 的太太 Levana Saxon 說道。

Saxon、女兒 Aya 和 Harrell 在 2021 年的合照
和肢體癱瘓相比,讓 Harrell 更崩潰的是失去了自己的溝通能力。
剛確診時,也正好是兩人女兒剛出生的時候。Harrell 最喜歡的就是給女兒唱歌,日間能隨時現編滑稽的歌曲,描述著自己在做的事情,晚上則會唱著溫柔的小夜曲,哄女兒睡覺。
然后突然有一天,他就唱不出歌了:
我失去溝通能力的過程非常漫長,最開始是失去給女兒唱歌的能力,然后開始要不斷重復自己的話別人才能聽懂,到后面必須要有專人為我翻譯。
另一個讓他們痛心的地方,在于朋友的消失。
你無法想象,有多少人因為不想目睹這場慢動作的車禍而遠離我們。這發生在所有在面對絕癥和慢性病的家庭。
人們希望你要不就好起來,要不就死。
在 Harrell 看來,這些人離開不是因為他們是壞人,只是他們不知道自己能做什么。
當你沒法用語言和他們去聊這個問題時,情況就變得更糟糕了。
而留在身邊的人,也因無法溝通而沮喪。
Saxon 表示,自己之前近乎每天都會讓丈夫不舒服:
我會問他:「我可以移動你的手臂嗎?」
然后我會以為他說的「可以」,但實際上他說的卻是「不」。然后我就會移動他的手臂,導致全身痙攣。
Saxon 也沒法請人協助照料 Harrell,因為沒人能理解他的話。
「開箱即用」的技術,讓他得以恢復全職工作

It just works.(它就是能用。)
這句話大家應該都不陌生。它常被用于形容設計直觀易用的產品,開箱上手就能開用,沒有繁復的使用說明。
沒想到的是,今天這句話居然已經被用來形容腦機接口。
2023 年 7 月,Harrell 接受了時常長達 5 小時的手術,在其大腦的中央前回植入了 4 個 4x4mm 大小的平臺。
這些跟 M&M 巧克力豆一般大小的設備每個有 64 個電極,合計有 256 個電極,比過往研究更多,這也意味著它將得收集到更多數據。

和所有腦機接口設備一樣,除了植入大腦的傳感器外,研究團隊還需要解碼器,用來解讀傳回的數據。
我們在之前的文章也介紹過,用腦機接口來構建語言對話能力有兩種方式。
早期,這類技術多以「一個字母一個字母」的拼寫式輸出為主。
近年來,研究團隊開始采用更「自然」的輸出模式 —— 逐個完整單詞地輸出。
在這種模式下,算法會將單詞拆分成更小的語音單位音素。譬如,單詞「Hello」里就有四個音素:「HH」「AH」「L」和「OW」。
2023 年公布的兩項采用這種算法的腦機接口研究中,參與者在開始使用前都需對系統進行較長時間訓練,等于是讓算法學習患者大腦電流模式。
當時,兩位受試者的訓練時間分別為幾周和將近半年。

Pat Bennett 是 BrainGate 項目的上一位公布的受試者,她用了半年時間來訓練系統
而 Harrell 這次,則只調試了大概半小時。
在這背后,團隊在正式讓 Harrell 啟用腦機接口和解碼算法前,先將算法放一個計算模擬上去測試練習,多了這一步后,「系統從第一天就能用起來」。
當屏幕上顯示的詞語的確是 Harrell 想說的,那他就可以完成確認,并用基于他失語前的聲音素材訓練出來的人聲讀出來,完成「說話」。
更振奮人心的是,除了能快速適應外,這套腦機接口的準確率也很出色。
經過兩小時的使用,在高達 12.5 萬詞庫的前提下,腦機接口輸出的準確率依舊高達 90%。而在幾天后,識別的準確率更是升高到 97%。
這個 97% 的準確率,不僅比過往類似研究(約 75%)要高,甚至比一些手機的語音輸入文字識別率都要高。
不過,Harrell 語言的輸出速度還是比平常語速慢,每分鐘只可以說 33 個單詞,低于平常語速 160 詞/分鐘。
它已經從一個科學研究展示變成了 Casey 每天可以用來和家人朋友說話的系統。
該項目負責人 David Brandman 說道。

對于 Harrell 而言,這個技術讓他恢復了獨立溝通的能力,他不再需要依賴專門的翻譯或只能被誤解。
他的太太 Saxon 表示,Harrell 現在開始重新和好朋友聯系起來:
他們可以直接來到我們家,坐下來和他聊天。進行真正的,深入的對話。
盡管低于平常語速,但因為準確率較高,Harrell 因此開始在家里恢復了全職工作。
在患病前,Harrell 是一名氣候活動家,在 NGO 擔任高級策略師,主要工作是推動資產管理公司以投資的方式去投入環境保護。
更重要的是,現在 Harrell 也能重新和女兒溝通了。
差不多兩年了,她都沒有辦法和我溝通。
現在,我可以幫助她媽媽去教導她。我可以和她建立一個更深的關系,告訴她我在想什么。
技術的「人性」
我是他們口中的高級用戶(power user)。
每周下來,Harrell 使用腦機接口的時間長達 70 小時。值得慶幸是,這個技術在長時間運行下表現也不錯。
我們在工程和測試上做了很多工作,也加入了很多小創新,才讓它長時間運行時也能保持可靠。
BrainGate 項目成員 Nicholas Card 說道。

「雖然」現在 Harrell 可以「說話」了,但他還不「滿足」,他想念唱歌。
每天「上機」時,他都要先用一些「測試句子」來看看設備是否表現正常。
這些時候,Harrell 腦里冒出的都是歌曲。最近,他很喜歡「唱」的是美國樂隊 Chicago 的「If You Leave Me Now」:
If you leave me now, you will take away the biggest part of me.
BrainGate 也在努力嘗試將音樂重新帶回到他的生活里。

這些勇于承擔風險的「先鋒」,也在塑造著我們未來的技術。
Harrell 對唱歌的喜愛,在推動 BrainGate 在研究如何在算法中融入旋律的知識。
因閉鎖綜合癥而失去對肌肉控制的 Ann Johnson,則是加州大學腦機接口項目的受試者。
通過和 Harrell 使用類似的技術,Johnson 也能將自己的話語通過屏幕播出。和 Harrell 不同的是,她的表達配合了數字化身,她的腦信號除了會變成文字,還會成為數字化身的表情。
同樣對溝通有渴求的 Johnson,想要的不是唱歌,而是當咨詢師,用自己康復的經驗來幫助類似病人。

這種情況下,有表情有語音的表達起來會更自然。
今天,馬斯克的腦機接口公司 Neuralink 公布了第二位受試者的情況。
Alex 也在用自己的方式使用腦機接口技術。
除了和第一位受試者 Noland Arbaugh 一樣都喜歡玩游戲外,第二位受試者 Alex 原來是一位汽車檢修員,喜歡建造東西。
Alex 在習慣腦機接口后,已經開始用 CAD 軟件來設計物件,為自己的 Neuralink 充電器設計了一個支架,并真 3D 打印出來使用了。

無論是腦機接口還是 AI,它們都更像是「通用技術」,它們「進化的形態」,除了由研究人員支持外,經常也是由那些真正去使用它們的人塑造。
這些技術的「分支」背后,都是人類去連接和創造的欲望。
作者 | 方嘉文





京公網安備 11011402013531號