文| 商隱社,作者 | 浩然
AI的發(fā)展給人們描繪了科技進步帶來的“詩和遠方”,但這背后卻有著巨大的能源、資源、勞動力消耗,這是AI發(fā)展的沉重現(xiàn)實。
此外,AI作為一種新型“巨機器”對人和社會的影響也被低估了。
01
谷歌在本周一表示,與 Kairos Power 公司簽署一份從多個小型模塊化反應堆購買電力的協(xié)議,以滿足發(fā)展人工智能的用電需求。
谷歌計劃買六到七個小型模塊化反應堆的電力,總計500兆瓦,首個小型模塊化反應堆在2030年之前投入使用。
而在上個月月底,微軟和星座能源公司簽署了一份為期20年的電力采購協(xié)議,計劃重啟曾因嚴重核事故而關閉的美國三哩島核電站。
1979年3月28日,三哩島壓水堆核電站的二號反應堆由于冷卻系統(tǒng)失靈,造成62噸的堆芯熔毀事故,這是人類核能發(fā)展史上發(fā)生的第一起堆芯熔毀事件。
國際上把核電站事故分為7級,切爾諾貝利和福島的核事故是唯二的兩件7級事故,而三哩島核泄露處于第5級。
星座能源在1999年買下了一號反應堆,就在發(fā)生事故的二號反應堆旁邊,后來因為經(jīng)濟效益不好在2019年關閉了。
跟微軟簽協(xié)議后,星座能源將投入16億美元對一號反應堆進行翻新,預計到2028年才開始重新發(fā)電,時間表受到監(jiān)管批準的影響。
谷歌、微軟搬出來核電站,一下子囤這么多電,主要將用來驅動AI數(shù)據(jù)中心。而且不只這兩家,其他在AI領域布局的科技大佬都在這么干。
今年3月,亞馬遜從塔倫能源公司購買了一個自帶核電供應的數(shù)據(jù)中心園區(qū);甲骨文最近也表示,正在設計1處由3個小型核反應堆供電的數(shù)據(jù)中心。
科技巨頭之所以搞得這么大,是因為AI恐怖的耗電量。
AI究竟有多耗電?
斯坦福人工智能研究所發(fā)布的《2023年人工智能指數(shù)報告》顯示,OpenAI的GPT-3單次訓練耗電量高達128.7萬度,相當于3000輛特斯拉Model Y跑滿32萬公里的耗電量。這也是120個美國家庭1年的用電量。
這還只是訓練用的電,相比后面不斷使用的環(huán)節(jié)只是小頭。
在使用環(huán)節(jié),AI每次作出回應也要大量耗電。像ChatGPT有2億多用戶,每天響應這些需求就要耗50萬度電。
大模型的參數(shù)量越大,需要處理的數(shù)據(jù)就越多,所需要的計算量就越大,而算力背后是大量的服務器、存儲設備和網(wǎng)絡設備,它們日夜不停地工作,消耗大量電能。
曾有業(yè)內人士表示,國內一線大模型的運營成本中,電費占到了總成本的50%以上。
國際能源署今年發(fā)布的報告中預測,未來三年全球對數(shù)據(jù)中心、加密貨幣和人工智能的電力需求將增加一倍以上,相當于一個德國的全部電力需求。
“我在一年多前就預測過芯片短缺,下一個短缺的將是電力。我認為明年將沒有足夠的電力來運行所有的芯片。”前段時間馬斯克發(fā)出了這樣的預警。
OpenAI首席執(zhí)行官山姆·奧特曼也表示,人工智能將消耗比人們預期更多的電力。
如果說算力是大模型的底層支撐,那電力就是算力的底層支持。能否獲得更清潔、穩(wěn)定的能源,以及AI設備能否做到效率更高、更省電,影響著AI發(fā)展的可持續(xù)性。
02
除了耗電,AI對資源也有著大量消耗。
比如對水資源的消耗。AI芯片制造過程中涉及大量的清洗和化學處理步驟,生產(chǎn)一個智能手機芯片就需要大約消耗5噸多的水。而AI超算數(shù)據(jù)中心也需要大量水來散熱,研究發(fā)現(xiàn),單是使用GPT-4生成100字文本就需要消耗多達三瓶水。
有調研估算,到2027年,全球范圍內的AI需求可能需要消耗掉66億立方米的水資源,相當于杭州西湖水量的450多倍。
還有礦產(chǎn)資源,任何高科技的起點都是能源和礦產(chǎn)。
從網(wǎng)絡路由器到電池再到數(shù)據(jù)中心,AI系統(tǒng)擴展網(wǎng)絡中的每一部分都需要礦產(chǎn)資源。
現(xiàn)代生活的很多方面都被轉移到了“云端”,但人們很少考慮這些原材料的成本。我們的工作、生活、閑暇娛樂大部分都發(fā)生在網(wǎng)絡計算架構的世界,而由云計算聯(lián)通的我們拿在手中的設備,其內核為鋰。
可充電鋰離子電池是移動設備、筆記本電腦、家用數(shù)字助理和數(shù)據(jù)中心備用電源的必需品。它們支持著互聯(lián)網(wǎng)和互聯(lián)網(wǎng)上運行的幾乎所有商業(yè)平臺。
除此之外,還有很多不可再生的礦物質參與到了AI和其他高科技發(fā)展中,包括用于iPhone揚聲器和電動汽車電機的稀土元素鏑和釹,用于士兵的紅外軍事設備和無人機的鍺,可以提高鋰離子電池性能的鈷。
參與世界科技競爭的國家都會根據(jù)自身工業(yè)要求和對供應風險的戰(zhàn)略評估,制定自己的關鍵礦物清單。

中國、美國、歐盟戰(zhàn)略性關鍵礦產(chǎn)(圖源:國際合作中心網(wǎng)站)
鋰、鍺、鈷、稀土、石墨等都位列其中,是發(fā)展新能源汽車、人工智能、云計算、光伏、信息通信等高科技不可或缺的。
像稀土,里面包含17種金屬元素,16種被用在了智能手機里,這些元素可以在彩色顯示屏、揚聲器、相機鏡頭、可充電電池、硬盤驅動器和其他許多組件中找到。
如果無法保證這些礦物的供應,包括AI在內的科技行業(yè)都將陷入停滯。這是技術發(fā)展最重要的約束條件。
很多礦產(chǎn)都分布于世界上比較偏僻或者經(jīng)濟不發(fā)達地區(qū),像玻利維亞西南部的烏尤尼鹽沼、剛果中部、蒙古國、印度尼西亞。而采礦歷來都是一件極易引發(fā)地緣政治沖突和戰(zhàn)爭的事情。
但包括AI在內的高科技發(fā)展給我們帶來了“詩與遠方”,很容易讓我們忽略構成技術“肉身”的這些原材料,背后的稀缺,以及由此帶來的沖突、饑餓和貧窮。
正如“鋰電池之父”古迪納夫所擔憂的那樣:“鋰的重要性不亞于石油等戰(zhàn)略性資源,一旦開采出現(xiàn)瓶頸,可能會跟石油一樣成為戰(zhàn)爭的導火索。”
這樣看來,高科技幾乎也可以看作是一種資源密集型的提取技術,把不可再生的礦產(chǎn)、水等轉化一些虛擬能力,期間還伴隨著環(huán)境破壞和地緣沖突。
而且,這種巨大的資源密集型基礎設施幾乎完全是私人的。
03
AI發(fā)展不僅存在能源和資源“饑渴”,還存在數(shù)據(jù)“饑渴”。
數(shù)據(jù)、算法和算力是AI大模型的三大支柱,而數(shù)據(jù)是大模型進行訓練的根基。數(shù)據(jù)集塑造了AI的認知邊界,它們決定了AI“看”世界的界限。
比如,創(chuàng)建計算機視覺系統(tǒng)的第一步,通常是從網(wǎng)上抓取成千上萬甚至數(shù)百萬張圖像,然后建立一系列分類體系來對它們進行排序,并以此作為系統(tǒng)感知可觀察事實的基礎。
如果想構建一個可以檢測蘋果和橙子圖片之間差異的機器學習系統(tǒng),首先開發(fā)人員必須收集和標記數(shù)以千計的蘋果和橙子的圖像,并基于此訓練神經(jīng)網(wǎng)絡。在軟件方面,算法會對圖像進行統(tǒng)計調查,并開發(fā)一個模型來識別兩個“類別”之間的差異。
如果一切按計劃進行,經(jīng)過訓練的模型將能夠區(qū)分它以前從未遇到過的蘋果和橙子圖像之間的差異。
但如果所有蘋果的訓練圖像都是紅色的,而沒有一個是綠色的,那機器學習系統(tǒng)可能會推斷“所有蘋果都是紅色的”。青蘋果完全不會被識別為蘋果。
因此,訓練數(shù)據(jù)集是大多數(shù)機器學習系統(tǒng)進行推理的核心。它們是AI系統(tǒng)用來生成預測基礎的主要原材料。
現(xiàn)在網(wǎng)絡上每天有不可勝數(shù)的文本、圖片、音視頻被上傳,AI參與者就開始了數(shù)據(jù)掠奪。
科技巨頭在其中占據(jù)了優(yōu)勢地位,像騰訊、字節(jié)、meta等掌握著各自的數(shù)據(jù)渠道,分享內容的人越多,他們能用來訓練大模型的力量就越大。人們很樂意免費為他們的照片貼上姓名和地點的標簽,而這種無償勞動為機器視覺和語言模型系統(tǒng)帶來了更準確的標記數(shù)據(jù)。
沒有這些數(shù)據(jù)渠道的企業(yè)就要為此付一大筆費用或者想其他辦法得到。
OpenAI就曾被報道其在未得到創(chuàng)作者授權情況下,使用Whisper語音識別工具,轉錄了超過一百萬小時的YouTube視頻內容,并將這些數(shù)據(jù)用于訓練其GPT-4模型。
但數(shù)據(jù),尤其是高質量的數(shù)據(jù)并非取之不盡的。根據(jù)去年Epoch AI人工智能預測組織的一項研究,AI公司可能在 2026年前耗盡高質量文本訓練數(shù)據(jù),而低質量文本和圖像數(shù)據(jù)的枯竭時間可能介于2030年至2060年之間。
山姆·奧特曼曾認為AI最后應當可以產(chǎn)生高品質的“人造資料”,以便高效地進行自我培訓。
但很多研究者認為,AI產(chǎn)生的數(shù)據(jù)質量太差,再用這樣的數(shù)據(jù)“喂”自己就是“自我投毒”。
對高質量數(shù)據(jù)的饑渴催生了“AI錄音員”“大數(shù)據(jù)標注師”“AI編輯”等眾包工作。
之前就有媒體報道,在一些一二線城市,互聯(lián)網(wǎng)大廠正以每次300元的價格,招募“AI錄音員”。他們的任務是為大模型提供定制化的語音數(shù)據(jù),通過錄制長達3小時的對話,幫助AI更好地理解和學習人類語言。
這300元不是那么好掙的,需要提供有充足劇情、嚴格符合規(guī)范的高質量內容,可能需要多次重復一些內容以符合要求。
事實上,AI的一個常被忽視的重大事實就是需要數(shù)量巨大的低薪工人幫助開發(fā)、維護和測試AI系統(tǒng)。比如AI錄音員,還有給數(shù)千小時的培訓數(shù)據(jù)做標記,審查可疑或有害的內容。但他們從未因為使這個AI系統(tǒng)正常運行而獲得認可。
此外,像亞馬遜的物流系統(tǒng),即便配備了大量機器人來做諸如搬箱子這樣的重活,但也需要人來配合完成機器人做不了的特殊、精細的工作,比如機器人識別不了的奇形怪狀的東西。
人去配合機器人,就要不斷適應機器人,還要按照機器的節(jié)奏,很難運用自己已有的知識或形成工作慣性。
這顯示出了AI發(fā)展初期人的改造,把人的勞動和價值之間進行脫節(jié),從而更好地配合機器,也更容易被替代。
而AI大多數(shù)訓練集是在人們不知情或未經(jīng)當事人同意的情況下構建的,像家里的智能音箱、口袋里的手機、智能手表、監(jiān)控記錄下的面部表情等,會不會也被拿來作為數(shù)據(jù)訓練AI?
機器學習模型需要持續(xù)的數(shù)據(jù)流才能變得更加準確。但機器只能漸近,永遠不會達到完全精準,這進一步推動算法從盡可能多的人身上提取信息,來為人工智能提供“燃料”。人類主體性被進一步消解。
04
寫下這么多并不是“反技術”,恰恰相反,技術給人類帶來了諸多便利,創(chuàng)造了更多可能性,使人類擺脫了諸多生存和發(fā)展難題。
但技術背后是一個涉及能源、資源、人、社會、歷史等各方面的系統(tǒng)性問題。
正如社會學家凱特·克勞福德在其所著《技術之外:社會聯(lián)結中的人工智能》中認為,人工智能既是具身的,也是物質的,由自然資源、燃料、人力、基礎設施、物流、歷史和分類構成,這些都是需要付出代價的。
但很明顯,當下人們更多追求技術的軍備競賽和技術狂歡,而忽略了技術之外的一系列問題。
尤瓦爾·赫拉利在《今日簡史》里說,19世紀工業(yè)革命興起之后,當時的社會、經(jīng)濟和政治模式都無法應對相關的新情況和新問題。封建主義、君主制和傳統(tǒng)宗教不適合管理工業(yè)大都市、幾百萬背井離鄉(xiāng)的工人,并面對現(xiàn)代經(jīng)濟不斷變化的本質。
狄更斯筆下的煤礦童工、第一次世界大戰(zhàn)和1932—1933年的烏克蘭大饑荒,都只是人類付出昂貴學費的一小部分。
現(xiàn)代文明有核武器及各種更高級的技術,破壞力也更驚人,我們只能比面對工業(yè)革命時做得更好才行。
人類的行進既充滿智慧,又是盲目的。做任何事都有代價,或許最優(yōu)的結果是效果和代價匹配,而非不計代價地奔向目標。





京公網(wǎng)安備 11011402013531號