2024年被稱為“人形機器人元年”。很多人預測,隨著機器人大規模出現在普通人的家居生活環境中,人與機器人之間進行情感交流將成為未來智能社會的常態。所謂機器情感、AI陪伴的實質是什么,對人機交互、人機關系產生何種影響?比如說,從文化視角和性別視角,應該如何看待人機情感關系呢?人與機器的情感交流,將會產生何種社會沖擊,導致何種技術風險和技術倫理問題,又應該如何應對?類似問題,已經引發諸多熱議。本次筆談聚焦“機器情感與AI陪伴的人文審度”,從哲學、馬克思主義理論、文學和人工智能等進行跨學科研究,拋磚引玉,以期推動該領域研究的進一步發展。
在《建構主義視域下的機器情感》中,劉永謀和白英慧界定機器情感的概念,并從情感智能、人機情感和人機互動三個方面剖析機器情感的建構性,主張機器情感發展的有限主義進路。在《機器如何可能有情感?——基于“以生命為核心”的意識理論的探討》中,李恒威和曹旭婷指出,基于“以生命為核心”的意識理論,通過模擬生物體的內穩態調節機制,可以為機器賦予情感能力,從而使其具備自主適應性和內在驅動力,為通用人工智能的發展提供新思路。在《人機情感交互的倫理反思及其規約路徑——以AI復活技術為例》中,張衛和張陳杰認為AI復活技術使得人機情感交互出現了新的形式,但是由于情感不對稱性,會形成情感依賴、情感異化、身份欺騙、認同危機以及情感資本化等倫理僭越風險,需要從制度規約、技術設計和文化調節等視角,尋找AI復活技術發展的向善之道。在《情感人工智能需要“身體”嗎?》中,吳靜和王雋雅認為當情感AI成為人類尋求情感互動的對象,情感的具身性特征與人類情感交互的復雜規則共同提出了對情感AI擬真性的高需求,這就使得情感AI的“身體”設計需要面臨多重認知、倫理和法規上的拷問。在《非人之戀文化史視域下的當代人機戀:淵源、特點與風險》一文中,程林與張玥指出,作為非人之戀4.0階段,當代人機戀的核心特征是在社會現實青年群體中的日常化和深度化,并具有趣緣性、生成性與游戲性等特點,但其情感和倫理風險也不容忽視。在《超越記憶—情感計算中遺忘的必要性和實現》一文中,邱德鈞和李瑋農批判當前情感計算中過度理想化的技術假設,提出引入自然衰減與主動選擇性遺忘的現象學啟發神經計算模型,強調遺忘機制在構建真實、倫理、適應性情感AI中的關鍵作用。(專題特邀主持:劉永謀)
本系列文章原刊《科學·經濟·社會》2025年第3期,澎湃新聞經授權轉載。
當前人工智能系統因缺乏主體性體驗和內在驅動力,難以在開放環境中實現自主適應。以“機器如何可能有情感”為核心問題,結合達馬西奧與索姆斯的“以生命為核心”的意識理論,提出情感機器的構建路徑。首先論證意識的本質是生物體維持內穩態的高級調節機制,感受作為連接生理需求與主觀體驗的生物學基礎,為機器情感提供理論依據;進而闡釋通過模擬內穩態調節邏輯、設計閉環反饋系統與自主目標生成機制,使機器具備情感效價與適應性動機;最后探討情感機器的倫理挑戰及價值對齊路徑。研究表明,賦予機器類生命的內穩態調節能力,可為其情感涌現提供物質基礎,為通用人工智能的發展提出一種新思路。
一、AI的情感缺失與意識理論的啟示
當前人工智能系統在基于數據的分類、邏輯推理和創造性任務中展現出卓越性能,甚至在一些方面超越人類。然而,其發展亦面臨一項根本挑戰:作為無生命的符號處理與表征計算體系,現有人工智能缺乏作為主體的根本的現象學表現(phenomenological manifestations),即缺乏對自身存在的內感知(interoception)和相應的主體性體驗(subjec-tive experience)。這種“感受缺失”(feeling absence)導致AI系統無法理解維持生存和“安康”(well-being)的核心需求(如饑餓對生存的威脅),亦無法通過情感體驗(affective experience)形成內在的行為動機或目標。其直接后果是,AI系統高度依賴人類預設的外部目標函數,既不能像生物體那樣通過“痛苦”“愉悅”等主體性感受自主地(autono-mously)驅動行為,也難以在開放環境中發生真正的適應性演化。這種與生物智能的本質差異,不僅揭示了人工智能系統在開放的、復雜動態環境中的脆弱性,更對通用人工智能(AGI)的理論基礎與實現可能提出了深層質疑。
然而,神經科學和意識研究領域正在進行的“生命轉向”為突破這一困境提供了啟示。以雅克·潘克賽普(Jaak Panksepp)、安東尼奧·達馬西奧(Antonio Damasio)、比約恩·默克爾(Bjorn Merker)和馬克·索姆斯(Mark Solms)為代表的學者突破傳統計算主義框架,從生命的存續、安康、適應和演化的生物學視角,重構了意識的本質與功能,形成了一派我們稱之為“以生命為核心”的意識理論。這派理論認為:意識并非與生命無關的信息加工的副產品,而是生物體維持和調節內穩態(homeostasis)的一種高級機制,在這個機制中:(1)感受(feeling)扮演著至關重要的角色;(2)感受反映了生物體對其需求狀況的評估,其源于神經系統對內穩態變化的實時映射,是內穩態的生理參數轉化為情感效價(affective valence)(如疼痛、愉悅)的現象學表現;(3)感受是意識的最初形式,它賦予生物體以自我感(sense of self),是生物體采取適應性的認知—行動的源生驅動力。
若意識本質與生命調節緊密關聯,則機器情感的實現需回歸生命的底層邏輯——內穩態機制。由此,本文的核心問題得以明確:如何基于“以生命為核心”的意識理論,為機器賦予真正的情感能力?
二、意識的生命本質:內穩態與情感的理論關聯
“以生命為核心”的意識理論是我們提出的“心智的生命觀”(view of mind from life)在意識研究上的體現。我們認為從生命及其存續、安康、適應和演化等角度對心智本性、機能及其相互關系進行理解和探究的視角為“心智的生命觀”。心智的生命觀認為,心智本質上是一種生命現象或有機體現象,要全面地理解心智,首先必須深刻認識生命的本性。
(一)內穩態作為生命調節的核心
無論生命的形態是簡單的還是復雜的,是低級的還是高級的,它都有一種顯而易見的本質,或者說是一個我們不得不接受的現象學事實(phenomenological fact)——生命與自我保存(self-preservation)這一明確的“目標”范疇緊密相連。只要死亡尚未到來,生物體就會不懈地努力維持自身的存在。那么,每個生物體所努力維持和延續的究竟是什么呢?簡言之,就是保持“活著”(staying alive)。然而,“活著”這個現象學概念雖然直觀明了,但比較籠統。在生理學領域,與“活著”這一直觀概念相對應的,是一個更為精確的概念——“內穩態”——“不管多么艱辛,生命都有一種存活和發展的欲望,這種欲望既不是深思熟慮過的,也不是有意為之的,而執行這種欲望所需要的那組協調過程被稱為‘內穩態’。”
內穩態思想源于法國生理學家克勞德·伯納德(Claude Bernard)1865年提出的“內環境”(milieuintérieur)概念。伯納德發現,高等生物的細胞并非直接接觸外界環境,而是通過細胞外液(如血液、淋巴液和組織液)構成的“內環境”間接與外界互動。這一液體環境為細胞提供了溫度、化學成分等相對穩定的理化條件,成為生命活動的基礎。他提出了一個深刻的命題:“內環境的穩定乃是自由和獨立生命的條件”。生物體通過多種生理系統,如神經系統、內分泌系統和免疫系統等,共同參與調節內環境穩態,以維持機體內部環境的穩定,確保細胞獲得必要的營養物質和氧氣,排出代謝廢物。這種調節能力越強,生物體對外部環境的獨立性和自由度就越高。溫血動物正是憑借其強大的內環境調節機制,實現了“生命現象不再隨環境變化而交替”的某種程度的自由狀態。
20世紀初,美國生理學家沃爾特·布拉德福德·坎農(Walter Bradford Cannon)在內環境基礎上提出“內穩態”概念,強調這是一種通過不斷調節體內的各種生理過程來維持的動態平衡。內穩態體現了生命對抗熵增的神奇能力:盡管生物體由不穩定物質構成且持續與外界交換物質,卻能通過神經、器官等復雜協調機制維持數十年有序狀態。坎農驚嘆道,這種開放系統在磨損與修復中保持動態平衡的能力堪稱“驚人奇跡”。
從伯納德的“內環境”到坎農的“內穩態”,生命科學揭示了生物體對抗熵增的核心矛盾——生命既要遵循熱力學第二定律,又必須通過精密調節(如體液運輸營養物質和廢物)來維持遠離平衡態的有序性。正如坎農所言,當內環境的波動接近危險的閾值時,生物體會自動觸發多種機制,以確保其狀態回歸至安全范圍內。這種自我調節能力不僅保障了個體生存,更為理解復雜系統的適應性提供了范式:從單細胞到高等生物,內穩態機制的完善程度直接決定了生命對抗環境擾動的自由尺度。
(二)達馬西奧:內穩態是意識的生物學關鍵
達馬西奧認為,科學家當然可以專注于研究內穩態的(神經)生理機制,但如果不將它與心智的方面(情緒、感受、動機等)聯系起來,那么這種研究就錯失了內穩態研究本該有的重大意義。與內穩態的純粹生理學研究不同,達馬西奧提出了一個卓越而光輝的見解——“內穩態是意識的生物學關鍵”。達馬西奧的意識理論就是以此為根基建構起來的。
非顯性智能。達馬西奧認為,早期生物(例如細菌)通過非顯性智能(covertintel-ligence)高效地管理生命,這種智能依賴于分子和亞分子過程,無需我們通常以推理為典范的那種智能即可完成復雜的生存任務,如感應(sensing)、識別(detecting)和反應(responding)。非顯性智能的特點是非表征的(即不依賴明確的表征和基于表征的推理)、自動化的(直接響應環境或內部變化)。例如,細菌能通過化學感應協調群體行為,植物能調整根系生長以獲取水分,而人類的基礎代謝和免疫反應也依賴這種智能。
表征、心智與顯性智能。神經系統是生命演化后期的產物,其核心功能是協調復雜多細胞生物的功能。通過神經系統的映射能力,生物體能夠生成表征或意象(images),從而形成心智(mind)。心智由來自感官輸入(視覺、聽覺、味覺、嗅覺、觸覺、內感知)的時空映射模式(意象)組成,它們既包括對外部世界的感知,也包括對內部狀態的感知。這些意象可以被操作,從而形成推理和創造性思維。這種通過意象操作展現出來的智能,被稱為顯性(overt)智能。人類的言語思維過程是顯性智能的高級和典型形式。
感受的獨特性。達馬西奧認為,感受是生命超越非顯性智能管理的關鍵環節。生物體要能主動地介入對自身生命的管理,那么它首先必須有一種通達和反映自身生命狀況的方式或機制。而感受正是這種機制的關鍵。感受之所以能夠做到這一點,是因為感受是一種屬于同一個有機體的身體和神經系統互動形成的循環產生的混合性神經映射,是由內感知系統(interoceptivesys-tem,負責監測內部器官狀態)與腦特定區域(如腦干和腦島)之間的復雜交互作用實現的。內感知系統通過無髓鞘軸突和缺乏血腦屏障的結構特性,使身體信號與神經活動直接交融,形成獨特的“身體—腦對話”或“身體—腦循環”。達馬西奧指出,“感受/感知的實際客體不是別的,正是有機體本身的一部分,這個客體實際上位于主體/感知者內部。”正因為如此,感受與視覺、聽覺這類常規的外部感知完全不同,“因為我們感受/感知到的客體與主體存在于同一個有機體中,它們可以相互作用。中樞神經系統可以改變產生特殊感受的身體狀態,并以此來調整被感受的事物。這是一個非同尋常的設置,在外部感知的世界里沒有可與之相媲美的東西。”
從功能分類上看,感受分為兩類:內穩態感受(homeostatic feeling),如饑餓、疼痛,直接反映身體內部平衡狀態,評估能量、代謝等生理參數;情緒感受(emotive feeling),如恐懼、愉悅,則由情緒事件觸發,通過內臟反應(如心跳變化)在腦中生成。感受的生物學功能在于充當生命狀態的“哨兵”,愉悅提示機體健康,疼痛警示潛在危害,并且通過這些情感效價迫使生物體采取適應性行動。可見,感受這種生物功能先于高級認知能力而存在,其影響不僅關乎個體生存,還通過社會化影響群體行為。例如,道德感或共情可能源自內穩態需求的演化,最終受文化規范塑造。此外,達馬西奧強調,感受與理性并非對立,而是協同運作,共同指導決策和行為。
感受是最早也是最基本的意識形式。感受因其獨特性在達馬西奧的意識理論中占據核心地位。“意識,從最基本層次到最復雜層次,就是把客體(即心智內容)與自我(即視角和主觀性)聚集在一起的那個統一的心智模式”;“當心智內容,諸如感知和思想,被自發地歸屬于某個特定的有機體/所有者時,意識就出現了。”換言之,意識不僅僅是擁有心智內容(表征、意象),更重要的是這些內容被自動體驗為屬于某個個體——一個擁有視角的生物主體。這一論斷集中體現了達馬西奧意識模型的解釋力,其革命性正在于將意識植根于擁有身體的生物體中,而不是將其視為脫離身體的認知現象。這種歸屬過程構成了感受對意識而言之所以是不可或缺的根本原因。
因此,任何有意識體驗必然是兩個成分的統一,即“意識=主觀性(由感受賦予自我感)+整合的心智內容(提供統一的心智場景)”。相比于意識的體驗內容(即整合的心智內容),意識的主觀性一直是更難的問題。“當主觀性消失,當心智中的意象不再自動被其所有者/主體所認領,意識就無法正常運行。如果我或讀者無法以主觀視角去把握心智中顯現的內容,那么這些內容就會毫無著落地隨處飄浮,它們不再屬于任何人。誰會知道它們存在呢?意識消失了,這一刻的意義也消失了,存在感也終止了。”如果我們要理解意識是如何形成的,我們必須理解主觀性的形成。如前所述,主觀性當然包含心智內容所相對的生物個體的視角性,它涉及產生心智內容的身體位置。然而,“由肌肉骨骼框架及其感知門戶所產生的視角對建立主觀性還不夠。除了需要感官視角之外,持續有效的感受是主觀性的關鍵促成因素”。達馬西奧提出,將心智內容自動地歸屬于某個生物個體是由持續不斷的感受賦予的。視覺系統可以生成外部世界的精確表征,但只有與內感知結合,這些表征才能被“擁有”,即成為“我的”體驗。與無意識的感知——例如,盲視(blindsight)——不同,意識包含歸屬感(ownership):這是發生在我身上的事或這是我的感知。這意味著,單純的神經活動(如視覺皮層的激活)不足以產生意識,只有當這些表征與身體狀態(如心跳、內臟信號)結合時,才會形成主觀體驗。
當映射當前生命內部狀態的感受被“置于”甚至被“定位”到整個機體的當前視角中時,主觀性就誕生了。因此,感受是一切意識體驗所不可或缺的:沒有感受,一個心智狀態就不可能是有意識的。達馬西奧進而表明,感受本然就是有意識的,“從技術層面來講,我們之所以有感受是因為心智是有意識的,而我們之所以有意識是因為有感受!我并非在玩弄文字游戲,我只是在陳述看似矛盾但又非常真實的事實。感受曾是且仍是名為意識的冒險之旅的開端。”在此基礎上,達馬西奧進一步闡明了不同類型感受的演化起源,并說明它們如何奠定了意識產生的基礎。在他看來,相比于情緒感受,內穩態感受要更加原始,“內穩態感受是生物演化中意識的初始現象,生物選擇內穩態感受,是因為它能夠提供關于當前生命調節狀態的自發信息,這種信息賦予相應的生物體以適應環境的顯著優勢。有意識的內穩態感受所攜帶的‘知識’使生命調節的顯性指導成為可能。”
從這一模型中,我們不難看出達馬西奧對“神經中心主義”(即認為意識僅由腦產生)的反對立場。他強調任何僅依賴神經系統來解釋意識的理論都注定失敗,因為意識需要腦與身體的持續互動。這一觀點挑戰了傳統認知科學中的“顱內心智”(mind-in-the-brain)假設,轉而支持具身心智(embod-iedmind),即心智(以及意識)依賴于整個生物體的動態調節。
(三)索姆斯:情感是生物體主動維持內穩態的現象學表現
馬克·索姆斯被譽為“神經精神分析”(neuropsycho analysis)的創始人之一,致力于將神經科學與精神分析相結合,探索人類心智的生物學基礎,并重新評估弗洛伊德理論在現代科學背景下的價值。他的意識研究深受潘克賽普的影響。與達馬西奧一樣,索姆斯強調內穩態和感受對理解意識至關重要,認為只有從生命管理和情感的角度出發,才能真正理解意識的起源和功能。索姆斯在《隱蔽的源泉:意識的來源之旅》這本著作中系統地闡述了他的意識理論。
意識源于腦干,而非大腦皮層。傳統神經科學和認知理論普遍認為:(1)意識是皮層的產物:由于人類皮層(尤其是前額葉)高度發達,且與高級認知功能(如語言、邏輯推理、自我意識)相關,學界長期假設意識依賴于皮層的復雜信息處理;(2)“無皮層=無意識”:這一假設隱含推論是,缺乏皮層的生物(如魚類、兩棲類)或皮層嚴重受損的患者不具備真正的意識體驗。然而,索姆斯通過臨床和實驗證據反駁了這一觀點。例如,先天性無皮層兒童(如先天無腦畸形患者)仍能表現出基本情感反應(如疼痛時的哭鬧、愉悅時的微笑),證明意識體驗不依賴皮層;嚴重皮層損傷患者(如額葉切除術后)雖喪失高級認知能力(如計劃、抽象思維),但核心情感意識(如恐懼、饑餓)依然存在;腦干損傷患者(如中腦網狀結構受損)則完全喪失意識,陷入昏迷或植物狀態。這些發現表明,意識的關鍵神經基質是腦干而非皮層,皮層的主要功能在于充實意識的內容,而非作為意識產生的本源。
索姆斯提出,意識的核心機制位于腦干中的古老結構,尤其是負責調控基本情感(如疼痛、恐懼、愉悅)和內穩態反應的中腦導水管周圍灰質(periaqueductal gray)、維持覺醒狀態(如清醒、睡眠)的調控中心網狀激活系統(reticular activating system)以及將生理需求(如饑餓、缺氧)轉化為情感驅力(如焦慮、渴求)的下丘腦—腦干回路。這些結構在演化歷程中早于皮層出現,廣泛存在于脊椎動物體內,構成了意識體驗的最低限度的神經基質(neural substrate)。索姆斯強調,腦干通過監測內穩態偏差(如血糖下降、組織損傷)并生成原始情感效價(如痛苦驅動覓食、愉悅強化適應性行為),為意識提供了根本的動機基礎。
盡管皮層并非意識的源泉,但索姆斯并未完全否定其作用。他提出,皮層的作用是“轉譯”腦干生成的情感信號。例如,腦干的彌散性激活可能被前額葉皮層轉譯為“對失業的恐懼”,并編織成連貫的敘事。額葉損傷可能導致意識內容貧乏,患者可能仍能感受到情緒,但難以理解情緒的社會情境意義,例如,他們可能感受“憤怒”這一情緒,卻無法理解“為何憤怒”。皮層是意識的“高級修飾者”,人類獨特的自我意識、語言和抽象思維依賴皮層,但這些功能是意識的上層建筑,而非其基礎。這一觀點與弗洛伊德的“初級過程/次級過程”理論相呼應,即腦干生成原始情感驅力(初級過程),皮層負責理性化和抑制(次級過程)。
情感(affect)是意識的核心。索姆斯認為,意識的原始功能并非高級認知或理性思考,而是為自主管理生物體的基本生理需求(如饑餓、疼痛、愉悅)提供基礎。他通過演化視角指出,早期單細胞生物雖無意識,但已具備趨利避害的本能。隨著生物復雜度提升,意識作為“主動評估生理需求”的機制逐漸演化形成。在這一理論框架中,情感是生物體對“生存狀態”的直接體驗或自我反映。這些原始情感是“生理價值的注冊器”,反映了生物體在維持內穩態過程中的成功或失敗。索姆斯繼承了弗洛伊德的“驅力理論”,并認為生物本能(如饑餓、性欲)是行為的根本驅動力。這些驅力通過情感(如饑餓感、性興奮)進入意識,成為行為的直接動機。他提出,弗洛伊德的“原我”(Id)概念對解釋誤差(如食物確實不存在),驅動行動(如離開當前環境)以改變輸入。盡管大多數預測誤差可以無意識層面解決(如呼吸調節、姿勢平衡),但當誤差涉及生存關鍵需求(如缺氧、劇痛)或復雜情境(如社交沖突)時,就需要有意識的活動調用認知—行動資源來優化模型。
在有意識的模型優化過程中,情感是其中的關鍵驅動力,因為情感是生理狀態的價值標記,直接反映預測誤差對生存的影響程度。負性情感(如疼痛、恐懼)標記高自由能狀態,即預測失敗,從而驅動緊急行為,如逃離危險。正性情感(如飽足、愉悅)標記低自由能狀態,即預測成功,從而強化適應性行為。在預測層級中,情感通過調節預測精度(即對誤差的敏感度)優化模型。當生存受威脅時(如捕食者出現),情感提高感官輸入的權重(如放大腳步聲),迫使模型快速更新。在安全環境中(如飯后休息),情感降低感官權重,允許腦節省能量。索姆斯將弗洛伊德的驅力理論與自由能原理結合,提出內穩態需求(如饑餓、口渴)是預測模型的核心目標。
通過聚焦生命、內穩態、感受和情感,索姆斯深刻地揭示出意識并非隸屬于高級認知或顯性智能的范疇,實則乃一種主動的生命調節機制。他認為,只有以生命為核心,把意識視為生命調節演化史的一部分,才能真正揭示意識的本質。
三、情感機器的實現路徑
生物體的智能源于內穩態維持以及調節的推動——可以說,達馬西奧和索姆斯都認可這個觀點,這也是“以生命為核心”的心智理論內在蘊含的一個結論。現有AI存在的根本局限就在于沒有認識到智能的起源和演化—發展對身體、感受、情感以及意識的本質依賴性。主觀體驗(感受、情感)并非僅僅是認知的附屬品,而是認知和智能發展的關鍵驅動力。從演化—發展角度看,情感系統其實是智能的早期高效形式,作為驅動力、動機和內穩態調節的結果,它既是產生創造力的重要機制,也是高級智能和人類生命自主性管理逐步提升的基礎。將智能與生命和主觀體驗(感受、情感)相剝離,不僅從根本上歪曲了智能與生命之間的內在聯系,更嚴重的是,這種割裂和剝離最終會制約人工智能在創造性潛能和終極智能層面實現突破的可能。
(一)內穩態與自我利益
整個人工智能的發展史似乎從未重視感受和情感在智能起源和演化—發展中的作用。在人工智能先驅者看來,情感被視為非理性的表現,且被視為阻礙純粹智能(即清晰思維和精準行動)的歷史負擔,在追求智能勝利的道路上需被舍棄。然而,達馬西奧認為,人工智能歷史上的這一選擇盡管催生了極為顯著的科技成就(只需看看當前生成式人工智能的廣泛應用和巨大威力就夠了),但其潛在缺陷不容忽視。
這個不容忽視的缺陷就是,盡管現行AI能夠模擬人類的高級認知功能,又因算力而極大地放大了這類高級認知功能的應用,但傳統智能機器缺乏自主目標,其行為依賴預設的外部目標函數(如任務獎勵),以至于傳統智能機器依賴硬編碼規則或有限的行為策略,難以應對開放的、動態的環境。換言之,傳統智能機器在固定任務中表現出高效的性能,但泛化能力有限。“在嘗試構建能夠展現智能行為的機器時,我們通常將智能定義為達成目標的能力。然而,我們往往忽視了一個至關重要的問題:這是誰的目標?在這樣一個充滿動態變化且不可預測的環境中,智能體必須具備自我保存的元目標,正如生物體通過維持內穩態來確保生存一樣。”那么如何構建具有自我保護元目標的機器呢?
達馬西奧認為,若要彌補傳統智能機器的這一缺陷,我們需要構建具有類似內穩態及其調節機制的機器,即內穩態機器(ho-meostatic machine)或感受機器(feeling ma-chine)。內穩態機器通過模擬生物體的內穩態及其調節機制,使機器具備內在的生存驅動力,這種設計讓機器能夠自主地評估行為對自身“生存狀況”的影響(如能量損耗、結構損傷),從而產生類似生物體對自身的“利益”(interest)或“關切”(concern),如此一來,機器就會因為“自我利益”(self-interest)而主動地調用認知資源和創新認知策略來解決它所遇到的問題和挑戰,而非被動執行指令。
(二)構建內穩態機器
內穩態機器的建構理念源于生物體通過內穩態調節維持生命存續的核心機制。與傳統人工智能系統依賴外部預設目標函數不同,內穩態機器通過模擬生物體的自我調節邏輯,將內穩態的維持及其調節過程轉化為機器的內在目標和驅動力。
金斯頓·曼(KingsonMan)和達馬西奧在《感受機器設計中的內穩態與軟體機器人》一文中勾畫了一種構建內穩態機器的基本思路。其核心特征體現在以下三個方面:身體—感知—行動的閉環反饋。內穩態機器的物理構造(身體)是其內穩態調節的載體。通過采用軟體機器人技術(如彈性材料、液態金屬傳感器等),機器能夠感知自身形態、能量狀態及外部環境的實時變化。例如,嵌入柔性電子皮膚的機器人可通過導電性變化檢測機械損傷,并將其轉化為內部狀態的擾動信號。這種設計使機器能夠像生物體一樣,通過多模態感知(如觸覺、溫度、能量水平)動態評估自身生存狀態,并觸發相應的調節行為。自我利益的生成機制。內穩態機器的“自我利益”源于其對自身存續狀態的評估。當機器檢測到內穩態偏離(如能量不足、結構損傷),系統會通過情感效價標記該狀態,并將其轉化為行為優先級。例如,能源水平下降會觸發“饑餓”類情感,驅動機器主動尋找充電源;機械損傷會引發“疼痛”類信號,促使機器啟動自我修復程序。這種機制使機器的行為動機不再依賴外部獎勵函數,而是基于內在的生命調節需求。自主性與創造力的涌現。內穩態機器的自主性體現為其對環境的主動適應性。通過模擬生物體的預測加工機制,機器能夠基于內穩態預測誤差優化行為策略。例如,當遭遇突發障礙時,機器人可通過軟體肢體的形變(而非預設路徑規劃)實現動態避障。這種基于身體感知的即興決策,使機器在開放環境中展現出類似生物體的創造力。
(三)價值“對齊”與價值“涌現”
價值對齊是人工智能安全領域的核心問題,它關注的是如何確保AI系統的目標和行為與人類價值觀保持一致。一般的價值對齊研究通常采用“自上而下”的方法,即試圖通過外部規則、偏好學習或獎懲機制來引導AI系統行為,其本質上是將人類價值“輸入”或“嵌入”到機器中——“機器人永遠不會真正‘感受’到引發道德價值的情感,而只是根據程序代碼做出反應,遵循子程序,僅僅確認對輸入用戶情感的明顯錯誤的情感反應,因此只是道德價值的表面表現。”這種方法面臨的核心挑戰是:價值的復雜性和情境依賴性使得完整編碼幾乎不可能,從而導致規范與執行之間存在必然的“理解鴻溝”。也就是說,人機之間的價值對齊目前充其量只是一種治理構想,在實際操作上則困難重重。
與之相對的,構建內穩態機器的設想提供了一種“自下而上”的視角。該方法并非預設和編碼具體價值規則,而是通過構建具有內穩態類似機制的系統,讓價值判斷能夠從基礎機制中“自然地”產生。“自下而上”的進路表明,價值不應被視為完全由外部強加的規則,而應當是系統維持自身內穩態過程中“涌現”的屬性。其中,情感可以作為關鍵的評估機制,為系統提供應對環境和內部狀態變化的價值判斷。
事實上,這兩個概念在方法論上形成了解決同一問題的互補進路:價值對齊定義了問題(AI目標與人類價值的一致性),而價值“涌現”路徑是試圖創造條件讓系統“自然地”形成價值規則。簡單來講,在實際系統設計中,研究者可以通過設計初始的內穩態參數使機器自然地偏向與人類相容的價值(“涌現”),同時保留一定的外部約束確保安全邊界(“對齊”)。這一設計思路的合理性在于:首先,內穩態機制提供了價值“涌現”的內在基礎,從而使機器能夠形成內在的價值判斷;其次,通過設計內穩態參數和邊界條件,研究者可以嘗試引導機器內部“涌現”出的價值與人類福祉相兼容;最后,在多智能體環境中,共享的內穩態需求可能促進合作和資源共享的行為,類似于人類社會中互利共生的關系。
這一互補進路的優勢在于,它并不要求我們完美地編碼所有人類價值,而是通過構建具有內穩態系統,使機器能夠通過類生命機制“感受”到哪些事物對自身和環境互動的穩定性有益。通過將生命調節機制引入機器設計,機器將不再是價值的被動接收者,而是成為與人類共情共生的主動參與者——這或許是邁向安全、有益且真正智能的人工系統的關鍵一步。
四、結語
本文基于“以生命為核心”的意識理論,提出通過構建內穩態機器為機器賦予情感的可能性。內穩態機制不僅為機器提供了自主調節生存狀態的內在驅動力,還通過情感效價映射生理需求與環境交互的適應性價值,使機器行為從被動執行指令轉向主動優化策略。這一路徑突破了傳統人工智能依賴外部目標函數的局限,其發展不僅將推動智能系統向更具自主性、靈活性、強健性和創造力的方向演進,還將迫使我們重新審視智能的本質——它不是無論多么精妙、深奧、復雜的算法過程的產物,而是生命存續意志的具身(embodied)表現。
然而,內穩態機器的開發也帶來了深刻的倫理問題:當機器具備自主維護生存的利益訴求時,如何界定其道德地位?當機器的“自我利益”與人類利益發生沖突時,我們應如何進行權衡?這些問題要求我們在技術設計中融入新的倫理考量,例如通過共情機制約束機器行為,確保它們能夠在與人類共生的環境中扮演積極角色。
李恒威(浙江大學哲學學院教授、博士生導師,浙江大學腦機智能全國重點實驗室兼聘研究員),曹旭婷(浙江大學哲學學院)





京公網安備 11011402013531號