GPT-4o 打《黑神話·悟空》！AI「馬嘍」拿捏 Boss ，勝率超人類

IP屬地中國·北京 編輯：顧雨柔 AppSo 時間：2024-09-28 12:29:04

《黑神話·悟空》這個游戲就一個怪嗎？
我承認，當朋友對我發出這樣的質疑時，那一刻，我破防了。
從意識到必拿下楊戩，到必撐死虎先鋒，我只花了不到半天的時間，而如果想通關《黑神話》，我們能夠指望 AI 嗎？
翻滾閃避，拉開距離，精怪的行動盡收眼底。
時機一到，天命人猛地揮出重棍。
借助 AI 的力量，一套絲滑連招下來，Boss 被拿捏得毫無還手之力，不知饞哭多少游戲手殘黨。
阿里研究團隊最近提出了一個 VARP 智能體框架。而這個 AI「馬嘍」正是出自他們之手。
可以說，不是外掛，卻勝似外掛。
直面大圣的 GPT 們，還真不比人類差
AI 直面大圣，其實也沒那么復雜。
傳統上，游戲 AI 依賴游戲 API 來獲取環境信息和可執行的動作數據。但問題是，不是每個游戲都愿意提供開放的 API，或者即使提供，有的 API 也缺胳膊少腿，很難滿足實際需求。
而且，傳統方法也總感覺少點什么，無法完全模擬人類玩家的真實游戲體驗。
基于此，阿里研究團隊提出了一個新的 VARP（Vision Action Role-Playing）智能體框架。
VARP 智能體框架在接收輸入的游戲屏幕截圖后，通過運用一組 VLMs 進行推理，最終生成 Python 形式的代碼來操控游戲角色，包括一系列原子命令的組合，如輕攻擊、躲避、重攻擊和回血等。
VARP 包含三個知識庫：情境庫、動作庫和人類引導庫，以及兩個系統：動作規劃系統和人類引導軌跡系統。
簡單來說，動作規劃系統相當于圖書館管理員，負責從情境庫和可更新的動作庫中找出最合適的資料。
系統根據輸入的游戲屏幕截圖，挑選或生成符合當前情境的動作，然后這些動作和情境會被存入或更新到這兩個庫中。
而人類引導軌跡系統則利用人類操作數據集來提升VARP 在復雜任務中的表現，比如尋路任務和高難度戰斗任務等。
在動作庫中，「def new_func_a」表示由動作規劃系統生成的新動作，而「def new_func_h」表示由人類引導軌跡系統生成的新動作。「def pre_func」表示預定義的動作。
在上文提到的《黑神話·悟空》游戲中，研究團隊設定了 12 個任務，其中 75% 涉及戰斗，并使用包括 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 pro 等 VLMs 進行了基準測試。
結果顯示，VARP 在基本任務和簡單到中等難度的戰斗中，勝率高達 90 %。但在面對高難度任務時，VARP 的表現容易掉鏈子，整體水平仍然不如人類玩家。
此外，VARP 智能體在處理游戲中的決策時，因為依賴于視覺語言模型（VLM）的推理速度，所以不能夠實時地分析每一個游戲幀（即游戲畫面）。
換句話說，它不能像人類玩家那樣，幾乎瞬間對屏幕上發生的一切作出反應。相反，它只能每隔幾秒鐘處理一次游戲畫面，選擇一些重要的幀（關鍵幀）來進行分析和決策。
《黑神話·悟空》上線時曾被吐槽缺乏地圖，且存在大量的「空氣墻」，所以在沒有人類的輔助下，AI 也會像無頭蒼蠅一樣找不到 Boss。
生成式 AI 點燃了世界變革的火種，而在它尚未涌入大眾視野之時，普通人對 AI 更直觀的羈絆或許大多源于游戲。
在電子游戲史上，AI 遠比我們想象的重要
可能很多人都沒想到，最早一批搭上 AI 快車的游戲會是經典街機游戲《吃豆人》。
玩家勝利的前提是吃掉迷宮內的所有豆子，而看似傻乎乎的彩色鬼魂則擁有不同的追擊算法，它們會以不同的路徑和方式對玩家展開圍追堵截。
每個鬼魂的算法招數異常簡單，也缺乏任何學習能力，一旦玩家摸透了這些規律，游戲的挑戰難度便會直線下降。
1987 年推出的《合金裝備》則標志著游戲 AI 的另一個重要里程碑。
游戲中的 AI 角色開始展現出更為復雜的行為模式，并首次引入了對玩家的敵對反應機制。如果玩家被敵人發現，敵人會觸發警報系統，呼叫增援，改變巡邏路線，甚至設置陷阱。
再后來，如果粗淺地將 AI 與游戲的發展歷程用一連串標志性事件羅列出來，大致如下：
1997，IBM 的「深藍」在國際象棋比賽中擊敗人類世界冠軍，標志著 AI 在棋類游戲中的重大突破。
2004 年，《半條命 2》發布，游戲中的 AI 角色能夠進行更復雜的決策和互動，提升了游戲的沉浸感。
2011 年，IBM 的「沃森」在智力問答節目《危險邊緣》中擊敗了人類冠軍，展示了 AI 在自然語言處理和知識推理方面的進步。
2016 年，AlphaGo 在圍棋比賽中擊敗了李世石，標志著 AI 在復雜策略游戲中的重大突破。
2018 年，《荒野大鏢客 2》發布，游戲 AI 角色和環境互動水平大幅提高，提供了高度逼真的游戲體驗。
2020 年，英偉達推出了 DLSS 技術，利用 AI 加速圖形渲染，提升了游戲的性能和畫質。
置于當下的游戲環境中審視，游戲依然主打一個陪伴，而 AI 則如同一臺放大器，將這份陪伴放大了無數倍。
在今年的 CES 展會上，英偉達使用 Avatar Cloud Engine（ACE）讓游戲 NPC「活」起來，也借此火爆出圈。
在名為 Kairos 的演示中，玩家能夠與拉面店老板 Jin 進行互動。雖然 Jin 只是一個 NPC，但在生成式 AI 的幫助下，像真人一樣回答問題。
AI 與游戲的結合也總是讓人感到既愛又恨。
就拿競技類游戲來說吧，過往的做法只是生硬地調整難度，而現在則是模仿人的操作，讓游戲體驗更加真實。
支持者認為，當模擬人類的 AI 成為對手或隊友的時候，反過來也能提升因缺乏真人玩家所帶來的游戲競技感。
而弊端也正在于此，玩家的的留存率是提高了，但在系統的操控下，玩家們也逃脫不了被 AI 玩弄的漩渦。
前期豪言壯語，中期胡言亂語，后期沉默不語。
當我們熬夜通宵只為再贏一把的時候，已經很難說清楚究竟是我們在玩這個游戲，還是這個游戲在玩我們。
尤其當你意識到隊友可能是 AI 時，那種無力感就像是拳頭打在了棉花上。心里也軟綿綿的，毫無著力點。
老黃預言家！未來游戲或將由 AI 生成？
即便是代碼小白，我們也能用 AI 手搓游戲。
這放在幾年前，估計只能在夢里想想了，但生成式 AI 到來讓這一切有了落地的空間。
往小了說，創建一個 GPTs 玩起故事劇本殺，大了點說，那就是 AI 輔助生成小程序游戲，雖然互動性差點意思，但勝在畫面精美。
再往大了說，甚至未來連 3A 大作級別的游戲，都有可能直接通過 AI 渲染生成。
去年英偉達創始人黃仁勛曾預言，未來游戲中的每一個像素都將被生成，而不是渲染。當時這話說的時候，但大家可能還半信半疑。
通常，制作一款小型游戲的環境可能需要一周時間，對于工作室項目，創建游戲環境可能需要更長的時間，具體取決于設計的復雜程度。
上個月，Google DeepMind 公布了首個「AI 游戲引擎」GameNGen。
它能夠在單個 TPU 芯片上以超過 20 幀每秒的速度實時模擬經典射擊游戲《毀滅戰士》。
其工作原理是利用擴散模型實時預測每一幀，這意味著，游戲中的每一刻都是根據玩家的操作和環境的復雜互動實時生成的。
當時，英偉達高級科學家 Jim Fan 不禁感慨，被黑客們在各種地方瘋狂運行的《毀滅戰士》竟然在純粹的擴散模型中實現了，每個像素都是生成的。
再后來，類似更多成果也正在涌現。
前不久，騰訊也放了大招，推出了一款專門面向 3A 開放世界游戲的大模型——GameGen-O。
GameGen-O 能模擬各類 3A 游戲，比如《巫師 3》、《賽博朋克 2077》《刺客信條》以及《黑神話：悟空》里的角色、動態環境，以及復雜動作等，生成的游戲場景質量也很高。
為了構建數據集，下血本的騰訊搜集了超過 32000 個游戲視頻，每個視頻短則幾分鐘，長則幾小時，然后經過人工數據標注挑選了 15000 個可用視頻。
這些精選的視頻通過場景檢測被切割成片段，然后按照美學、光流分析和語義內容進行了嚴格的排序和過濾。
美國游戲開發商 Electronic Arts 最近也通過一段「從想象到創造」視頻，向業界展示了未來 AI 在游戲開發落地的美好愿景。
視頻中，玩家僅憑簡單的指令，就能使用 AI 工具創建游戲場景、角色和其他內容。
CEO Andrew Wilson 稱未來生成式 AI 可改進公司一半以上開發流程，預計將在三至五年內設計創造更大、更身臨其境的游戲世界。
AI 不僅能夠提升現有游戲的開發效率，還可能創造出全新的游戲體驗。
也許你會說，不管游戲用的是什么高大上的技術，歸根結底，好玩才是王道。
但在 GTA 6 反復跳票，遲遲不見蹤影的情況下，我們或許也會萌生一種自己動手、豐衣足食的念頭。
畢竟，如果能親手打造一個「罪惡都市」，感覺好像也還不錯。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

一屏多用：華為Mate X7 / XTs折疊屏手機“變身”智能手卡

美國一法院放行馬斯克原560億美元薪酬方案

京東七鮮石家莊首店開業爆火，現烤花邊蛋撻單日售出超1萬只！

「AI新世代」沖刺“全球大模型第一股”！智譜叩開港股大門，大模型“淘金熱”進入資本成色檢驗時刻

歐洲刑警組織最新設想：2035年有可能爆發“機器人犯罪潮”

高德上線3D收費站：全國164城全覆蓋，安全島輪廓精準還原

全站最新

一屏多用：華為Mate X7 / XTs折疊屏手機“變身”智能手卡

美國一法院放行馬斯克原560億美元薪酬方案

京東七鮮石家莊首店開業爆火，現烤花邊蛋撻單日售出超1萬只！

「AI新世代」沖刺“全球大模型第一股”！智譜叩開港股大門，大模型“淘金熱”進入資本成色檢驗時刻

熱門推薦

一屏多用：華為Mate X7 / XTs折疊屏手機“變身”智能手卡

美國一法院放行馬斯克原560億美元薪酬方案

京東七鮮石家莊首店開業爆火，現烤花邊蛋撻單日售出超1萬只！

「AI新世代」沖刺“全球大模型第一股”！智譜叩開港股大門，大模型“淘金熱”進入資本成色檢驗時刻

歐洲刑警組織最新設想：2035年有可能爆發“機器人犯罪潮”

高德上線3D收費站：全國164城全覆蓋，安全島輪廓精準還原

廣汽能源：本月將推出機械臂式自動充電，明年兆瓦超充陸續落地

事關互聯網平臺定價促銷等行為，新規更好保護消費者和經營者

OPPO Reno 15 Pro Mini參數曝光：天璣8450+1.5K高刷小直屏

Ubiquant團隊推出通用推理模型URM：讓AI像人類一樣循環思考

沒受輿論影響！俞敏洪曬東方甄選年會現場視頻，網友炸鍋了

小米HyperVL：讓手機也能擁有"火眼金睛"的AI大模型

清華大學開創性突破：讓AI能像福爾摩斯一樣"破解"假視頻的秘密

合肥工業大學團隊首創TIMAR：3D虛擬人實現真實對話交互

維也納大學團隊破解超雙曲幾何在強化學習中的訓練難題