報道
編輯:Aeneas
谷歌NotebookLM的文字生播客功能,簡直太驚艷了。一位掃雷游戲作家聽到自己的書變成的播客后,反應是又驚又喜。想象一下那些沒人做成播客的心頭好冷門書,小編有了一個大膽的想法……
谷歌的NotebookLM功能,能迅速把文字生成播客,一經推出就引起了強烈反響。

而就在最近,一位游戲作家發現,自己出版的一本掃雷的書,竟然已經被NotebookLM生成了假的AI播客!
看到自己的書被濃縮成了兩個不存在的人之間的時長12分半的對話,作者Kyle Orland大呼:我被嚇到了!
當然,如果仔細聽,就會發現播客音頻中仍然存在不少問題,顯然它還無法取代專業播客。
但即便如此,Orland仍然感慨道:播客這樣的格式,是我們接受復雜信息的一種更吸引人、更有趣的方式。
比起基于文本的聊天機器人給我們的枯燥的回復,它顯然為生成式AI指明一個更有魅力的未來。
谷歌NotebookLM
谷歌的NotebookLM,是一年多前推出的。

根據谷歌介紹,它的功能是「作為虛擬研究助理,基于您選擇來源總結事實、解釋復雜的想法,并且為新的聯系集思廣益」。
不過就在上周,谷歌添加了「音頻概述」的功能。
一下子,NotebookLM就有了新的賣點:一篇冷冰冰的文檔,可以變成引人入勝的音頻了!

不過有趣的是,谷歌在任何地方都沒有使用「播客」這個詞,而是表示這個功能可以幫你「總結材料,在主題之間建立聯系,甚至開一些戲謔的玩笑」。
沃頓商學院教授Ethan Mollick發帖的時候,給予了這個產品正確的叫法——「播客」。

Mollick教授將這個播客評為「當前最好的AI演示」。
同時他也表示,這很令人不安。
當然,AI播客中,幻覺問題依然無法避免。
但Mollick教授表示,總結、提煉和處理多個大文檔的能力,能讓我們對AI進行事實核查,這才是它的最大價值所在。

受到Ethan Mollick的啟發,Orland決定把自己的這本書輸入NotebookLM。

他很期待,這本關于掃雷游戲的大概30000字的書,如果變成虛擬播客,會是什么樣子。
僅僅幾分鐘后,Orland就看到了文章開頭的畫面。
他身臨其境地體驗到,如果自己出現在NPR的「Pop Culture Happy Hour」節目,或者受邀出現在一個戲謔風的播客節目中,會是什么樣子。
AI主持人開始瞎編了
Orland發現,NotebookLM的摘要,涵蓋了自己這本書的主要部分——
激發掃雷靈感的游戲的史前史;20世紀90年代,專注于商業業務的微軟為Windows Entertainment Pack展開的艱苦戰斗;掃雷預裝在數百萬臺企業和政府計算機上而引發的道德恐慌;以及圍繞游戲競爭場景的種種令人驚訝的作弊爭議。
總的來說,任何一個聽到這個播客的人,都可以大致了解我這本書的內容,就跟許多真實的播客一樣。
雖然在這篇假播客中,并沒有出現大面積的幻覺,但還是有一些地方在小細節上出了紕漏,或者直接給出文本中不支持的假設。
比如,例如,在討論掃雷游戲的前身Mined-Out 時,AI播客說:「所以這就是那些方塊和旗幟開始發揮作用的地方......」

然而,Mined-Out并沒有這兩個功能,全是AI瞎編的。
顯然,如果我們需要使用NotebookLM的摘要播客去了解學術文章或新聞報道,如果出現類似的幻覺,或者漏掉書中一些關鍵部分,會很勸退。
不過,我們可以使用這種摘要獲得一些「克里夫筆記」式的東西,對于那些我們沒有時間或者沒有興趣完整閱讀的大部頭書,它還是很有吸引力的。

而且,跟閱讀「克里夫筆記」不同,這種簡潔的播客風格可以提供一種令人愉快的背景噪音,非常適合外出散步或辦事時聽。
AI,忽然溫情了起來
正是這種自然、詼諧的演示,讓NotebookLM 的新功能從其他能生成文本摘要的AI產品中脫穎而出。
Orland表示,這感覺就好像自己碰巧在咖啡館偷聽到兩個人在討論自己的書。
然而,這兩個人在現實中并不存在。
而且,他們對這本書表現出的贊揚態度,可能也是通過算法而設計好的。

開始,一位「播客主持人」將這本書描述為來自「軟盤和撥號調制解調器之國」的故事。
如此有趣的表達,作者并沒有在書中使用過,AI的這種幽默讓他捧腹大笑。
接著這位主持人調侃著講出「比爾·蓋茨在微軟辦公室里偷偷溜達」,暗示了作者在書中最喜歡的佚事。
隨后,這兩位假主持人以一種很自然的對話,探討了這樁佚事。
主持人1:當你自己的CEO暗自著迷時,很難否認某件事的影響。
主持人2:等等,我們是在談論比爾·蓋茨嗎?

兩人「播客」格式的來回對話風格,也允許一些有趣但偏離本書要點的話題出現。
比如,當討論《掃雷》前作《Mined-Out》中的蠕蟲電影明星遇險少女時,這兩位AI主持人似乎有點心煩意亂。
主持人1:我想問,蟲子還主演什么電影?
主持人2:恐怕細節已經消失在游戲歷史的塵埃里了。
然后,兩位「主持人」以一種隨意的方式提出了掃雷的改進版本,該版本是為了解決微軟原版掃雷的問題而設計的。
主持人1:所以最終社區想出了一個更優雅的解決方案。
主持人2:讓我猜一下。他們創造了新版本的掃雷。
主持人1:沒錯。
主持人2:舊的一天就到此為止了。
兩人的對話形式中,呈現出了一種溫和、輕松的節奏,但呈現出的信息是很密集的。
而且,聽起來很自然的停頓和重復,也能幫助強調一些要點。
比如,主持人1談到「幾乎每臺計算機上都預裝了這款令人難以置信的上癮的益智游戲」,另一個聲音就會回答,「在每臺計算機上?」
或者,某位主持人談到「我們發現最初的掃雷游戲在生成隨機棋盤的方式上存在缺陷」,另一個聲音就會跳出來驚呼「一個缺陷!」
氣氛組的勁兒是給足了。

當然,兩位AI假人的對話還是有一些問題。
比如,兩個聲音似乎一直在「我讀過這本書」和「我對你分享的書中事實感到驚訝」這兩種感覺之間來回橫跳,這就很難讓人相信其中任何一個是真誠的。
而過于驚訝的反應,也會讓人因為厭蠢而有點惱火。
另外,AI還會在錯誤的地方斷句,或者出現一些奇怪的笑聲。
盡管如此,它依然令Orland驚喜。
他舉例說,比如在某些時刻,它引出某些事的方式,微妙地迎合了他的作者自我意識,這讓他非常受用。
最后Orland總結道,在聽完NotebookLM的總結后,自己會想象到這不久的將來,這些假播客將成為自己的「正餐」。
尤其是那些那些不太容易引起真人播主興趣的專業書籍或主題。
通過將生成式AI文本重新包裝成「兩個人聊天」的模式,谷歌為有時似乎非人性化的技術,換上了一層和藹可親的面孔。
參考資料:
https://arstechnica.com/ai/2024/09/fake-ai-podcasters-are-reviewing-my-book-and-its-freaking-me-out/





京公網安備 11011402013531號