不得不說,生成式AI真的改變了很多東西。
作為一個沒啥藝術細胞的文科生,在生成式AI大模型出來前,我所能做到的“內容產出”,也就是揮動手指,敲擊鍵盤,讓數字信號夾雜著中文字符出現在電腦屏幕上,僅此而已。
但現在,哪怕本身對繪畫一竅不通、對樂理更是毫無理解,只要懂得提示詞的編寫,我就能夠輕松“制作”不同風格的畫作、“產出”各種流派的音樂,就連播客這種號稱“小而美”的傳播媒介,似乎也沒有那么神秘了。
3月25日,網易有道宣布有道文檔FM開啟公測。

(圖源:有道)
作為一款有聲閱讀、學習效率工具,有道文檔FM號稱支持拍照、文檔、鏈接、長文本等多形式內容一鍵轉播客,還能迅速提煉核心要點,生成簡潔明了的總結與思維導圖,讓你一眼洞悉內容主旨。
我決定幫大伙試一下,是時候看看國產AI播客到底能不能打了。
「懶狗」也能做播客
想要體驗有道文檔FM,其實還蠻簡單的。
打開自己手機上的應用商店,搜索“有道文檔FM”,看到那個像藍色氣泡的圖標點擊下載就行。
反正現在是公測階段,又不需要邀請碼啥的,我的評價是有手都會。

(圖源:)
打開應用,你會看到一些官方制作的播客示例。
我先是試著聽了一下隨應用附帶的“《日航的奇跡》:飛向天際的涅槃”,基本上就是通過生成式AI對原作進行了比較簡明扼要的剖析解讀,AI主持人能夠做到抑揚頓挫、自然停頓和模擬真人的吸氣呼氣聲,聽起來并沒有明顯的違和感。
當然了,這只是官方給出的例子,實際效果還得我們自己測試。
有道文檔FM為用戶提供了四種新建播客的方式,你可以拍照片、扔網址、扔文件,也可以只粘貼文字,需要注意的是,免費用戶上傳的文件不能超過5MB,需要開啟會員之后才能擴展到20MB。

(圖源:)
在導入文本后,有道文檔FM會提供包含文本朗讀在內的二十種播客類型供用戶選擇,不同的類型會對轉寫后的播客腳本帶來一定差異,然后可以選擇你喜歡的音色,它提供了13種男性聲線、11種女性聲線,包括新聞男聲、電臺主播、深夜電臺、元氣青梅等。

(圖源:)
為了測試轉播客的效果,我特地準備了三段不同的文本。
為啥是三段,主要是因為免費體驗次數只有三次。

第一段文本,是我早年間混跡SteamCN(今keylol)論壇所寫的文章,《CRPG簡述》,約莫著5000字左右的文本,剛好可以看一下這種亞文化內容轉寫的效果如何。
接下來,只要點一下生成,實測5000字的文本大約耗時2-3分鐘,你就能得到一個大約六分鐘的,由兩個AI主持人進行“深度探討”的中文音頻播客。
內容如下,感興趣的讀者可以自己下載聽一下:

(圖源:)
從內容上來說,有道文檔FM很會抓重點,基本能把稿件中的重要內容摘出來。
以這段播客為例,從主播A迷戀上《神界:原罪2》這款游戲作為引入,兩位AI主播圍繞著CRPG游戲類型的定義、CRPG游戲的起源以及發展過程,講得那叫一個頭頭是道。

(圖源:)
它還可以將稿件打碎,并用口語化語言,在兩人一唱一和中表達出來。
第二段文本,是我去年參加的一次群訪,采訪的對象是機械革命創始人潘春節。
嗯...這次轉化出來的播客腳本就顯得有些死板了,不知道是不是因為對專訪類內容資料不足的緣故,最終轉化出來的播客腳本,基本就是兩位AI主播在添加了一些語氣詞的情況下對原文進行復述。

(圖源:)
幸好,除了這段播客外,為了方便閱讀,有道文檔FM還在頁面上方給出了文字版,甚至還提供了AI總結和思維導圖,讓用戶能夠更有條理地抓住文本的知識點,怎么都是有用的。
第三段文本,是我在大學時撰寫的一本三流小說,第一部分約7.5萬字,正好可以測試一下有道文檔FM的“小說劇場”選項。
誒,這次轉寫時間就長了不少,等了十幾分鐘后,有道文檔FM總算是端出了一份長達35分鐘的播客內容。
從轉寫的效果來看,有道文檔FM確實能夠識別角色的行動,并將背景、對話、行動以較合理的方式拆解并講述下去,就是不清楚現在有什么BUG,導致這段播客中頻繁出現“讓我們繼續這個引人入勝的故事”這句話。

(圖源:)
每當AI主播讀到這句話,就會讓人有種從內容中被抽離出來的感覺。
除此以外,目前有道的AI播客還有一些瑕疵。
比如有些男性聲音,存在語速較慢,還無法控制語速的問題。
尤其是新聞男聲和電臺主播,男生磁性音色,再加上字正腔圓的咬字,或許會適合解說紀錄片,但在播客中就過于突兀,相聲評書的音色里甚至含有一些雜音,讓人很是出戲。
但就目前來說,有道文檔FM在內容上確實沒有毛病,聽感也算正常,最終產出的內容可能更接近于老師上課時的知識解讀。
當然了,有道自己可以也是這樣定位的。你可以對自己手頭有的資料進行學習,也可以直接用公眾號鏈接轉播客,快速吸收今日要聞和知識,借助這玩意自帶的DeepSeek,你甚至可以實現提出問題,DeepSeek給出回答,然后就能直接轉寫成播客內容吸收的體驗。
比起放空大腦的享受,它的最大價值,或許還是豐富了學習的場景吧。
AI播客起風了?
事實上,AI播客的誕生距離我們并不遙遠。
2024年9月,谷歌的NotebookLM推出了名為“Audio Overview”的功能,該功能可以將用戶上傳的內容轉換為音頻對話,由兩位AI主播進行討論,其內容流暢,音質逼真,仿佛真的有兩個人在對談。

(圖源:NotebookLM)
作為整個類型的開創者,NotebookLM可能是這類產品里最有“創造力”的,因為它生成的腳本并不會拘泥于用戶提供的內容,而是會在此之上進行相關內容的擴展,還能根據需要調整語速,男女主播吐字清晰,語音語調自然真實,在音頻播放期間用戶甚至可直接與AI主持人互動等功能。
對我們來說,這款產品最大的缺陷,估計是它只支持英文內容的生成這點吧。
不管咋說,這款產品的出現,讓人們看到了AI播客的潛力。人們不但可以用它快速消化大量信息,把長篇大論變成有趣的對話,在做家務或者開車的時候"閱讀"那些平時沒時間看的文章,甚至可以用來準備演講稿,聽聽別人(特別是AI)怎么看待你的觀點。
受此影響,在AI技術的推動下,播客制作和分發變得更加便捷,涌現出了如“Listen Notes”、“Podcastle”、“De”等熱門應用。這些平臺利用AI語音轉寫、智能剪輯和音頻增強等功能,大大降低了播客制作的門檻,使得更多人可以輕松地創建和分享自己的播客節目。
毋庸置疑的是,播客,將成為下一個AI涌入的賽道。
放在國外,這很順理成章,因為播客在歐美算是個頗具市場號召力的領域,月度收聽人數一度超過他們總人口的三分之一。
但在國內,一切大不相同,因為對中文互聯網而言,播客一直都是種小眾又有些神秘的存在,喜歡的人死心塌地,不懂的人隔著墻壁。

(圖源:抖音)
移動互聯網的普及,讓廣羅大眾早就習慣了視頻和短視頻的內容消費體系,上下滑動的手指和高速刷新的視頻流,更是讓超高速信息獲取成為了一種習以為常的事情,也使得播客這種相對“慢”的音頻形式與快節奏的互聯網顯得格格不入。
當然了,并非每個人都會沉迷于視覺帶來的感官刺激,憑借其獨特的陪伴感和深度,播客還是成功吸引了一批忠實聽眾和創作者。當你在早晚高峰的地鐵上,看到有人戴著耳機“閉目養神”,卻又時而露出神秘的笑容,那他很有可能是在聽播客。
而我,恰好也算是個播客的“消費者”。
在我看來,播客并不是什么“更為純粹和深刻的交流方式”,而是更接近于一種充分利用碎片化時間的媒介,它排除了視覺干擾,讓你在通勤、運動、打掃衛生的時候,都能找到機會沉浸在對話和敘事之中,抓住一切時間汲取感興趣的觀點。
對效率至上主義者來說,這點真的挺難能可貴的。
只可惜,國內播客節目發展的情況,可遠沒有播客愛好者們想象的那么輕松,在亞文化播客圈里頗具影響力的“機核”,甚至在近一年時間里接連撤裁了多位核心主播,變現與熱愛之間的沖突似乎正在愈演愈烈。
有道文檔FM的存在,在一定程度上算是填上了“中文AI播客”這個市場的空白,它從學習的交互形式出發,將文檔內容直接生成AI播客,給用戶提供了一種對特定知識進行大量有效輸入的方法,是一款非常適合學習的AI應用。
曾經小眾的播客,會因為被教育場景盯上而不再小眾嗎?
或許只有時間能給我們答案。
3月20日-3月23日,AWE(中國家電及消費電子博覽會) 2025 盛大開幕,海信、TCL、長虹、雷鳥、添可、追覓、云鯨、小熊、螢石、韶音、海爾、三翼鳥、九陽、科沃斯、萬和、索尼、三星、LG等巨頭重磅參展,DeepSeek掀起的AI工業化浪潮如何影響家電成重要看點,“AI家電”風起云涌,AWE 2025報道團正在全程追蹤報道,敬請關注。
AWE25 系列專題





京公網安備 11011402013531號