文 | 追問nextquestion
在當今人工智能的浪潮影響下,AI生成技術已成為創意產業的一大助力。劇本創作和廣告文案編寫等創作者如今面臨著一個關鍵的選擇:是否應該借助先進的人工智能模型,來激發和豐富他們的創意創作?
近日Science Advance上發表的一項研究給出了讓人喜憂參半的回答。盡管人工智能能顯著提升個體的創造力,它卻可能產生較為平庸、缺乏獨創性的創意輸出。該研究結果強調了人工智能在創意寫作中的潛力和風險,有助于理解大模型應用對人類行為及其社會文化所帶來的沖擊。

?Doshi, Anil R., and Oliver P. Hauser. "Generative AI enhances individual creativity but reduces the collective diversity of novel content." Science Advances 10.28 (2024): eadn5290.
問題:如何評估創意?
生成式人工智能技術,現如今能夠在文本(例如 ChatGPT)、圖像(例如 Midjourney)、音頻(例如 Jukebox)和視頻(例如 Pictory)中產生看起來有創意的內容。雖然之前的研究已證明人工智能能與人類合作開發故事情節,但這種合作是否真的能激發靈感,還是僅僅將創作者的思維限制在AI提供的范例之內,進而限制創意的飛揚,目前的研究還相對匱乏。
而在評估創造力時,我們通常從兩個維度進行考量:新穎性和實用性。新穎性衡量一個想法與現狀或常規期望的偏離程度,是衡量故事的原創性和稀有性的關鍵指標。而實用性則關注想法與預期目標的契合程度,涵蓋了故事或文案對目標受眾的適應性,以及其形成系列產品(書)的可能性和商業化(出版)概率。

?圖2.實驗設計流程圖,圖源:論文。
在該研究中,研究人員在線招募了293名參與者,并要求他們撰寫一個簡短的八句話故事。為了探究大模型在創意寫作中的作用,參與者被隨機分配到三個組別:一組未接受任何人工智能提示(僅人類組)、一組獲得一個由大模型產生的想法,以及一組獲得五個由大模型產生的想法。為評估這些故事的創造力,研究人員又另外在線招募了600名評估者,他們在不知情的情況下,根據實用性、新穎性和幾個情感維度對參與者寫的故事進行了打分。
發現:個體創意增加,群體多樣性降低
研究發現,人工智能生成的創意可以作為人類思維的跳板,提供潛在的起點,引發多樣的故事情節發展,形成一種“樹狀結構”。相較于未接受大模型提示的組,使用5條提示的參與者獲得了最大的創造力收益,他們的故事在新穎性方面的得分高出8.1%,在實用性方面高出9%(圖2A)。

?圖2.對比沒有大模型輔助的人類寫作(基線)及具有1條或5條大模型產生的想法的組間平均評估結果
此外,通過讓參與者在寫作前進行發散性思維任務——列出10個完全不同的詞匯,研究人員評估了參與者的內在創造力。研究發現,對于創造力本身就很高的參與者,人工智能提供的創意幾乎不影響其故事的創造性。然而對于創意不足的參與者,人工智能的幫助顯著降低了他們作品的單調性,減少了15.2%。
之后研究者通過Open AI提供的文本嵌入,計算故事間的相似度,結果發現接受人工智能創意提示的參與者之間的故事相似性增加了10.7%,其變化和多樣性也更少。這表明,盡管人工智能輔助可以提高個體的創造力,但它也可能在群體層面導致參與者創意之間的雷同,進而減低集體的新穎性,減少了創意的多樣性。

?圖3.對比三組生成的故事的組間相似度,以及與大模型給出提示的相似度概率密度分布,峰越尖說明組內相似度越高。
討論
無獨有偶,今年2月發表于Scientific Reports的論文則從流暢性、獨創性和詳細程度考察了GPT-4的發散性思維,得出了類似的結果。
GPT-4在所有發散性思維的測量維度上都會優于人類參與者。特別是在控制了回答流暢性之后,GPT-4在原創性和詳細程度上的表現尤為突出。但相較于人類,GPT-4在回答中使用了更高頻率的重復詞匯,且在詞匯選擇上更為集中。這與本研究所表現出的集體新穎性降低是一致的。

?Hubert, K.F., Awa, K.N. & Zabelina, D.L. The current state of artificial intelligence generative language models is more creative than humans on divergent thinking tasks.Sci Rep14, 3440 (2024). https://doi.org/10.1038/s41598-024-53303-w
大模型如何影響人類獨特行為特征——創造力?基于目前的研究,我們可以明確的說,生成式AI輔助的創意寫作確實可以增強個人的創造力,但同時也存在關鍵風險:集體創造力的新穎性可能因此受損。
如果出版業接受更多受AI啟發的生成式內容,這些內容將在整體上可能變得越來越雷同,進而失去創作者個體的獨特性。這里存在一個可能的惡性循環,即一旦個別作家認為AI輔助的寫作提高了他們的創造性,那他們可能會更有動力且更頻繁地依賴此類技術,這反過來又可能削弱整體文學作品的創新性。
當然,目前的實驗設計仍然存在缺陷,研究者只是于在線平臺招募了非專業寫作者志愿參與實驗,參與者沒有獲得額外經濟刺激。拿到生成式人工智能提示的參與者獲得的是實驗中根據提示詞模板產生的,而非寫作者自由與ChatGPT對話。寫作任務也只是完成短短8句不需要考慮復雜因果關系的短篇故事寫作,這些都和現實中的創意創作不符合。此外,鑒于該研究基于西方文化背景,其結果是否適用于中國文化仍有待驗證。
總而言之,雖然人工智能將為創意產業帶來了巨大潛力,但如何平衡其利與弊,確保技術的健康發展,將是我們不可回避的挑戰。那么,知曉了實驗結果的你,將會如何選擇?





京公網安備 11011402013531號