一項(xiàng)由魯爾大學(xué)波鴻分校與馬克斯?普朗克軟件系統(tǒng)研究所進(jìn)行的研究,深入分析了傳統(tǒng)搜索引擎與生成式人工智能系統(tǒng)在信息來源和信息呈現(xiàn)上的不同。研究團(tuán)隊(duì)對谷歌的自然搜索結(jié)果與四個(gè)生成式 AI 搜索系統(tǒng)進(jìn)行了對比,包括谷歌 AI 概述、帶搜索功能的 Gemini2.5Flash、GPT-4o-Search 和啟用搜索工具的 GPT-4o。這項(xiàng)研究涉及超過4600個(gè)查詢,涵蓋政治、產(chǎn)品評論和科學(xué)等六大主題,揭示了這些系統(tǒng)在處理網(wǎng)絡(luò)信息時(shí)的多樣性。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
研究發(fā)現(xiàn),AI 搜索系統(tǒng)能夠從更廣泛和不太知名的網(wǎng)站獲取信息。例如,在 AI 概述中,53% 的引用網(wǎng)站未能出現(xiàn)在谷歌搜索結(jié)果的前十名,而27% 甚至沒有進(jìn)入前100名。這說明用戶可能會(huì)看到來自較少審查或不熟悉網(wǎng)站的信息。
在信息來源的引用深度上,GPT-Tool 平均每個(gè)答案僅引用0.4個(gè)外部來源,主要依賴于其內(nèi)部數(shù)據(jù)。而 AI 概述和 Gemini 則每次查詢引用超過8個(gè)外部來源,顯示出其信息獲取的豐富性。此外,傳統(tǒng)的谷歌搜索通常限制每次查詢的結(jié)果為十個(gè)鏈接,使其信息來源更加集中。
研究還強(qiáng)調(diào),在處理當(dāng)前事件時(shí),傳統(tǒng)搜索引擎的表現(xiàn)明顯優(yōu)于 AI 系統(tǒng)。在對100個(gè)熱門話題的測試中,AI 概述僅能覆蓋3% 的查詢,而 GPT-4o-Search 覆蓋率為72%。這顯示出 AI 系統(tǒng)在最新信息更新上的不足,可能導(dǎo)致用戶接收到過時(shí)或不準(zhǔn)確的信息。
劃重點(diǎn):





京公網(wǎng)安備 11011402013531號(hào)