,8月3日消息,據(jù)外電報道,在OpenAI推出SearchGPT大約一周后,一些頂級新聞出版商明確表示,他們不想與這家初創(chuàng)公司的新搜索引擎有任何關(guān)系。
《紐約時報》和至少 13 家其他新聞網(wǎng)站已屏蔽 OAI-SearchBot。這是一個網(wǎng)絡(luò)爬蟲,用于索引信息,以便 OpenAI 可以檢索并向 SearchGPT 用戶顯示相關(guān)結(jié)果。
Originality.ai跟蹤了這些內(nèi)容,發(fā)現(xiàn)排名前 1,000 位的網(wǎng)站出版商中有 14 家已經(jīng)屏蔽了 OAI-SearchBot。名單上的其他出版物包括《連線》、《紐約客》、《Vogue》、《名利場》和《GQ》。
Originality.ai 首席執(zhí)行官喬恩·吉勒姆 (Jon Gillham) 表示,這有點(diǎn)令人費(fèi)解。
「我不確定為什么出版商會屏蔽它。」他告訴《商業(yè)內(nèi)幕》。「這是出版商想要和需要的流量。」
OpenAI 上周發(fā)布 SearchGPT 時強(qiáng)調(diào),OAI-SearchBot 不會爬取網(wǎng)絡(luò)來收集數(shù)據(jù)來訓(xùn)練其GPT-5等 AI 模型。它建議網(wǎng)站所有者允許新機(jī)器人確保您的網(wǎng)站出現(xiàn)在搜索結(jié)果中。
如果無法爬取每個網(wǎng)站的權(quán)限,OpenAI 的 SearchGPT 服務(wù)就有可能不如谷歌的搜索引擎完善。BI 詢問 Gillham 是否有任何大型新聞出版商屏蔽了谷歌的搜索機(jī)器人,他說他不知道有哪個新聞出版商這么做了。
缺乏信任或?qū)λ阉髁髁看嬉?/p>
OpenAI 還有另一個網(wǎng)絡(luò)爬蟲,名為 GPTbot,它可以收集在線數(shù)據(jù)用于 AI 模型訓(xùn)練。數(shù)百個網(wǎng)站已經(jīng)屏蔽了它。這更有意義:你想要來自搜索引擎的流量,但你不想放棄你的內(nèi)容來訓(xùn)練可能與你競爭的 AI 模型。
然而,OpenAI 多年來一直在未經(jīng)許可的情況下收集在線數(shù)據(jù)。當(dāng) OpenAI 表示其新搜索機(jī)器人不會秘密竊取他們的內(nèi)容作為 AI 訓(xùn)練數(shù)據(jù)時,出版商可能只是不信任它?
「我認(rèn)為是這樣。」吉勒姆說。
另一種理論是:如今的搜索結(jié)果并不總是會將用戶引導(dǎo)到那些努力創(chuàng)建原創(chuàng)內(nèi)容的網(wǎng)站。新人工智能搜索引擎的目標(biāo)之一是通過向用戶展示摘要來留住用戶。如果出版商不再看到來自搜索引擎的大量流量,為什么還要允許他們的網(wǎng)絡(luò)爬蟲呢?
來自紐約時報的投訴
吉勒姆還指出,OpenAI 今年一直忙于與出版商達(dá)成協(xié)議,以使用他們的內(nèi)容檔案。(Business Insider 母公司 Axel Springer簽署了其中一份協(xié)議。)
吉勒姆補(bǔ)充道:這似乎是 OpenAI 有意采取的一系列措施,首先與出版商搞好關(guān)系,簽署所有這些合作協(xié)議,然后宣布 SearchGPT。
出版商中最大的反對者是《紐約時報》。它已起訴 OpenAI 和微軟,指控這兩家科技公司非法使用其成果來制造競爭產(chǎn)品。
《紐約時報》發(fā)言人查理·施塔特蘭德 (Charlie Stadtlander) 在一份聲明中表示:未經(jīng)明確書面協(xié)議,無論我們是否阻止或限制任何特定機(jī)器人抓取我們的內(nèi)容,《紐約時報》均不會授權(quán)將我們的作品用于生成搜索或人工智能訓(xùn)練目的。
《紐約時報》在針對 OpenAI 和微軟的投訴中談到了搜索引擎變得更加人工智能化并可能從出版商那里吸走流量的問題。
該出版商在訴狀中寫道:被告還使用微軟的 Bing 搜索索引,該索引復(fù)制并分類了《紐約時報》的在線內(nèi)容,生成的響應(yīng)包含《紐約時報》文章的逐字摘錄和詳細(xì)摘要,這些文章比傳統(tǒng)搜索引擎返回的內(nèi)容長得多,也詳細(xì)得多。被告的工具未經(jīng)《紐約時報》許可或授權(quán)就提供《紐約時報》內(nèi)容,破壞并損害了《紐約時報》與讀者的關(guān)系,剝奪了《紐約時報》的訂閱、許可、廣告和聯(lián)屬收入。
OpenAI 尚未回應(yīng)置評請求。






京公網(wǎng)安備 11011402013531號