被指在AI訓練中濫用盜版書籍，Adobe面臨集體訴訟

IP屬地中國·北京 IT之家 時間：2025-12-18 22:15:56

IT之家 12 月 18 日消息，據外媒 TechCrunch 今日報道，一項由作家 Elizabeth Lyon 發起的集體訴訟對 Adobe 發出新的指控，稱對方在訓練 SlimLM 語言模型時，使用了包括 Lyon 本人的作品在內的大量盜版書籍。Lyon 來自俄勒岡州，長期從事非虛構寫作，并出版多本寫作指導類書籍。
Adobe 方面介紹，SlimLM 是一套面向移動設備文檔輔助場景的小語言模型，其預訓練基礎為 SlimPajama-627B 數據集。該數據集由 Cerebras 于 2023 年發布，被描述為去重、多語料的開源集合。然而訴訟認為，SlimPajama 本身來源存在問題。
訴訟文件指出，SlimPajama 是在復制并加工 RedPajama 數據集的基礎上生成的，而 RedPajama 包含廣受爭議的 Books3 數據集。Books3 收錄約 19.1 萬本書籍，其中包含大量受版權保護作品。
訴訟明確指出，作為 RedPajama 的派生數據集，SlimPajama 同樣包含 Books3 內容，因此不可避免地納入了原告及其他作者的版權作品。
圍繞 Books3 和 RedPajama 的爭議，早已不止于 Adobe。此前，蘋果和 Salesforce 均因涉嫌在 AI 訓練中使用相關數據集而遭到起訴，相關案件指控企業未經授權使用受版權保護內容。
在更廣泛的行業背景下，類似訴訟正在成為常態。AI 模型對訓練數據規模的高度依賴，使數據來源問題頻頻引發法律風險。今年 9 月，Anthropic 同意向多名作者支付 15 億美元（IT之家注：現匯率約合 105.77 億元人民幣），就其訓練 Claude 時使用盜版作品的指控達成和解。該案件被外界視為 AI 訓練版權爭議的重要節點，然而行業內持續擴大的法律挑戰仍未終結。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

黑芝麻智能：快速增長背后，全維度競爭

OpenAI最強代碼模型GPT-5.2-Codex上線

存儲成本飆升沖擊全球手機市場：明年均價上漲6.9%！所有廠商出貨量下跌

最強編程模型！OpenAI發布GPT-5.2-Codex

vivo S50 Pro mini實拍：mini小直屏，長焦Live搭滿血性能鐵三角

12國外交官組團體驗阿里千問APP：60秒生成PPT驚艷全場

全站最新

黑芝麻智能：快速增長背后，全維度競爭

OpenAI最強代碼模型GPT-5.2-Codex上線

存儲成本飆升沖擊全球手機市場：明年均價上漲6.9%！所有廠商出貨量下跌

最強編程模型！OpenAI發布GPT-5.2-Codex

熱門推薦

大眾汽車歡迎歐盟放寬2035年汽車排放規則之舉

?捷達汽車科技公司成立，地方國資產業基金持股逾26%

中國成為《瘋狂動物城2》全球最大票倉

華為系具身初創企業「具腦磐石」與紐泰格科技集團達成戰略合作

寧德時代等成立國聯芯材科技公司# 注冊資本約1.7億

銀河通用機器人完成超3億美元新一輪融資

VITURE Pro在德國被禁售

康師傅飲品投資公司董事長變更

2025國內「年度字詞」為「深度求索（DeepSeek）」

奇瑞汽車等成立新產業投資合伙企業

三星首款三折疊手機Galaxy Z TriFold正式開售

十周年感恩回饋！華為WATCH 5優惠500元：售價2199元起

Mythic 融資 1.25 億美元，力圖以超高能效 AI 芯片挑戰 NVIDIA

騰訊元寶宣布支持微信一句話設置提醒

AI 刻畫時代！DeepSeek 當選“漢語盤點 2025”年度國內詞