Adobe被訴用盜版書籍訓練AI模型，SlimLM陷版權風波

IP屬地中國·北京 編輯：沈如風 Chinaz 時間：2025-12-18 12:30:21

近日，俄勒岡州作家伊麗莎白·萊昂（Elizabeth Lyon）對Adobe提起集體訴訟，指控其在訓練名為 SlimLM 的小型語言模型時，使用了包含其盜版作品在內的非法數據集。
SlimLM是Adobe推出的一系列輕量化語言模型，專為移動設備上的文檔輔助任務（如摘要、改寫、問答）優化。Adobe官方稱，該模型基于 SlimPajama-627B 數據集進行預訓練——這是由AI芯片公司Cerebras于 2023 年 6 月發布的開源、去重、多來源語料庫。
然而，萊昂的訴狀指出，SlimPajama實際上是 RedPajama 數據集的衍生版本，而RedPajama又直接復制了臭名昭著的 Books3 數據集。Books3 包含約19. 1 萬本受版權保護的圖書，長期被指大量收錄自網絡盜版資源（如The Bibliotik）。訴狀強調：“SlimPajama因系RedPajama的衍生復制，故包含Books3 中的內容，其中包括原告及集體成員的受版權保護作品。”
萊昂本人是多本非虛構寫作指南的作者，其作品據稱就在被非法用于訓練的數據之列。她指控Adobe在未獲授權、未署名、未支付任何費用的情況下，將其文字用于商業AI產品的開發，侵犯了版權法賦予作者的專有權利。
這并非孤立事件。Books3 和RedPajama已成為AI行業版權訴訟的“高頻詞”：
-2024 年 9 月，Apple被訴使用Books3 訓練其Apple Intelligence；
- 同月，Anthropic就類似指控與作家群體達成 15 億美元和解，被視為AI版權案的里程碑；
-10 月，Salesforce也被指依賴RedPajama訓練其AI系統。
隨著生成式AI對海量文本的依賴日益加深，訓練數據的合法性問題正從道德爭議演變為法律雷區。Adobe此次被訴，再次凸顯了一個行業性困境：即使使用“開源”數據集，若其源頭包含侵權內容，下游開發者仍可能承擔連帶責任。
在Anthropic天價和解案的陰影下，Adobe如何應對此次訴訟，或將影響整個AI行業對訓練數據溯源與合規審查的重視程度。而對內容創作者而言，這場訴訟不僅是維權，更是對“AI時代創作價值歸屬”的一次關鍵確認。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

AI投入再加碼，消息稱理想汽車在硅谷成立新研發中心

湖南電信與華為打造全國首個2.1GHz 8T8R 45MHz連片覆蓋5G網

曝蔚來推行新渠道合作模式：用戶開店、不涉及授權，派人現場賣車

對話火山引擎譚待：多數人低估了火山拿下 AI 云的決心

理論應用 | 知識經濟遇上AI變革（上）

“天才少女”羅福莉亮相背后：曾被雷軍親自點將，能成小米新王牌？

全站最新

AI投入再加碼，消息稱理想汽車在硅谷成立新研發中心

湖南電信與華為打造全國首個2.1GHz 8T8R 45MHz連片覆蓋5G網

曝蔚來推行新渠道合作模式：用戶開店、不涉及授權，派人現場賣車

對話火山引擎譚待：多數人低估了火山拿下 AI 云的決心

熱門推薦

AI投入再加碼，消息稱理想汽車在硅谷成立新研發中心

湖南電信與華為打造全國首個2.1GHz 8T8R 45MHz連片覆蓋5G網

曝蔚來推行新渠道合作模式：用戶開店、不涉及授權，派人現場賣車

對話火山引擎譚待：多數人低估了火山拿下 AI 云的決心

理論應用 | 知識經濟遇上AI變革（上）

“天才少女”羅福莉亮相背后：曾被雷軍親自點將，能成小米新王牌？

受半導體短缺影響，本田在華工廠被曝將停產數日

不要慌！大利好，來了！

曝蘋果放棄VR頭顯，轉向AI眼鏡！附未來兩年最全產品圖

OpenAI搶灘高校：ChatGPT許可在美公立大學賣出了70萬份，全球超100萬份

歐洲頂尖神經學家感慨：這就是中國的力量…

24小時蔬菜，7日鮮蛋明天，京東七鮮石家莊首店開業，刷新“新鮮”認知

從年初到歲末國產GPU為何刮起“上市風暴”？

韓副總理：中國或成為比美國更強的AI競爭對手

報告：2025年1-10月中國新能源乘用車L2級及以上輔助駕駛功能裝車率達87%