軟件巨頭 Adobe 近日面臨一項擬議的集體訴訟,指控其在訓練人工智能模型時非法使用了受版權保護的盜版書籍。
俄勒岡州作者伊麗莎白·里昂(Elizabeth Lyon)代表受影響群體提起訴訟,稱 Adobe 在開發其名為 SlimLM 的輕量級語言模型時,使用了包含她作品在內的盜版書籍數據集。
訴訟指出,SlimLM是在開源數據集 SlimPajama-627B 上進行預訓練的。該數據集被指控包含了臭名昭著的 Books3 子集,其中收錄了約 19.1 萬本未經授權的電子書。
Adobe 并非唯一受災的巨頭。此前,Apple、Salesforce 以及 Anthropic 等公司也因使用 RedPajama 或類似包含 Books3 內容的數據集而陷入法律糾紛。模型用途:被指控的SlimLM模型主要用于移動設備上的文檔輔助任務優化。
目前,Adobe 尚未對此訴訟發表正式評論。隨著 AI 技術大規模應用,此類關于訓練數據合規性的法律博弈正成為行業轉折點的關鍵。





京公網安備 11011402013531號