2月9日消息,據媒體報道,一名圖書作者對meta提起訴訟,指控該公司未經授權下載了大量盜版電子書,用于訓練其AI模型。
最新泄露的郵件顯示,meta承認下載了一個有爭議的大型數據集LibGen,其中包括數千萬本盜版書籍。

根據法庭文件,meta通過名為“安娜的檔案”(Anna's Archive)的渠道下載了至少81.7TB的數據,其中包括來自知名盜版網站Z-Library和LibGen的至少35.7TB的內容,meta還被指此前從LibGen下載了額外的80.6TB數據。
作者指出,meta的這一行為構成了非法的電子書庫種子下載,且這一數字可能只是其盜版行為的冰山一角。
作者估計,這些盜版電子書庫可能僅占meta盜版版權作品總量的0.008%,這表明meta的盜版規模可能遠超目前所揭露的。
郵件還顯示,meta公司員工也意識到其行為的法律風險,2023年4月,meta的研究工程師尼古拉·巴什利科夫在郵件中表示:“用公司的筆記本電腦下BT感覺不妥。”
到2023年9月,巴什科夫加大了抗議力度,并咨詢了法律團隊,他指出,使用Torrents意味著對文件進行“播種”,即對外共享內容,這在法律上是不允許的。
但meta仍決定繼續,并試圖通過將數據集下載到非meta服務器來避免被追溯的風險。






京公網安備 11011402013531號