為訓練AI不擇手段！Meta被曝下載數十TB盜版電子書

IP屬地中國·北京 編輯：馮璃月快科技 時間：2025-02-09 11:01:21

2月9日消息，據媒體報道，一名圖書作者對meta提起訴訟，指控該公司未經授權下載了大量盜版電子書，用于訓練其AI模型。
最新泄露的郵件顯示，meta承認下載了一個有爭議的大型數據集LibGen，其中包括數千萬本盜版書籍。
根據法庭文件，meta通過名為“安娜的檔案”（Anna's Archive）的渠道下載了至少81.7TB的數據，其中包括來自知名盜版網站Z-Library和LibGen的至少35.7TB的內容，meta還被指此前從LibGen下載了額外的80.6TB數據。
作者指出，meta的這一行為構成了非法的電子書庫種子下載，且這一數字可能只是其盜版行為的冰山一角。
作者估計，這些盜版電子書庫可能僅占meta盜版版權作品總量的0.008%，這表明meta的盜版規模可能遠超目前所揭露的。
郵件還顯示，meta公司員工也意識到其行為的法律風險，2023年4月，meta的研究工程師尼古拉·巴什利科夫在郵件中表示：“用公司的筆記本電腦下BT感覺不妥。”
到2023年9月，巴什科夫加大了抗議力度，并咨詢了法律團隊，他指出，使用Torrents意味著對文件進行“播種”，即對外共享內容，這在法律上是不允許的。
但meta仍決定繼續，并試圖通過將數據集下載到非meta服務器來避免被追溯的風險。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

浩云長盛彭軼峰：兼容并蓄和系統性思維是應對IDC行業急速迭代的生存法則

硅谷還在Vibe Coding，中國AI搶先！一句話做應用能不能賺錢？

一場“無人”的馬拉松 | 兩說

OpenAI被曝正尋求千億美元融資，估值或達7500億美元

新華視點｜全鏈發力逐夢星空河南打造商業航天產業“星”征程

上海國際網文周發布出海報告：拉美市場崛起，全球市場格局重塑

全站最新

浩云長盛彭軼峰：兼容并蓄和系統性思維是應對IDC行業急速迭代的生存法則

硅谷還在Vibe Coding，中國AI搶先！一句話做應用能不能賺錢？

一場“無人”的馬拉松 | 兩說

OpenAI被曝正尋求千億美元融資，估值或達7500億美元

熱門推薦

Gemini3Flash 正式面向 Perplexity Pro 與 Max 用戶開放

字節跳動推出 TRAE CN 企業版，助力高效編程

浩云長盛彭軼峰：兼容并蓄和系統性思維是應對IDC行業急速迭代的生存法則

硅谷還在Vibe Coding，中國AI搶先！一句話做應用能不能賺錢？

自研視頻生成大模型全球受追捧，國產AI視頻服務加速全球化進程

美銀：印度已成全球最活躍AI大模型市場，龐大年輕人口淪為硅谷“試驗田”

一場“無人”的馬拉松 | 兩說

OpenAI被曝正尋求千億美元融資，估值或達7500億美元

新華視點｜全鏈發力逐夢星空河南打造商業航天產業“星”征程

菜鳥聯手天貓超市加碼淘寶閃購

上海國際網文周發布出海報告：拉美市場崛起，全球市場格局重塑

華為MatePad 11.5平板2026款現身官網，最高12GB+256GB規格

全球首款商用2nm手機芯片：三星Exynos 2600規格再曝

郭明錤：AI危機倒逼蘋果激進創新

“特斯拉延期交付機器人是卡在靈巧手上，中國靈巧手遙遙領先”