
字節跳動回應了“實習生破壞大模型訓練”相關傳聞。
近日,有傳聞稱:“字節跳動的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據稱遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元。”
10月19日,字節跳動回應稱:“確有商業化技術團隊實習生惡意干擾團隊研究項目的模型訓練任務,該實習生已被辭退,但這并不影響商業化的正式項目及線上業務,也不涉及字節跳動大模型等其他業務。網傳‘涉及8000多卡、損失上千萬美元’嚴重夸大。”
另外,字節跳動澄清,“經核實,涉事人一直在商業化技術團隊實習,并沒有AI Lab實習經歷。其社交媒體個人簡介及部分媒體報道有誤。”
澎湃新聞記者了解到,該事件實際發生在今年6月底,實習生田某某為國內某高校在讀博士生,于2021年9月起在字節實習,因對團隊資源分配不滿,利用HF(huggingface)的漏洞,在公司的共享模型里寫入破壞代碼,導致模型的訓練效果忽高忽低,無法產生預期的訓練效果,而且AML團隊無法核查原因。在消息曝出后,該名涉事實習生試圖在社交平臺上辟謠,將責任甩給他人,不過很快便遭到了接近字節跳動人士的否認。
字節已成為國內大模型戰場上角逐的強勁力量。據第三方數據,基于豆包大模型打造的豆包APP月活用戶數在上半年已達到2752萬,是第二名的2.43倍,已成為國內最活躍的AIGC類(生成式人工智能)應用產品。
此前5月15日,字節正式發布豆包大模型,主力模型在企業市場的定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業便宜99.3%,震撼業內,不少競爭對手紛紛跟進,引發大模型行業集體性的降價趨勢。
澎湃新聞首席記者 范佳來 實習生 姚桐
澎湃新聞





京公網安備 11011402013531號