12月17日-18日,2025全球數據技術大會在北京舉行。華為公司副總裁、數據存儲產品線總裁袁遠在會上分享了華為在數據基礎設施方面的思考與實踐。
袁遠指出,隨著Agentic AI新時代的到來,各行各業都在更加深度、全面地使用數據,使其成為AI訓練與推理的語料與知識,進而創造價值。當前,用于AI的數據量同比增長41%,數據資源共享日益活躍,更多行業和技術企業選擇進入數據市場,通過擴充數據資產的規模、精度與多樣性,在智能化競爭中實現領先。此外,高質量數據集建設提速,截至目前我國已建成超過500PB高質量數據集。AI的快速發展,在鞏固數據要素價值地位的同時,更推動傳統IT架構從“以算力為中心”向“以數據為中心”轉變。
“中國已是全球數據大國,但數據語料建設仍面臨關鍵挑戰。”袁遠同時強調,我國數據留存率僅2.8%,存在海量數據“存不下”、存儲成本高、能耗大等問題;行業高質量數據稀缺,例如我國醫療模型訓練數據量僅為西方領先國家的10%左右;數據共享率不足25%,大量數據仍存儲在“孤島”中;數據安全風險突出,全球年度泄露數據已達470余億條。
針對這些挑戰,袁遠結合《國家數據基礎設施建設指引》與華為實踐提出三點建議。
首先在城市層面,宜發揮城市樞紐作用,打造先進存力中心,推動公共數據和行業數據的匯聚、治理和可信流通,支撐城市數字經濟發展。其次在行業層面,建設數據共享協作平臺,推動數據從分散利用到智能融合,讓高質量行業知識庫賦能生態。最后在企業層面,企業作為最早開始重視、挖掘數據資產的先行者,需助力建設AI數據湖底座,加強全域數據共享、高效管理與敏捷使用。
“以自動駕駛為例,通過AI數據湖整合路測、仿真、高精地圖等多樣數據,提供百萬車輛數據高速接入、EB級數據高效管理、全球站點數據跨域流動等關鍵能力,讓環境感知、行人避讓等多智能體協同,保障極端條件與特定場景下行駛安全。”袁遠指出。
袁遠表示,先進的數據基礎設施建設離不開持續的技術創新。未來華為將加大投入,引領AI數據湖發展方向,助力各界逐步解決數據收集、存儲、治理與應用等問題,推動AI技術落地,共同釋放數據要素價值。





京公網安備 11011402013531號