在WAVE SUMMIT深度學習開發者大會上,百度正式推出文心大模型X1.1版本。這款基于文心4.5訓練的深度思考模型,通過迭代式混合強化學習框架實現了顯著升級,在事實準確性、指令遵循能力和智能體交互水平三大維度分別提升34.8%、12.5%和9.6%。
新模型展現出強大的復雜任務處理能力。在創意寫作場景中,它能精準調用內置知識庫和聯網搜索工具,生成結構嚴謹、文辭優美的內容;面對共享單車用戶的情緒化咨詢時,模型可自動規劃解決方案并調用工具,在短時間內完成完整服務流程。權威評測顯示,該模型整體性能超越DeepSeek R1-0528,在部分任務上達到國際頂尖水平,與GPT-5和Gemini 2.5 Pro持平。
配套生態建設取得突破性進展。飛槳文心生態已聚集2333萬開發者,服務76萬家企業。現場發布的"AI助老公益計劃"頗受關注,通過百度搜索或小度智能健康屏即可使用的"AI助老智能體",為老年群體提供便捷的數字化服務。同時推出的"文心導師·星耀計劃"匯聚了48%的十年以上行業專家和41%的專業技術人員,構建起高質量的數據指導體系。
在數字人技術領域,百度推出的劇本驅動多模協同方案引發行業關注。該技術整合語言、聲音和形象生成模塊,實現動態交互與深度思考的融合。在慧播星平臺的實際應用中,數字人主播已展現出超越真人的帶貨能力,羅永浩數字人直播首秀即創下行業GMV新紀錄,部分品類銷售量超過真人主播。
框架層面,飛槳v3.2版本通過計算優化、并行策略和容錯機制三大升級,將ERNIE-4.5-300B-A47B模型的預訓練效率提升至47% MFU。該版本實現92%的類CUDA芯片算子復用率,并兼容Safetensors權重體系,顯著降低部署成本。配套推出的FastDeploy部署套件,使大模型在50ms時延下達到57K tokens/秒的輸入吞吐量。
科研領域迎來兩項重要突破:PaddleCFD和PaddleMaterials科學計算套件可提升流體力學與材料科學的研發效率;GraphNet計算圖數據集提供2700余個標準化模型圖,填補AI編譯器測試基準空白。現場開源的ERNIE-4.5-21B-A3B-Thinking思考模型,在內容創作、邏輯推理等任務中表現優異。
開發工具鏈持續完善。文心快碼3.5S版本強化多智能體協同能力,實現"一人即團隊"的開發模式。目前該工具已服務超千萬開發者,百度內部45%的新增代碼由AI生成,頭部用戶的AI代碼產出比例更高達75%。中國科技館聯合發布的智能體矩陣,聯動全國28家科技館資源,推動科普服務智能化升級。





京公網安備 11011402013531號