北京人形機器人創新中心開源 Pelican-VL 1.0 模型

IP屬地中國·北京 IT之家 時間：2025-11-14 08:10:30

IT之家 11 月 14 日消息，北京人形機器人創新中心昨晚宣布全面開源具身智能 VLM 模型 ——Pelican-VL 1.0。
IT之家從官方介紹獲悉，該模型覆蓋 7B、72B 參數規模，是迄今為止“最大規模的開源具身多模態大模型”，同時，也是迄今為止全球性能最強大的具身智能 VLM 模型。根據測試，其性能超越 GPT-5 同類模型 15.79% ，與 Google gemini 系列模型相比提升 19.25%，同時也超越通義千問、書生萬象等國內模型，成為了目前最強的開源具身多模態大模型。

文章稱，該團隊還提出了一套全新的 DPPO（刻意訓練）訓練范式，是全球首創的具身多模態大模型后訓練自進化算法框架。憑借 DPPO，Pelican-VL 實現‘性能最強’這一目標使用的數據量為 200K，僅僅是其他大模型的 1/10 甚至 1/50，是名副其實的開源 VLM 性價比之王。
Pelican-VL 1.0 的開源，能夠大幅提升具身智能在商業服務、工業泛工業、高危特種作業、家庭服務等多種真實場景中，通過視覺-語言感知輔助多步任務規劃的能力。而 VLM 作為目前實現機器人全自主的核心，Pelican 的開源也將推動我國具身智能全自主發展。

本次開源的 Pelican-VL 1.0 的核心優勢在于深度整合海量數據與自適應學習機制，在由 1000+ A800 GPU 組成的集群上訓練，單次檢查點訓練耗費超過 50,000 A800 GPU-小時；團隊從原始數據中蒸餾出的包含數億 token 的高質量元數據以做訓練基石。基于上述優勢，Pelican-VL 1.0 實現了在基線基礎上性能提升 20.3%，平均超過 Qwen3-VL 系列、InternVL3.5 系列等同級別開源模型 10.6%。
得益于“刻意練習”DPPO（Deliberate Practice Policy Optimization）訓練范式，Pelican-VL 就像一名刻苦鉆研的學生：每次訓練循環都會“看視頻 — 自主練習 — 發現錯誤 — 糾正提升”。通過 DPPO 模仿人類元認知的學習方式，通過強化學習（RL）探索弱點、生成失敗樣本，再進行有針對性地監督微調（SFT），讓模型不斷自我糾錯和迭代進步。
就像學生做錯題后總結經驗一樣，Pelican-VL 能在訓練中發現“薄弱知識點”并補齊，從而持續提高在視覺-語言和具身任務上的能力。通過這種機制，Pelican-VL 能夠更準確地理解圖像內容、語言指令和物理常識，最終在決策和操作執行環節中，實現了具身智能在空間-時間推理和動作規劃方面的大幅突破。

免責聲明：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其內容真實性、完整性不作任何保證或承諾。如若本網有任何內容侵犯您的權益，請及時聯系我們，本站將會在24小時內處理完畢。

同類資訊

當 AI 開始分「左右」

逆勢而行？Valve新款Steam Machine官宣，8GB顯存配置引發爭議

安謀科技發了一枚 NPU，要把 AIGC 算力提升 10 倍

AI視頻泛濫成災！平臺管控難，消費者鑒別能力日益重要？

福特總裁：美國制造業人才短缺，如果戰爭來臨谷歌造不出飛機大炮

AI時代，人如何保持精神的獨立與高貴

全站最新

當 AI 開始分「左右」

逆勢而行？Valve新款Steam Machine官宣，8GB顯存配置引發爭議

安謀科技發了一枚 NPU，要把 AIGC 算力提升 10 倍

AI視頻泛濫成災！平臺管控難，消費者鑒別能力日益重要？

熱門推薦

奔馳電動車有起火風險！車主稱召回后續航縮水只剩280公里

當 AI 開始分「左右」

我國科學家開創中性原子量子計算新架構，單原子尋址保真度達99.66%

逆勢而行？Valve新款Steam Machine官宣，8GB顯存配置引發爭議

安謀科技發了一枚 NPU，要把 AIGC 算力提升 10 倍

AI視頻泛濫成災！平臺管控難，消費者鑒別能力日益重要？

福特總裁：美國制造業人才短缺，如果戰爭來臨谷歌造不出飛機大炮

AI時代，人如何保持精神的獨立與高貴

俄宇航員在太空使用生物識別技術在線辦理業務

2026年手機屏幕影像電池全面升級，蘋果三星華為將推大折疊手機

王自如神操作！改個手機設置，就能消滅各種APP彈窗廣告？

庫克被曝最早明年讓位CEO，“蘋果AI已落后同行2年”

2025 XIN峰會開幕展示人工智能硬件生態及前沿科技

Dexmal原力靈機兩輪融資金額近10億元阿里與蔚來資本分別領投

ChatGPT愛用破折號是病，奧特曼剛宣布已經治好了