北京人形機器人創新中心全面開源具身智能VLM模型——Pelican-VL 1.0。該模型覆蓋7B、72B參數規模,是迄今為止“最大規模的開源具身多模態大模型”,同時,也是迄今為止全球性能最強大的具身智能VLM模型。根據測試,其性能超越GPT-5 同類模型15.79% ,與Google gemini 系列模型相比提升19.25%,同時也超越通義千問、書生萬象等國內模型,成為了目前最強的開源具身多模態大模型 。
另外值得注意的是,Pelican-VL的核心主創團隊都是由女性組成,這也充分體現了女性力量在我國科技研發中的重要貢獻。該團隊還提出了一套全新的DPPO(刻意訓練)訓練範式,是全球首創的具身多模態大模型後訓練自進化算法框架。憑藉DPPO,Pelican-VL 實現【性能最強】這一目標使用的數據量為200K,僅僅是其他大模型的1/10甚至1/50,是名副其實的開源VLM性價比之王。
Pelican-VL 1.0 的開源,能夠大幅提升具身智能在商業服務、工業泛工業、高危特種作業、家庭服務等多種真實場景中,通過視覺-語言感知輔助多步任務規劃的能力。而VLM作為目前實現機器人全自主的核心,Pelican的開源也將推動我國具身智能全自主發展。
開源主頁
https://pelican-vl.github.io/
https://github.com/Open-X-Humanoid/pelican-vl