“北京人形”全面開源具身智能 VLM 模型：Pelican-VL 1.0

北京人形機器人創新中心全面開源具身智能VLM模型——Pelican-VL 1.0。該模型覆蓋7B、72B參數規模，是迄今為止“最大規模的開源具身多模態大模型”，同時，也是迄今為止全球性能最強大的具身智能VLM模型。根據測試，其性能超越GPT-5 同類模型15.79% ，與Google gemini 系列模型相比提升19.25%，同時也超越通義千問、書生萬象等國內模型，成為了目前最強的開源具身多模態大模型。

另外值得注意的是，Pelican-VL的核心主創團隊都是由女性組成，這也充分體現了女性力量在我國科技研發中的重要貢獻。該團隊還提出了一套全新的DPPO（刻意訓練）訓練範式，是全球首創的具身多模態大模型後訓練自進化算法框架。憑藉DPPO，Pelican-VL 實現【性能最強】這一目標使用的數據量為200K，僅僅是其他大模型的1/10甚至1/50，是名副其實的開源VLM性價比之王。

Pelican-VL 1.0 的開源，能夠大幅提升具身智能在商業服務、工業泛工業、高危特種作業、家庭服務等多種真實場景中，通過視覺-語言感知輔助多步任務規劃的能力。而VLM作為目前實現機器人全自主的核心，Pelican的開源也將推動我國具身智能全自主發展。

開源主頁
https://pelican-vl.github.io/
https://github.com/Open-X-Humanoid/pelican-vl

發佈評論

Product

Company

Support

Company

“北京人形”全面開源具身智能 VLM 模型：Pelican-VL 1.0

發佈 評論

發佈評論