北京人形機器人創新中心近日宣布,正式開源其最新研發的具身智能多模態大模型——Pelican-VL1.0。這一舉措標志著國內在具身智能領域的技術突破邁出了重要一步,也為全球開發者提供了更強大的工具支持。
Pelican-VL1.0模型包含7B和72B兩種參數規模版本,是目前全球范圍內規模最大的開源具身多模態大模型。根據第三方測試數據顯示,該模型在多項性能指標上表現優異,不僅超越了國際領先的GPT-5同類模型15.79%,還在國內通義千問、書生萬象等知名模型中脫穎而出,成為當前性能最強的開源具身多模態大模型。
該模型的核心優勢在于其強大的視覺-語言感知能力,能夠通過多模態交互實現復雜場景下的多步任務規劃。在實際應用中,Pelican-VL1.0可顯著提升具身智能系統在商業服務、工業泛工業、高危特種作業以及家庭服務等多個領域的適應性和執行效率。例如,在工業場景中,機器人可以更精準地識別設備狀態并完成維護任務;在家庭服務中,則能更好地理解用戶需求并提供個性化服務。
此次開源不僅提供了完整的模型架構和訓練代碼,還包含詳細的文檔說明,方便全球開發者快速上手和二次開發。北京人形機器人創新中心表示,希望通過開源共享推動具身智能技術的快速發展,加速其在各行業的應用落地,為人工智能技術賦能實體經濟提供新的解決方案。











