滾動資訊

當前位置：首頁 > 資訊 > 人工智能 > 正文內容

VLA模型：具身智能的突破與挑戰

時間：2025-06-03 18:00:01 來源：ITBEAR編輯：快訊團隊 IP：北京 發表評論無障礙通道

在具身智能領域，視覺-語言-動作模型（VLA）作為一種新興范式，正逐漸嶄露頭角。該模型通過整合視覺信息、語言指令和行動決策，顯著提升了機器人對復雜環境的理解和適應能力，為機器人從單一任務執行向多樣化場景自主決策的轉變提供了強大支持。VLA因此成為學術界和工業界的研究熱點。

近期，雷峰網與AI科技評論GAIR Live品牌聯合舉辦了一場線上圓桌沙龍，主題為“具身智能之VLA的實踐與突破”。此次沙龍由北京大學計算機學院助理教授仉尚航主持，并邀請了清華大學交叉信息院的助理教授高陽、趙行，以及北京大學人工智能研究院的助理教授楊耀東，共同探討VLA的最新進展和未來方向。

沙龍上，仉尚航首先引導討論了VLA的定義、起源及其與其他相關模型的區別。隨后，各位嘉賓深入分析了VLA的技術路線和新成果，探討了不同技術路線的優缺點，并圍繞機器人常見任務，剖析了核心技術瓶頸和主流輸出范式。還討論了強化學習與VLA的結合、泛化能力的提升、異構數據的利用以及協同訓練等議題。

高陽指出，推理與數據是當前VLA面臨的兩大核心挑戰。盡管已有不少研究探索了VLA與推理的結合路徑，但尚未找到最優方案。同時，VLA的數據量級遠不及訓練大語言模型（VLM）的數據，且多樣性嚴重不足，這限制了模型的能力提升。趙行表示，VLA在實際應用中的系統運行頻率單一化問題，以及高低頻自適應閉環系統的設計，仍是未解決的課題。楊耀東則提到，當前VLA訓練存在割裂問題，大腦（VLM）和小腦（底層策略模型）多分開訓練，缺乏端到端訓練及類似人類大小腦的雙向交互。

在討論VLA的前世今生時，高陽回顧了VLA的起源和發展，指出其源于大模型的技術變革。楊耀東則從大模型視角和行為動作決策控制視角闡述了VLA的重要性。趙行則分享了GPT-4發布對其研究方向的啟發，以及VLA在解決長尾問題上的潛力。

對于VLA的技術路線和最新進展，高陽提到了架構與數據兩方面的進展，并強調了數據多樣性的重要性。楊耀東從模型架構角度分類了VLA，并探討了行為動作空間的表征方式。趙行則關注雙系統設計，并介紹了不同團隊在VLA方面的研究成果。

在探討VLA的核心技術瓶頸時，高陽強調推理和數據的挑戰，趙行提到高低頻自適應閉環系統的設計難題，楊耀東則指出端到端訓練和測試時計算閉環的缺乏。對于強化學習與VLA的結合，嘉賓們一致認為這是VLA發展的必由之路，但仍面臨許多未解問題。

在數據使用方面，高陽強調數據的多樣性比絕對數量更重要，并介紹了千尋智能如何利用互聯網數據優化VLA模型。楊耀東則提出，互聯網數據雖然豐富，但信噪比低，且對具體任務的適用性有限。趙行則認為，仿真數據可以作為真實數據的補充，通過技術手段縮小sim to real gap。

對于VLA的泛化能力，嘉賓們提出了多種提升策略，包括利用大量互聯網數據進行聯合訓練、創新模型架構、實現具身認知等。在探討VLA與本體構型設計的關系時，嘉賓們認為VLA模型與機器人本體沒有必然綁定，但硬件局限和VLA能力需相互匹配。

最后，關于VLA是否能完成長程任務，嘉賓們持不同觀點。高陽認為，先通過VLM拆解任務再由VLA執行是更實際的方法。楊耀東則強調VLA具備完成長程任務的潛力，并指出需賦予模型推理能力和測試時計算閉環。趙行則提出，需先定義和評測推理能力，再探索VLA在長程任務中的應用。

在落地場景方面，嘉賓們一致認為工業場景是VLA最先落地的選擇，但也提到了商業領域和ToBC模式等新場景的可能性。

此次圓桌沙龍為觀眾帶來了VLA領域的深入洞察和前沿思考，對于推動VLA技術的發展和應用具有重要意義。

舉報 0 收藏 0 打賞 0評論 0

更多>同類資訊

OpenAICEO提醒：ChatGPT雖火，但人工智能不可全信

奧特曼強調，“因此，這項技術不應該被無條件地信任。”奧特曼特別提醒用戶，在使用這類生成式AI工具時，應保持一定的批判思維和驗證意識。這些變化雖然提升了用戶體驗和商業可持續性，但也帶來了新的隱私和數據安全挑戰。…

06-30

OpenAI首席執行官提醒：人工智能雖好，但需警惕無條件信任

奧特曼強調，“因此，這項技術不應該被無條件地信任。”奧特曼特別提醒用戶，在使用這類生成式AI工具時，應保持一定的批判思維和驗證意識。這些變化雖然提升了用戶體驗和商業可持續性，但也帶來了新的隱私和數據安全挑戰。…

06-30

奧爾特曼提醒：ChatGPT非萬能，用戶需謹慎對待人工智能

IT之家 6 月 30 日消息，在 OpenAI 官方播客的首期節目中，OpenAI CEO 奧爾特曼表示，許多用戶對 ChatGPT 過于信任，這種現象值得警惕。他指出，這些新特性也帶來了新的隱私隱憂。但如…

06-30

AI人才爭奪戰升級：Meta豪擲千金，行業格局面臨重塑

06-30

OpenAICEO提醒：ChatGPT雖好，但勿盲目信任人工智能技術

06-30

奧爾特曼提醒：ChatGPT雖好，但請勿過度信賴人工智能

06-30

Intel高層再洗牌：首席戰略官離職，新CEO陳立武加速內部改革

06-30

奧爾特曼提醒：ChatGPT非萬能，用戶需謹慎對待人工智能

IT之家 6 月 30 日消息，在 OpenAI 官方播客的首期節目中，OpenAI CEO 奧爾特曼表示，許多用戶對 ChatGPT 過于信任，這種現象值得警惕。他指出，這些新特性也帶來了新的隱私隱憂。但如…

06-30

博雷頓自動駕駛礦卡即將發布，無人駕駛技術開啟礦山實用主義新篇章

06-30

馬斯克Neuralink新突破：腦機接口助力盲人重見光明在望

孟加拉國《金融快報》28日稱，該公司透露目前已經有7名失去活動能力的受試者接受了腦機接口植入手術，并“最快在2026年有望讓盲人復明”。據介紹，目前已經有7名因為損傷或疾病失去活動能力的受試者接受了腦機接口植…

06-30

百度文心大模型4.5系列全面開源：10款模型引領AI技術創新

06-30

魔搭社區：匯聚7萬模型，賦能1600萬開發者，打造中國AI開源新生態

06-30

全球首發！國家能源集團“擎源”大模型引領發電行業智能新篇章

06-30

AI搜索時代：大語言模型偏好與傳統SEO策略不謀而合

06-30

中國海洋科技新突破：OceanGPT（滄淵）大模型正式發布

06-30

點擊查看更多 +

全站最新

特斯拉V4超充登陸中國：雨天無憂，兼容多品牌車輛

2025款歐拉好貓煥新上市：經典與潮流碰撞，重塑純電出行體驗

奔馳電動化放緩卻推純電超跑GT XX，意在重塑市場信心與技術形象

插混VS增程：全面解析，為何插混成為主流車企新寵？

周鴻祎趣談不買黃金理由：重量成考量，投資需謹慎

多益網絡十萬懸賞求治“擺爛”員工，網友腦洞大開回應引熱議

熱門內容

本欄最新

OpenAICEO提醒：ChatGPT雖火，但人工智能不可全信

OpenAI首席執行官提醒：人工智能雖好，但需警惕無條件信任

奧爾特曼提醒：ChatGPT非萬能，用戶需謹慎對待人工智能

OpenAICEO提醒：ChatGPT雖好，但勿盲目信任人工智能技術

奧爾特曼提醒：ChatGPT非萬能，用戶需謹慎對待人工智能

博雷頓自動駕駛礦卡即將發布，無人駕駛技術開啟礦山實用主義新篇章

本網站LOGO小熊標志受版權保護，版權登記號：魯作登字-2015-F-025467，未經ITBEAR官方許可，嚴禁使用。
聲明：本網站是公益性科普網站，為網友提供科技類資訊內容，無障礙技術由太陽灣捐增，為閱讀障礙用戶提供內容聽讀服務。如本站內容侵犯了您的權利，請通知我們及時刪除。
中國（山東）自由貿易試驗區魯ICP備11015305號-1 商業合作入口
Copyright ? 小熊科技資訊 2007-2024 ITBEAR.COM.CN All rights reserved.

日本精品一区二区三区高清 久久

VLA模型：具身智能的突破與挑戰

日本精品一区二区三区高清久久