隨著人工智能技術(shù)發(fā)展進入新階段,自動駕駛領(lǐng)域正經(jīng)歷一場深刻的范式變革。在剛剛落幕的全球計算機視覺頂級會議ICCV 2025上,理想汽車自動駕駛團隊展示的系列創(chuàng)新成果,為行業(yè)描繪出技術(shù)演進的新路徑。
自動駕駛高級算法專家詹錕在具身智能研討會上提出的"訓(xùn)練閉環(huán)"理念,標志著行業(yè)從數(shù)據(jù)驅(qū)動向智能驅(qū)動的關(guān)鍵轉(zhuǎn)折。理想汽車構(gòu)建的全球首個量產(chǎn)級世界模型與強化學(xué)習(xí)融合架構(gòu),通過環(huán)境生成、智能體交互和反饋優(yōu)化形成完整訓(xùn)練體系,有效解決了傳統(tǒng)端到端方案在極端場景下的數(shù)據(jù)稀缺難題。
技術(shù)演進呈現(xiàn)清晰的迭代軌跡。從規(guī)則算法到端到端方案,再到當(dāng)前VLA(視覺語言行動)架構(gòu)的成熟應(yīng)用,理想汽車在輔助駕駛領(lǐng)域?qū)崿F(xiàn)了三次重大跨越。其雙系統(tǒng)架構(gòu)將E2E實時決策與VLM認知推理相結(jié)合,使MPI(人類接管里程)指標在12個月內(nèi)顯著提升。當(dāng)訓(xùn)練數(shù)據(jù)量突破千萬級后,團隊通過引入合成數(shù)據(jù)與真實數(shù)據(jù)融合訓(xùn)練,成功突破邊際效應(yīng)瓶頸。
在環(huán)境建模領(lǐng)域,理想提出的Hierarchy UGP技術(shù)引發(fā)學(xué)界關(guān)注。該技術(shù)采用根層-子場景層-圖元層的三維分層結(jié)構(gòu),配合四維空間統(tǒng)一高斯圖元表示,實現(xiàn)了對動態(tài)場景的高精度重建。研究顯示,這種建模方式在處理復(fù)雜交通場景時,模型容量提升3倍以上,能夠準確還原任意動態(tài)元素。
數(shù)據(jù)合成能力的突破為技術(shù)發(fā)展注入新動能。理想團隊開發(fā)的提示詞生成系統(tǒng),可實時創(chuàng)建包含視頻和點云的虛擬場景,特別適用于新法規(guī)環(huán)境、特殊地理區(qū)域等罕見場景的模擬訓(xùn)練。這種技術(shù)使模型在極端天氣、復(fù)雜路況等場景下的決策穩(wěn)定性提升40%,同時降低25%的實車測試成本。
在技術(shù)落地層面,理想構(gòu)建的完整技術(shù)棧涵蓋場景重建、多模態(tài)生成、智能體交互等12個關(guān)鍵模塊。其中3D資產(chǎn)庫包含超過20萬種交通元素模型,評價反饋系統(tǒng)支持毫秒級決策評估。算力基礎(chǔ)設(shè)施的升級使模型訓(xùn)練效率提升5倍,為實時強化學(xué)習(xí)提供了硬件支撐。
學(xué)術(shù)成果方面,理想團隊在ICCV 2025上展示了五項突破性研究。除Hierarchy UGP外,3DRealCar數(shù)據(jù)集通過2500輛汽車的360度掃描,創(chuàng)建了業(yè)界首個高保真汽車模型庫;World4Drive框架利用潛在世界模型實現(xiàn)無需標注的端到端規(guī)劃;HiNeuS神經(jīng)表面重建技術(shù)解決了低紋理場景下的建模難題;RoboPearls視頻模擬框架則開創(chuàng)了機器人操作的可編輯仿真新范式。
面向未來技術(shù)挑戰(zhàn),理想明確了兩個重點突破方向。強化學(xué)習(xí)引擎需要同時滿足泛化性、實時性和大規(guī)模并發(fā)需求,團隊正著力優(yōu)化世界模型精度、3D資產(chǎn)豐富度和獎勵模型效率。交互式智能體研究則通過調(diào)整強化學(xué)習(xí)獎勵機制,實現(xiàn)多智能體協(xié)同決策,相關(guān)成果MAD系統(tǒng)即將發(fā)布。
作為首家將VLA架構(gòu)應(yīng)用于量產(chǎn)車型的企業(yè),理想汽車的技術(shù)布局已產(chǎn)生顯著行業(yè)影響。其開源的輔助駕駛代碼庫被全球3200余名開發(fā)者使用,提出的VLA技術(shù)范式正成為行業(yè)新標準。在研發(fā)投入方面,公司近半研發(fā)預(yù)算投向人工智能領(lǐng)域,組建的四支專業(yè)團隊分別深耕輔助駕駛、智能交互、工業(yè)智能化和商業(yè)智能化方向。













