在計(jì)算機(jī)視覺(jué)領(lǐng)域,一場(chǎng)技術(shù)革新風(fēng)暴正悄然掀起。近期落幕的國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV)上,特斯拉首次向外界深度揭秘其FSD(完全自動(dòng)駕駛)系統(tǒng)的核心架構(gòu),這一舉動(dòng)引發(fā)行業(yè)廣泛關(guān)注,也預(yù)示著自動(dòng)駕駛技術(shù)邁向全新發(fā)展階段。
特斯拉自動(dòng)駕駛副總裁阿肖克·埃魯斯瓦米在大會(huì)上介紹,F(xiàn)SD系統(tǒng)依托一個(gè)大型神經(jīng)網(wǎng)絡(luò),將攝像頭視頻、地圖、車速乃至音頻等多模態(tài)信息一股腦輸入其中,網(wǎng)絡(luò)直接輸出方向盤(pán)操作和油門(mén)控制指令。這意味著,過(guò)去感知、預(yù)測(cè)、決策、控制等獨(dú)立環(huán)節(jié),如今在一個(gè)網(wǎng)絡(luò)內(nèi)融合,通過(guò)反向傳播實(shí)現(xiàn)整體優(yōu)化。這種架構(gòu)與當(dāng)下熱議的“世界模型”概念高度契合。
所謂“世界模型”,可理解為AI構(gòu)建的“虛擬小宇宙”。它能將外界信息壓縮成內(nèi)部版本,并在此空間內(nèi)模擬未來(lái)場(chǎng)景。例如,它能預(yù)測(cè)踩油門(mén)后前車的反應(yīng)——是繼續(xù)前行還是緊急剎車。這種能力如同人類大腦的“預(yù)演”,是實(shí)現(xiàn)智能決策的關(guān)鍵。特斯拉的“神經(jīng)世界模擬器”正是此類模型的典型代表,它不僅能生成未來(lái)畫(huà)面,還能根據(jù)不同操作預(yù)測(cè)多種結(jié)果。
這一技術(shù)的優(yōu)勢(shì)在于,它不僅能提供“未來(lái)可能堵車”的籠統(tǒng)判斷,更能細(xì)化到“變道是否更快或更危險(xiǎn)”的具體分析。通過(guò)在虛擬環(huán)境中反復(fù)測(cè)試新策略,甚至模擬極端場(chǎng)景,系統(tǒng)迭代速度大幅提升。例如,系統(tǒng)可在虛擬世界中嘗試不同變道時(shí)機(jī),評(píng)估風(fēng)險(xiǎn)與收益,從而優(yōu)化實(shí)際駕駛決策。
圍繞自動(dòng)駕駛技術(shù)路線,行業(yè)已形成兩大陣營(yíng)。以特斯拉、蔚來(lái)、華為為代表的企業(yè)主張“世界模型”路線,認(rèn)為AI需真正理解物理世界,通過(guò)內(nèi)部模擬實(shí)現(xiàn)精準(zhǔn)決策;而理想、小米等企業(yè)則傾向“VLA(視覺(jué)-語(yǔ)言-行動(dòng))模型”,借助大語(yǔ)言模型的推理能力,將視覺(jué)信息轉(zhuǎn)化為文字描述,再通過(guò)語(yǔ)言邏輯制定策略。
兩條路線各有優(yōu)勢(shì)。世界模型更貼近物理現(xiàn)實(shí),擅長(zhǎng)處理復(fù)雜動(dòng)態(tài)環(huán)境,是高級(jí)別自動(dòng)駕駛的核心技術(shù);VLA模型則憑借語(yǔ)言模型的常識(shí)推理能力,在應(yīng)對(duì)長(zhǎng)尾場(chǎng)景(如罕見(jiàn)交通狀況)時(shí)更具潛力。例如,面對(duì)道路施工標(biāo)志模糊的情況,VLA模型可通過(guò)語(yǔ)言邏輯推斷施工類型,而世界模型則可能更依賴對(duì)物理環(huán)境的直接感知。
中國(guó)企業(yè)在世界模型領(lǐng)域已展現(xiàn)強(qiáng)勁實(shí)力。蔚來(lái)推出的NWM世界模型,可在100毫秒內(nèi)生成200多個(gè)應(yīng)對(duì)預(yù)案,并篩選最優(yōu)方案;華為的WEWA架構(gòu)則強(qiáng)調(diào)從傳感器信號(hào)到控制指令的直接映射,跳過(guò)語(yǔ)言轉(zhuǎn)換環(huán)節(jié),追求極致安全;商湯的“開(kāi)悟”模型則聚焦仿真領(lǐng)域,通過(guò)AI生成海量高逼真訓(xùn)練數(shù)據(jù),降低車企研發(fā)成本。
這場(chǎng)技術(shù)競(jìng)賽背后,是自動(dòng)駕駛從輔助功能向完全自主的跨越。無(wú)論是特斯拉的“閉環(huán)神經(jīng)宇宙”,還是中國(guó)企業(yè)的多樣化探索,均指向同一目標(biāo):讓汽車成為具備感知、思考與決策能力的移動(dòng)智能體。世界模型作為關(guān)鍵技術(shù),正成為企業(yè)爭(zhēng)奪L4級(jí)無(wú)人駕駛制高點(diǎn)的核心籌碼。












