特斯拉AI軟件副總裁阿肖克·埃盧斯瓦米(Ashok Elluswamy)在國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)上,以代表身份向外界披露了該公司在自動(dòng)駕駛領(lǐng)域的技術(shù)突破。作為直接向馬斯克匯報(bào)的核心成員,這位2024年晉升的AI業(yè)務(wù)負(fù)責(zé)人,曾深度參與特斯拉自動(dòng)駕駛系統(tǒng)的早期研發(fā)工作,此次分享的內(nèi)容引發(fā)了行業(yè)對(duì)技術(shù)路線(xiàn)的新思考。
特斯拉的技術(shù)團(tuán)隊(duì)正在顛覆傳統(tǒng)自動(dòng)駕駛的開(kāi)發(fā)模式。傳統(tǒng)方案通常將感知、預(yù)測(cè)、規(guī)劃三個(gè)環(huán)節(jié)拆分為獨(dú)立模塊,各模塊通過(guò)預(yù)設(shè)接口傳遞數(shù)據(jù),但特斯拉認(rèn)為這種"模塊化"路徑存在接口復(fù)雜、優(yōu)化困難等弊端。取而代之的是"端到端"神經(jīng)網(wǎng)絡(luò)架構(gòu),該系統(tǒng)直接接收攝像頭像素輸入,同步輸出轉(zhuǎn)向與加速指令,實(shí)現(xiàn)從環(huán)境感知到?jīng)Q策控制的全鏈路優(yōu)化。
在處理現(xiàn)實(shí)駕駛中的倫理困境時(shí),端到端模型展現(xiàn)出獨(dú)特優(yōu)勢(shì)。當(dāng)車(chē)輛面臨"繞過(guò)積水還是借道逆行"這類(lèi)微型電車(chē)難題時(shí),傳統(tǒng)規(guī)則系統(tǒng)難以編碼所有可能性。而特斯拉的解決方案是通過(guò)海量真實(shí)駕駛數(shù)據(jù)訓(xùn)練,使AI系統(tǒng)在無(wú)明確規(guī)則的情況下,自然形成符合人類(lèi)價(jià)值觀(guān)的決策模式。這種隱式學(xué)習(xí)機(jī)制,讓車(chē)輛能像人類(lèi)駕駛員一樣權(quán)衡利弊。
系統(tǒng)對(duì)環(huán)境意圖的理解能力達(dá)到新高度。在區(qū)分"過(guò)馬路雞群"與"路邊休憩鵝群"的場(chǎng)景中,端到端模型通過(guò)潛在空間分析,準(zhǔn)確判斷不同群體的運(yùn)動(dòng)趨勢(shì)。這種對(duì)動(dòng)態(tài)意圖的捕捉能力,在模塊化系統(tǒng)中因數(shù)據(jù)傳遞損耗而難以實(shí)現(xiàn),卻成為特斯拉技術(shù)的核心差異點(diǎn)。
支撐這套系統(tǒng)的是前所未有的數(shù)據(jù)規(guī)模。特斯拉車(chē)隊(duì)每日產(chǎn)生的駕駛數(shù)據(jù),相當(dāng)于人類(lèi)500年的駕駛時(shí)長(zhǎng)。面對(duì)每秒20億個(gè)傳感器輸入(涵蓋攝像頭、地圖、音頻等),系統(tǒng)通過(guò)智能篩選機(jī)制提取關(guān)鍵信息,最終壓縮為轉(zhuǎn)向與加速兩個(gè)核心指令。這種數(shù)據(jù)處理能力,使系統(tǒng)在雨天路滑場(chǎng)景中,能提前5秒預(yù)判前車(chē)失控的二次反彈風(fēng)險(xiǎn),展現(xiàn)出傳統(tǒng)方案難以企及的預(yù)測(cè)精度。
為破解端到端模型的黑箱問(wèn)題,研發(fā)團(tuán)隊(duì)開(kāi)發(fā)了兩項(xiàng)創(chuàng)新工具。其一是基于生成式高斯?jié)姙R技術(shù)的視覺(jué)重建系統(tǒng),可在220毫秒內(nèi)生成動(dòng)態(tài)3D環(huán)境模型,讓工程師直觀(guān)觀(guān)察AI的感知結(jié)果;其二是嵌入FSD v14.x版本的小型語(yǔ)言推理模型,該模型能用自然語(yǔ)言解釋決策邏輯,例如說(shuō)明"為何在此處減速"。
真實(shí)場(chǎng)景評(píng)估成為技術(shù)落地的最后關(guān)卡。特斯拉構(gòu)建的神經(jīng)世界模擬器能實(shí)時(shí)生成極端事故場(chǎng)景,對(duì)系統(tǒng)進(jìn)行7×24小時(shí)的壓力測(cè)試。這個(gè)具備AI屬性的虛擬世界,不僅能復(fù)現(xiàn)歷史數(shù)據(jù),更能創(chuàng)造傳統(tǒng)測(cè)試難以覆蓋的邊緣案例。通過(guò)這種"超現(xiàn)實(shí)駕駛游戲",系統(tǒng)在虛擬環(huán)境中完成數(shù)百萬(wàn)次迭代升級(jí)。
技術(shù)通用性驗(yàn)證取得突破性進(jìn)展。模擬器生成的畫(huà)面顯示,擎天柱人形機(jī)器人已在虛擬工廠(chǎng)環(huán)境中完成自主導(dǎo)航測(cè)試。這證明特斯拉的自動(dòng)駕駛技術(shù)棧可無(wú)縫遷移至機(jī)器人領(lǐng)域,為解決現(xiàn)實(shí)世界的通用人工智能問(wèn)題奠定了基礎(chǔ)。從汽車(chē)到人形機(jī)器人,端到端架構(gòu)正在開(kāi)辟一條技術(shù)復(fù)用的新路徑。








