“大家別太興奮,自動(dòng)駕駛行業(yè)即將進(jìn)入一段艱難時(shí)期。”在地平線舉辦的技術(shù)生態(tài)大會(huì)上,地平線副總裁兼首席架構(gòu)師蘇箐的這句話,如同一盆冷水,澆滅了行業(yè)內(nèi)的部分狂熱情緒。他并非刻意制造恐慌,而是基于對(duì)自動(dòng)駕駛領(lǐng)域十年起伏的深刻洞察,以及對(duì)未來技術(shù)、工程和商業(yè)路徑的審慎判斷。

蘇箐將特斯拉FSD V12視為自動(dòng)駕駛發(fā)展的分水嶺,其意義堪比原子時(shí)代核裂變實(shí)驗(yàn)首次成功——它證明了端到端數(shù)據(jù)驅(qū)動(dòng)這條路是可行的。在此之前,盡管深度學(xué)習(xí)已經(jīng)重構(gòu)了感知系統(tǒng),但規(guī)控部分仍嚴(yán)重依賴人工規(guī)則,導(dǎo)致系統(tǒng)行為機(jī)械、難以達(dá)到人類水平,發(fā)展瓶頸明顯。FSD V12的出現(xiàn),填平了從“知道正確方向”到“真正落地實(shí)現(xiàn)”之間的巨大鴻溝。
然而,走通這條路并不意味著一帆風(fēng)順。蘇箐提醒,人類容易陷入兩種錯(cuò)覺:在事情未發(fā)生時(shí),完全不相信它會(huì)發(fā)生;而當(dāng)事情發(fā)生后,又會(huì)認(rèn)為它會(huì)持續(xù)發(fā)生。當(dāng)前,行業(yè)正處在后一種盲目樂觀之中。一次內(nèi)核范式重構(gòu),往往是一個(gè)技術(shù)周期的高點(diǎn),而非持續(xù)躍升的起點(diǎn)。
他指出,人工智能大約每二三十年經(jīng)歷一次范式輪回,這一代的深度學(xué)習(xí)技術(shù)可能已接近天花板,Scaling Law的邊界或許正在臨近。未來三到五年,AI和AGI的基礎(chǔ)理論可能不會(huì)有全新突破。而且,端到端已經(jīng)實(shí)現(xiàn)了從感知到規(guī)控的完整閉環(huán),若要再有巨大的內(nèi)核重構(gòu),就需要改變內(nèi)核理論,但目前尚未看到下一個(gè)理論突破的前置信號(hào)。
基于以上判斷,蘇箐認(rèn)為未來三年,行業(yè)的主旋律將是在已確立的端到端范式基礎(chǔ)上,進(jìn)行極致的工程優(yōu)化、體驗(yàn)打磨和成本下探,而非期待又一次理論內(nèi)核的重構(gòu)。這意味著行業(yè)將告別顛覆性創(chuàng)新帶來的興奮,進(jìn)入漫長(zhǎng)、瑣碎、燒錢的“啃硬骨頭”階段,競(jìng)爭(zhēng)重點(diǎn)將從“誰先看到方向”轉(zhuǎn)向“誰能把方向走得更穩(wěn)、更遠(yuǎn)、更經(jīng)濟(jì)”。
那么,這“苦日子”具體苦在哪里?蘇箐在演講中勾勒出了三道難關(guān)。
第一重是極致工程的高成本煉獄。端到端系統(tǒng)雖然潛力巨大,但其開發(fā)、訓(xùn)練和調(diào)試過程極其復(fù)雜且不透明。一輪試驗(yàn)可能需要花費(fèi)十幾億甚至幾十億資金,且結(jié)果非常不收斂,任何一個(gè)噪聲都可能導(dǎo)致整個(gè)系統(tǒng)失效。高投入、高風(fēng)險(xiǎn)、長(zhǎng)周期,考驗(yàn)著公司的財(cái)力、技術(shù)韌性和戰(zhàn)略定力。蘇箐坦言,做一輪試驗(yàn)可能投入十個(gè)億還不一定成功,這種不確定性令人焦慮。
第二重是長(zhǎng)尾問題的深水區(qū)。當(dāng)基礎(chǔ)能力過關(guān)后,真正的挑戰(zhàn)才剛剛開始。例如,系統(tǒng)需要面對(duì)“后面有一個(gè)水坑,該怎么辦”或者“前面卡車錯(cuò)車,該鳴笛等待還是繞過去”等類似人類司機(jī)日常決策的問題。然而,越是人類與生俱來的基本技能,計(jì)算機(jī)越難掌握。解決稠密物理世界中的連續(xù)決策問題,需要系統(tǒng)具備接近常識(shí)的認(rèn)知和泛化能力。蘇箐表示,這些問題極其難解決,目前還沒有清晰答案,只能依靠海量數(shù)據(jù)、高效仿真和工程團(tuán)隊(duì)的“集團(tuán)軍作戰(zhàn)能力”去一點(diǎn)點(diǎn)打磨。
第三重是規(guī)模化的成本攻堅(jiān)戰(zhàn)。蘇箐設(shè)想,Urban L2(城市組合輔助駕駛)會(huì)像自動(dòng)擋一樣,從幾十萬的車普及到十萬級(jí)別的車,并且一樣好用。但要實(shí)現(xiàn)這一目標(biāo),需要在體驗(yàn)類人的同時(shí),將成本壓到極致。這涉及算力平臺(tái)、傳感器方案、數(shù)據(jù)閉環(huán)、制造規(guī)模等多個(gè)環(huán)節(jié),每一個(gè)環(huán)節(jié)都需要精打細(xì)算。L4級(jí)自動(dòng)駕駛同樣面臨挑戰(zhàn),雖然新范式解決了過去依賴高精地圖、限定區(qū)域(ODD)所帶來的高成本和可擴(kuò)展性難題,但真正實(shí)現(xiàn)“以乘用車和robotaxi的雙模式去部署”,并以“合理的價(jià)錢”讓用戶無感地獲得L4級(jí)體驗(yàn),仍需在可靠性、法規(guī)、商業(yè)模式上完成跨越。蘇箐強(qiáng)調(diào),本質(zhì)是需要與人類司機(jī)比成本,這是商業(yè)本質(zhì)的源頭,任何無法數(shù)量級(jí)降低成本的線性遞推方案在商業(yè)上都難以成立。

面對(duì)即將到來的“苦日子”,蘇箐分享了地平線的應(yīng)對(duì)策略。首先是鑄造“工業(yè)母機(jī)”,即不斷強(qiáng)化公司的工程能力和組織能力。蘇箐認(rèn)為,這是應(yīng)對(duì)一切技術(shù)不確定性的確定性基礎(chǔ)。只有擁有穩(wěn)定、高效、能打硬仗的工程組織,才能在新技術(shù)來臨時(shí)快速導(dǎo)入,在問題爆發(fā)時(shí)以“集團(tuán)軍”規(guī)模系統(tǒng)化解決,并持續(xù)攻堅(jiān)那些最難的、沒有現(xiàn)成答案的長(zhǎng)尾問題。
其次是堅(jiān)持“統(tǒng)一范式”。地平線不會(huì)走L2級(jí)組合輔助駕駛和L4割裂的道路,而是會(huì)重投入L4,以統(tǒng)一的開發(fā)范式、統(tǒng)一的傳感器配置、統(tǒng)一的ODD區(qū)域,打通L2到L4。這意味著技術(shù)演進(jìn)是連續(xù)曲線,今天用戶在L2系統(tǒng)上獲得的數(shù)據(jù)和體驗(yàn),將為明天的L4系統(tǒng)提供養(yǎng)分;研發(fā)L4過程中攻克的高階難題,其解決方案可以反哺提升L2的安全與流暢度。這種思路不僅提升了研發(fā)效率,更讓“你現(xiàn)在開的是L2的車,三年后買到的車已經(jīng)是準(zhǔn)L4系統(tǒng)了”成為可能。
最后是“玩命堆算力”。在技術(shù)可能進(jìn)入平臺(tái)期時(shí),地平線選擇了持續(xù)提升算力。蘇箐表示,后面每一代芯片和每一代產(chǎn)品會(huì)堅(jiān)持十倍算力提升、十倍模型容量。他認(rèn)為,隨著半導(dǎo)體工藝進(jìn)步和規(guī)模擴(kuò)大,算力成本的邊際效應(yīng)極其顯著,不要過早質(zhì)疑“是否需要這么多算力”,持續(xù)、簡(jiǎn)單且粗暴地追求算力規(guī)模,是為未來更大模型、更復(fù)雜任務(wù)儲(chǔ)備的“基建”,是在理論瓶頸期維持體驗(yàn)進(jìn)度的核心手段。地平線的產(chǎn)品思路也在調(diào)整,從過去“做加法”轉(zhuǎn)向“做減法”,專注于讓一個(gè)統(tǒng)一的端到端模型“長(zhǎng)”出各種能力。










