在近日的一次重大技術分享活動中,理想汽車董事長兼首席執行官李想深入探討了人工智能(AI)的最新進展,特別是其推出的VLA司機大模型,這一創新技術被視為從動物進化到人類智能模擬的重要里程碑。李想不僅分享了VLA司機大模型的作用、訓練方法及其面臨的挑戰,還談到了創業和個人成長的深刻見解。
李想將AI工具劃分為三個層次:信息工具、輔助工具和生產工具。他指出,當前大多數用戶僅將AI作為信息工具,但這類工具往往伴隨著大量無效信息,僅具備有限的參考價值。作為輔助工具,AI能夠提升效率,例如輔助駕駛系統,但仍需人類參與。然而,李想強調,AI真正的潛力在于成為生產工具,能夠獨立執行專業任務,顯著提高效率與質量。他比喻道,就像人類雇傭司機一樣,AI技術最終也將承擔類似角色,成為真正的生產工具。
VLA司機大模型的訓練過程模擬了人類學習駕駛的過程,包括預訓練、后訓練和強化訓練三個階段。預訓練階段相當于人類學習交通規則和物理世界的基礎知識,通過大量高清視覺和語言數據,訓練出云端的基座模型,并轉化為車端高效運行的模型。后訓練階段則類似于人類在駕校學習駕駛,通過加入實際駕駛行為數據,將基座模型轉變為VLA司機大模型。強化訓練則相當于人類在社會中實際駕駛,旨在讓VLA司機大模型更加安全、舒適,與人類價值觀保持一致,甚至超越人類駕駛水平。
在強化訓練中,理想汽車采用了基于人類反饋的強化學習(RLHF)和純強化學習模型,以確保VLA司機大模型的安全性和舒適性。通過這兩部分訓練,VLA司機大模型不僅能夠遵守交通規則,貼合中國用戶的駕駛習慣,還能在復雜交通環境中做出安全、舒適的決策。
VLA司機大模型以“司機智能體”的形式呈現,用戶可以通過自然語言與其溝通,就像與人類司機交流一樣。簡單指令由車端的VLA直接處理,復雜指令則由云端的基座模型解析后再交由VLA處理。這種設計使得VLA司機大模型能夠靈活應對各種駕駛場景。
除了專業能力,VLA司機大模型還注重安全性和模型透明度。為了確保其安全性和職業性,理想汽車在強化訓練環節投入了大量資源,并組建了超級對齊團隊,為司機智能體注入職業素養。同時,為了解決模型的黑盒問題,理想汽車打造了真實、符合物理世界規律的世界模型,使得VLA可以在世界模型中低成本、準確地驗證現實問題,有效提升解決問題的效率。
李想表示,判斷一個司機智能體是否優秀,關鍵在于其專業能力、職業能力和構建信任的能力。VLA司機大模型通過訓練提升了專業能力,超級對齊增強了職業能力,而理解自然語言和具備記憶能力則提升了構建信任的能力。
在分享中,李想還談到了理想汽車的技術積累和創新理念。他指出,理想汽車實現從研究、研發到能力表達,再到業務價值轉化的快速躍遷,得益于扎實的基本功積累。理想汽車堅持自研,通過技術賦能用戶價值。例如,在輔助駕駛方面,理想汽車自研底層推理引擎,使芯片能夠運行語言模型,實現了雙Orin-X芯片和Thor-U芯片運行同等規模的VLA司機大模型。
李想強調,雖然理想汽車在VLA司機大模型的語言能力研發上受益于開源項目DeepSeek,節省了時間和成本,但理想汽車仍選擇加大投入,專注打造適配多場景的自研模型。同時,理想汽車也選擇開源自研的汽車操作系統——理想星環OS,回饋社會。
在談到個人成長和創業心態時,李想表示,創業路上苦多于甜,但他選擇保留那些有價值的美好片段,用來激勵自己保持正能量。他認為,成長帶來能量,關注自我、接受自身的優點和不足,并用成長替代改變是關鍵。親密關系同樣重要,家人和同事能夠相互支撐,形成強大的腦力和心力。
回顧自己的創業經歷,李想表示,從高中創辦個人網站至今,他的思維方式沒有本質變化:遇到問題解決問題,解決別人不愿解決的難題,解決用戶的痛點,不斷向他人學習。面對AI的發展,李想認為,在AI面前所有的人性都應被保留,因為一切人性都是文化、生命、性格、能力的特質,也是人類真正的生命力所在。