在智能科技的浪潮中,理想汽車再度引領創新風潮,于近期推出的“理想AI Talk第二季”活動中,其董事長兼CEO李想深度剖析了人工智能的發展現狀與未來趨勢,特別是其傾力打造的VLA司機大模型,為自動駕駛領域帶來了革命性的突破。
李想將AI的應用劃分為信息工具、輔助工具及生產工具三個階段。當前,AI主要作為信息工具存在,但信息冗雜、有效性低的問題凸顯。輔助工具階段,如輔助駕駛系統,雖提升了效率,仍需人類參與。而未來,當AI進化為生產工具時,將能獨立完成專業任務,實現效率與質量的雙重飛躍。李想強調,真正的智能在于AI能否成為生產工具,正如人類雇傭司機一樣,AI也將承擔起類似職責。
VLA司機大模型,即Vision-Language-Action Model(視覺語言行動模型),是理想汽車邁向自動駕駛未來的關鍵一步。它不僅能夠像人類司機一樣工作,更將成為交通領域的專業生產工具。VLA的實現并非一蹴而就,而是經歷了從依賴規則算法和高精地圖的輔助駕駛,到端到端+VLM(Vision Language Model,視覺語言模型)輔助駕駛的逐步進化,直至最終實現VLA的“人類智能”階段。
在VLA的訓練過程中,理想汽車借鑒了人類學習駕駛的三個階段:預訓練、后訓練和強化訓練。預訓練相當于人類學習物理世界和交通常識,通過大量數據訓練出云端的VL基座模型;后訓練則如同人類去駕校學習開車,加入動作數據后,VL基座轉變為VLA司機大模型;強化訓練則類似于人類在社會中實際開車練習,旨在提升VLA的安全性和舒適性,使其更加貼合人類價值觀。
VLA司機大模型不僅擁有強大的專業能力,更在超級對齊團隊的加持下,具備了職業司機的素養。同時,理想汽車通過打造真實、符合物理世界規律的世界模型,有效解決了AI的黑盒問題,使得VLA能夠在世界模型中低成本、準確地驗證現實問題,提升解決問題的效率。
在李想看來,判斷司機Agent是否優秀,關鍵在于其專業能力、職業能力和構建信任的能力。VLA司機大模型在這三個方面均表現出色,不僅提升了自動駕駛的專業水平,更通過超級對齊增強了職業能力,以及通過理解自然語言、具備記憶能力提升了構建信任的能力。
理想汽車在技術快速躍遷的背后,是其從研究、研發到能力表達,再到將能力變成業務價值的深厚基本功積累。李想堅持自研道路,通過技術賦能用戶價值。在輔助駕駛方面,理想汽車依托自有編譯團隊和自研底層推理引擎,克服了英偉達Orin-X芯片無法直接運行語言模型的挑戰,實現了雙Orin-X芯片和Thor-U芯片運行同等規模的VLA司機大模型。
在創業路上,李想始終保持積極樂觀的心態,將挑戰視為成長的機會。他強調,成長帶來能量,在痛苦中保持正能量是關鍵。他關注自我成長,同時也重視親密關系,認為家人和同事的互補與支撐是企業成功的關鍵。
面對AI的發展,李想認為應保留所有人性特質,無論是好是壞,因為這些都是人類真正的生命力所在。理想汽車始終以技術創新解決行業難題,從增程電動和5C超充技術到自研汽車操作系統,再到VLA司機大模型,不斷挑戰成長的極限,持續為行業和用戶創造價值。