在理想汽車近期舉辦的“理想AI Talk第二季”活動中,董事長兼CEO李想深入探討了人工智能(AI)的最新進展,特別是理想汽車自研的VLA司機大模型,這一創新技術標志著AI在交通領域的重大突破。
李想將AI工具的發展劃分為三個層次:信息工具、輔助工具和生產工具。他指出,當前大多數AI應用仍處于信息工具階段,充斥著無效信息和結果。輔助工具階段,如現有的輔助駕駛系統,雖能提高效率但仍需人類監控。而生產工具階段,AI將能獨立完成專業任務,顯著提升效率與質量。李想強調,只有當AI成為生產工具時,其潛力才能真正爆發。
VLA(Vision-Language-Action Model,視覺語言行動模型)是理想汽車向生產工具階段邁進的關鍵一步。李想介紹,VLA能夠讓AI像人類司機一樣工作,成為交通領域的專業生產工具。這一過程并非一蹴而就,而是經歷了從依賴規則算法和高精地圖的輔助駕駛,到端到端+VLM(Vision Language Model,視覺語言模型)輔助駕駛,再到VLA的逐步進化。
VLA的訓練過程模擬了人類學習駕駛的三個階段:預訓練、后訓練和強化訓練。預訓練階段,VLA通過大量高清視覺數據、交通語言語料和聯合數據,構建出云端的VL基座模型。后訓練階段,加入動作數據,將VL基座轉變為VLA司機大模型。強化訓練階段,則通過基于人類反饋的強化學習和純強化學習模型,提升VLA的安全性和舒適性,使其對齊人類價值觀。
VLA司機大模型以“司機Agent”的形式呈現,用戶可以通過自然語言與其溝通,如同與人類司機交流一般。李想表示,VLA不僅具備看和理解的能力,還能真正執行行動,符合人類的運作方式。
在安全性方面,理想汽車投入大量資源確保VLA司機大模型的職業性。通過超級對齊團隊,為司機Agent注入職業素養,避免違規行為。同時,為解決模型的黑盒問題,理想汽車打造了真實、符合物理世界規律的世界模型,使VLA能夠在其中低成本、準確地驗證現實問題,提升解決問題的效率。
李想還分享了理想汽車在技術研發上的堅持與投入。他強調,扎實的基本功比走捷徑更為重要。理想汽車堅持自研,通過技術賦能用戶價值。例如,在輔助駕駛方面,理想汽車依托自有編譯團隊和自研底層推理引擎,實現了讓雙Orin-X芯片和Thor-U芯片運行同等規模的VLA司機大模型。
理想汽車還受益于DeepSeek的開源,這一舉措顯著加速了VLA司機大模型的語言能力研發。盡管如此,理想汽車仍選擇加大投入,專注打造適配多場景的自研模型。同時,理想汽車也選擇開源自研的汽車操作系統——理想星環OS,回饋社會。
在個人成長與創業心態方面,李想表示,成為更有能量的人關鍵在于關注自我,接受自身的優點和不足,并用成長替代改變。他強調親密關系的重要性,家人和同事能夠形成互補,相互支撐。回顧創業經歷,李想表示,遇到問題解決問題,解決別人不愿解決的難題,解決用戶的痛點,是他一貫的思維方式。
面對AI的發展,李想認為,在AI面前所有的人性都應被保留,因為一切人性都是文化、生命、性格、能力的特質,也是人類真正的生命力所在。理想汽車將繼續以技術創新解決行業難題,不斷挑戰成長的極限,持續為行業和用戶創造價值。