在近期的一次重大科技分享活動中,理想汽車董事長兼首席執行官李想,深度剖析了人工智能(AI)的未來發展路徑,特別是理想汽車自主研發的VLA司機大模型,這一創新成果標志著理想汽車在AI技術應用上的重大突破。
李想將AI的應用劃分為三個層次:信息工具、輔助工具及生產工具。他指出,當前AI主要作為信息工具存在,但其提供的信息往往摻雜大量無效內容,僅具有有限的參考價值。作為輔助工具時,AI能夠提升工作效率,如輔助駕駛系統,但仍需人類監控。而AI真正成為生產工具時,將能夠獨立完成專業任務,顯著提升效率與質量,這一愿景與李想提出的“AI司機”概念不謀而合。
“AI能否成為真正的智能體,關鍵在于它能否作為生產工具存在。”李想強調,“正如人類會雇傭司機,AI技術也將承擔類似角色,成為真正的生產力。”
VLA司機大模型的訓練過程,模擬了人類學習駕駛的三個階段:預訓練、后訓練和強化訓練。預訓練階段,模型通過大量高清視覺數據和語言語料,學習物理世界和交通領域的常識。后訓練階段,加入動作數據,模型從理論走向實踐,初步具備駕駛能力。強化訓練階段,則通過模擬真實駕駛環境和人類反饋,進一步提升模型的安全性和舒適性,使其駕駛水平甚至超越人類。
VLA司機大模型以“司機智能體”的形態呈現,用戶可以通過自然語言與其溝通,如同與真實司機對話。簡單指令由車載模型即時處理,復雜指令則通過云端解析后執行,確保了高效且流暢的交互體驗。
在安全性方面,理想汽車投入大量資源,組建了專業的超級對齊團隊,確保VLA司機大模型遵守交通規則,貼合中國用戶的駕駛習慣,避免學習不良駕駛行為。同時,通過打造真實、符合物理規律的世界模型,理想汽車有效解決了AI模型的黑盒問題,提升了解決問題的效率和準確性。
李想認為,一個優秀的AI司機,應具備專業能力、職業能力和構建信任的能力。VLA司機大模型通過先進的訓練方法和強化學習,不僅提升了專業能力,還通過超級對齊增強了職業能力,并通過理解自然語言、具備記憶能力,提升了構建信任的能力。
理想汽車堅持自研道路,通過技術賦能用戶價值。在輔助駕駛領域,面對英偉達Orin-X芯片無法直接運行語言模型的挑戰,理想汽車依托自研的底層推理引擎,使芯片能夠高效運行VLM。同時,憑借在芯片、控制器設計和汽車操作系統等方面的綜合能力,理想汽車實現了雙Orin-X芯片和Thor-U芯片運行同等規模的VLA司機大模型。
李想分享道,理想汽車在VLA司機大模型的語言能力研發上,得益于DeepSeek的開源,取得了顯著進展,節省了時間和成本。但理想汽車并未止步,而是選擇加大投入,專注打造適配多場景的自研模型。
談及個人成長和企業發展,李想表示,創業路上雖然充滿挑戰,但他選擇保持樂觀態度,將挑戰視為成長的機會。他認為,成長意味著增強能力,而關注自我和親密關系同樣重要。家人和同事能夠形成互補,相互支撐,共同面對挑戰。
李想還提到,從高中創辦個人網站至今,他的思維方式始終如一:遇到問題解決問題,解決他人不愿解決的難題,解決用戶的痛點。面對AI的發展,他強調應保留所有人性特質,因為這正是人類真正的生命力所在。理想汽車將繼續以技術創新為驅動,不斷挑戰成長的極限,為行業和用戶創造更多價值。