在人工智能領域,理想汽車正引領一場深刻的變革。近日,理想汽車董事長兼CEO李想在“理想AI Talk第二季”活動中,深入探討了人工智能的最新進展,特別是其自研的VLA司機大模型,這一創新技術不僅標志著AI在交通領域的重大突破,也體現了理想汽車對于未來出行的深刻洞察。
李想將AI工具劃分為三個層次:信息工具、輔助工具和生產工具。他指出,當前AI大多被用作信息工具,但信息冗雜、效率低下。作為輔助工具,AI雖能提升效率,如輔助駕駛,但仍需人類參與。而真正的突破在于將AI發展為生產工具,能夠獨立承擔專業任務,顯著提升效率與質量。VLA司機大模型正是這一愿景的具現,它將AI推向了交通領域的專業生產工具新階段。
VLA司機大模型的發展并非一蹴而就,而是經歷了從“昆蟲動物智能”到“哺乳動物智能”,再到“人類智能”的逐步進化。起初,理想汽車依賴規則算法和高精地圖實現輔助駕駛,這相當于“昆蟲動物智能”。隨后,通過引入端到端模型和VLM視覺語言模型,輔助駕駛能力接近“哺乳動物智能”。然而,端到端模型在處理復雜問題和與人類溝通方面存在局限。為此,理想汽車研發了VLA司機大模型,它不僅能通過3D和2D視覺完整感知物理世界,還具備語言理解和思維鏈推理能力,真正實現了“人類智能”。
VLA司機大模型的訓練過程模擬了人類學習駕駛的過程,包括預訓練、后訓練和強化訓練。預訓練階段,通過大量數據訓練出云端的VL基座模型,并轉化為車端高效運行的端側模型。后訓練階段,加入動作數據,使VL基座模型轉變為VLA司機大模型。強化訓練階段,則通過基于人類反饋的強化學習和世界模型訓練,提升模型的安全性和舒適性,使其對齊人類價值觀,甚至超越人類駕駛水平。
VLA司機大模型以“司機Agent”的形式呈現,用戶可通過自然語言與其溝通,就像與人類司機交流一樣。為了確保VLA司機大模型的專業性和安全性,理想汽車在強化訓練環節投入大量資源,組建了超級對齊團隊,為司機Agent注入職業素養。同時,為解決模型的黑盒問題,理想汽車打造了真實、符合物理世界規律的世界模型,使VLA能夠在其中低成本、準確地驗證現實問題,提升解決問題的效率。
在人工智能時代,理想汽車堅持自研,從研究、研發到能力表達,再到將能力變成業務價值,每一步都扎實積累。例如,針對英偉達Orin-X芯片無法直接運行語言模型的問題,理想汽車自研底層推理引擎,使芯片能夠運行VLM。理想汽車還憑借芯片、控制器設計和自研汽車操作系統等綜合能力,實現了雙Orin-X芯片和Thor-U芯片運行同等規模的VLA司機大模型。這些努力不僅提升了技術能力,也為用戶帶來了更好的體驗。
在談及創業和個人成長時,李想表示,創業路上苦多于甜,但他選擇保留有價值的美好片段,激勵自己保持正能量。他認為,成為更有能量的人的關鍵在于關注自我,接受自身的優點和不足,并用成長替代改變。同時,他也強調親密關系的重要性,家人和同事能夠形成互補,相互支撐。正是這份積極樂觀的心態和團隊的支持,讓理想汽車能夠快速成長為千億營收規模、百萬交付量的新勢力企業。
李想還分享了理想汽車在開源方面的貢獻。得益于DeepSeek的開源,理想汽車在VLA司機大模型的語言能力研發上取得了顯著進展。盡管如此,理想汽車仍選擇加大投入,專注打造適配多場景的自研模型。同時,理想汽車也選擇開源自研的汽車操作系統——理想星環OS,回饋社會。這一舉措不僅體現了理想汽車的技術實力,也展現了其開放共享的精神。