在5月7日的理想汽車“理想AI Talk第二季”活動中,理想汽車董事長兼CEO李想深入探討了人工智能的未來發(fā)展,并重點介紹了其最新研發(fā)成果——VLA司機大模型。此次分享不僅揭示了理想汽車在人工智能領(lǐng)域的探索方向,還分享了李想對于創(chuàng)業(yè)和個人成長的獨到見解。
李想將AI工具劃分為三個層次:信息工具、輔助工具和生產(chǎn)工具。他指出,目前AI主要作為信息工具存在,但這類工具往往伴隨著大量無效信息,僅能提供有限的參考價值。當AI進化為輔助工具時,其效率將顯著提升,例如當前的輔助駕駛系統(tǒng)。然而,真正的突破將發(fā)生在AI成為生產(chǎn)工具之時,那時它將能夠獨立完成專業(yè)任務,帶來質(zhì)量與效率的雙重飛躍。
“判斷一個Agent是否真正智能,關(guān)鍵在于它能否成為生產(chǎn)工具。”李想強調(diào),“只有當AI成為生產(chǎn)工具,它才能真正爆發(fā)。正如人類會雇傭司機,AI技術(shù)最終也將承擔類似的職責。”
VLA司機大模型正是理想汽車向這一愿景邁出的重要一步。李想表示,VLA(Vision-Language-Action Model,視覺語言行動模型)將讓AI成為真正的司機,成為交通領(lǐng)域的專業(yè)生產(chǎn)工具。VLA的實現(xiàn)并非一蹴而就,而是一個逐步進化的過程,經(jīng)歷了從依賴規(guī)則算法和高精地圖的輔助駕駛,到端到端+VLM(Vision Language Model,視覺語言模型)輔助駕駛,再到VLA司機大模型的三個階段。
在VLA的研發(fā)過程中,理想汽車借鑒了人類學習駕駛技能的過程,將其分為預訓練、后訓練和強化訓練三個環(huán)節(jié)。預訓練相當于人類學習物理世界和交通領(lǐng)域的常識,通過大量數(shù)據(jù)訓練出云端的VL基座模型。后訓練則類似于人類去駕校學習開車的過程,通過加入動作數(shù)據(jù),將VL基座模型轉(zhuǎn)化為VLA司機大模型。強化訓練則是讓VLA司機大模型在實際環(huán)境中進行練習,以提升其安全性和舒適性,使其更符合人類價值觀。
除了專業(yè)能力外,VLA司機大模型還注重解決安全性和模型黑盒問題。理想汽車在強化訓練環(huán)節(jié)投入大量資源,組建了超級對齊團隊,為司機Agent注入職業(yè)素養(yǎng)。同時,理想汽車還打造了真實、符合物理世界規(guī)律的世界模型,以解決模型的黑盒問題。通過世界模型的仿真能力,VLA可以在低成本、高效率地驗證現(xiàn)實問題。
在分享中,李想還談到了理想汽車的技術(shù)自研之路。他強調(diào),扎實的基本功對于技術(shù)快速躍遷至關(guān)重要。理想汽車堅持自研,通過技術(shù)賦能用戶價值。例如,在輔助駕駛方面,理想汽車依托自有編譯團隊和自研底層推理引擎,成功實現(xiàn)了雙Orin-X芯片和Thor-U芯片運行同等規(guī)模的VLA司機大模型。
李想還分享了他的創(chuàng)業(yè)心得。他表示,創(chuàng)業(yè)路上雖然充滿挑戰(zhàn),但保持正能量至關(guān)重要。他將企業(yè)遭遇的打擊視為成長的契機,認為這些挑戰(zhàn)賦予了理想汽車更多的能力。同時,他也強調(diào)了親密關(guān)系的重要性,認為關(guān)注他人的成長同樣能帶來能量。
在談到人工智能的未來時,李想認為,在AI面前,所有人性都應被保留。因為一切人性都是文化、生命、性格、能力的特質(zhì),也是人類真正的生命力所在。理想汽車將繼續(xù)以技術(shù)創(chuàng)新解決行業(yè)難題,不斷挑戰(zhàn)成長的極限,為用戶和行業(yè)創(chuàng)造更多價值。