在近期的一次重大科技發布活動中,理想汽車宣布了其“理想AI Talk第二季”的核心成果——VLA司機大模型,這一創新標志著理想汽車在人工智能領域的又一重大突破。理想汽車的董事長兼CEO李想,在此次發布會上深入探討了人工智能的未來發展路徑,以及VLA司機大模型如何引領這一變革。
李想將AI工具的發展劃分為三個階段:信息工具、輔助工具和生產工具。他指出,當前AI主要作為信息工具使用,但充斥著大量無效信息,僅能提供有限的參考價值。作為輔助工具時,AI能顯著提升效率,如輔助駕駛技術,但仍需人類監控。而未來,當AI進化為生產工具時,將能獨立完成專業任務,實現效率與質量的雙重飛躍。
“真正的智能在于成為生產工具。”李想強調,“只有當AI成為生產工具,它才能真正爆發。就像人類雇傭司機一樣,AI也將承擔類似角色,成為真正的生產工具。”
VLA司機大模型,即視覺語言行動模型,是理想汽車將AI打造為交通領域專業生產工具的關鍵。李想表示,VLA的實現并非一蹴而就,而是經歷了從依賴規則算法和高精地圖的輔助駕駛,到端到端+VLM(視覺語言模型)輔助駕駛,再到VLA司機大模型的逐步進化。
在VLA的發展過程中,理想汽車克服了端到端模型在處理復雜問題時的局限性,通過引入VLM模型輔助,并開展VLA研究,最終在多項頂級學術會議上發表論文,奠定了堅實的理論基礎。VLA能通過3D和2D視覺的組合,完整地看到物理世界,并具備語言、CoT(思維鏈)推理能力,實現真正的行動執行。
VLA的訓練過程模擬了人類學習駕駛技能的過程,包括預訓練、后訓練和強化訓練三個環節。預訓練相當于人類學習物理世界和交通領域的常識;后訓練則相當于人類去駕校學習開車的過程;強化訓練則類似于人類在社會中實際開車練習,旨在讓VLA司機大模型更加安全、舒適,并符合人類價值觀。
為了確保VLA司機大模型的安全性和解決模型黑盒問題,理想汽車在強化訓練環節投入了大量資源,組建了超級對齊團隊,為司機Agent注入職業素養。同時,理想汽車還打造了真實、符合物理世界規律的世界模型,通過仿真能力低成本、準確地驗證現實問題,有效應對模型黑盒帶來的挑戰。
在談及理想汽車的技術積累時,李想表示,公司從研究、研發到能力表達,再到將能力變成業務價值的過程中,始終堅持自研,通過技術賦能用戶價值。理想汽車在輔助駕駛方面取得了顯著成果,自研底層推理引擎,使芯片能運行VLM模型,實現了雙Orin-X芯片和Thor-U芯片運行同等規模的VLA司機大模型。
李想還分享了公司的開源理念,表示在受益于開源的同時,也選擇開源自研的汽車操作系統——理想星環OS,回饋社會。他強調,在AI時代,扎實的基本功比走捷徑更重要,大型企業的基本功和能力永遠無法被逾越。
在個人成長和創業心態方面,李想表示,他選擇保留有價值的美好片段,用來激勵自己保持正能量。他強調,成長帶來能量,在痛苦中保持正能量是創業路上的關鍵。他感謝團隊的支持和家人的陪伴,認為親密關系同樣重要,能夠形成互補,相互支撐。
李想回顧了自己的創業經歷,表示從高中創辦個人網站至今,自己的思維方式始終未變:遇到問題解決問題,解決別人不愿解決的難題,解決用戶的痛點,不斷向他人學習。他感謝在創業路上遇到的挑戰和幫助,認為這些經歷賦予了理想汽車更多的能力。