近日,理想汽車創始人李想在“理想AI Talk第二季”活動中,深入探討了人工智能的最新發展趨勢以及理想汽車在智能駕駛和AI領域的布局策略。他分享道,在短短130天內,他見證了中國AI技術的顯著進步,特別是DeepSeek、千問等國內模型在基座模型、推理和多模態方面已與美國水平相當。
李想特別贊揚了中國企業在模型效率上的卓越表現,尤其是DeepSeek V3的混合專家模型(MoE)架構,其671B參數和極簡的“人類最佳實踐”運用,給他留下了深刻印象。然而,他也坦誠地表示,盡管AI技術日新月異,他的工作時間卻并未減少,反而有所增加。他認為,這主要是因為大多數人仍將AI視為一種信息工具,依賴于聯網搜索和檢索增強生成(RAG),但信息源的不準確可能導致推理過程和結果出錯,增加了無效信息。
為了更準確地描述AI工具的價值,李想將其分為三類:信息工具、輔助工具和生產工具。他堅信,只有當AI真正成為生產工具,能夠替代人類完成專業工作,產生有效生產力時,其價值才會真正爆發。他預測,未來的Agent將不再是通用的,而是每個專業領域都會有專業的Agent,因為不同領域的語料、行動和思維鏈截然不同。
對于DeepSeek,李想給予了高度評價,并透露其開源對理想汽車的自動駕駛研發產生了巨大幫助,特別是加速了VLA模型中的語言部分約9個月的時間。為了回饋社會,理想汽車決定將自研四年的整車操作系統理想星環OS開源,這并非出于公司戰略考慮,而是源于一種樸素的情懷和對社會的貢獻。
盡管擁抱了DeepSeek,但理想汽車并未放棄自研基座模型團隊,反而加大了投入。李想解釋說,理想汽車的業務場景特殊,車載環境需要針對性的基座模型,包括3D視覺、高清2D視覺、交通/駕駛/家庭領域專業語料以及視覺與語言聯合語料。這些數據和場景是通用大模型所不具備的。因此,理想汽車正在訓練不同規模的模型,以滿足車載智能助手和輔助駕駛的需求。
李想將理想汽車的智能駕駛發展劃分為三個階段:從規則算法階段(昆蟲智能)到端到端+VLM階段(哺乳動物智能),最終邁入VLA(視覺、語言、行動模型)階段(人類智能)。他將車載VLA稱為“司機大模型”,目標是使其像人類司機一樣工作。他認為,交通領域是實現VLA的最佳實驗場,因為規則清晰、環境確定、車輛控制自由度相對較低。為了確保VLA的安全性,理想汽車組建了百人規模的“超級對齊”團隊,負責確保模型遵守交通規則、符合人類駕駛習慣,保證安全和舒適性。
理想汽車還構建了基于重建和生成的交通世界模型,以在虛擬環境中模擬真實場景,提高驗證效率并解決模型黑盒問題。李想強調,邁向VLA需要前期積累,不能急于求成。他回顧了理想汽車自2021年開始自研輔助駕駛的歷程,在操作系統、訓練體系、底層芯片軟件優化等方面都進行了深入投入。面對行業競爭,他認為應學習頂尖公司的基本功,因為能力強的公司在AI時代能迅速復制創新,只有基礎扎實才能應對挑戰。
在個人成長和能量方面,李想認為關鍵在于關注人,尤其是親密關系。他通過持續的成長來獲取和傳遞能量,并看到了家人和團隊的成長帶來的巨大能量。他相信AI應幫助人類有更多時間與“萬物”接觸,獲取智慧。最后,他強調在AI時代應保留人性的所有特質,因為它們共同構成了生命的活力。