在智能駕駛領域,盡管輔助駕駛技術已實現了全國范圍內的廣泛應用,但用戶從“可用”到“信賴”的轉變依然面臨巨大挑戰。核心問題在于用戶對于智能駕駛系統的“安心感”嚴重不足,這主要歸因于系統決策的不可解釋性、對盲區預判能力的欠缺以及人機交互的機械性。
為了破解這一難題,理想與元戎啟行等前沿企業紛紛押注VLA(視覺-語言-動作)模型技術,旨在通過技術升級,打通智能駕駛體驗的“最后一公里”。VLA模型的核心在于利用語言模型增強系統的推理能力,使其對社會常識有更深入的理解,從而有效應對各種長尾場景。
當前智能駕駛面臨的挑戰主要包括:模型決策的不可解釋性、防御型駕駛能力的不足以及人機交互的機械性。用戶對于智能駕駛系統為何會突然加速、減速或退出缺乏了解,這種信息的不透明導致用戶難以建立對系統的信任。同時,防御型駕駛能力的缺失也是智能駕駛的一大短板,尤其是在面對如高架橋橋墩盲區等復雜場景時,系統往往只能采取緊急制動等被動措施,而無法提前預判并規避風險。
針對這些問題,理想與元戎啟行通過VLA模型進行了全面升級。用戶現在可以通過語音指令控制車輛的動作、車速以及車道選擇等,甚至還能實現豪車識別功能,當遇到豪車時,智能駕駛系統會采取更加謹慎的駕駛策略。這一升級不僅提升了用戶體驗,也展示了VLA模型對場景的深刻理解和精準預判能力。
VLA模型還具備空間語義理解、異形障礙物識別以及文字類引導牌理解三大功能??臻g語義理解功能使得系統能夠預判行車中的交通盲區,如通過無紅綠燈路口時,VLA模型能提前識別到指示牌并做出準確決策。異形障礙物識別功能則解決了智能駕駛在極端路況下的算法長尾問題,系統能夠識別并應對各種變形或超載的障礙物。而文字類引導牌理解功能則大大增強了系統對路牌信息的識別和理解能力,使得智能駕駛系統能夠按照路牌引導內容行駛。
元戎啟行正在通過VLA模型打造具備防御型駕駛能力的AI司機。據悉,元戎的VLA模型將在第三季度量產上車5款車型。這一進展不僅標志著智能駕駛技術取得了重大突破,也為下半年的智能駕駛市場競爭注入了新的活力。隨著VLA技術的不斷成熟和量產應用的推進,智能駕駛系統能否具備更長遠的思維和推測能力,將成為衡量智駕玩家能否進入第一梯隊的關鍵指標。