在人工智能領域,一場從數字世界向物理世界的躍遷正在悄然發生。十一年前,王曉剛與湯曉鷗共同推動計算機視覺識別率首次超越人類肉眼,開啟了人工智能1.0時代。如今,當行業沉浸在大語言模型的狂歡中時,王曉剛卻將目光投向了更具挑戰性的領域——具身智能。他直言:“現有研究范式已陷入瓶頸,唯有以人類行為為核心重構物理規律,才能叩開AI 3.0的大門。”
2025年被視為具身智能發展的關鍵節點。王曉剛指出,當前大語言模型依賴的互聯網語料正面臨枯竭危機,純粹的數字世界探索已觸及天花板。具身智能通過與物理世界的交互產生新智能,成為突破這一困境的核心路徑。然而,現實中的機器人仍難以走出實驗室:在復雜環境中,它們因缺乏常識而屢屢受挫,演示中的“高光時刻”難以轉化為實際場景中的穩定表現。
面對這一困境,王曉剛提出“以人為中心”的新研究范式。他回憶道,2025年初,團隊在南洋理工大學劉子緯教授帶領下,開創了“環境式采集”技術。通過第一視角攝像頭、穿戴式傳感器及全景相機,記錄人類在真實生產生活中的行為數據。這種模式不僅將數據量級從十萬小時提升至千萬小時,更解決了數據采集效率低、場景單一的問題。例如,在杭州某前置倉試點中,工作人員佩戴設備工作10小時即可采集同等時長數據,且覆蓋上萬種商品,效率較傳統遙操作提升百倍。
在商業化落地層面,大曉機器人選擇了軟硬協同的垂直整合路徑。其推出的“具身超級大腦模組A1”已應用于四足機器人,實現戶外自主導航與語音任務執行。通過與商湯方舟平臺打通,機器人可直接調用150余種AI應用,價值鏈條得以延伸。王曉剛透露,未來三年將聚焦三大場景:短期以電力巡檢、文旅等戶外場景為主,中期攻克前置倉分揀難題,長期目標則是家庭服務機器人。
值得關注的是,大曉機器人選擇在此時開源“開悟3.0”模型及工具鏈,并完成與沐曦、海光等國產芯片的深度適配。王曉剛解釋,開源不僅能快速建立生態優勢,更可通過云服務部署實現商業閉環。他以DeepSeek為例,強調先發優勢的重要性:“當高質量開源項目形成聚集效應,芯片廠商會主動適配,生態壁壘自然形成。”
談及公司命名,王曉剛笑稱“大曉”源于他與首席科學家陶大程的師兄弟情誼,但更深層的含義藏在發布會主題中——“大千世界,曉識萬象”。這八個字,既是對世界模型理解物理世界的期許,也是對環境式采集感知交互規律的詮釋。在這場從數字到物理的躍遷中,王曉剛正帶領團隊書寫新的規則。










