當大模型參數競賽逐漸失去懸念,科技巨頭們正將目光投向更貼近用戶的終端戰場。阿里與字節跳動近期在AI硬件領域的密集動作,標志著這場爭奪下一代人機交互入口的較量已進入白熱化階段。前者一口氣推出六款AI眼鏡,后者則將智能助手深度植入手機系統,兩種截然不同的技術路線背后,是相同的戰略野心——重塑用戶與數字世界的連接方式。
這場變革的驅動力源于行業認知的深刻轉變。過去兩年,大模型能力競賽主導了AI發展主線,但2024年下半年以來,頭部企業紛紛放緩模型迭代節奏。OpenAI與Anthropic推遲新品發布,國內主流模型在理解能力上的差距日益縮小,用戶對技術突破的敏感度持續下降。技術供給與市場需求之間的錯位,迫使行業重新思考價值創造的關鍵節點——如何將模型能力轉化為用戶可感知的服務體驗。
終端設備的戰略價值在此背景下凸顯。阿里智能終端業務負責人指出,端側設備不僅是模型能力的輸出終端,更是訓練數據的反饋閉環。用戶每次交互產生的行為數據,都在持續優化模型性能。這種"端云協同"的生態閉環,使得掌控硬件入口的企業獲得數據采集、系統調用和用戶交互的完整控制權。當AI進入"代理階段",用戶期待的不再是簡單問答,而是跨應用的任務閉環執行,這對操作系統權限和硬件感知能力提出全新要求。
阿里選擇的路徑是創造新物種。其發布的六款AI眼鏡摒棄消費電子產品的時尚屬性,聚焦功能完整性設計。這款被定位為"個人移動入口"的設備,試圖通過語音交互重構任務執行邏輯:用戶只需發出指令,設備即可自動完成拍照、識別場景、發布內容等復雜操作。這種顛覆性設計背后,是阿里構建"感知-決策-執行"完整鏈條的野心。通過自有硬件打通數據采集、模型訓練和場景落地的全流程,阿里希望在下一代入口爭奪中占據先機。
字節跳動則采取軟件定義硬件的策略。與中興合作的工程樣機搭載的豆包助手,將AI能力深度植入操作系統底層。這款具備完整任務鏈執行能力的智能助手,能夠理解屏幕界面元素、模擬點擊操作、實現跨應用跳轉。當用戶提出"將收藏餐廳標記在地圖"的需求時,系統可自動拆解為信息提取、地圖標注、票務預訂等六個步驟。這種對操作系統主控邏輯的重構,使AI從應用功能升級為系統入口,用戶無需打開特定應用即可完成復雜任務。
兩種技術路線折射出不同的戰略考量。阿里通過自有硬件建立數據護城河,確保模型迭代所需的持續反饋;字節則借助系統級整合快速滲透現有設備生態,其Ocean部門整合的硬件資源已覆蓋手機、VR、耳機等多個領域。這種差異化的布局背后,是相同的技術判斷:AI價值創造的重心正在從云端向終端遷移,掌握入口控制權的企業將主導未來平臺格局。
現實挑戰同樣不容忽視。豆包手機助手雖備貨50萬臺,但3499元的定價和極客定位限制了市場滲透。其任務鏈執行穩定性、屏幕識別準確率等技術指標仍需驗證,特別是在多應用協同、異常處理和安全容錯等關鍵環節。阿里AI眼鏡則面臨傳感器精度、續航能力和算力集成等硬件瓶頸,要實現環境感知、意圖理解和動作執行的完整閉環,仍需突破多模態推理和場景建模的技術門檻。
用戶接受度是另一個變量。當AI助手獲得系統級權限,能夠繞過用戶主動操作自動執行任務時,數據安全、隱私保護和支付風險等問題隨之浮現。盡管當前產品保留人工確認機制,但代理型AI的權限邊界和監管標準尚未明確,這可能成為技術普及的潛在障礙。不過這些挑戰并未削弱科技巨頭的投入決心,谷歌AI眼鏡進入概念驗證階段,小米、理想在車載和可穿戴領域持續發力,全球范圍內正形成新一輪入口爭奪戰。
這場競賽的本質是平臺控制權的遷移。當模型能力差距縮小,用戶體驗成為差異化競爭的核心,終端設備正從功能載體升級為價值創造的戰略支點。無論是創造新入口還是改造舊系統,科技巨頭們都在押注一個共同未來:在AI重塑數字生活的進程中,誰掌握終端控制權,誰就能定義下一代交互標準,進而主導萬億級智能生態的演進方向。













