手機廠商正站在AI技術變革的前沿,以vivo、OPPO、榮耀為代表的頭部企業,通過密集的技術發布與生態布局,將AI終端競爭推向新階段。在近期舉辦的開發者大會上,AI戰略升級成為核心議題,各家不僅展示了端側多模態技術的突破性進展,更暴露出端云協同、生態共建與商業落地的深層挑戰。
端側多模態能力正重塑手機交互邏輯。vivo推出的18項端側智能應用中,卡證識別、UI Agent等功能已突破傳統語音助手的簡單指令模式,實現通過自然語言完成備忘錄創建、賬單自動記錄等復雜操作。OPPO的“一鍵問屏”技術則讓AI具備實時理解屏幕內容的能力,用戶可指著實體物品進行語音查詢,而“一鍵閃記”功能通過掃描小票或微信支付記錄,自動完成消費分類與提醒。榮耀披露的3000余個自動化場景,涵蓋一鍵比價、自動領券、語音打車等跨應用操作,將原本需要多次切換App的流程壓縮為單一指令。
技術演進呈現三大趨勢:輕量化模型、深度推理與GUI操控。今年發布的端側模型普遍聚焦3B參數規模,如榮耀的7B多模態感知大模型、vivo的3B多模態推理大模型及OPPO的0.6B-4B四檔套件。這些模型通過低比特量化與端側Lora訓練技術,在保持性能的同時將體積壓縮至傳統模型的1/3以下。更關鍵的是,端側推理模型已具備類似云端的深度思考能力,可處理復雜邏輯問題;GUI Agent技術則通過模擬人類操作界面,實現對第三方應用的主動操控,無需依賴API接口。
端云協同的矛盾日益凸顯。盡管手機廠商普遍采用端云混合架構,但云側模型調用仍面臨多重困境。某手機廠商技術負責人透露,云廠商提供的API版本通常滯后內部最新模型3-6個月,且存在數據主權擔憂——云服務商既怕手機廠商通過本地數據優化出更優模型,又擔心自身技術被超越。這種矛盾促使廠商將重心轉向端側:vivo的3B模型在文本摘要任務中已達到云側大模型98%的準確率,而運行內存占用從7B模型的4GB降至可接受范圍。
商業落地遭遇成本與生態雙重瓶頸。高頻調用云側ASR模型進行語音轉錄,每小時成本高達2元,這對出貨量以億計的手機廠商而言是巨大負擔。更棘手的是,缺乏殺手級應用導致用戶感知薄弱,芯片廠商因此對高端AI算力芯片持觀望態度。高通驍龍與聯發科天璣最新旗艦芯片雖具備100TOPS算力,但若缺乏應用場景支撐,高算力將直接推高芯片成本,形成惡性循環。
智能體生態建設進入深水區。當前自動化功能多局限于系統級應用,跨第三方App操作仍需解決安全授權標準。vivo通過構建“通控設施組”向生態伙伴開放屏幕感知、任務規劃等基礎能力,OPPO則將智能體框架作為跨設備協同的核心平臺。榮耀的MCP架構已接入4000余個生態智能體,并嘗試聯動硬件生態。螞蟻集團等互聯網廠商已嘗到甜頭,其AI健康智能體在vivo生態中的流量份額半年增長300%,但多數App廠商仍擔憂數據共享與流量分配問題。GUI大模型成為折中方案——AI僅模擬界面操作,關鍵節點仍需用戶確認,既保留App價值,又實現自動化升級。
在這場AI終端競賽中,手機廠商正從技術追隨者轉向生態定義者。他們既要突破端側模型性能極限,又要平衡云側合作與數據主權,更要說服互聯網廠商共享生態紅利。正如某廠商AI負責人所言:“這不僅是技術戰,更是關于未來數字世界話語權的爭奪。”當3B模型開始媲美云端性能,當GUI操控突破應用邊界,手機AI的進化或許才剛剛揭開序幕。











