近期,多款應(yīng)用對(duì)努比亞M53(豆包手機(jī))的封禁名單持續(xù)擴(kuò)大,微信、支付寶、拼多多、淘寶等主流電商平臺(tái),以及多家銀行類(lèi)應(yīng)用,均在不同程度上限制了用戶在該機(jī)型上的登錄與使用。這一現(xiàn)象背后,折射出智能體AI與現(xiàn)有互聯(lián)網(wǎng)生態(tài)之間的深層矛盾。
以“幫我比價(jià)下單”為例,豆包手機(jī)助手通過(guò)GUI Agent技術(shù),讓AI直接解析手機(jī)界面元素,模擬用戶操作流程,實(shí)現(xiàn)從跳轉(zhuǎn)頁(yè)面到完成結(jié)算的全自動(dòng)化。這種不依賴(lài)官方接口的交互方式,雖在技術(shù)上具有突破性,卻對(duì)平臺(tái)規(guī)則、安全邊界構(gòu)成挑戰(zhàn)。類(lèi)似案例還包括亞馬遜對(duì)Comet AI的警告——后者通過(guò)解析網(wǎng)頁(yè)結(jié)構(gòu)繞過(guò)平臺(tái)推薦體系,直接向用戶提供商品篩選建議,引發(fā)商業(yè)鏈路爭(zhēng)議。
GUI路線的核心困境在于,其試圖以“模擬人類(lèi)操作”的方式突破平臺(tái)壁壘,卻忽視了互聯(lián)網(wǎng)生態(tài)的復(fù)雜性。當(dāng)智能體AI跳過(guò)產(chǎn)品邏輯與風(fēng)控體系,平臺(tái)將面臨三重風(fēng)險(xiǎn):操作場(chǎng)景失控、數(shù)據(jù)交互失序、責(zé)任歸屬模糊。工信部中國(guó)信通院發(fā)布的《端云協(xié)同智能體交互雙重授權(quán)安全指引》明確指出,智能體需同時(shí)獲得應(yīng)用方與用戶授權(quán),方可合法訪問(wèn)第三方服務(wù),這進(jìn)一步凸顯了GUI模式的合規(guī)性短板。
與GUI的“野蠻生長(zhǎng)”形成對(duì)比,MCP(大模型上下文協(xié)議)正成為行業(yè)共識(shí)。該協(xié)議由Anthropic最初為Claude開(kāi)發(fā),旨在通過(guò)統(tǒng)一標(biāo)準(zhǔn)接口降低大模型與外部系統(tǒng)的集成成本。開(kāi)發(fā)者遵循JSON-RPC規(guī)范,即可將文件系統(tǒng)、數(shù)據(jù)庫(kù)等工具接入AI模型,類(lèi)似USB-C接口的通用性使其迅速蔓延。2024年中以來(lái),VS Code、OpenAI、Google等企業(yè)相繼將其納入技術(shù)棧,阿里云、字節(jié)跳動(dòng)等國(guó)內(nèi)廠商也在項(xiàng)目中采用MCP作為互聯(lián)標(biāo)準(zhǔn)。
MCP的突破性在于,它為智能體AI構(gòu)建了“能力層”交互框架。以查詢訂單為例,GUI路線需通過(guò)解析界面文本、定位按鈕等多步驟完成,而MCP模式下可直接發(fā)起“查詢-返回-處理”的能力請(qǐng)求,將交互效率提升數(shù)個(gè)量級(jí)。更重要的是,協(xié)議層可顯性定義權(quán)限邊界:平臺(tái)可明確哪些數(shù)據(jù)可讀、哪些操作需二次確認(rèn)、哪些業(yè)務(wù)永久封閉,從而在保障用戶體驗(yàn)的同時(shí)維護(hù)生態(tài)秩序。
行業(yè)對(duì)MCP的押注已從技術(shù)層面延伸至治理層面。2025年12月,Anthropic將該協(xié)議捐贈(zèng)給Linux基金會(huì),標(biāo)志著其從企業(yè)標(biāo)準(zhǔn)升級(jí)為行業(yè)基礎(chǔ)設(shè)施。與此同時(shí),Agentic AI基金會(huì)同步推進(jìn)OpenAI捐贈(zèng)的AGNTS.md(智能體使用說(shuō)明標(biāo)準(zhǔn))與Google捐贈(zèng)的Block(工作流構(gòu)建框架),形成“協(xié)議-規(guī)范-框架”的完整生態(tài)。Google推出的遠(yuǎn)程MCP服務(wù)器,更將智能體接入地圖、BigQuery等云端服務(wù);阿里云百煉平臺(tái)則提供全生命周期MCP服務(wù),覆蓋從開(kāi)發(fā)到部署的全流程。
盡管MCP代表未來(lái)方向,但GUI路線仍具有現(xiàn)實(shí)價(jià)值。在互聯(lián)網(wǎng)生態(tài)改造完成前,GUI可作為“兜底方案”,確保智能體在未適配環(huán)境中維持基礎(chǔ)功能。而MCP將逐步承擔(dān)跨系統(tǒng)、跨平臺(tái)的底層互聯(lián)職責(zé),通過(guò)清晰權(quán)限管理構(gòu)建有序生態(tài)。兩者共存的局面下,終端設(shè)備上的系統(tǒng)級(jí)智能體將扮演協(xié)調(diào)者角色:理解用戶目標(biāo),整合設(shè)備、平臺(tái)與服務(wù)資源,在規(guī)則框架內(nèi)完成跨生態(tài)任務(wù)。這種“OS統(tǒng)籌入口、協(xié)議溝通服務(wù)、模型靈活切換”的模式,或?qū)⒊蔀橹悄荏wAI的終極形態(tài)。










