在近期舉辦的“2025驍龍峰會·中國”上,AI智能體(Agent)成為芯片供應商、手機與PC制造商以及AI技術解決方案提供商熱議的焦點。業內普遍認為,2025年不僅是AI智能體從云端走向終端設備的關鍵節點,更是其普及應用的重要窗口期。榮耀終端產品線總裁方飛在峰會上指出,今年將開啟“手機智能體與性能的引擎時代”;小米AI產品經理李豪杰則透露,其個性化端側AI已實現無需輸入即可生成內容的功能,并具備環境感知能力;金山辦公生態合作負責人張寧介紹了基于WPS靈犀的“原生Office辦公智能體”,展現了智能體在辦公場景的深度融合。
AI智能體的落地對終端芯片提出了更高要求。谷歌云定義顯示,智能體需具備多模態信息處理能力,可同時處理文本、語音、視頻等數據,并實現自主學習與獨立決策。與被動響應的AI助理不同,智能體能以目標為導向主動完成任務。這一特性依賴于生成式AI與基礎模型的多模態功能,而多模態數據的復雜性需要異構計算架構的支持——以NPU為核心,協同CPU與GPU共同完成計算任務。
高通最新發布的第五代驍龍8至尊版芯片,正是為滿足這一需求設計的異構AI引擎。其核心由自研Oryon CPU、Adreno GPU與全新Hexagon NPU組成,三者分工明確:CPU負責即時響應任務,GPU通過獨立顯存加速AI負載,NPU則專注運行大語言模型與復雜推理。例如,在圖像識別場景中,12個標量加速器可處理經典AI任務并支持大模型推理;8個向量加速器能加速像素級圖像模型,延長語音模型上下文窗口;張量加速器則針對視覺大模型等復雜用例進行優化。芯片集成的傳感器中樞可在保護隱私的前提下,構建用戶個性化知識圖譜。
內存帶寬與模型量化技術是端側部署的另一關鍵。第五代驍龍8至尊版首次支持64位內存架構,使NPU可訪問超4GB RAM,顯著提升大模型訓練效率與推理速度。其LP DDR5x內存頻率達5.2GHz,進一步優化了響應速度。在模型輕量化方面,Hexagon NPU支持的INT2與FP8精度技術,通過降低參數精度減少內存占用,同時保持模型準確性。高通技術總監萬衛星透露,該芯片在三十億參數大語言模型上的出字速度可達220token/s以上。
CPU與GPU的性能突破同樣為智能體提供了算力支撐。第三代Qualcomm Oryon CPU采用4.60GHz超級內核與3.62GHz性能內核,單核性能提升20%,多核性能提升17%,能效提升35%。新一代Adreno GPU性能提升23%,光追性能提升25%,能效優化20%,并首次引入18MB獨立高速顯存。這一設計不僅降低整機功耗10%,提升游戲性能38%,還為AI影像功能(如實時視頻分析、相冊增強)帶來更快的推理響應。
在PC領域,高通同步推出了面向筆記本電腦的驍龍X2 Elite Extreme與驍龍X2 Elite平臺。其中,X2 Elite Extreme集成3nm制程的第三代Oryon CPU,擁有12個超級核心與6個性能核心,主頻達5GHz,成為首款支持該頻率的ARM兼容CPU。其搭載的NPU具備80TOPS AI處理能力,可支持Windows 11 AI+ PC上的并發AI體驗。高通產品管理副總裁Nitin Kumar強調,該NPU的推理性能能滿足生成式AI與智能體的計算需求。
終端廠商與芯片供應商的深度協同,成為推動智能體落地的核心動力。榮耀與高通聯合研發的端側AI模型方案,通過2-bit量化技術將模型存儲空間壓縮30%,推理速度提升15%,功耗降低20%。在峰會現場,榮耀演示的“智能體驅動的圖像AI追色”功能引發關注:用戶通過語音指令,讓智能體YOYO將電影海報風格遷移至故宮照片,整個過程依賴低bit量化存儲與向量檢索技術實現高效處理。雙方開發的新一代向量化檢索技術,通過稠密向量編碼將檢索性能提升400%,多模態感知能力則使個人知識庫構建更便捷。
PC端的創新同樣顯著。金山辦公與高通合作,基于驍龍AI PC架構適配的WPS Office預發布版本顯示,其啟動速度較競品提升20%,15MB Excel文件打開速度領先10%,10MB PPT文件打開速度領先10%。今年7月發布的WPS AI 3.0版本“WPS靈犀”,已實現通過自然語言完成文檔創作、演示生成等功能。張寧表示,未來WPS靈犀將與驍龍AI PC硬件深度融合,構建協同增效的辦公生態。
2025年既是高通成立四十周年,也是其入華三十周年。高通中國區董事長孟樸指出,AI將成為未來三十年與中國合作伙伴合作的核心。高通首席運營官Akash Palkhiwala透露,公司將與本土AI模型提供商及開發者合作,推動智能體AI在更多終端落地,并優化智能手機上的AI功能體驗。











