安謀科技近日正式推出專為端側大模型設計的全新一代NPU IP——“周易”X3。這款產品通過與Arm架構CPU、GPU協同工作,構建起基于Arm生態的異構算力解決方案,標志著端側AI算力進入系統性優化新階段。
研發團隊負責人透露,“周易”X3采用創新的DSP+DSA架構,實現從定點計算向浮點計算的跨越。該架構具備通用性、靈活性和高效性三大特點,通過軟硬件深度協同設計,單Cluster算力覆蓋8-80TFLOPS(FP8),單核心帶寬最高達256GB/s。特別設計的AI專屬硬件引擎AIFF配合硬化調度器,將CPU負載降低至0.5%,調度延遲控制在極低水平。
在軟件生態構建方面,Compass AI平臺已實現與TensorFlow、ONNX、Pytorch等主流框架的無縫對接,支持GPTQ量化方案和Hugging Face模型庫。該平臺可處理LLM、VLM、VLA、MoE等多元模型類型,算子支持數量突破160個,模型兼容性超過270種。實測數據顯示,CNN模型性能較前代提升30-50%,AIGC大模型處理能力提升10倍,多核算力線性度達70-80%,大模型Prefill階段算力利用率提升至72%,Decode階段有效帶寬利用率在開啟自研解壓引擎WDC后突破100%。
發布會現場演示環節展示了多個落地場景:基于“周易”X3的AI PC可本地運行MinicpM v2.6模型,實現實時拍照識圖功能;在文生圖應用中,Stable Diffusion v1.5模型運行流暢,圖片生成速度達到秒級;文生文場景下,DeepSeek-R1-Distill-Qwen-1.5B模型顯著提升了對話流暢度和tokens生成效率。這些案例驗證了新一代NPU在提升AI應用體驗流暢度方面的突破性進展。
該技術已形成完整解決方案矩陣,覆蓋加速卡、AI PC、AI手機、具身智能、智能座艙、ADAS及智能IPC等多個領域。自2018年組建國內首個NPU研發團隊以來,安謀科技已交付五代產品,形成100%本土化的研發支持體系。當前戰略聚焦"AI Arm China"方向,通過持續迭代NPU產品線,為端側AI爆發提供核心算力支撐。












