安謀科技近日正式推出新一代專為端側大模型設計的NPU IP——“周易”X3。這款產品通過與Arm架構的CPU、GPU協同工作,構建起基于Arm生態的異構計算解決方案,為端側AI應用提供更強大的算力支持。
據介紹,“周易”X3在多個關鍵領域實現突破性升級,包括模型兼容性、硬件架構效率、軟件生態適配、算力帶寬優化、能效表現以及系統擴展性。安謀科技產品研發負責人表示,該團隊自2018年成立以來,已成功交付五代NPU產品,并實現終端領域的商業化應用,所有研發工作均由中國本土團隊獨立完成。
硬件架構方面,“周易”X3采用DSP+DSA混合架構,支持從定點到浮點的計算轉換。其單集群算力范圍覆蓋8-80TFLOPS(FP8精度),單核帶寬最高可達256GB/s。通過配備AI專屬硬件引擎AIFF和專用調度器,該方案將CPU負載降低至0.5%,同時顯著減少調度延遲。在模型支持能力上,新平臺可處理超過160種算子類型,兼容270余種模型架構。
軟件生態建設取得重要進展,其Compass AI平臺已實現與TensorFlow、ONNX、PyTorch等主流框架的無縫對接,并支持大模型動態Shape處理、GPTQ量化方案、Hugging Face模型庫以及LLM、VLM等多元模型類型。性能測試顯示,CNN模型處理效率較前代提升30-50%,AIGC大模型處理能力提升近10倍,多核算力線性度達到70-80%,大模型Prefill階段算力利用率提升至72%,Decode階段在啟用自研解壓引擎WDC后有效帶寬利用率突破100%。
發布會現場演示了多個應用場景:基于“周易”X3的AI PC可本地運行MinicpM v2.6模型,實現實時圖像識別功能;在文生圖領域,搭載Stable Diffusion v1.5的設備能以秒級速度生成高質量圖像;文生文應用中,DeepSeek-R1-Distill-Qwen-1.5B模型的運行流暢度和響應速度均有顯著提升。這些案例表明,新一代產品在性能提升和生態完善的雙重作用下,大幅改善了端側AI的實際使用體驗。
目前,“周易”X3已形成覆蓋多領域的解決方案矩陣,其應用場景延伸至加速卡、AI PC、智能手機、具身智能、智能座艙、ADAS系統以及智能監控設備等終端產品。該平臺通過提供NPU IP授權、開放技術合作和完整解決方案,持續推動本土端側AI技術的規模化落地。











