國內芯片IP設計與服務領域的領軍企業安謀科技近日在上海舉辦新品發布會,正式推出新一代“周易”X3 NPU,標志著其“All in AI”產品戰略進入實質性落地階段。這款專為端側AI計算設計的處理器,憑借多項技術創新成為全場焦點,其性能指標與架構設計均達到行業領先水平。
作為安謀科技自研IP矩陣的核心成員,“周易”X3 NPU采用專為大模型優化的DSP+DSA通用架構,首次實現CNN與Transformer架構的深度融合。該架構支持單Cluster叢簇配置最多4個核心,FP8算力覆蓋8至80 TFlops區間,核心帶寬高達256GB/s。這種設計使其能夠靈活適配從智能汽車到移動終端的多樣化場景,為AI加速卡、智能座艙、ADAS系統等提供端側計算支持。
架構層面的突破性創新體現在四大核心模塊:自研解壓硬件WDC通過軟件無損壓縮技術,將等效帶寬提升15-20%;新增的W4A8/W4A16計算模式專為大模型優化,在保持精度的同時降低帶寬消耗;AIFF硬件引擎與專用調度器的組合,使CPU負載降至0.5%以下;多精度融合計算支持INT4/8/16/32及FP4/8/16/32等數據類型,平衡性能與能效的靈活性達到新高度。
實測數據顯示,相比前代X2型號,X3在CNN模型性能上提升30-50%,多核算力線性度達到70-80%。在AIGC大模型場景中,其綜合性能實現10倍躍升,這得益于FP16算力、核心帶寬及Softmax性能的協同優化。以Llama2 7B模型測試為例,Prefill階段算力利用率達72%,Decode階段在WDC硬件加持下有效帶寬利用率突破100%,顯著超越行業平均水平。
配套發布的“周易”Compass AI軟件平臺構成完整解決方案。該平臺通過NN Compiler神經網絡編譯器整合模型解析、優化、生成等全流程工具,支持超過160種算子與270種模型。其創新性的Hugging Face“一鍵部署”功能,可直接處理主流AI框架模型,配合動態shape支持與多樣化量化方案,將開發門檻降低60%以上。平臺還提供Bit精度仿真環境與多層次調試工具,支持Android、Linux等操作系統及SoC異構計算。
發布會現場展示了“周易”系列產品的完整布局:Z1型號以0.32-3.75 TOPS算力覆蓋AIoT場景,已應用于智能音箱等產品;Z2/Z3型號支持1.25-5 TOPS算力,面向入門級座艙市場;X1型號10 TOPS算力服務高端AIoT設備;X2型號在10-30 TOPS區間實現端側多模態運行,現場演示了Stable Diffusion文生圖功能;最新X3型號則通過8-80 FP8 TFLOPS算力,在DeepSeek-R1-Distill等主流大模型上展現出實時文生文、圖生文等交互能力。
安謀科技自2018年組建國內首個NPU研發團隊以來,已形成覆蓋CPU、SPU、多媒體處理的全棧自研體系。此次“周易”X3的發布,不僅完善了其AI計算產品矩陣,更通過軟硬協同的完整生態,為智能汽車、移動終端、物聯網等領域的大模型端側部署提供了關鍵基礎設施。隨著AIGC技術向邊緣側滲透,這款具備全棧自主能力的NPU有望成為推動端側AI普及的重要力量。











