近日,安謀科技正式發佈新一代 NPU IP “周易” X3。該產品採用最新 DSP+DSA 架構,可靈活支持端側多任務場景。
據瞭解,其配套的 “周易” NPU Compass AI 軟件平台優化大模型端到端性能,新增對 Hugging Face 模型庫的原生支持,支持超 160 種算子、270 種模型。
“周易” X3 採用專為大模型設計的 DSP + DSA 架構,兼顧 CNN 與 Transformer,並協同完善的 “周易” NPU Compass AI 軟件平台,旨在為基礎設施、智能汽車、移動終端及智能物聯網四大領域提供高效 AI 計算核心,加速端側 AI 部署。
硬件方面,“周易” X3 具備 8-80 FP8 TFLOPS 算力,單 Core 帶寬高達 256 GB/s,支持 W4A8/W4A16 計算加速模式,並集成自研 WDC 解壓硬件,使大模型權重壓縮後可獲得額外約 15% 的等效帶寬。其 AIFF 硬件引擎與專用調度器可將 CPU 負載降至 0.5%,顯著提升並行任務處理效率。
性能方面,“周易” X3 CNN 模型性能較上一代提升 30%-50%,AIGC 大模型能力提升 10 倍。實測數據顯示,Prefill 階段算力利用率達 72%,Decode 階段在開啓 WDC 情況下有效帶寬利用率超過 100%,充分釋放硬件潛力。
平台已開源 Parser、Optimizer、Linux Driver、TVM 等核心組件,並支持 DSL 算子編程語言,初期已支持超 160 種算子與 270 多種模型,提升開發與部署效率。