news 2026/6/25 14:44:19

cann/ops-math矩阵乘压缩解压缩算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
cann/ops-math矩阵乘压缩解压缩算子

MatMulV2CompressDequant

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

产品支持情况

产品是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品×
Atlas A2 训练系列产品/Atlas A2 推理系列产品×

功能说明

  • 算子功能:进行矩阵乘计算时,可先通过msModelSlim工具对右矩阵进行无损压缩,减少内存占用,然后通过本接口完成无损解压缩、矩阵乘和反量化计算。

  • 计算公式

    x2_unzip = unzip(x2, compressIndex, compressInfo) result = (x1 @ x2_unzip + bias) * deqScale

    其中x2表示右矩阵经过msModelSlim工具压缩后的一维数据,x2_unzip是接口内部进行无损解压缩后的数据(与原始右矩阵数据一致)。

参数说明约束说明

参数名输入/输出/属性描述数据类型数据格式
x1输入张量矩阵乘的左输入,2维张量。INT8ND
x2输入张量压缩后的矩阵乘右输入,1维张量。INT8ND
compressIndex输入张量矩阵乘右输入的压缩索引表,1维张量。INT8ND
bias输入张量偏置项,支持空指针传入。INT32ND
deqScale输入张量反量化参数,数据类型为UINT64。UINT64ND
offsetW输入张量矩阵乘右输入的偏移量,当前仅支持空指针传入。INT8ND
offsetX输入属性矩阵乘左输入的偏移量,当前仅支持0。INT32-
compressInfo输入数组压缩数据相关信息,包括压缩块信息和原始shape等。INT64-
out输出张量计算结果输出。FLOAT16ND
  • x1和x2_unzip的Reduce维度大小必须相等。
  • 所有输入张量不支持非连续的Tensor。
  • deqScale需要将原始float类型参数转换为UINT64数据格式。
  • 当前offsetW仅支持空指针,offsetX仅支持0。

调用说明

调用方式样例代码说明
aclnn接口[test_aclnn_matmul_compress_dequant](https://gitcode.com/cann/ops-math/blob/b3ab846cf8647b24507d2844eb4038511025223c/conversion/matmul_v2_compress_dequant/tests/ut/op_host/
op_api/test_aclnn_matmul_compress_dequant.cpp?utm_source=gitcode_repo_files)通过aclnnMatmulCompressDequant接口方式调用MatmulCompressDequant算子。

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 21:36:59

基于SPU-Net与解剖标志的机器人辅助脊柱手术自动规划技术

1. 项目概述:当AI遇见脊柱外科手术刀在脊柱外科手术室里,椎板切除术是一项常规但极其精细的操作。医生需要在毫厘之间,用高速磨钻去除压迫神经的椎板骨质,既要保证减压充分,又要避免损伤紧贴其后的脊髓和神经根。这个过…

作者头像 李华
网站建设 2026/5/9 21:36:58

基于Node.js与Telegram Bot构建本地AI助手:远程调用Claude Code实战

1. 项目概述:将本地Claude Code打造成24小时在线的Telegram机器人如果你和我一样,经常在手机或平板电脑上突然冒出一些代码调试的想法,或者想远程查看一下服务器上的日志,但又懒得打开电脑,那么这个项目绝对值得你花时…

作者头像 李华
网站建设 2026/5/9 21:36:35

MPAI-EEV:AI端到端视频编码如何重塑视频压缩技术格局

1. 项目概述:为什么我们需要关注MPAI-EEV?如果你最近在关注视频技术的前沿动态,大概率会看到一个缩写词在反复出现:MPAI-EEV。这可不是什么新的视频格式,而是一个正在悄然改变游戏规则的技术标准——基于人工智能的端到…

作者头像 李华
网站建设 2026/5/9 21:35:33

游戏技能模拟与自动化工具:从原理到实战构建

1. 项目概述:一个面向游戏技能模拟与数据挖掘的开源工具最近在游戏开发与AI研究社区里,一个名为openclaw-skill-uexcorp-sc的项目引起了我的注意。这个由 RikyZ90 维护的开源仓库,名字本身就透着一股硬核技术味儿。乍一看,“openc…

作者头像 李华
网站建设 2026/5/9 21:29:33

CANN/ATVC向量计算模板库

ATVC 【免费下载链接】atvc ATVC(Ascend C Templates for Vector Compute),是为基于Ascend C开发的典型Vector算子封装的一系列模板头文件的集合,可帮助用户快速开发典型Vector算子。 项目地址: https://gitcode.com/cann/atvc …

作者头像 李华
网站建设 2026/5/9 21:28:34

CANN/ops-math循环填充算子

CircularPad 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持 Ascend 950PR/Ascend 950DT Atlas A3 训练系列产品/Atlas A3 推理系列…

作者头像 李华