news 2026/6/25 16:42:16

CANN/ops-math循环填充算子

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ops-math循环填充算子

CircularPad

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT×
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品×
Atlas 推理系列产品×
Atlas 训练系列产品×
Kirin X90 处理器系列产品
Kirin 9030 处理器系列产品

功能说明

  • 算子功能:使用循环填充方式对输入张量进行填充操作。
  • CircularPad2d:对输入张量的最后两维进行循环填充。
  • CircularPad3d:对输入张量的最后三维进行循环填充。

参数说明

CircularPad2d

参数名输入/输出/属性描述数据类型数据格式
self输入张量待填充的原输入数据,shape支持3-4维。FLOAT16、BFLOAT16、FLOAT32、INT8、INT32ND
padding输入数组填充维度,长度为4,数值依次代表左右上下需要填充的值。INT64-
out输出张量填充后的输出结果,shape支持3-4维。FLOAT16、BFLOAT16、FLOAT32、INT8、INT32ND

CircularPad3d

参数名输入/输出/属性描述数据类型数据格式
self输入张量待填充的原输入数据,shape支持4-5维。FLOAT16、BFLOAT16、FLOAT32、INT8、INT32ND
padding输入数组填充维度,长度为6,数值依次代表左右上下前后需要填充的值。INT64-
out输出张量填充后的输出结果,shape支持4-5维。FLOAT16、BFLOAT16、FLOAT32、INT8、INT32ND
  • Kirin X90/Kirin 9030 处理器系列产品: 不支持BFLOAT16。

约束说明

  • padding值必须小于对应维度的大小。
  • out的最后一维在不同类型下的大小需满足如下约束:
    • int8:(0, 98304)
    • float16/bfloat16:(0, 49152)
    • int32/float32:(0, 24576)
  • 输入和输出的数据类型必须一致。
  • 支持非连续的Tensor。

调用说明

调用方式样例代码说明
aclnn接口test_aclnn_circular_pad通过aclnnCircularPad2d, aclnnCircularPad3d接口方式调用CircularPad2d算子。

【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 21:28:33

CANN torchtitan-npu昇腾训练适配插件

【免费下载链接】torchtitan-npu Ascend Extension for torchtitan 项目地址: https://gitcode.com/cann/torchtitan-npu torchtitan-npu 基于 torchtitan 的昇腾全流程大模型训练适配插件 简介 torchtitan-npu定位为torchtitan的昇腾(Ascend)后端…

作者头像 李华
网站建设 2026/5/9 21:12:30

平头哥C906核的JTAG调试到底怎么搞?用全志D1s实测SDIO引脚复用方案

平头哥C906核的JTAG调试实战:全志D1s引脚复用技术解析 当工程师第一次拿到搭载平头哥C906 RISC-V核心的全志D1s开发板时,最令人头疼的问题莫过于调试接口的缺失。传统串口调试只能提供有限的运行信息,而真正的硬件级调试能力往往隐藏在芯片的…

作者头像 李华
网站建设 2026/5/9 21:11:52

2025最权威的十大AI辅助论文工具实测分析

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 聚焦大语言模型架构创新以及训练优化展开研究的是DeepSeek论文,该模型运用混合专…

作者头像 李华
网站建设 2026/5/9 21:09:45

taotoken助力企业内统一管理多个团队的ai模型调用与成本

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 taotoken助力企业内统一管理多个团队的ai模型调用与成本 当企业内部多个项目组或团队同时接入和使用不同的大模型服务时&#xff0…

作者头像 李华