news 2026/6/25 11:32:34

CANN神经网络算子库更新日志

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN神经网络算子库更新日志

CHANGELOG

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

本文档记录各版本的重要变更,版本按时间倒序排列。

v9.0.0-beta.2

发布日期:2026-03-30

本版本新增多项新增特性、问题修复及性能改进,支持最新的950硬件。 我们诚挚欢迎社区反馈,以进一步提升 ops-nn 的稳定性和功能完备性。 使用方式请参阅官方文档。

CANN 9.0.0-beta.2

版本目录说明如下: ├── aarch64 # CPU为ARM类型 │ ├── ops # ops算子包目录,用于归档算子子包 │ ├── ... ├── x86_64 # CPU为X86类型 │ ├── ops # ops算子包目录,用于归档算子子包 │ ├── ...

📌 版本配套

CANN独立升级子包版本配套关系

| CANN子包版本 | 版本源码标签 | 配套CANN版本| |--|--|--| | cann-ops-math 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-ops-nn 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-ops-cv 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-ops-transformer 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-hccl 9.0.0-beta.2 | CANN 9.0.0-beta.2 | | cann-hixl 9.0.0-beta.2 | CANN 9.0.0-beta.2 |

CANN开源子包版本配套关系

CANN子包版本版本源码标签配套CANN版本
cann-opbase 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-oam-tools 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-asc-tools 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-asc-devkit 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-pto-isa 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-ge-compiler 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-ge-executor 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-graph-autofusion 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-metadef 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-dflow-executor 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-hcomm 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2
cann-npu-runtime 9.0.0-beta.2v9.0.0-beta.2CANN 9.0.0-beta.2

🚀 关键特性

  • 【工程能力】静态库工程适配 !391
  • 【工程能力】算子工程适配950 !450
  • 【工程能力】新增支持按模板编译特定算子kernel能力#1097
  • 【新特性】950支持PyTorch view的算子融合优化 #864
  • 【新特性】950支持SIMD/SIMT新同构编程(#660、#710、#668、#656、#658)

🐛 问题修复

  • ScatterNd算子确定性计算按列分核偏移修复(!3137)
  • scatter_elements 确定性模板(!3092)
  • Matmul算子FP32场景下单核切K模板的精度(!2651)

v8.5.0-beta.1

发布日期:2025-12-30

ops-nn 算子首个 Beta 版本 v8.5.0-beta.1 现已发布。 本版本引入了多项新增特性、问题修复及性能改进,目前仍处于测试阶段。 我们诚挚欢迎社区反馈,以进一步提升 ops-nn 的稳定性和功能完备性。 使用方式请参阅官方文档。

🔗 版本地址

CANN 8.5.0-beta 1

版本目录说明如下: ├── aarch64 # CPU为ARM类型 │ ├── ops # ops算子包目录,用于归档算子子包 │ ├── ... ├── x86_64 # CPU为X86类型 │ ├── ops # ops算子包目录,用于归档算子子包 │ ├── ...

📌 版本配套

CANN独立升级子包版本配套关系

| CANN子包版本 | 版本源码标签 | 配套CANN版本| |--|--|--| | cann-ops-math 8.5.0-beta.1 | CANN 8.5.0-beta.1 | | cann-ops-nn 8.5.0-beta.1 | CANN 8.5.0-beta.1 | | cann-ops-cv 8.5.0-beta.1 | CANN 8.5.0-beta.1 | | cann-ops-transformer 8.5.0-beta.1 | CANN 8.5.0-beta.1 | | cann-hccl 8.5.0-beta.1 | CANN 8.5.0-beta.1 | | cann-hixl 8.5.0-beta.1 | CANN 8.5.0-beta.1 |

CANN开源子包版本配套关系

CANN子包版本版本源码标签配套CANN版本
cann-opbase 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-oam-tools 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-asc-tools 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-asc-devkit 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-pto-isa 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-ge-compiler 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-ge-executor 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-graph-autofusion 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-metadef 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-dflow-executor 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-hcomm 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1
cann-npu-runtime 8.5.0-beta.1v8.5.0-beta.1CANN 8.5.0-beta.1

🚀 关键特性

  • 【工程能力】nn类onnx算子插件支持。(#452)
  • 【工程能力】增加编译选项oom、asan、mssanitizer、build-type等工程级稳定性与可调试性能力。(#391)
  • 【算子实现】部分算子新增对KirinX90支持。(#609、#610、#612)
  • 【算子实现】新支持稀疏4:2量化matmul算子,针对稀疏矩阵使能硬件加速能力。(#429)
  • 【资料优化】增加QUICK_START,离线编译模式,aicore/aicpu/graph模式下开发指南完善。(#702、#562)
  • 【资料优化】优化贡献指南中新算子贡献流程。(#294)
  • 【性能优化】增加asc_opc算子并行编译能力,优化编译效率;增加ccache,优化编译时长。(#692)

🐛 问题修复

  • 修复conv类算子编译告警问题。(Issue33)
  • 使用constexpr修饰if使能编译优化。(Issue98)
  • add_example样例算子执行调用问题修复。(Issue245)

【免费下载链接】ops-nn本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-nn

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/9 22:01:09

从停机问题到AI责任归属:技术边界与可问责系统构建

1. 项目概述:一个横跨技术与法律的交叉议题最近和几位做算法开发的朋友聊天,大家不约而同地提到了一个越来越现实的问题:我们写的代码、训练的模型,如果出了问题,责任算谁的?这让我想起了计算机科学里那个经…

作者头像 李华
网站建设 2026/5/9 22:00:49

开源OSINT工具iGotcha:模块化数字痕迹追踪与信息聚合实战

1. 项目概述:一个被低估的“数字足迹”追踪利器 最近在整理一些开源情报分析(OSINT)工具时,我又重新审视了一个老项目: akasumitlamba/iGotcha 。这个名字听起来有点意思,直译过来就是“我抓到你了”。它…

作者头像 李华
网站建设 2026/5/9 22:00:27

机器学习赋能质谱数据分析:从模型选型到行星探测实战

1. 项目概述:当质谱遇见机器学习如果你在生物化学、环境科学或者天体物理领域工作,那么质谱仪对你来说一定不陌生。这台“分子秤”能告诉我们样品里有什么、有多少,数据量巨大,但解读起来常常让人头疼。传统的分析方法&#xff0c…

作者头像 李华