news 2026/7/5 19:17:55

CANN/asc-devkit SetFixSplit矩阵分块设置

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit SetFixSplit矩阵分块设置

SetFixSplit

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

设置固定的baseM、baseN、baseK,单位为元素个数。

函数原型

int32_t SetFixSplit(int32_t baseMIn = -1, int32_t baseNIn = -1, int32_t baseKIn = -1)

参数说明

表1参数说明

参数名输入/输出描述
baseMIn输入设置固定的baseM,默认值为-1,表示不设置固定baseM,由tiling函数进行计算。
baseNIn输入设置固定的baseN,默认值为-1,表示不设置固定baseN,由tiling函数进行计算。
baseKIn输入当前仅支持取值为-1,暂不支持设置其它值。

返回值说明

-1表示设置失败;0表示设置成功。

约束说明

  • baseM*baseN个输出元素所占的存储空间大小不能超过L0C Buffer大小,即baseM * baseN * sizeof(C_TYPE) <= L0CSize。
  • baseM需要小于等于singleM按16个元素向上对齐后的值(如ceil(singleM/16)*16),baseN需要小于等于singleN以C0_size个元素向上对齐的值,其中singleM为单核内M轴长度,singleN为单核内N轴长度,half/bfloat16_t数据类型的C0_size为16,float数据类型的C0_size为8,int8_t数据类型的C0_size为32,int4b_t数据类型的C0_size为64。例如singleM=12,则baseM需要小于等于16,同时baseM需要满足分形对齐的要求,所以baseM只能取16;如果baseM取其他超过16的值,获取Tiling将失败。

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); tiling.SetFixSplit(16, 16, -1); // 设置固定的baseM、baseN

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/5 19:17:23

sra_tvm_adapter核心技术解析:softmax优化补丁的深度剖析

sra_tvm_adapter核心技术解析&#xff1a;softmax优化补丁的深度剖析 【免费下载链接】sra_tvm_adapter Adapter for Kunpeng TVM Library 项目地址: https://gitcode.com/openeuler/sra_tvm_adapter 前往项目官网免费下载&#xff1a;https://ar.openeuler.org/ar/ sr…

作者头像 李华
网站建设 2026/7/5 19:17:09

Selenium自动化实战:网页弹窗自动处理与元素定位技巧

1. 项目概述&#xff1a;当自动化脚本遇上“反重力” 最近在折腾一个挺有意思的小项目&#xff0c;名字叫“Antigravity-Auto-Accept”。光看名字&#xff0c;你可能会联想到科幻或者某种物理模拟&#xff0c;但它的核心其实非常接地气&#xff1a;一个基于Selenium的网页自动…

作者头像 李华
网站建设 2026/7/5 19:14:23

Twine.js终极指南:5步掌握可视化互动叙事创作

Twine.js终极指南&#xff1a;5步掌握可视化互动叙事创作 【免费下载链接】twinejs Twine, a tool for telling interactive, nonlinear stories 项目地址: https://gitcode.com/gh_mirrors/tw/twinejs Twine.js是一款革命性的可视化工具&#xff0c;专为创作交互式非线…

作者头像 李华
网站建设 2026/7/5 19:14:20

如何快速掌握zxcvbn:终极密码强度评估工具完全指南

如何快速掌握zxcvbn&#xff1a;终极密码强度评估工具完全指南 【免费下载链接】zxcvbn Low-Budget Password Strength Estimation 项目地址: https://gitcode.com/gh_mirrors/zx/zxcvbn 在当今数字化时代&#xff0c;密码安全已经成为保护个人隐私的第一道防线。zxcvbn…

作者头像 李华
网站建设 2026/7/5 19:12:05

如何永久保存微信聊天记录:终极个人数据资产管理指南

如何永久保存微信聊天记录&#xff1a;终极个人数据资产管理指南 【免费下载链接】WeChatMsg 提取微信聊天记录&#xff0c;将其导出成HTML、Word、CSV文档永久保存&#xff0c;对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/WeChat…

作者头像 李华
网站建设 2026/7/5 19:11:58

如何高效解决3大流媒体下载难题:N_m3u8DL-RE终极方案

如何高效解决3大流媒体下载难题&#xff1a;N_m3u8DL-RE终极方案 【免费下载链接】N_m3u8DL-RE Cross-Platform, modern and powerful stream downloader for MPD/M3U8/ISM. English/简体中文/繁體中文. 项目地址: https://gitcode.com/GitHub_Trending/nm3/N_m3u8DL-RE …

作者头像 李华