news 2026/7/5 19:36:28

CANN/asc-devkit矩阵Batch设置

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/asc-devkit矩阵Batch设置

SetBatchInfoForNormal

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

设置A/B矩阵的M/N/K轴信息,以及A/B矩阵的Batch数。Layout类型为NORMAL的场景,调用IterateBatch或者IterateNBatch接口之前,需要在Host侧Tiling实现中通过本接口设置A/B矩阵的M/N/K轴等信息。

函数原型

int32_t SetBatchInfoForNormal(int32_t batchA, int32_t batchB, int32_t m, int32_t n, int32_t k)

参数说明

表1参数说明

参数名输入/输出描述
batchA输入A矩阵的batch数
batchB输入B矩阵的batch数
m输入A矩阵的M轴信息
n输入B矩阵的N轴信息
k输入A/B矩阵的K轴信息

返回值说明

-1表示设置失败; 0表示设置成功。

约束说明

Layout类型为NORMAL的场景,调用IterateBatch或者IterateNBatch接口之前,需要在Host侧Tiling实现中通过本接口设置A/B矩阵的M/N/K轴等信息。

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::MultiCoreMatmulTiling tiling(ascendcPlatform); int32_t M = 32; int32_t N = 256; int32_t K = 64; tiling.SetDim(1); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(M, N, K); tiling.SetOrgShape(M, N, K); tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); constexpr int32_t BATCH_NUM = 3; tiling.SetBatchInfoForNormal(BATCH_NUM, BATCH_NUM, M, N, K); // 设置矩阵排布 tiling.SetBufferSpace(-1, -1, -1); optiling::TCubeTiling tilingData; int ret = tiling.GetTiling(tilingData);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/5 19:34:38

使用TRT-LLM部署Laguna XS 2.1:NVIDIA GPU优化终极指南 [特殊字符]

使用TRT-LLM部署Laguna XS 2.1:NVIDIA GPU优化终极指南 🚀 【免费下载链接】Laguna-XS-2.1 项目地址: https://ai.gitcode.com/hf_mirrors/poolside/Laguna-XS-2.1 想要在NVIDIA GPU上获得极致的Laguna XS 2.1推理性能吗?这篇完整的T…

作者头像 李华
网站建设 2026/7/5 19:31:31

提升网页导航体验的智能目录生成器:TOC项目深度解析

提升网页导航体验的智能目录生成器:TOC项目深度解析 【免费下载链接】toc Table of Contents Plugin 项目地址: https://gitcode.com/gh_mirrors/toc2/toc 在网页开发中,长文档和内容密集型页面的导航问题一直是用户体验的痛点。传统的锚点链接需…

作者头像 李华
网站建设 2026/7/5 19:29:20

终极Python通达信数据解析方案:免费获取完整股票数据的完整指南

终极Python通达信数据解析方案:免费获取完整股票数据的完整指南 【免费下载链接】mootdx 通达信数据读取的一个简便使用封装 项目地址: https://gitcode.com/GitHub_Trending/mo/mootdx 在量化投资和金融数据分析领域,获取高质量、完整的股票市场…

作者头像 李华
网站建设 2026/7/5 19:28:52

如何构建智能桌面伙伴:基于PySide6的完整桌面宠物开发框架解析

如何构建智能桌面伙伴:基于PySide6的完整桌面宠物开发框架解析 【免费下载链接】DyberPet Desktop Cyber Pet Framework based on PySide6 项目地址: https://gitcode.com/GitHub_Trending/dy/DyberPet 在桌面应用开发领域,虚拟伙伴系统正成为连接…

作者头像 李华