CANN/asc-devkit Matmul-Tiling类构造函数
📅 2026/7/5 20:08:39
👁️ 次浏览
Matmul Tiling类构造函数【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit功能说明用于创建一个Matmul单核Tiling对象或者多核Tiling对象或者BatchMatmul Tiling对象。函数原型带参构造函数需要传入硬件平台信息推荐使用这类构造函数来获得更好的兼容性。使用PlatformAscendC类传入信息explicit MatmulApiTiling(const platform_ascendc::PlatformAscendC ascendcPlatform)explicit MultiCoreMatmulTiling(const platform_ascendc::PlatformAscendC ascendcPlatform)explicit BatchMatmulTiling(const platform_ascendc::PlatformAscendC ascendcPlatform)使用PlatformInfo传入信息当platform_ascendc::PlatformAscendC无法在Tiling运行时获取时需要用户自行构造PlatformInfo结构体透传给MatmulApiTiling构造函数。explicit MatmulApiTiling(const PlatformInfo platform)explicit MultiCoreMatmulTiling(const PlatformInfo platform)无参构造函数MatmulApiTiling()MultiCoreMatmulTiling()BatchMatmulTiling()无参构造函数只支持如下产品型号Atlas A2训练系列产品/Atlas 800I A2推理产品Atlas A3 训练系列产品基类构造函数MatmulApiTiling、MultiCoreMatmulTiling和BatchMatmulTiling都继承自基类MatmulApiTilingBase其构造函数如下MatmulApiTilingBase()explicit MatmulApiTilingBase(const platform_ascendc::PlatformAscendC ascendcPlatform)explicit MatmulApiTilingBase(const PlatformInfo platform)参数说明表1参数说明参数名输入/输出描述ascendcPlatform输入传入硬件平台的信息PlatformAscendC定义请参见构造及析构函数。platform输入传入硬件版本以及AI Core中各个硬件单元提供的内存大小。PlatformInfo构造时通过构造及析构函数获取。PlatformInfo结构定义如下代码所示socVersion通过GetSocVersion获取并透传各类硬件存储空间大小通过GetCoreMemSize获取并透传。不推荐通过直接填值构造PlatformInfo的方式调用构造函数例如PlatformInfo(socVersion, 1024, 1024, ..);struct PlatformInfo { platform_ascendc::SocVersion socVersion; uint64_t l1Size 0; uint64_t l0CSize 0; uint64_t ubSize 0; uint64_t l0ASize 0; uint64_t l0BSize 0; };在实现Host侧的Tiling函数时platform_ascendc::PlatformAscendC用于获取一些硬件平台的信息来支撑Tiling的计算比如获取硬件平台的核数等信息。PlatformAscendC类提供获取这些平台信息的功能。与platform_ascendc::PlatformAscendC不同的是PlatformInfo则用于获取芯片版本、AI Core中各个硬件单元提供的内存大小等只针对单个AI Core的信息。约束说明无使用样例无参构造函数// 单核Tiling matmul_tiling::MatmulApiTiling tiling; tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); // 多核Tiling matmul_tiling::MultiCoreMatmulTiling tiling; tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); // BatchMatmul Tiling matmul_tiling::BatchMatmulTiling bmmTiling; bmmTiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16);带参构造函数// 单核Tiling auto ascendcPlatform platform_ascendc::PlatformAscendC(context-GetPlatformInfo()); matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); // 多核Tiling auto ascendcPlatform platform_ascendc::PlatformAscendC(context-GetPlatformInfo()); matmul_tiling::MultiCoreMatmulTiling tiling(ascendcPlatform); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); // BatchMatmul Tiling auto ascendcPlatform platform_ascendc::PlatformAscendC(context-GetPlatformInfo()); matmul_tiling::BatchMatmulTiling bmmTiling(ascendcPlatform); bmmTiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
终极3DS游戏格式转换指南:3dsconv让你的游戏安装变得简单快捷 【免费下载链接】3dsconv Python script to convert Nintendo 3DS CCI (".cci", ".3ds") files to the CIA format 项目地址: https://gitcode.com/gh_mirrors/3d/3dsconv
还…
📅 2026/7/5 20:08:39
新手必看:RobustBench数据集处理与预处理最佳实践 【免费下载链接】robustbench RobustBench: a standardized adversarial robustness benchmark [NeurIPS 2021 Benchmarks and Datasets Track] 项目地址: https://gitcode.com/gh_mirrors/ro/robustbench
R…
📅 2026/7/5 20:06:38
如何在3分钟内完成离线文字识别?Umi-OCR终极指南 【免费下载链接】Umi-OCR OCR software, free and offline. 开源、免费的离线OCR软件。支持截屏/批量导入图片,PDF文档识别,排除水印/页眉页脚,扫描/生成二维码。内置多国语言库。…
📅 2026/7/5 20:06:38
【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills
name: model-train-oom-analysis description: "用于诊断 PyTorc…
📅 2026/7/5 21:10:46
RedisInsight批量操作实战指南:5大技巧助你高效管理海量Redis数据 【免费下载链接】RedisInsight Redis GUI by Redis 项目地址: https://gitcode.com/GitHub_Trending/re/RedisInsight
RedisInsight作为Redis官方推出的专业可视化工具,其批量操作…
📅 2026/7/5 21:10:46
为什么选择downr1n:解锁iOS设备降级与越狱的完整指南 【免费下载链接】downr1n downgrade tethered checkm8 idevices ios 14, 15. 项目地址: https://gitcode.com/gh_mirrors/do/downr1n
downr1n是一款专为具备checkm8漏洞的iOS设备设计的降级工具ÿ…
📅 2026/7/5 21:10:46
5分钟快速上手:墨菲安全开源SCA工具完整使用指南 【免费下载链接】murphysec An open source tool focused on software supply chain security. 墨菲安全专注于软件供应链安全,具备专业的软件成分分析(SCA)、漏洞检测、专业漏洞库…
📅 2026/7/5 21:10:46
ACP Agent通信协议:革命性AI Agent互操作标准,提升企业AI集成效率300% 【免费下载链接】ACP Open protocol for communication between AI agents, applications, and humans. 项目地址: https://gitcode.com/gh_mirrors/acp4/ACP
在AI技术快速发…
📅 2026/7/5 21:10:46
PasteMD Pandoc Filters高级用法:实现Mermaid图表和自定义格式转换的完整教程 【免费下载链接】PasteMD 一键将 Markdown 和网页 AI 对话(ChatGPT/DeepSeek等)完美粘贴到 Word、WPS 和 Excel 的效率工具 项目地址: https://gitcode.com/RIC…
📅 2026/7/5 21:08:46
1. 项目背景与核心需求 在嵌入式系统开发中,快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下,系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…
📅 2026/7/5 0:01:51
1. 工业电流环信号传输的基础认知在工业自动化领域,4-20mA电流环传输技术已经持续服役超过半个世纪。这种看似简单的信号传输方式之所以能经久不衰,核心在于其独特的抗干扰能力——电流信号在长距离传输时几乎不受线路电阻和电压波动的影响。我曾在化工厂…
📅 2026/7/5 0:01:51
最近在项目里尝试用 YOLO 做目标检测,从环境搭建到模型训练,再到推理部署,整个过程踩了不少坑。网上的资料虽然多,但要么版本老旧,要么步骤零散不成体系,对于刚入门的新手来说,很容易卡在某个环…
📅 2026/7/5 0:01:51
1. 项目背景与核心需求 在嵌入式系统开发中,快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下,系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…
📅 2026/7/5 0:01:51
1. 工业电流环信号传输的基础认知在工业自动化领域,4-20mA电流环传输技术已经持续服役超过半个世纪。这种看似简单的信号传输方式之所以能经久不衰,核心在于其独特的抗干扰能力——电流信号在长距离传输时几乎不受线路电阻和电压波动的影响。我曾在化工厂…
📅 2026/7/5 0:01:51
最近在项目里尝试用 YOLO 做目标检测,从环境搭建到模型训练,再到推理部署,整个过程踩了不少坑。网上的资料虽然多,但要么版本老旧,要么步骤零散不成体系,对于刚入门的新手来说,很容易卡在某个环…
📅 2026/7/5 0:01:51
目录
第一步:选对模板,省心一半
第二步:打开扫码点餐功能
开启功能按钮
桌台管理与桌码生成
第三步:个性化设计,打造品牌感
调整点餐页面
设置点餐规则 你还在让顾客站着排队点餐吗?2025年ÿ…
📅 2026/7/5 6:01:04
在业务中快速构建一个能理解私有文档、准确回答专业问题的智能助手,是很多开发团队面临的共同挑战。传统方案往往需要从零开始搭建复杂的 RAG(检索增强生成)系统,涉及文档解析、向量化、检索、大模型调用等多个环节,整…
📅 2026/7/5 6:01:04
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE
你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
📅 2026/7/4 17:36:47