CANN/asc-devkit矩阵切K轴API
📅 2026/7/5 18:44:26
👁️ 次浏览
SetSplitK【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit功能说明EnableMultiCoreSplitK接口功能与该接口相同建议使用EnableMultiCoreSplitK。多核场景通过该接口开启切K轴。不调用该接口的情况下默认不切K轴。在GetTiling接口调用前使用。函数原型void SetSplitK(bool flag)参数说明表1参数说明参数名输入/输出描述flag输入是否开启切K轴。true开启切K轴false不开启切K轴返回值说明无约束说明如果在算子中使用该接口获取C矩阵结果时仅支持输出到Global Memory。如果在算子中使用该接口需在Kernel侧代码中首次将C矩阵分片的结果写入Global Memory之前先清零Global Memory随后在获取C矩阵分片的结果时再开启AtomicAdd累加。如果不预先清零Global Memory可能会因为累加Global Memory中原始的无效数据而产生精度问题。调用示例auto ascendcPlatform platform_ascendc::PlatformAscendC(context-GetPlatformInfo()) matmul_tiling::MultiCoreMatmulTiling tiling(ascendcPlatform); tiling.SetDim(useCoreNums); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(M, N, K); tiling.SetOrgShape(M, N, K); tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); tiling.SetSplitK(true); optiling::TCubeTiling tilingData; int ret tiling.GetTiling(tilingData);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
全面掌握ExplorerPatcher:打造个性化Windows工作环境的实用指南 【免费下载链接】ExplorerPatcher This project aims to enhance the working environment on Windows 项目地址: https://gitcode.com/GitHub_Trending/ex/ExplorerPatcher
你是否对Windows 1…
📅 2026/7/5 18:44:26
鸣潮自动化助手:5分钟掌握后台智能战斗与资源管理 【免费下载链接】ok-wuthering-waves 鸣潮 后台自动战斗 自动刷声骸 一键日常 Automation for Wuthering Waves 项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves
鸣潮自动化助手是一款…
📅 2026/7/5 18:42:26
Ventoy主题自定义完全指南:打造个性化启动界面 【免费下载链接】Ventoy A new bootable USB solution. 项目地址: https://gitcode.com/GitHub_Trending/ve/Ventoy
Ventoy作为新一代开源可启动USB解决方案,不仅支持多种操作系统镜像的直接启动&am…
📅 2026/7/5 18:42:26
Spek频谱分析器终极指南:专业音频可视化解决方案深度解析 【免费下载链接】spek Acoustic spectrum analyser 项目地址: https://gitcode.com/gh_mirrors/sp/spek
在音频处理的世界中,你是否曾遇到过这样的困境:需要快速分析音频文件的…
📅 2026/7/5 19:54:37
2026年AI论文写作工具已从“内容生成”进化为集文献分析、逻辑构建与学术合规于一体的智能研究助手,核心评价维度涵盖文献真实性、格式合规性、长文本逻辑、查重降重、AIGC合规与多语言支持。本次测评覆盖6款主流工具,测试场景包括中文与英文论文、全流程…
📅 2026/7/5 19:54:37
pysimdjson社区贡献指南:如何参与开发SIMD加速的JSON解析器 【免费下载链接】pysimdjson Python bindings for the simdjson project. 项目地址: https://gitcode.com/gh_mirrors/py/pysimdjson
想要为高性能JSON解析库pysimdjson贡献代码吗?这篇…
📅 2026/7/5 19:54:37
鸣潮自动化终极指南:5分钟掌握后台自动战斗系统 【免费下载链接】ok-wuthering-waves 鸣潮 后台自动战斗 自动刷声骸 一键日常 Automation for Wuthering Waves 项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves
你是否厌倦了每天重复刷…
📅 2026/7/5 19:54:37
如何用py-kms搭建免费的Windows和Office激活服务器 【免费下载链接】py-kms KMS Server Emulator written in Python 项目地址: https://gitcode.com/gh_mirrors/py/py-kms
你是否曾为Windows和Office的正版授权费用感到困扰?或者在企业环境中需要批量激活多…
📅 2026/7/5 19:54:37
Obsidian Banners YAML配置完全指南:手动编辑横幅数据的技巧 【免费下载链接】obsidian-banners An Obsidian plugin that adds banners to your notes 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-banners
想要完全掌控Obsidian笔记的横幅显示效…
📅 2026/7/5 19:52:37
1. 项目背景与核心需求 在嵌入式系统开发中,快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下,系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…
📅 2026/7/5 0:01:51
1. 工业电流环信号传输的基础认知在工业自动化领域,4-20mA电流环传输技术已经持续服役超过半个世纪。这种看似简单的信号传输方式之所以能经久不衰,核心在于其独特的抗干扰能力——电流信号在长距离传输时几乎不受线路电阻和电压波动的影响。我曾在化工厂…
📅 2026/7/5 0:01:51
最近在项目里尝试用 YOLO 做目标检测,从环境搭建到模型训练,再到推理部署,整个过程踩了不少坑。网上的资料虽然多,但要么版本老旧,要么步骤零散不成体系,对于刚入门的新手来说,很容易卡在某个环…
📅 2026/7/5 0:01:51
1. 项目背景与核心需求 在嵌入式系统开发中,快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下,系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…
📅 2026/7/5 0:01:51
1. 工业电流环信号传输的基础认知在工业自动化领域,4-20mA电流环传输技术已经持续服役超过半个世纪。这种看似简单的信号传输方式之所以能经久不衰,核心在于其独特的抗干扰能力——电流信号在长距离传输时几乎不受线路电阻和电压波动的影响。我曾在化工厂…
📅 2026/7/5 0:01:51
最近在项目里尝试用 YOLO 做目标检测,从环境搭建到模型训练,再到推理部署,整个过程踩了不少坑。网上的资料虽然多,但要么版本老旧,要么步骤零散不成体系,对于刚入门的新手来说,很容易卡在某个环…
📅 2026/7/5 0:01:51
目录
第一步:选对模板,省心一半
第二步:打开扫码点餐功能
开启功能按钮
桌台管理与桌码生成
第三步:个性化设计,打造品牌感
调整点餐页面
设置点餐规则 你还在让顾客站着排队点餐吗?2025年ÿ…
📅 2026/7/5 6:01:04
在业务中快速构建一个能理解私有文档、准确回答专业问题的智能助手,是很多开发团队面临的共同挑战。传统方案往往需要从零开始搭建复杂的 RAG(检索增强生成)系统,涉及文档解析、向量化、检索、大模型调用等多个环节,整…
📅 2026/7/5 6:01:04
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE
你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
📅 2026/7/4 17:36:47