cann/asc-devkit卷积Tiling

cann/asc-devkit卷积Tiling
TConv3DBackpropInputTiling结构体【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkitTConv3DBackpropInputTiling结构体包含Conv3DBackpropInput算子规格信息及Tiling切分算法的相关参数被传递给Conv3DBackpropInput Kernel侧用于数据切分、数据搬运和计算等。TConv3DBackpropInputTiling结构体的参数说明见下表。用户通过调用GetTiling接口获取TConv3DBackpropInputTiling结构体具体流程请参考Conv3DBackpropInput Tiling使用说明。当前暂不支持用户自定义配置TConv3DBackpropInputTiling结构体中的参数。表1TConv3DBackpropInputTiling结构说明参数名称说明batch输入GradOutput的N等于卷积正向输入Input的N。cin输出GradInput的Channel等于卷积正向输入Input的Channel。cout输入GradOutput的Channel。cout1输入GradOutput的C1等于cout/c0。cin1输出GradInput的C1等于卷积正向输入Input的C1等于cin/c0。cout1G预留参数用户无需感知。cin1G预留参数用户无需感知。c0当前输入数据类型下C0的大小。该参数目前只支持取值为16。c0Bits任意一个数除以c0等价的右移位数例如c08则c0Bits3c016则c0Bits4。dout输入GradOutput的Depth大小单位元素。ho输入GradOutput的Height大小单位元素。wo输入GradOutput的Width大小单位元素。di输出GradInput的Depth大小等于卷积正向输入Input的Depth大小单位元素。hi输出GradInput的Height大小等于卷积正向输入Input的Height大小单位元素。wi输出GradInput的Width大小等于卷积正向输入Input的Width大小单位元素。dk输入Weight的Depth大小单位元素。hk输入Weight的Height大小单位元素。wk输入Weight的Width大小单位元素。group预留参数用户无需感知。strideD卷积反向计算中Stride的Depth大小单位元素。strideH卷积反向计算中StrideHeight大小单位元素。strideW卷积反向计算中StrideWidth大小单位元素。padFront卷积反向计算中输出矩阵GradInput Padding的Depth维度的前方向单位元素。padBack卷积反向计算中输出矩阵GradInput Padding的Depth维度的后方向单位元素。padUp卷积反向计算中输出矩阵GradInput Padding的Height维度的上方向单位元素。padDown卷积反向计算中输出矩阵GradInput Padding的Height维度的下方向单位元素。padLeft卷积反向计算中输出矩阵GradInput Padding的Width维度的左方向单位元素。padRight卷积反向计算中输出矩阵GradInput Padding的Width维度的右方向单位元素。backpropPadTail预留参数用户无需感知。backpropPadUp卷积反向计算中输入矩阵GradOutput Padding的Height维度的上方向单位元素。backpropPadDown卷积反向计算中输入矩阵GradOutput Padding的Height维度的下方向单位元素。backpropPadLeft卷积反向计算中输入矩阵GradOutput Padding的Width维度的左方向单位元素。backpropPadRight卷积反向计算中输入矩阵GradOutput Padding的Width维度的右方向单位元素。dilationD卷积反向计算中Dilation的Depth大小单位元素。dilationH卷积反向计算中Dilation的Height大小单位元素。dilationW卷积反向计算中Dilation的Width大小单位元素。al0Pbuffer1表示不开启DoubleBuffer2表示开启DoubleBuffer。bl0Pbuffer1表示不开启DoubleBuffer2表示开启DoubleBuffer。cl0Pbuffer1表示不开启DoubleBuffer2表示开启DoubleBuffer。al1Pbuffer1表示不开启DoubleBuffer2表示开启DoubleBuffer。bl1Pbuffer1表示不开启DoubleBuffer2表示开启DoubleBuffer。singleCoreGroup预留参数用户无需感知。singleCoreCout单核M方向上计算cout数据量的大小。singleCoreCout1单核上cout1的大小。singleCoreCin1单核上cin1的大小。singleCoreDin单核上Din的大小。singleCoreHo单核K方向上计算ho数据量的大小。baseML0上M方向大小。baseKL0上K方向大小。baseNL0上N方向大小。baseD预留参数用户无需感知。baseBatch预留参数用户无需感知。baseGroup预留参数用户无需感知。stepM特征矩阵在L1中缓存的buffer M方向上baseM的倍数。stepN权重矩阵在L1中缓存的buffer N方向上baseN的倍数。stepKa特征矩阵在L1中缓存的buffer K方向上baseK的倍数。stepKb权重矩阵在L1中缓存的buffer K方向上baseK的倍数。stepBatch预留参数用户无需感知。stepGroup预留参数用户无需感知。iterateOrder预留参数用户无需感知。hf32Flag预留参数用户无需感知。initOutputFlag预留参数用户无需感知。reserved预留参数用户无需感知。singleCoreBatch预留参数用户无需感知。singleCoreM单核M方向上需要计算的数据量大小。singleCoreCin单核N方向上计算cin数据量的大小。【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考