CANN/ops-math掩码缩放算子

CANN/ops-math掩码缩放算子
MaskedScale【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品×Atlas 200I/500 A2 推理产品×Atlas 推理系列产品×Atlas 训练系列产品×功能说明算子功能完成elementwise计算计算公式$$ out self \times mask \times scale $$调用说明当前算子作为自定义算子通过图模式下发执行aclnnMaskedScale两段式接口仅供内部使用不对外暴露。算子输入输出参数说明self(计算输入)公式中的输入selfDevice侧Tensor。Ascend 950PR/Ascend 950DT 数据类型支持FLOAT16、BFLOAT16、FLOAT数据格式支持ND。Atlas A3 训练系列产品/Atlas A3 推理系列产品 数据类型支持FLOAT16、BFLOAT16、FLOAT数据格式支持ND。mask(计算输入)公式中的maskDevice侧Tensorshape需要与self一致。Ascend 950PR/Ascend 950DT 数据类型支持UINT8、INT8、FLOAT16、FLOAT数据格式支持ND。Atlas A3 训练系列产品/Atlas A3 推理系列产品 数据类型支持UINT8、INT8、FLOAT16、FLOAT数据格式支持ND。scale(float, 计算输入)标量缩放系数数据类型支持FLOAT非Tensor。y(计算输出)公式中的outDevice侧Tensor数据类型和shape需要与self一致。Ascend 950PR/Ascend 950DT 数据类型支持FLOAT16、BFLOAT16、FLOAT数据格式支持ND。Atlas A3 训练系列产品/Atlas A3 推理系列产品 数据类型支持FLOAT16、BFLOAT16、FLOAT数据格式支持ND。约束说明确定性计算MaskedScale默认确定性实现。shape约束self、mask和y的shape需要一致。当前实现的元素总数不能超过uint32_t可表示范围。输入/属性命名采用self、mask、scale、y与内部 aclnn 接口保持一致。FLOAT16 路径中scale按 half 标量参与向量乘存在标量精度截断FLOAT/BFLOAT16 路径按 float 标量计算。【免费下载链接】ops-math本项目是CANN提供的数学类基础计算算子库实现网络在NPU上加速计算。项目地址: https://gitcode.com/cann/ops-math创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考