CANN/pypto动态维度API文档
📅 2026/7/4 7:21:50
👁️ 次浏览
pypto.DYNAMIC【免费下载链接】pyptoPyPTO发音: pai p-t-oParallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto产品支持情况Ascend 950PR支持Atlas A3 训练系列产品/Atlas A3 推理系列产品支持Atlas A2 训练系列产品/Atlas A2 推理系列产品支持功能说明pypto.DYNAMIC用于定义动态维度Dynamic Dimension允许张量的某些维度在运行时变化。这对于处理可变的batch size、序列长度等场景非常有用。动态维度通常在模块级别定义然后在JIT编译的内核函数的类型注解中使用。主要应用场景动态Batch Size: 推理时batch size可能随请求数量变化动态序列长度: NLP任务中文本序列长度不固定动态图结构: 图神经网络中节点数量可变条件计算: 根据输入形状决定计算流程Shape标记方式标记含义pypto.DYNAMIC或pypto.DYN动态轴传入torch tensor该维变化时无需重编译pypto.STATIC静态轴传入torch tensor该维变化时触发重编译64固定轴只允许传入该固定大小传入其他大小会报错(runtime_debug_mode为3开启校验)...剩余轴都作为静态轴处理约束说明动态维度必须在JIT函数的类型注解中使用调用示例示例1: 基础用法 - 动态Batch Sizeimport pypto # 固定轴 HIDDEN_SIZE 128 pypto.frontend.jit def add_bias( x: pypto.Tensor([pypto.DYNAMIC, pypto.STATIC], pypto.DT_FP32), bias: pypto.Tensor([HIDDEN_SIZE], pypto.DT_FP32), out: pypto.Tensor([pypto.DYNAMIC, ...], pypto.DT_FP32) ): # 实现add逻辑 # [pypto.DYNAMIC, ...]第一维是动态的省略号表示剩余维度是静态的 ... # 可以用不同的batch size调用 x1 torch.randn(2, 128, dtypetorch.float32, devicenpu:0) out1 torch.randn(2, 128, dtypetorch.float32, devicenpu:0) result1 add_bias(x1, bias, out1) # batch2 x2 torch.randn(8, 128, dtypetorch.float32, devicenpu:0) out2 torch.randn(8, 128, dtypetorch.float32, devicenpu:0) result2 add_bias(x2, bias, out2) # batch8示例2: 多个动态维度HIDDEN 768 pypto.frontend.jit def attention_kernel( q: pypto.Tensor([pypto.DYNAMIC, pypto.DYNAMIC, HIDDEN], pypto.DT_FP32), k: pypto.Tensor([pypto.DYNAMIC, pypto.DYNAMIC, HIDDEN], pypto.DT_FP32), v: pypto.Tensor([pypto.DYNAMIC, pypto.DYNAMIC, HIDDEN], pypto.DT_FP32), out: pypto.Tensor([pypto.DYNAMIC, pypto.DYNAMIC, HIDDEN], pypto.DT_FP32), ): # 实现attention逻辑 # 前两维batch、序列长度都是动态的 ... return output # 可以处理不同的batch和序列长度 attention_kernel(q_4_128, k_4_128, v_4_128, out) # B4, SEQ128 attention_kernel(q_2_256, k_2_256, v_2_256, out) # B2, SEQ256无需重编译最佳实践文档说明: 在代码注释中说明哪些维度是动态的及其含义测试覆盖: 测试不同的动态维度取值确保代码的正确性【免费下载链接】pyptoPyPTO发音: pai p-t-oParallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
Mhook安全应用:恶意软件分析与反调试技术的终极指南 【免费下载链接】mhook A Windows API hooking library 项目地址: https://gitcode.com/gh_mirrors/mh/mhook
Mhook作为一款轻量级Windows API hooking库,为安全研究人员提供了强大的二进制拦截…
📅 2026/7/4 7:21:50
CMS备份与恢复:Instatic完整灾难恢复演练 【免费下载链接】Instatic Instatic is a modern self-hosted visual CMS - get it running in 1 minute 项目地址: https://gitcode.com/GitHub_Trending/in/Instatic
Instatic作为一款现代化自托管视觉CMS…
📅 2026/7/4 7:21:50
Elm Platform 社区资源完整指南:如何参与贡献和获取技术支持 【免费下载链接】elm-platform Bundle of all core development tools for Elm 项目地址: https://gitcode.com/gh_mirrors/el/elm-platform
Elm Platform 是 Elm 语言核心开发工具的完整捆绑包&a…
📅 2026/7/4 7:21:50
Algorithm Analyzer Guide 【免费下载链接】hccl 集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案 项目地址: https://gitcode.co…
📅 2026/7/4 8:24:02
PidStepResponseFeatures Benchmark Note 【免费下载链接】mat-chem-sim-pred 面向工业领域,聚焦计算仿真、预测两大核心场景,构建面向流程工业"机理数据"双轮驱动的领域计算层,推动AI for Science在材料化学领域的深度应用。 项…
📅 2026/7/4 8:24:02
思源宋体TTF终极指南:7种字重高效应用与专业排版完全解决方案 【免费下载链接】source-han-serif-ttf Source Han Serif TTF 项目地址: https://gitcode.com/gh_mirrors/so/source-han-serif-ttf
还在为商业项目寻找既专业又完全免费的中文字体解决方案吗&am…
📅 2026/7/4 8:24:02
如何用Python-Backdoor进行文件传输与目录下载?超详细教程 【免费下载链接】Python-Backdoor This project is a cross-platform backdoor/reverse shell and post-exploitation tool written in Python3 项目地址: https://gitcode.com/gh_mirrors/py/Python-Bac…
📅 2026/7/4 8:24:02
深入理解Offix hooks:useQuery、useSave与离线数据操作技巧 【免费下载链接】offix GraphQL Offline Client and Server 项目地址: https://gitcode.com/gh_mirrors/of/offix
Offix是一个强大的GraphQL离线客户端和服务器解决方案,它通过提供直观…
📅 2026/7/4 8:24:02
uarch-bench实战案例:揭秘Zen3架构时钟周期性能优化技巧 【免费下载链接】uarch-bench A benchmark for low-level CPU micro-architectural features 项目地址: https://gitcode.com/gh_mirrors/ua/uarch-bench
在CPU性能优化领域,uarch-bench是…
📅 2026/7/4 8:22:02
Axure RP中文界面终极解决方案:3分钟告别英文困扰 【免费下载链接】axure-cn Chinese language file for Axure RP. Axure RP 简体中文语言包。支持 Axure 11、10、9。不定期更新。 项目地址: https://gitcode.com/gh_mirrors/ax/axure-cn
还在为Axure RP的英…
📅 2026/7/4 0:00:50
1. MC6470与STM32F745VG的黄金组合解析在工业自动化和机器人控制领域,传感器与微控制器的协同工作能力直接决定了系统的响应速度和定位精度。MC6470作为一款6自由度惯性测量单元(6DOF IMU),与STM32F745VG这款基于ARM Cortex-M7内核的高性能微控制器组合&…
📅 2026/7/4 0:00:50
1. 项目概述:为什么要在本地跑 SAM Audio?这不只是“能用”,而是“必须用”SAM Audio——全称是 Segment Anything Model for Audio,不是 Meta 那个视觉领域的 SAM(Segment Anything Model)的简单移植&…
📅 2026/7/4 0:00:50
6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…
📅 2026/7/2 17:37:53
引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…
📅 2026/7/2 17:37:51
目录
第一步:选对模板,省心一半
第二步:打开扫码点餐功能
开启功能按钮
桌台管理与桌码生成
第三步:个性化设计,打造品牌感
调整点餐页面
设置点餐规则 你还在让顾客站着排队点餐吗?2025年ÿ…
📅 2026/7/4 5:07:51
在业务中快速构建一个能理解私有文档、准确回答专业问题的智能助手,是很多开发团队面临的共同挑战。传统方案往往需要从零开始搭建复杂的 RAG(检索增强生成)系统,涉及文档解析、向量化、检索、大模型调用等多个环节,整…
📅 2026/7/4 5:10:18
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE
你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
📅 2026/7/3 10:20:06