昇腾CANN/GE编译运行FlowGraph
📅 2026/7/4 7:46:00
👁️ 次浏览
编译并运行FlowGraph【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge功能介绍构建完FlowGraph之后如果您希望直接编译并运行FlowGraph得到图的执行结果可以参考本节内容。涉及的主要接口为调用“GEInitialize”接口进行系统初始化也可在Graph构建前调用申请系统资源。调用“Session构造函数”创建Session类对象申请Session资源。调用“FlowGraph”接口在Session类对象中添加定义好的图。调用“RunGraph”接口或者“FeedDataFlowGraphfeed所有输入”和“FetchDataFlowGraph获取所有输出数据”接口运行图。调用GEFinalize接口释放系统资源。[!NOTE]说明 如上步骤中的“GEInitialize”、“Session构造函数”、“AddGraph”、“RunGraph”、“GEFinalize”详细信息请参考《GE图引擎 API》。 使用DataFlow开发框架时NN模型执行使用的是饱和模式。该模式下计算精度可能存在误差该模式仅为兼容旧版本后续不演进。开发示例包含的头文件。#include ge_api.h申请系统资源。Graph定义完成后调用GEInitialize进行系统初始化也可在Graph定义前调用申请系统资源。示例代码如下std::mapAscendString, AscendStringconfig {{ge.exec.deviceId, 0}, {ge.exec.logicalDeviceClusterDeployMode, SINGLE}, {ge.exec.logicalDeviceId, [0:0]}, {ge.graphRunMode, 1}, {ge.exec.precision_mode, allow_fp32_to_fp16}}; Status ret ge::GEInitialize(config);可以通过config配置传入GE运行的初始化信息以上配置中的参数ge.exec.deviceId、ge.graphRunMode和ge.exec.precision_mode分别用于指定GE实例运行设备图执行模式在线推理请配置为0训练请配置为1以及算子精度模式。[!NOTE]说明 由于部分UDF不支持负荷分担所以需要在GE初始化时添加{ge.exec.logicalDeviceClusterDeployMode, SINGLE}, {ge.exec.logicalDeviceId, [0:0]}。其中logicalDeviceId可以是[0:0]也可以是[0:1]。如果需要多实例部署可以参考指定DataFlow节点部署位置来实现多实例部署。logicalDeviceId解释如下。 logicalDeviceClusterDeployMode为SINGLE时用于指定模型部署在某个指定的设备上。 配置格式[node_id:device_id]node_idAI处理器逻辑ID从0开始表示资源配置文件中第几个设备。device_idAI处理器物理ID。添加Graph对象并运行Graph。若想使定义好的Graph运行起来首先要创建一个Session对象然后调用AddGraph接口添加图再调用RunGraph接口执行图。示例代码如下std::map AscendString, AscendString options; ge::Session *session new Session(options); if(session nullptr) { std::cout Create session failed. std::endl; return FAILED; } // 构造FlowGraph Status ret session-AddGraph(graph_id, flow_graph.ToGeGraph()); if(ret ! SUCCESS) { return FAILED; } // 方式一RunGraph ret session-RunGraph(graph_id, input, output); if(ret ! SUCCESS) { return FAILED; } // 方式二先FeedDataFlowGraph再FetchDataFlowGraph ge::DataFlowInfo dataFlowInfo; geRet session-FeedDataFlowGraph(0, input, dataFlowInfo, 3000); if (geRet ! ge::SUCCESS) { return FAILED; } geRet session-FetchDataFlowGraph(0, output, dataFlowInfo, 3000); if (geRet ! ge::SUCCESS) { return FAILED; }用户可以通过传入options配置图运行相关配置信息。其中图运行完之后的数据保存在output中。如果DataFlow图中包含UDF节点DataFlow在图编译过程中会将编译结果放到用户指定UDF的workspace目录下落盘文件以graph_name_release.tar.gz格式存储。该文件用于DataFlow模型部署阶段解压使用在程序运行期间保证该文件不能被手动删除。图运行完之后通过GEFinalize释放资源。ret ge::GEFinalize();【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
GeUtils 【免费下载链接】ge GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的…
📅 2026/7/4 7:46:00
Agent Skills技能日志记录:建立完整的技能执行日志系统 【免费下载链接】agentskills Specification and documentation for Agent Skills 项目地址: https://gitcode.com/GitHub_Trending/ag/agentskills
在AI代理快速发展的今天,Agent Skills技…
📅 2026/7/4 7:46:00
kube-prod-runtime开发者手册:贡献代码与扩展功能的正确姿势 【免费下载链接】kube-prod-runtime A standard infrastructure environment for Kubernetes 项目地址: https://gitcode.com/gh_mirrors/ku/kube-prod-runtime
kube-prod-runtime是一个为Kuberne…
📅 2026/7/4 7:46:00
JSONRPC在Context中的应用:深入理解AI模型通信机制 【免费下载链接】Context Native macOS client for Model Context Protocol (MCP) 项目地址: https://gitcode.com/gh_mirrors/context25/Context
Context作为一款基于Model Context Protocol (MCP) 的macO…
📅 2026/7/4 9:44:12
Elm-platform快速入门:从零开始构建你的第一个Elm应用 【免费下载链接】elm-platform Bundle of all core development tools for Elm 项目地址: https://gitcode.com/gh_mirrors/el/elm-platform
Elm-platform是一套完整的Elm核心开发工具集,它包…
📅 2026/7/4 9:44:12
Mermaid Live Editor:3分钟掌握免费在线图表编辑的终极指南 【免费下载链接】mermaid-live-editor Edit, preview and share mermaid charts/diagrams. New implementation of the live editor. 项目地址: https://gitcode.com/GitHub_Trending/me/mermaid-live-e…
📅 2026/7/4 9:44:12
Crucible在学术研究中的应用:前沿符号验证技术案例分析 【免费下载链接】crucible Crucible is a library for symbolic simulation of imperative programs 项目地址: https://gitcode.com/gh_mirrors/cr/crucible
Crucible作为一款语言无关的符号模拟库&am…
📅 2026/7/4 9:44:12
计算机使用代理框架Cua:多模态AI与安全沙箱融合的技术架构 【免费下载链接】cua Open-source infrastructure for Computer-Use Agents. Sandboxes, SDKs, and benchmarks to train and evaluate AI agents that can control full desktops (macOS, Linux, Windows)…
📅 2026/7/4 9:44:12
Ornith-1.0-9B-MTP-GGUF完全指南:如何实现1.7倍文本生成速度提升 【免费下载链接】Ornith-1.0-9B-MTP-GGUF 项目地址: https://ai.gitcode.com/hf_mirrors/protoLabsAI/Ornith-1.0-9B-MTP-GGUF
想要让AI文本生成速度提升1.7倍吗?Ornith-1.0-9B-M…
📅 2026/7/4 9:42:12
Axure RP中文界面终极解决方案:3分钟告别英文困扰 【免费下载链接】axure-cn Chinese language file for Axure RP. Axure RP 简体中文语言包。支持 Axure 11、10、9。不定期更新。 项目地址: https://gitcode.com/gh_mirrors/ax/axure-cn
还在为Axure RP的英…
📅 2026/7/4 0:00:50
1. MC6470与STM32F745VG的黄金组合解析在工业自动化和机器人控制领域,传感器与微控制器的协同工作能力直接决定了系统的响应速度和定位精度。MC6470作为一款6自由度惯性测量单元(6DOF IMU),与STM32F745VG这款基于ARM Cortex-M7内核的高性能微控制器组合&…
📅 2026/7/4 0:00:50
1. 项目概述:为什么要在本地跑 SAM Audio?这不只是“能用”,而是“必须用”SAM Audio——全称是 Segment Anything Model for Audio,不是 Meta 那个视觉领域的 SAM(Segment Anything Model)的简单移植&…
📅 2026/7/4 0:00:50
6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…
📅 2026/7/2 17:37:53
引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…
📅 2026/7/2 17:37:51
目录
第一步:选对模板,省心一半
第二步:打开扫码点餐功能
开启功能按钮
桌台管理与桌码生成
第三步:个性化设计,打造品牌感
调整点餐页面
设置点餐规则 你还在让顾客站着排队点餐吗?2025年ÿ…
📅 2026/7/4 5:07:51
在业务中快速构建一个能理解私有文档、准确回答专业问题的智能助手,是很多开发团队面临的共同挑战。传统方案往往需要从零开始搭建复杂的 RAG(检索增强生成)系统,涉及文档解析、向量化、检索、大模型调用等多个环节,整…
📅 2026/7/4 5:10:18
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE
你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
📅 2026/7/3 10:20:06