act仿真,任务层
📅 2026/7/3 18:32:11
👁️ 次浏览
整体分层任务与环境层sim_env.py关节空间控制、ee_sim_env.py末端位姿控制、scripted_policy.py脚本策略、assetsMuJoCo XML 场景。数据层record_sim_episodes.py 采集并保存hdf5utils.py 负责 Dataset/DataLoader 与归一化统计visualize_episodes.py 可视化数据集。训练/评估层imitate_episodes.py 是主入口训练 --eval 评估 生成 rollout 视频policy.py 是策略适配器ACTPolicy / CNNMLPPolicy。模型层detr 是 ACT 的网络实现backbone、transformer、VAE/decoder 等main.py 负责构建模型和优化器。配置层constants.py 定义任务配置数据目录、episode 长度、相机名和仿真常量。关键执行链路采集record_sim_episodes.py → data/episode_*.hdf5训练imitate_episodes.py → 读取 constants.py 中任务数据目录 → 训练并保存policy_best.ckpt评估可视化imitate_episodes.py --eval→ 加载policy_best.ckpt→ 输出 video*.mp4sim_env为仿真环境层def make_sim_env(task_name):用于生成关节空间的环境通过字符串导入xml文件把物理引擎和任务组合成 dm_control 标准环境。有插入和传递两个任务。class BimanualViperXEETask(base.Task):def before_step(self, action, physics):每步执行前把动作写入physics物理引擎def initialize_robots(self, physics):重置双臂到初始位姿def get_qpos(physics):读取位姿def get_qvel(physics):读取速度def get_env_state(physics):定义环境状态接口这里没有实现要求子类实现def get_observation(self, physics):获得观测形状为obs[qpos]: (14,)左臂6 左夹爪1 右臂6 右夹爪1obs[qvel]: (14,)结构同上速度obs[env_state]:TransferCubeEETask: (7,)一个物体 poseInsertionEETask: (14,)pegsocket 两个物体 poseobs[images][top]: (480, 640, 3) uint8obs[images][angle]: (480, 640, 3) uint8obs[images][vis]: (480, 640, 3) uint8obs[mocap_pose_left]: (7,)xyz quatobs[mocap_pose_right]: (7,)xyz quatobs[gripper_ctrl]: (4,)左右夹爪控制量 [L, -L, R, -R]class TransferCubeTask(BimanualViperXTask):为传递方块的子类def initialize_episode(self, physics):初始化所有关节位置和方块位置def get_env_state(physics):获得关节位置def get_reward(self, physics):根据接触情况返回当前 step 的奖励。遍历当前物理步的所有接触点取出该接触的两个几何体 id把几何体 id 转成可读名称。如果右夹爪接触方块奖励至少 1右夹爪接触且方块离开桌面被抬起奖励升到 2左夹爪接触方块表示开始交接奖励升到 3左夹爪接触且方块不在桌上认为交接成功奖励最高 4。class InsertionTask(BimanualViperXTask):插入的子类def get_reward(self, physics):如果左右夹爪都接触到了各自应该拿的物体左手 socket右手 peg奖励为1。表示“双手都接触目标”。如果双手都接触目标而且 peg 和 socket 都离开了桌子奖励升级为2。表示“双手都真正抓起了物体”。如果 peg 和 socket 已经碰到一起并且二者都不在桌上奖励为3。表示“插销和插孔已经对接上”。如果 peg 碰到了 pin奖励设为4。表示“插入成功”这是最高奖励。def get_action(master_bot_left, master_bot_right):动作变为14维动作向量、def test_sim_teleop():把真实臂的数据送入仿真ee_sim_env.py实现了末端位姿控制def make_ee_sim_env(task_name):左臂动作里有7维末端位姿3维位置 x, y, z4维四元数姿态 quat左夹爪再加1维开合量。一共16维度scripted_policy.py作用是手动写出专家策略完成方块传递任务整体结构BasePolicy脚本策略基类负责轨迹插值和按时间输出动作。PickAndTransferPolicy传方块任务的手工策略。InsertionPolicy插销插孔任务的手工策略。test_policy测试这些脚本策略能不能在仿真里跑通。class BasePolicy:父类def interpolate(curr_waypoint, next_waypoint, t):定义线性插值def __call__(self, ts):把类实例变成可调用对象在每一步时调用取出waypoint进行插值得到当前时间步的轨迹。class PickAndTransferPolicy(BasePolicy):继承basepolicy实现def generate_trajectory(self, ts_first):先在第一次读取observation的机械臂位置和物块位置直接定义交接点通过打点控制机械臂def test_policy(task_name):变运行边显示摄像头数据观察是否正确运行
【导语:Karukan 是一款面向 Linux 和 macOS 的日语输入系统,它基于神经网络的假名汉字转换引擎,具有实时转换、上下文感知等特点,为日语输入带来了新的体验。】多平台适配的日语输入系统Karukan 项目由多个组件构成,以…
📅 2026/7/3 18:32:11
1. 项目概述:当AI开始写尼采式的格言,我们到底在训练什么?“我用AI生成尼采式箴言”——这个标题乍看像一场技术炫技,实则是一次对语言本质、哲学表达与模型能力边界的三重叩问。过去两年里,我陆续用不同架构的开源语言…
📅 2026/7/3 18:32:11
1. 项目概述:在Colab里拿数据,远不止upload一个按钮那么简单 “Various Ways to Get Data on Google Colab”——这个标题看似平实,但背后藏着每个用Colab做实验的人每天都在面对的真实困境:你刚写完模型代码,准备喂数…
📅 2026/7/3 18:30:11
Barrier终极指南:一套键盘鼠标控制多台电脑的完整教程 【免费下载链接】barrier Open-source KVM software 项目地址: https://gitcode.com/gh_mirrors/ba/barrier
你是否厌倦了在办公桌上摆放多套键盘鼠标,频繁切换设备打断工作流?Ba…
📅 2026/7/3 19:40:18
如何快速掌握CTFAK 2.0:Clickteam Fusion游戏资源提取完全指南 【免费下载链接】CTFAK2.0 Updated version of the Clickteam Fusion Army Knife Decompiler 项目地址: https://gitcode.com/gh_mirrors/ct/CTFAK2.0
CTFAK 2.0是Clickteam Fusion游戏资源提取…
📅 2026/7/3 19:40:18
1. 项目背景与核心价值 在嵌入式系统开发中,精确的电压管理一直是个技术痛点。传统方案要么精度不足,要么成本过高,而KMR221这颗电压检测芯片配合PIC18F85J50微控制器的组合,恰好找到了性能与成本的黄金平衡点。我最近在一个工业传…
📅 2026/7/3 19:40:18
DBeaver驱动包架构深度解析:构建企业级数据库连接管理解决方案 【免费下载链接】dbeaver-driver-all dbeaver所有jdbc驱动都在这,dbeaver all jdbc drivers ,come and download with me , one package come with all jdbc drivers. 项目地址: https://…
📅 2026/7/3 19:40:18
一、引言:十堰火锅消费乱象与选型痛点近两年十堰餐饮消费回暖,网红火锅赛道极速扩容,叠加川渝火锅下沉热潮,本地新增火锅门店逐年上涨,但行业同质化、营销虚标、体验割裂问题突出。结合本地消费反馈,当前用…
📅 2026/7/3 19:40:18
1. 项目概述:为什么“本地优先”的轻量级智能体正在成为新刚需最近三个月,我陆续给六家中小团队做过技术咨询,几乎每场都会被问到同一个问题:“有没有一种智能体,不依赖云端API、不上传数据、不绑定厂商、装上就能跑&a…
📅 2026/7/3 19:38:17
1. AI Agent设计模式全景概览在智能系统开发领域,AI Agent的设计模式就像建筑师的蓝图,决定了智能体如何感知环境、处理信息并采取行动。从业五年来,我见证过太多团队因为模式选择不当导致系统重构的案例。最近在金融风控系统升级时ÿ…
📅 2026/7/3 0:00:32
1. 项目概述:iOS自动化测试的“定位”之痛做iOS自动化测试的朋友,十有八九都卡在“元素定位”这个环节上。你兴冲冲地写好了测试脚本,结果一运行,要么是找不到元素,要么是找到了但点不动,要么是这次能跑通下…
📅 2026/7/3 0:00:32
MTKClient实战指南:深度解析联发科芯片调试与设备修复方案 【免费下载链接】mtkclient MTK reverse engineering and flash tool 项目地址: https://gitcode.com/gh_mirrors/mt/mtkclient
MTKClient是一款专业的联发科芯片调试工具,为技术爱好者和…
📅 2026/7/3 0:00:32
6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…
📅 2026/7/2 17:37:53
引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…
📅 2026/7/2 17:37:51
目录
第一步:选对模板,省心一半
第二步:打开扫码点餐功能
开启功能按钮
桌台管理与桌码生成
第三步:个性化设计,打造品牌感
调整点餐页面
设置点餐规则 你还在让顾客站着排队点餐吗?2025年ÿ…
📅 2026/7/3 4:46:22
在业务中快速构建一个能理解私有文档、准确回答专业问题的智能助手,是很多开发团队面临的共同挑战。传统方案往往需要从零开始搭建复杂的 RAG(检索增强生成)系统,涉及文档解析、向量化、检索、大模型调用等多个环节,整…
📅 2026/7/2 9:49:12
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE
你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
📅 2026/7/3 10:20:06