16-ADAPTRACK:基于自适应阈值的多目标跟踪匹配算法
📅 2026/7/5 2:38:10
👁️ 次浏览
摘要多目标跟踪( MOT )在各种计算机视觉领域中起着关键作用最近的检测跟踪算法将MOT视为不同的检测和关联任务。然而现有的跟踪器在跨视频形成完整轨迹的同时往往依赖于敏感阈值来关联先前的轨迹和当前的检测结果。这些阈值对跟踪性能至关重要并且需要对每个数据集甚至序列进行手动调整限制了在实际应用中的适应性。为了解决这个问题在本文中我们引入了AdapTrack一种新的MOT算法它可以在不需要手动设置阈值的情况下适应变化的场景。 通过精心设计的匹配策略我们的跟踪器可以为每一帧自适应地选择适当的阈值并正确地关联检测到的物体。因此与现有最先进的方法相比Adap Track在标准的MOT基准测试集MOT17和MOT20上表现优异。我们的贡献总结如下。1我们推出AdapTrack-一种基于检测式跟踪的新型运动目标追踪算法能够在关联过程中自适应调整匹配阈值。这种自适应阈值设定方法无需手动配置阈值有效解决了阈值设置固有的敏感性问题并提升了该算法在多种场景下的跟踪性能。2我们提出的方法采用了一种精心设计的匹配策略该策略仅涉及负样本过滤和自适应阈值处理且计算开销极低。3我们的跟踪系统在多种跟踪场景中展现出卓越的适应性和稳健性在MOT17和MOT20数据集上均取得领先成果有效应对了不同跟踪环境带来的挑战。1、代码和数据集1.1 论文代码https://github. com / kamkyu94 / Adap Track1.2 数据集MOT17和MOT202、要解决的问题近年来基于TBD的跟踪器凭借其卓越性能成为主流选择--这类跟踪器通过二分匹配及其估算的成对亲和力在时间轴上依次连接检测结果。然而它们在关联过程中通常依赖敏感阈值来避免不同对象之间的错误匹配。这些阈值往往显著影响跟踪性能需要针对不同场景进行精细调整。例如图1中各序列最优阈值值的巨大差异充分体现了其固有的敏感性。尽管如此在大多数情况下匹配阈值仍需手动设置而考虑到MOT场景中广阔且不可预测的开放世界特性这种人工设定在实际应用中可能引发严重问题。3、提出的创新点我们推出了一款基于TB数据库的创新MOT追踪器AdapTrack该工具能够动态处理多种追踪场景无需手动设置阈值。通过采用由负样本过滤和自适应阈值设定构成的新型匹配策略我们的追踪器能够在每个帧的关联处理过程中自适应地确定合适的阈值。具体而言在过滤阶段我们首先会战略性地剔除可能干扰后续自适应阈值设定过程的噪声距离值;随后在自适应阈值设定阶段通过对过滤后的距离值进行分析并引入极化锚点值及聚类技术来确定最优阈值。3.1 方法我们提出的MOT算法分为多个步骤进行。首先,我们在 当前帧中检测感兴趣对象,其中第 i 个检测结果表示为,包含边界框位置、提取的外观特征以及置信度评分。随后,我们计算一组检测结果与现有轨迹集之间的成对距离;每个轨迹(记为)由其外观特征及 对应的检测结果集合共同构成,并持续更新。最后,通过使用新的匹配策略我们根据自适应确定的阈值和计算的距离将检测结果与相应的轨道进行适当的关联。3.2 匹配策略如图1和图2所示由于环境因素(包括相机和物体的运动)频繁变化用于排除检测结果与轨迹之间错误配对(即负样本配对)关联所需的阈值需要针对每个视频甚至每帧画面持续调整。然而现有多种方法仍存在依赖手动设定匹配阈值的局限性这在实际应用场景中可能带来显著挑战。为解决这一问题我们提出了一种可根据具体跟踪场景灵活调整的新型匹配策略。该策略通过两个独立阶段--负样本过滤与自适应阈值设定--使我们在每帧匹配过程中都能动态选择合适的阈值。在第一阶段我们剔除源自潜在负样本配对的距离值。随后在第二阶段我们根据负值对之间的距离通常大于正值对之间距离这一固有规律将剩余距离值分为两组从而确定合适的阈值。3.2.1 负值过滤在我们分析检测结果和现有轨迹之间的成对距离以自适应地找到一个适当的阈值来分离正负关联之前我们首先发现并过滤掉从明显的负对中计算的距离值。由于大多数距离不可避免地对应于负对因此这种主动滤波过程可以在随后的自适应阈值阶段最大限度地减少噪声值的潜在干扰并通过减少所考虑的目标数量来简化后续阶段。尽管该滤波阶段的实现方式可能不同但在我们的Adap Track中考虑到算法的简洁性我们在计算的距离中引入了空间约束。 更具体地说当我们使用外观特征之间的余弦距离计算距离时我们通过将没有任何空间重叠的对的距离值替换为它们的IoU距离来实现这个过滤阶段即这种情况下的IoU距离。这种过滤过程还可以通过拒绝具有高相似度但空间距离较远的配对之间的匹配来显著降低错误关联的风险。3.2.2 自适应阈值处理在这个阶段我们分析距离的过滤值并自适应地确定适当的阈值来区分负关联和正关联。首先我们在过滤后的距离集合中引入两个新的极化锚值并将超出范围的锚值丢弃到添加的锚值中。两个锚值分别被分配为当前距离度量的可能最小值和滤波前的最大距离值。然后我们利用正对之间的距离大多低于负对之间的距离这一固有特性将距离值聚为两组。注入的锚值作为聚类开始的初始点。 最后基于聚类结果我们设定阈值为正组的最大距离分数。3.3 AdapTrack算法1给出了我们提出的Adap Track的伪代码。在整个输入视频中我们首先检测当前帧中的物体(第4行)并使用Kalman滤波器(第7 ~ 9行)更新轨迹及其预测的后续位置。随后我们计算O和K之间的距离矩阵其中和分别表示外观特征的余弦距离和基于卡尔曼状态的马氏距离的矩阵(第12行)。在负值过滤后自适应地选择匹配阈值并通过基于成对距离的二分匹配和匈牙利算法将每个轨道与相应的检测结果相关联只有当它们的距离小于( 13 ~ 16)。 此外我们计算和之间的IoU距离只有当匹配对的距离低于阈值时才将它们关联起来这也是自适应确定的(线23 ~ 26)。最后将剩余的检测结果初始化为新的航迹(第32行)并使用与前文工作类似的对应匹配检测结果的特征更新匹配后的第 j 个航迹的外观特征。4、结论与不足尽管基于检测的跟踪算法凭借卓越性能长期主导运动目标跟踪领域,但其对敏感阈值的固有依赖性仍带来诸多挑战,阻碍了实际应用。为解决这一问题,我们提出了一种名为AdapTrack的创新算法——该算法能够适应动态跟踪场景,同时无需人工配置阈值。通过采用包含负样本过滤和自适应阈值设定的新型匹配策略,我们的跟踪系统可为每帧图像自动确定合适的阈值,从而提升在不同环境下的跟踪性能。经过大量分析与消融实验验证,该算法在MOT17和MOT20数据集上均展现出超越行 业平均水平的性能优势。凭借其强大的鲁棒性和灵活性,AdapTrack为实际应用场景提供了更为可靠且灵活的解决方案。
🚀 30款热门AI模型一站整合,DeepSeek/GLM/Qwen 随心用,限时 5 折。 👉 点击领海量免费额度 ChatGPT 是什么?它能做什么?为什么它能在短短几个月内引爆全球 AI 浪潮,并持续影响至今࿱…
📅 2026/7/5 2:38:10
开篇:2026年,酒店门头成客流胜负手2026年,Z世代、新中产成为酒店消费核心群体,据《2026商业视觉营销报告》显示,87%的消费者会因门头设计亮眼而主动进店,门头的引流权重已超越线上点评排名的20%。但多数酒店…
📅 2026/7/5 2:38:10
智能驾驶摄像头带宽计算与SerDes选型:很多项目不是算法差,而是第一根线就算错了 01 一辆智能车为什么长满了“眼睛”? 你有没有发现,十年前的汽车只有一颗倒车摄像头,今天的智能车却恨不得把前后左右都装满摄像头?这不是车企在堆配置,而是智能驾驶系统被场景逼出来的结果…
📅 2026/7/5 2:36:10
一、引言:复杂网络环境中的防火墙规则管理困境随着企业数字化转型深入,网络边界日益模糊,混合云、多数据中心、分支机构互联成为常态。防火墙作为网络安全的第一道防线,承载着访问控制、入侵防御、流量审计等关键职能。然而&#…
📅 2026/7/5 3:54:24
给定一个二叉搜索树的根节点 root ,和一个整数 k ,请你设计一个算法查找其中第 k 小的元素(k 从 1 开始计数)。示例 1:输入:root [3,1,4,null,2], k 1
输出:1示例 2:输入ÿ…
📅 2026/7/5 3:54:24
在2026年这个节点,教育部严抓学术规范,自动降AIGC率,知网查重率成了每位硕博生、高校教师的卡点。
其实,AI论文写作早就不再是简单的文字堆砌,它已进化到能帮你深度分析数据、对标学术范式的地步。如果你还在为AI写毕业…
📅 2026/7/5 3:54:24
明天又要去参加一次面试。每次面试的时候,面试官都会在最后给面试者一些时间,来问问题。这是个非常好的机会,能按照自己的思路,来了解职位、技术、企业文化、福利待遇、企业状况和前景等情况,以弥补前面面试过程中没有…
📅 2026/7/5 3:54:24
1、AI程序员系列文章 2、AI面试系列文章 3、AI编程系列文章 目录
开篇:为什么我们要逃离Electron
Tauri架构全景:RustWebview的优雅组合
架构图解
核心设计理念
环境搭建:5分钟跑起第一个Tauri应用
前置依赖
创建项目
项目结构解析
…
📅 2026/7/5 3:54:24
前言:制造业获客方式升级,线上渠道成必选项2026年,内蒙古的制造业工厂面临着新的挑战和机遇。传统的线下展会、客户转介绍等获客方式,效果越来越有限;而线上渠道正在成为制造业获客的新主战场。很多制造业工厂的老板已…
📅 2026/7/5 3:52:24
1. 项目背景与核心需求 在嵌入式系统开发中,快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下,系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…
📅 2026/7/5 0:01:51
1. 工业电流环信号传输的基础认知在工业自动化领域,4-20mA电流环传输技术已经持续服役超过半个世纪。这种看似简单的信号传输方式之所以能经久不衰,核心在于其独特的抗干扰能力——电流信号在长距离传输时几乎不受线路电阻和电压波动的影响。我曾在化工厂…
📅 2026/7/5 0:01:51
最近在项目里尝试用 YOLO 做目标检测,从环境搭建到模型训练,再到推理部署,整个过程踩了不少坑。网上的资料虽然多,但要么版本老旧,要么步骤零散不成体系,对于刚入门的新手来说,很容易卡在某个环…
📅 2026/7/5 0:01:51
1. 项目背景与核心需求 在嵌入式系统开发中,快速精确的数据检索是一个常见但极具挑战性的需求。特别是在工业控制、医疗设备和物联网终端等场景下,系统往往需要在毫秒级时间内完成关键参数的读取和写入操作。传统基于Flash存储的方案存在擦写次数有限、操…
📅 2026/7/5 0:01:51
1. 工业电流环信号传输的基础认知在工业自动化领域,4-20mA电流环传输技术已经持续服役超过半个世纪。这种看似简单的信号传输方式之所以能经久不衰,核心在于其独特的抗干扰能力——电流信号在长距离传输时几乎不受线路电阻和电压波动的影响。我曾在化工厂…
📅 2026/7/5 0:01:51
最近在项目里尝试用 YOLO 做目标检测,从环境搭建到模型训练,再到推理部署,整个过程踩了不少坑。网上的资料虽然多,但要么版本老旧,要么步骤零散不成体系,对于刚入门的新手来说,很容易卡在某个环…
📅 2026/7/5 0:01:51
目录
第一步:选对模板,省心一半
第二步:打开扫码点餐功能
开启功能按钮
桌台管理与桌码生成
第三步:个性化设计,打造品牌感
调整点餐页面
设置点餐规则 你还在让顾客站着排队点餐吗?2025年ÿ…
📅 2026/7/4 5:07:51
在业务中快速构建一个能理解私有文档、准确回答专业问题的智能助手,是很多开发团队面临的共同挑战。传统方案往往需要从零开始搭建复杂的 RAG(检索增强生成)系统,涉及文档解析、向量化、检索、大模型调用等多个环节,整…
📅 2026/7/4 5:10:18
FAE放射组学分析工具:医学影像特征探索的完整解决方案 【免费下载链接】FAE FeAture Explorer 项目地址: https://gitcode.com/gh_mirrors/fae/FAE
你是否曾经面对海量医学影像数据感到无从下手?想要从CT、MRI等影像中提取有价值的定量特征&#…
📅 2026/7/4 17:36:47