RaUF:让毫米波雷达学会“不确定”感知

RaUF:让毫米波雷达学会“不确定”感知
论文标题RaUF: Learning the Spatial Uncertainty Field of Radar发表日期2026年发表单位华中科技大学 (Huazhong University of Science and Technology)期刊Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026原文链接https://openaccess.thecvf.com/content/CVPR2026/html/Wang_RaUF_Learning_the_Spatial_Uncertainty_Field_of_Radar_CVPR_2026_paper.html开源代码论文声明项目将开放于 https://shengpeng.wang/rauf通讯作者Shengpeng Wang华中科技大学一、雷达为什么总在角度上“发虚”雨天、夜间、尘土和强光都会让相机吃亏毫米波雷达却还能稳定工作。但当雷达点云被送进自动驾驶感知系统时问题又换了一种形式出现距离方向还算可靠角度方向却经常像被拉开了一条扇形阴影。这种“发虚”不是算法偷懒而是雷达硬件本身留下的物理痕迹。有效角度到达天线数量有限方位角分辨率天然弱于距离分辨率。同一个真实目标在雷达空间里可能对应一片弯月形的候选区域。稀疏点太少雷达原始点云不像 LiDAR 那样密很多结构只能靠网络从少量反射里推断。角向误差太大距离维度和方位维度的误差不是一个量级用普通的各向同性置信度描述会把雷达最重要的物理差异抹平。️鬼点很会骗人多径反射和噪声会制造虚假点。很多方法依赖强度图强反射不一定是真目标弱反射也不一定该丢。现有路线大致分成几类。CFAR 类传统检测速度快、链路清楚但点云稀疏角分辨率上限受硬件限制。RadarHD / RPDNet 类监督增强借助 LiDAR 或高分辨率传感器做监督可以补出更密结构但容易把一对多的模糊映射压成平均答案。扩散类方法 SDDiff重建能力强但多轮扩散迭代计算更重在车载级实时部署里压力更大。共同卡点很清楚雷达不是缺一个更会“补点”的网络而是缺一个尊重雷达误差形状的学习目标。二、化繁为简的妙招从“确定点云”到不确定性场如果一个雷达点在角度方向本来就不准硬让网络预测一个唯一坐标监督信号就会变得拧巴。不同样本可能给出彼此冲突的 LiDAR 标签网络最后学到的平均位置看起来平滑却可能不符合任何真实结构。RaUF 的核心动作是把这个问题改写成概率建模。网络不只输出目标在哪里还输出该位置对应的不确定性。换句话说模型学到的不是一张“标准答案地图”而是一张带置信度的“误差地图”。第一个关键洞察来自雷达物理雷达误差在距离和角度方向上并不对称。论文把这种弯月形空间分布近似成各向异性高斯置信椭圆用极坐标里的距离、方位角和俯仰角不确定性再转换到笛卡尔坐标下的协方差。这样一来网络可以承认“这个点沿角度方向更不准”而不必把所有方向都当成同等可靠。第二个关键洞察来自多普勒。对于静止散射点径向速度由雷达自身运动和散射点方向决定。真实反射会更符合这种运动学约束鬼点和多径反射则更容易偏离。RaUF 用多普勒一致性给空间点云加了一层物理筛选。第三个设计是双向域注意力融合。强度分支负责空间定位多普勒分支负责速度一致性。两个分支先各自提特征再通过 cross-attention 互相校准空间特征帮助多普勒分支聚焦可疑区域多普勒特征再反过来修正空间占据判断。这套设计的妙处在于它没有把雷达的不确定性当成噪声删掉而是把不确定性变成训练信号本身。三、算法流程先画误差再压鬼点RaUF 的输入是包含强度和多普勒信息的雷达测量张量。两条 3D CNN 分支分别提取空间占据特征和多普勒速度特征。3D 卷积会同时处理距离、方位和俯仰维度计算量随三维网格规模增长瓶颈主要落在体素特征的乘加和显存占用上。随后进入双向域注意力融合。强度特征和多普勒特征被 patch 化为 token 序列先用空间 token 查询多普勒 token得到更聚焦的速度一致性表征再把多普勒投影到类似占据图的隐空间用它反向查询空间 token更新空间结构。输出端分两路一路预测点云位置均值一路预测各向异性协方差。训练时LiDAR 点云通过视锥体体素化构造监督区域负对数似然损失负责让位置误差和预测不确定性相互匹配辅助速度回归则继续约束多普勒一致性。最终得到的不是一堆“我觉得这里有点”的雷达点而是一组带空间置信度的候选反射。下游配准、速度估计和目标跟踪可以利用这些置信度少信那些物理上不稳定的点。四、性能数字RaUF到底强在哪只看点云是否更密很容易误判雷达增强方法。真正关键的问题是补出来的点能不能贴近 LiDAR鬼点比例有没有下降下游任务会不会受益。在 Coloradar 数据集上RaUF 相比传统 OS-CFAR 的平均 Chamfer Distance 降低约 70.1%F-score 约提升 5 倍。工程上这意味着它不是只在局部多补了几个点而是在整体几何贴合度和可用点比例上同时改善。表 1 更能说明问题。单芯片雷达场景里RaUF 在 Armyroom 上达到 1.31 CD 和 0.69 F-score在 Classroom 上达到 1.74 CD 和 0.54 F-score级联雷达场景里Longboard 的 CD 从 OS-CFAR 的 12.99 降到 3.79F-score 从 0.04 提升到 0.36。消融实验也比较干净。不确定性校准让 CD 降低 30.55% 到 37.18%F-score 提升 27.27% 到 38.71%。BDA 模块相对只用强度的基线又带来 14.98% 到 15.95% 的提升。这两个数字分别对应 RaUF 的两条主线承认角向模糊利用多普勒压制鬼点。下游任务同样有收益。在 transformation estimation 中使用 RaUF 的不确定性感知点云相比 GICP 在平移和旋转精度上都提升约 22%。ego-velocity estimation 方面它超过经典 RANSAC并接近端到端 RadarEVE 的表现。从公开数据到真实采集泛化性够不够实验如果只在一个室内 benchmark 上好看对车载雷达意义有限。RaUF 的验证覆盖了 Coloradar、RaDelft 和自采数据传感器也包含短距单芯片雷达和长距级联雷达。Coloradar 提供 4.3 万帧雷达数据覆盖室内外不同环境。RaDelft 来自大规模城市道路场景雷达最大探测距离 51 米记录时长约 35 分钟。论文作者还采集了超过 1.1 万帧真实数据用 Fast-Livo2 获得速度真值。训练成本并不轻。论文实验使用 4 张 NVIDIA GeForce RTX 4090 和 Intel Xeon Gold 6226R CPU总训练时间约 6 天。这说明 RaUF 的训练阶段仍是研究级配置不能简单理解为端侧小模型。不过推理侧比扩散迭代路线更友好。RaUF 的主干是 3D CNN 加双向 attention没有 SDDiff 那种重复采样过程。真正部署时压力会集中在三维雷达网格、token 化后的注意力长度以及多普勒分支额外计算上。工程团队需要做稀疏化、量化或裁剪才能把它塞进车载 SoC 的实时预算。未来展望雷达感知会走向“可信点云”吗很多雷达点云增强方法默认追求一个目标让点更多、更像 LiDAR。RaUF 给出的方向更谨慎也更适合工程系统点云不仅要密还要知道哪些点该信、哪些点要打折。这种思路可以迁移到多个任务。配准时不确定性可以作为点权重目标跟踪时置信椭圆可以进入数据关联多传感器融合时雷达点不再只是一个硬坐标而是一条带误差形状的观测。挑战也很现实。RaUF 仍依赖 LiDAR 构造监督意味着训练数据采集成本不低。多普勒一致性主要服务于静止散射或符合运动假设的目标复杂动态交通参与者会让约束变得更难。论文给出了真实数据验证但离量产系统还差传感器适配、延迟评估、端侧压缩和长期天气测试。所以 RaUF 的价值不是立刻替代现有车载雷达管线而是把“雷达点云增强”从生成更漂亮的图推进到生成更可信的观测。Armor三问Q1RaUF 会不会只是把 LiDAR 的形状蒸馏给雷达不完全是。它确实用 LiDAR 构造监督但重点不只是拟合 LiDAR 点云而是把雷达自身的各向异性误差写进损失函数。这个物理约束让它比普通 cross-modal supervision 更像雷达方法。Q2多普勒一致性真的能解决鬼点吗它能过滤一部分不符合运动学约束的虚假反射尤其是多径和杂波造成的异常点。但它不是万能清洗器。动态目标、复杂反射面和自车运动估计误差都会影响多普勒约束的可靠性。Q3这套方法适合直接上车吗还不能这么乐观。训练成本高推理延迟没有给出足够完整的车规级数字真实部署还要看 SoC、雷达规格和数据链路。更合理的判断是RaUF 提供了一个值得工程化压缩的方向。可能的问题RaUF 依赖 LiDAR 监督和特定数据集训练跨雷达型号、安装位置和城市道路分布时仍需要重新适配。论文没有给出足够细的端侧实时指标也没有系统讨论动态目标对多普勒一致性的破坏。对工程团队来说这篇论文最值得借鉴的是物理建模思路而不是直接照搬整套网络。