开源|DroneRFa:面向低空反无人机探测的大规模射频信号数据集(浙大最新成果)
重磅开源DroneRFa面向低空反无人机探测的大规模射频信号数据集浙大最新成果发布平台电子与信息学报2024 年第 4 期作者俞宁宁毛盛健周成伟孙国威史治国 *陈积明单位浙江大学浙江省协同感知与自主无人系统重点实验室、承德市公安局原文链接一、为什么我们需要一套全新无人机射频公开数据集近些年消费级、工业级无人机普及速度飞快航拍、电力巡检、农林植保、应急救援都离不开无人机但随之而来的黑飞、滥飞安全事件持续激增已经成为空域安防、公共治安、机场管控、重点区域防护的重大难题。文中整理近年全球典型无人机违规事件涵盖毒品走私、隐私偷拍、机场停运、禁区闯入、公共设施损毁等多类场景美国加州利用微型无人机跨境走私毒品法、意多地无人机闯入政务活动、历史地标空域国内海口、武汉接连出现铁路、居民区无人机违规拍摄爱尔兰都柏林机场因无人机入侵临时停运航班。现有空域管控手段对带 GPS 的正规商用无人机约束有效但无 GPS 自制改装无人机、境外改装飞控设备不受禁飞区限制管控存在巨大漏洞。当前主流四类反无人机探测方案各有明显短板探测方式探测距离核心优势致命短板视觉光电1–2km无源隐蔽、目标直观受光照、遮挡影响极大夜间探测成本高声学探测150m设备廉价、无源接收城市车流、人声噪声严重干扰识别有源雷达3–8km远距离、测速测距低空杂波严重、设备昂贵、电磁辐射明显不适合城区无源射频探测1–5km电磁特征难以伪装、无源低干扰、城区适配性强同频 WiFi、蓝牙杂波干扰硬件成本偏高综合对比后基于射频信号的无源探测是城市低空无人机监测最优路线之一。但目前领域发展存在关键瓶颈现有公开无人机射频数据集机型少、覆盖频段单一大多仅采集 2.4GHz 信号缺少多频段切换数据大量研究采用私有闭源数据集不同算法无法在统一基准下公平对比行业缺少标准化评测基准缺少区分室内 / 户外、远近不同飞行距离的标注数据难以支撑信号衰减、复杂场景识别算法研究。针对以上痛点浙江大学团队公开DroneRFa 大规模无人机射频数据集完整覆盖多机型、多场景、三大 ISM 公用频段配套两套完整识别验证方案可供所有反无人机、频谱识别领域学者免费下载使用。二、DroneRFa 数据集核心优势一览1. 样本规模大、机型覆盖全面数据集总计25 类射频信号城市户外运动无人机信号9 类城市室内静态无人机 / 飞控信号15 类背景干扰参照信号1 类含 WiFi、蓝牙电磁环境覆盖大疆全系列消费、工业级无人机外加 VBar、FrSky、Futaba、RadioLink、云卓等主流第三方飞控器完全匹配市面主流违规无人机硬件。数据采集标准严苛每一类机型不少于 12 个独立信号片段单片段采样点超 1 亿个数据量级足以支撑深度学习、传统时频统计算法训练与验证。2. 三 ISM 频段双通道同步采集弥补现有数据短板采集覆盖全球通用三大工业科学医疗开放频段915MHz902–928MHz、2.4GHz2400–2484.5MHz、5.8GHz5725–5850MHz采用双通道同步采集机制可完整记录无人机多频段自动切换通信行为。现有绝大多数公开数据集仅聚焦 2.4GHz 单频段本数据集填补多频段跳频图传数据空白适配新一代多模无人机研究。3. 精细化距离标注支撑射频衰减、远距离弱信号研究户外采集严格划分三级飞行距离标签D0020–40m近距D0140–80m中距D1080–150m远距不同距离下无人机射频信号衰减、信噪比变化完整留存专门面向远距离微弱无人机信号检测、抗衰减识别算法研发。4. 标准化二进制编码命名批量读取、筛选便捷全部数据统一为.mat格式文件文件名自带完整标签格式Txxxxx_Dxx_Sxxxx.matT机型二进制编码0000 为背景其余对应大疆各机型、第三方飞控D距离二进制编码近 / 中 / 远三档S频段模式编码区分初始通信频段、可切换多频段设备举例T0010_D01_S1110.mat 40–80m 距离 DJI Phantom 4 Pro支持 2.4G/5.8G 频段切换射频数据。单文件内置 4 路 I/Q 基带数据RF0_I、RF0_Q、RF1_I、RF1_Q双接收通道同相正交复信号双精度浮点存储Matlab、Python h5py 均可一键读取官方提供读取代码示例。三、数据集硬件采集方案与完整采集流程1. 全套采集设备清单射频接收机NI USRP-2955频率覆盖 10MHz–6GHz4 收发通道最大瞬时带宽 80MHz采样率最高 100MS/s14bit ADC增益 0–95dB接收天线VERT2450 全向垂直增益天线2.4/5.8GHz 双频段3dBi 增益计算主机Win10 工作站至强 W-2245 处理器32GB 内存1TB 以上存储LabVIEW 驱动采集传输套件PCIe 高速连接线单通道吞吐 100MS/s传输延迟10ms被测目标全系列大疆无人机 多品牌独立飞控。2. 采集场景划分户外场景杭州城郊开阔小镇无人机水平距离接收机 20–150m飞行速度 5–15m/s 动态采集室内场景无人机与接收机固定间距 2m无远距离衰减干扰用于纯净信号特征提取。3. 标准化采集步骤无人机开机与遥控器配对确认通信链路正常LabVIEW 初始化 USRP双通道中心频率按需配置大疆主流机型通道 02440MHz通道 15800MHz仅支持 915M/2.4G 飞控通道 0915MHz通道 12440MHz统一参数采样率 100MS/s、接收增益 50dB、单次存储 10M 采样点操控人员由近至远改变无人机位置划分近 / 中 / 远三档距离标定采集人员按编码规则命名 mat 文件每段采集≥1 亿采样点更换机型、飞行距离、通信频段重复采集样本量达标后停机。补充说明数据连续性细节采集采用 “采集 - 存储” 分段模式每 10M 采样点区间内信号完整连续间断仅出现在分段交界处。无人机跳频、图传周期特征在 0.1s10M 采样点窗口内完整呈现短时信号分析不受分段间隙影响。四、两套完整无人机识别验证方案数据集有效性论证论文配套两套识别算法分别适配轻量化实时检测、高精度复杂场景识别所有实验均基于 DroneRFa 完成可直接复现。方案一基于频谱可视统计特征的轻量化识别无深度学习、低算力原理基础无人机射频分为两类核心信号上行控制跳频信号遥控器下发飞行指令采用跳频扩频调制不同机型跳频带宽、跳频间隔、脉冲时长存在固定出厂特征下行图传 OFDM 信号无人机回传航拍画面具备固定周期、占空比可作为区分特征。6 类核心统计特征指标跳频块带宽、跳频块持续时长、相邻跳频时间间隔、相邻跳频带宽间隔、图传信号周期、图传占空比。论文给出全部 24 类无人机、飞控器完整特征参数表可直接建立特征匹配库。识别流程对 I/Q 复信号做 STFT 短时傅里叶变换生成时频图滑动窗口遍历时频图谱提取全部跳频块、图传脉冲计算 6 项统计特征与数据库先验参数匹配完成机型分类。适用场景边缘低算力无源探测设备、实时快速筛查短板为远距离弱信号、同调制机型识别精度不足。方案二基于 ResNet-18 深度学习的高精度识别复杂干扰、远距离弱信号适配针对传统统计特征方法缺陷短片段特征缺失、远距离信号淹没、同类调制区分度低采用卷积神经网络自动挖掘隐层时频特征。实验配置样本划分每 100 万采样点10ms作为独立样本6:2:2 划分训练 / 验证 / 测试集样本总量近 1.6 万STFT 参数汉明窗滑动重叠 0.5输入时频图尺寸 (2,1024,1024)训练参数Adam 优化器学习率 0.001批次 32损失函数交叉熵对比变量时域长度、频域分辨率双变量消融实验。核心实验结论性能对照表精简解读基准配置时频窗 1024×1024识别准确率 97.73%多分类精确率、召回率、F1 值均超 0.97单帧推理速度 53fps时域长度压缩对精度衰减影响远大于频域压缩缩短信号时长会大幅丢失跳频周期特征识别性能断崖下跌若需提升设备实时推理速度优先降低频域分辨率可在精度小幅下降前提下大幅提升帧率最高 217fps。混淆矩阵结果显示绝大多数机型无严重错分仅少量调制参数近似飞控存在极低概率混淆证明数据集特征区分度充足。五、数据集下载与引用规范官方下载地址https://jeit.ac.cn/web/data/getData?dataTypeDataset3学术使用强制要求论文、学位论文、会议报告、专利、项目成果中使用 DroneRFa 数据集必须规范引用本文俞宁宁毛盛健周成伟等.DroneRFa: 用于侦测低空无人机的大规模无人机射频信号数据集 [J]. 电子与信息学报2024,46 (4):1147-1156.DOI:10.11999/JEIT230570六、总结与后续研究规划现有数据集价值DroneRFa 填补了国内多场景、多频段、带距离标注开源无人机射频数据集空白统一评测基准同时提供传统时频统计、深度学习两套完整基线算法可支撑无人机检测、机型识别、弱信号复原、多源干扰抑制、射频指纹提取全方向研究。后续扩充计划团队将持续维护更新数据集后续迭代方向新增多无人机集群同时飞行混合射频样本叠加 WiFi、蓝牙、移动通信等强同频干扰场景数据补充更多国产、自制改装飞控、小型穿越机射频样本增加多接收阵列、多距离梯度精细化标注数据。文末留言区公众号互动话术从事反无人机射频识别、频谱感知、深度学习信号分类的同行可直接前往官网下载数据集复现论文基线如有数据集读取、采集方案复现、算法优化相关问题可查阅原文实验章节或联系通信作者史治国教授转发分享给空域安防、电磁信号处理、无人系统方向课题组共建统一开源评测基准