2025年IEEE TKDE,LLM-QL:多架并行无人机调度方法
📅 2026/6/26 4:16:55
👁️ 次浏览
目录1.摘要2.LLM 增强 Q-Learning 方法3.实验分析4.结论7.参考文献8.算法辅导·应用定制·读者交流1.摘要多飞行助手旅行商问题mFSTSP多架 UAV 与卡车协同配送传统调度方法在大规模场景下计算成本高、探索低效且容易陷入局部最优。本文提出LLM-QL 将 Q-Learning 局部探索与 LLM 对未知环境全局理解结合用专门设计的提示词把问题建模转为 LLM 易理解形式并生成启发式项指导探索。2.LLM 增强 Q-Learning 方法问题建模mFSTSP 目标是最小化卡车和多 UAV 完成所有配送并返回终点总完成时间min t c 1 \min\; t_{c1}mintc1关键约束包括每个客户只被卡车或某架 UAV 服务一次卡车从仓库出发并返回终点每架 UAV 每次任务最多服务一个客户UAV 飞行时间不超过续航卡车路径保持连通并消除子回路。将 mFSTSP 转为序贯决策问题。状态S ( i , D ) S(i,D)S(i,D)表示卡车当前位置和 UAV 状态动作A ( j , m ) A(j,m)A(j,m)表示选择下一节点j jj和运输方式m mm其中m 0 m0m0为卡车m 1 m1m1为 UAV。Q 表Q [ i , j , m ] Q[i,j,m]Q[i,j,m]存储从节点i ii到节点j jj并使用工具m mm累计回报。Q [ i , j , m ] Q [ i , j , m ] α ( R [ i , j , m ] γ max A ′ Q [ j , k , m ′ ] ) − Q [ i , j , m ] (12) Q[i,j,m]Q[i,j,m]\alpha\left(R[i,j,m]\gamma\max_{A}Q[j,k,m]\right)-Q[i,j,m] \tag{12}Q[i,j,m]Q[i,j,m]α(R[i,j,m]γA′maxQ[j,k,m′])−Q[i,j,m](12)其中α \alphaα为学习率γ \gammaγ为折扣因子。奖励原先取路径距离倒数距离越短奖励越高。LLM 增强 Q-LearningLLM-QL 先分别构造卡车道路距离矩阵和 UAV 欧氏距离矩阵。卡车距离反映真实路网UAV 距离反映直飞路径。将目标函数、约束、当前状态和 Python 模板输入 LLM让其生成可执行启发式函数H [ i , j , m ] H[i,j,m]H[i,j,m]。启发式项综合距离、未访问状态、客户优先级、邻近连接度和时间效率用于指导动作选择。LLM-QL 的奖励函数为R [ i , j , m ] { 1 T [ i , j , m ] , 若所有约束满足 − ∞ , 若任一约束违反 R[i,j,m] \begin{cases} \dfrac{1}{T[i,j,m]}, \text{若所有约束满足}\\ -\infty, \text{若任一约束违反} \end{cases}R[i,j,m]⎩⎨⎧T[i,j,m]1,−∞,若所有约束满足若任一约束违反引入 LLM 启发式后 Q 值更新Q [ i , j , m ] ← Q [ i , j , m ] α ( R [ i , j , m ] γ max A ′ Q [ j , k , m ′ ] ) H [ i , j , m ] − Q [ i , j , m ] Q[i,j,m]\leftarrow Q[i,j,m]\alpha\left(R[i,j,m]\gamma\max_{A}Q[j,k,m]\right)H[i,j,m]-Q[i,j,m]Q[i,j,m]←Q[i,j,m]α(R[i,j,m]γA′maxQ[j,k,m′])H[i,j,m]−Q[i,j,m]每轮训练中算法按ε \varepsilonε-greedy 策略选择动作计算 LLM 启发式值并更新 Q 表直到所有节点访问完成。3.实验分析实验使用西雅图城市数据集包含仓库、客户经纬度和包裹重量。卡车距离采用真实道路网络距离UAV 距离采用欧氏距离。LLM 使用 ChatGPT-4o框架不依赖特定模型。对比方法包括 MILP、2PML 和 MAPPO。消融实验消融实验比较有无 LLM 启发式的 Q-Learning。小规模任务中加入启发式后不一定每次都达到精确最优但收敛明显更快大规模任务中收敛速度相近但启发式版本给出更准确的总完成时间。两类数据集上结果一致说明 LLM-QL 具有泛化性。解质量与问题规模比较在不同客户规模和 UAV 数量下LLM-QL 总完成时间最低说明其能在固定迭代内更快找到更好解。MILP 在小规模可精确求解但大规模复杂度迅速上升2PML 受聚类和路径规划两阶段折中影响MAPPO 虽提高协作效率但大规模下训练和计算压力较大。4.结论LLM-QL通过启发式项减少无效探索并加速收敛。理论上加入有界启发式不破坏 Bellman 算子压缩性且近似误差有界。实验表明LLM-QL 在大规模场景中优于 MILP、2PML 和 MAPPO在总完成时间、运行时间和 UAV 利用率等关键指标上最高提升约 1.35 倍。7.参考文献Zhou Q, Wu J, Zhu M, et al. LLM-QL: a LLM-enhanced Q-learning approach for scheduling multiple parallel drones[J]. IEEE Transactions on Knowledge and Data Engineering, 2025.8.算法辅导·应用定制·读者交流xx
在全球设备管理市场中,Jamf、Kandji、Microsoft Intune、Samsung Knox Guard、Google Device Lock Controller、PayJoy、NuovoPay、Trustonic 等国际方案,都在各自领域形成了成熟能力。
但对于中国大陆的手机租赁行业来说,真正的问题并不是“…
📅 2026/6/26 4:16:55
生成式人工智能逐步融入海外用户日常信息获取的背景下,出海企业开始关注一个新的营销方向:如何让品牌信息更可能被AI大模型识别、引用,并在用户与AI对话时获得推荐。这一方向,目前行业内常被称为“谷歌GEO”(Generativ…
📅 2026/6/26 4:16:55
伴随家居装修行业的品质升级,高端系统门窗凭借良好的隔音、节能、密封、抗风压性能,适配住宅、别墅、商业建筑等多种装修场景,成为现代家装与建筑配套的主流建材品类。和传统普通门窗相比,系统门窗依托标准化研发与工业化工艺打造…
📅 2026/6/26 4:16:55
每年这个时候,总有不少同学在计算机金融和金融工程这两个名称相似的方向之间徘徊。它们都带有“金融”色彩,都强调数学和编程基础,从课程表上看似乎差别不大。但真正走到就业环节,各自的培养目标、适合人群、以及在校期间需要储备…
📅 2026/6/26 5:37:02
1. 项目概述:从“玩具模型”到前沿物理的桥梁 最近在整理一些理论物理和数学物理交叉领域的老课题笔记,发现“非线性李共形代数”与“自对偶杨-米尔斯理论的单圈修正”这个组合,依然是一个充满魅力且能带来新启发的“宝藏”方向。乍一看标题&…
📅 2026/6/26 5:37:02
结对编程(Pair Programming)是一种由两名开发者共同完成同一项开发任务的软件工程实践。它不仅能提升代码质量,还能促进知识共享、团队协作和新成员入职。本文将系统介绍结对编程是什么、如何开展结对编程、常见模式、优势、挑战,…
📅 2026/6/26 5:37:02
HandheldCompanion:终极Windows掌机游戏体验优化方案 【免费下载链接】HandheldCompanion ControllerService 项目地址: https://gitcode.com/gh_mirrors/ha/HandheldCompanion
HandheldCompanion是一款专为Windows掌机设计的全能游戏伴侣工具,它…
📅 2026/6/26 5:37:02
基于 logprob,幻觉抑制 创新方案。 目录 基于 `logprob`,幻觉抑制 创新方案。 一、基础层:单值置信度(简单但有效) 1. 平均对数概率 / 困惑度(Perplexity) 2. 最小 token 概率(Min-Prob,强烈推荐) 二、 熵与分布(更懂「犹豫」):整个候选分布有多分散 3. 预测熵(…
📅 2026/6/26 5:37:02
一、什么是堆码测试堆码测试属于包装运输验证里的静态压力试验,模拟货物在仓库、车厢、集装箱多层堆叠受压的实际工况,检验外包装抗变形、抗塌陷能力,同时判断内衬与内部产品会不会被挤压损坏。试验样品分两种情况,测试侧重点完全…
📅 2026/6/26 5:32:02
如何在PC上免费畅玩Nintendo Switch游戏:Ryujinx模拟器终极指南 【免费下载链接】Ryujinx 用 C# 编写的实验性 Nintendo Switch 模拟器 项目地址: https://gitcode.com/GitHub_Trending/ry/Ryujinx
想要在电脑上体验Nintendo Switch的精彩游戏世界吗…
📅 2026/6/26 0:01:05
上一篇【第53篇】Netty在Dubbo中的应用——Dubbo网络通信层深度解析 下一篇【第55篇】Netty游戏服务器实战——10万在线游戏服务器架构 一、ES网络通信架构
ES集群各节点的通信:
---------- ---------- ----------
| Node-1 | | Node-2 | | No…
📅 2026/6/26 0:01:05
1. 项目概述:这不是一次普通模型更新,而是一次上下文能力的质变跃迁“Qwen2.5-Turbo上线阿里云百炼平台,模型上下文长度扩展至百万tokens”——这句话里藏着三个关键信号:Turbo不是简单提速,而是面向生产环境的工程化重…
📅 2026/6/26 0:01:05
1. 从手册到实战:SLIDER与SPINBOX控件的深度解析在嵌入式GUI开发里摸爬滚打十几年,我见过太多项目因为界面交互的“小问题”而卡壳。参数调节不跟手、数值输入效率低下,这些看似不起眼的细节,往往是决定产品用户体验成败的关键。e…
📅 2026/6/25 16:52:10
暗黑2重获新生:D2DX如何让经典游戏在现代Windows系统上流畅运行 【免费下载链接】d2dx D2DX is a complete solution to make Diablo II run well on modern PCs, with high fps and better resolutions. 项目地址: https://gitcode.com/gh_mirrors/d2/d2dx
…
📅 2026/6/25 16:52:10
CompressO终极指南:免费开源的视频图像压缩神器 【免费下载链接】compressO Convert any video/image into a tiny size. 100% free & open-source. Available for Mac, Windows & Linux. 项目地址: https://gitcode.com/gh_mirrors/co/compressO
你…
📅 2026/6/25 7:05:00