近年来,无人机竞速作为一项极富挑战与观赏性的体育赛事,吸引了全球范围内众多顶尖飞手与科技团队的关注。无人机竞速赛中的飞手需要操控高速四旋翼无人机,凭借第一视角(FPV)视觉信息,在三维空间中穿越多个指定的门架,完成极具技术难度的高速飞行。随着人工智能技术的快速发展,研究者们尝试让自主飞行系统挑战甚至超越人类飞行员的水平。2023年,一项基于深度强化学习的无人机竞速系统Swift成功实现了这一目标,标志着无人机自主竞速领域迈入了一个全新的阶段。无人机竞速运动要求选手在极短的时间内完成反应、感知、决策和精确操控,飞行速度常超过百公里每小时,机动动作快速且复杂,飞行器所承受的加速和机动力达到数倍重力加速度。在这样的极限飞行环境下,自动驾驶无人机需要凭借自身搭载的视觉和惯性测量单元(IMU)传感器,估计自身速度与位姿,做出实时高效的控制决策。
Swift系统采用深度强化学习(Deep Reinforcement Learning, DRL)技术,通过在高保真仿真环境中的训练,结合从真实世界收集的传感器数据,解决了仿真与现实之间存在的感知与动力学差异,实现了从仿真到现实的高效迁移。该系统的感知模块融合了基于卷积神经网络的门架检测和视觉惯性里程计(VIO),通过卡尔曼滤波器实现对无人机状态的准确估计。控制策略部分,则由两层多层感知器(MLP)组成,输入为经过滤波后的低维状态估计,输出目标推力和机身角速度(Body Rates),这一控制模式与人类飞手的惯用控制信号保持一致。训练时,Swift使用基于近端策略优化(PPO)的模型无关强化学习方法,结合任务驱动的奖励函数设计,不仅鼓励无人机加速经过每一扇门,还纳入了感知目标,确保无人机摄像头持续锁定下一扇门,提高姿态估计的稳定性。该技术难点不仅在于极限动态控制,更在于如何处理由于噪声、传感器误差和环境复杂性造成的观测偏差。为此,团队通过有限的真实飞行数据,建立了感知与动力学的残差模型,包括使用高斯过程模拟视觉惯性里程计的状态估计偏差,以及基于k近邻回归的动力学残差修正。
这些残差模型注入仿真环境,使得训练过程更贴近现实,实现了策略的有效微调和真实环境中的稳健表现。Swift在由专业无人机飞手设计的一条长约75米、包含7个门架的赛道上进行了测试。被邀请与三位世界冠军飞手Alex Vanover、Thomas Bitmatta和Marvin Schaepper同场竞技,均取得多场胜利,并刷新了赛道最快圈速纪录。比赛采用三圈制,首个连续完成三圈并依序通过所有门架的选手获胜。Swift在高速起跑阶段展现出显著优势,反应时间较人类快120毫秒,更快地加速至首个门架。在复杂弯道如著名的“Split-S”动作中,Swift展示了更加紧凑且精妙的轨迹规划,表现出长期规划与价值函数优化带来的策略优势,而人类飞手则习惯于短期视角规划。
人机对决录像显示,尽管人类司机更早调整飞行器朝向以保持目标门架在视觉范围内,Swift则依靠多传感器融合以及视觉里程计等信息,进行动态控制,并在赛道全程维持更高平均速度、优化飞行线和动力分配。此外,Swift展现了超低的传感器与动作延迟,40毫秒的延迟明显低于人类飞手平均220毫秒的感知反应时间,这使其在快速决策和动作执行上具备天然优势。值得注意的是,Swift仅使用无人机上的传感器与计算资源,无需依赖外部定位系统(如动作捕捉),这一点保证了其比赛的公平性,也彰显了完全自主能力。技术团队采用高保真的动力学仿真结合基于物理和数据驱动的空气动力学建模,成功再现复杂飞行动力学。此外,模拟里还叠加了低级控制器行为模型、飞手优化的飞控PID算法以及电池与电调模型,保证了训练策略在现实中的有效迁移。相比传统基于规划的自主飞行方法,基于深度强化学习的Swift表现出更强的鲁棒性和适应性。
传统控制策略对状态估计准确性依赖极高,在实际感知噪声及动力学偏差条件下性能大幅下降。这一事实通过对比实验数据得以佐证,强化学习策略凭借经验来自适应界面不确定性,实现了真正的端到端自主竞速。人类飞手对于环境变化及飞行异常的处理能力依然卓越,例如在飞行中跌落或机体受损后依旧坚持完成比赛。然而,Swift尚未训练具备碰撞后恢复或应对光照条件剧变等鲁棒性。未来研究将聚焦拓展系统在不同环境下的泛化能力,提升系统对飞行事故的容忍与应急响应,从而参与更广泛的公开竞速赛事。此外,Swift系统借助深度强化学习成功实现在真实世界的高性能无人机控制,代表了机器人与人工智能领域的重要里程碑。
此技术潜力广泛,未来或可推广至无人驾驶汽车、机器人导航、飞行器自主控制等多个领域,不断推动带有感知、学习和决策闭环的智能系统应用发展。无人机竞速运动对智能体的实时感知、快速决策及高精度控制提出了极高要求,而深度强化学习则为解决这类复杂控制问题提供了强大能量。通过仿真训练和现实数据索引相结合,Swift突破了机械与感知误差限制,成功将先进AI引进物理竞技舞台,开启了跨领域多模态自主智能的新未来。随着计算能力的持续提升和算法的日益完善,人工智能飞行员有望持续刷新极限速度与控制水平,为竞速运动注入前所未有的科技活力,也将促进智慧交通、智能巡逻等实际应用的腾飞。无人机竞速的冠军AI不仅是技术的体现,更是创新自主智能系统成功演示的重要里程碑,是机器人竞赛与AI技术交汇处绚丽耀眼的新辉煌。