在自动驾驶领域,一项由北京理工大学计算机学院主导的研究正在引起广泛关注。这项研究不仅在资源利用上更加高效,还在性能提升方面取得了显著成果,堪称端到端自动驾驶领域的重大突破。在最新一期的CVPR 2024会议上,该团队的研究成果荣获最佳论文奖,其创新性的“蒸馏”技术——PlanKD,成功地将端到端自动驾驶系统的性能提升了近100%,且无需牺牲系统可靠性或增加额外成本。
解决行业痛点:资源限制下的性能优化
长期以来,基于Transformer架构的自动驾驶大模型因庞大的参数量和高计算需求,使得在资源受限的车载环境下部署成为一大挑战。要么增加成本以保障性能,要么削减模型规模牺牲性能,这是自动驾驶技术面临的两难选择。然而,北理工团队的PlanKD框架打破了这一僵局,它能够在保持模型体积小巧的同时,大幅提升端到端规划器的性能,实验证明,使用PlanKD后,相同参数量的规划器性能可提升50-100%。
实验验证:性能与安全的双重提升
研究团队在著名的自动驾驶仿真平台CARLA上进行了详尽的实验,该平台由英特尔和丰田联合开发,提供了丰富的仿真环境和气候条件,是业界公认的端到端自动驾驶测试金标准。他们选取了InterFuser模型作为基础,这是一个由商汤科技提出的多模态Transformer模型,在CARLA公开排行榜上曾位列第一。通过在8个不同模拟城镇中,采用21种天气条件进行训练和测试,结果表明,PlanKD加持下,InterFuser模型的驾驶分数平均提高了60-100%,路线完成度和违章分数也有显著改善,同时降低了碰撞率和违章率,推理时间大幅缩短,展现出优异的安全性和效率。
技术揭秘:PlanKD如何实现“蒸馏”效应
PlanKD的核心在于其独特的“蒸馏”机制,能够精准地将大模型的知识和能力转移到小型模型中,避免了传统知识蒸馏可能带来的无关信息干扰。通过设计基于信息瓶颈策略的规划相关信息蒸馏器,团队仅提取与规划任务紧密相关的特征,有效过滤掉冗余信息,确保小模型性能的纯净提升。此外,针对路径点的重要性和安全性,PlanKD采用了安全意识排名损失函数和熵损失,进一步优化了注意力权重分布,使模型在处理关键路径点时更加稳健可靠。
本文来源: 量子位【阅读原文】