基于强化学习和避让策略的应急车辆混合换道决策方法

联系我们

专利号：CN112406867B

成果方：清华大学

成果类型：发明授权

发明人：胡坚明; 牛浩懿; 裴欣; 张毅

授权日：2021-12-28

价值预估：请联系我们获取最新价值

本发明涉及一种基于强化学习和避让策略的应急车辆混合换道决策方法，包括：确定优化路段以及待规划ICCV和ICEV的执行策略；对待规划ICEV的DQN网络进行初始化；基于待规划ICEV及其六个邻居车辆的状态信息以及其前车的避让策略执行情况，得到DQN网络的状态空间；基于DQN网络的状态空间得到输出值，基于输出值得到初步决策以及动作空间；建立动作选择屏障，对得到的初步决策进行验证和选择，直到从输出值或动作空间中最终选出的动作满足交通规则和道路物理结构；定义奖励函数，用于对该动作所对应的总奖励进行计算；对DQN网络进行训练，得到训练好的DQN网络。本发明可以广泛应用于道路换道决策控制领域。

网站导航