登录
注册
联系我们
首页
技术成果
行业资讯
政策要闻
平台动态
应咨在线
应咨映像
应咨资料馆
科创服务
科创企业上市服务
知识产权服务
司法鉴定服务
专家智库
数据搜索
服务咨询
基于强化学习和避让策略的应急车辆混合换道决策方法
联系我们
专利号:
CN112406867B
成果方:
清华大学
成果类型:
发明授权
发明人:
胡坚明; 牛浩懿; 裴欣; 张毅
授权日:
2021-12-28
价值预估:
请联系我们获取最新价值
本发明涉及一种基于强化学习和避让策略的应急车辆混合换道决策方法,包括:确定优化路段以及待规划ICCV和ICEV的执行策略;对待规划ICEV的DQN网络进行初始化;基于待规划ICEV及其六个邻居车辆的状态信息以及其前车的避让策略执行情况,得到DQN网络的状态空间;基于DQN网络的状态空间得到输出值,基于输出值得到初步决策以及动作空间;建立动作选择屏障,对得到的初步决策进行验证和选择,直到从输出值或动作空间中最终选出的动作满足交通规则和道路物理结构;定义奖励函数,用于对该动作所对应的总奖励进行计算;对DQN网络进行训练,得到训练好的DQN网络。本发明可以广泛应用于道路换道决策控制领域。
网站导航
首页
权益登记
技术信息登记
能力信息登记
成果信息登记
技术成果
找资金
股权融资
债权融资
行业资讯
政策要闻
媒体报道
平台动态
贷款问题咨询
应咨在线
应咨映像
应咨资料馆
科创服务
科创企业上市服务
知识产权服务
司法鉴定服务
专家智库
关于上技所
公司荣誉
数据大屏
数据搜索
服务咨询