Data-model back-end fusion method for automatic driving decision control function
附图说明 图1是本发明方法主要计算流程示意图; 图2是本发明方法中后端融合因子计算示意图; 图3是本发明方法与经典方法的实施效果对比图。 技术领域 本发明属于智能网联汽车领域,涉及一种自动驾驶决策控制方法,为提高自动驾驶汽车在不常见危险工况下的决策控制安全性和最优性,新创的一种车辆动力学模型和驾驶数据后端融合的决策控制方法。 具体实施方式 下面结合附图对本发明作进一步描述。 参照图1~图3,一种面向自动驾驶决策控制功能的数据-模型后端融合方法,包括以下步骤: 步骤一、驾驶数据采集与数据集构建 利用自动驾驶汽车车载传感器系统,采集典型驾驶工况下的车辆动力学数据和驾驶场景数据,包括各时刻(
步骤二、车辆动力学理论模型建立与验证 由于自动驾驶汽车决策控制主要关注道路平面内的运动,根据汽车动力学理论知识,建立车辆横纵向动力学离散解析模型,包括纵向、横向、横摆方向的微分动力学模型,例如
步骤三、将自动驾驶决策控制问题构建为集成式的动态优化问题,在每个时刻对决策控制问题进行求解 决策控制问题输入为步骤一所述的自动驾驶场景状态
步骤四、对上述动态优化问题进行模型预测滚动时域在线优化求解 在当前时刻,决策控制优化目标为未来有限预测时域内的性能加权指标之和
步骤五、对上述动态优化问题进行数据驱动强化学习离线优化求解 采用离线优化后在线应用的方式,先利用Actor-Critic强化学习方法(例如DDPG、TD3、SAC等,包含评价函数Critic和动作函数Actor的交替迭代求解),基于上述驾驶数据库中的马尔科夫决策数据进行采样和迭代求解,可以得到未来无穷预测时域内最优性能指标评价函数
步骤六、计算纯模型驱动求解的置信度 由于步骤四中基于模型求解的决策控制量
步骤七、计算纯数据驱动求解的置信度 由于步骤五中基于数据求解的决策控制量
步骤八、计算模型数据信息的后端融合因子和融合决策控制量。为充分发挥模型信息和数据信息的优势,将两者的最优决策控制量进行互补,计算模型数据融合因子
实施例:自动驾驶车辆在部分湿滑路面的曲线行驶控制方案。 目前城市道路的沥青或水泥路面经过一段时间使用后,经常会出现部分损坏、部分坑洼、部分异物堆积等情况,导致路面的部分区域在雨雪天气时比较湿滑。这些湿滑路面区域的轮胎附着系数和附着力将明星降低,而且湿滑区域的位置出现比较随机。因此,自动驾驶车辆在部分湿滑路面上行驶的控制难度较大,容易发生侧滑、侧翻、横向旋转等不稳定不安全状态,且现有方法尚未能很好解决这种情况下的安全行驶控制。 本发明提出的面向自动驾驶决策控制功能的数据-模型后端融合方法可以较好的同时利用车辆动力学信息和驾驶数据信息,是这类难度较大的自动驾驶控制任务的可选求解方法,将具有较好的决策控制性能。 本实施例所考虑的自动驾驶汽车在部分湿滑路面的曲线行驶控制场景如下:一辆前轮转向、后轮驱动、独立悬架的B级轿车,需要设计自动驾驶算法对其转向系统进行控制,在一条有高低起伏、弯道和湿滑区域的道路上安全行驶。 根据本发明内容实施步骤,取得的实施效果如图3所示,对比了纯模型驱动的决策控制、纯数据驱动的决策控制以及本发明中模型-数据融合的决策控制效果。可以看出,在本实施例的部分湿滑路面的曲线行驶工况中,本发明方法的车辆路径跟踪效果比其他两种方法更好,且避免了车辆动力学模型在路面湿滑条件下不准确导致的横摆角速度失误。 本说明书的实施例所述的内容仅仅是对发明构思的实现形式的列举,仅作说明用途。本发明的保护范围不应当被视为仅限于本实施例所陈述的具体形式,本发明的保护范围也及于本领域的普通技术人员根据本发明构思所能想到的等同技术手段。 背景技术 现有自动驾驶决策控制技术大多基于人类驾驶经验规则或车辆动力学理论模型进行算法设计,利用启发式规则或车辆运动特性信息求解决策和控制输出,所开发的决策控制算法对较常见的自动驾驶工况具有一定的适用性。目前常用的决策控制方法包括专家决策系统、PID控制、模糊规则控制、模型预测控制等。但在实际自动驾驶过程中,现有决策控制算法经常无法适应于道路行驶条件的不确定性和交通驾驶环境的不确定性,导致自动驾驶汽车的决策控制性能减弱甚至对道路交通安全造成严重威胁。 现有的自动驾驶决策控制技术主要存在以下缺点:第一、基于人类驾驶经验规则设计,导致决策控制层级繁杂,算法维护和更新成本高;第二,基于车辆动力学理论模型设计,决控算法性能对模型精度依赖性强,通常只适用于线性状态区域;第三,单纯使用驾驶经验或理论模型信息的决控算法对信息利用不充分,缺乏对道路行驶条件不确定性和交通驾驶环境不确定性的设计,在较少出现的场景下自动驾驶性能差。 发明内容 为了克服已有技术的不足,本发明提供了一种面向自动驾驶决策控制功能的数据-模型后端融合方法,能够结合现有技术方案的优势且方便实际工程应用,旨在保证常见工况下决控性能的同时,提高不常见危险工况下的安全性和决控最优性。。 本发明解决其技术问题所采用的技术方案是: 一种面向自动驾驶决策控制功能的数据-模型后端融合方法,包括以下步骤: 步骤一、驾驶数据采集与数据集构建 利用自动驾驶汽车车载传感器系统,采集典型驾驶工况下的车辆动力学数据和驾驶场景数据,包括各时刻(
步骤二、车辆动力学理论模型建立与验证 由于自动驾驶汽车决策控制主要关注道路平面内的运动,根据汽车动力学理论知识,建立车辆横纵向动力学离散解析模型,包括纵向、横向、横摆方向的微分动力学模型;
步骤三、将自动驾驶决策控制问题构建为集成式的动态优化问题,在每个时刻对决策控制问题进行求解 决策控制问题输入为步骤一所述的自动驾驶场景状态
步骤四、对上述动态优化问题进行模型预测滚动时域在线优化求解 在当前时刻,决策控制优化目标为未来有限预测时域内的性能加权指标之和
步骤五、对上述动态优化问题进行数据驱动强化学习离线优化求解 采用离线优化后在线应用的方式,先利用Actor-Critic强化学习方法,基于上述驾驶数据库中的马尔科夫决策数据进行采样和迭代求解,可以得到未来无穷预测时域内最优性能指标评价函数
步骤六、计算纯模型驱动求解的置信度 由于步骤四中基于模型求解的决策控制量
步骤七、计算纯数据驱动求解的置信度 由于步骤五中基于数据求解的决策控制量
步骤八、计算模型数据信息的后端融合因子和融合决策控制量 为充分发挥模型信息和数据信息的优势,将两者的最优决策控制量进行互补;计算模型数据融合因子
进一步,所述步骤一中,所述自车动力学状态
本发明的有益效果主要表现在: 1、在典型自动驾驶场景下,通过驾驶数据信息和动力学模型信息的融合,利用模型信息保证决策控制功能的基本性能和鲁棒性,并结合数据信息提高决策控制功能的最优性; 2、利用所采集驾驶数据的多样性,增加自动驾驶决策控制功能的场景覆盖范围,并利用数据的真实性,提高实际应用过程中的安全性; 3、利用驾驶数据信息的不断更新能力和所用强化学习方法的迭代学习能力,可以结合车云协同技术实现自动驾驶决策控制能力的学习进化。 The invention discloses a data-model back-end fusion method for an automatic driving decision control function. The method comprises the following steps: step 1, acquiring driving data and constructing a data set; 2, establishing and verifying a vehicle dynamics theoretical model; 3, constructing an automatic driving decision control problem into an integrated dynamic optimization problem, and solving the decision control problem at each moment; 4, performing model prediction rolling time domain online optimization solution on the dynamic optimization problem; step 5, performing data-driven reinforcement learning off-line optimization solution on the dynamic optimization problem; 6, calculating the confidence coefficient of pure model driven solution; 7, calculating the confidence coefficient of pure data driven solution; and 8, calculating a rear-end fusion factor and a fusion decision control quantity of model data information. According to the method, the safety and the decision control optimality under the uncommon dangerous working conditions are improved while the decision control performance under the common working conditions is ensured. 1.一种面向自动驾驶决策控制功能的数据-模型后端融合方法,其特征在于,所述方法包括以下步骤: 步骤一、驾驶数据采集与数据集构建 利用自动驾驶汽车车载传感器系统,采集典型驾驶工况下的车辆动力学数据和驾驶场景数据,包括各时刻( 步骤二、车辆动力学理论模型建立与验证 由于自动驾驶汽车决策控制主要关注道路平面内的运动,根据汽车动力学理论知识,建立车辆横纵向动力学离散解析模型,包括纵向、横向、横摆方向的微分动力学模型; 步骤三、将自动驾驶决策控制问题构建为集成式的动态优化问题,在每个时刻对决策控制问题进行求解 决策控制问题输入为步骤一所述的自动驾驶场景状态 步骤四、对上述动态优化问题进行模型预测滚动时域在线优化求解 在当前时刻,决策控制优化目标为未来有限预测时域内的性能加权指标之和 步骤五、对上述动态优化问题进行数据驱动强化学习离线优化求解 采用离线优化后在线应用的方式,先利用Actor-Critic强化学习方法,基于上述驾驶数据库中的马尔科夫决策数据进行采样和迭代求解,可以得到未来无穷预测时域内最优性能指标评价函数 步骤六、计算纯模型驱动求解的置信度 由于步骤四中基于模型求解的决策控制量 步骤七、计算纯数据驱动求解的置信度 由于步骤五中基于数据求解的决策控制量 步骤八、计算模型数据信息的后端融合因子和融合决策控制量 为充分发挥模型信息和数据信息的优势,将两者的最优决策控制量进行互补;计算模型数据融合因子 2.如权利要求1所述的面向自动驾驶决策控制功能的数据-模型后端融合方法,其特征在于,所述步骤一中,所述自车动力学状态