本文来源:智能运载装备研究所
/ 导读 /
【摘要】: 在紧急情况下,尤其是针对弯道上的紧急避障场景,智能驾驶车辆可能运行在其操纵性能极限附近,此时必须保证能够更安全、更充分的利用车辆的操纵性能来避免碰撞的发生。与此同时,在上述情况下,为了确保车辆不会失去控制,车辆的稳定性也将变得至关重要。然而,此时为了保证车辆稳定性而进行的一些操纵行为将有可能与为了避免碰撞和路径跟踪等任务所需的相关操纵行为产生冲突,进而可能会导致智能车辆发生碰撞,即车辆的防侧翻、防侧滑、防碰撞可能会存在矛盾关系。
基于上述问题,Christian Gerdes在《Collision Avoidance and Stabilization for Autonomous Vehicles in Emergency Scenarios》中提出了一种新的 控制架构,其整合了路径跟踪、车辆的稳定性及避免碰撞的要求, 并且在上述三种要求产生冲突的情况下,通过优先保证满足避免碰撞要求的策略来对三者进行协调。甚至是若出于避免碰撞的需求,该控制架构可以暂时性的违背车辆稳定性要求以满足避免碰撞要求,即将车辆稳定性作为软约束使用。该种控制架构使用了模型预测控制(MPC)算法,其在模型中考虑了轮胎的非线性特性,使得所设计的控制器能够充分利用车辆的全部操纵性能来满足相关的控制要求。此外,在MPC算法中,还在预测域中选取了变化的时间步长,即考虑到稳定性及避免碰撞的不同控制要求来选取不同的时间步长,其中,稳定性控制是瞬时短时距行为,采用较短的预测步长;避障和路径跟踪是中时距行为,采用较长的预测步长。
简介
智能驾驶车辆的自主行驶控制通常分为轨迹规划及轨迹跟踪两个步骤。 轨迹规划算法通常假设车辆运行在操纵极限之下,该假设使得许多简单的轨迹跟踪算法得以应用。然而,在紧急情况下,上述简单的算法(本处的简单指的是其简单的假设车辆运行在操纵极限之下)的车辆动作将会受到车辆内置的稳定性系统的影响,如受到电子稳定性控制系统(ESC)的主动干预,其即使在即将发生碰撞的情况下,仍在确保车辆稳定性的相关要求而进行相应的动作。因此,仅管轨迹规划算法规划出一条能够避免碰撞的轨迹,仍然无法确定在紧急情况下,执行经过ESC系统所修正的控制动作后,轨迹跟踪算法能否完成对该避免碰撞的轨迹进行跟踪。
解决上述问题的一种方法是通过模型预测控制算法将稳定性问题引入到车辆的轨迹跟踪控制问题中。 MPC基于一种实时优化思想,能够通过连续地求解最优化问题来得到在约束范围内(如稳定性约束、安全性约束)能够最小化路径跟踪误差的控制变量。
通过上述的控制方法直接将稳定性问题考虑在内,而非依赖于ESC系统来保证车辆稳定性。然而, 该种方法仍然存在一些问题, 如稳定性约束可能会导致路径跟踪误差较大,进而导致车辆发生碰撞。稳定性控制行为的影响涉及轨迹规划及轨迹跟踪两个过程,为了更好的考虑车辆稳定性对上述两个过程的影响,可以将上述两个过程整合在一个控制问题中。因此,本文引入了整合轨迹规划及跟踪的方法,并且将车辆的稳定性极限扩展到车辆的非线性运行区域,使得车辆能够运行在其操纵极限附近,充分利用车辆的操纵性能;同时,在模型预测控制的预测域中选取变化的步长以便在单个优化问题中更好的整合车辆稳定性及避免碰撞的要求。 短的时间步长主要考虑车辆当前的稳定性及跟踪决策;长的时间步则主要考虑避免碰撞的要求。
问题概述
MPC将决策得到转向指令,该指令是通过在跟踪名义路径要求、确保车辆稳定性要求及避免碰撞的要求中权衡所得到。本文中采用模型预测控制算法来设计控制器,MPC问题的一般形式如下所示:
轨迹
轨迹的定义为:在缺少稳定性及环境约束的情况下,智能车辆所要行驶过的路径及相应的速度。
1.路径
路径不仅为智能车辆提供了一条能够运用于跟踪行驶的名义路线,同时,也为车辆模型及环境边界提供了参考。在本文中,路径将被道路曲率k参数化的表示为沿着道路的距离s的函数。给定初始(东/北)位置 及航向角 ,则路径上点的位置及切线的方向可以通过下述式子表示:
2.速度
速度曲线表示的含义为车辆在上述规划路径中每个点的期望纵向速度 。当跟踪在上文规划所得到的路径,而使得车辆运行在操纵极限附近时,在避免碰撞及稳定性要求之间权衡的情况就变得尤为明显。因此,速度曲线可以根据上述限制来计算得到。
操纵极限是从道路与车辆轮胎之间的摩擦系数μ推导而来,其对车辆的横向加速度ay及纵向加速度ax进行了限制,具体如下所示:
其中g为重力加速度。
横向加速度与道路曲率k相关,具体如下所示:
通过上述关系式对车辆纵向速度进行相应的限制,此时即可求解得到速度曲线。比如,假设道路曲率为:
则车辆的临界安全速度也可以表示为行驶里程s的函数:
根据性能约束(8)和(9)可得,速度曲线的系数满足关系式 :
3.Usage
本文中使用了一条单向道路,如Fig. 2(a)所示,其可通过曲率来进行参数化表示,如Fig. 2(b)所示。本文设定
在此设定的基础上求解车辆运行在操纵极限附近情况下的速度曲线,如Fig. 2(c)所示,该曲线中的最大速度值为18m/s。
车辆动力学模型
MPC最优化算法求解得到最优的前轮轮胎力作为式(1)中的输入变量u,其能够满足避免碰撞要求、稳定性要求及路径跟踪要求三者中期望的权衡目标。该最优化算法是基于五个状态的自行车模型的预测信息来进行迭代优化求解的,该模型在上述式(2)中给出。该五个状态的自行车模型的前两个车辆状态及关联的轮胎模型都与车辆稳定性相关,而最后三个路径状态则与路径跟踪及碰撞避免要求相关。
通过在预测的运行点上对控制方程进行线性化,将可以得到一个仿射的线性时变车辆模型,其适用于实时的应用。
1.车辆状态
平面自行车模型用于表示车辆动力学特性,应用小角度假设及每个轴上的两个轮胎均被合并为一个整体的近似方法得到该模型,该模型示意图如Fig. 3所示:
给定车辆纵向速度Ux,该模型的两个状态分别为横向速度Uy及横摆角速度r,系统方程如下所示:
其中,在一些情况下,车辆质心侧偏角
被用于替代横向速度Uy作为自行车模型的状态变量,因为其能够更为直观的表示车辆状态。具体如何选用恰当的变量作为状态可以根据下述结论作为依据:当纵向速度为常数时,选择侧偏角或者横向速度作为系统状态都是可以的;而当纵向速度变化时,则选择横向速度Uy作为状态量,可以避免引入非凸项
这也是很多车辆动力学模型中选取横向速度Uy作为状态变量的原因。
2.轮胎模型
在上式(10)中的轮胎力Fyf及Fyr将通过刷子轮胎模型得到,具体如下式:
其中,Ca、μ分别为轮胎转向刚度及摩擦系数,两者的值均通过实验获得;Fz为法向载荷;α为轮胎侧偏角; 为饱和侧偏角。轮胎侧偏角为轮胎朝向与前进方向的夹角,前、后轮侧偏角表达式如下所示:
其中,δ为前轮转向角。由式(11),饱和侧偏角表达式为:
由式(11)定义得到的横向轮胎力的值还取决于预设的纵向力Fx,纵向轮胎力对横向轮胎力的影响可以通过两种方法来考虑。
第一种方法为: 在模型中引入衰减系数η,其值随着纵向力的增加而减小,含义为:地面除开提供给轮胎纵向的力外还能为横向所提供的力,其能够描述随着纵向力Fx的增大而引起横向力的减小的现象。衰减系数的定义式如下:
第二种方法为: 根据静态纵向重量转移模型,纵向轮胎法向载荷Fz的表达式如下:
其中,L为车辆的长度;h为车辆重心的高度。上述等式中的第一项为静态重力分配;第二项为加速或制动所带来的影响。再结合(11)式即可得到横向力对纵向力的影响。
轮胎转向刚度及道路与轮胎间的摩擦系数将会通过实验测得,具体试验内容为:驾驶员以恒定速度驾驶车辆,同时缓慢地增加转向角度。具体试验结果如Fig. 4所示:
仿射的车辆模型包含了非线性的前轮及后轮模型(式(12)和(13))。采用后轮模型的目的是精确的描述车辆状态与后轮产生的轮胎力之间的非线性关系,对于稳定性分析,该非线性关系是至关重要的。通过结合正则化、线性化及信任域,将可以对车辆地稳定性进行分析。
结合连续线性化的正则化方法,提供了在预测域中每一时间步的预测状态(该预测状态是基于先前的得到的解,其并被用于上一步作为执行输入)。通过式(13)能够得到预测的侧偏角 ,其可作为名义点,用于对非线性轮胎模型(11)的线性化。然而,仅使用先前时刻的解来进行线性化可能会导致线性化后的解在执行步内振荡,具体原因是快变动力学导致先前时刻的解及线性化后得到的解会在非线性的解处发生振荡。为了解决上述振荡的问题,本文采用对先前的预测值 及最终解 求加权平均值的方法得出预测的侧偏角 的正则化形式,通过该种方法可以光顺在执行步内预测值振荡的现象,具体形式如下所示:
其中,当取 时,将可以非常显著的抑制振荡问题。
一旦通过上述方法得到预测的侧偏角 ,即可在该点处对非线性轮胎曲线进行线性化。在预测域的k时刻,该曲线的线性化可以选择在 或者 处进行。但是,选择上述两点中任意一点进行线性化,则会在另外一点处产生较大的误差。 因此,线性化可以在两点的均值处进行,这种线性化的方法总是过度估计期望的后轮轮胎力,因为轮胎模型(11)式的二阶导数为负值,图像为上凸的。具体如Fig. 5所示。另外一种线性化的方法则是在上述两点间进行线性插值,具体示意图见Fig. 5,该种方法为不足估计线性化,即在两个点上的值是非常准确的,但是在两点之间线性化后的值对比原非线性曲线上的值是偏小的,即是不足估计的。不足线性化也有其优点,即可以利用不足线性化在两点之间带来的估计不足特性,可以使得控制器更早的对潜在的危险及稳定性破坏的情况做出反应,增强系统总体的安全性。在线性化中误差是不可避免的,且当两点间的时间跨度越大,该误差也将越大。
如果侧偏角的预测值在控制执行步内未发生变化(如: ),则在k到k+1时间步内,所选择的线性化方法将会不足估计轮胎力;如果侧偏角的预测值在控制执行步内未发生变化(如: ),则在k到k+1时间步内,所选择的线性化方法将会过度估计轮胎力 。由于有上述问题存在,本处提出了信任域,其用于约束车辆的状态在一个允许的偏差内(与预测值之间偏差)来确保模型的精确度。信任域由 及 来定义,因此 控制执行值必须涵盖后轮轮胎力的整个范围,具体表达式如下所示:
当紧急情况发生时,控制器将会要求 执行值接近最终的值。当 ,将会限制后轮侧偏角最大变化量为 ,同时确保在 控制器执行步内,轮胎曲线的整个范围可以被完全地遍历。最终得到的后轮模型扩展了线性侧偏角边界(如Fig. 5所示,扩展的范围大约为3°)。
车辆模型中整合了前轮轮胎模型以保证利用全部的轮胎力,与基于车辆状态的后轮侧偏角不同,控制器直接通过转向输入来控制前轮侧偏,其能够让Fyf直接作为车辆模型的输入。使用前轮横向力作为输入,而非使用前轮转向角作为输入有其优势,即能够使得优化算法在决策输入量时直接考虑到前轮的极限能力。一旦通过计算得到期望的Fyf后,结合(11)及(12)式,其能够被转化得为应的转向角数值,具体表达式如下:
其中 表示轮胎曲线的逆模型。
3.路径状态
五个状态的自行车模型中最后三个状态变量表示了车辆与名义路径之间的关系,该三个状态分别为沿着路径的距离s,车辆航向与路径方向间的航向偏差 ,横向偏差e,具体的控制方程如下所示:
其中,采用了 及Uy的小值假设对de及ds进行近似表示。对于ds的控制方程中,选用了期望横向偏差 ,而非采用实际横向偏差e来表示,该种选择保留了方程的线性。期望的横向偏差从 推导而来,与用于后轮线性化所示意的侧偏角相似。横向偏差是模型中其它车辆状态的积分(和)形式,在控制输入执行时,其不会快速的变化,因此,在此不需要使用如式(17)的正则化方法来处理振荡的问题。
4.模型线性化
经过上述推导,所得到连续的车辆模型如下所示:
其中,
矩阵A,B及C依赖于运行点 ,该连续的模型可以在预测域内以选定的步长进行离散化,具体内容将在下文中给出。
稳定性及环境边界
车辆的稳定性及避免碰撞的目标都通过边界或者状态空间的区域来定义,即当车辆处于稳定状态及能够避免碰撞时,车辆模型的状态应当位于边界或者区域内。
1.稳定性边界
MPC使用的边界,是通过稳态下轮胎所能产生的最大轮胎力约束了车辆的横向速度Uy及横摆角速度r。由于车辆在行驶过程中后轮先发生侧滑,则通过后轮饱和的条件(式(13)和(14))推导得到横向速度Uy的限制,即当后轮侧偏角饱和时,得到Uy的阈值,具体如下所示:
与先前其他学者的一些研究工作相似,该边界是通过考虑了后轮侧偏角限制所得到。但在本文中,对其还有所发展,即扩展了线性区域,有利于对后轮轮胎力的全部利用。
基于式(10)推导得到的最大稳态条件,得到横摆角速度的边界,进一步对稳定时的车辆速度状态进行限定,具体如下所示:
上式是考虑了短板效应所得到的结果,即边界值选取前、后轮中最先饱和的一方的值,该式同时考虑了前、后轮的饱和情况。
式(24)、(25)定义了在稳定时车辆运动状态Uy及r所处的不变的稳定集合,如Fig. 6所示:
其中,超出上述边界不是必然导致车辆失稳,但对于超出边界的车辆状态,无法保证在下一时间步中的控制输入能够使得系统状态向边界靠近。
上述的稳定性边界是通过最大轮胎力推导得来,因此其准确程度受模型的不确定性程度的影响。
2.环境边界
避免碰撞的边界可以通过环境边界来得到。环境边界是横向偏差的集合,其边界为沿着路径距离s的横向偏差的最大值emax及最小值emin,当沿着路径距离s的车辆横向误差处于该范围内时,能够满足避免碰撞的要求,同时保持车辆在车道内行驶的状态,具体环境边界如下所示:
其中,函数 线性地近似表示处车辆的有效宽度与航向角偏差 之间的关系。如:当车身与道路方向平行时,即 ,车辆的有效宽度是车辆真实宽度的一半;当车身方向与道路方向垂直时,即 °,有效宽度至少为重心到前轴的长度a。
变时间步长的预测域
为了有效的在轨迹跟踪、稳定性及避免碰撞的要求中进行权衡,MPC控制器必须考虑到临界时域内的车辆动力学及较远时域内的避免碰撞情况,来最优化横向力输入。
然而,离散点的数量受到算力的限制而无法取得非常大,因此,通过选取不同步长的大小来离散车辆模型作为解决方案。采用短步长来离散车辆模型,对于建模车辆动力学有优势,即对路径跟踪及车辆稳定性的动力学建模更加的精确,但是步长太短不能有效的考虑未来环境的信息;采用长步长对模型进行离散化的优势:拓展了预测域,充分考虑到未来的障碍物信息及路径信息。
1.时间步长的选择
预测域由三种不同的步长组成,分别为:1.临近项,包含了10个短时间步 ;2.时变的修正时间步 ;3.较远项,包含20个长时间步 。
时域内的临近项提供了高保真的动力学建模,其对于路径跟踪和车辆稳定性研究是十分必要的。较远项则进一步扩展了预测范围,涵盖了3.8s的环境信息。修正时间步则位于前述临近项及较远项之间,即从 过渡到 ,其维持了长时间步的空间位置。具体例子如Fig. 7所示:
2.连续车辆模型的离散化
在时间步长较短时,零阶保持器的效果比较好,连续定常输入假设较为准确的反映了真实的输入情况。而因为在预测域内,较远的时间中采用零阶保持器会导致模型的准确性变差,而此时一阶保持器则能够对模型较好的近似,因此采用一阶保持器对其进行离散。
在前10个短步长内运用零阶保持器及在后20个长时间步内运用一阶保持器模型的情况下,结合使用矩阵指数方法对连续的车辆模型(式(23))进行离散化,所得到的离散化模型如下所示:
其中, 是沿着预测域时变线性的。
3.权重比例
除了上述提到的离散化中不同步长的选择外,最优化问题中的权重也应当根据步长的不同而按照一定的比例设置,以维持在滚动时域内的一致性。考虑到对一定的时间周期T内,车辆状态xc为常量,对于车辆状态的代价函数如下所示:
为了令上述的代价函数相等, 必须与 按一定关系设置,具体如下所示:
控制器架构
轨迹、稳定性边界及环境边界定义了控制器必须协同的一些控制目标。MPC控制器求解得到系统的横向输入,其满足了由简单的纵向控制器给出的纵向命令。总的控制结构如图Fig. 9所示:
1.纵向控制器
在预测域内,根据跟踪前述部分规划得到的速度曲线所需的输入,纵向控制器通过求解得到所需要的纵向力。该控制器假定车辆的纵向动力学能够用质点模型来描述。在MPC预测域内的每一个点k,前馈加反馈的控制律如下所示:
其中, 是由速度曲线得到在 的速度, 是为了跟踪速度曲线在 处的加速度所需要的加速度值,kp是速度跟踪增益, 抵消了耗散影响,如滚动阻力及空气阻力的影响。上式等号右侧的第一项则为前馈项,通过规划的速度曲线可以预先求解出为了跟踪期望加速度所需要的纵向力的值;第二项反馈项,即通过速度偏差所带来的反馈修正值。在通过式(30)得到 后,再通过查表的方法得到所需要的制动力大小及电机转矩。
2.横向控制器
基于仿射的车辆模型(式(27)),MPC求解得到前轮轮胎力。对于后轮侧偏角的信任域(式(18))可以被改写为如下形式:
车辆的稳定性约束(式(24)/(25))可以被改写为如下形式:
环境边界可以被改写为如下形式:
其中还整合考虑了避免碰撞的要求。
最终得到的优化问题的形式如下:
约束条件包括式(27)及下述内容:
其中, 分别为稳定性边界及环境边界中的松弛因子, ,而vmax是转向系统的物理结构所限制的最大允许的变化量。
及 分别为破坏避免碰撞约束及破坏稳定性约束的权重系数。在理想的情况下,即避免碰撞的约束及稳定性约束均满足时,在最优解中上述两个松弛变量均为零。然而,在并非理想的情况时,即约束必须被违背时,放松的约束能够确保问题有解。如本文前述部分所述,当稳定性要求与避免碰撞要求矛盾时,优先保证避免碰撞要求,即具体通过调节权重的相对大小来达到该目的,即
参考文献:《Collision Avoidance and Stabilization for Autonomous Vehicles in Emergency Scenarios》
- End -