Riker子波匹配追踪算法及其改进
- 格式:pdf
- 大小:788.59 KB
- 文档页数:6
移动机器人是否具有自主感知[1]、能够进行自主导航[2]是当前人工智能领域研究的热点。
但现如今移动机器人的路径规划不仅要求利用算法找到一条从出发点到目标点的无碰撞路径,还要求机器人能够在复杂动态环境中完成自适应避障。
只使用全局路径规划算法显然不能适用于复杂环境下的机器人,需要局部路径规划算法与之配合。
但是当前几种常用的局部路径规划算法还存在一些缺陷:人工势场法[3]会使移动机器人陷入局部极小值和不可到达点。
动态窗口法[4]只适用于全向移动机器人和差速移动机器人,并不适用于所有类型的机器人。
随机搜索树算法[5]随机性较大,导致最终生成的搜索路径具有概率性。
EB(elastic band)算法[6]应用在动态环境中,该算法根据障碍物的位置和自身位姿信息使局部变形,使机器人同时受到相互制衡的拉力和排斥力,重新规划一条避开障碍物的路径。
后EB算法中加入了对机器人的非完整运动学约束[7],但始终没有引入时间信息。
基于以上的研究,近几年Röosmann等[8]新提出的TEB(time elastic band)算法是在EB算法的基础上,加入了时间信息的思想,还考虑到了机器人的动力学和非改进TEB算法的局部路径规划算法研究代婉玉,张丽娟,吴佳峰,马向华上海应用技术大学电气与电子工程学院,上海201418摘要:在复杂动态环境中用传统TEB(time elastic band)算法规划路径时,会出现速度控制量不平滑导致的路径震荡、给机器人带来较大冲击和易发生碰撞。
针对以上问题对传统TEB算法进行改进,对检测到的不规则障碍物膨胀化处理并进行区域分级策略,优先考虑安全区域的行驶路线,使机器人在复杂环境中更加安全平稳地运行。
在算法中加入障碍物距离对速度的约束,能有效降低机器人靠近障碍物后因速度跳变导致的路径行驶过程的震荡幅度和机器人受到的冲击,以保障机器人运行时的安全。
通过在ROS环境中的大量对比仿真,表明在复杂动态环境中改进后TEB算法规划的路径更安全平滑,能有效减少机器人受到的冲击。
随机森林算法的改进方法随机森林算法是一种常见的机器学习算法,广泛应用于分类、回归等领域。
它利用多棵决策树的集成效果,减小了单棵决策树过拟合的风险。
但是随机森林算法本身也有一些缺陷,例如对于高维度数据的处理效果不佳、需要进行特征选择等。
本文将介绍随机森林算法的一些改进方法,以及它们的优缺点。
1. 子空间随机森林(Subspace Random Forest)子空间随机森林是一种改进的随机森林算法,它在构造每棵树的时候只选取部分特征进行拟合。
这样可以解决高维度数据处理问题,也可以避免许多无用特征导致模型过拟合的问题。
子空间随机森林有两个主要的改进方法:(1)Feature baggingFeature bagging是一种选取特征的方法,它每次从全部特征中随机选取一部分特征进行构造决策树。
这样可以避免某些特征在决策树中的权重过大,从而提高预测精度。
(2)随机分割随机分割是指在每个内部节点上,从子空间中随机选取几个特征进行计算,选出最佳的分割特征。
这可以使得每棵树的结构更加随机,降低过拟合的风险。
2. 基于局部线性嵌入的随机森林(Random Forest with Local Linear Embedding)相比于传统的随机森林算法,基于局部线性嵌入的随机森林算法有一个显著优势:它利用了数据中的局部结构信息。
该算法先通过局部线性嵌入将数据映射到低维空间中,然后再利用随机森林算法进行拟合。
相比于在高维空间中进行拟合,这种方法可以提高模型的拟合能力。
但是它的缺陷是需要进行额外的维度约减操作,增加了模型的计算时间和计算复杂度。
3. 随机权重随机森林(Random Weight Random Forest)随机权重随机森林是一种改进的随机森林算法,它是在传统的随机森林算法的基础上添加了一个重要步骤:对每个特征进行随机加权。
它可以通过随机加权来解决某些特征过于突出的问题,从而提高模型的拟合能力。
以上是三种常见的随机森林算法的改进方法,它们的主要优点在于可以提高模型的拟合能力和鲁棒性。
2019年8月计算机工程与设计Aug.2019第40卷第8期COMPUTER ENGINEERING AND DESIGN Vol.40No.8改进的RRT路径规划算法刘恩海12,高文斌12,孔瑞平3,刘贝野12,董瑶12+,陈媛媛12(1.河北工业大学人工智能与数据科学学院,天津300401;2.河北工业大学河北省大数据计算重C实验室,天津300401;3.天津工业职业学院智能技术系,天津300400)摘要:对全局路径规划算法中的快速扩展随机树(RRT)算法进行深入的研究,针对基本RRT算法随机性强、搜索没有偏向性、得到的路径不一定为最优路径等缺点,提出一种改进的RRT优化算法,通过改进随机数生长方式的角度对原有算法思路进行改进,引导随机数向着目标点方向生长,与此同时移动机器人可以根据周围环境信息及时做出调整,使随机树向更高质量生长。
大量仿真结果表明,改进的RRT算法具有一定的可行性与有效性,能高效引导随机树朝目标点方向高质量地生长,规划的路径尽可能接近最优路径,有效缩短了路径规划时间。
关键词:路径规划;RRT算法;目标偏向;路径优化;人工势场算法中图法分类号:TP24文献标识号:A文章编号:1000-7024(2019)08-2253-06doi:10.16208/j.issnl000-7024.2019.08025Improved RRT path planning algorithmLIU En-hai12,GAO Wen-bin12,KONG Ruiping,LIU Bei-ye12,DONG Yao12+,CHEN Yuan-y uan1'2(1.School of Artificial Intelligence,Hebei University of Technology,Tianjin300401,China; 2.Hebei ProvincialKey Laboratory of Big Data Computing,Hebei University o f Technology,Tianjin300401,China;3.Department of Intelligemt Technology,Tiamm Polytechnic College,Tiamm300400,China)Abstract:This research based on rapidly-exploring random trees(RRT)algorithm in global path planning to improve shortcomings of@radi ional RRT&such as random-inclinding&lacks of preference in searching and local-or-global op imum problem.Owing @o@heseshor@comings&animprovedRRTalgorihm wasproposed&whichleadedrandomnumber@ogrowandge@closer@o@he @arge@by improving@he angle of@he grow@h mode of random number&and meanwhile@he robo@made adjus@men@s according@o environmen@&whichenabled@herandom@ree@ohavebe@erqualiies.Numeroussimulaionexperimen@alresulsshow@ha@@his improvedRRTalgorihmisfeasibleande f eciveandicanlead@herandom@ree@ogrowandge@closer@o@he@arge@e f ecively& isresulisclosed@oglobalopimum wi h less ime consumed.Keywords:pa@hplanning;RRTalgorihm;@arge@bias;pa@hopimizaion;arificialpo@enialfieldalgorihm0引言移动机器人路径规划是指机器人在有障碍物的工作环境中运动,对自身传感器得到的数据进行分析,根据一定的算法,并在一定约束条件下规划出一条从起点到目标点的路径,同时在运动的过程中不与障碍物发生碰撞移动机器人路径规划主要解决以下3个问题也:(1移动机器人从起点运动到目标点。
一种改进的粒子群遗传算法改进粒子群遗传算法简介改进粒子群遗传算法(Improved Particle Swarm Optimization,IPSO)是一种基于遗传算法理论的新型混合优化算法。
它结合了粒子群算法和最优化原理,有效地解决了复杂的非凸优化问题。
该算法通过将粒子群,pbest,gbest等元素进行综合,实现了全局优化效果。
算法原理IPSO算法结合了粒子群和遗传算法,充分发挥其高效率和平衡能力。
首先,将群体中的所有粒子看作是多个变量的n维向量,将所有粒子的维度构建成一颗搜索树。
随后,采用以下两种基本过程进行优化:(1)粒子群进化。
将群体中的每个粒子看作是遗传算法的一对父母,根据粒子内在的适应度函数迭代调整其位置;(2)最佳位置进化。
根据所有粒子的最佳适应度,采用染色体交叉、变异及筛选等操作,改变父母粒子最优位置的变量,以达到全局优化效果的目的。
算法的优势IPSO算法有效地结合了粒子群算法和遗传算法耦合优化处理和组合优化方法,在局部优化以及全局优化能力上都有很强大的收敛能力和搜索能力。
它不仅可以有效解决复杂的优化问题,而且可以实现更快的收敛速度以及更高的精度。
此外,该算法简单易行,实现成本低廉,能够较好地在复杂的环境中获得有效的搜索结果,具有比较强的优化能力和智能化能力。
应用领域IPSO算法可以广泛应用于智能控制、系统实时优化等领域,特别是能够实现多约束优化问题的求解,具有重要的应用价值。
例如,可以用它实现模糊逻辑控制,用它来解决下面的这类问题:最大化成功次数/最小化失败次数,最小化服务时间/最大化服务质量等。
此外,还可以用它来解决机器学习、网络带宽优化等问题。
结论改进粒子群遗传算法是一种非常有效且智能的优化算法,它可以实现自适应的优化函数的搜索、实现全局优化效果和提高计算效率。
它的优势在于充分发挥粒子群和遗传算法的优势,可以实现快速搜索和自适应解决复杂优化问题。
ORB算法——精选推荐
ORB算法,即Oriented FAST and Rotated BRIEF算法,是2024年发布,由Edward Rosten,Toby Sharp和Radu Timofte创制的一种关键点检测算法,是FAST算法和BRIEF算法的结合。
ORB算法是一种实现快速的关键点检测和描述子提取算法,它拥有多种优势,首先它采用FAST 算法来检测关键点,具有快速的实时性;其次它采用BRIEF描述子来描述关键点,可以降低特征点提取和描述所消耗的时间,改善算法的时效性;此外,ORB算法使用金字塔检测多尺度的关键点,因此能够对输入图像拥有更好的鲁棒性;最后ORB算法采用小波变换来增强图像的空域特征,提高它的匹配精度等。
ORB算法的优势可以用来提升特征点提取和匹配等的准确性,比如可以用来在图像中提取特征,在空间传感器中构建空间坐标,在机器视觉中进行目标识别,在激光雷达中进行路径估计等应用中,ORB算法可以提供精准的实时响应,可以极大程度地提升系统计算效率。
此外,ORB算法还在相关研究中取得了良好的应用效果,比如ORB-SLAM2算法,是一个开源的室内外实时地图构建的SLAM系统,完全基于深度上的视觉传感器,采用ORB-SLAM2算法可以实现室内外的地图构建,且地图构建的效果优于其他现有的算法。
自适应粒子群优化算法自适应粒子群优化算法(Adaptive Particle Swarm Optimization,简称APSO)是一种基于粒子群优化算法(Particle Swarm Optimization,简称PSO)的改进算法。
PSO算法是一种群体智能优化算法,模拟鸟群觅食行为来求解优化问题。
与传统PSO算法相比,APSO算法在粒子个体的位置和速度更新方面进行了优化,增强了算法的鲁棒性和全局能力。
APSO算法的关键改进之一是引入自适应策略来调整个体的速度和位置更新。
传统PSO算法中,个体的速度与当前速度和历史最优位置有关。
而在APSO算法中,个体的速度与自适应权重有关,该权重能够自动调整以适应不同的空间和优化问题。
自适应权重的调整基于个体的历史最优位置和整个粒子群的全局最优位置。
在每次迭代中,根据粒子群的全局情况来动态调整权重,使得速度的更新更加灵活和可靠。
另一个关键改进是引入自适应的惯性因子(inertia weight)来调整粒子的速度。
传统PSO算法中,惯性因子是一个常数,控制了速度的更新。
在APSO算法中,惯性因子根据粒子群的性能和进程进行自适应调整。
对于空间广阔、优化问题复杂的情况,惯性因子较大以促进全局;对于空间狭窄、优化问题简单的情况,惯性因子较小以促进局部。
通过调整惯性因子,粒子的速度和位置更新更具有灵活性和针对性,可以更好地适应不同的优化问题。
此外,APSO算法还引入了自适应的局域半径(search range)来控制粒子的范围。
传统PSO算法中,粒子的范围是固定的,很容易陷入局部最优解。
而在APSO算法中,根据全局最优位置和当前最优位置的距离进行自适应调整,当距离较大时,范围增加;当距离较小时,范围减小。
通过自适应调整范围,可以提高算法的全局能力,减少陷入局部最优解的风险。
综上所述,自适应粒子群优化算法(APSO)是一种改进的PSO算法,通过引入自适应策略来调整个体的速度和位置更新,增强了算法的鲁棒性和全局能力。
一种改进RRT算法在机器人轨迹规划中的应用ApplicationofanImprovedRRTAlgorithminRobotTrajectoryPlanning孙 超 张伟军(上海交通大学机械与动力工程学院,上海 200240)摘 要牶高压带电作业机器人是目前机器人研究领域中一个重要的研究方向,而机器人在线缆位置附近的轨迹规划是一项重要难题。
本文以快速搜索随机树(rapidly exploringrandomtree,RRT)及其相关改进算法作为带电作业机器人的路径规划方法。
首先通过分析RRT算法的实现过程,提出根据红黑树数据结构加速节点搜寻的优化方案,并通过仿真实验证明该方法的高效性。
然后针对RRT算法路径效果较差和RRT算法耗时较长的问题,提出获取有效路径后再进行路径优化的方案。
最后本文通过模拟机器人作业环境,进行六自由度机器人路径规划仿真,证明该两种方案的有效性和高效性,并最终应用于实际带电作业。
关键词牶快速搜索随机树(RRT) 路径规划 六自由度机器人DOI牶10.16413/j.cnki.issn.1007080x.2022.z2.006Abstract牶Highvoltageliveworkingrobotisanimportantresearchdirectioninthefieldofrobotresearch,andthetrajectoryplanningnearthecablepositionoftherobotisanimportantproblem.Inthispaper,rapidly exploringrandomtree(RRT)anditsrelatedimprovedalgorithmsareusedasthepathplanningmethodofliveworkingrobot.Firstly,byanalyzingtheimplementationprocessofRRTalgorithm,thispaperproposesanoptimizationschemetoacceleratenodesearchaccordingtotheredblacktreedatastructure,andtheefficiencyofthismethodisprovedbysimulationexperiments.Then,aimingattheproblemsofpoorpatheffectofRRTalgorithmandlongtime consumingRRT algorithm,thispaperproposesaschemeofpathoptimizationafterobtaininganeffectivepath.Finally,thesixdegreeoffreedomrobotpathplanningsimulationiscarriedoutbysimulatingtherobotworkingenvironment,whichprovestheeffectivenessandefficiencyofthetwoschemes,andfinallyappliedtotheactualliveworking.Keywords牶RRT(rapidly exploringrandomtree) pathplanning 6DOFrobot142022 45机电一体化 作者简介:孙 超 1996年生,硕士研究生。
基于RRT的运动规划算法综述1.介绍在过去的十多年中,机器人的运动规划问题已经收到了大量的关注,因为机器人开始成为现代工业和日常生活的重要组成部分。
最早的运动规划的问题只是考虑如何移动一架钢琴从一个房间到另一个房间而没有碰撞任何物体。
早期的算法则关注研究一个最完备的运动规划算法(完备性指如果存在这么一条规划的路径,那么算法一定能够在有限时间找到它),例如用一个多边形表示机器人,其他的多边形表示障碍物体,然后转化为一个代数问题去求解。
但是这些算法遇到了计算的复杂性问题,他们有一个指数时间的复杂度。
在1979年,Reif则证明了钢琴搬运工问题的运动规划是一个PSPACE-hard问题[1]。
所以这种完备的规划算法无法应用在实际中。
在实际应用中的运动规划算法有胞分法[2],势场法[3],路径图法[4]等。
这些算法在参数设置的比较好的时候,可以保证规划的完备性,在复杂环境中也可以保证花费的时间上限。
然而,这些算法在实际应用中有许多缺点。
例如在高维空间中这些算法就无法使用,像胞分法会使得计算量过大。
势场法会陷入局部极小值,导致规划失败[5],[6]。
基于采样的运动规划算法是最近十几年提出的一种算法,并且已经吸引了极大的关注。
概括的讲,基于采样的运动规划算法一般是连接一系列从无障碍的空间中随机采样的点,试图建立一条从初始状态到目标状态的路径。
与最完备的运动规划算法相反,基于采样的方法通过避免在状态空间中显式地构造障碍物来提供大量的计算节省。
即使这些算法没有实现完整性,但是它们是概率完备,这意味着规划算法不能返回解的概率随着样本的数量趋近无穷而衰减到零[7],并且这个下降速率是指数型的。
快速扩展随机树(Rapidly-exploring Random Trees,RRT)算法,是近十几年得到广泛发展与应用的基于采样的运动规划算法,它由美国爱荷华州立大学的Steven M. LaValle 教授在1998年提出,他一直从事RRT算法的改进和应用研究,他的相关工作奠定了RRT算法的基础。
基于机器人激光定位的一种改进amcl算法基于机器人激光定位的一种改进AMCL算法机器人导航系统中的位姿估计是实现自主移动最关键的部分之一。
AMCL算法是一种常见的基于粒子滤波(Particle Filter)的定位算法,它能够将激光雷达数据和机器人里程计信息结合起来进行位姿估计。
不过,AMCL算法存在一些问题,比如粒子数目影响定位精度、容易出现粒子崩溃等。
因此,在AMCL算法的基础上,对其进行改进,提高定位精度和鲁棒性,是非常有必要的。
本文介绍基于机器人激光定位的一种改进AMCL算法,具体思路如下:1. AMCL算法的流程AMCL算法是一种基于粒子滤波的定位算法,它使用激光雷达数据和机器人里程计信息来估计机器人在环境中的位置。
其算法流程如下:(1) 初始化一组粒子,其中每个粒子代表机器人的一个假设位姿。
(2) 根据地图和机器人传感器信息,计算每个粒子的权重,其中粒子越能解释当前激光雷达数据,权重越高。
(3) 根据粒子的权重,对粒子进行重采样,使得权重高的粒子数量增多,权重低的粒子数量减少。
(4) 利用重采样得到的粒子估计机器人的位姿。
(5) 根据机器人传感器信息和位姿估计,更新粒子的状态。
(6) 返回第2步,重复进行直到满足条件。
2. AMCL算法的问题使用AMCL算法进行机器人定位时,会存在以下问题:(1) 粒子数目。
粒子数目越多,定位精度越高,但是计算复杂度也会增加。
而粒子数目过少,定位精度就会下降。
(2) 粒子崩溃。
当机器人在环境中行进时,由于传感器的误差和障碍物的遮挡等原因,会出现部分粒子的权重越来越低,最终这些粒子的权重将会降为零,称为粒子崩溃现象。
这会导致定位精度下降,并且需要重新初始化粒子以进行定位。
(3) 地图匹配问题。
AMCL算法使用地图进行粒子的权重计算,而地图的准确性对定位精度有重要影响。
如果地图与环境不匹配,会导致定位精度下降。
3. 改进算法思路为了解决上述问题,我们提出了一种基于机器人激光定位的一种改进AMCL算法,改进思路如下:(1) 采用动态粒子数目。
基于改进YOLOX 的移动机器人目标跟随方法万 琴 1, 2李 智 1李伊康 1葛 柱 1王耀南 2, 3吴 迪1摘 要 针对移动机器人在复杂场景中难以稳定跟随目标的问题, 提出基于改进YOLOX 的移动机器人目标跟随方法, 主要包括目标检测、目标跟踪以及目标跟随三个部分. 首先, 以 YOLOX 网络为基础, 在其框架下将主干网络采用轻量化网络 MobileNetV2X, 提高复杂场景中目标检测的实时性. 然后, 通过改进的卡尔曼滤波器获取目标跟踪状态并采用数据关联进行目标匹配, 同时通过深度直方图判定目标发生遮挡后, 采用深度概率信息约束及最大后验概率(Maximum a posteri-ori, MAP)进行匹配跟踪, 确保机器人在遮挡情况下稳定跟踪目标. 再采用基于视觉伺服控制的目标跟随算法, 当跟踪目标丢失时, 引入重识别特征主动搜寻目标实现目标跟随. 最后, 在公开数据集上与具有代表性的目标跟随方法进行了定性和定量实验, 同时在真实场景中完成了移动机器人目标跟随实验, 实验结果均验证了所提方法具有较好的鲁棒性和实时性.关键词 移动机器人, YOLOX, 重识别, 目标跟随引用格式 万琴, 李智, 李伊康, 葛柱, 王耀南, 吴迪. 基于改进YOLOX 的移动机器人目标跟随方法. 自动化学报, 2023,49(7): 1558−1572DOI 10.16383/j.aas.c220344Target Following Method of Mobile Robot Based on Improved YOLOXWAN Qin 1, 2 LI Zhi 1 LI Yi-Kang 1 GE Zhu 1 WANG Yao-Nan 2, 3 WU Di 1Abstract A target following method of mobile robot based on improved YOLOX is proposed to solve the problem that mobile robots are difficult to follow the target stably in complex scene. This method mainly includes three parts: Target detection, target tracking and target following. Firstly, the lightweight MobileNetV2X network is ad-opted under the YOLOX framework to improve the real-time performance of target detection in complex scene.Then, the improved Kalman filter is proposed to obtain the tracking state and data association is used for target matching. When the target is judged by depth-histogram, the depth probability constraint and maximum a posteri-ori (MAP) probability are utilized for matching, which ensure that the robot tracks the target stably under occlu-sion. Moreover, target-following algorithm based on servo control is proposed, and re-id feature is introduced to act-ively search for disappeared targets. Finally, qualitative and quantitative experiments on public data set and in real-world environments demonstrate the efficiency of the proposed method.Key words Mobile robot, YOLOX, re-id, target followingCitation Wan Qin, Li Zhi, Li Yi-Kang, Ge Zhu, Wang Yao-Nan, Wu Di. Target following method of mobile robot based on improved YOLOX. Acta Automatica Sinica , 2023, 49(7): 1558−1572移动机器人在安防、物流和医疗等领域应用广泛[1−2], 其中机器人目标跟随算法引起了广泛关注,但移动机器人目标跟随算法的鲁棒性和实时性仍是亟待解决的关键问题[3−4].机器人目标跟随算法分为生成式模型方法和检测跟踪方法两大类[5−6]. 生成式模型主要通过构建目标模型实现跟随, 如Yoshimi 等[7]利用视觉传感器获取行人颜色和纹理特征, 机器人在视野范围内寻找与之相匹配的区域, 融合行人与位置速度信息构建模型, 采用基于生成式的目标跟踪算法跟随行人.然而, 此类算法关注目标本身, 忽略背景信息, 经常出现跟踪丢失的情况.为同时考虑目标与背景信息, 检测跟踪方法得收稿日期 2022-04-27 录用日期 2022-09-26Manuscript received April 27, 2022; accepted September 26,2022国家自然科学基金 (62006075), 湖南省自然科学杰出青年基金(2021JJ10002), 湖南省重点研发计划(2021GK2024), 湖南省教育厅重点项目(21A 0460), 湖南省自然科学基金面上项目(2020JJ4246, 2022JJ30198)资助Supported by National Natural Science Foundation of China (62006075), Foundation Project for Distinguished Young Schol-ars of Hunan Province (2021JJ10002), Key Research and Devel-opment Projects of Hunan Province (2021GK2024), Key Projects of Hunan Provincial Department of Education (21A0460), and General Project of Hunan Natural Science Foundation (2020JJ 4246, 2022JJ30198)本文责任编委 程龙Recommended by Associate Editor CHENG Long1. 湖南工程学院电气与信息工程学院 湘潭 4111042. 湖南大学机器人视觉感知与控制技术国家工程研究中心 长沙 4100823. 湖南大学电气与信息工程学院 长沙 4100821. College of Electrical and Information Engineering, Hunan Institute of Engineering, Xiangtan 4111042. National Engin-eering Research Center for Robot Visual Perception and Control Technology, Hunan University, Changsha 4100823. College ofElectrical and Information Engineering, Hunan University,Changsha 410082第 49 卷 第 7 期自 动 化 学 报Vol. 49, No. 72023 年 7 月ACTA AUTOMATICA SINICAJuly, 2023到了越来越多的关注, 此方法通过构建分类器区分目标及背景, 其跟踪效果普遍优于生成式模型方法.余铎等[3] 通过快速判别尺度空间切换相关滤波算法与卡尔曼滤波算法实现稳定跟踪. 另外, 移动机器人在跟随控制过程中常受到背景杂斑、光照变化、目标遮挡、尺度变化等干扰, 导致跟随目标丢失. 因此传统的检测跟踪方法不适用于移动机器人在复杂多变场景中的目标跟随[2].基于深度学习的移动机器人目标跟随算法具有鲁棒性强等优势[8]. Zhang等[9] 通过基于目标轮廓带采样策略来提高移动机器人跟踪性能, 但未对遮挡、行人消失等情况进行处理. Pang等[10] 提出一种基于深度学习的目标检测器, 引入卡尔曼滤波来预测目标位置, 加入重识别模块处理遮挡问题, 但此类算法需先获取精度较高的目标检测结果. 鉴于上述问题, JDE (Jointly learns the detector and em-bedding model)检测模型可用来融合重识别与检测分支[11], 提高目标检测精度. YOLO (You only look once) 系列算法则是一类基于JDE检测模型的一阶段框下的目标检测算法, 具有高效、灵活和泛化性能好的优点.YOLO算法包括了YOLOV1 ~ YOLOV7系列算法以及一系列基于改进YOLO的目标检测算法. Redmon等[12] 提出YOLO算法进行目标检测,直接采用回归的方法进行坐标框的检测以及分类,使用一个端到端的简单网络实现坐标回归与分类,能够极大地提升目标的检测速度. 此后, YOLO的网络结构不断优化, 已经成为目标检测领域主流的算法. Hsu等[13]引入比率感知机制, 动态调整YOLOV3的输入层长度和宽度超参数, 从而解决了长宽比差异较大的问题, 能够有效地提高平均跟踪精度. Huang等[14] 引入改进的YOLOV3模型, 此模型将预测尺度从3个增加到4个, 并使用额外的特征图来提取更多的细节. YOLOV3的目标位置识别精度较差, 在目标分布密集、尺寸差异较大的复杂场景中, 检测效果较差. YOLOV4[15] 开发了Darknet53目标检测模型, 此模型具有更高的网络输入分辨率,网络层参数多, 计算复杂度高, 对小目标检测效果较差. 对此, YOLO-Z[16] 提出了一系列不同尺度的模型, 提高YOLOV5检测小目标的性能. Cheng等[17]提出一种单阶段SSD (Single shot multibox de-tector) 微小目标检测方法, 此方法可提高微小目标检测的实时性, 但其使用的两阶段式目标检测器使目标定位精度有所下降. YOLOV6[18]设计了更高效的主干网络和网络层. YOLOV7[19]扩展了高效长程注意力网络, 加入了基于级联的模型缩放方法,均可一定程度提高检测精度和推理效率, 但由于未引入重识别分支, 无法提取浅层特征用于后续跟踪. YOLOX[20]在YOLO系列的基础上做出了一系列改进, 相比于YOLO系列目标检测算法, 其最大的不同是采用了无锚框检测器. 而YOLOV1 ~ YOLOV5采用有锚框的检测器, 由于可能会被多个锚框同时检测且与检测框中心存在误差, 并不适用于JDE 检测模型. 因此, 采用无锚框的YOLOX目标检测算法更加适合于JDE检测模型.移动机器人检测与跟踪跟随目标的核心问题是其在运动过程中, 复杂场景干扰影响其检测精度以及跟随性能. YOLOX以Darknet53网络结构为主干, 有较高的检测精度, 但模型较大、推理速度较慢, 不适用于移动机器人实时跟随. 在YOLOV5的网络模型中, 虽然网络的特征提取能力随着深度的增加而增强, 但下采样次数的增加会导致梯度的消失, 这极大影响了移动机器人的检测精度[21]. 为了提升移动机器人的检测精度, DeepSORT目标跟踪算法[22]采用卡尔曼滤波更新目标位置, 并与当前检测目标关联匹配, 但未解决因遮挡跟踪造成的目标丢失问题. Han等[23]提出PSR (Peak side-lobe rate)目标跟踪算法, 引入深度信息来评估跟踪可信度,并可主动检测跟踪丢失目标. 但其采用相关滤波法实现目标跟踪, 在复杂场景下的跟踪鲁棒性低. 可见, 改进网络结构的同时引入深度信息, 是提升移动机器人检测跟随性能的一种亟待探索的方法.综上所述, 基于YOLO系列的移动机器人目标跟随算法的鲁棒性强且精度高, 但对于变化环境迁移和泛化能力弱, 且运行速率低. 传统移动机器人目标跟随算法速度快, 但是当目标发生形变、尺度变化和严重遮挡等情况时, 跟踪过程容易出现目标跟踪丢失. 因此, 为实现复杂场景下移动机器人稳定跟随目标, 本文提出改进YOLOX的移动机器人目标跟随方法(Improved YOLOX target-follow-ing algorithm, IYTFA). 主要工作如下:1)为提高目标检测精度和速度, 提出基于YOLOX-MobileNetV2X网络 (YOLOX-M2X) 的目标检测算法, 使用交叉熵损失、回归损失以及重识别损失函数, 共同训练检测与重识别分支.2)为提高目标预测与更新速率, 采用改进的卡尔曼滤波器获取目标跟踪状态. 同时加入基于深度直方图的遮挡检测机制, 并通过深度概率约束帧间目标匹配, 提高遮挡跟踪准确率.3)在目标跟随过程中, 提出基于视觉伺服控制的主动搜寻策略, 并在目标消失时引入重识别特征进行跟踪跟随, 保证移动机器人稳定跟随目标.本文内容安排如下: 第1节介绍IYTFA算法,7 期万琴等: 基于改进YOLOX的移动机器人目标跟随方法1559包括目标检测部分、目标跟踪部分和目标跟随控制部分; 第2节为实验验证, 简要说明移动机器人和深度学习平台, 定性、定量分析目标跟踪算法, 并进行移动机器人目标跟随实验; 第3节对本文工作进行总结与展望.1 IYTFA 算法IYTFA 移动机器人目标跟随方法的结构框图如图1所示, 主要由目标检测、目标跟踪及目标跟随控制三部分组成. 首先, 将YOLOX 的主干网络Darknet53替换为MobileNetV2X, 通过获取的RGB 视频序列输入训练完成的MobileNetV2X 网络得到特征图, 再将重识别损失函数和检测损失函数分别训练重识别分支及检测分支, 从而得到目标检测结果. 然后采用改进的卡尔曼滤波器获取跟踪状态, 通过轨迹关联实现目标匹配, 同时引入遮挡判别机制, 如判断目标被遮挡则加入深度概率约束进行遮挡目标跟踪匹配. 最后采用基于视觉伺服控制的主动搜寻策略完成移动机器人目标跟随.1.1 改进YOLOX 的目标检测算法目标检测是移动机器人目标跟随的关键问题,目标检测精度很大程度上决定了移动机器人跟随的稳定性. 本文以YOLOX 体系架构为基础进行改进, 优化网络结构与损失函数, 提高检测实时性. 主干网络使用MobileNetV2X 网络, 再通过检测分支与重识别分支得到检测结果.1.1.1 YOLOX-MobileNetV2X 网络YOLOX 算法[20]将解耦头、数据增强、无锚框以及标签分类等算法与传统的YOLO 算法进行融合, 算法泛化能力强, 检测小目标精度高.YOLOX 算法网络主要分为三个部分, 分别为主干网络、网络层和预测层. 其主干网络采用Darknet53特征提取网络, 网络层采用特征金字塔网络, 预测层使用了3个解耦头. 输入图片在主干网络部分进行浅层特征提取, 输出3个特征层传入网络层进行深层特征提取, 输出分别传入3个解耦头进行目标检测. 但是YOLOX 主干网络通常使用Darknet53网络, 存在模型尺寸大、推理速度慢等问题. 因此为实现移动机器人实时目标检测, 本文提出YOLOX-M2X 网络, 将YOLOX 主干网络采用轻量级的特征提取网络MobileNetV2X, 该网络的卷积核心层是深度可分离卷积层, 可将输出的特征图的通道数缩减至一半, 并再与原卷积层提取的特征图合并,与仅使用一组深度可分离卷积的MobileNetV2[24]相比, 该网络可获得更多特征图的语义信息.330×103220×103250×103在YOLOX-M2X 网络上, 先采用COCO2017训练集训练得到网络参数, 再移植至移动机器人平台进行实时检测. COCO2017数据集是一个可用于图像检测的大规模数据集, 包含超过 幅图像(其中 幅是有标注的图像), 涵盖150万个目标及80个目标类别(行人、汽车、大象等)、91种材料类别(草、墙、天空等), 每幅图像包含5句语句描述, 且有 个带关键点标注的行人.RGB 视频序列深度视频序列跟踪结果检测结果重识别分支分支分支目标分支网络层重识别头解耦头相机ZED 相机坐标系图像坐标系跟随行人移动机器人坐标系世界坐标系 M前景机器人跟随运动学模型MobileNetV2X主干网络ZED 相机模型浅层特征深层特征特征图F R F R F F f (t )X X Y Y Z R = O −z XYOww q q O R =x y z P = ∑ w f (x x 重识别−低维向量改进卡尔曼滤波器图 1 本文方法结构框图Fig. 1 Structure block diagram of our method1560自 动 化 学 报49 卷H ×W H W F ∈R H ×W ×C H W C MobileNetV2X 网络将目标检测时的分类分为7个阶段, 输入图片分辨率为 ( 为图片高度, 为图片宽度). 假设输入特征图表示为 , 其中 为高度、 为宽度、 为通道数.每个阶段的核心层为瓶颈层, 每个阶段的瓶颈层中包括4个步骤.F 1×1∈R H ×W ×C ′步骤 1. 使用1×1卷积核扩展特征图为 , 大幅减少计算量.F 1×1∈R H ×W ×C ′F 3×3∈R H ′×W ′×C ′步骤 2. 特征图 进行逐点卷积,再采用3×3深度可分离卷积得到特征图 .F 3×3∈R H ′×W ′×C ′F (3×3)/2∈R H ′×W ′×(C ′/2)F ′(3×3)/2∈R H ′×W ′×(C ′/2)F ′(3×3)/2∈R H ′×W ′×(C ′/2)F ′′(3×3)/2∈RH ′′×W ′′×(C ′/2)F ′′(3×3)/2∈R H′′×W ′′×(C ′/2)F ′(3×3)/2∈R H′×W ′×(C ′/2)F ′3×3∈RH ′′′×W ′′′×C ′步骤 3. 为进一步获得更多的语义信息, 将特征图 一分为二, 首先通过普通卷积将特征映射减少到原始通道数的一半, 得到特征图和 ,再将特征图 进行深度可分离卷积得到 , 然后将 与 两者结合在一起得到新的特征图 .F ′3×3∈RH ′′′×W ′′′×C ′F ′∈R H ′′′×W ′′′×C ′′步骤 4. 将新特征图 使用卷积核为1×1的投影卷积层再次卷积, 得到特征图为 , 即得到每个瓶颈层的输出特征图.F 7∈R 15×15×320F 1∈R 240×240×15在MobileNetV2X 网络中的第7个阶段得到深层特征图 , 在第1个阶段得到浅层特征图 , 经网络层后得到检测分支和重识别分支的输入特征图.1.1.2 目标检测分支及损失函数F 7∈R 15×15×320F detction ∈R H d ×W d ×C d F obj ∈R H ′o ×W ′o ×1F reg ∈R H ′r ×W ′r ×4(x y w h )F cls ∈R H ′c ×W ′c ×1F detection ∈R H ′d ×W ′d ×6MobileNetV2X 网络输出的检测分支特征图, 经网络层后得到特征图 , 再经过解耦头后得到检测分支, 包括目标、分类和回归三个分支. 输入目标分支的特征图为 , 分支中每个特征点代表对应预测框内被检测目标属于前景的概率, 据此判断目标是前景还是背景. 为稳定训练过程并加快收敛速度、精确定位目标, 该分支估计每个像素相对于目标中心的连续漂移, 以减少下采样的影响; 输入回归分支的特征图为 , 该分支对目标框的中心坐标点及高度宽度 , , , 进行预测; 输入分类分支的特征图为 ,该分支得到对目标所属类别的预测评分, 如目标属于行人、车辆、动物等不同类别的评分, 其代表目标属于各个类别的概率值. 最后将三个分支的输出结果合并相加得到特征图 , 即为目标检测分支的信息.L obj L reg L cls L detection 为度量目标检测信息和真实目标信息之间的差值, 进一步定义损失函数, 损失函数值越小则差值越小, 训练模型准确度越高. 由于MobileNetV2X 网络中的目标检测分支包括目标分支、回归分支和分类分支, 其对应损失函数由目标损失函数 、回归损失函数 和分类损失函数 三部分组成,总的训练损失函数 表示为λ1λ2λ3L obj L cls L reg 其中, , 和 是损失平衡系数. 和 采用二值交叉熵损失函数(Binary cross entropy,BCE), 采用交并比 (Intersection over union,IoU) 损失函数.L obj 在目标检测中, 需首先判定预测的目标属于前景或者背景, 目标损失函数 采用Focal 交叉熵损失函数度量其与真实值的差值, 即N obj L obj y s s p s s 其中, 代表用于计算 损失函数的视频帧目标总个数; 表示测试样本 的标签, 前景标为1,背景标为0; 表示测试样本 预测为前景的概率.L reg IoU IoU IoU 回归损失函数使用 损失函数来度量预测检测框与真实目标框的交并比(面积重叠度). 指标范围为[0, 1], 当面积重叠率越大时, 指标数值越大, 即IoU 其中, 表示当前帧目标预测框和目标真实框的面积重叠率,即交并比.为评判当前视频帧目标所属的类别与真实值的差值, 分类损失函数采用多分类交叉熵损失函数对目标所属类别的预测进行评分, 即N cls L cls M y dc d c y dc p dc d c 其中, 代表用于计算 损失函数的视频帧目标总个数; 表示类别的数量; 为符号函数, 如果当前视频帧目标 的真实类别等于 , 为1,否则取0; 为当前帧目标 属于类别 的预测概率.1.1.3 重识别分支及损失函数为在目标消失再出现时完成视频连续帧间的目标匹配识别(即目标重识别), 在YOLOX-M2X 网络中加入重识别分支提取目标的颜色、纹理等浅层外观特征作为重识别特征.MobileNetV2X 网络输出的重识别分支特征图7 期万琴等: 基于改进YOLOX 的移动机器人目标跟随方法1561F 1∈R 240×240×16F re-id ∈R H ri ×W ri ×C riF ′re-id∈R H ′ri ×W ′ri ×C ri F ′′re-id∈R H ′′ri ×W ′′ri ×128x y C ={c (b ),b ∈[1,B ]} 经网络层得到 ,首先使用3×3卷积核依次与输入特征图卷积, 得到特征图 , 再通过128组1×1的卷积, 得到具有128个通道的特征图 , 则在特征图中提取对应的目标框中心点( , )处的浅层外观特征作为该目标重识别特征. 同时使用全连接层和归一化操作将其映射到特征分布向量 .L id 为评判重识别特征图准确度, 定义重识别损失函数, 其值越小, 表示重识别特征图越准确. 并将重识别损失函数 定义为L la (b )B N re-id 其中, 目标真实框的标签编码为 , 是训练数据中所有身份(ID)的编号, 使用特征图对应的目标中心点重识别特征在YOLOX-M2X 网络进行训练, 表示当前帧中目标所属类别的总数.L id L detection 最后, 将检测和重识别损失函数相加, 同时使用不确定性损失函数[11]来自动平衡检测和重识别损失函数. 与单独使用 和 训练模型相比, 训练效果得到提升, 同时减少了计算复杂度, 可达到实时性要求.1.2 基于改进卡尔曼滤波的目标跟踪首先使用第1帧检测的目标框初始化目标轨迹及跟踪状态, 然后通过改进的卡尔曼滤波器预测下一帧目标位置, 最后采用连续帧间的数据关联确定目标跟踪状态.t M i =1,···,M t N j =1,···,N t i x t,i j z t,j 在当前视频帧下, 设 时刻检测到 个目标,, 时刻跟踪 个目标, ,每一帧检测及跟踪结果实时更新, 则当前 时刻的第 个检测目标状态为 , 第 个跟踪目标状态为.x t,i =(β,˙β)T β={u,v,γ,h }β(u,v )γh (˙u,˙v )˙γ˙h本文使用改进的卡尔曼滤波器对行人轨迹的状态进行预测和更新, 设目标状态为 ,. 其中 表示目标的观测值, 表示边界框中心位置, 高宽比为 , 高度为 . 目标中心点变化速率为 , 高宽比变化速率为 , 高度变化速率为 . 考虑带非加性噪声的一般非线性系统模型w t −1v t w t −1v t 其中, 和 分别是过程噪声序列和量测噪声序列, 并假设 和 是均值为0的高斯白噪声, 其Q t R t w t −1Q t V t R t 方差分别为 和 , 即 ~(0, ), ~(0, ).为详细说明改进卡尔曼滤波器预测与更新的过程, 算法1给出此部分的伪代码. 算法1. 改进卡尔曼滤波算法x 0,i P Q t R t 输入. , , , .x t +1输出. .x 0,i P Q tR t t =0初始化. 和协方差矩阵 , 确定噪声协方差矩阵 和 , 并且设置时间 .[1,t +1]1) for .ψ=V √DV [V,D ]=eig (P )ψP 2) , 其中, , eig 表示矩阵特征值分解, 为正半定平方根矩阵, 为协方差矩阵.φP i ρi =|⟨φ,P i ⟩|/(|φ|×|P i |)3) 计算均值 和协方差矩阵 之间余弦相似度 .ξt,i =φ+√∑M i =1ρi /(λρi )ψt 4) 计算容积点 .ωt,i (ε)=λρi /(4∑Mi =1ρi )5) 计算权重 .ξt,i ωt,i 6) 生成容积点 和 .ˆx t +1,i P t +17) 通过以下公式估计一步状态预测 和 方差.ˆx t +1,i =M ∑i =1w t,i f (ξt ,i) P t +1=n ∑i =1w t,i f (ξt,i )f T (ξt,i )−ˆx t +1,i ˆx T t +1,i +Q t ξt +1,i ωt +1,i 8) 与步骤3)类似, 生成容积点 和 .ˆz t +1,j P z t +19) 估计输出预测 , 协方差 .ˆx t +1,i =ˆx t +1,i +K t +1(z t +1,j −ˆz t +1,j ) K t +1=P z t +1 P t +1=P t +1−K t +1P z t +1K T t +1 .10) end for .i z t,j F ′′t,re-id ∈R H ′′ri ×W ′′ri ×128F ′′t −1,re-id ∈R H ′ri ×W ′ri ×128q (i,j )F ′′t,re-id∈R H ′′ri ×W ′′ri ×128F ′′t −1,re-id ∈R H ′ri ×W ′ri ×128采用改进卡尔曼滤波器获取上一帧目标 的中心点在当前帧的预测位置 , 同时通过重识别特征图 中对应该预测中心位置, 得到上一帧目标在当前帧的预测外观特征. 移动机器人在跟随过程中, 会出现遮挡、快速移动等情况, 余弦距离具有快速度量的优点. 采用余弦距离 [19]判别当前帧中心点对应的外观特征向量 与上一帧在当前帧的预测外观特征向量 是否关联.b i,j λb i,j λi j b i,j λ其中, 为正确关联轨迹集合. 在训练数据集上训练网络参数得到余弦距离, 并与训练集基准之间的余弦距离进行比较, 得到阈值 . 式(7)中, 当 小于阈值 , 表示当前帧检测目标 与上一帧跟踪目标 关联, 则跟踪正常; 当 大于阈值 , 表示未成功关联, 则继续判断目标是否遮挡或消失.1562自 动 化 学 报49 卷1.3 基于深度概率约束的遮挡目标跟踪跟踪目标由于被遮挡, 目标外观会发生显著变化, 导致目标特征减少, 移动机器人跟踪目标丢失.本文提出一种有效的遮挡处理机制, 当判断遮挡发生时, 采用深度概率对目标周围区域进行空间约束,并通过最大后验概率(Maximum a posteriori,MAP)关联匹配实现遮挡跟踪.1)遮挡判断由于多个目标相互遮挡时, RGB 外观被遮挡,只可从深度信息区分不同遮挡目标, 而ZED 相机获取的深度信息为多个遮挡目标中离该相机最近的目标深度信息. 因此将目标框在RGB 图中的位置区域映射到深度图中并设定为深度遮挡区域, 若判定其他目标进入此区域表示发生遮挡, 具体判定如图2所示.(a) 遮挡前(a) Before occlusion(b) 遮挡后(b) After occlusionRGB 图深度图深度直方图深度遮挡区域目标1目标2RGB 图深度图深度直方图图 2 遮挡前后深度直方图Fig. 2 Depth histogram before and after occlusion目标1遮挡前深度直方图最大峰值为4 000, 目标2遮挡前深度直方图的最大峰值为2 500, 发生遮挡后深度遮挡区域深度直方图最大峰值为2 500, 深度直方图的峰值从4 000下降到2 500. 显然, 此时目标1的深度遮挡区域的深度直方图出现新的上升峰值2 500, 且小于遮挡前的峰值4 000, 则可见目标被遮挡后的深度直方图峰值明显减少.j t −1t (d j t −d j t −1)N (w t ,ξ2t )因此, 可根据深度变化大小判定是否发生遮挡.设跟踪目标 在 帧和 帧之间的深度变化均值可以近似为高斯分布 ~ , 在此基础上判定是否发生遮挡.,d j t t j M j |(d jt −d j t −1)|t −1t |(ωt −ξt )/(ωt −1−ξt −1)|t t −1∑w t −ξt j|(d jt −d jt −1)|w t −ξt 式中 是第 帧中跟踪目标 的深度值; 表示第 与第 帧之间所有目标深度差之和; 表示第 帧与第 帧之间深度值变化率, 其值足够大表示发生遮挡. 代表小于 的所有跟踪目标深度值差之和. 其遮挡判断准则为d j t D jt T j T j 当目标未被遮挡时, 接近 , 接近于1; 当目标被遮挡时, 则 接近于0.2)遮挡匹配跟踪S 当目标发生遮挡时, 通过最大后验概率关联当前帧检测目标与上一帧跟踪目标, 可有效解决遮挡跟踪问题. 假设所有运动目标之间相互独立, 设单个目标轨迹组成为 , 似然概率具有条件独立性,则关联遮挡目标的目标函数为P (z t −1,j )P (x t,i |z t −1,j )式中, 是所有跟踪目标的先验概率; 表示当前检测目标属于跟踪目标的条件概率, 该条件概率通过检测目标与上一帧跟踪目标框的重叠率计算得到.x t,i b (x t,i )z t −1,j b (z t −1,j )b (x t,i )b (z t −1,j )设当前帧检测目标 的深度图对应的边界框为 , 跟踪目标 的深度图对应的边界框为 , 通过判断 与 的重叠率来表示跟踪置信度, 式(11)用于求目标框的重叠率, 即σC σx t,j z t −1,j 式中, 为重叠区域, 若 大于 , 表示 与 关联匹配.1.4 基于视觉伺服控制的目标跟随在获取目标跟踪结果后, 选定感兴趣的一个目标作为移动机器人的跟随目标. 为使移动机器人实7 期万琴等: 基于改进YOLOX 的移动机器人目标跟随方法1563现目标跟随, 本文采用基于视觉伺服控制的目标跟随算法, 使跟随目标框的中心点保持为视野范围中心点. 如目标消失, 则移动机器人按照目标运动轨迹进行主动搜索, 重新识别目标并使移动机器人继续跟随目标.1.4.1 基于ZED 相机的移动机器人运动学模型由于ZED 相机具有成像分辨率高、可获取远距离深度图像等优点, 本文采用ZED 相机作为移动机器人视觉传感器, 其内参已标定.Y P =(x cn ,y cn ,z cn )z n 假设ZED 相机的镜头畸变小到可以忽略, 相机固有参数用针孔模型表示, ZED 相机成像原理图如图3所示. 在图像坐标系 的跟踪目标坐标为, 是从图像坐标和ZED 相机的固有参数中获得f b f b d x l x r 其中, 为相机焦距, 为左右相机基线, 和 是通过先验信息或相机标定得到. 其中由极线约束关系, 视差 可由左相机中的像素点 与右相机中的像素点 对应关系计算得到.YXX rX lX − bZf像平面相机基线左相机右相机P = (x cn , y cn , z cn )图 3 ZED 相机成像图Fig. 3 ZED camera imageryG P R Z Y C (x,y )D θ本文算法将移动机器人平台简化为基于ZED相机的两轮差速模型, 如图4所示. 图4中包括世界坐标系 、机器人坐标系 、ZED 相机坐标系 和图像坐标系 . 图中, 为移动机器人运动中心点, 为两轮之间的距离, 为方向角.G O T O M R rw =O T −O M Z TM O T O M 在世界坐标系 中, 跟踪目标位置 与机器人位置 之间的距离可表示为 .在ZED 相机坐标系中, 目标到机器人的距离 是由跟踪目标位置 和机器人位置 通过式(13) 得到R (θQ ,θC )Q Z δd M 其中, 表示从世界坐标系 到ZED 相机坐标系 旋转矩阵. 表示在世界坐标系 中,移动机器人与摄像机的距离.1.4.2 机器人主动控制策略前述跟踪算法完成目标跟踪, 并获取目标跟踪框的深度信息, 但直接使用目标跟踪框的深度信息来计算机器人与跟随目标的距离, 会引入大量的背景信息. 因此需要对目标中心进行重定位, 为跟踪区域找到合适的位置, 提高机器人跟随精度.(x l ,y l )∈ˆβˆβˆβˆkr ˆβ⊙∗目标跟踪框中心设为 , 表示目标跟踪框区域内所有像素坐标. 区域的精确位置在 内重定位, 利用循环矩阵 与 进行同或 运算得ˆy ∗ˆy ∗j (∆x,∆y )(x ∗,y ∗)(x l ,y l )(x ∗,y ∗)在 中最大值的位置 即为精确目标跟踪中心 与 之间的位置偏差. 跟踪区域的精确位置 计算为(x ∗,y ∗)(x ∗,y ∗)f (t )f ∗(t )得到精确位置 后, 获取以 为中心区域框的4个顶点坐标, 计算中心点和顶点对应深度信息平均值 , 其值表示为移动机器人与目标的距离. 设移动机器人期望到达位置为 , 误 X control =[U (t )=v t ,W (t )=w t ]v t w t 机器人控制变量为 , 代表移动机器人的线速度,代表移动机器人的角速度, PID 控制器设计为k P k I k D λ其中, , 和 为PID 系数, 是调整因子.G目标位置w M T = x cny cnz cn图 4 基于ZED 相机的两轮差速驱动模型Fig. 4 Two-wheel differential drive model based on ZED1564自 动 化 学 报49 卷。
粒子群算法的各种变体算法
粒子群算法(PSO)是一种启发式优化算法,最初由Kennedy和Eberhart在1995年提出。
它模拟了鸟群或鱼群中个体之间的协作
和竞争关系,在解决优化问题时具有较好的收敛性和全局寻优能力。
随着研究的深入,人们提出了许多粒子群算法的变体,以应对不同
类型的优化问题和改善算法性能。
以下是一些常见的粒子群算法的
变体:
1. 改进的粒子群算法(IPSO),IPSO通过改变粒子的速度更
新公式、邻域拓扑结构或者引入新的搜索策略来增强PSO的全局搜
索能力和局部搜索能力。
2. 多种群粒子群算法(MPSO),MPSO将种群划分为多个子种群,每个子种群独立进行搜索,并通过信息共享来提高全局搜索能力。
3. 自适应粒子群算法(APSO),APSO通过自适应地调整算法
参数或者搜索策略来适应不同的优化问题,提高算法的鲁棒性和适
用性。
4. 混沌粒子群算法(CPSO),CPSO引入了混沌序列来增加算
法的随机性,提高搜索的多样性和全局寻优能力。
5. 多目标粒子群算法(MOPSO),MOPSO针对多目标优化问题
进行了改进,通过引入帕累托最优解集和多目标优化策略来寻找最
优的解集。
6. 基于改进策略的粒子群算法(SPSO),SPSO通过引入新的
搜索策略,如局部搜索、动态权重、自适应参数等,来提高算法的
收敛速度和全局搜索能力。
这些粒子群算法的变体在不同的优化问题中都有其独特的优势,研究人员可以根据具体的问题特点选择合适的算法来进行求解。
同时,随着对粒子群算法的研究不断深入,相信会有更多新的变体算
法被提出来,以满足不断变化的优化问题需求。
第6卷第6期2009年12月 CHINESEJOURNALOFENGINEERINGGEOPHYSICSVol16,No16Dec1,2009
文章编号:1672)7940(2009)06)0740)06doi:1013969/j1issn11672-7940120091061015
Riker子波匹配追踪算法及其改进屈念念,刘江平,李家斌(中国地质大学地球物理与空间信息学院,武汉430074)
作者简介:屈念念(1986-),女,硕士研究生,主要从事地震数据处理方法研究。E-mail:q120080265@yahoo.cn刘江平(1957-),男,教授,博士生导师,主要从事地震勘探的科研与教学工作。E-mail:liujp@cug.edu.cn
摘 要:匹配追踪(MatchingPursuit)算法的基本思想是基于信号的可分解和重构,是在一个确定的函数集
合中自适应地选择一些函数来表示一个信号的计算过程,函数集合中的每个函数都称为原子。本文利用奇异值分解对传统的匹配追踪算法进行了改进,提高收敛速度、计算速度以及重构精度,并将得到的时频分布与其他方法进行对比,测验结果证明了改进算法的高效性和有效性。关键词:匹配追踪算法;最小二乘;奇异值分解;时频分布
中图分类号:P631文献标识码:A收稿日期:2009-11-11
RevisedMatchingPursuitAlgorithmUsingRickerWavelets
QuNiannian,LiuJiangping,LiJiabin(InstituteofGeophysicsandGeomatics,ChinaUniversityofGeosciences,Wuhan430074,China)
Abstract:ThebasicideaofMatchingPursuitalgorithmisbasedonthepossibilityofdecom-positionandreconstructionofseismicdata.Itisaprocessinwhichaseriesoffunctionscanbechosenfromacertainfunctionsettorepresentagivensignal,andtheeachandeveryfunctionwithinthefunctionsetiscalledasanatom.Thispaperusessingularvaluedecom-positionmethodtorevisematchingpursuitalgorithm,andimprovesthespeedofconver-genceandcomputation,andthencomparesthetime-frequencydistributionoftherevisedmatchingpursuitwithothermethods.Theresultprovestheeffectivenessoftherevisedmatchingpursuitalgorithm.Keywords:matchingpursuitalgorithm;least-square;singularvaluedecomposition;time-frequencydistribution
匹配追踪(MatchingPursuit)算法是在一个确定的函数集合中自适应地选择一些函数来表示一个信号的计算过程,函数集合中的每个函数都称为原子。其核心思想是将信号表示为一系列与信号局部结构特征最佳匹配的时频原子的线性组合,然后求各时频原子的时频分布并将其叠加,得到信号的时频分布。MP算法虽然计算复杂度较高,但有很多优良的性质,如对信号自适应的灵活表达,这是传统的傅立叶变化或小波变换[1~4]所无法比拟的,另外还具有较高的时间)频率分辨率,暂态结构的局部自适应性,信号结构的参数表示更加灵活等优点。MP算法一经提出,便很快被应用于地球物理的地震信号处理领域。在1996年应用MP分解算法对压缩的地震信号进行Kirchhoff偏移计算;在2003年独立多分辨率分析和MP算法对计算量和数据进行统计与分析;在2004年以Ricker子波为原子对地震信号进行时频分解;在2005年采用Morlet小波为原子对地震信号进行MP分解等。MP算法是一种重复迭代逼近的贪婪算法,因此其核心问题就是如何建立有效的原子库,并快速地检索出匹配的原子,提高检索效率,加快计算速度。DurkaPJ和QianS提出了在原子生成的层面,通过借助于前一次原子的生成结果来便捷地进行当前原子的计算生成,而原子字典的索引方式则是先依照离散化尺度参数,再根据尺度参数来确定其他原子参数的计算方式。尹忠科等将最相关原子的匹配与遗传算法的整体寻优过程联系起来以实现快速定位最佳匹配原子的目的,从而提高匹配逼近过程的计算效率。WangYH从瞬时频率和瞬时相位的角度出发,通过计算原始信号的瞬时频率和瞬时相位[5~9]来粗略地确定时频原子的频率参数和相位参数,然后在相对集中的字典子集中进行最佳原子的匹配搜索,同样也提高了计算速度。本文在上述学者研究工作的基础上对匹配追踪算法进行了改进,提高收敛的速度和计算速度,并将得到的时频分布与其他方法进行对比,测验结果证明了改进算法的高效性和有效性。
1 匹配追踪基本原理MP算法的核心思想就在一个确定的函数集合中挑选最能体现信号特征的一系列函数,其中每个函数称为原子[10],MP算法原子库的类别有许多种,如:Gabor原子,ChirpLet原子,FMmlet原子,Ricker子波原子,阻尼正弦函数原子等。假设D为进行信号分解的函数集合,原始信号为u,长度为N。MP算法是通过把函数u垂直投影到函数集合D的元素上来进行重复的迭代估算,在进行一次迭代后,函数u可以表示为:u=3u,gC4gC
+Ru(1)
其中gCID,Ru是把u函数在函数集合D上进行垂直投影后的残余矢量,为了使残余矢量尽可能的小,就必须使内积计算项|&尽可能大。很显然,gC与Ru是正交的,因此:+u+2=3u,gC42++Ru+2(2)假设R0u=u,且进行了n轮的迭代(n\0)得到残余矢量Rnu,此时在函数集合D选择一个原子,使其匹配逼近这个残余矢量Rnu,因此:Rnu=3Rnu,grn4grn+Rn+1u(3)其中Rn+1u就是进行了n+1次迭代得到的残余矢量,gCn是第n次迭代时选择的原子。MP算法就是这样的一个重复迭代的过程,如果重复这样的迭代过程m次,即可将u表示为如下的形式:u=Emn=13Rn-1u,grn4grn+Rnu(4)因此经过m次迭代分解计算后,原始信号u可用m个原子的合成来近似表示,其误差为第m次迭代计算后的残余矢量。匹配追踪算法的每次迭代时都按照一定的索引扫描整个函数集合,搜索出与当前信号最大相关的原子参数,然后剔除最相关原子的能量形成残余信号,残余信号再进入下一轮迭代计算,直到迭代循环终结或残值信号满足设定的阀值。2 Ricker子波匹配追踪算法原理 Ricker子波的时间域表示为:XR(t,fj)=(1-2P2f2jt2)exp(-P2f2jt2)(5)利用Ricker子波原子进行匹配追踪分解时,每次迭代都剔除与地震道中最大相关的Ricker子波[12~16]。迭代过程一直持续到剩余的地震道幅度小于给定的阈值为止。此过程便把地震道分解为Ricker子波原子的线性组合,其结果是对应原始地震道信号的一系列具有不同到达时刻和振幅的Ricker子波。每一道有限带宽的地震信号u(t)都可以表示为Ricker子波的线性组合:u(t)=Ejaj*w(t-tj,fj,Hj)+Noise(6)其中Aj,tj,fj,Hj为分解出的第j次Ricker子波w的振幅,中心时间,波峰频率和相位。tj是通过u(t)的瞬时包络局部极大值来估计的,即通过对信号做Hilbert变换求信号的瞬时包络,其中tj可粗略估计为包络峰值处对应的时间t,瞬时频率favg则为tj处的频率,可由Hilbert变换求出,则对于Ricker子波的主频为:
741 第6期 屈念念等:Riker子波匹配追踪算法及其改进fj=P2*favg(7)为了有效的求得第j次Ricker子波的振幅Aj和相位Hj,对信号u(t)和Ricker子波w做Hilbert变换可得复地震道U(t)和复子波W(t,fj):U(t)=u(t)+iuH(t)(8)W(t)=w(t)+iwH(t)(9)则(6)式可表示为:
U(t)=EjAj*W(t-tj,fj)+Noise,
(10)其中Aj=ajeiUj,(6)式中的幅度Aj表示为的Aj
模,相位Hj表示为的Aj相位。
为了使信号u(t)与匹配的Ricker子波集之间的相对误差:
R(t)=3U(t)-EJ1[Aj*W(t-tj,fj)]42(11)为最小,利用最小二乘法来求的Aj,则A=[WTW+EI]-1WTU(12)因为在实际资料中地震信号初始相位均归零,所以在分解的过程中可以不用求取相位这个参数,默认相位Hj为零。因此在利用匹配追踪法分解时求取振幅Aj,主频fj和中心时间tj。为了有效的提高时频分辨率,避免对过于庞大的原子库进行搜索,可以在由上述步骤中所求得的tj和fj加上自定义的范围,如对于所得的第j次Ric-ker子波的中心时间tj,可以在以tj为中心的20ms范围内搜索,fj亦如此,从而可以得到与原信号最大相关的Ricker子波,就可以利用这个最佳的原子进行下一步最小二乘法反演,这样就能更好地表示原始信号。
3 算法改进从理论角度来讲,求取的Aj要使搜索出来的一系列子波与原始信号尽可能接近,这样能够减少迭代次数,加快收敛速度。从理论上讲,通过最小二乘法就能够得到J个Ricker子波。对于不存在接近于零的特征值和无穷大特征值的行列式WTW,最小二乘法足以利用适当的迭代次数解出最佳的子波集合。但是在实际的地震信号中,行列式WTW的特征值有一部分会趋近于零,利用最小二乘法所计算出的振幅误差较大,然后减去
子波后的信号就要在原来的已经计算的包络处再次计算一个子波,这样会增加迭代次数,降低效率和重构精度。因此,采用新的方法来计算振幅。笔者尝试了奇异值分解[19]的方法来计算振幅,当矩阵W为奇异矩阵时,可进行奇异值分解:W=SrCrVTr(13)其中:r为矩阵的秩,Cr是由WTW之r个非零特征值之正根组成的对角线矩阵,Sr,Vr均为WTW的特征向量矩阵。则A=VrC-1rSTrU(14)此种方法不受行列式特征值的影响,可以有效地减少计算振幅的误差,而且可以减少迭代次数,提高运算速度。另外,在计算过程中,除了设定剩余的地震道幅度为阈值外,还设定了另外一个迭代终止准则,即收敛准则,当迭代N次的剩余信号幅值与迭代N+1次的剩余信号相对幅值差值接近于零时,迭代结果已经不再收敛,停止迭代。如果不设置这个收敛准则,则因为计算误差所剩余的相同延时和频率的子波将会不断分解,只会延长计算时间,而对于重构信号毫无用处。