当前位置:文档之家› 一种基于混合学习策略的移动机器人路径规划方法_郜园园

一种基于混合学习策略的移动机器人路径规划方法_郜园园

一种基于混合学习策略的移动机器人路径规划方法_郜园园
一种基于混合学习策略的移动机器人路径规划方法_郜园园

第27卷第12期V ol.27No.12控制与决策

Control and Decision

2012年12月

Dec.2012

一种基于混合学习策略的移动机器人路径规划方法

文章编号:1001-0920(2012)12-1822-06

郜园园,阮晓钢,宋洪军,于建均

(北京工业大学电子信息与控制工程学院,北京100124)

摘要:针对未知环境下移动机器人路径规划问题,以操作条件反射学习机制为基础,根据模糊推理系统和学习自动机的原理,提出一种应用于移动机器人导航的混合学习策略.运用仿生的自组织学习方法,通过不断与外界未知环境交互从而使机器人具有自学习和自适应的功能.仿真结果表明,该方法能使机器人学会避障和目标导航任务,与传统的人工势场法相比,能有效地克服局部极小和振荡情况.

关键词:模糊推理系统;学习自动机;操作条件反射;混合学习策略;路径规划

中图分类号:TP242文献标志码:A

Path planning method for mobile robot based on a hybrid learning approach

GAO Yuan-yuan,RUAN Xiao-gang,SONG Hong-jun,YU Jian-jun

(College of Electronic Information and Control Engineering,Beijing University of Technology,Beijing100124,China.Correspondent:GAO Yuan-yuan,E-mail:yuangao84@https://www.doczj.com/doc/7115975941.html,)

Abstract:Aim to solve the path planning problem of mobile robot in the unknown environment,a hybrid learning approach is proposed for the robot navigation based on the operant conditioning theory and the principle of fuzzy inference system and learning automata.The robot is endowed with the capabilities of self-learning and self-adapting with unknown environment by using a bionic self-organizing method.Simulation results show that,compared with the method of arti?cal potential?eld, the proposed method can make the robot learn the ability of obstacle avoidance and goal seeking without being stuck in local minima and oscillation.

Key words:fuzzy inference system;learning automata;operant conditioning;hybrid learning approach;path planning

1引言

路径规划是当前移动机器人研究的热点之一,它要求机器人能够自主地决定路径,避开障碍物,实现任务目标.近年来,随着移动机器人应用范围的扩大,对于规划技术的要求也越来越高,单一的规划方法有时不能较好地解决某些规划问题,因而一些新的智能技术逐渐被引入路径规划中,促使了各种方法的融合发展,尤其是将模糊推理系统(FIS)与其他学习方法相结合的混合学习策略已成为研究路径规划方法的重点.Cang等[1]提出将一种结合监督学习与强化学习的模糊控制器用于移动机器人避障,但是该控制器有243条规则,使得该控制器很难满足实时性的要求. Meng等[2-3]将FIS与非监督学习相结合提出了一种神经模糊控制器,并利用行为评价学习方法进行参数和结构的学习,可动态地自主生成、删除和调整模糊规则,将其应用于移动机器人的路径规划,实现了避障和沿墙走的行为.Boubertakh等[4]结合FIS与改进的Q学习方法,在专家知识基础上只用8条模糊规则便成功完成了移动机器人避障和目标导航任务.

上述混合学习方法虽然有诸多优点,但均未涉及仿生学的控制机理.若将模糊控制本身所具有的鲁棒性与基于生理学的感知-动作行为相结合,不断通过与外界未知环境交互,则可使机器人具有自学习和自适应的功能,为移动机器人在复杂环境中的避障导航提出新的思路.学习有限状态自动机(LFSA)能有效地模拟生理学上的感知-动作映射,并且能很好地体现生物的操作条件反射学习机制,其在机器人学中的应用研究已逐渐增多[5-11].Wang等[9]运用确定性有限

收稿日期:2011-07-07;修回日期:2011-11-07.

基金项目:国家863计划项目(2007AA04Z226);国家自然科学基金项目(61075110);北京市自然科学基金项目(4102011);北京市教委重点基金项目(KZ201210005001).

作者简介:郜园园(1984?),女,博士生,从事智能机器人、机器学习的研究;阮晓钢(1958?),男,教授,博士生导师,从事机器人、模式识别等研究.

DOI:10.13195/j.cd.2012.12.65.gaoyy.023

第12期郜园园等:一种基于混合学习策略的移动机器人路径规划方法1823

状态自动机,结合Q学习,帮助机器人进行行为选择

和最优控制.蔡建羡等[12]初步探讨了FIS与概率自动

机的结合,构造了一种仿生自主学习系统,并将其应

用于机器人姿态平衡控制,体现了生物仿生的特性.

可见,模糊逻辑法与学习自动机的结合能有效地解决

移动机器人研究中的一些问题,并具有仿生学的机理.

本文在学习自动机基础上构建了一种操作条件

反射学习自动机(OCLA),用来模拟动物的操作条件

反射机理,并将其用于优化FIS的模糊规则.FIS产生

输出作用于移动机器人,使其通过学习来达到最终

感知到行为的最佳映射.此外,引入有效的专家知识,

提高了系统的灵活性和可扩展性.该方法将生物学

习、模糊控制与学习自动机相结合,实现了移动机器

人在未知环境下的自主避障与导航行为.通过仿真实

验分析,该策略不仅能使机器人学会避障和目标导航,

而且与传统的人工势场法相比能有效地避免陷入局

部极小和摆脱左右振荡.

2移动机器人模糊控制器

本文设计的模糊控制器的总体框架如图1所

示.首先利用人类专家知识初步建立一个简单的模

糊控制器;然后模拟生物操作条件反射,利用OCLA

进一步调节模糊规则的参数,通过不断与外界未知环

境交互从而使机器人具有自学习和自适应的能力.

图1系统结构

2.1机器人模型

仿真中采用一个圆形对称移动机器人结构模型,

其半径为R=20cm.机器人有左右两个轮加前方一

个万向轮,其圆周由24个均匀分布的超声传感器组

成.对于每一个传感器s i,i=1,2,???,24,其覆盖角

度为15°,在其范围内得到与障碍物的距离信息为l i.

考虑到移动机器人的对称结构和传感器均匀分布特

征,针对避障和导航设计了一个简单易行的模糊控制

器,本文简化了输入维数.本文采用机器人前方的18

个传感器,每6个1组共分为3组作为模糊控制器的

输入,3个方向的距离分别表示为:左侧距离d L,前方

距离d F和右侧距离d R.

? ? ?d R=R+min

i=1,2,???,6

(l i),

d F=R+min

i=7,8,???,12

(l i),

d L=R+min

i=13,14,???,18

(l i).

(1)

采用两个坐标系:一个是用XOY表示的世界坐

标系;一个是用xoy表示的机器人的坐标系,其中o是

机器人的中心,y轴直接通过机器人中心(当机器人的

后面两个轮子与y轴同直线时则会径直向前走).机器

人的控制变量是线速度v和机器人运动的转角ΔΦ.

在机器人行为控制结构中,提出决定机器人合适的动

作v和ΔΦ即可实现避障和目标导向的目的.

2.2模糊控制器

模糊推理系统如图2所示,输出y1为机器人的运

行速度v,y2为机器人的运动转角ΔΦ.首先对输入

d=(d L,d F,d R)进行模糊化操作,采用高斯型隶属度

函数来估计每一个输入,分别表示为N和F.

Input

layer

Antecedent

layer

Rules

layer

Output

layer

图2模糊推理系统

隶属度函数可描述为

N:μN k(t)=

{

1,d k?d m;

e?(1/2)((d k(t)?d m)/σN)2,else;

(2)

F:μF k(t)=

{

e?(1/2)((d k(t)?d s)/σF)2,d k?d s;

1,else.

(3)

其中:d m为机器人与障碍物可允许的最小距离,d s为

机器人运动的安全距离,当d>d s时机器人可以最

大速度安全行走.N和F的中心及标准差分别为d m

和d s,σN和σF.

根据专家知识针对避障与目标导向任务建立了

模糊规则集[4].这种策略可以大大减小机器人搜索空

间,使其快速地对环境做出反应.专家知识表述如下:

1)如果机器人在3个方向上距离障碍物均比较

远,则机器人直接以最大的速度向着目标导航;

2)如果目标不在机器人前方,但前方有障碍物存

在,则机器人向着目标方向沿距离最近的障碍物向左

或向右运动,即沿左或右障碍物行走;

3)如果机器人前方既有目标又有障碍物存在,则

机器人试着向目标沿着距离最近的障碍物向左或向

右运动,即沿左或右障碍物行走.

为使机器人自主地决定导航模式,设定两个参

1824

控制与决策

第27卷

数p 和q ,其具体描述如下:

p =

{

0,d L

{

0,90°<θ<270°;1,else .

(5)

其中:d max 是传感器可以探测到与障碍物的最大距离,θ是机器人与目标点的夹角.如果p =1(p =0),则选择沿右(左)侧墙行为;如果q =1,则激活目标导向行为;如果q =0,则选择沿墙走的行为.

采用高斯隶属度函数,获得3个方向(d L ,d F ,d R )的距离模糊输入信息.模糊规则结论的符号语言为:PB (正大),PM (正中),PS (正小),ZR (零),NS (负小),NM (负中),NB (负大).这些值由下一步所设计的操作条件反射自动机学习获得.由于机器人几何结构上的对称性,可以得出NB =?PB,NM =?PM,NS =?PS.简化参数个数,引入上述专家知识,产生了8条模糊规则,描述如下.

R1:If (d L ,d F ,d R )is (N,N,N )Then v 1is ZR and

ΔΦ1is (2×p ?1)×PB;

R2:If (d L ,d F ,d R )is (N,N,F )Then v 2is ZR and

ΔΦ2is NB;

R3:If (d L ,d F ,d R )is (N,F,N )Then v 3is C v ×

V max and ΔΦ3is ZR;

R4:If (d L ,d F ,d R )is (N,F,F)Then v 4is V max and

ΔΦ4is (2×p ?1)×NS;

R5:If (d L ,d F ,d R )is (F,N,N)Then v 5is ZR and

ΔΦ5is PB;

R6:If (d L ,d F ,d R )is (F,N,F)Then v 6is ZR and

ΔΦ6is (2×p ?1)×NB;

R7:If (d L ,d F ,d R )is (F,F,N)Then v 7is V max and

ΔΦ7is (2×p ?1)×NS;

R8:If (d L ,d F ,d R )is (F,F,F)Then v 8is V max and

ΔΦ8is q ×θ+(1?q )×(2×p ?1)×PM.

其中:V max 为机器人运行的最大速度;v i 和ΔΦi 为模糊规则结论;C v 为速度的衰减率.

最后,由模糊推理系统输出的运动转角ΔΦ和运行速度v 来决定机器人下一步的动作,本文采用了Sugeno 模糊推理方法得出精确化后的输出

ΔΦ=

8∑

i =1

αi ΔΦi /8∑i =1

αi ,(6)v =

8∑i =1

αi v i

/8∑i =1

αi ,

(7)

其中αi 是通过代数乘积方法所得到的每一条规则的真实值.

3操作条件反射学习自动机

在本文所设计的仿生混合学习策略中,通过上一节所设计的模糊控制器可以获得机器人的动作输出.学习自动机的引入是为了进一步调节模糊控制器的规则参数,具体调节每一条规则的ΔΦi ,即调节模糊规则结论PB,PM,PS,ZR,NS,NM 和NB 的值.这里基于操作条件反射学习机制设计了一种新的学习自动机,从而使得模糊控制器具有自调节的能力.3.1

操作条件反射基础

“操作条件反射”(OC)的概念由Skinner [13]首次提出,由此创立了Skinner 操作条件反射理论.其核心内容为:某一操作行为一旦受到其结果的强化,则该行为发生的概率便会增加.操作条件反射这一概念的特点在于,它强调行为结果对行为的影响.行为的结果决定有机体行为的加强或减弱以及是否重复某种行为,从而决定有机体行为模式的形成.这一理论阐明了有机体许多复杂行为得以形成的原因,它把对有机体行为的解释,从经典条件反射论的“刺激-反应”模式,深入到了操作条件反射论的“反应-刺激-反应”加强或减弱模式.

自20世纪90年代中期开始,许多学者致力于研究Skinner 操作条件反射理论,期望机器能复制动物的行为学习方式,并建立了相关的模型[14-18].以概率自动机为平台,蔡建羡等[12]用其来模拟操作条件反射机制,设计了相应的仿生系统,并成功实现了两轮机器人的平衡控制.

本文在此基础上设计了一种操作条件反射学习自动机模拟动物学习,并将其用于对模糊推理系统的规则进行进一步细化调节,使移动机器人能够适应复杂的环境变化,具有自主的学习能力.3.2OCLA 的结构设计

定义OCLA 是一个五元组模型,即

OCLA =?S,O,Z,ψ,δ?.

其中:

1)OCLA 的内部状态集合S ={s i ∣i =0,1,???,

n S },s i 为OCLA 第i 个状态符号.

2)OCLA 的内部操作集合O ={o k ∣k =1,2,???,

n O },o k 为OCLA 第k 个操作符号.

3)OCLA 的输出符号集合Z ={z m ∣m =0,1,

???,n Z },z m 为OCLA 第m 个输出符号.

4)OCLA 的状态取向函数ψ:S →[?,f ],?定义为取向性最差的取向函数值,f 为取向性最好的取向函数值(这里的取向性是从生物学意义上定义的,环境决定生物进化的方向,即生物的取向性),?和

f 的值可根据所处理的具体对象来取值.对于任一

第12期

郜园园等:一种基于混合学习策略的移动机器人路径规划方法

1825

s i (s i ∈S ),ψi =ψ(s i )是OCLA 关于状态s i 的期望值,如果ψi <0,则称s i 是负取向状态;如果ψi =0,则称

s i 是零取向状态;如果ψi >0,则称s i 是正取向状态.

5)OCLA 的操作条件反射学习律δ.设OCLA 在

t 时刻的状态为s (t )=s a ∈S ,依集合R 中随机“条

件-操作”规则选中的操作为o (t )=o c ∈O ,实施操作后观测到t +1时刻的状态s (t +1)=s d ∈S ,则基于操作条件反射原理,操作集合R 中随机“条件-操作”规则p ak (k =1,2,???,n O )的激发概率依

δ:?

?

?p ak (t +1)=p abk (t )?ξ(?ψac )?p ak (t ),p ak (t +1)=max min(p ak (t +1),0,1),k =c ;p ac (t +1)=1?

∑k =c

p ak (t +1),k =c 进行调节.其中ψac =ψ(s d )?ψ(s a ),是OCLA 在状态处于s a (s a ∈S )的条件下实施操作o c (o c ∈O )后状态转移为s d (s d ∈S )后取向函数值的变化量,可用此变化量来判断该操作的好坏.ξ(ψac )=ξ(ψ(s d )?

ψ(s a ))=λ?ψac /r 是单调增函数,ξ(x )=0当且仅

当ψac =0,r 是操作规则总数,λ是学习率,即每次迭代学习的速率.p ac (t )(a ∈{0,1,???,n S },c ∈{1,2,

???,n O })是OCLA 状态处于s a (s a ∈S )时实施操作o c (o c ∈O )的概率,当ψabc >0时,实施操作o c 并转

移状态为s d 后的取向函数值变大,相应地p ac (t +1)>

p ac (t ),即下一时刻选择操作o c 的概率增大,反之亦

然.max min(p ak (t +1),0,1)可保证p ak (t +1)∈[0,1],

n o ∑

k =1

p ak (t )=1,即表示在同一输入同一状态下采取不同操作的概率和为1,当t →∞时,若p ac (t )→1,则说明操作o c (o c ∈O )在状态处于s a (s a ∈S )的条件下行为最优.一般情况下给定学习迭代次数T f 或最优行为选择概率最大阈值p ε,当学习达到迭代次数或者当某一状态处于s a (s a ∈S )条件下实施操作

o c (o c ∈O )的概率p abc (t )?p ε时,停止学习;p ε∈[0.7,1],由实际的系统环境具体设定,本文设p ε=0.9.

3.3路径规划中的OCLA

将OCLA 应用于上一节所设计的模糊控制器中,并对模糊规则进行调节.OCLA 的内部状态数与模糊控制器的规则数相同,取n S =8,内部操作集合为每一个规则下的结论个数,取n O =5.输出是按照操作条件反射学习率所选择的模糊规则的结论.状态取向函数简单设计如式(8)所示,P ik 表示第i 个规则第k 条结论被选择的概率.根据具体实验设定参数的值,路径规划仿真实验中设定λ=0.3,r =5,从而可以得到ξ(ψ).

ψ=

{

?1,min(d R ,d F ,d L )

(8)

如果概率选择的操作是o (t )=o c ∈O ,对于每一条规则应用OCLA 表述如下:

If Rule is i Then A i =A ic ,按照OCLA 操作条件反射学习率δ改变P ic ;or A i =A ik ,按照OCLA 操作条件反射学习率δ改变P ik .这里i =1,2,???,n S ,k =

1,2,???,n O ,且k =c .

对于每一条规则下的5个可选结论都有对应的动作选择概率值P ij ,A ij 表示第i 条规则下可供概率选择的结论j ,j =1,2,???,n O ,在本文路径规划中A ij 具体的是机器人运动转角ΔΦ的模糊规则结论.机器人在当前状态下按概率选择模糊规则结论,通过取向函数进行概率更新,以改变下一次该行为动作选择的概率来模拟生物在未知环境下动作选择的不确定性和取向性.

4基于仿生混合学习策略的路径规划

4.1

实验条件

本文研究的目的是使移动机器人像人或动物一样通过学习具有避障和目标导向的能力,同时还能够克服局部极小和左右振荡的情况.本文实验中使用的机器人模型如第2节中所述,这里假设超声传感器的可测范围为0~250cm.仿真中所用的参数见表1,表2为ΔΦ模糊规则结论.每一个对应5个模糊规则结论,表2中只给出了最小值和最大值,例如NS 是

?5,?10,?15,?20,?25,即每一条规则的内部操作集

合为每一个规则下的结论个数,即n O =5.

表1

实验参数

d m /cm

d s /cm

σN

σF

V max /(m/s)

C v

30900.250.2510.1

表2ΔΦ模糊规则结论

NS

NM

NB

ZR PB min ?25?45?65045max

?5

?25

?45

65

为方便进行实验研究,本文建立了移动机器人基于超声传感器导航的仿真研究环境,障碍物的类型包括圆形、方形和隔墙型障碍,其大小和位置可以改变,并且对于移动机器人系统而言是完全未知的.移动机器人系统仅能通过超声传感器探测不同方向的障碍物距离,但可以感知当前的位置信息.移动机器人在未知环境中进行学习,每一轮学习的运行时间为500步,每一步时间T s =1s.机器人与环境如图3所示,其中实体部分表示未知的障碍物,“-”表示机器人运行的轨迹,与轨迹一端相连的圆形表示移动机器人.

1826

控制与决策

第27卷

(a)

(b)

C 1

C 2

C 3C 4

图3机器人自由巡航轨迹图

4.2结果与分析

实验1自由巡航实验.

移动机器人从起始点开始出发,直到与障碍物发生碰撞,即与障碍物距离小于最小可允许距离d m =

30cm.每次碰撞后,机器人在碰撞处重新进行动作选

择,直到避开障碍物继续前行.机器人每一次动作通过操作条件反射自动机的取向函数评价后,对所选规则的概率值进行更新,以使好的行为动作选择的概率越来越大.图3(a)为第1轮学习前100步时的运行轨迹,图中C 1,C 2,C 3和C 4分别是机器人与障碍物的碰撞点,很明显机器人刚开始还没有学会避碰行为.随着学习的进行,图3(b)为第3轮的学习,机器人在这一轮已学会避碰行为,运动曲线也较为光滑.

当模糊推理系统中各规则的结论值存在任意一个选择概率大于0.9时,停止学习,认为当前结论达到近似最优.学习完成后的结论值大于0.9的值在表3中列出,这一部分学习的结果与文献[4]中的结果相同,证明了该方法的有效性.

表3

学习完成后的ΔΦ值

R1R2R3R4R5R6R7R8PB NB

ZR NS

PB PB NS

NM

45

?65

?10

50

55

?10

?25

实验2目标导航实验.

当机器人经过3轮学习完成后已习得避障的能力,在此基础上进行目标导航实验.图4为机器人基于本文方法进行目标导航的运行轨迹图.从图4可以看出,机器人能够自主判断出目标点的方向并实施行为动作,以期以较优的路径到达目标点位置.图4(a)所示机器人周围远离障碍物,p =1直接启动目标导向模式进行动作;图4(b)和图4(c)是在图4(a)的环境中加入障碍物,通过与环境交互p 值变化1-0-1进行模式切换来选择动作,并最终到达目标点(p =1目标导向模式,p =0沿障碍物行走模式);图4(d)中p 值的变化过程为1-0-1-0-1;图4(e)是在图4(d)中又加入了随机的障碍物,机器人仍能另辟新径到达目标点

,

表现出了很好的鲁棒性与适应性

,

导航过程p 值变化为1-0-1-0-1-0-1.

(a)1

(b)2 (c)2

(d)3

(d)4

图4未知环境下目标导航

实验3克服局部极小与振荡对比实验.仿真中布置了凹型障碍物环境和窄的通道环境与传统的人工势场法进行相关对比实验研究.对于传统的人工势场法,在一些复杂障碍物条件下往往存在参数优化困难,无法对环境变化实现自适应;而学习的方法则可以有效地利用与环境的交互克服上述问题.特别地,对于凹型障碍物等复杂环境,传统的人工势场法会出现局部极值,即引力与斥力相等,一些其他的方法也容易出现循环振荡.

图5给出了在凹型障碍物环境下和窄的通道环境下的对比实验,实验设置窄道的宽为80cm.图5(a)为采用人工势场法的移动机器人导航轨迹,图5(b)为采用本文方法的移动机器人运行轨迹.图中第1横排是凹形环境下的对比图.第2横排为窄的通道环境下的实验效果对比图.可以看出,本文方法在凹形环境

中能够实时地识别环境,自主地改变行为选择策略,

p 值变化过程是1-0-1,从目标导航行为变为沿障碍物

走的行为,并且在通过障碍物后又切换为目标导航行为,克服了陷入局部极小的情况,成功绕开了障碍物趋向目标点.机器人采用传统的人工势场法在通过窄道环境时出现了左右波动,而本文导航方法则在识别环境后持续选择规则R3进行导航

,路径比较平坦,没有出现振荡,鲁棒性较好.

(a) (b)

图5克服局部极小与振荡对比实验

第12期郜园园等:一种基于混合学习策略的移动机器人路径规划方法1827

5结论

本文对移动机器人路径规划方法进行了研究,有效地把生物学习、模糊控制与学习自动机相结合,实现了移动机器人在未知复杂环境下的自主避障与导航行为.采用仿生的混合学习策略来使机器人学习路径规划行为,通过自动获取知识、积累经验和不断更新从而降低了由对象和系统造成的不确定性影响.实验结果表明,本文方法能够使机器人学会避障、目标导航,解决了特殊环境下的局部极值和左右振荡问题,并通过与环境交互实现了自主学习,从而提高了机器人的反应式行为的灵活性和对环境的适应性.因为所研究的是一种拟人的学习机制,是以提高机器人的避障能力为主而效果作为其次,故在下一步研究中还需进一步地优化.

参考文献(References)

[1]Cang Y,Yung N H C,Danwei Wang.A fuzzy controller

with supervised learning assisted reinforcement learning algorithm for obstacle avoidance[J].IEEE Trans on Systems,Man,and Cybernetics,Part B:Cybernetics,2003, 33(1):17-27.

[2]Meng Joo Er,Chang Deng.Obstacle avoidance of a mobile

robot using hybrid learning approach[J].IEEE Trans on Industrial Electronics,2005,52(3):898-905.

[3]Meng Joo Er,Yi Zhou.Automatic generation of fuzzy

inference systems via unsupervised learning[J].Neural Networks,2008,21(10):1556-1566.

[4]Boubertakh H,Tadjine M,Glorennec P Y.A new

mobile robot navigation method using fuzzy logic and

a modi?ed Q-learning algorithm[J].J of Intelligent and

Fuzzy Systems,2010,21(1/2):113-119.

[5]Narendra K S,Thathchar M A L.Learning automat:An

introduction[M].Upper Saddle River:Prentice-Hall,1989.

[6]Pierce D,Kuipers B.Learning to explore and build

maps[C].Proc of the National Conf on Arti?cial Intelligence.Seattle:MIT Press,1994:264-1271.

[7]Dean T,Anqluin D,Basye K,et al.Inferring?nite automata

with stochastic output functions and an application to map learning[J].Machine Learning,1995,18(1):81-108. [8]EI-Osery A,Jamshidi M.A stochastic learning automaton

based autonomous control of robotic agents[C].IEEE

Int Conf on Systems,Man and Cybernetics.Yasmine Hammamet:IEEE Press,2002:100-105.

[9]Wang X,Ray A,Lee P,et al.Optimal control of robot

behaviour using language measure[J].Int J of Vehicle Autonomous Systems,2004,2(3/4):147-167.

[10]Cattinelli I,Goldwurm M,Borqhese N.Interacting with

an arti?cial partner:Modeling the role of emotional aspects[J].Biological Cybernetics,2008,99(6):473-489.

[11]闫保英,赵合计.机器人足球中角色决策的有限状态自

动机模型[J].山东轻工业学院学报:自然科学版,2008, 22(2):98-101.

(Yan B Y,Zhao H J.The?nite state automation model of the decision-making of robocup based on role[J].J of Shandong Institute of Light Industry:Natural Science Edition,2008,22(2):98-101.)

[12]蔡建羡,阮晓钢.OCPA仿生自主学习系统及在机器人

姿态平衡控制上的应用[J].模式识别与人工智能,2011, 24(1):138-146.

(Cai J X,Ruan X G.OCPA bionic autonomous learning system and its application to robot poster balance control[J].Pattern Recognition and Arti?cial Intelligence, 2011,24(1):138-146.)

[13]Skinner B F.The behavior of organisms[M].New York:

Appleton-Century-Crofts,1938.

[14]Touretzky D S,Saksida L M.Operant conditioning in

skinnerbots[J].Adaptive Behavior,1997,5(3/4):219-247.

[15]Saksida L M,Raymond S M,Touretzky D S.

Shaping robot behavior using principles from instrumental conditioning[J].Robotics and Autonomous Systems,1998, 22(3/4):231-249.

[16]Touretzky D S,Daw N D,Tira-Thompson E https://www.doczj.com/doc/7115975941.html,bining

con?gural and TD learning on a robot[C].The2nd Int Conf on Development and Learning.Cambridge,2002:47-52.

[17]Gaudiano P,Chang C.Adaptive obstacle avoidance with a

neural network for operant conditioning:Experiments with real robots[C].IEEE Int Symposium on Computational Intelligence in Robotics and Automation.Monterey:IEEE Press,1997:13-18.

[18]Itoh K,Miwa H,Matsumoto M,et al.Behavior model of

humanoid robots based on operant conditioning[C].The 5th IEEE-RAS Int Conf on Humanoid Robots.Tsukuba: IEEE Press,2005:220-225.

遗传算法与机器人路径规划

遗传算法与机器人路径规划 摘要:机器人的路径规划是机器人学的一个重要研究领域,是人工智能和机器人学的一个结合点。对于移动机器人而言,在其工作时要求按一定的规则,例如时间最优,在工作空间中寻找到一条最优的路径运动。机器人路径规划可以建模成在一定的约束条件下,机器人在工作过程中能够避开障碍物从初始位置行走到目标位置的路径优化过程。遗传算法是一种应用较多的路径规划方法,利用地图中的信息进行路径规划,实际应用中效率比较高。 关键词:路径规划;移动机器人;避障;遗传算法 Genetic Algorithm and Robot Path Planning Abstract: Robot path planning research is a very important area of robotics, it is also a combine point of artificial intelligence and robotics. For the mobile robot, it need to be worked by certain rulers(e.g time optimal),and find a best movement path in work space. Robot path planning can be modeled that in the course of robots able to avoid the obstacles from the initial position to the target location,and it ruquire to work under ertain constraints. Genetic algorithm used in path planning is very common, when planning the path ,it use the information of map ,and have high eficient in actual. Key words: Path planning,mobile robot, avoid the obstacles, genetic algorithm 1路径规划 1.1机器人路径规划分类 (1)根据机器人对环境信息掌握的程度和障碍物的不同,移动机器人的路径规划基本上可分为以下几类: 1,已知环境下的对静态障碍物的路径规划; 2,未知环境下的对静态障碍物的路径规划; 3,已知环境下对动态障碍物的路径规划; 4,未知环境下的对动态障碍物的路径规划。 (2)也可根据对环境信息掌握的程度不同将移动机器人路径规划分为两种类型: 1,基于环境先验完全信息的全局路径规划; 2,基于传感器信息的局部路径规划。 (第二种中的环境是未知或部分未知的,即障碍物的尺寸、形状和位置等信息必须通过传感器获取。) 1.2路径规划步骤 无论机器人路径规划属于哪种类别,采用何种规划算法,基本上都要遵循以下步骤: 1, 建立环境模型,即将现实世界的问题进行抽象后建立相关的模型; 2, 路径搜索方法,即寻找合乎条件的路径的算法。 1.3路径规划方法

移动机器人完全遍历路径规划算法研究

东南大学 硕士学位论文 移动机器人完全遍历路径规划算法研究 姓名:胡正聪 申请学位级别:硕士 专业:机械电子工程 指导教师:张赤斌 20080403

第一章绪论 第一章绪论 1.1移动机器人的发展史 社会的主体是人类,历史的推动者是人类,伟大的人类运用自己的智慧不断创造伟大的发明,不断推动社会的发展。邓小平同志说过:“科技是第一生产力。”生产力是社会发展的动力,所以人类推动社会发展就是要致力于发展生产力,致力于发展科技。人类不断发展生产力来提高自身认识自然、改造自然、得到自己所需物质的能力,这种能力的进化由最初的运用双手、简单工具、发展到运用畜力、发展到运用简单机器、发展到运用自动化设备、还会发展到我们无法想象的未来。 机器人就是生产力发展的产物。机器人的概念最早是在1920年的科幻小说中提出的,而早期的机器人如1939年美国纽约世界博览会上展出的西屋电气公司制造的家用机器人Elektro和1956年美国人乔治?德沃尔制造出的世界上第一台可编程的机器人都是一些实用价值不高的机器人,它们是现代机器人的雏形。上世纪60年代,由于传感器和计算机技术的发展及应用,兴起了全世界第二代机器人的研究热潮,并向人工智能进发。1968年,美国斯坦福研究所公布了他们研发成功的机器人Shakey。它带有视觉传感器,能根据人的指令发现并抓取积木。Shakey可以算是世界第一台智能机器人,它拉开了第三代机器人研发的序幕。到了上世纪80年代,发达国家都组建各种机器人研究机构,尤其是以美国为代表的国家将机器人的研究列入了军事发展计划,带动各国把机器人的研究推上了高潮,日本和欧洲各国都成立了各自的机器人研究中心和规划了自己的研究计划。进入90年代后,机器人的应用领域除了工业和军事外,还涉及到了服务和娱乐领域,以日本本田公司的ASIMO人型机器人和索尼公司的AIBO娱乐机器人为代表的机器人展示了机器人领域各方面的先进研究成果。在欧洲,2002年丹麦iRobot公司推出了吸尘器机器人Roomba,它能避开障碍,自动设计行进路线,还能在电量不足时,自动驶向充电座。Roomba是目前世界上销量最大、最商业化的家用机器人。2006年6月,微软公司推出MicrosoRRoboticsStudio,机器人模块化、平台统一化的趋势越来截明显,比尔?盖茨预言:“家用机器人很快将席卷伞球。” 图1.1丹麦iRobot公司推出的吸尘机器人Roomba[

机器人路径规划

1绪论 1.1机器人简介 1.1.1什么是机器人 机器人一词不仅会在科幻小说、动画片等上看到和听到,有时也会在电视上看到在工厂进行作业的机器人,在实际中也有机会看到机器人的展示。今天,说不定机器人就在我们的身过,但这里我们要讨论的是什么是机器人学研究的机器人。 机器人(robot)一词来源下1920年捷克作家卡雷尔. 查培克(Kapel Capek)所编写的戏剧中的人造劳动者,在那里机器人被描写成像奴隶那样进行劳动的机器。 后来作为一种虚构的机械出现在许多作品中,代替人们去完成某些工作。20世纪60年代出现了作为可实用机械的机器人。为了反这种机器人同虚构的机器人及玩具机器人加以区别,称其为工业机器人。 工业机器人的兴起促进了大学及研究所开展机器人的研究。随着计算机的普及,又积极地开展了带有智能的机器人的研究。到70年代,机器人作为工程对象已经被确认,机器人一词也受到公认。目前,机器人学的研究对象已不仅仅是工业机器人了。 即便是实际存在的机器人,也很难把它定义为机器人,而且其定义也随着时代在变化。这里简单地反具有下述性质的机械看作是机器人: 1.代替人进行工作:机器人能像人那样使用工具和机械,因此,数控机床和 汽车不是机器人。 2.有通有性:既可简单地变换所进行的作为,又能按照工作状况的变化相应 地进行工作。一般的玩具机器人不能说有通用性。 3.直接对个界作工作:不仅是像计算机那样进行计算,而且能依据计算结果 对外界结果对外界产生作用。 机器人学把这样定义的机器人作为研究对象。

1.1.2机器人的分类 机器人的分类方法很多,这里我们依据三个有代表性的分类方法列举机器人的种类。 首先,由天机器人要代替人进行作业,因此可根据代替人的哪一个器官来分类: 操作机器人(手):利用相当于手臂的机械手、相当于手指的手爪来使物体协作。 移动机器人(腿):虽然已开发出了2足步行和4足步行机器人,但实用的却是用车轮进行移动的机器人。(本文以轮式移动机器人作为研究对象)视觉机器人(眼):通过外观检查来除掉残次品,观看人的面孔认出是谁。虽然还有使用触觉的机器人,但由于它不是为了操作,所以不能说是触觉机器人。 也还有不仅代替单一器官的机器人,例如进行移动操作,或进行视觉和操作的机器人。 其次,按机器人的应用来分类: 工业机器人:可分为搬送、焊接、装配、喷漆、检查等机器人,主要用于工厂内。 极限作业器人:主要用在人们难以进入的核电站、海底、宇宙空间等进行作为的机器人。也包括建筑、农业机器人等。 娱乐机器人:有弹奏乐器的机器人、舞蹈机器人、宠物机器人等,具有某种程度的通用性。也有适应环境面改变行动的宠物机器人。 最后则是按照基于什么样的信息进行动作来分类: 表1基于动作信息的机器人分类

机器人路径运行操作步骤

3.23机器人路径运动操作步骤 任务:选取多个点构成一条路径,通过示教器完成机器人路径运动操作 相关知识:机器人路径示教器操作分为手动和自动两种模式 操作步骤: 一、手动模式 1、新建程序 (1)点击首页下拉菜单中“程序编辑器”选项,进入程序编辑器 (2)点击右上角“例行程序”选项,进如程序列表 (3)点击左下角“文件”,选择“新建例行程序”,新建例行程序 并命名 2、程序编写 (1)选择新建好的例行程序,进入程序编辑页面,点击左下角“添 加指令”,在右侧弹出菜单中选择轴运动指令“MoveJ” (2)根据需要修改显示的“MoveJ * ,v1000 , z50 , tool0”指令, *代表坐标点名称,v1000代表速度,z50代表路径选择幅度, tool0与工具坐标有关 (3)根据需要添加路径包含的点坐标并修改,完成全部路径点的设 置 3、调试 (1)从第一行“MoveJ”指令开始,利用示教器旋钮调节机器人至路 径点位,点击“修改位置”,程序与点位一一对应 (2)点位修改完成后,进行手动调试。点击“调试”选择“PP移动 至例行程序”,进入要调试的例行程序,光标选择调试的程序 行,再次点击“调试”,选择“PP移动至光标” (3)在右下角设置选项中选择机器人运行的速度

(4)左手按下示教器使能键,右手按下示教器上的“开始”按钮, 进行机器人路径运行操控 注意:机器人运行过程中不能松开示教器使能键 二、自动模式 1、完成手动调试模式调试后,点击“例行程序”菜单进入程序选择列表, 选择“Main”函数,进入函数编辑页面 2、光标选择,点击“添加指令”,在右侧弹出菜单中选择 “ProcCall”指令,将例行程序添加至主程序中 3、将机器人控制柜模式选择开关调到“自动模式” 4、点击示教器上的选项“确认” 5、按下控制柜上使能键,白色指示灯常亮 6、按下示教器上“开始”按钮,开始自动模式调试 7、自动模式下完成轨迹动作以后把控制柜上的“自动”模式旋转调回“手 动”模式

机器人路径规划方法的研究

第5期(总第156期) 2009年10月机械工程与自动化 M ECHAN I CAL EN G I N EER I N G & AU TOM A T I ON N o 15 O ct 1 文章编号:167226413(2009)0520194203 机器人路径规划方法的研究 李爱萍,李元宗 (太原理工大学机械工程学院,山西 太原 030024) 摘要:路径规划技术是机器人学研究领域中的一个重要部分。目前的研究主要分为全局规划方法和局部规划方法两大类。通过对机器人路径规划方法研究现状的分析,指出了各种方法的优点及不足,并对其发展方向进行了展望。 关键词:机器人;全局规划;局部规划中图分类号:T P 242 文献标识码:A 收稿日期:2009201207;修回日期:2009204218 作者简介:李爱萍(19792),女,山西晋中人,在读硕士研究生。 0 引言 路径规划技术是机器人学研究领域中的一个重要 部分。机器人的最优路径规划就是依据某个或某些优化准则(如工作代价最小、行走路线最短、行走时间最短等),在其工作空间中找到一条从起始状态到目标状态的最优路径。根据对环境信息的掌握程度不同,路径规划可分为:①全局路径规划:环境信息完全已知,根据环境地图按照一定的算法搜寻一条最优或者近似最优的无碰撞路径,规划路径的精确程度取决于获取环境信息的准确程度;②局部路径规划:环境信息完全未知或部分未知,根据传感器的信息来不断地更新其内部的环境信息,从而确定出机器人在地图中的当前位置及周围局部范围内的障碍物分布情况,并在此基础上,规划出一条从当前点到某一子目标点的最优路径。 1 全局规划方法111 栅格法 栅格法是目前研究最广泛的路径规划方法之一。该方法将机器人的工作空间分解为多个简单的区域(栅格),由这些栅格构成一个显式的连通图,或在搜索过程中形成隐式的连通图,然后在图上搜索一条从起始栅格到目标栅格的路径。一般路径只需用栅格的序号表示。但栅格的划分直接影响其规划结果,如果栅格划分过大,环境信息储藏量小,分辨率下降,规划能力就差;栅格划分过小,规划时间长,而且对信息存储能力的要求会急剧增加。112 可视图法 可视图法中的路径图由捕捉到的存在于机器人一 维网络曲线(称为路径图)自由空间中的节点组成。路径的初始状态和目标状态同路径图中的点相对应,这样路径规划问题就演变为在这些点间搜索路径的问题。要求机器人和障碍物各顶点之间、目标点和障碍物各顶点之间以及各障碍物顶点与顶点之间的连线均不能穿越障碍物,即直线是“可视的”。然后采用某种方法搜索从起始点到目标点的最优路径,搜索最优路径的问题就转化为从起始点到目标点经过这些可视直线的最短距离问题。该法能够求得最短路径,但需假设忽略机器人的尺寸大小,使得机器人通过障碍物顶点时离障碍物太近甚至接触,并且搜索时间长。113 拓扑法 拓扑法将规划空间分割成具有拓扑特征的子空间,根据彼此的连通性建立拓扑网络,在网络上寻找起始点到目标点的拓扑路径,最终由拓扑路径求出几何路径。拓扑法的基本思想是降维法,即将在高维几何空间中求路径的问题转化为低维拓扑空间中判别连通性的问题。其优点在于利用拓扑特征大大缩小了搜索空间,其算法的复杂性仅依赖于障碍物数目,在理论上是完备的;而且拓扑法通常不需要机器人的准确位置,对于位置误差也就有了更好的鲁棒性。缺点是建立拓扑网络的过程相当复杂,特别是在增加障碍物时如何有效地修正已经存在的拓扑网是有待解决的问题。 114 自由空间法 自由空间法采用预先定义的广义锥形或凸多边形等基本形状构造自由空间,并将自由空间表示为连通图,通过搜索连通图来进行路径规划。自由空间的构

一种移动机器人的路径规划算法

一种移动机器人的路径规划算法 作者:霍迎辉,张连明 (广东工业大学自动化研究所广州510090 文章来源:自动化技术与应用点击数:1419 更新时间:2005-1-24 摘要:本文提出一种移动机器人路径规划最短切线路径算法。依据此算法,机器人能顺利地避开障碍物到达目标位置,其原理简单,计算快捷,容易实现。仿真结果验证了它的有效性和实用性。 关键词:移动机器人;路径规划;机器人避障 1引言 移动机器人路径规划问题是指在有障碍物的工作环境中寻找一条恰当的从给定起点到终点的运动路径,使机器人在运动过程中能安全、无碰撞地绕过所有的障碍物[1]。 障碍环境中机器人的无碰撞路径规划[2]是智能机器人研究的重要课题之一,由于在障碍空间中机器人运动规划的高度复杂性使得这一问题至今未能很好地解决。路径规划问题根据机器人的工作环境模型可以分为两种,一种是基于模型的路径规划,作业环境的全部信息都是预知的;另一种是基于传感器的路径规划,作业环境的信息是全部未知或部分未知的。 对机器人路径规划的研究,世界各国的专家学者们提出了许多不同的路径规划方法,主要可分为全局路径和局部路径规划方法。全局路径规划方法有位形空间法、广义锥方法、顶点图像法、栅格划归法;局部路径规划方法主要有人工势场法。这些方法都各有优缺点[3],也没有一种方法能够适用于任何场合。 本文提出一种最短切线路径的规划方法,其涉及的理论并不高深,计算简单,容易实现,可供侧重于应用的读者参考。下面将详细介绍该算法的基本原理,最后给出仿真实现的结果。 2最短切线路径算法 2.1算法基本原理 (1)首先判断机器人和给定的目标位置之间是否存在障碍物。如图1所示,以B代表目标位置,其坐标 为(x B,y B ),以R、A分别代表机器人及障碍物,坐标为(x R ,y R )、(x A ,y A )。Rr和Ra表示机器人和障 碍物的碰撞半径,也就是说在其半径以外无碰撞的危险。这里对碰撞半径的选择作出一点说明,碰撞半径越小,发生碰撞的危险度越大,但切线路径越短;碰撞半径越大,发生碰撞的危险度越小,但同时切线路径越长。要根据实际情况和控制要求来确定碰撞半径。若机器人与目标位置之间不存在障碍物,机器人可走直线直接到达目标位置,此时的直线方程可由两点式确定:

移动机器人路径规划技术综述

第25卷第7期V ol.25No.7 控制与决策 Control and Decision 2010年7月 Jul.2010移动机器人路径规划技术综述 文章编号:1001-0920(2010)07-0961-07 朱大奇,颜明重 (上海海事大学水下机器人与智能系统实验室,上海201306) 摘要:智能移动机器人路径规划问题一直是机器人研究的核心内容之一.将移动机器人路径规划方法概括为:基于模版匹配路径规划技术、基于人工势场路径规划技术、基于地图构建路径规划技术和基于人工智能的路径规划技术.分别对这几种方法进行总结与评价,最后展望了移动机器人路径规划的未来研究方向. 关键词:移动机器人;路径规划;人工势场;模板匹配;地图构建;神经网络;智能计算 中图分类号:TP18;TP273文献标识码:A Survey on technology of mobile robot path planning ZHU Da-qi,YAN Ming-zhong (Laboratory of Underwater Vehicles and Intelligent Systems,Shanghai Maritime University,Shanghai201306, China.Correspondent:ZHU Da-qi,E-mail:zdq367@https://www.doczj.com/doc/7115975941.html,) Abstract:The technology of intelligent mobile robot path planning is one of the most important robot research areas.In this paper the methods of path planning are classi?ed into four classes:Template based,arti?cial potential?eld based,map building based and arti?cial intelligent based approaches.First,the basic theories of the path planning methods are introduced brie?y.Then,the advantages and limitations of the methods are pointed out.Finally,the technology development trends of intelligent mobile robot path planning are given. Key words:Mobile robot;Path planning;Arti?cial potential?eld;Template approach;Map building;Neural network; Intelligent computation 1引言 所谓移动机器人路径规划技术,就是机器人根据自身传感器对环境的感知,自行规划出一条安全的运行路线,同时高效完成作业任务.移动机器人路径规划主要解决3个问题:1)使机器人能从初始点运动到目标点;2)用一定的算法使机器人能绕开障碍物,并且经过某些必须经过的点完成相应的作业任务;3)在完成以上任务的前提下,尽量优化机器人运行轨迹.机器人路径规划技术是智能移动机器人研究的核心内容之一,它起始于20世纪70年代,迄今为止,己有大量的研究成果报道.部分学者从机器人对环境感知的角度,将移动机器人路径规划方法分为3种类型[1]:基于环境模型的规划方法、基于事例学习的规划方法和基于行为的路径规划方法;从机器人路径规划的目标范围看,又可分为全局路径规划和局部路径规划;从规划环境是否随时间变化方面看,还可分为静态路径规划和动态路径规划. 本文从移动机器人路径规划的具体算法与策略上,将移动机器人路径规划技术概括为以下4类:模版匹配路径规划技术、人工势场路径规划技术、地图构建路径规划技术和人工智能路径规划技术.分别对这几种方法进行总结与评价,展望了移动机器人路径规划的未来发展方向. 2模版匹配路径规划技术 模版匹配方法是将机器人当前状态与过去经历相比较,找到最接近的状态,修改这一状态下的路径,便可得到一条新的路径[2,3].即首先利用路径规划所用到的或已产生的信息建立一个模版库,库中的任一模版包含每一次规划的环境信息和路径信息,这些模版可通过特定的索引取得;随后将当前规划任务和环境信息与模版库中的模版进行匹配,以寻找出一 收稿日期:2009-08-30;修回日期:2009-11-18. 基金项目:国家自然科学基金项目(50775136);高校博士点基金项目(20093121110001);上海市教委科研创新项目(10ZZ97). 作者简介:朱大奇(1964?),男,安徽安庆人,教授,博士生导师,从事水下机器人可靠性与路径规划等研究;颜明重(1977?),男,福建泉州人,博士生,从事水下机器人路径规划的研究.

机器人路径动态规划

研究背景 近年来,机器人技术飞速发展,机器人的应用领域也在不断扩展。机器人的工作环境存在高度的多变性和复杂性,因此自主导航是实现真正智能化和完全自主移动的关键技术。机器人的导航问题可以归结为对“我在哪”、“我要去哪”以及“我如何到达那里”三个问题的回答。第三个问题就是路径规划,要求机器人在当前位置与目标位置之间寻找一条安全、合理、高效的路径,保证机器人能够安全地到达目标地点。机器人路径规划是机器人领域的一个研究热点。 一、课题应用 机器人的路径规划是机器人学的一个重要研究领域,是人工智能和机器人学的一个结合点。对于移动机器人而言,在其工作时要求按一定的规则,例如时间最优,在工作空间中寻找到一条最优的路径运动。机器人路径规划可以建模成在一定的约束条件下,机器人在工作过程中能够避开障碍物从初始位置行走到目标位置的路径优化过程。遗传算法是一种应用较多的路径规划方法,利用地图中的信息进行路径规划,实际应用中效率比较高。 智能移动机器人[1],是一个集环境感知、动态决策与规划、行为控制与执行等多功能于一体的综合系统。它集中了传感器技术、信息处理、电子工程、计算机工程、自动化控制工程以及人工智能等多学科的研究成果,代表机电一体化的最高成就,是目前科学技术发展最活跃的领域之一。随着机器人性能不断地完善,移动机器人的应用范围大为扩展,不仅在工业、农业、医疗、服务等行业中得到广泛的应用,而且在城市安全、国防和空间探测领域等有害与危险场合得到很好的应用。因此,移动机器人技术已经得到世界各国的普遍关注。 移动机器人的研究始于60 年代末期。斯坦福研究院(SRI)的Nils Nilssen 和Charles Rosen 等人,在1966年至1972 年中研发出了取名Shakey的自主移动机器人[1]。目的是研究应用人工智能技术,在复杂环境下机器人系统的自主推理、规划和控制。 根据移动方式来分,可分为:轮式移动机器人、步行移动机器人(单腿式、双腿式和多腿式)、履带式移动机器人、爬行机器人、蠕动式机器人和游动式机器人等类型;按工作环境来分,可分为:室内移动机器人和室外移动机器人;按控制体系结构来分,可分为:功能式(水平式)结构机器人、行为式(垂直式)结构机器人和混合式机器人;按功能和用途来分,可分为:医疗机器人、军用机器人、助残机器人、清洁机器人等; 一种由传感器、遥控操作器和自动控制的移动载体组成的机器人系统。移动机器人具有移动功能,在代替人从事危险、恶劣(如辐射、有毒等)环境下作业和人所不 及的(如宇宙空间、水下等)环境作业方面,比一般机器人有更大的机动性、灵活性。 移动机器人是一种在复杂环境下工作的,具有自行组织、自主运行、自主规划的智能机器人,融合了计算机技术、信息技术、通信技术、微电子技术和机器人技术等。 三、研究意义 路径规划技术是机器人研究领域中的一个重要分支,是机器人智能化的重要标志,是对

机器人路径规划

机器人路径规划 摘要:机器人路径规划是机器人技术的重要分支之一,路径规划技术的研究是研究机器人技术不可或缺的技术之一。本文首先介绍了当前研究人员热衷的ROS 系统是如何进行路径规划的,接着论述了作为群智能算法的蚁群算法应用于机器人的路径规划中。研究表明,可以将蚁群算法和ROS系统结合,进一步的进行机器人的路径规划。 关键词:路径规划,ROS系统,蚁群算法,机器人 1.引言 智能移动机器人技术是机器人技术的重要组成部分,应用前景十分广阔:工业,农业,国防,医疗,以及服务业等[1]。文献提出,未来数年内,中国服务机器人发展将超过传统的工业机器人[2],机器人路径规划技术是服务机器人研究的核心内容之一[3]。可见,研究机器人的路径规划问题十分必要。 随着机器人领域的快速发展和复杂化,代码的复用性和模块化的需求原来越强烈,而已有的开源机器人系统又不能很好的适应需求。2010年Willow Garage 公司发布了开源机器人操作系统ROS(robot operating system),很快在机器人研究领域展开了学习和使用ROS的热潮。ROS系统是起源于2007年斯坦福大学人工智能实验室的项目与机器人技术公司Willow Garage的个人机器人项目(Personal Robots Program)之间的合作,2008年之后就由Willow Garage来进行推动。ROS的运行架构是一种使用ROS通信模块实现模块间P2P的松耦合的网络连接的处理架构,它执行若干种类型的通讯,包括基于服务的同步RPC(远程过程调用)通讯、基于Topic的异步数据流通讯,还有参数服务器上的数据存储。ROS系统以其独特优点引起了研究人员的兴趣。 近年来,各国学者致力于机器人路径规划的研究且取得了相当丰硕的研究成果。目前已有多种算法用于规划机器人的路径,文献【4】将其主要分为经典方

多机器人路径规划研究方法(一)

多机器人路径规划研究方法(一) 张亚鸣雷小宇杨胜跃樊晓平瞿志华贾占朝摘要:在查阅大量文献的基础上对多机器人路径规划的主要研究内容和研究现状进行了分析和总结,讨论了多机器人路径规划方法的评判标准,并阐述了研究遇到的瓶颈问题,展望了多机器人路径规划方法的发展趋势。 关键词:多机器人;路径规划;强化学习;评判准则 e,itexpoundedthebottleneckofthepathplanningresearchfor , ; 近年来,分布式人工智能(DAI)成为人工智能研究的一个重要分支。DAI 研究大致可以分为DPS (distributedproblemsolving )和MAS ()两个方面。一些从事机器人学的研究人员受多智能体系统研究的启发,将智能体概念应用于多机器人系统的研究中,将单个机器人视做一个能独立执行特定任务的智能体,并把这种多机器人系统称为多智能体机器人系统(MARS)。因此,本文中多机器人系统等同于多智能体机器人系统。目前,多机器人系统已经成为学术界研究的热点,而路径规划研究又是其核心部分。

机器人路径规划问题可以建模为一个带约束的优化问题,其包括地理环境信息建模、路径规划、定位和避障等任务,它是移动机器人导航与控制的基础。单个移动机器人路径规划研究一直是机器人研究的重点,且已经有许多成果 1~3],例如在静态环境中常见的有连接图法、可视图法、切线图法、Voronoi 图法、自由空间法、栅格法、拓扑法、链接图法、证据理论建图等;动态环境中常见的有粒子群算法、免疫算法、遗传算法、神经网络、蚁群算法、模拟退火算法、人工势场法等。然而,多机器人路径规划研究比单个机器人路径规划要复杂得多,必须考虑多机器人系统中机器人之间的避碰机制、机器人之间的相互协作机制、通信机制等问题。 1 多机器人路径规划方法单个机器人的路径规划是找出从起始点至终点的一条最短无碰路径。多个机器人的路径规划侧重考虑整个系统的最优路径,如系统的总耗时间最少路径或是系统总路径最短等。从目前国内外的研究来看,在规划多机器人路径时,更多考虑的是多机器人之间的协调和合作式的路径规划。 目前国内外多机器人路径规划研究方法分为传统方法、智能优化方法和其他方法三大类。其中传统方法主要有基于图论的方法(如可视图法、自由空间法、栅格法、Voronoi 图法以及人工势场方法等);智能优化方法主要有遗传算法、蚁群算法、免疫算法、神经网络、强化学 习等;其他方法主要有动态规划、最优控制算法、模糊控制等。它们中的大部分都是从单个机器人路径规划方法扩展而来的。 1)传统方法多机器人路径规划传统方法的特点主要体现在基于图论的基础

基于路径规划的智能机器人控制实验

I SSN C N 1 0 - 0 2 - 3 4 9 / 5 6 实验技术与管理 第27卷第12期201年1 2月 1 1 2 0 4 T E x p e r i m e n t a l T e c h n o l o g ya n d Ma n a g e m e n t Vo l .27N o .12D e c .201 基于路径规划的智能机器人控制实验 张佳,陈杰,窦丽华 ( 北京理工大学自动化学院,北京1081) 摘 验教学平台。在此平台上设计并开发了分别适用于本科生及硕士研究生的系列实验 规划、全区域覆盖路径规划以及多机器人队形控制等项实验内容。该实验能够让学生接触到先进的智能机 器人增强学生对自动化专业的学习兴趣提高了学生的动手能力和创新能力。 关键词智能机器人路径规划全区域覆盖队形控制 文献标志码文章编号 要 : 针对自动化专业学生 , 以 P i o n e e r 3 A T 系列的机器人为对象 , 搭建了基于路径规划的智能机器人实 , , 包括基于模型的路径 3 , , : ; ; ; 中图分类号 : T P 2 4 2 3 3 : A : 1 0 0 2 4 9 5 6 ( 2 0 1 0 ) 1 2 0 0 4 4 0 4 I n t e l l i g e n t r o b o t c o n t r o l e x p e r i m e n t s b as e d o n p a t h p l a n n i n g Zha n g J i a , Ch e n J i e , D o uL i hua ( S c h o o l o f A u t o m r a t i za t i o n , B e i e j i n g I n s t i t u t e o f T e c h n o l o g y , B e i j i r n g 1 0 0 0 8 1 r , Ch i n a ) A b s t r a c t : A i e m t i n g a t s t r ud e n n n i T t m o t t t s o f au t o e m a t i za m t e i o n m a j o r i , t h p i s p a p e m r t ak e s r o b n o o t s o r o f P i o n e e n 3 A T S e r i n e e sas o b p j e c t t a n d m c o n s t r u c sa n i x n t e l l i m g e o b o t x p o e r o e i n n t t o e a c h n e g l a t f o r , b as e d o p a t h p l a n t n i g .Bas ud e d e o n t h i s l a f o r b , as e r n i s e o x f p e p t e i e swh i c ha p p i n t d t u n d r p g r adua t i e t s c t ud e n t sa n d g adua e s t e n t s r g s p c t i v e l l ya r o n e d e s t i g n e da d l o e i r e m d. I t t n c l ud e s m d e l b as e d r p a t h p l p a o n n i n g o m p l t e t e c n v e a g e p a t h p t l a n n i n a e d m u l t c i r e b o f t o r m a t i e o n e x n p i e n . h e e x p e r i m t o f f e sa n o r t u n y f o r s ud e t s t w o r kw i hadva n c d i n t t e l i g t r b K o o s . I t n ha c e ss t t ud e n i s i n t e r e s t s t o l e a r n au t o m a t i za t i o n m a j o r . A l s o , s t ud e n t s i n n o va t i o n a b i l i y o u l d e i m p r o v e d b y e t h e e x p e o r e n t p . e y w o r d s : i n t l l i g e n r b t ; a t h p l a n n i n g ; c o m p l e t e c o v e r a g e ; f o r m a t i o n 自动化技术是一门涉及学科较多、应用广泛的综 1 实验平台的搭(智械科技) 合性科学技术。实验教学是自动化专业教学过程中 [1] 非常重要的一环。随着目前机器人技术的不断发展, 本课程选用的机器人是美国先锋(P i o n e r 3A T ) 系列机器人[。该系列机器人是目前世界上最成熟的 4] 机器人控制实验已逐步进入各个高校。机器人教学对 于培养和提高学生的创新精神和动手能力具有极其重 轮式移动机器人研究平台之一。通常科研人员对此系 要的作用[。在自动化专业开设机器人控制实验课 2 ] 列机器人的开发与研究都在控制台程序上运行,但需 要对v M a 机器人技术应用接口a 有较 深的了解因此需要花费大量时间阅读繁多的程序代 熟悉研究环境。由于实验学时有限为了能让学生 在最短的时间内最大程度地掌握机器人的有关知识 首先搭建了一个简单实用的实验平台。该平台的建立 能使学生在最短时间内熟悉各种底层动作在实验课 程中掌握基础理论和系统深入的专门知识。 整个平台系统包括个功能模块用户操作管理 模块、通信模块、控制模块、数据分析处理模块和显示 程, 不仅可以让学生接触到国际先进的机器人们的眼界还可以让学生学习先进的控制方法 些方法运用于机器人的实际控制上 提高学生的创新能力和动手能力 域的继续发展奠定坚实的基础。为此 重点实验室项目中购买了数台机器人 , , 开阔他 并将这 A c t i e d i A r i , , ,扩展他们的思维 , 码, , [ 3 ] , 为将来在控制领 , , 本校在北京市 , 针对自动化专 , 业的教学内容及要求,开设了机器人控制实验,取得了 良好的教学效果。 5 : 收稿日期 : 2 0 0 9 1 2 2 1 修改日期 : 2 0 1 0 0 3 1 5 管理模块。各模块所组成的功能结构如图 们之间通过数据信号和控制信号联系在一起 个统一的整体。在控制模块中为学生的实验操作 1 所示,它 基金项目 : 北京市教育委员会共建重点实验室资助项目 (CSYS ,构成一 1 0 0 0 (7 0417) 作者简介 : 张佳 1 9 8 0 ) , 女 ,北京市人 , 硕士 ,实验师 , 研究方向为机器 [ 5 ] , 人控制、智能控制和图像处理.

多机器人路径规划研究方法

多机器人路径规划研究方法 张亚鸣雷小宇杨胜跃樊晓平瞿志华贾占朝 摘要:在查阅大量文献的基础上对多机器人路径规划的主要研究内容和研究现状进行了分析和总结,讨论了多机器人路径规划方法的评判标准,并阐述了研究遇到的瓶颈问题,展望了多机器人路径规划方法的发展趋势。 关键词:多机器人;路径规划;强化学习;评判准则 Abstract:This paper analyzed and concluded the main method and current research of the path planning research for multi robot.Then discussed the criterion of path planning research for multi robot based large of literature.Meanwhile,it expounded the bottleneck of the path planning research for multi robot,forecasted the future development of multi robot path planning. Key words:multi robot;path planning;reinforcement learning;evaluating criteria 近年来,分布式人工智能(DAI)成为人工智能研究的一个重要分支。DAI研究大致可以分为DPS(distributed problem solving)和MAS(multi agent system)两个方面。一些从事机器人学的研究人员受多智能体系统研究的启发,将智能体概念应用于多机器人系统的研究中,将单个机器人视做一个能独立执行特定任务的智能体,并把这种多机器人系统称为多智能体机器人系统(MARS)。因此,本文中多机器人系统等同于多智能体机器人系统。目前,多机器人系统已经成为学术界研究的热点,而路径规划研究又是其核心部分。 机器人路径规划问题可以建模为一个带约束的优化问题,其包括地理环境信息建模、路径规划、定位和避障等任务,它是移动机器人导航与控制的基础。单个移动机器人路径规划研究一直是机器人研究的重点,且已经有许多成果[1~3],例如在静态环境中常见的有连接图法、可视图法、切线图法、Voronoi图法、自由空间法、栅格法、拓扑法、链接图法、Dempster Shafer 证据理论建图等;动态环境中常见的有粒子群算法、免疫算法、遗传算法、神经网络、蚁群算法、模拟退火算法、人工势场法等。然而,多机器人路径规划

多机器人路径规划研究方法(一)

多机器人路径规划研究方法(一) 张亚鸣雷小宇杨胜跃樊晓平瞿志华贾占朝 摘要:在查阅大量文献的基础上对多机器人路径规划的主要研究内容和研究现状进行了分析和总结,讨论了多机器人路径规划方法的评判标准,并阐述了研究遇到的瓶颈问题,展望了多机器人路径规划方法的发展趋势。 关键词:多机器人;路径规划;强化学习;评判准则 e,itexpoundedthebottleneckofthepathplanningresearchfor, ; 近年来,分布式人工智能(DAI)成为人工智能研究的一个重要分支。DAI 研究大致可以分为DPS(distributedproblemsolving)和MAS ()两个方面。一些从事机器人学的研究人员受多智能体系统研究的启发,将智能体概念应用于多机器人系统的研究中,将单个机器人视做一个能独立执行特定任务的智能体,并把这种多机器人系统称为多智能体机器人系统(MARS)。因此,本文中多机器人系统等同于多智能体机器人系统。目前,多机器人系统已经成为学术

界研究的热点,而路径规划研究又是其核心部分。 机器人路径规划问题可以建模为一个带约束的优化问题,其包括地理环境信息建模、路径规划、定位和避障等任务,它是移动机器人导航与控制的基础。单个移动机器人路径规划研究一直是机器人研究的重点,且已经有许多成果1~3],例如在静态环境中常见的有连接图法、可视图法、切线图法、Voronoi图法、自由空间法、栅格法、拓扑法、链接图法、证据理论建图等;动态环境中常见的有粒子群算法、免疫算法、遗传算法、神经网络、蚁群算法、模拟退火算法、人工势场法等。然而,多机器人路径规划研究比单个机器人路径规划要复杂得多,必须考虑多机器人系统中机器人之间的避碰机制、机器人之间的相互协作机制、通信机制等问题。 1多机器人路径规划方法 单个机器人的路径规划是找出从起始点至终点的一条最短无碰路径。多个机器人的路径规划侧重考虑整个系统的最优路径,如系统的总耗时间最少路径或是系统总路径最短等。从目前国内外的研究来看,在规划多机器人路径时,更多考虑的是多机器人之间的协调和合作式的路径规划。 目前国内外多机器人路径规划研究方法分为传统方法、智能优化方法和其他方法三大类。其中传统方法主要有基于图论的方法(如可视图法、自由空间法、栅格法、Voronoi图法以及人工势场方法等);智能优化方法主要有遗传算法、蚁群算法、免疫算法、神经网络、强化学

智能机器人避障路径规划算法研究

龙源期刊网 https://www.doczj.com/doc/7115975941.html, 智能机器人避障路径规划算法研究 作者:张永妮 来源:《中小企业管理与科技·上旬刊》2016年第02期 摘要:智能机器人只有具备自主移动能力才能实现应用价值。路径规划用于决策机器人 在环境中如何行走的问题,是实现机器人智能化的关键技术。为提高机器人路径规划,对未知环境的实时性、适应性和优化性要求越来越高。自主移动机器人是集环境感知、动态策略与规划、行为控制与执行等多功能于一体的综合系统。近几年,移动机器人技术在工业、农业、医学、航天航空等许多领域发挥了重要作用。其中智能避障更是研究领域的难点和热点,智能避障是能够根据采集障碍物的状体信息,按照一定的方法进行有效的避障,最后到达终点。本文主要介绍了动态窗口和Bug2的避障算法和研究与仿真。实现这两种避障算法主要基于Matlab 等语言编程开发,实现对移动机器人避障算法的仿真。Matlab功能强大、编程简单、适用广。 最后,验证基于Bug算法的几种路径规划方法,将避障实时性,环境的适应性、规划路径的优化性作为算法性能指标,进行仿真实验与对比实验分析。结果验证了算法的有效性。 关键词:智能机器人;避障;MATLAB仿真;路径规划 1 绪论 智能机器人避障算法的研究对于推进机器人领域的应用和发展具有重要的意义。随着计算机技术、传感器技术、控制技术的发展,智能机器人的避障技术已经取得了丰硕的研究成果,其应用领域不断的扩大,应用复杂程度也越来越高,因此对其关键技术提出了更高要求,相应的方法也更加成熟。 本文通过查阅文献资料,对目前智能机器人的发展动态有了一定了解。对现阶段机器人避障的一些常用方法做了研究,然后设计了不同算法在未知环境下的避障仿真实验来验证本文所设计的算法的可行性。路径规划要求机器人能够在较短的时间内,感知到范围尽可能大的区域,从而找到最近的路径使机器人能够沿着最优路径运动到终点,并避开障碍物。 2 基于动态窗口的避障算法及仿真 2.1 概述 机器人局部路径规划的方法很多,动态窗口法就是其中的一种,其主要是在速度(v,w)空间中采样多组速度,并模拟机器人在这些速度下一定时间内的轨迹。在得到多组轨迹以后,对这些轨迹进行评价,选取最优轨迹所对应的速度来驱动机器人运动。该算法突出点在于动态窗口这个名词,它的含义是依据移动机器人的及速度性能限定速度采样空间在一个可行的动态图范围内。

相关主题
文本预览
相关文档 最新文档