外文翻译
- 格式:doc
- 大小:2.12 MB
- 文档页数:14
附件1:外文资料翻译译文
脑情感学习型智能控制器的全方向三轮式机器人的运动控制摘要:一个用于控制一个全方位的机器人的运动的智能控制器,该控制器是
基于大脑情感学习的算法,这是从哺乳动物大脑的边缘系统的计算模型获得的的
启发。大脑情感学习型智能控制器,线性二次调节器(LQR)控制相媲美,二次
奖励(BELBIC)用于在一个全方位的机器人。通过仿真和实验实施BELBIC改
善控制系统性能的结果。结果表明,该方法可以用于更有效的实际问题。优化控
制工作或其他目标,如能量最小化,更多的关注构成了该方法的其他优点。
关键词-大脑情感学习型智能控制器(BELBIC);情感学习;线性二次调节
器(LQR);MIMO系统;全方位的机器人。
介绍
随着人工智能和学习方法的发展,这些方法的应用被用于各个领域,像控制,机器人学,政策制定等其他领域。数据驱动和基于规则的方法在近几年比以决策
为基础的方法应用更广泛,这也是真正的全向移动机器人。机器人的主要基本运
动控制方法已经被应用于经典控制器,像PID控制使用了该系统的数学方向和逆
向运动学。但是最近模糊控制器,甚至神经网络已经非常频繁的使用用来代替以
前的方法[1-4]。由于机器人在现实世界中面临的不确定性,预先设计的控制器可
能会有一些缺点,这些不明朗的因素,包括环境中的波动,机器人的目标和能力。因此,我们鼓励对使用控制器的学习,使它们更好的适应现实世界,在本文中,
我们研究使用脑情感学习型智能控制器 (BEL-BIC)的机器人的运动控制。对于
第一部分,我们通过LoLiMoT算法[5]评估我们的环境仿真模型,然后,我们会
拥有对一个真正的机器人控制器应用的评价。
线性二次调节器(LQR)是一个强大的最优控制器,但是新的问题是,它面
临着不确定性。LQR的主要缺点出现在它结合观测器和LQR控制时[6],像LTR
及其扩展,永远不会完全的返回自身的坚固性,转换到自适应学习的方法是不可
避免的,结合周围的一些基于最优控制方法的研究通过最近的学习方法[7][8]。
另一个最佳方法是B ang-Bang及其它的扩展,这是一种在全向移动控制机器人中的流行方法[9][10],这种方法的目的是从一个给定的初始状态到一个理想的最终状态寻找最短时间路径[11]。
我们的机械式团队制造的机器人之间的分歧是不可避免的。机器人会在组装方式上有所不同,这导致很难使用需要精确模型的方法。另一方面,模型在环境变量中的不确定性是不可预测和不可嵌入的,通过添加复杂的确切动态模型来找出确切的模型在这种系统的情况下是不可能的。这也是直接使用BELBIC控制器的原因,这些机器人的运动(它也被用在一些其他应用程序之前[12]-[16])。这样做的主要目的是机器人一直跟踪设定点,而且我们增加了减少控制工作的条件约束,因此,控制并不会廉价,这意味着控制工作的重要。因此,系统将尝试消耗更少的能源来衡量控制的成果,这也是最优控制方法的目标之一[6]。换句话说,把能源消耗控制在最小除了复杂的军事演习。这是文献中最常见的移动机器人的宗旨[9][10][18],也是我们的宗旨.然后,他不仅要达到目标,而且认为能源和效率不能选择较长的道理(或者说路径消耗更多的能源),这意味着机器人将更快的移动并且电池将更早的消耗一空,此外,尖锐的军事演习将导致更高的电池消耗和本地化的不确定性的增加,这意味着优先考虑平滑悠长的路线,而不选择短而有急转弯的路线。
对于这种情况,我们从最优控制功能的成本获得了一种情感功能的灵感,情感信号被定义为随着时间推移的现场的误差和控制误差的积分,因此,产生了一个信号展示压力值,我们的目标是尽量减少这种压力,使用此功能时,我们获得了使用性能BELBIC提到的测试床。
本文的其他部分组织如下,第二节解释三轮机器人和他们的制作。第三节,我们有一个BELBIC和其底层结构的解释。第四节通过BELBIC做出控制机器人的模拟结果。第五节演示使用BLEBIC的真正的机器人。最后,第六节为本文的结论。
Fig. 1. One of the robots that are used for the experiments. Each robot hasthree wheels and each of the
wheels has a separate brushless motor.
Fig. 2. Main electronic boards that are mounted on the robots.
Fig. 3. Boards mounted on the robots for providing wireless communication.
二三轮机器人
三轮机器人是机器人的一种,使用在很多领域。他们有三个全向移动车轮能随时向任何方向移动(换句话说,它们是全向移动机器人)。三轮机器人要比四轮机器人要有优势,因为它具有较小的规模和更少的设备要求,使用这类机器人面临的主要问题是机器人的运动控制,如何使机器人运动到理想的位置,图4显示了一个三轮机器人,三个轮子角度和方向的示意图(机器人如图1,机器人主板如图2,机器人无线控制模块如图3)。
车轮的速度和位置的变化值和机器人的角度之间的关系根据固定的坐标标注在(1)和(2)
在(1)中,变量X和Y,并指定位置ψ和机器人固定的协调方向,R为车轮半径,Li
代表轮子i到机器人中心的距离,δ是机器人的运动方向和第一方向轮之间的角度(详细注释如图4)。最后,θi指定为轮子i的速度。
Fig. 4. Schematic model of three-wheel robot. L i is the distance from the Wheel i to the center of the robot and δ is the angle between the direction of the robot and direction of the first wheel.
正弦函数M矩阵的存在时模型变得非线性,此速度之间的关系的前提是没有真正的机器人电动机,而且不同的电动机也有不同的确切行为,另一方面,很多因素都没有在模型中考虑,例如,车轮在地板上打滑(虽然我们没有确定地板上运动的方程),视觉系统相对于控制器的反馈频率具有延迟和较低的相机帧数。另一方面,相机的输出应该同步虽然不精确的知道相机的距离和存在不确定性。另外一些增加不确定性的其他因素如,不同规格的电机,车轮和中心机器人的距离,机器人的重量分布不平均,主轮上的外围滚筒和打滑的可能性都不是容易设计的。在一般情况下,我们已经跳过了环境中的许多影响因素,它们不会在建模中被考虑,因为所有这些,只会使建模过程更加复杂。电机输入三个脉宽调制(PWM)的目的是控制机机器人的位置和方向,由于每个车轮的运动影响到其他车轮和整个机器人的运动,因此,产生的运动力和电压之间的关系变的十分重要。
三 BELBIC
Moren和Balkenius提出了学习自哺乳动物脑的情绪学习的计算机模型,这也是BELBIC的基础[12][13],在2004年Lucas引入了BELBIC作为控制器,并运用情绪控制的