当前位置:文档之家› 机器人双目视觉定位技术研究

机器人双目视觉定位技术研究

机器人双目视觉定位技术研究
机器人双目视觉定位技术研究

西安电子科技大学

硕士学位论文

机器人双目视觉定位技术研究

姓名:林琳

申请学位级别:硕士

专业:机械电子工程

指导教师:牛海军

20090101

机器人视觉物体定位方法

机器人视觉物体定位方法 本次设计的题目是机器人视觉物体定位。伴随社会发展,机器人的利用越来越普及,出现了多种多样的智能机器人,由此也引发了对机器视觉的研究热潮。文章首先介绍了机器视觉的发展历程,并详细说明了各阶段的特点。接着概述了机器视觉技术的原理,深入剖析了主流视觉物体定位方法。然后介绍了机器人视觉物体定位方法常用的几种应用。最后介绍了几种新颖的视觉物体定位方法,并猜想机器人视觉物体定位技术未来发展方向。 关键词:机器视觉 SLAM技术单目视觉双目视觉多目视觉 第一章:绪论 1.1选题的背景及意义 在我国持续爆发的2019新型冠状病毒(即2019-nCoV)事件中,自动化食品仓储配送系统服务包括机器人、无人驾驶、无人机等再次成为讨论的焦点。配送机器人如何实现自动取货送货?无人驾驶汽车是怎么躲避行人?无人机巡航中怎么确定物体之间的距离?当我们谈到相关的话题时,机器视觉定位是无论如何也绕不开的问题。 自被誉为“机器人之父”的恩格尔伯格先生1959年发明第一台机器人以来,科学家一直把对机器人的研究作为研究的重点方向。传统的机器人缺乏环境感知能力和自动应变能力,仅仅只能在严格的预定义的环境中完成一些预定义和指令下的动作,应用非常有限局限。随着机器人逐渐走进人们的生产和生活中,人们也对机器人提出了更高的要求,希望实现在生产加工中对物体的自动加工、对自身运动轨迹实时的随动检测,节省对其运动轨迹的预先编程,提高生产效率。要达到这些要求,必须同时满足图像信息的获取、采集、处理和输出,这就是本文的研究重点:机器人视觉物体定位方法。

机器人视觉物体定位系统的设计和研发是为了更好地为工业机器人服务,它的本质是发挥摄像机定位以及跟踪性功能,很多企业在自身生产环节依赖于机器人,生产效率明显得到改善。然而很多的机器人是半自动的工作模式,只有在人工操控的指引下才能完成工作任务,这样的机器人实用性很差,无法彻底解放人工,实现自动化操作。为了提高机器人接收外界信息、感知外界信息的能力,进一步提高机器人的工作效率,保障工业生产的精度和质量,在以往的机器人系统中新增全新的计算机图像视觉获取系统,通过视觉图像获取系统中所捕捉的图像和外界信息,对捕捉的图像信息进行处理和分析识别,继而让机器人能够识别外界信息,然后再全面分析图像的基础上完成后续的重建和精准化计算,通过一系列的重建以及精准化的计算全面应用机器人控制柜通讯等等设备,掌控全面的工作,实现机器人对外界信息的跟踪和定位。 1.2国内外研究现状 国外研究现状 国外最先开始视觉物体定位技术的研究,应用领域也相对广泛,并且占据绝对的技术优势,其主要涉及机器人移动导航、三维立体测量、虚拟现实VR技术等。 20世纪60年代,美国mit的robert研究人员提出三维景物分析,标志着立体视觉和影像技术的结合点而诞生。立体视觉在此后20年的时间迅速地发展成为一门新的影像技术学科。到70年代时,以marr为主要代表的一批视觉物体定位方法研究学者已经整理和发展出了一整套关于视觉计算的理论基础。到80 年代后,大量利用空间几何研究双目立体视觉的学者提出了一系列理论与实际成果。 卡内基梅隆大学的Tomasi 和Kanade 等人对立体视觉的研究建立在摄像机为正交投影模型的假设下,分解出了三维结构和相机运行,成功研究出了基于图像的三维重建技术。但是,这项技术存在明显的缺点,由于假设相机为正交投影模型,而这个假设仅仅在物体深度远远大于物体尺寸时才是合理假设。美国

基于机器视觉的工件识别和定位文献综述

基于机器视觉的工件识别和定位文献综述 1.前言 1.1工业机器人的现状与发展趋势 机器人作为一种最典型的应用范围广、技术附加值高的数字控制装备,在现代先进生产制造业中发挥的作用越来越重要,机器人技术的发展将会对未来生产和社会发展起到强有力的推动作用。《2l 世纪日本创建机器人社会技术发展战略报告》指出,“机器人技术与信息技术一样,在强化产业竞争力方面是极为重要的战略高技术领域。培育未来机器人产业是支撑2l 世纪日本产业竞争力的产业战略之一,具有非常重要的意义。” 研发工业机器人的初衷是为了使工人能够从单调重复作业、危险恶劣环境作业中解脱出来,但近些年来,工厂和企业引进工业机器人的主要目的则更多地是为了提高生产效率和保证产品质量。因为机器人的使用寿命很长,大都在10 年以上,并且可以全天后不间断的保持连续、高效地工作状态,因此被广泛应用于各行各业,主要进行焊接、装配、搬运、加工、喷涂、码垛等复杂作业。伴随着工业机器人研究技术的成熟和现代制造业对自动生产的需要,工业机器人越来越被广泛的应用到现代化的生产中。 现在机器人的价格相比过去已经下降很多,并且以后还会继续下降,但目前全世界范围的劳动力成本都有所上涨,个别国家和地区劳动力成本又很高,这就给工业机器人的需求提供了广阔的市场空间,工业机器人销量的保持着较快速度的增长。工业机器人在生产中主要有机器人工作单元和机器人工作生产线这两种应用方式,并且在国外,机器人工作生产线已经成为工业机器人主要的应用方式。以机器人为核心的自动化生产线适应了现代制造业多品种、少批量的柔性生产发展方向,具有广阔的市场发展前景和强劲生命力,已开发出多种面向汽车、电气机械等行业的自动化成套装备和生产线产品。在发达国家,机器人自动化生产线已经应用到了各行各业,并且已经形成一个庞大的产业链。像日本的FANUC、MOTOMAN,瑞典的ABB、德国的KUKA、意大利的COMAU 等都是国际上知名的被广泛用于自动化生产线的工业机器人。这些产品代表着当今世界工业机器人的最高水平。 我国的工业机器人前期发展比较缓慢。当将被研发列入国家有关计划后,发展速度就明显加快。特别是在每次国家的五年规划和“863”计划的重点支持下,我国机器人技术的研究取得了重大发展。在机器人基础技术和关键技术方面都取得了巨大进展,科技成果已经在实际工作中得到转化。以沈阳新松机器人为代表的国内机器人自主品牌已迅速崛起并逐步缩小与国际品牌的技术差距。 机器人涉及到多学科的交叉融合,涉及到机械、电子、计算机、通讯、控制等多个方面。在现代制造业中,伴随着工业机器人应用范围的扩大和机器人技术的发展,机器人的自动化、智能化和网络化的程度也越来越高,所能实现的功能也越来越多,性能越来越好。机器人技术的内涵已变为“灵活应用机器人技术的、具有实在动作功能的智能化系统。”目前,工业机器人技术正在向智能机器和智能系统的方向发展,其发展趋势主要为:结构的模块化和可重构化;控制技术的开放化、PC 化和网络化;伺服驱动技术的数字化和分散化;多传感器融合技术的实用化;工作环境设计的优化和作业的柔性化以及系统的网络化和智能化等方面。 1.2机器视觉在工业机器人中的应用 工业机器人是FMS(柔性加工)加工单元的主要组成部分,它的灵活性和柔性使其成为自动化物流系统中必不可少的设备,主要用于物料、工件的装卸、分捡和贮运。目前在全世界有数以百万的各种类型的工业机器人应用在机械制造、零件加工和装配及运输等领域,

双目视觉成像原理

双目视觉成像原理 1.引言 双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。融合两只眼睛获得的图像并观察它们之间的差别,使我们可以获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来,这个差别,我们称作视差(Disparity)图。 双目立体视觉测量方法具有效率高、精度合适、系统结构简单、成本低等优点,非常适合于制造现场的在线、非接触产品检测和质量控制。对运动物体(包括动物和人体形体)测量中,由于图像获取是在瞬间完成的,因此立体视觉方法是一种更有效的测量方法。双目立体视觉系统是计算机视觉的关键技术之一,获取空间三维场景的距离信息也是计算机视觉研究中最基础的内容。 2.双目立体视觉系统 立体视觉系统由左右两部摄像机组成。如图一所示,图中分别以下标L和r标注左、右摄像机的相应参数。世界空间中一点A(X,Y,Z)在左右摄像机的成像面C L和C R上的像点分别为al(ul,vl)和ar(ur,vr)。这两个像点是世界空间中同一个对象点A的像,称为“共轭点”。知道了这两个共轭像点,分别作它们与各自相机的光心Ol和Or的连线,即投影线alOl和arOr,它们的交点即为世界空间中的对象点A(X,Y,Z)。这就是立体视觉的基本原理。 图1:立体视觉系统 3.双目立体视觉相关基本理论说明 3.1 双目立体视觉原理 双目立体视觉三维测量是基于视差原理,图2所示为简单的平视双目立体成像原理图,两摄像机的投影中心的连线的距离,即基线距为b。摄像机坐标系的原点在摄像机镜头的光心处,坐标系如图2所示。事实上摄像机的成像平面在镜头的光心后,图2中将左右成像平面绘制在镜头的光心前f处,这个虚拟的图像平面坐标系O1uv的u轴和v轴与和摄像机坐标系的x轴和y轴方向一致,这样可以简化计算过程。左右图像坐

双目视觉成像原理讲解学习

双目视觉成像原理

双目视觉成像原理 1.引言 双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。融合两只眼睛获得的图像并观察它们之间的差别,使我们可以获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来,这个差别,我们称作视差(Disparity)图。 双目立体视觉测量方法具有效率高、精度合适、系统结构简单、成本低等优点,非常适合于制造现场的在线、非接触产品检测和质量控制。对运动物体(包括动物和人体形体)测量中,由于图像获取是在瞬间完成的,因此立体视觉方法是一种更有效的测量方法。双目立体视觉系统是计算机视觉的关键技术之一,获取空间三维场景的距离信息也是计算机视觉研究中最基础的内容。2.双目立体视觉系统 立体视觉系统由左右两部摄像机组成。如图一所示,图中分别以下标L和r标注左、右摄像机的相应参数。世界空间中一点A(X,Y,Z)在左右摄像机的成像面C L和C R上的像点分别为al(ul,vl)和ar(ur,vr)。这两个像点是世界空间中同一个对象点A的像,称为“共轭点”。知道了这两个共轭像点,分别作它们与各自相机的光心Ol和Or的连线,即投影线alOl和arOr,它们的交点即为世界空间中的对象点A(X,Y,Z)。这就是立体视觉的基本原理。

图1:立体视觉系统 3.双目立体视觉相关基本理论说明 3.1 双目立体视觉原理 双目立体视觉三维测量是基于视差原理,图2所示为简单的平视双目 立体成像原理图,两摄像机的投影中心的连线的距离,即基线距为b 。摄像机坐标系的原点在摄像机镜头的光心处,坐标系如图2所示。事实上摄像机的成像平面在镜头的光心后,图2中将左右成像平面绘制在镜头的光心前f 处,这个虚拟的图像平面坐标系O1uv 的u 轴和v 轴与和摄像机坐标系的x 轴和y 轴方向一致,这样可以简化计算过程。左右图像坐标系的原点在摄像机光轴与平面的交点O1和O2。空间中某点P 在左图像和右图像中相应的坐标分别为P1(u1,v1)和P2(u2,v2)。假定两摄像机的图像在同一个平面上,则点P 图像坐标的Y 坐标相同,即v1=v2。由三角几何关系得到: c c 1z x f u = c c 2z )b -x (f u = v 1 c c 21z y f v v ==

移动机器人视觉定位设计方案

移动机器人视觉定位设计方案 运动视觉研究的是如何从变化场景的一系列不同时刻的图像中提取出有关场景中的目标的形状、位置和运动信息,将之应用于移动机器人的导航与定位。首先要估计出目标的空间位置和运动信息,从而为移动机器人车体的导航与定位提供关键前提。 视觉信息的获取主要是通过单视觉方式和多视觉方式。单视觉方式结构简单,避免了视觉数据融合,易于实现实时监测。如果利用目标物体的几何形状模型,在目标上取3 个以上的特征点也能够获取目标的位置等信息。此方法须保证该组特征点在不同坐标系下的位置关系一致,而对于一般的双目视觉系统,坐标的计算误差往往会破坏这种关系。 采用在机器人上安装车载摄像机这种局部视觉定位方式,本文对移动机器人的运动视觉定位方法进行了研究。该方法的实现分为两部分:首先采用移动机器人视觉系统求出目标质心特征点的位置时间序列,从而将对被跟踪目标的跟踪转化为对其质心的跟踪;然后通过推广卡尔曼滤波方法估计目标的空间位置和运动参数。 1 目标成像的几何模型 移动机器人视觉系统的坐标关系如图1 所示。 其中O-X Y Z 为世界坐标系;O c - X cY cZ c 为摄像机坐标系。其中O c 为摄像机的光心,X 轴、Y 轴分别与X c 轴、Y c 轴和图像的x ,y 轴平行,Z c 为摄像机的光轴,它与图像平面垂直。光轴与图像平面的交点O 1 为图像坐标系的原点。O cO 1 为摄像机的焦距f 。 图1 移动机器人视觉系统的坐标关系 不考虑透镜畸变,则由透视投影成像模型为:

式中,Z′= [u,v ]T 为目标特征点P 在图像坐标系的二维坐标值;(X ,Y ,Z )为P 点在世界坐标系的坐标;(X c0,Y c0,Z c0)为摄像机的光心在世界坐标系的坐标;dx ,dy 为摄像机的每一个像素分别在x 轴与y 轴方向采样的量化因子;u0,v 0 分别为摄像机的图像中心O 1 在x 轴与y 轴方向采样时的位置偏移量。通过式(1)即可实现点P 位置在图像坐标系和世界坐标系的变换。 2 图像目标识别与定位跟踪 2.1 目标获取 目标的获取即在摄像机采集的图像中搜索是否有特定目标,并提取目标区域,给出目标在图像中的位置特征点。 由于机器人控制实时性的需要,过于耗时的复杂算法是不适用的,因此以颜色信息为目标特征实现目标的获取。本文采用了HS I 模型, 3 个分量中,I 是受光照影响较大的分量。所以,在用颜色特征识别目标时,减少亮度特征I 的权值,主要以H 和S 作为判定的主要特征,从而可以提高颜色特征识别的鲁棒性。 考虑到连通性,本文利用捕获图像的像素及其八连通区域的平均HS 特征向量与目标像素的HS特征向量差的模是否满足一定的阈值条件来判别像素的相似性;同时采用中心连接区域增长法进行区域增长从而确定目标区域。图2 给出了目标区域分割的算法流程。

基于机器视觉的工业机器人定位系统

基于机器视觉的工业机器人定位系统 基于机器视觉的工业机器人定位系统 类别:传感与控制 摘要:建立了一个主动机器视觉定位系统,用于工业机器人对零件工位的精确定位。采用基于区域的匹配和形状特征识别相结合的图像处理方法,该方法经过阈值和形状判据,识别出物体特征。经实验验证,该方法能够快速准确地得到物体的边界和质心,进行数据识别和计算,再结合机器人运动学原理控制机器人实时运动以消除此误差,满足工业机器人自定位的要求。 1.引言目前工业机器人仅能在严格定义的结构化环境中执行预定指令动作,缺乏对环境的感知与应变能力,这极大地限制了机器人的应用。利用机器人的视觉控制,不需要预先对工业机器人的运动轨迹进行示教或离线编程,可节约大量的编程时间,提高生产效率和加工质量。Hagger 等人提出通过基于机器人末端与目标物体之间的误差进行视觉反馈的方法;Mezouar 等人提出通过图像空间的路径规划和基于图像的控制方法。国内这方面主要应用于焊接机器人对焊缝的跟踪。本文利用基于位置的视觉伺服思想,以六自由度垂直关节型喷涂机器人为载体,提出一种基于机器视觉的工业机器人自定位控制方法,解决了机器人末端实际位置与期望位置相距较远的问题,改善了喷涂机器人的定位精度。 2.视觉定位系统的组成机器人视觉定位系统构成如图 1 所示,在关节型机器人末端安装喷涂工具、单个摄像机,使工件能完全出现在摄像机的图像中。系统包括摄像机系统和控制系统:(1)摄像机系统:由单个摄像机和计算机(包括图像采集卡)组成,负责视觉图像的采集和机器视觉算法;(2)控制系统:由计算机和控制箱组成,用来控制机器人末端的实际位置;经 CCD 摄像机对工作区进行拍摄,计算机通过本文使用的图像识别方法,提取跟踪特征,进行数据识别和计算,通过逆运动学求解得到机器人各关节位置误差值,最后控制高精度的末端执行机构,调整机器人的位姿。 图1 喷涂机器人视觉定位系统组成 3.视觉定位系统工作原理 3.1 视觉定位系统的工作原理使用 CCD 摄像机和1394 系列采集卡,将视频信号输入计算机,并对其快速处理。首先选取被跟踪物体的局部图像,该步骤相当于离线学习的过程,在图像中建立坐标系以及训练系统寻找跟踪物。学习结束后,图像卡不停地采集图像,提取跟踪特征,进行数据识别和计算,通过逆运动学求解得到机器人各关节位置给定值,最后控制高精度的末端执行机构,调整机器人的位姿。工作流程如图2 所示。图 2 视觉定位系统软件流程图 3.2 基于区域的匹配本文采用的就是基于区域的相关匹配方法。它是把一幅图像中的某一点的灰度领域作为模板,在另一幅图像中搜索具有相同(或相似)灰度值分布的对应点领域,从而实现两幅图像的匹配。在基于区域相关的算法中,要匹配的元素是固定尺寸的图像窗口,相似准则是两幅图像中窗口间的相关性度量。当搜索区域中的元素使相似性准则最大化时,则认为元素是匹配的。定义P (i, j) P 是模板图像中一点,取以P (i, j) P 为中心的某一邻域作为相关窗口K ,大小为(2w +1),假设K 在原始图中,水

双目立体视觉的水下应用

双目立体视觉的水下应用 从图像预处理、相机标定、立体匹配三个方面论述了双目视觉在水下场景的应用,比较了与空气环境中应用的不同,对水下双目视觉发展趋势做了分析。 标签:水下双目视觉;相机标定;立体匹配 Abstract:This paper discusses the application of binocular vision in underwater scene from three aspects of image preprocessing,camera calibration and stereo matching,compares the application of binocular vision with that in air environment,and analyzes the development trend of underwater binocular vision. Keywords:underwater binocular vision;camera calibration;stereo matching 引言 双目立体视觉技术利用视差理论恢复像素的深度信息和三维坐标,通过获取左右两个视角下同时采集的两幅图像恢复三维场景信息,还原真实的三维世界,为导航提供目标的位置信息描述,是被动式视觉测量技术的一种。作为计算机视觉的一个重要分支,双目立体视觉技术模型简洁,运算高效,有着广阔的应用前景。而随着海洋科学技术的发展和人类对海洋资源探索的逐渐深入,双目视觉技术逐渐被应用到海洋探测,在对水下目标的监控、海底地形测绘、海流测量、水下军事设施的探测和侦查等方面都有着广泛的应用。 双目立体视觉系统模拟人眼,通过三角测量原理来获取图像的视差,进而得到目标三维信息,一般由以下几个功能模块组成:图像采集,相机标定,立体匹配,三维重建。常规的双目视觉大多是在单一介质的空气中,而由于水下环境的特殊性,往往存在光的散射,吸收效应等不利因素的干扰,相关技术方法也应随环境作适应性调整。本文从图像处理,相机标定,立体匹配这三个方面在水下场景的应用做了论述,阐明了与单一空气介质环境中的不同,并对水下双目立体视觉技术的发展做了展望。 1 成像模型 双目立体视觉用到的模型一般是线性的针孔模型,该模型是双目立体视觉中成像的基本模型,将相机理想化,并把空间点投影视为中心,投影未考虑镜头畸变和环境等其他因素,所以也叫线性摄像机模型。而水下成像模型则是考虑到折射的影响,对此做相应补偿和修正。 在双目立体视觉系统中,为了研究空间点和像点的投影关系,通常会用到4个坐标系:世界坐标系OW-XWYWXW、相机坐标系O-xyz、图像物理坐标系O-XY和图像像素坐标系Of-uv。

双目立体视觉技术的实现及其进展

双目立体视觉技术的实现及其进展 摘要:阐述了双目立体视觉技术在国内外应用的最新动态及其优越性。指出双目体视技术的实现分为图像获取、摄像机标定、特片提取、立体匹配和三维重建几个步骤,详细分析了各个步骤的技术特点、存在的问题和解决方案,并对双目体视技术的发展做了展望。 关键词:双目立体视觉计算机视觉立体匹配摄像机标定特征提取 双目立体视觉是计算机视觉的一个重要分支,即由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,通过计算空间点在两幅国像中的视差,获得该点的三维坐标值。80年代美国麻省理工学院人工智能实验室的Marr提出了一种视觉计算理论并应用在双睛匹配上,使两张有视差的平面图产生在深度的立体图形,奠定了双目立体视觉发展理论基础。相比其他类的体视方法,如透镜板三维成像、投影式三维显示、全息照相术等,双目本视直接模拟人类双眼处理景物的方式,可靠简便,在许多领域均极具应用价值,如微操作系统的位姿检测与控制、机器人导航与航测、三维测量学及虚拟现实等。 1 双目体视的技术特点 双目标视技术的实现可分为以下步骤:图像获取、摄像机标定、特征提取、图像匹配和三维重建,下面依次介绍各个步骤的实现方法和技术特点。 1.1 图像获取 双目体视的图像获取是由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,获取立体图像对。其针孔模型如图1。假定摄像机C1与C2的角距和内部参数都相等,两摄像机的光轴互相平行,二维成像平面X1O1Y1和X2O2Y2重合,P1与P2分别是空间点P在C1与C2上的成像点。但一般情况下,针孔模型两个摄像机的内部参数不可能完成相同,摄像机安装时无法看到光轴和成像平面,故实际中难以应用。 上海交大在理论上对会摄式双目体视系统的测量精度与系统结构参数之间的关系作了详尽分析,并通过试验指出,对某一特定点进行三角测量。该点测量误差与两CCD光轴夹角是一复杂的函数关系;若两摄像头光轴夹角一定,则被测坐标与摄像头坐标系之间距离越大,测量得到点距离的误差就越大。在满足测量范围的前提下,应选择两CCD之间夹角在50℃~80℃之间。 1.2 摄像机的标定 对双目体视而言,CCD摄像机、数码相机是利用计算机技术对物理世界进行重建前的基本测量工具,对它们的标定是实现立体视觉基本而又关键的一步。通常先采用单摄像机的标定方法,分别得到两个摄像机的内、外参数;再通过同一世界坐标中的一组定标点来建立两个摄像机之间的位置关系。目前常用的单摄像机标定方法主要有: (1)摄影测量学的传统设备标定法。利用至少17个参数描述摄像机与三维物体空间的结束关系,计算量非常大。 (2)直接线性变换性。涉及的参数少、便于计算。 (3)透视变换短阵法。从透视变换的角度来建立摄像机的成像模型,无需初始值,可进行实时计算。 (4)相机标定的两步法。首先采用透视短阵变换的方法求解线性系统的摄像机参数,再以求得的参数为初始值,考虑畸变因素,利用最优化方法求得非线性解,标定精度较高。 (5)双平面标定法。 在双摄像机标定中,需要精确的外部参数。由于结构配置很难准确,两个摄像机的距离

基于双目立体视觉及机械手精确定位系统

基于双目立体视觉的机械手精确定位系统 双目立体视觉 导读:摘要:在机械手执行任务的过程中,控制机械手定位到目标位置是一个非常关键的问题。本文提出了一种基于双目立体视觉的机械手自动定位系统设计方法,由双目立体视觉系统根据目标物的二维图像计算出目标物的三维坐... 摘要:在机械手执行任务的过程中,控制机械手定位到目标位置是一个非常关键的问题。本文提出了一种基于双目立体视觉的机械手自动定位系统设计方法,由双目立体视觉系统根据目标物的二维图像计算出目标物的三维坐标,然后根据此三维坐标去控制机械手自动运动到目标位置。实验表明该系统能提高排爆机器人机械手的易操作性,大大提高了机械手的性能。 关键词:双目立体视觉, 标定, 运动控制 The target positioning system of a manipulator based on binocular st ereo vision Wang Wei , LuoFei, Jiang Liangzhong, Qi Hengnian Abstract: Target Positioning is very important for a manipulator, whic h implies to control the manipulator moving to the position of a ta rget. This paper proposes the design of an automatically target posit ioning system based on binocular stereo vision technical, where the 3 D coordinate of a target is acquired through the binocular stereo vi sion subsystem, then the manipulator will be controlled to perform au tomatically target positioning according to the 3D coordinate acquired. The experiment result showed that this system have extended the abi lity of a manipulator greatly. Key Words: Binocular stereo vision, Camera calibration, Motion control 机器人技术是涉及机械学、传感器技术、驱动技术、控制技术、通信技术和计算机技术的一门综合性高新技术,既是光机电一体化的重要基础,又是光机电一体化技术的典型代表,它是多学科科技革命的必然结果。近年来,随着机器人研究的不断发展,机器人技术开始源源不断地向人类活动的各个领域渗透,结合这些领域的应用特点,各种各样的具有不同功能的机器人被研制出来,并且在不同的应用领域都得到了广泛的应用。例如,美国 Wolstenholme 机器公司生产的MR5和MR7排爆机器人,能用于户内及户外环境、适应各种地形活动,完成排爆功能,已被美国军方广泛使用。排爆机器人是特种机器人的一种,主要用于在事发现场排除处理爆炸物及其他危险物品。排爆机器人的多功能机械手,作为排爆机器人的完成抓取任务的主要执行器,应能完成包括抓取爆炸物在内的一系列任务,对于排爆机器人来讲尤为重要。排爆是一个充满变化而复杂的过程,在排爆机器人执行任务的过程中,最关键的一步就是控制机器人的多功能机械手去抓取目标物,即控制机

双目立体视觉

双目立体视觉 双目立体视觉的研究一直是机器视觉中的热点和难点。使用双目立体视觉系统可以确定任意物体的三维轮廓,并且可以得到轮廓上任意点的三维坐标。因此双目立体视觉系统可以应用在多个领域。现说明介绍如何基于HALCON实现双目立体视觉系统,以及立体视觉的基本理论、方法和相关技术,为搭建双目立体视觉系统和提高算法效率。 双目立体视觉是机器视觉的一种重要形式,它是基于视差原理并由多幅图像获取物体三维几何信息的方法。双目立体视觉系统一般由双摄像机从不同角度同时获得被测物的两幅数字图像,或由单摄像机在不同时刻从不同角度获得被测物的两幅数字图像,并基于视差原理恢复出物体的三维几何信息,重建物体三维轮廓及位置。双目立体视觉系统在机器视觉领域有着广泛的应用前景。 HALCON是在世界范围内广泛使用的机器视觉软件。它拥有满足您各类机器视觉应用需求的完善的开发库。HALCON也包含Blob分析、形态学、模式识别、测量、三维摄像机定标、双目立体视觉等杰出的高级算法。HALCON支持Linux和Windows,并且可以通过C、C++、C#、Visual Basic和Delphi 语言访问。另外HALCON与硬件无关,支持大多数图像采集卡及带有DirectShow和IEEE 1394驱动的采集设备,用户可以利用其开放式结构快速开发图像处理和机器视觉应用软件。 一.双目立体视觉相关基本理论说明 1.1 双目立体视觉原理 双目立体视觉三维测量是基于视差原理,图1所示为简单的平视双目立体成像原理图,两摄像机的投影中心的连线的距离,即基线距为b。摄像机坐标系的原点在摄像机镜头的光心处,坐标系如图1所示。事实上摄像机的成像平面在镜头的光心后,图1中将左右成像平面绘制在镜头的光心前f处,这个虚拟的图像平面坐标系O1uv的u轴和v轴与和摄像机坐标系的x轴和y轴方向一致,这样可以简化计算过程。左右图像坐标系的原点在摄像机光轴与平面的交点O1和O2。空间中某点P在左图像和右图像中相应的坐标分别为P1(u1,v1)和P2(u2,v2)。假定两摄像机的图像在同一个平面上,则点P图像坐标的Y坐标相同,即v1=v2。由三角几何关系得到: 上式中(xc,yc,zc)为点P在左摄像机坐标系中的坐标,b为基线距,f为两个摄像机的焦距,(u1,v1)和(u2,v2)分别为点P在左图像和右图像中的坐标。 视差定义为某一点在两幅图像中相应点的位置差: 图1 双目立体成像原理图图3 一般双目立体视觉系统原理图

双目立体视觉技术简介

双目立体视觉技术简介 1. 什么是视觉 视觉是一个古老的研究课题,同时又是人类观察世界、认知世界的重要功能和手段。人类从外界获得的信息约有75%来自视觉系统,用机器模拟人类的视觉功能是人们多年的梦想。视觉神经生理学,视觉心里学,特别是计算机技术、数字图像处理、计算机图形学、人工智能等学科的发展,为利用计算机实现模拟人类的视觉成为可能。在现代工业自动化生产过程中,计算机视觉正成为一种提高生产效率和检验产品质量的关键技术之一,如机器零件的自动检测、智能机器人控制、生产线的自动监控等;在国防和航天等领域,计算机视觉也具有较重要的意义,如运动目标的自动跟踪与识别、自主车导航及空间机器人的视觉控制等。人类视觉过程可以看作是一个从感觉到知觉的复杂过程,从狭义上来说视觉的最终目的是要对场景作出对观察者有意义的解释和描述;从广义上说,是根据周围的环境和观察者的意愿,在解释和描述的基础上做出行为规划或行为决策。计算机视觉研究的目的使计算机具有通过二维图像信息来认知三维环境信息的能力,这种能力不仅使机器能感知三维环境中物体的几何信息(如形状、位置、姿态运动等),而且能进一步对它们进行描述、存储、识别与理解,计算机视觉己经发展起一套独立的计算理论与算法。 2. 什么是计算机双目立体视觉 双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。融合两只眼睛获得的图像并观察它们之间的差别,使我们可以获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来,这个差别,我们称作视差(Disparity)图像,如图一。 图一、视差(Disparity)图像 双目立体视觉测量方法具有效率高、精度合适、系统结构简单、成本低等优点,非常适合于制造现场的在线、非接触产品检测和质量控制。对运动物体(包括动物和人体形体)测量中,由于图像获取是在瞬间完成的,因此立体视觉方法是一种更有效的测量方法。 双目立体视觉系统是计算机视觉的关键技术之一,获取空间三维场景的距离信息也是计算机视觉研究中最基础的内容。 双目立体视觉的开创性工作始于上世纪的60年代中期。美国MIT的Roberts通过从数字图像中提取立方体、楔形体和棱柱体等简单规则多面体的三维结构,并对物体的形状和空间关系

双目立体视觉

计算机双目立体视觉 双目立体视觉技术是仿照人类利用双目线索感知深度信息的方法,实现对三维信息的感知。为解决智能机器人抓取物体、视觉导航、目标跟踪等奠定基础。 双目立体视觉(Binocular Stereo Vision )是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点之间的位置偏差,来获取物体三维几何信息的方法。融合两只眼睛获取的图像并观察它们之间的差别,使我们可以获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来,这个差别,我们称作为视差(Disparity )图像。 双目立体视觉系统 立体视觉系统由左右两部摄像机组成,如图,世界空间中的一点A(X,Y ,Z)在左右摄像机的成 像面1C 和r C 上的像点分别为)(111,v u a 和) (r r r v u a ,。这两个像点是世界空间中同一个对象点A 的像,称为“共轭点”。知道了这两个共轭像点,分别作它们与各自相机的光心1O 和r O 的连线,即投影线11O a 和r r O a ,它们的交点即为世界空间中的对象点A 。这就是立体视觉的基本原理。 双目立体视觉智能视频分析技术 恢复场景的3D 信息是立体视觉研究中最基本的目标,为实现这一目标,一个完整的立体视觉系统通常包含六个模块:图像获取、摄像机标定、特征提取、立体匹配、三维恢复和视频

分析(运动检测、运动跟踪、规则判断、报警处理)。 图像获取(Image Acquisition ) 数字图像的获取是立体视觉的信息来源。常用的立体视觉图像一般为双目图像,有的采用夺目图像。图像的获取方式有很多种,主要有具体运用的场合和目的决定。立体图像的获取不仅要满足应用要求,而且考虑视点差异、光照条件、摄像机的性能和场景特点等方面的影像。 摄像机标定(Camera Calibration ) 图像上每一点的亮度反映了空间物体表面某点反射光的强度,而该点在图像上的位置则与空 间物体表面相应点的几何位置有关。这些位置的相互关系由摄像机成像几何模型来决定。该几何模型的参数称为摄像机参数,这些参数必须由实验与计算来确定,实验与计算的过程称为摄像机定标。 立体视觉系统摄像机标定是指对三维场景中对象点在左右摄像机图像平面上的坐标位置)(111,v u a 和) (r r r v u a ,与其世界空间坐标A (X, Y , Z )之间的映射关系的确立,是实现立体视觉三维模型重构中基本且关键的一步。 特征提取(Feature Acquisition ) 特征提取的目的是获取匹配得以进行的图像特征,图像特征的性质与图像匹配的方法选择有着密切的联系。目前,还没有建立起一种普遍适用的获取图像特征的理论,因此导致了立体视觉研究领域中匹配特征的多样化。像素相位匹配是近二十年才发展起来的一类匹配算法。相位作为匹配基元,本身反映着信号的结构信息,对图像的高频噪声有很好的一直作用,适于并行处理,能获得亚像素级精度的致密视差。但存在相位奇点和相位卷绕的问题,需加入自适应滤波器解决。或者是像素的集合,也可以是它们的抽象表达,如图像的结构、图像的目标和关系结构等。常用的匹配特征主要有点状特征、线装特征和区特征等几种情形。 一般而言,尺度较大的图像特征蕴含较多的图片信息,且特征本身的数目较少,匹配效率高;但特征提取和描述过程存在较大的困难,定位精度也较差。而对于尺度较小的图像特征来说,对其进行表达和描述相对简单,定位的精度高;但由于特征本身数码较多,所包含的图像信息少,在匹配时需要采用较为严格的约束条件和匹配策略,一尽可能的减少匹配歧义和提高匹配效率。总的来说,好的匹配特征应该具有要可区分性、不变性、唯一性以及有效解决匹配歧义的能力。 图像匹配(Image Matching ) 在立体视觉中,图像匹配是指将三维空间中一点A (X, Y , Z )在左右摄像机的成像面1C 和r C 上的像点)(111,v u a 和) (r r r v u a ,对应起来。图像匹配是立体视觉中最重要也是最困难的问题,一直是立体视觉研究的焦点。当空间三维场景经过透视投影(Perspective Projection )变换为二维图像时,同一场景在不同视点的摄像机图像平面上成像会发生不同程度的扭曲和变形,而且场景中的光照条件、被测对象的几何形状和表面特性、噪声干扰和畸变、摄像机特性等诸多因素的影响都被集中体现在单一的图像灰度值中。显然,要包含了如此之多不利因素的图像进行精准的匹配是很不容易的。

机器视觉引导与定位

机器视觉引导与定位 视觉引导与定位是工业机器人应用领域中广泛存在的问题。对于工作在自动化生产线上的工业机器人来说,其完成最多的一类操作是“抓取-放置”动作。为了完成这类操作,对被操作物体定位信息的获取是必要的,首先机器人必须知道物体被操作前的位姿,以保证机器人准确地抓取;其次是必须知道物体被操作后的目标位姿,以保证机器人准确地完成任务。在大部分的工业机器人应用场合,机器人只是按照固定的程序进行操作,物体的初始位姿和终止位姿是事先规定的,作业任务完成的质量由生产线的定位精度来保证。为了高质量作业,就要求生产线相对固定,定位精度高,这样的结果是生产柔性下降,成本却大大增加,此时生产线的柔性和产品质量是矛盾的。 视觉引导与定位是解决上述矛盾的理想工具。工业机器人可以通过视觉系统实时地了解工作环境的变化,相应调整动作,保证任务的正确完成。这种情况下,即使生产线的调整或定位有较大的误差也不会对机器人准确作业造成多大影响,视觉系统实际上提供了外部闭环控制机制,保证机器人自动补偿由于环境变化而产生的误差。 理想的视觉引导与定位应当是基于视觉伺服的。首先观察物体的大致方位,然后机械手一边运动一边观察机械手和物体之间的偏差,根据这个偏差调整机械手的运动方向,直到机械手和物体准确接触为止。但是这种定位方式在实现上存在诸多困难。 直接视觉引导与定位是一次性地对在机器人环境中物体的空间位姿进行详细描述,引导机器人直接地完成动作。与基于视觉伺服的方法相比,直接视觉引导的运算量大大减少,为实际应用创造了条件,但这必须基于一个前提:视觉系统能够在机器人空间中(基坐标系中)精确测定物体的三维位姿信息。 以上内容由深圳市科视创科技有限公司整理编辑,分享请注明出处

KUKA机器人定位抓取视觉设置说明

机器人定位抓取 ---视觉部分设置手册 机器人定位抓取视觉部分设置步骤如下: 一、调整相机到适当的位置 1、将相机连接到PC; 2、打开In-Sight软件; 3、将相机添加到In-Sight网络; 若相机与PC机本地连接在相同的网段(IP地址的前三段 相同、最后一段不同,例如:PC机IP为192.168.3.11, 相机IP为192.168.3.9),则在In-Sight网络里可直接找到 相机,如下图所示: 若在In-Sight网络里找不到相机,则需要通过修改相机IP 地址的方式将相机添加进来,方法如下: 1)在In-Sight网络里右键单击“In-Sight传感器”,选择 “添加传感器/设备”

2)在出现的界面中左键单击左侧区域出现的相机,在右侧区域选择“使用下列网络设置”,将相机IP地 址前三段及子网掩码修改为与PC机一致(当IP地 址前三段或子网掩码与PC机不一致时,右侧会出 现红色叹号),

3)相机IP地址及子网掩码修改好之后,点击“应用”,会出现如下对话框 点击“确定”,出现 同时,In-Sight网络里会出现相机。 点击“确定”,然后关闭设置页面。 4、连接相机 双击In-Sight网络里出现的相机。 5、查看右下角相机状态

若右下角显示,则单击上面工具栏中的“联 机/脱机”图标,使相机处于脱机状态 6、点击工具栏中的“实时”图标,使相机处于实时状态 7、调整相机高度,使相机的视野范围(图像可见范围)满足 检测需求(下图中的视野范围为18.5*13.875) 8、固定相机高度 二、调整图像 1、将检测物放置在相机视野范围内; 2、调节镜头上的“光圈”,使图像亮度适中(此操作说明中 没有使用光源,所以只需要调节光圈;若使用光源,应先

三菱工业机器人视觉定位的实现

三菱工业机器人视觉标定的实现 郭方营电子电气工程学院 摘要:本文介绍了三菱工业机器人视觉标定实现的方法。在工业相机分辨率为640*480像素范围内设置9个标定圆,利用工业机器人2D标定软件获取9个标定点图像坐标和世界坐标,求得投影矩阵,写入机器人控制器,通过调用PVSCAL函数实现相机坐标系与世界坐标系的坐标转换,从而实现工业机器人视觉的标定,基于该方法结合视觉匹配和PLC可以实现工业机器人的运动控制。 关键词:工业机器人工业相机视觉标定坐标变换 1引言 《中国制造2025》和“十三五”发展中,工业机器人的需求逐渐增多,工业机器人要完成搬运、码垛、装配等各种工作都离不开坐标点,对于静态物体抓取、精度要求不高、坐标位置不多的场合,往往采用坐标位置示教的方法,利用示教器获得机器人特定点的位置(X.Y.Z)和姿态(A.B.C)坐标信息,然后按照要求以关节插补、直线插补、圆弧插补等方式完成运动。但在抓取运动的物体时,受外界因素影响,特别是质量轻的物体,位置点会产生偏移,示教的坐标点将不准确,同时随着坐标点数量的增加,示教工作量将会增大。针对固定点坐标示教的缺点,可以利用机器人的视觉控制来弥补,工业机器人的视觉犹如人的“眼睛”,即用工业相机来测出手爪和目标的相对位置,将目标位置的坐标经过转换成世界坐标系,实现“眼睛”看,用爪手抓取的过程,工业机器人的运动轨迹不需要提前示教,提高了编程和生产效率及加工精度。实现视觉控制的一种重要的问题之一就是视觉标定,目前常用的方法有线性标定方法、非线性标定方法、Tsai的经典两步法、张正友的标定方法等[1],以上方法都需要编写坐标变换求解算法,必须具备线性代数的数学基础,难度较大。本文结合三菱工业机器人2D标定软件提供的功能和DALSA工业相机的特点利用9个标定圆,通过调用PVSCAL函数完成坐标转换,实现工业机器人视觉的标定。 2 硬件构成 工业相机固定在六自由度机器人的J5轴上,如图1(见附件)所示,采用蓝色光源作为背景光,采用吸盘式爪手,标定时在抓手中心处安装一个针尖便于示教坐

机器人视觉系统

机器人视觉系统 在现代工业自动化生产中,涉及到各种各样的检验、生产监视及零件识别应用,例如零配件批量加工的尺寸检查,自动装配的完整性检查,电子装配线的元件自动定位,IC上的字符识别等。通常人眼无法连续、稳定地完成这些带有高度重复性和智能性的工作,其它物理量传感器也难有用武之地。由此人们开始考虑利用光电成像系统采集被控目标的图像,而后经计算机或专用的图像处理模块进行数字化处理,根据图像的像素分布、亮度和颜色等信息,来进行尺寸、形状、颜色等的判别。这样,就把计算机的快速性、可重复性,与人眼视觉的高度智能化和抽象能力相结合,由此产生了机器视觉的概念。 一个成功的机器视觉系统是一个经过细致工程处理来满足一系列明确要求的系统。当这些要求完全确定后,这个系统就设计并建立来满足这些精确的要求。机器视觉的优点包括以下几点: ■精度高 作为一个精确的测量仪器,设计优秀的视觉系统能够对一千个或更多部件的一个进行空间测量。因为此种测量不需要接触,所以对脆弱部件没有磨损和危险。 ■连续性 视觉系统可以使人们免受疲劳之苦。因为没有人工操作者,也就没有了人为造成的操作变化。多个系统可以设定单独运行。 ■成本效率高 随着计算机处理器价格的急剧下降,机器视觉系统成本效率也变得越来越高。一个价值10000美元的视觉系统可以轻松取代三个人工探测者,而每个探测者每年需要20000美元的工资。另外,视觉系统的操作和维持费用非常低。 ■灵活性 视觉系统能够进行各种不同的测量。当应用变化以后,只需软件做相应变化或者升级以适应新的需求即可。 许多应用满意过程控制(SPC)的公司正在考虑应用机器视觉系统来传递持续的、协调的和精确的测量SPC命令。在SPC中,制造参数是被持续监控的。整个过程的控制就是要保证这些参数在一定的范围内。这使制造者在生产过程失去控制或出现坏部件时能够调节过程参数。机器视觉系统比光学或机器传感器有更好的可适应性。它们使自动机器具有了多样性、灵活性和可重组性。当需要改变生产过程时,对机器视觉来说“工具更换”仅仅是软件的变换而不是更换昂贵的硬件。当生产线重组后,视觉系统往往可以重复使用 机器视觉系统的构成 机器视觉技术用计算机来分析一个图像,并根据分析得出结论。现今机器视觉有两种应用。机器视觉系统可以探测部件,在此光学器件允许处理器更精确的观察目标并对哪些部件可以通过哪些需要废弃做出有效的决定;机器视觉也可以用来创造一个部件,即运用复杂光学器件和软件相结合直接指导制造过程。 尽管机器视觉应用各异,但都包括以下几个过程; ■图像采集 光学系统采集图像,图像转换成模拟格式并传入计算机存储器。 ■图像处理 处理器运用不同的算法来提高对结论有重要影响的图像要素。 ■特性提取 处理器识别并量化图像的关键特性,例如印刷电路板上洞的位置或者连接器上引脚的个数。

相关主题
文本预览
相关文档 最新文档