基于动态划理论的立体匹配算法研究
- 格式:doc
- 大小:876.00 KB
- 文档页数:21
基于深度学习的立体匹配算法研究随着现代科技的不断进步,深度学习在计算机视觉领域发挥着越来越重要的作用。
其中,在立体匹配算法的研究中,深度学习的应用已经得到了广泛的认可和应用。
本文将着重探讨基于深度学习的立体匹配算法研究。
一、立体匹配算法概述立体匹配算法是指通过对两幅具有一定视角差异的图像进行比较,以获取三维立体信息的一种算法。
其中,匹配是立体重建和视觉跟踪的核心技术之一。
立体匹配算法从原理上可以分为基于局部和全局两种方法。
其中,基于局部的匹配可以快速地获得立体信息,但是对于复杂的场景表达能力有限;基于全局的匹配可以获得更好的匹配结果,但是执行效率较低。
因此,为了更好地平衡算法的效率和精度,立体匹配算法在发展中不断探索着新的方法和策略。
其中,基于深度学习的立体匹配算法的应用正成为发展的趋势。
二、基于深度学习的立体匹配算法原理基于深度学习的立体匹配算法主要使用卷积神经网络(Convolutional Neural Network,CNN)作为核心模型,通过训练得到二者视差差异下的匹配结果。
其中,CNN模型能够通过局部和全局特征学习获得场景的高维度特征,从而实现立体匹配结果的生成。
在具体实现中,基于深度学习的立体匹配算法需要针对不同的问题选择不同的模型。
例如,对于低纹理或重复纹理的场景,深度学习模型可以通过引入弱监督机制来提高算法的性能;对于复杂的场景,则需要设计多级网络结构来提高算法的表达能力。
此外,基于深度学习的立体匹配算法还需要对数据进行预处理和增强,例如对图像进行去噪、颜色平衡和几何变换等操作,从而提高算法的稳定性和鲁棒性。
三、基于深度学习的立体匹配算法应用与研究进展目前,基于深度学习的立体匹配算法已经成为立体匹配研究的热点。
其中,一些最新的研究进展已经取得了很好的效果。
例如,一些研究者使用基于深度学习的方法,大大提高了立体匹配算法的识别准确率,以及执行效率。
同时还有一些研究探索了结合多源数据的联合学习方案,从而在不同场景下对立体匹配结果进行优化和融合。
基于深度学习的立体匹配算法研究立体匹配是计算机视觉中重要的任务之一,旨在通过分析图像中的特征及其在不同视角下的变化来推断深度信息。
这项任务对于建立真实感三维场景重建、目标检测与跟踪、姿态估计和机器人导航等应用都至关重要。
而随着深度学习的发展,基于深度学习的立体匹配算法在这个领域的研究成为了热点。
立体匹配的目标是在左右两个摄像机图像中寻找对应的点,通过这些对应点的位置差异来估计深度。
然而,由于遮挡、光照变化、纹理缺失等因素的干扰,传统的立体匹配算法面临一系列的挑战。
而深度学习的引入,使得立体匹配的性能得到了显著提升。
基于深度学习的立体匹配算法通常采用卷积神经网络(Convolutional Neural Network, CNN)来提取图像的特征表示。
CNN具有自动学习特征表示的能力,可以更好地捕捉到图像中的纹理信息和结构特征。
同时,为了解决立体匹配中的各种问题,研究者们提出了一系列基于深度学习的方法。
一种常见的基于深度学习的立体匹配算法是使用卷积神经网络进行特征匹配。
这类方法将左右图像作为CNN的输入,网络的输出是一个代表匹配度的矩阵,通过寻找矩阵中的最大值或较高的像素值来确定左右图像中对应点的位置。
其中,匹配代价函数的设计至关重要,常用的代价函数包括基于像素差异的、结构相似性度量(SSD)、均方差(MSE)等。
此类算法可以在不同视角下捕捉到图像的特征差异,但由于缺乏全局约束,容易出现误匹配的情况。
为了解决误匹配问题,另一类算法引入了全局约束来提高立体匹配的准确性。
这些算法通过将立体匹配问题转化为优化问题,利用深度学习模型生成代价图,并利用全局优化算法(如图割、动态规划等)来找到最优的匹配结果。
这种方法的优势在于可以通过考虑整个图像的上下文信息来提高准确性,但计算复杂度较高。
除了基于CNN的方法,还有一些基于生成对抗网络(Generative Adversarial Network, GAN)的立体匹配算法。
立体匹配算法的分类对比研究作者:宁晓斐胡波赵磊徳文智来源:《硅谷》2013年第18期摘要立体视觉主要利用多图像成像技术,通过多个图像来获取物体的深度信息。
本文首先叙述了常用的立体匹配算法的组成,将立体匹配算法分为三类,详细说明了三种匹配算法分类中具有代表性的块匹配算法、半全局立体匹配算法和图割法的具体实现步骤,从匹配速度和匹配效果上分析总结了三种算法的优缺点。
最后概况归纳了现有的立体匹配算法所存在的问题以及对立体匹配算法发展的展望。
关键词立体匹配;算法分类中图分类号:TP391 文献标识码:A 文章编号:1671-7597(2013)18-0045-02人时刻处在一个复杂的三维场景中,我们的双眼从场景中获得二维图像,大脑自动地将两幅图像进行叠加以产生三维信息,这样就很自然地知道周围物体距离自身的远近。
双目视觉是在充分理解人类视觉原理的基础上使用计算机来模拟人类的双目成像系统,利用成像设备代替人眼获取两幅图像,通过计算机代替人脑获取所拍物体的三维信息。
立体匹配是双目立体视觉系统中最关键的一部分。
1 立体匹配算法的分类本文将立体匹配算法分为:局部立体匹配算法、半全局立体匹配算法以及全局立体匹配算法。
1.1 局部立体匹配算法局部匹配算法又称基于窗口的方法,为每个像素计算一个大小、形状和权重适合的支撑区域,然后将支撑区域中的视差值加权平均。
理想的支撑区域应当覆盖无纹理区域,且在深度不连续处停止。
SAD是最简单的算法,可以很容易的嵌入到FPGA和SOC,是实时系统的典范,但是它在两幅图像间很容易出现强度变化。
与SAD算法相比,SSD方法有更高的算法复杂性,这是由于它涉及更多的乘法运算。
包含相同像素值的两个区域将产生零值。
ZSAD和ZSSD解决了在辐射失真的情况下不能产生正确结果的这个问题。
但ZSAD和ZSSD在性能上的改进由于大幅度增加的算法复杂性而被抵消。
NCC对不同光照条件下的亮度变化有鲁棒性。
但它的计算时间比SAD和SSD更长。
3D视觉中的立体匹配算法研究与改进在3D视觉领域中,立体匹配算法是一项重要的技术,用于处理立体图像的深度信息。
立体匹配算法旨在通过对图像中的对应点进行匹配,确定它们之间的距离,从而重构场景的三维结构。
本文将对3D视觉中的立体匹配算法进行研究与改进。
一、立体匹配算法的基本原理立体匹配算法的基本原理是通过比较左右两幅立体图像的像素信息,找到它们之间的对应点,并计算出距离或深度信息。
常用的立体匹配算法包括视差法、基于特征的立体匹配、图割算法等。
视差法是最传统的立体匹配算法之一。
它通过比较左右图像中像素的灰度值差异来确定对应点的视差值,再通过一定的几何关系计算出深度信息。
视差法简单易实现,但对于纹理丰富、边缘模糊等情况下的图像匹配效果不佳。
基于特征的立体匹配算法利用图像中的特征点(如角点、边缘等)进行匹配,以获得更准确的结果。
该算法通常包括特征提取、特征匹配和深度计算等步骤。
特征点的选择和匹配精度对立体匹配结果的准确性有着重要影响。
图割算法是一种基于图论的立体匹配算法,它将立体匹配问题转化为图割问题。
通过构建能量函数,利用图割算法来计算最小代价的匹配结果。
图割算法具有较高的准确性和鲁棒性,但计算复杂度较高,不适用于实时系统。
二、立体匹配算法的常见问题在实际应用中,立体匹配算法仍然存在一些问题,限制了其性能和应用范围。
主要问题包括视差失真、运动物体处理、低纹理区域匹配等。
视差失真是指由于视角变化或透视变换等原因导致匹配误差增大。
特别是在远处或大角度情况下,视差估计会出现积累误差,使得深度信息不准确。
解决视差失真问题的方法包括视角校正、立体图像重建等。
运动物体处理是指当场景中存在运动物体时,立体匹配算法难以准确地匹配对应点。
运动物体造成图像中的对应点轻微偏移,导致匹配错误。
针对这个问题,可以采用背景建模、光流估计等方法来提高立体匹配的稳定性。
低纹理区域匹配是立体匹配中的一个挑战性问题。
在低纹理区域,图像中的对应点很少或没有,难以准确匹配。
立体视觉中的立体匹配技术研究与应用的开题报告一、选题意义随着立体显示技术的不断发展,立体视觉的应用范围越来越广泛,涉及到图像、视频处理、医疗、军事、工业等多个领域。
其中,立体匹配技术是实现立体视觉的核心技术之一,在三维重建、深度检测、目标跟踪等方面都有着广泛的应用。
因此,研究立体匹配技术的理论模型、方法和应用具有重要的科学意义和实际价值。
二、研究内容本研究旨在探讨基于区域分割的立体匹配技术的理论模型、方法和应用。
具体研究内容包括以下几个方面:1. 立体匹配技术的基本概念和原理,包括视差、视差图、视差匹配、立体匹配算法等。
2. 基于区域分割的立体匹配技术的理论模型和方法,该方法分为分块匹配、窗口匹配、全局匹配等多个部分,其中分块匹配是最基本的算法,窗口匹配和全局匹配是对分块匹配的改进,能够获得更准确的匹配结果。
3. 立体匹配技术的应用,包括图像重建、深度检测、目标跟踪等。
其中,图像重建是利用立体匹配技术从双目图像中恢复三维模型,深度检测是检测物体在场景中的深度,目标跟踪是在目标运动过程中保持对目标的跟踪。
三、研究方法本研究采用文献调研和理论分析相结合的方法,首先对立体匹配技术的基本概念和原理进行归纳总结,然后对基于区域分割的立体匹配技术的理论模型和方法进行深入探讨,最后对立体匹配技术在图像重建、深度检测、目标跟踪等方面的应用进行综述和分析。
四、预期成果本研究预期达成以下几个成果:1. 归纳总结立体匹配技术的基本概念和原理,形成完整的理论框架。
2. 探讨基于区域分割的立体匹配技术的理论模型和方法,分析其优缺点和适用范围。
3. 综述立体匹配技术在图像重建、深度检测、目标跟踪等方面的应用,并对其未来发展趋势进行展望。
五、研究计划本研究拟按照以下计划进行:1. 第一阶段(1个月):阅读相关文献,总结立体匹配技术的基本概念和原理。
2. 第二阶段(2个月):探讨基于区域分割的立体匹配技术的理论模型和方法。
3. 第三阶段(2个月):综述立体匹配技术在图像重建、深度检测、目标跟踪等方面的应用。
基于ELAS立体匹配算法的研究与改进张道德;伍渊;吴良溢;胡新宇【摘要】在双目机器人视觉伺服控制中,双目立体匹配算法的实时性和准确性,对机器人的精确定位及控制至关重要.在研究现有的一些先进性立体匹配算法的基础上,引入一种基于视差平面的局部立体匹配算法ELAS(算法,将该算法与先进的立体匹配算法对比发现,其克服了现有算法需要给定最大视差值范围才能获得较好视差图的缺点,综合处理时间和处理效果,表现最好.介绍ELAS算法原理,并分析其存在的问题,针对ELAS算法处理效果不佳的问题,根据视差连续原理,研究改进的ELAS算法,并使用引导滤波器处理视差图.实验证明,改进的ELAS算法显著提高了原算法的效果,而处理时间增加不多,在不考虑实时性的情况下,结合上述滤波器后,处理效果能够接近真实视差图.%Binocular stereo matching algorithm is real-time and accurate in the binocular vision servo control system,which is very important for the accurate positioning and control of the robot.Based on the study of some advanced stereo matching algorithms,this paper introduces an algorithm of local stereo matching based on parallax plane-ELAS (Efficient LArge-scale Stereo) algorithm,introduces the principle of ELAS algorithm,Which overcomes the shortcomings of these existing algorithms in which the best disparity map cannot be obtained until the maximum disparity value range is given.The best performance is obtained by considering the combination of the processing time and processing effect.Aiming at the problem that the ELAS algorithm does not work well, the improved ELAS algorithm is studied based on the principle of disparity continuity.The disparity map is processed using the guidedfilter.Experiments show that the improved ELAS algorithm improves the performance of the original algorithm significantly.Without considering the real-time performance, combined with the above-mentioned filters, the processing effect can be close to the real disparity map, which is of great significance in 3D reconstruction and visual servoing.【期刊名称】《湖北工业大学学报》【年(卷),期】2017(032)002【总页数】6页(P1-6)【关键词】立体匹配;ELAS;滤波;实时性【作者】张道德;伍渊;吴良溢;胡新宇【作者单位】湖北工业大学机械工程学院,湖北武汉 430068;武汉市轻工装备工程技术研究中心,湖北武汉 430068;湖北工业大学机械工程学院,湖北武汉 430068;武汉市轻工装备工程技术研究中心,湖北武汉 430068;湖北工业大学机械工程学院,湖北武汉 430068;武汉市轻工装备工程技术研究中心,湖北武汉 430068;湖北工业大学机械工程学院,湖北武汉 430068;武汉市轻工装备工程技术研究中心,湖北武汉 430068【正文语种】中文【中图分类】TP242.62在基于双目视觉的视觉伺服中,视觉图像采集和处理的实时性至关重要[1]。
立体匹配算法的研究和应用一、本文概述立体匹配算法是计算机视觉领域中的一个重要研究方向,它旨在从两个或多个不同视角的图像中恢复出场景的深度信息。
这一技术在三维重建、机器人导航、自动驾驶、虚拟现实和增强现实等领域有着广泛的应用前景。
本文将对立体匹配算法的研究现状、基本原理、常见算法以及实际应用进行深入探讨。
本文将概述立体匹配算法的发展历程和研究现状,介绍其在计算机视觉领域的重要性以及面临的挑战。
接着,文章将详细阐述立体匹配算法的基本原理,包括立体视觉的基本原理、图像预处理、特征提取与匹配、视差计算与优化等关键步骤。
在此基础上,本文将重点介绍几种经典的立体匹配算法,如基于全局能量最小化的算法、基于局部窗口的算法、基于特征的算法等,并分析它们的优缺点和适用范围。
文章还将关注近年来兴起的深度学习在立体匹配领域的应用,探讨其带来的性能提升和创新点。
本文将讨论立体匹配算法在实际应用中的案例,如三维重建、机器人导航、自动驾驶等,并分析其在实际应用中的挑战和未来的发展趋势。
通过本文的综述,读者可以对立体匹配算法有一个全面而深入的了解,为相关研究和应用提供有益的参考。
二、立体匹配算法的基本理论立体匹配算法是计算机视觉领域的重要研究方向,旨在从两幅或多幅不同视角的图像中恢复出场景的三维信息。
其基本理论涉及图像处理、模式识别、计算机视觉等多个学科,是机器视觉领域的核心技术之一。
立体匹配算法的核心是寻找图像对之间的对应点,即立体匹配点。
这些点在左右两幅图像中应具有相同的空间位置,但在像素坐标上存在差异,这种差异被称为视差。
通过计算这些视差值,我们可以得到场景的深度信息。
立体匹配算法的基本流程包括预处理、特征提取、匹配代价计算、视差计算和后处理等步骤。
预处理主要是对原始图像进行滤波、增强等操作,以提高图像质量。
特征提取则是从图像中提取用于匹配的特征信息,如角点、边缘等。
匹配代价计算是根据提取的特征,计算不同像素点之间的匹配代价,即相似度度量。
《双目立体视觉三维重建的立体匹配算法研究》篇一一、引言双目立体视觉技术是计算机视觉领域中的一项重要技术,它通过模拟人类双眼的视觉系统,利用两个相机获取同一场景的图像,从而实现对场景的三维重建。
其中,立体匹配算法是双目立体视觉三维重建中的关键技术之一。
本文旨在研究双目立体视觉三维重建中的立体匹配算法,以提高三维重建的精度和效率。
二、立体匹配算法概述立体匹配算法是双目立体视觉三维重建中的核心算法,其主要目的是在两个相机获取的图像中寻找对应的像素点,从而计算出场景的深度信息。
立体匹配算法通常包括预处理、特征提取、匹配基元选择、匹配代价计算、视差估计和优化等步骤。
其中,匹配基元的选择和匹配代价的计算是影响匹配精度的关键因素。
三、现有立体匹配算法分析目前,已经存在多种立体匹配算法,如基于区域的算法、基于特征的算法、基于相位的算法等。
这些算法各有优缺点,如基于区域的算法能够获得较高的匹配精度,但计算量较大;基于特征的算法能够快速地找到匹配点,但易受噪声和光照变化的影响。
因此,需要根据具体的应用场景和需求选择合适的立体匹配算法。
四、本文研究的立体匹配算法本文提出了一种基于全局能量优化的立体匹配算法。
该算法首先对输入图像进行预处理和特征提取,然后利用多种匹配基元进行匹配代价计算,并通过全局能量优化方法得到最终的视差图。
该算法能够有效地解决传统算法中存在的计算量大、易受噪声和光照变化影响等问题,提高了匹配精度和鲁棒性。
五、实验与分析为了验证本文提出的立体匹配算法的有效性,我们进行了多组实验。
实验结果表明,该算法能够获得较高的匹配精度和较低的计算量。
同时,该算法对噪声和光照变化具有较强的鲁棒性,能够在不同场景下获得较好的三维重建效果。
与传统的立体匹配算法相比,本文提出的算法具有更高的实用价值和应用前景。
六、结论本文研究了双目立体视觉三维重建中的立体匹配算法,提出了一种基于全局能量优化的立体匹配算法。
该算法能够有效地解决传统算法中存在的计算量大、易受噪声和光照变化影响等问题,提高了匹配精度和鲁棒性。
南京大学本科生毕业论文(申请学士学位)论文题目基于动态规划理论的立体匹配算法研究作者姓名张洋洋专业名称电子信息科学与技术指导教师李扬二零一二年六月学号:088202084论文答辩日期:2012年6月2日指导教师:(签字)论文题目基于动态规划理论的立体匹配算法研究Title in English(英文题目)The research of Stereo Matching based on DynamicProgramming姓名:张洋洋南京大学金陵学院信息管理系Dept. of Information Management,Jinling College, NJU南京大学金陵学院本科生毕业论文(设计)中文摘要毕业论文题目:基于动态规划理论的立体匹配算法研究信工院系电子信息科学与技术专业08级本科生姓名:张洋洋指导教师(姓名):李扬随着计算机视觉的发展,双目立体视觉已经成为近期研究的重点,它主要是通过模拟人眼立体成像的机制,利用两台摄像机通过不同位置成像,然后通过后续的处理,主要包括摄像机标定,立体匹配,以即最后3-D重建最终产生三维的图像。
然而立体视觉的重点是立体匹配,因此本文对立体匹配做重点的讨论与研究。
对于立体匹配,现如今已经有许多不同的研究成果,包括分为不同流派的研究思路,主要有针对区域的匹配算法和全局的匹配算法的研究并且都取得了很大的进展,其中针对全局路径的立体匹配要优于块匹配,最著名的是基于动态规划的匹配算法,这种传统的匹配算法,仅仅引入单调顺序约束,缺乏全局对于扫描线约束的限制,使得匹配后的视差图像存在大量带状误匹配的情况,针对此现象,本文提出了基于动态规划理论的立体匹配思想,通过加入行扫描线之间的约束条件和列扫描,能够较好的完成图像的匹配与视差的还原。
南京大学金陵学院本科生毕业论文(设计)英文摘要With the development of computer vision, binocular stereo vision is one of the most important area of researching. It mainly depend on simulating the system of the eyes of human beings, making use of two cameras to acquire two different pictures in diverse location and then dealing with the special procedure. After that the amount of the date of this picture would be disposed, including: camera calibration, stereo matching and 3-D reconstruction etc. While the stereo matching is the key module of the stereo vision, so this essay we research the stereo matching as the keynote.The study about the stereo matching during the world acquire lots of research achievements, since. Divided into different schools of thought, mainly for regional matching and global matching algorithm research,and the global matching of dynamic programming is better than the regional matching. This algorithm only introduce the monotone sequence constraint and ignore the constraint between scanning lines,so the result based on the traditional dynamic programming matching exist large number of articles. In order to overcoming this phenomenon, this essay present the theory of dynamic programming based on the stereo matching--adding the constraint of the among scanning lines and acquire better result.目录第1章绪论 (1)1.1 计算机视觉的发展......................................................................................错误!未定义书签。
1.2 双目立体视觉概述......................................................................................错误!未定义书签。
1.3 本文主要研究内容......................................................................................错误!未定义书签。
第2章常用的一些立体匹配的算法 (3)2.1 视差理论 (4)2.2 立体匹配常用算法综述 (4)第3章分层正交动态划匹配算法 (4)3.1 匹配代价与视差空间 (5)3.1.1 匹配代价计算 (6)3.1.2 固定窗口块匹配过程 (7)3.1.3 滑动窗口匹配 (9)3.2 动态规划立体匹配 (10)3.3 分层正交动态规划立体匹配算法 (12)3.3.1 水平方向最优路径 (12)3.3.2 水平双向能量函数 (13)3.3.3 垂直方向最优路径 (13)第4章总结与展望第一章绪论1.1计算机视觉的发展概况“计算机视觉领域的最突出特点是其多样性和不完善性。
这一领域的先驱可追溯到更早的时候,但是直到20世纪70年代后期,当计算机的性能提高到足以处理诸如图像这样的大规模数据时,计算机视觉才得到了正式的关注和发展。
然而这些发展往往起源于其他不同领域的需要,因而何谓“计算机视觉问题”始终没有得到正式定义,很自然地,“计算机视觉问题”应当被如何解决也没有成型的公式”]1[。
计算机视觉研究主要有以下几个领域的研究方向相互渗透:人工智能、物理(主要是可见光与红外的成像)、神经生物学。
除了上面提到的领域,很多研究课题同样可被当作纯粹的数学问题。
例如,计算机视觉中的很多问题,其理论基础便是统计学,最优化理论以及几何学。
如何使既有方法通过各种软硬件实现,或说如何对这些方法加以修改,而使之获得合理的执行速度而又不损失足够精度,是现今电脑视觉领域的主要课题。
当前,随着计算机科学、信号处理、以及人工智能研究的更一步深入,计算机视觉技术越来越多的得到人们的重视与研究,此外计算机视觉的应用也更加的广泛,设计到军事、医疗等方方面面。
如今对于计算机双目立体视觉的研究比较热,也取得了很多进展,本文着重对双目立体视觉中的算法进行高论分析。
1.2计算机双目立体视觉近年来计算机视觉研究的重点与热点之一是双目立体视觉。
它通过仿生学的原理模拟人类双眼成像的机制原理,利用两个摄像机在不同角度拍的摄同一景物或者物体,通过一个参考空间来计算两幅拍摄图像中的视差,进而获得对应点的三维坐标值信息。
为了便于研究,完整的双目立体视觉通常会被按照不同的步骤按照既定的流程来进行相关的研究,它主要流程是首先是左右图像信息获取,然后根据图像信息进行相关的预处理方便后续进行分析与研究,接着对预处理后的数据进行摄像机标定的过程,随后就是最重要也是最复杂的立体匹配过程,最后完成三维重建,其中立体匹配技术是立体视觉中的重点环节。
整个双目立体视觉流程如图1.1所示:图1.1 双目立体视觉的处理流程由于本文主要研究立体匹配的相关算法,因此不过多对:图像的预处理、相机标定以及三维重建等细节进行相关的研究讨论。
立体匹配(stereo matching):立体匹配作为立体视觉研究的重点,同时问题复杂多样,它主要是针对多幅图像完成在同一副图像的映射关系,这种映射关系通常是特种提取之间的复杂关系,从而得到图像的视差图像。
因为现实中的大多图像信息都是三维的,然而摄像机只能将三维的图像信息投射到二维的空间,这就使得三维空间中复杂的信息都只能以单一的像素表现在二维图像中。
因此要完成正确、效率比较高的无歧义匹配难度相当的大。
所以就目前立体匹配研究的方向来看,无论哪一种立体匹配的算法,其步骤和内容都主要分为三个方面,首先是选取恰当的匹配特种方法,这一点尤为重要。
其二是找打这些特征的本质属性加以研究与分析,最后就是建立稳定且高效率的匹配方法。
现如今我们看到的主流的算法都是介于这三个不走展开的,基于这种方法世界各地也提出了很多各具特色的算法匹配,但是由于立体匹配本身复杂多样性,同时涉及的问题复杂繁多,所以至今未有一整套成熟通用的算法去解决问题。
1.3本文主要研究内容本文主要针对计算机视觉中的双目立体视觉相关算法的研究与实现,并且对立体匹配算法进行了详细的讨论,重点研究了基于动态规划理论的立体匹配算法。
全文安排如下:第一章,主要介绍现代计算机视觉发展的概况以及双目立体视觉匹配的一些概念。
第二章,主要概述如今常用的一些立体匹配的算法。
第三章,重点分析传统动态规划匹配算法的不足,并根据不足提出改进的匹配算法即基于动态规划正交立体匹配算法。
第四章对全文进行总结与展望,并提出有待解决的问题。
第二章立体匹配的常用算法Scharstein等提出立体匹配算法可以大致分为四个步骤[2]:第一步是初始代价匹配计算;第二步是对初始匹配代价的能量聚合值计算;第三步是视差的计算与优化;最后则是图像校正。
上述步骤的选取与匹配选用的方法有关,对于局部的固定窗口匹配主要是前三步骤即首先计算初始匹配代价,然后根据初始匹配代价选取适当的块进行最小代价聚合值的筛选,选取最小代价聚合值下的视差值作为当前像素的视差值。
而自适应窗口块匹配算法则将前两部相结合,后续步骤相同。
局部算法具有计算负责度低、算法效率高等特点,它最突出的特点是对于初始匹配代价计算和对匹配代价聚合值的计算,这两个步骤尤为重要,方法是首先确定视差的搜索范围,每个视差值对应一个初始的匹配代价,然后根据这些初始代价利用分块的方法计算每个块中的灰度值之和即匹配代价聚合值,然后选取匹配代价聚合值最小的时候对应的视差作为当前像素的视差,尽管这种方法具有复杂度低于效率高等特点,但是它仅仅考虑块内的约束条件,缺乏全局的约束,导致匹配的精度较低,误匹配的情况较大。