当前位置:文档之家› 基于点特征的图像配准算法研究

基于点特征的图像配准算法研究

基于点特征的图像配准算法研究
基于点特征的图像配准算法研究

目录

摘 要 (1)

ABSTRACT (3)

第一章 绪论 (5)

1.1 课题背景介绍 (5)

1.1.1 图像配准技术简介 (5)

1.1.2 图像配准技术分类 (6)

1.1.3 图像配准系统的组成 (6)

1.2 图像配准应用领域与研究现状 (7)

1.2.1 虚拟现实与静态图像镶嵌 (7)

1.2.2 动态镶嵌与视频压缩 (9)

1.2.3 图像超分辨率复原 (9)

1.2.4 目标辨识与检索 (10)

1.3 本文的研究重点及章节安排 (10)

第二章 成像几何与图像变换模型 (12)

2.1 摄像机成像几何基础 (12)

2.1.1 针孔相机模型及摄像机坐标系 (12)

2.1.2 世界坐标系与像平面坐标系 (13)

2.2 摄像机运动 (15)

2.2.1 摄像机运动的基本形式 (15)

2.2.2 摄像机运动与图像配准 (16)

2.3 图像变换模型 (16)

2.3.1 透视变换模型的论证 (17)

2.3.2 透视变换矩阵求解方法概述 (19)

2.3.3 其他图像变换模型 (19)

2.4 宽基线与窄基线介绍 (20)

第三章 基于角点特征的图像配准 (22)

3.1 现有算法概要 (22)

3.2 图像特征概述 (23)

3.2.1 边缘特征 (23)

3.2.2 角点特征 (24)

i

3.2.3 Harris角点检测 (25)

3.2.4 角点匹配 (26)

3.3 改进的图像配准算法 (29)

3.3.1 相位相关法简介 (30)

3.3.2 改进的角点匹配 (31)

3.3.3 变换估计与配准误差计算 (32)

3.3.4 改进的鲁棒变换估计算法 (33)

3.3.5 系统框架 (36)

3.4 实验结果与分析 (36)

3.5 小结 (41)

第四章 图像变换与镶嵌技术 (43)

4.1 理论基础介绍 (43)

4.1.1 图像插值 (43)

4.1.2 图像变形与流形 (44)

4.1.3 图像融合算法介绍 (48)

4.1.4 影响图像合成清晰度几个因素 (49)

4.2 白平衡及亮度差异自动调整算法 (49)

4.3 实验结果与小结 (51)

第五章 SIFT特征匹配技术 (53)

5.1 宽基线特征匹配概述 (53)

5.2 SIFT特征匹配 (54)

5.2.1 图像多尺度表示 (54)

5.2.2 SIFT特征匹配算法 (55)

5.2.3 实验结果 (58)

5.2.4 小结 (63)

第六章 总结与展望 (64)

附录 本文实验图片 (66)

参考文献 (69)

致谢 (73)

攻读学位期间发表的论文 (74)

ii

摘 要

图像配准是指找出场景中同一物体表面的结构点在不同图像上的投影像素点之间的对应关系。图像镶嵌指的是将多幅互有重叠的图像组合形成一幅宽视角图片的技术。目前图像配准和镶嵌广泛应用于虚拟现实、视频压缩、图像复原、图像数据库检索等技术中。图像配准的研究是计算机视觉中最困难也是最重要的任务之一。

不同的图像配准方法总是对应于某种适用的图像变换模型,总体可以分为三类方法:直接像素亮度差优化的方法、基于特征匹配的方法和变换域求解的方法。图像配准算法研究的核心问题是提高配准的速度、精度和算法的稳健度。

本文针对同一场景在不同角度下拍摄的重叠图像配准及镶嵌问题进行了研究,包括研究了窄基线条件下基于频域信息的配准技术和基于点特征匹配的配准技术;研究了图像配准与镶嵌技术中的一系列相关问题,包括摄像机运动模型、透视变换矩阵参数的鲁棒估计和求解方法、插值技术、图像变形技术、流形的概念等,并分析了影响合成图像清晰度的主要因素。

本文提出了一种快速、稳健的基于角点匹配的图像配准算法。该算法提出了两次导向匹配的思想,第一次使用相位相关法估计的全局粗平移运动参数指导局部的角点匹配,以降低无效搜索、提高匹配的速度和稳健性,第二次使用改进的RANSAC算法鲁棒估算的精确变换模型参数再次指导角点匹配,以获得更多的有效匹配角点;算法使用奇异值分解最小二乘法估算变换模型参数,并使用LM非线性优化方法进一步降低配准误差。这种全局参数指导局部匹配的思路提高了现有算法的匹配速度,并较好的降低了错配,提高了算法的整体稳健性和配准精度。实验结果表明,与现有算法相比,对于图像重叠区域较小、图像中含有运动物体、重复性纹理等较难自动匹配情况,使用本文算法可以有效提高算法的成功率。

本文还提出了一种基于亮度与白平衡自动调整的图像镶嵌算法。该算法中,首先使用本文提出的基于角点匹配的图像配准算法对图像进行几何配准,然后在对应点位置处利用各个色彩通道的灰度信息估算图像色彩变换函数以进一步实现图像的光度配准,最后进行无缝的图像镶嵌。实验结果表明该算法可以较好的融合

1

存在一定亮度和白平衡差异的图像。

另外本文还介绍了宽基线条件下的特征匹配技术,并研究了基于尺度空间和不变量技术的SIFT特征点匹配算法及其应用。

关键词:图像配准;相位相关法;点匹配;图像镶嵌;SIFT特征匹配

2

ABSTRACT

Image Registration is a technique that relates or aligns different images taken from different viewpoints, at different times, or by different image sensing devices. Image mosaic technology uses the result of image registration to build large view panorama- like image from small adjacent image series, which could enlarge the user’s view scope and increase image resolution as well.

Till now, image registration and mosaic technology is widely used in the field of virtual reality(VR),video compression, image super-resolution, intelligent surveillance system, etc, which came to be an active research area in computer vision during recent years.

Feature-based, direct pixel difference optimization based, and Fourier based method are three typical ways of image registration, which have its own appropriate application area separately. The key problems focus on how to increase the algorithm speed, to increase the registration precision and to enhance the robustness of these registration methods.

This paper did research on overlayed-image registration and mosaicing technique and presented some new effective algorithms based on point-matching.

Firstly, the author did some research on frequency based and corner-matching based image registration technology used in short baseline correspondence condition. Then a new fast and robust image auto registration algorithm is presented. In this method, there is a new twice guided-matching scheme that first use phase correlation to estimate translational parameters to roughly guide local corner matching, and second use an improved RANSAC algorithm to estimate 8 parameters of perspective transformation to guide local corner matching again, with more precision. So much more valid corner matches could be quickly and stably generated. SVDLS (Singular Value Decomposition Least Square) is used to estimate transform parameters and Levenberg-Marquardt optimization is used to decrease registration error. The thought of guided matching mechanics is experimented to show better results than existing methods on matching speed, registration error, and the whole robustness of the algorithm.

Secondly, a simple, practical image auto stitching method based on brightness and white-balance automatic tuning is presented.Both of the geometric and photometric

3

registration techniques are employed in this method to efficiently estimate six linear parameters of the color transform model,after which the two images is well prepared for the next mosaicing step.

Thirdly, the invariant based registration technique is researched in this paper, and the author introduces the popular SIFT (Scale Invariant Feature Transform) based matching algorithm in the condition of wide baseline correspondence point matching technologies.

The algorithms in this paper are testified to be effective by lots of interesting, promising experimental results too.

Keywords: Image Registration; Phase Correlation; Point Matching; Image Mosaic; SIFT Feature Matching

4

第一章 绪论

本章首先阐述了图像配准的概念和图像配准的几类方法,然后分析了图像配准技术的应用领域及国内外研究现状,最后对本文的研究内容、研究重点和全文章节安排予以介绍。

1.1 课题背景介绍

近年来,随着数字化技术的不断发展,计算机处理能力不断提高、硬件装置价格的不断下降,各种先进实用的图像图形算法层出不穷,这使得计算机视觉技术变得更加切实可行。虚拟现实、模式识别、视频压缩等实用技术得到了广泛的关注。更多的算法开始由实验室走向市场。

我们使用光学成像系统可以从三维世界获得数字化的图像序列。对同一场景拍摄的图像序列实际上是真实的三维世界在不同时间向成像平面的一系列投影,图像帧与帧之间具有较大的相关性和信息冗余。这是图像配准研究的理论依据。

1.1.1 图像配准技术简介

图像配准(Image Registration)是图像处理的一个基本问题,它源自于多个领域的很多实际问题,如不同传感器获得信息的融合;不同时间、不同条件下获得的图像的差异监侧;成像系统和物体场景变化情况下获得的图像的三维信息获取;图像中的目标识别;多媒体数据库的检索等等。

简单来说,图像配准是将同一场景拍摄的不同图像进行对齐的技术,即找到图像之间的点对点映射关系,或者对某种感兴趣的特征建立关联。在中文文献中,图像配准也常被翻译作图像对齐、图像注册。

以同一场景拍摄而成的两幅图像为例。假如实际的三维世界点P在两幅图像中分别对应着p1和p2两个二维图像点。图像配准要做的就是找到p1和p2的映射关系,或者p1、p2跟P的关系。p1和p2被称为对应点(Correspondence Points)、匹配点(Matching Points) 或控制点(Control Points)。

5

1.1.2 图像配准技术分类

Barbara Zitova[1]从应用的角度将图像配准问题概括为下面四类情况:

(一)同一场景从不同角度拍摄形成的不同图像的配准问题。其研究目的是

获得更宽阔视野的图片,获得立体信息、进行三维模型等。

(二)不同时间拍摄的不同图像的配准问题。其研究目的是检测并定位场景

中的变化部分,比如在遥感图像处理技术中检测地理环境是否发生变

化,在医学图像处理技术中检测患者的局部部位是否发生病变,在自

动视频监控系统中智能化的检测是否有入侵等。

(三)不同传感器所拍摄图像的配准与融合问题,比如在CT、SPECT、MRS

等医学图像系统中的应用。

(四)二维场景的图像跟三维模型的配准问题,比如在GIS系统、目标辨识、

图像数据库检索系统中的应用。

无论所处理的图像是发生何种形式的变化、是用何种传感器去拍摄,我们总是力求使用不变的部分、共性的信息去完成配准,然后再根据需要去处理变化的部分。这就是图像配准技术的核心思想。

1.1.3 图像配准系统的组成

一个典型的图像配准系统包括四个部分[1]:

1.)特征检测(Feature Detection)

这里的特征指的是广义的特征,包括图像灰度、色度特征;角点、边缘、轮廓等结构性特征;频域信息、小波系数等[2]。

2.)特征匹配(Feature Matching)

即使用特征描述算子(即特征向量)和相似性策略对特征进行匹配。

3.)变换模型参数估算(Transform Model Estimation)

变换模型又称映射模型(Mapping Model),即将输入图像向参考图像映射

的坐标变换函数[1]。

4.)图像重采样与变换(Image Resampling and Transformations)

这一步就是我们由输入图像经变换模型向参考图像进行对齐的过程。变6

换后图像的坐标将不再是整数,这就涉及到重采样与插值的技术。

1.2 图像配准应用领域与研究现状

图像配准是立体视觉、运动分析、数据融合等实用技术的基础,在导航、地图与地形配准、自然资源分析、天气预报、环境监测、生理病变研究等许多领域有重要的应用价值。国内外学者针对不同的图像配准应用问题进行了大量的研究工作,早在1992年英国剑桥大学的Lisa Gottesfeld Brown在文献[3]中就总结了图像配准的主要理论及图像配准在各个领域的应用。当时他讨论的图像配准技术主要还是著眼于医学图像处理、遥感图像处理等传统应用领域。

时隔十四年,图像配准技术已经有了飞跃的发展。下面本文作者将综述介绍一下当前图像配准技术在虚拟现实、视频压缩、图像复原等领域的应用,并着重介绍图像配准及静态图像镶嵌技术的国内外研究近况。

1.2.1 虚拟现实与静态图像镶嵌

虚拟现实(Virtual Reality)技术是一系列多媒体新技术的汇集,其目标是用计算机来生成一个逼真的三维世界以给观众如同真实世界的体验。近年来随着计算机技术的发展,虚拟现实技术已经深入到游戏设计、建筑设计、医学仿真、军事仿真等诸多应用领域[4]。虚拟现实的实现方法分为传统的基于三维建模的方法和基于图像绘制的方法。基于三维建模的方法首先要对场景中的所有物体建立三维几何模型和光照模型,然后利用透视投影原理(将在第二章介绍)将三维几何模型映射到二维成像空间。基于三维建模的方法的缺点是:对硬件要求较高,设备复杂;渲染速度受场景复杂度的限制;生成的模拟世界真实感不佳等。

基于图像的虚拟现实技术(Image-Based Virtual Reality, 简称IBVR)的出现较好的解决了传统虚拟现实技术的这些不足。首先利用图像处理技术得到场景的全景图[5],然后采用几何变换和插值的方法就可以生成新的任意角度的视图。

获取全景图的方法有两种,一种方法是基于硬件实现的系统,比如使用鱼眼镜头、扫帚式摄像机等设备直接获取全景图。这种方法造价昂贵,获取的全景图含有较大的变形失真,而且图像分辨率也受到限制。另一种思路就是使用图像镶

7

嵌的方法。图像镶嵌是指将多幅图像进行组合、拼接的技术:首先对周边场景进行拍摄以得到一系列的重叠图像,然后利用重叠区域的信息计算出图像间的变换模型关系,并将其镶嵌起来以形成全景图[5-8,10]。

图像镶嵌要考虑三个最基本的问题,即首先要确定图像坐标变换的数学表示模型,或者说摄像机运动模型;其次要根据某种方法来估算、求解该模型的参数;最后将多幅图像统一投影、变形到一个新的坐标系,并使用某种图像融合算法进行拼合。

图像配准是图像镶嵌技术的核心问题。微软研究院的Richard Szeliski在1996年SIGGRAPH上提出了基于运动模型的全景图拼接算法[5]。Szeliski采用了非线性优化的方法来最小化像素两幅图像的亮度差以确定变换参数。该方法使用了全部像素进行优化处理,所以配准精度较高,但是计算速度较慢,且稳健性不佳。

国内的赵向阳,杜立民在2004年提出了一种基于特征点匹配的图像自动拼接算法[8],其中使用了Harris算法[9]提取角点并进行匹配。赵的算法采用了鲁棒变换估计技术,在一定程度上提高配准算法的稳健性,但是计算速度依然较慢,且无法配准重叠区域较小、运动物体较多的图像。M.Brown在2003年ICCV大会上发表了一篇名为Recognising Panoramas的文章[10],文中使用了基于不变量技术[11]的SIFT算法[12]进行图像配准,算法完全自动完成且效果较好。M.Brown的大会发言再次掀起了全景图拼接技术研究的热潮。

块匹配算法是用于运动图像编码的一种常用算法,其实质也是对视频图像序列的相邻帧进行配准[13]。块匹配算法中,每帧图像被分成二维的M×N像素的子块,假定每个子块内的像素都作平移运动。当前帧的M×N子块在上一帧对应的子块邻域窗口内搜索到与之最匹配的子块,当前子块与匹配块在二维平面上的位移即为运动估计得到的运动矢量。Dae-Hyun Kim[14]提出了一种改进的块匹配算法并将其用于全景图拼接技术中。

另外,B. Reddy和B. Chatterji [15]中提出了一种基于FFT的图像配准方法,可以处理包含平移、缩放和尺度变化在内的图像配准问题;李忠新等在2004年提出了一种基于频域相关的柱面全景图拼接技术[16]。这些方法都是在变换域进行图像配准的例子。

8

综上可见,面向图像镶嵌的图像配准算法主要可以分为三类[17]:基于特征匹配的方法;直接像素亮度差最小优化的方法;在变换域求解的方法。

1.2.2 动态镶嵌与视频压缩

图像镶嵌分为静态镶嵌(Static Mosaicing)和动态镶嵌(Dynamic Mosaicing)两种。1.2.1节介绍的属于前者。静态镶嵌是对一系列相邻帧图像的共性信息即背景的描述,但无法对每个帧独有的动态信息进行更新。

动态镶嵌则常见于视频压缩与编码等技术中[18,19]。基于动态镶嵌的视频压缩原理是:在一个视频图像序列中,相连续的帧之间重叠较大,体现出较强的延续性和相关性。我们可以将实际场景表示为前景物体和从序列图像中提取并镶嵌而成的背景,在存储和传输视频的时候我们只处理背景的Mosaic和每一帧的增量。而在需要复现某一帧的时候,则该序列中的任一帧可以由背景和增量的Mosaic完全表示,从而降低了信息冗余度,实现了视频数据的压缩。

动态镶嵌技术推动了视频压缩、图像检索、视频编辑和交互技术的发展。创建视频的动态镶嵌需要三个步骤[19]:(1)相邻帧的图像配准;(2)生成包含相邻一系列帧共性的背景Mosaic;(3)计算每一帧跟Mosaic相比的增量。

1.2.3 图像超分辨率复原

图像的超分辨率复原(Image Super-Resolution)[20]指的是从低分辨率图像中构造出高分辨率图像的技术。超分辨率图像复原技术最初是以单张图像重构的概念和方法提出的。对于单帧图像重构问题,主要的解决思路都是围绕重采样和插值算法来进行的。然而,通过这些单帧插值方法的图像经过放大后,会出现一些平滑效应,图像的边缘细节通常不能被很好的重构出来。

而多帧图像重构技术的出现弥补了这一不足。该技术是通过充分利用各幅低分辨率图像提供的不完全相同的信息来提高图像的分辨率的[21]。在由低分辨率图像重构高分辨率图像的过程中,建立重构模型时,必须要知道各低分辨率图象彼此之间的微位移量和微旋转角的大小。这就需要采用亚像素(Sub-Pixel)精度的精确图像配准技术。精确图像配准算法的好坏直接影响图像复原的最终效果。

9

图像超分辨率复原技术有两个重要用途,一是可以通过软件手段提高已有图像的分辨率,二是在不降低图像品质和细节的前提下实现降噪。目前图像超分辨率复原技术在军事、医学和公安等领域具有十分重要的应用价值和良好前景。

1.2.4 目标辨识与检索

图像识别和检索属于广义的图像配准范畴。在进行识别时,我们希望能找到一种对平移、缩放、旋转、光照变化、噪声等因素保持一定不变性、稳定性的图像局部特征算子,从而可以作为辨识物体的重要依据。

Schmid和Mohr最早在1997年就提出了基于尺度空间和不变量理论的图像特征描述算子[12,22]-SIFT算子(Scale Invariant Feature Transform)的概念,其含义是使用SIFT技术得到的图像特征向量对尺度的变化保持不变性。后来随着该算法的发展,SIFT算子已不仅仅是对尺度变化保持不变性,而是扩展到对旋转、尺度缩放、甚至部分的三维视角变化和光照变化保持不变,从而成为稳定性、适应性较强的局部特征匹配算子。

Schmid成功的将SIFT技术用于图像检索[22],而David G. Lowe则将其用于目标辨识[23],M.Brown则将SIFT特征匹配算法用于全景图自动拼接系统中[10],均取得了不错的效果。

1.3 本文的研究重点及章节安排

本文主要研究窄基线(窄基线的概念将在第二章介绍)条件下基于点特征的图像配准问题及在图像镶嵌中的应用。本文的研究重点着眼于提高当前配准算法的速度、配准精度和稳健性。另外本文对宽基线条件下的图像配准问题以及基于不变量技术的点特征匹配问题也作了一定研究。

本文研究内容概括如下:

1)系统研究了摄像机成像模型、坐标变换与摄像机运动,并论述了单应性

矩阵成立的条件;

2)研究了基于角点匹配和基于相位相关法的图像配准;

3)研究了鲁棒的变换估计技术;

10

4)介绍了图像插值算法、图像变形和流形技术;研究了图像镶嵌中的白平

衡与亮度自适应调整技术;

5)介绍了不变量技术,并研究了基于SIFT算子的特征匹配。

全文共分为六章,各章节内容安排如下:

第一章为绪论,阐述了图像配准技术的背景,介绍了图像配准技术的定义及分类,并概述了图像配准技术的应用领域及国内外研究进展。

第二章介绍了针孔摄像机模型及摄像机运动、坐标变换,介绍了窄基线和宽基线的概念,论证了8参数透视变换矩阵的应用条件,并概述了透视变换矩阵参数的求解方法。

第三、四章研究了窄基线情况下基于点特征的重叠图像配准技术,其中第三章阐述了图像特征的概念,并介绍了当前主流的边缘检测、角点检测和匹配方法,介绍了相位相关法估算平移参数的方法,然后提出了两次导向匹配的思想和改进的RANSAC算法,并将其用于角点匹配和变换模型参数估计。本章最后将给出本文算法与现有主流算法的对比实验。

第四章为图像变换与镶嵌,概述介绍了图像插值、重投影和图像融合技术,用实验结果分析了配准误差对图像镶嵌效果的影响,同时提出了一种白平衡与亮度自动调整的图像合成算法,然后介绍了影响图像合成清晰度的几个因素。本章的实验验证了算法的有效性。

第五章介绍了宽基线情况下基于SIFT算子的特征匹配,并用实验仿真结果进行分析讨论。

第六章总结了本文所作的工作,提出了仍然存在的问题,并对下一步的研究工作做了展望。

11

第二章 成像几何与图像变换模型

本章将阐述摄像机成像几何的基本原理,然后介绍摄像机运动与图像配准的关系、窄基线与宽基线、图像变换的知识,同时对8参数平面透视变换矩阵的存在条件进行了论证,并简介了几类求解参数的方法。

2.1 摄像机成像几何基础

2.1.1 针孔相机模型及摄像机坐标系

在一个成像系统中,二维图像每一点的灰度值反映了空间物体表面某点反射光的强度,而该点在图像上的位置则与空间物体表面相应点的几何位置有关。这些位置的相互关系由摄像机成像几何模型所决定[23,24]。在三维计算机图形学的研究中,为了简化问题的处理同时又满足应用的需要,常用针孔相机模型来代替实际的摄像机。针孔相机的成像几何关系称为透视投影(Perspective Projection)[25]。

图2-1 摄像机坐标系

首先定义摄像机坐标系O -X c Y c Z c ,如图2-1所示,O 称为投影中心,OZ c 为薄透镜的光轴,p 为像平面与光轴的交点,O-p 的长度即为焦距f 。

三维空间中实际点X 在摄像机坐标系内的空间坐标为(X c ,Y c ,Z c ),经过透视投影成像后形成二维像点x 其坐标为(x c ,y c )。二者由透视投影公式关联:

c

c c c c Z f Y y X x == (2-1)

式(2-1)中角标c 表示这是在摄像机坐标系下的坐标。等号两边单位都是毫米。

12

(x c ,y c )、(X c ,Y c ,Z c )属于欧氏坐标(Euclidean)。在欧氏坐标中,一个平面点由一个二维向量表示,一个三维空间点由一个三维向量表示。欧氏坐标因具备直观的特点而得到了广泛应用。为了更方便的表达透视投影公式及统一的描述平移、旋转等运动模型,我们引入齐次坐标的概念。齐次坐标增加了一个缩放因子w ,若一个二维点欧氏坐标为(x,y),则其对应的齐次坐标为(x w ,y w ,w )。齐次坐标系下的坐标点具有一个很重要的性质就是缩放不变性。本章在描述变换公式时,如无特殊声明,则默认使用齐次坐标。齐次坐标下的透视投影公式如式(2-2):

??????

??????????????????=??????????10100000

0001c c c c c c Z Y X f f y x Z (2-2) 2.1.2 世界坐标系与像平面坐标系

摄像机坐标系可以简明扼要的描述针孔相机模型的本质,但这还远远不够。完整的描述一个三维世界点到二维像素点的映射还需要知道摄像机内、外部参数,

即需要知道摄像机坐标系跟像平面坐标系、世界坐标系的关系。

图2-2 世界坐标系

世界坐标表示场景点在客观世界的绝对坐标。如图2-2所示,摄像机以某种姿态放置于一个实际的三维世界中。摄像机坐标系X c Y c Z c 与世界坐标系X w Y w Z w 不一定完全重合,而是具备一定的平移和旋转关系。

13

齐次坐标表示下坐标系的平移、旋转可以用一个4×4的矩阵来表示:

??????????????=??????????????????????=??????

????????1111w w w w w w c c c Z Y X Z Y X Z Y X M 0t R (2-3) 式(2-3)中,左边是摄像机坐标系下的齐次坐标,公式右边是一个4×4的变换矩阵乘以世界坐标系下的齐次坐标。其中R 是3×3的正交单位矩阵,代表旋转量,t 是3×1的平移向量,0=(0,0,0)。

接下来作者来介绍一下像平面坐标系。像平面坐标系反映了摄像机的内部构造对最终成像结果的影响。假设摄像机坐标系下的以毫米为单位的图像点坐标(x c ,y c ),其最终形成的图像像素为

(x,y)。

图2-3 像平面坐标系

图2-3为像平面坐标系,其中点O 定义在摄像机光轴和图像平面的交点。

0x x dx

x c ?= 0y y dy y c ?= (2-4) 像平面坐标系跟摄像机坐标系的关系如在式(2-4)所示,其中dx ,dy 代表每毫米物理尺寸对应的像素个数。将(2-4)表示成齐次坐标形式如式(2-5)所示:

?????????????????????????

?=??????????110010

01100c c y x y dy x dx y x (2-5) 我们将式(2-2)、(2-3)、(2-5)联立可得式(2-6):

14

110100

00

00 11010000000010010

0110000??????????????????????????????=?????????????????????????????????????????????

?=??????????w w w y x

w w w c Z Y X y a x a Z Y X f f y dy x dx y x Z 0t R 0t R (2-6) 其中a x =f /dx ,a y =f /dy 。将式(2-6)简记为:

[]w w c Z X P X t R K x |== (2-7)

式(2-7)中,X w =[X w ,Y w ,Z w ,1]T 是齐次坐标表示的三维世界点坐标,x =[x,y,1]T 是齐次坐标表示的二维平面点的像素坐标。Z c 为X w 的深度,为该点到焦平面的距离。P 是3×4的三维投影投影矩阵,由K 和[R|t ]连乘得到,其中:K 完全由a x ,a y ,x 0,y 0决定,其只与摄像机内部结构有关(包括摄像机焦距、镜头纵横比、图像中心坐标),我们称这些参数为摄像机内参数(Camera Intrinsic Parameters);[R|t ]完全由摄像机相对于世界坐标系的方向和位置决定,称为摄像机外参数(Camera Extrinsic Parameters)[24]。摄像机内、外参数可以由摄像机标定(Camera Calibration)技术求得

[26]。

至此,根据式(2-7),如果已知摄像机的内、外参数,对于任何空间点X w 就可以唯一确定它的图像点的位置x (其中Z c 可以联立去掉)。这就是针孔相机几何成像原理的完整表述。

2.2 摄像机运动

2.2.1 摄像机运动的基本形式

一般摄像机运动可以分为以下几种基本运动形式[6,25]:

平移运动(Translation),即摄像机的运动平行与成像平面。如图2-4(a)

镜头缩放运动(Zooming),即焦距发生变化,或者相机作延光轴(即z 轴)

方向的运动。如图2-4(b)

15

水平扫动(Panning),即摄像机绕y轴转。如图2-4(c)

垂直扫动(Tilting),即摄像机绕x轴转。如图2-4(d)

旋转运动(Rolling),即摄像机绕光轴转。如图2-4(e)

(a) 平移(b) 缩放(c) 水平扫动

(d) 垂直扫动(e) 旋转

图2-4 五种基本摄像机运动

2.2.2 摄像机运动与图像配准

实际的摄像机运动一般是上述五种基本运动的组合。图像配准问题其实就是研究在某种摄像机运动下拍摄的不同图像的图像模型参数求解问题,或者说是摄像机运动参数估计问题。

假设场景点的三维世界坐标X w及两次成像的透视投影矩阵P1、P2已知,则可分别确定成像点x1、x2。由于x1和x2对应于同一三维世界点X w,所以称之为一对匹配点、对应点。两幅图像的匹配点是位于重叠区域内的像素点。

图像配准是上述过程的逆向过程,即根据同一三维场景的两幅或多幅图像确定对应点并由此计算出图像变换模型,甚至根据匹配点及其他约束条件进而重建出三维场景[27]。后者属于立体视觉的研究范畴。

2.3 图像变换模型

图像变换模型是指两幅二维图像所具备的坐标变换关系。在某种约束的摄像机运动条件下,三维场景形成的两幅或多幅图像之间的关系可以完全由图像变换

16

模型描述。本文作者所做的研究都是围绕着某种特定的图像变换模型展开的。2.3.1 透视变换模型的论证

本节将论证满足以下两个条件之一的情况下,两幅图像之间的对应关系可以由一个3×3的平面透视变换矩阵(Planar Perspective Transform)来表示[24,28,29]:? 1. 相机绕光心转动时拍摄的任意三维场景(如图2-5(a)所示)

这里三维空间是可以任意分布的,但要求摄像机镜头严格绕光心旋转拍摄:即可以进行水平扫动、垂直扫动、旋转及镜头缩放,

但不可以发生相机平移。

近似条件:将摄像机近似固定于一点进行拍摄。

? 2. 相机以任意运动方式运动拍摄的平面场景(如图2-5(b)所示)平面场景是指不具备立体信息的类似于平面的场景,比如一堵墙、一幅油画等。

近似条件:场景深度远大于焦距时。

(a) 相机绕光心转动拍摄的任意三维场景

(b) 相机以任意方式拍摄的平面场景

图2-5 透视变换矩阵成立的两个条件

17

下面将简单的证明一下这两个条件。

对于第一种情况,假设世界坐标系和第一幅图像的摄像机坐标系重合,则第二幅图像的摄像机坐标系与世界坐标系的关系可以用旋转矩阵R 和平移向量t 来表示。将两个摄像机的透视投影公式表示如下:

]|[110I K P = (2-8)

]|[22t R K P = (2-9)

式(2-8)和(2-9)中,K 1、K 2为3×3摄像机内参数矩阵,I 为3×3的单位阵,R 为3×3旋转矩阵,t 为三维平移向量,0=[0,0,0]T 。由式(2-7)、(2-8)、(2-9)有:

w c Z X 0I K x ]|[111= (2-10)

t K R K X t R K x 22222 ]|[+????

??????==w w w w c Z Y X Z (2-11)

由(2-10)得: (2-12)

????

??????==?w w w w c Z Y X Z X 0I x K ]|[1111

联立(2-11)和(2-12)得: (2-13) t K x RK K x 21112122+=?c c Z Z 根据式(2-13),若三维场景静止,只要摄像机绕光心转动拍摄,就有t =0,得:

1112122x RK K x ?=c c Z Z (2-14)

记H =Z c1K 2RK 1-1/Z c2,则式(2-14)可以表示为:

12Hx x = (2-15)

上式中H 是一个3×3的满秩矩阵,称为平面透视变换矩阵,简称透视变换矩阵,又称单应性矩阵(Homography)。可见对一任意三维场景以除平移之外的运动方式进行拍摄所形成的图像像素点坐标满足式(2-15)的单应性矩阵变换关系。 对于第二种情况,假设所拍摄的三维场景点都位于同一平面上,其平面方程为n ΠT X w =d ,其中n 为该平面的单位法向量,d 为坐标原点到该平面的距离。由式(2-13)得:

()

11211212 / x H x K n t K H x Π?=+=c T c Z Z (2-16)

18

地的总结图像配准算法

图像配准定义为:对从不同传感器、不同时相、不同角度所获得的两幅或多幅图像进行最佳匹配的处理过程[2]。图像配准需要分析各分量图像上的几何畸变,然后采用一种几何变换将图像归化到统一的坐标系统中。在配准过程中,通常取其中的一幅图像作为配准的标准,称之为参考图像;另一幅图像作为配准图像。 图1-1 图像配准的基本流程 图1-2 图像配准方法分类

根据配准使用的特征,图像配准的方法大致可分为三类: (1)基于图像灰度的配准算法。首先从参考图像中提取目标区作为配准的模板,然后用该模板在待配准图像中滑动,通过相似性度量(如相关系数法、差的平方和法、差的绝对值法、协方差法)来寻找最佳匹配点。 (2)基于图像特征的配准算法。该算法是以图像中某些显著特征(点、线、区域)为配准基元,算法过程分为两步:特征提取和特征匹配。首先从两幅图像中提取灰度变化明显的点、线、区域等特征形成特征集。然后在两幅图像对应的特征集中利用特征匹配算法尽可能地将存在对应关系的特征对选择出来。对于非特征像素点利用插值等方法作处理推算出对应匹配关系,从而实现两幅图像之间逐像素的配准。 (3)基于对图像的理解和解释的配准算法。这种配准算法不仅能自动识别相应像点,而且还可以由计算机自动识别各种目标的性质和相互关系,具有极高的可靠性和精度。这种基于理解和解释的图像配准涉及到诸如计算机视觉、模式识别、人工智能等许多领域。不仅依赖于这些领域中理论上的突破,而且有待于高速度并行处理计算机的研制。 从自动化角度来看,可以将配准过程分为自动、半自动和手动配准。 存在问题:如何提高图像的配准速度将是大范围遥感图像自动配准问题的要点;选取何种自动配准方案以保证图像的配准精度将是大范围遥感图像自动配准问题的另一要点。 2(,)[1((, f x y g f h x y 其中,h表示二维空间坐标变换。g表示灰度或辐射变换,描述因传感器类型的不同以及成像时气候等环境的影响所带来的图像灰度的变换。配准问题的实质就是要找到最优的空域变换h和灰度变换g,使得上述的等式成立,从而找到配准变换的参数 特征空间的选择通常要考虑以下几个因素:相似性;空间分布;唯一性。 在自动图像配准中对特征的理解可以分为两类。(1)基于灰度的方法:基于灰度的方法将重点放在特征匹配上,在其过程中并没有真正提取特征。一般所说的模板匹配法就是这种方法的代表。这种方法实际上将图像的灰度分布直接作为特征而构成匹配的基础。(2)基于特征的方法:基于特征的方法需要在图像中提取显著的特征:区域(森林、湖泊、农田等)、线(区域的边界、道路等)和点(区域的角

基于形状匹配的快速图像配准

2008年4月张素等:基于形状匹配的快速图像配准 2实验结果与分析 为检验本文算法的有效性,取一幅分辨率为512×512的腹部cT图像(图3(a)),依次进行伸缩、旋转、平移变换,再加入高斯噪声,得到另一幅图像(图3(b)).变换公式为 [≥]=j[一:;兰0][二]+[芝](18)式中:(J,y)为参考图像上的点;(t),’)为变换之后的点;J为伸缩比例;p为参考图像的旋转角度,分别用Poweu搜索算法和本文算法进行配准,配准参数的精度为0.001.实验在一台CPU为Celeron、主频为2.8GHz、内存为512M的计算机上进行.图3为算法流程中,轮廓提取、标记点自动提取以及形状匹配的结果.表1列出了一部分代表性的比较结果(其中丁为配准全过程所耗费的时间). 图3轮廓提取、标记点自动提取以及形状匹配的结果 F193 Re蛐№ofregi佃e砷撇惦on'autom雠lalI山mrbdete甜仙姐dshpe删nc址啤 衷1本文算法与PoweⅡ算法结果的比较 T|山.1C岫para6ver器IIltsbetw咖thepro肼lsedm劬od aⅡdPoweuaIgorithm 变换及配 旷无量纲占/(o)厶x|缸l r,s 准参数像素像素 变换参数050060肿020DoO3ⅢD00_—— PoweU法050260D5219J05528五58560 初始参数049760.040193173150l_—— 本文算法050060.29419.88429.82325变换参数lo∞40肿0lO姗50D00。—— PoweU法lO∞40舶l9.11550j02l190 初始参数l-00040.olO10J昕349.92l●—— 本文算法1000钧0959.952500的30 变换参数15∞10Doo20DOO30.000_——poweU法1姗10D072039929_994680初始参数15029.9971937229217_—— 本文算法150010JD4920.0503028342 变换参数150030加040肿0IO.000 Pov岭U法104628鹏5.48571.43.687’l230初始参数150529.95539D067.9∥ 本文算法150130J02239514lOJ昕327 变换参数2肿O10.aDO15加O20.000●—— PoweU法1.91939j92l15矗6423272‘ll∞ 初始参数2肿610.018 13剃17.盯5.●——本文算法2D00lO.12616_01320JD2253注:用上标#表示的数据稍偏离变换参数;用上标?表示的部分数据为错误结果. 由表1的结果可以看出,用Poweu算法直接进行搜索,计算时间较长,且有时因收敛到局部极值而产生错误结果,如表中用卑号标出的数据.而采用本文的算法完全达到了预期目的,大大减少了计算量,精度达到了“亚像素”级水平,有效地避免了收敛于局部极值.观察表l中用SVD法求得的初始参数,可以看出,这些参数实质上已经非常接近最终的配准参数,这是因为形状信息本身就是比较精确的特征量;其中有几个数据稍偏离配准参数,这是因为较大的变换参数(主要是缩放参数s)会使形状匹配过程中产生相对较大的误差.计算过程中,特征提取、形状匹配、SVD法求初始参数等步骤所耗费的计算量均比较小,而Powell算法一旦得到了与变换参数较接近的初始参数,就会很快地收敛到正确结果,这是由PoweU算法本身的性质所决定的.本实验中,在绝大多数情况下,只需要计算一个循环即可收敛.因此,PoweU算法的作用其实相当于对SVD法所得的参数进行修正. 3结语 本文将形状特征和互信息搜索相结合,有效地提

图像配准技术研究进展

第14卷第6期2007年12月 电光与控制 EU£CTRONICSOPTICS&CONTROL V01.14№.6 Dee.2007 文章编号:1671—637X(2007)06—0099—07 图像配准技术研究进展 刘松涛,杨绍清 (海军大连舰艇学院信息与通信工程系,辽宁大连116018) 摘要:图像配堆是解决图像融合、图像镶嵌和变化检测等问题的必要前提。其应用遍及军事、遥感、医学和计算机视觉等多个领域。筒要回顾了图像配准技术的发展史和研究现状.重点阐述了当前的技术热点和应用趋势,最后展望了进一步的研究方向。 关键词:图像配准;信息论;非刚性配准;虚拟结构 中图分类号:V243.6文献标识码:A Progressinimageregistrationtechniques LIUSong—taa,YANGShao—qing (Oept.ofInformation&CommtmicdionEt,g泌rit,.g,DafianNavalAcademy,Dalian116018,舀白Ⅺ) Abstract:Imageregistrationisessentialforallimageanalysistaskslikeimagefusion,imagemosaicandchangedetection.Itisusedwidelyinmilitarysystem,medicalimaging,remotesensing,computervision,etc.Thehistoryandcurrentetatusofimageregistrationtechniquesfirereviewedkeflywithemphasisonitscurrenttechnicalhotspotsandapplicationtrends.Someinterestingaspectsforfurtherstudya”pointedoutintheend. Keywords:imageregistration;informationtheory;110n—rigidregistration;virtualstructUre 0引言 图像配准是许多应用问题必须的预处理步骤,比如:时序图像的变化检测或多模图像融合,这些问题遍及军事、遥感、医学、计算机视觉等多个领域。许多领域都需要图像配准,实际应用过程可能会有所不同,但其中关键的因素是类似的。概括地说,图像配准是对取自不同时间、不同传感器或者不同视角的同一场景的两橱或多幅图像进行最佳匹配的过程,包括像素灰度匹配和空间位置对齐。 配准方法的分类可以依据不同的准则。Bro.wn…依据变换模型的复杂程度对配准方法进行分类,并归纳了配准技术的实现步骤:特征空问、相似度测量、搜索空间和策略。Maintz”1等则提出了9 收稿日期:2006—03—09修回Et期:2006—05—15 基金项目:国防预研基金资助项目(51403030604JBl40I);国家自然科学基金资助项目(60572160) 一 作者简介:荆松涛(1978一),男,河南孟津人,博士,主要研究方向为图像融合、耳标识别、成像跟踪、DSP开发 等。条分类准则,依次为:图像维数、配准特征的来源、变换模型、坐标变换域、交互性、优化策略、成像模式、配准对象、配准目标的特点等。作者参考Brown和Mainlz的分类方法,将配准技术概括为8个方面,包括:配准对象、特征提取、特征匹配、变换模型、优化策略、坐标变换与插值、系统实现及算法评估,并考虑每项内容的技术特性进行细分,然后依据某一算法的创新点进行分类。囊括所有方法的分类准则是不存在的,所提方法侧重于从总体上对配准方法进行考察,是一种相对能反映配准方法本质特征的分类方法。依据新的分类准则,作者已对图像配准技术的8个子方向进行了系统研究uJ。 1发展史和研究现状 国外从20世纪60年代就开始在图像配准领域进行研究“】,但直到1980年代才开始引起学者们的关注。到上世纪末,单模图像配准问题已基本解决,但多模图像配准由于涉及模式和领域的复杂性.仍需密切关注。国际上对图像配准技术曾做过调查”】,其结论是1990年代初技术文献明显增加。而

图像配准技术方法研究

图像配准技术方法研究 摘要随着信息技术的迅猛发展,图像配准技术已经在军事、遥感、医学、计算机视觉等多个领域得到了广泛的应用。图像配准技术是图像处理的一个基本问题,它是将不同时间、传感器或视角下获取的相同场景的多幅图像进行匹配的图像处理的过程。三类图像配准的方法大致如下:基于灰度的图像配准方法。基于变换域的图像配准方法。基于特征的图像配准方法。本文将应用这三种方法对图像配准进行研究。并重点研究基于特征的图像配准方法。 关键词图像配准,特征点匹配,灰度插值,控制点的提取 Abstract The technology of image registration is being widely used in the military, remote sensing , medical, computer, visual and any other fields with the rapid development of information technology. The technology of image registration is a kind of process to match different pictures getting from different periods and different cameras but a same scene, it is a basic point to handle the pictures. There are three kinds of ways to do the image registration:According to the level of the color of gray getting from the pictures.According to transforming domains.According to the features The three kinds of ways will be used to discuss the image registration in the thesis, and the way according to the features will be discussed more in the thesis.

图像配准的方法

图像配准的方法 迄今为止,在国内外的图像处理研究领域,已经报道了相当多的图像配准 研究工作,产生了不少图像配准方法。总的来说,各种方法都是面向一定范围 的应用领域,也具有各自的特点。比如计算机视觉中的景物匹配和飞行器定位 系统中的地图匹配,依据其完成的主要功能而被称为目标检测与定位,根据其 所采用的算法称之为图像相关等等。 图像配准的方式可以概括为相对配准和绝对配准两种:相对配准是指选择 多图像中的一张图像作为参考图像,将其它的相关图像与之配准,其坐标系统 是任意的。绝对配准是指先定义一个控制网格,所有的图像相对于这个网格来 进行配准,也就是分别完成各分量图像的几何校正来实现坐标系的统一。本文 主要研究大幅面多图像的相对配准,因此如何确定多图像之间的配准函数映射 关系是图像配准的关键。通常通过一个适当的多项式来拟合两图像之间的平移、旋转和仿射变换,由此将图像配准函数映射关系转化为如何确定多项式的系数,最终转化为如何确定配准控制点(RCP)。目前,根据如何确定RCP的方法和图像配准中利用的图像信息区别可将图像配准方法分为三个主要类别:基于灰度信 息法、变换域法和基于特征法[25],其中基于特征法又可以根据所用的特征属 性的不同而细分为若干类别。以下将根据这一分类原则来讨论目前已经报道的 各种图像配准方法和原理。 1基于灰度信息的图像配准方法 基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而 是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是 实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变 换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多 基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯相似度检测匹配法、交互信息法。 (1)互相关法

医学图像配准技术 综述

医学图像配准技术 A Survey of Medical Image Registration 张剑戈综述,潘家普审校 (上海第二医科大学生物医学工程教研室,上海 200025) 利用CT、MRI、SPECT及PET等成像设备能获取人体内部形态和功能的图像信息,为临床诊断和治疗提供了可靠的依据。不同成像模式具有高度的特异性,例如CT通过从多角度的方向上检测X线经过人体后的衰减量,用数学的方法重建出身体的断层图像,清楚地显示出体内脏器、骨骼的解剖结构,但不能显示功能信息。PET是一种无创性的探测生理性放射核素在机体内分布的断层显象技术,是对活机体的生物化学显象,反映了机体的功能信息,但是图像模糊,不能清楚地反映形态结构。将不同模式的图像,通过空间变换映射到同一坐标系中,使相应器官的影像在空间中的位置一致,可以同时反映形态和功能信息。而求解空间变换参数的过程就是图像配准,也是一个多参数优化过程。图像配准在病灶定位、PACS系统、放射治疗计划、指导神经手术以及检查治疗效果上有着重要的应用价值。 图像配准算法 可以从不同的角度对图像配准算法进行分类[1]:同/异模式图像配准,2D/3D图像配准,刚体/非刚体配准。本文根据算法的出发点,将配准算法分为基于图像特征(feature-based)和基于像素密度(intensity-based)两类。 基于特征的配准算法 这类算法利用从待配准图像中提取的特征,计算出空间变换参数。根据特征由人体自身结构中提取或是由外部引入,分为内部特征(internal feature)和外部特征(external feature)。

【作者简介】张剑戈(1972-),男,山东济南人,讲师,硕士 1. 外部特征 在物体表面人为地放置一些可以显像的标记物(外标记,external marker)作为基准,根据同一标记在不同图像空间中的坐标,通过矩阵运算求解出空间变换参数。外标记分为植入性和非植入性[2]:立体框架定位、在颅骨上固定螺栓和在表皮加上可显像的标记。Andre G[3]等将该方法用于机器人辅助手术,对于股骨移植,位移误差小于1.5mm,角度误差小于3°,由于计算量小,可以实现实时配准。但是标记物必须事先被固定好,不能用于回顾性配准,而且该方法只适用刚体配准。 2. 内部特征 从医学影像中可以提取出点、线和面:血管的交点、血管、胸腹之间的横膈膜等,这些特征作为内标记点(internal marker) ,利用其空间位置同样可以求解出空间变换参数。Hill DL[4]用11个形态点对脑部配准,误差<1mm,方差为1.73mm。Meyer CR[5]除了血管树的交点,还使用了左右脑之间的间隔等特征。Maurer CR[6,7]赋予点、线、面等几何特征不同的权重(weighted geometrical features, WGF),进一步改进了算法。内标记点配准是一种交互性的方法,将3D图像配准简化为点、线和面的匹配,可以进行回顾性研究,不会造成患者的不适。但是医生对特征位置的判断影响到配准精度,为了克服人为误差,需要多次重复操作,以平均值作为最终结果。 表面匹配算法也利用了内部特征[8]:进行图像分割,提取出轮廓曲线、物体表面等内部特征,使2D/3D图像配准简化为2D曲线和3D曲面的匹配,不再考虑物体内部像素。典型的应用是刚体配准的“头帽”算法[9],从头部的3D图像中分割出表面轮廓,分别作为头模型和帽模型。配准的目标函数是头表面和帽表面之间的均方距离,该距离是空间变换参数的函数。表面匹配算法是一种自动算法,在物体表面轮廓相似并且清晰的情况下,配准效果很好。其不足之处在于:准确地进行图像分割很困难;不同模式的图像,如CT/PET图像,由于器官的轮廓差异较大,难于精确地匹配。 3. 在非刚体配准中的应用 进行非刚体配准前要确定物理模型,常见有弹性模型、粘稠液体模型、生物力学模型。通过在感兴趣区域中提取参考点、2D或是3D轮廓线,使待配准图像

多模图像配准融合

多模图像配准融合

浅析多模态医学图像的配准与融合技术 来源:本站原创作者:朱俊林发布时间:2009-06-07 1 医学图像的配准技术简介 医学图像的配准技术是90年代才发展起来的医学图像处理一个重要分支, 并且日益受到了医学界和工程界的重视。医学图像的配准是指对于一幅医学图 像寻求一种或者是一系列的空间变换,使两幅图像的对应点达到空间位置和解 剖结构的一致,这种一致是指人体上的同一解剖点在两张匹配的图像上有相同 的空间位置。简单地说医学图像配准就是解决两幅图像的严格对齐问题。配准 的结果应使两幅图像上所有的解剖点,或至少是所有具有诊断意义的解剖点及 手术感兴趣的点都达到匹配。 医学图像的配准按图像来源分为:单模态(mono-modality)与多模态配准(multi-modality)。单模态配准是指对来自同一成像设备的不同时刻或不同角 度的图像进行配准。但在实际临床应用中,单一模态的图像往往不能提供医生 所需要的足够信息,通常需要将不同模态的图像融合在一起得到更丰富的信息 量,从而作出准确的诊断,制订出合适的治疗方案。所谓多模态配准,是将来 自不同形式的医学图像进行空间上的对准,将对应的相同解剖位置标记出来以 实现图像融合和进一步后期处理。多模态图像之间的配准使用最频繁,主要应用在诊断方面,可分为解剖—解剖的配准和解剖—功能的配准两大类,前者将显示组织形态学不同方面的两幅图像混合,后者将组织的新陈代谢与它相对于解剖 结构的空间位置联系起来。目前,主要的研究工作重点是进行CT、MRI以及PET、fMRI等图像的配准。 2 医学图像融合技术简介 医学图像的融合是指将两幅(或两幅以上)来自不同成像设备或不同时刻获 取的已配准图像,采用某种算法,把各个图像的优点或互补性有机结合起来, 获得信息量更为丰富的新图像的技术。医学诊断往往要综合许多不同信息进行, 传统的方法是,临床医生利用灯箱分别观看这些胶片,综合对比,得到结果。 如果能够把这些互补信息以某种方式综合在一起作为一个整体作为医学诊断的 依据,使得临床医生只要在一张综合图像上就能看到不同原始图像的信息,那 么就能提供全方位的信息细节。 3 医学图像配准及融合的关系及意义 医学图像的配准和融合有着非常密切的关系,特别是对于多模态图像而 言,配准和融合是密不可分的。配准是融合的前提,也是决定图像融合技术发 展的关键技术,若事先不对待融合图像进行空间上的对准,那么融合后的图像 也是毫无意义的。融合是配准的目的,通过来自不同影像设备的图像融合,可 以得到更多的信息,提高影像数据的利用率。在多模态医学图像信息融合中, 是要把相对应的组织结构融合在一起,而待融合的图像往往来自不同的成像设 备,它们的成像方位、角度和分辨率等因素都是不同的,所以这些图像中相应 组织的位置、大小等都是有差异的,必须先进行配准处理,才能实现准确地融 合。

图像匹配的主要方法分析

图像匹配的主要方法分析 在我国的图像处理中,有很多的关键技术正在不断的发展和创新之中。这些相关技术的发展在很大程度上推动了我国图像处理事业的发展。作为图像处理过程中的关键技术,图像匹配技术正在受到越来越多的关注。文章针对图像匹配的主要方法进行详细的论述,希望通过文章的阐述和分析能够为我国的图像匹配技术的发展和创新贡献微薄力量,同时也为我国图像处理技术的发展贡献力量。 标签:图像处理;图像匹配;特征匹配;方法 在我国的图像处理技术中,图像的匹配技术不仅仅是其中的重要组成部分,同时还是很多图像技术的发展创新的技术基础。例如图像技术中的立体视觉技术;图像技术中的运动分析技术以及图像技术中的数据融合技术等。通过上述内容可以看出,在我国的图像技术中,图像匹配技术具有非常广泛的应用。随着我国的相关技术不断的创新和发展,对于图像匹配技术的要求也是越来越高。这样就要求我国的图像匹配技术有更深层次的研究和发展。我国现阶段的研究主要是针对图像匹配过程中的匹配算法进行研究,希望借助研究能够更加有效的提升在实际的工作应用中的图像质量,同时也能够在很大程度上提升图像处理的图像分别率。文章的主要陈述点是通过图像匹配技术的具体方法进行优点和缺点的分析,通过分析优点和缺点来论述我国图像处理技术中的图像匹配技术的发展方向以及改进措施。近些年出现了很多的图像匹配方法,针对现阶段的新方法以及新的研究思路我们在实际的应用过程中要有一个非常清醒的选择。文章针对这一问题主要有三个内容的阐述。第一个是图像匹配技术的算法融合;第二个是图像匹配技术中的局部特征算法;最后一个是图像匹配技术中的模型匹配具体算法。 1 现阶段在世界范围内较为经典的图像匹配技术的算法 关于现阶段在世界范围内的较为经典的图像匹配技术的算法的阐述,文章主要从两个方面进行分析。第一个方面是ABS图像匹配算法。第二个方面是归一化相互关图像匹配算法。下面进行详细的论述和分析。 (1)算法一:ABS图像匹配算法。ABS图像匹配算法最主要的原理就是要使用模板的图像以及相应的匹配图像的搜索用窗口之间的转换差别来显示两者之间的关联性。图像匹配的大小在数值上等同于模板图像的窗口滑动顺序。窗口的每一次滑动都会引起模板图像的匹配计算。现阶段ABS的算法主要有三个,如下: 在选择上述三种计算方法的过程中要根据实际情况社情相应的阀值,否则会出现很高的失误率。上述的三种算法使用范围较狭窄。只使用与等待匹配的图像在模板影像的计算。 (2)算法二:归一化相互关图像匹配算法。归一化相互关的图像匹配算法在现阶段是较为经典的算法。通常专业的称法为NC算法。此计算方法主要是采

配准综述

图像配准是对取自不同时间,不同传感器或者不同视角的同一区域的两幅或者多幅图像进行匹配叠加的过程。随着技术手段的不断发展,人们对图像配准的要求也越来越离。包括配准方法的鲁棒性、算法的难易程度、算法的自主性等都是考量算法的指标。图像配准的方法中,有人提出过被广泛认同的四个巧骤: a.特征空间的选择 特征空间是指将运用到配准中元素的集合。特征空间包括很多方面,比如像素值,比如点、线,或者平面甚至是曲面。 b.搜索空间 搜索策略是指一系列配准变换操作的集合。搜索空间是建立在几何形变基础上的。而几何形变一般包括全局的和局部的几何形变。典型的全局变形包括平移,缩放,扭曲等变形以及它们的组合。而局部形变,对变换参数要求比较苛刻,因为某一套变换参数只能作用在局部形变区域,而其余区域需采用插值技术补充。然而,另外的变形区域则需要另外的变换参数去表述。在一般的处理中,我们将变换模型看成是一种先验知识。不然则需要考量所有的变换模型。 c.搜索策略 搜索策略是实施变换的依据。它的存在是为了找寻变换模型的最优解。常用的搜索策略有松弛模型法、牛顿法和共扼梯度法。 d.相似性度量 相似性度量是对采用的变换模型的评价。相似性度量主要是采用参考图像和配准图像之间的共有的特征之间的差异比较的方法来评价配准的情况。这其中的差异可以包括点位的误差,或者是灰度值相关的差异,还可以是在变换域之间的差异值等等。最常见的相似性度量是检测特征的欧氏距离。 上述的几个步骤构成了图像配准的基本框架。许许多多的算法充斥其中产生了种类繁多的配准方法。下面主要介绍下几种典型的配准算法。目前典型的配准算法中大致可分成基于灰度、基于特征和基于模型的方法。 基于灰度的配准算法 基于灰度的算法中,重点是对图像配准的过程上,而不是特征集的选择

图像识别匹配技术原理

第1章绪论 1.1研究背景及意义 数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。通常,像素在计算机中保存为二维整数数组的光栅图像,这些值经常用压缩格式进行传输和储存。数字图像可以由许多不同的输入设备和技术生成,例如数码相机、扫描仪、坐标测量机等,也可以从任意的非图像数据合成得到,例如数学函数或者三维几何模型,三维几何模型是计算机图形学的一个主要分支。数字图像处理领域就是研究它们的变换算法。 数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。 图像配准(Image registration)就是将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程,它已经被广泛地应用于遥感数据分析、计算机视觉、图像处理等领域。 图像配准的方法迄今为止,在国内外的图像处理研究领域,已经报道了相当多的图像配准研究工作,产生了不少图像配准方法。总的来说,各种方法都是面向一定范围的应用领域,也具有各自的特点。比如计算机视觉中的景物匹配和飞行器定位系统中的地图匹配,依据其完成的主要功能而被称为目标检测与定位,根据其所采用的算法称之为图像相关等等。 基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯相似度检测匹配法、交互信息法。 目前主要图像配准方法有基于互信息的配准方法,基于相关性的配准方法和基于梯度的配准方法。其中基于梯度的方法基本很少单独使用,而作为一个辅助

基于ICP算法的图像配准的MATLAB实现

function [TR, TT] = icp(model,data,max_iter,min_iter,fitting,thres,init_flag,tes_flag,refpn t) % ICP Iterative Closest Point Algorithm. Takes use of % Delaunay tesselation of points in model. % % Ordinary usage: % % [R, T] = icp(model,data) % % ICP fit points in data to the points in model. % Fit with respect to minimize the sum of square % errors with the closest model points and data points. % % INPUT: % % model - matrix with model points, [Pm_1 Pm_2 ... Pm_nmod] % data - matrix with data points, [Pd_1 Pd_2 ... Pd_ndat] % % OUTPUT: % % R - rotation matrix and % T - translation vector accordingly so % % newdata = R*data + T . % % newdata are transformed data points to fit model % % % Special usage: % % icp(model) or icp(model,tes_flag) % % ICP creates a Delaunay tessellation of points in % model and save it as global variable Tes. ICP also % saves two global variables ir and jc for tes_flag=1 (default) or % Tesind and Tesver for tes_flag=2, which % makes it easy to find in the tesselation. To use the global variables % in icp, put tes_flag to 0. % % % Other usage: % % [R, T] = icp(model,data,max_iter,min_iter,... % fitting,thres,init_flag,tes_flag) % % INPUT: % % max_iter - maximum number of iterations. Default=104 % % min_iter - minimum number of iterations. Default=4 % % fitting - =2 Fit with respect to minimize the sum of square errors. (default) % alt. =[2,w], where w is a weight vector corresponding to data. % w is a vector of same length as data.

图像配准算法综述

杭州电子科技大学 毕业设计(论文)文献综述 毕业设计题目SIFT特征研究及应用 文献综述题目图像配准算法综述学院生命信息及仪器工程学院 专业电子信息技术及仪器 姓名 班级 学号 指导教师

图像配准算法综述 一.前言 图像配准是指找出场景中同一物体表面的结构点在不同图像上的投影像素点之间的对应关系,是图像信息处理领域中一项非常重要的技术,同时也是其它一些图像分析技术,如立体视觉、运动分析、数据融合等的基础。 目前图像配准广泛应用于虚拟现实、视频压缩、图像复原、图像数据库检索等技术中。图像配准的研究是计算机视觉中最困难也是最重要的任务之一。不同的图像配准方法总是对应于某种适用的图像变换模型,其核心问题是提高配准的速度、精度和算法的稳健度。 随着科学技术的发展现在约40%的机器视觉应用中都会使用图像匹配技术,所涉及的领域有:工业检测,导弹的地形匹配,光学和雷达的图像跟踪,交通管理,工业流水线的自动监控、工业仪表的自动监控,医疗诊断,资源分析,气象预报,文字识别以及图像检索等。 图像匹配研究按其处理步骤可以分为样本采集、样本预处理、样本分割、样本的特征提取等,并且与计算机视觉、多维信号处理和数值计算方法等紧密结合。它也是其它一些图像分析技术,如立休视觉、运动分析、数据融合等的基础。正因为其应用的广泛性,新的应用和新的要求逐步产生,使得匹配算法的研究逐步走向深入,出现了快速、稳定、鲁棒性好的匹配算法。因此,研究图像的匹配算法对于如何提高实际工程中的图像处理质量和识别精度具有非常重要的意义。 本文主要分析图像匹配常用方法的优点和不足之处,讨论了图像匹配中需要进一步研究和解决的问题。 二.图像配准算法的研究现状 图像配准是立体视觉、运动分析、数掘融合等实用技术的基础,在导航、地图与地形配准、自然资源分析、天气预报、环境监测、生理病变研究等许多领域有重要的应用价值。国内外学者针对不同的图像配准应用问题进行了大量的研究工作,早在1992年英国剑桥大学的Lisa Gottesfeld Brown在文献[1]习中就总结了图像配准的主要理论及图像配准在各个领域的应用。当时他讨论的图像配准技术主要还是著眼于医学图像处理、遥感图像处理等传统应用领域。图像配准是图像镶嵌技术的核心问题。 微软研究院的Richard Szeliski在1996年SIGGRAPH上提出了基于运动模型的全景图拼接算法[7]。Szeliski采用了非线性优化的方法来最小化像素两幅图像的亮度差以确定变换参数。该方法使用了全部像素进行优化处理,所以配准精度较高,但是计算速度较慢,且稳健性不佳。 国内的赵向阳。杜立民在2004年提出了一种基于特征点匹配的图像自动拼接算法[2],其中使用了Harris算法[3]提取角点并进行匹配。赵的算法采用了鲁棒变换估计技术,在一定程度上提高配准算法的稳健性,但是计算速度依然较慢,且无法配准重

基于特征的图像匹配算法-毕业论文含源代码

诚信声明 本人声明: 我所呈交的本科毕业设计论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致中所罗列的容以外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了意。本人完全意识到本声明的法律结果由本人承担。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:日期:2010 年05 月20日

毕业设计(论文)任务书 设计(论文)题目: 学院:专业:班级: 学生指导教师(含职称):专业负责人: 1.设计(论文)的主要任务及目标 (1) 了解图象匹配技术的发展和应用情况,尤其是基于特征的图象匹配技术的发展和应用。 (2) 学习并掌握图像匹配方法,按要求完成算法 2.设计(论文)的基本要求和容 (1)查阅相关中、英文文献,完成5000汉字的与设计容有关的英文资料的翻译。(2)查阅15篇以上参考文献,其中至少5篇为外文文献,对目前国外图象匹配技术的发展和应用进行全面综述。 (3)学习图象匹配算法,尤其是基于特征的图象匹配算法。 (4)实现并分析至少两种基于特征的图象匹配算法,并分析算法性能。 3.主要参考文献 [1]谭磊, 桦, 薛彦斌.一种基于特征点的图像匹配算法[J].天津理工大学报,2006, 22(6),66-69. [2]甘进,王晓丹,权文.基于特征点的快速匹配算法[J].电光与控制,2009,16(2), 65-66. [3]王军,明柱.图像匹配算法的研究进展[J].大气与环境光学学报,2007,2(1), 12-15.

4

基于视频序列的图像配准算法研究与应用

工学硕士学位论文 基于视频序列的图像配准算法研究与应用 王帅 哈尔滨工业大学 2007年7月

国内图书分类号:TP391.4 国际图书分类号:681.39 工学硕士学位论文 基于视频序列的图像配准算法研究与应用 硕士研究生:王帅 导师:承恒达 教授 申请学位:工学硕士 学科、专业:计算机科学与技术 所在单位:计算机科学与技术学院 答辩日期:2007年7月 授予学位单位:哈尔滨工业大学

Classified Index: TP391.4 U.D.C: 681.39 Dissertation for the Master Degree in Engineering RESEARCH AND APPLICATION OF IMAGE REGISTRATION BASED ON VIDEO SEQUENCE Candidate:Wang Shuai Supervisor:Prof. Cheng Hengda Academic Degree Applied for:Master of Engineering Specialty:Computer Science and Technology Affiliation:School of Computer Science and Technology Date of Defence:July, 2007 Degree-Conferring-Institution:Harbin Institute of Technology

哈尔滨工业大学工学硕士学位论文 摘要 随着数字技术的不断发展,视频图像的分析与处理越来越受到人们的关注。数字化图像序列可以通过摄像机等光学设备获得,是真实世界在不同时间向成像平面的一系列投影。图像帧之间具有较大的相关性和信息冗余,找到并描述图像序列间的内在联系成为研究的关键所在。图像配准技术可以有效地解决这类问题。 图像配准问题是图像处理里的一个基本问题,是将不同时间、不同传感器、不同视角及不同拍摄条件下获取的图像对齐或匹配,消除存在的几何畸变。图像配准在计算机视觉、模式识别、医学图像处理和遥感信息处理方面有着广泛的应用。 本文提出了基于自适应聚类的特征匹配方法,满足大量图像配准的需求,提高匹配的速度,该方法基于正确匹配点对间形成矢量的一致性,对匹配点对进行自适应聚类,实验证明该方法在保证正确匹配不丢失的同时,可有效剔除绝大多数错误匹配,为进一步进行RANSAC匹配提供方便,且有效地提高了整个匹配过程的速度。 本文提出一种简单有效的图像合成方法。该方法针对摄像机固定位置,水平旋转拍摄的视频序列的特点,选取图像序列中部分帧,通过H矩阵确定重叠区域,再利用线性插值进行图像融合。实验证明在转角小于180 时,合成效果较好。 本文成功运用图像配准技术完成运动员滑行数据的测量,利用图像配准技术估计图像间摄像机运动,进而消除摄像机运动的影响,得到运动员的真实运动数据。根据这一原理,首先对冰场进行合理化建模,并确定相应的视频拍摄方案,设计了运动员冰场定位算法,利用帧间的H矩阵估计摄像机旋转角度,进而估计运动员的旋转角度完成滑行数据的测量。 关键词图像配准;特征点匹配;自适应聚类 - -I

关于图像匹配的综述

关于图像匹配的综述 1.图像匹配的背景及定义 1.1图像匹配的背景及意义 图像匹配技术广泛的应用于日常生活中的诸多领域,如医疗诊断中各种医学图片的分析与识别、遥感图片识别、天气预报中的卫星云图识别、指纹识别、人脸识别等。图像匹配技术主要指通过计算机,采用数学技术方法,对获取的图像按照特定目的进行相应的处理。图像匹配技术是人工智能的一个重要分支和应用,随着计算机技术及人工智能技术的发展,图像识别技术逐渐成为人工智能的基础技术之一。它涉及的技术领域相当的广泛,也越来越深入,其基本分析方法也随着数学工具的不断进步而不断发展。现在,图像识别技术的应用范围己经不仅仅局限于视觉的范围,也体现在机器智能和数字技术等方面。 1.2图像匹配的定义 所谓图像匹配是指在一幅(或一批)图像中寻找与给定目标图像相似的图像或者图像区域(子图像)的过程。通常将已知目标图像称为模板图像,而将待搜索图像中可能与它对应的子图称作该模板的待匹配的目标图像。图像匹配是在来自不同时间或者不同视角的同一场景的两幅或多幅图像之间寻找对应关系,该技术隶属于计算机视觉哺领域。图像匹配的具 体应用包括目标或场景识别、在多幅图像中求解3D结构、立体对应和运动跟踪等。由于拍摄时间、拍摄角度、自然环境的变化,多种传感器的使用、传感器本身的缺陷及噪声等影响,拍摄的图像会存在灰度失真和几何畸变。同时,图像预处理过程会引入的误差,这都是导致模板图像与待匹配的目标图像之间通常存在着一定程度上的差异。在这种情况下,如何使匹配算法精度高、正确匹配率高、速度快和抗干扰性强成为人们关心的问题。 2.图像匹配算法的分类 图像匹配算法的选取对图像匹配结果的影响很大。实用的匹配算法不仅要求计算量小,还必须具有良好的抗噪能力和抗几何形变的能力。通常情况下,图像匹配算法可以分为以下两大类:基于灰度相关的匹配算法、基于特征的图像匹配算法。 1) 基于灰度分布的相关匹配算法,也称为基于区域的匹配方法。常见的基于图像灰度的匹配方法有:(1)归一化灰度相关匹配、(2)最小二乘影像匹配、和(3)序贯相似性检测法匹配等。该类算法直接利用整幅图像的灰度信息,建立两幅图像之间的相似性度量,然后采用某种搜索方法,寻找使相似性度量值最大或最小的变换模型的参数值。在灰度及几何畸变

角点检测算法综述

角点检测算法综述 范娜,俞利,徐伯夏 (中国航天科工集团第三研究院8357所天津300308) 摘要:角点作为图像的一个重要特征,它保留了图像绝大部分的特征信息。角点在三维场景重建、运动估计、目标跟踪以及图像配准与图像匹配等计算机视觉领域有着重要的作用。本文对角点检测算法的类别进行总结,对各类算法进行了详细介绍,并对近几年来各类算法发展与改进进行了总结。 关键词:特征信息;计算机视觉;角点检测 Survey of Corner Detection Algorithms FAN Na, YU Li, and XU Bo-xia (The 8357 Research Institute of the Third Research Academy of CASIC Tianjin 300308) Abstract:As a more important feature of image, corner contains voluminous information of image features.In the domain of computer vision, such as three-dimensional reconstruction, motion estimation, object tracking, image registration and image matching, corner of image play an important role.this paper attempt to summarize and detailedly introduce corner detection algorithms, and summarize the developments of these algorithms in recent years. Key words: Feature Information;Computer Vision;Corner Detection 1 引言 角点并没有明确的定义,一般将图像中亮度变化剧烈的点或图像边缘上曲率取极大值的点认为是角点。从形态上来说,角点包括L、T、Y、X和箭头型角点等。角点作为图像的重要特征,保留了图像的绝大部分的特征信息,又有效地减少了信息的数据量,从而有效地提高了运算速度以及匹配的可靠性。总结现有的角点检测算子的评价方法,总体上有以下几个标准[1]: (1)稳定性:即同一场景图像在亮度、对比度等因素变化的情况下,检测出的角点数目及位置应当稳定 (2)可靠性:即在算子的可变参数改变情况下,不影响生成的角点的质量,只改变检测出角点的数目;检测到的角点具有平移、旋转、伸缩不变性 (3)鲁棒性:即算法的抗噪性能,在一定的噪声干扰下,算子仍然具有很强的角点检测能力 (4)准确性:主要指不发生误检测以及角点位置定位准确 (5)高效性:是指算法的计算速度快慢,算法速度必须足够快以满足图像处理系统的要求 经过几十年的研究与探索,产生了许多检测角点的方法,但大致可以分为四类:基于灰度图像的角点检测算法、基于二值图像的角点检测算法、基于边缘特征的角点检测算法以及支持矢量机角点检测算法。本文中

相关主题
文本预览
相关文档 最新文档