当前位置:文档之家› 图像二值化算法研究与实现

图像二值化算法研究与实现

图像二值化算法研究与实现
图像二值化算法研究与实现

图像二值化算法研究与实现

摘要:图像二值化是图像预处理中的一项重要技术,在模式识别、光学字符识别、医学成像等方面都有重要应用。论文介绍了图像及数字图像处理技术的一些概念和相关知识;对VC++ 软件的发展和软件在图像处理中的应用做了简要介绍;还介绍了图像二值化算法以及利用VC++软件工具进行算法的实现。论文重点实现了图像分割技术中常用灰度图像二值化算法,如Otsu算法、Bernsen算法,并对这些算法运行的实验结果进行分析与比较。

关键词:图像处理;二值化;VC++;

1.引言

1.1 图像与数字图像

图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。

数字图像:数字图像是将连续的模拟图像经过离散化处理后得到的计算机能够辨识的点阵图像。在严格意义上讲,数字图像是经过等距离矩形网格采样,对幅度进行等间隔量化的二维函数。因此,数字图像实际上就是被量化的二维采样数组。

1.2 数字图像处理技术内容与发展现状

数字图像处理就是采用一定的算法对数字图像进行处理,以获得人眼视觉或者某种接受系统所需要的图像处理过程。图像处理的基础是数字,主要任务是进行各种算法设计和算法实现。

图像处理技术的发展大致经历了初创期、发展期、普及期和实用化期4个阶段。初创期开始与20世纪60年代,当时的图像采用像素型光栅进行少秒显示,大多采用中、大型机对其处理。在这一时期,由于图像存储成本高、处理设备昂贵,其应用面很窄。进入20世纪70年代的发展期,开始大量采用中、小型机进行处理,图像处理也逐渐改用光栅扫描方式,特别是CT和卫星遥感图像的出现,对图像处理技术的发展起到了很好的推动作用。到了20世纪80年代,图像处理技术进入普及期,此时的微机已经能够担当起图形图像处理的任务。超大规模集成电路(Very Large Scale Integration, VLSI)的出现更使处理速度大大提高,设备造价也进一步降低,极大地促进了图形图像系统的普及和应用。20世纪90年代是图像处理技术的实用化时期,图像处理的信息量巨大,对处理速度的要求极高。

1.3 图像二值化原理及意义

图像二值化是指用灰度变换来研究灰度图像的一种常用方法,即设定某一阈值将灰度

图像的像素分成大于阈值的像素群和小于阈值的像素群两部分。例如输人灰度图像函数为),(y x f ,输出二值图像函数为),(y x g ,则

???≥<=Threshold

y x f Threshold

y x f y x g ) ,( 255),( 0) , ( (1)

阈值(threshold )是把目标和背景区分开的标尺,选取适当的阈值就是既要尽可能保存图像信息,又要尽可能减少背景和噪声的干扰,这是选择阈值的原则。

图像的二值化处理就是将图像上的点的灰度置为0或255,也就是使整个图像呈现出明显的黑白效果。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。

在数字图像处理中,二值图像占有非常重要的地位,特别是在实用的图像处理中,以二值图像处理实现而构成的系统是很多的,要进行二值图像的处理与分析,首先要把灰度图像二值化,得到二值化图像,这样子有利于再对图像做进一步处理时,图像的集合性质只与像素的值为0或255的点的位置有关,不再涉及像素的多级值,使处理变得简单,而且数据的处理和压缩量小。二值图像在图像分析中应用非常广泛,二值图像就是指只有两个灰度级的图像,二值图像具有存储空间小,处理速度快,可以方便地对图像进行布尔逻辑运算等特点。更重要的是,在二值图像的基础上,还可以进一步对图像处理,获得该图像的一些几何特征或者其他更多特征。 2. 软件工具—VC++ 2.1 软件概述

Microsoft Visual C++是 Microsoft 公司推出的开发Win32环境程序,面向对象的可视化集成编程系统。它不但具有程序框架自动生成、灵活方便的类管理、代码编写和界面设计集成交互操作、可开发多种程序等优点,而且通过简单的设置就可使其生成的程序框架支持数据库接口、OLE2、WinSock 网络、控制界面。它以拥有“语法高亮”,IntelliSense (自动编译功能)以及高级除错功能而著称。比如,它允许用户进行远程调试,单步执行等。还有允许用户在调试期间重新编译被修改的代码,而不必重新启动正在调试的程序。其编译及建置系统以预编译头文件、最小重建功能及累加连结著称。这些特征明显缩短程式编辑、编译及连结的时间花费,在大型软件计划上尤其显著。

VC++由C++语言 、MFC 的封装类、IDE 构成。 MFC (microsoft foundation classes, 微软基础类库)是微软为Windows 程序员提供的一个面向对象的Windows 编程接口,它大大简化了Windows 编程工作。 ? MFC 提供了一个标准化的结构

? 提供了大量的代码,指导用户编程时实现某些技术和功能。 VC 在单个工具中,能完成如下功能,因此被称为IDE(Integreted Development Enviroment, 集成开发环境):

? 生成不同编写代码的起始应用程序 ? 通过许多不同方法查看项目文件 ? 编辑源文件和包含文件 ? 建立应用程序的可视界面 ? 编译及链接

? 运行及调试应用程序 2.2 VC++开发环境

Visual C++的集成开发环境Visual Studio 提供了大量的实用工具以支持可视化编程特性,它们包括: 项目工作区、ClassWizard 、AppWizard 、WizardBar 等。

下面对它们作逐一介绍。Visual C++的用户界面如图1所示。

图1 Visual C++的用户界面

图1 Visual C++的用户界面 2.2.1 项目工作区

Visual C++使用项目工作区来组织项目、元素以及项目信息在屏幕上出现的方式。在桌面上,工作区以窗口方式组织项目、文件和项目设置。每个项目视图都有一个相应的文件夹,包含了关于该项目的各种元素。展开该文件夹可以显示该视图方式下工作区的详细信息。项目视图区包含三个选项卡,单击各选项卡,可以在其间切换。这三个选项卡从左到右依次是:ClassView 、ResourceView 、FileView 。 (1) ClassView(类视图)

显示项目中定义的C++类,展开文件夹显示工程中所定义的所有类,展开类可查看类的数据成员和成员函数以及全局变量、函数和类型定义。ClassView 显示所有已定义的类以及这些类中的数据成员、成员变量。 (2) ResourceView(资源视图)

显示项目中所包含的资源文件。展开文件夹可显示所有的资源类型,如图3。

图2 类视图 图3 资源视图

(3) FileView(文件视图)

显示所创建的工程。展开文件夹可以查看工程中所包含的文件,如图4。

向导栏 菜单条 工具条

项目工作区

调试区 工作区

图4 文件视图

2.2.2 向导栏

图5 向导栏

WizardBar 会自动跟踪用户程序的上下文——比如,当文本编辑器中的光标从一个函数移动到另一个函数时,Wizard 的显示会自动更新。

WizardBar 工具条包含了三个相关的下拉列表框: 类(Class )、过滤器(Filter )和成员(Member )

WizardBar 最右边是一个Action Control 下拉选项,单击Action Control 的向下箭头符号会弹出一个菜单,用于执行跳到函数定义、增加消息处理函数等操作。 3. 图像二值化的算法及实现 3.1 论文研究对象

论文主要研究BMP 格式的灰度图像文件。BMP(Bitmap Picture)文件格式是Windows 系统交换图形、图像数据的一种标准格式。BMP 图像的数据由四个部分组成,如表1所示。

表1 BMP 图像文件结构

typedef struct tagBITMAPFILEHEADER {

WORD bfType;

DWORD bfSize;

WORD bfReserved1;

WORD bfReserved2;

DWORD bfOffBits;

} BITMAPFILEHEADER;

这个结构的长度是固定的,为14个字节(WORD为无符号16位二进制整数,DWORD为无符号32位二进制整数)。

第二部分为位图信息头BITMAPINFOHEADER,也是一个结构,其定义如下:

typedef struct tagBITMAPINFOHEADER {

DWORD biSize;

LONG biWidth;

LONG biHeight;

WORD biPlanes;

WORD biBitCount;

DWORD biCompression;

DWORD biSizeImage;

LONG biXPelsPerMeter;

LONG biYPelsPerMeter;

DWORD biClrUsed;

DWORD biClrImportant;

} BITMAPINFOHEADER;

这个结构的长度是固定的,为40个字节(LONG为32位二进制整数)。其中,biCompression的有效值为BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS,这都是一些Windows 定义好的常量。由于RLE4和RLE8的压缩格式用的不多,一般仅讨论biCompression的有

效值为BI_RGB,即不压缩的情况。

第三部分为调色板(Palette),当然,这里是对那些需要调色板的位图文件而言的。

真彩色图像是不需要调色板的,BITMAPINFOHEADER后直接是位图数据。调色板实际上是

一个数组,共有biClrUsed个元素(如果该值为零,则有2的biBitCount次方个元素)。

数组中每个元素的类型是一个RGBQUAD结构,占4个字节,其定义如下:

typedef struct tagRGBQUAD {

BYTE rgbBlue;

BYTE rgbGreen;

BYTE rgbRed;

BYTE rgbReserved;

} RGBQUAD;

第四部分就是实际的图像数据。对于用到调色板的位图,图像数据就是该像素颜色在

调色板中的索引值,对于真彩色图像,图像数据就是实际的R、G、B值。下面就2色、16

色、256色和真彩色位图分别介绍。

对于2色位图,用1位就可以表示该像素的颜色(一般0表示黑色,1表示白色),所

以一个字节可以表示8个像素。对于16色位图,用4位就可以表示一个像素的颜色,所

以一个字节可以表示2个像素。对于256色位图,一个字节刚好可以表示1个像素。

下面有两点值得注意:

(1) 每一行的字节数必须是4的整倍数,如果不是,则需要补齐。

(2) BMP文件的数据存放是从下到上,从左到右的,也就是说,从文件中最先读到的

是图像最下面的一行的左边的第一个像素,然后是左边的第二个像素,接下来是倒数第二

行左边第一个像素,左边第二个像素。依次类推,最后得到的是最上面的最右边的一个像

素。

3.2 灰度变换

黑白图片的黑白变换叫灰度变换,彩色图片的色彩变换也叫灰度变换。一幅彩色图

像的象素矩阵中每个象素由RGB 3种颜色按一定的比例混合形成一种颜色来表示,比如黑

色使RGB(0,0,0) ,纯红色是RGB(0,1,0)...。在处理相片时,有时可能因为环境光源太

暗,使RGB色的值偏小,就会使图形太暗看不清,如果环境光源太光,又使图像泛白,通

过灰度变换,就可以使RGB值调和到合适的程度,使相片变得漂亮。

灰度变换原理:首先提取一幅图像的一个象素,在BMP格式中一个象素由8位红色亮度值,

8位绿色亮度值和8位蓝色亮度值组成,只要按一定的变换函数去变换。

灰度变换公式: GRAY=0.11*R+0.59*G+0.3*B (2)

3.3 图像二值化常用算法

3.3.1 简单阈值

通过直接对图像的灰度直方图曲线进行分析,判断极小值所在的灰度级,再对所有极

小值点进行相应的分类合并来最终确定阈值的位置,避免出现过分割的现象。在预处理阶

段本文采用了基于各向异性扩散的平滑方法对图像进行滤波,以消除噪声,同时还可以使

图像的灰度直方图曲线更为连续,从而加速算法的执行效率。

简单阈值是指用灰度变换来研究灰度图像的一种常用方法,即设定某一阈值将灰度图

像的像素分成大于阈值的像素群和小于阈值的像素群两部分。例如输人灰度图像函数为,

输出二值图像函数为,则

Threshold=127 (3) 阈值(threshold )是把目标和背景区分开的标尺,选取适当的阈值就是既要尽可能保存图

像信息,又要尽可能减少背景和噪声的干扰,这是选择阈值的原则。

图6 简单阈值效果图像

由于简单阈值法过于简单,丢失部分信息。随着时代的发展人们对于图像的要求也越来越高,这种简单的方法已经不能够满足人们的要求。 3.3.2 Bernsen 法

局部阈值法把灰度阈值选取为随像素位置变化而变化的函数,它是一种动态选择阈值的自适应方法。

设图像在像素点),(j i 处的灰度值为),(j i f ,考虑以像素点),(j i 为中心的)12()12(+?+ωω窗口,(12+ω表示窗口的边长),则Bernsen 算法可以描述如下:

计算图像中各个像素点),(j i 的阈值),(j i T

))

,(min ),(max (5.0),(n j m i f n j m i f j i T n m n m +++++?=≤≤-≤≤-≤≤-≤≤-ωωωωωωω

ω (4)

对图像中各像素点),(j i 用),(j i b 值逐点进行二值化。

?

??≥<=),(),(1),(),(0),(j i T j i f j i T j i f j i b (5) 用I 存储灰度图像的值,设I 为M N ?,把I 边界扩展成()()22+?+M N extend 矩阵。 首先读取原图像I 的大小为M N ?。由于I 中的元素不是每个都是在33?窗口的中心,所以需要对灰度图像I 进行扩展。首先创建一个)2()2(+?+M N 的矩阵extend ,把矩阵I 中的像素),()1,1(j i I j i extend =++,而第一行和最后一行,第一列和最后一列的填充依据是以它靠近的行或列为对称轴进行填充。遍历从)2,2(extend 到)1,1(++M N extend 的像素,并取以当前像素为中心的33?窗口的最大像素max 和最小像素min ,依据公式

min)(max 5.0+?=t 求出阈值t 。

把灰度图像矩阵I 赋值于另一矩阵B ,以免改变当前得到的灰度图像矩阵。遍历该矩阵B ,对当前灰度值与t 比较,如果大于赋予1,判为目标像素类,否则赋予0,作为背景像素类。显示得到的二值图像B 。

Bernsen 方法流程图如图7所示。

3.3.2.1 Bernsen 方法结果分析

Bernsen 方法对图像进行二值化处理,以下为研究对象的几张原始图像,图8所示。

(a) (b) (c)

(d) (e) (f)

图8 原图

(a) lenna原始图像(256×256);(b)barbara原始图像(256×256);(c)peppers原始图像(256×256);

(d) lenna原始图像(512×512);(e)barbara原始图像(512×512); (f)peppers原始图像(512×512)

通过调研参考文献可知,对图8这六幅图像都采用Bernsen算法进行图像二值化处理。其结果如图所示。len na(256×256)、len na(512×512)原始图像通过Bernsen方法二值化后的所得到的二值图像如9所示。barbara(256×256)、barbara(512×512)原始图像通过Bernsen方法二值化后的所得到的二值图像如图10所示。pe ppers(256×256)、peppers(512×512)原始图像通过Bernsen方法二值化后的所得到的二值图像如图11所示。

(a) (b)

图9 Bernsen方法二值化lenna图像

(a)二值lenna图像(256×256);(b)二值lenna图像(512×512)

(a) (b)

图10 Bernsen方法二值化barbara图像

(a)二值barbara图像(256×256); (b)二值barbara图像(512×512)

(a)

(b)

图11 Bernsen 方法二值化peppers 图像

(a)二值peppers 图像(256×256); (b)二值peppers 图像(512×512)

实验结果分析如表【12】

2。

以没有固定的阈值。图像越大用Bernsen 算法对其进行二值化处理的时间越长。 3.3.3 Otsu 法

Otsu 在1979 年提出的最大类间方差法(有时也称之为大津法),该方法的基本思想是:设阈值将图像分割成两组,一组灰度对应目标,另一组灰度对应背景,则这两组灰度值的类内方差最小,两组的类间方差最大。对图像Image ,记t 为目标与背景的分割阈值,目标像素数占图像比例为0ω,平均灰度为0μ;背景像素数占图像比例为1ω,平均灰度为1μ。图像的总平均灰度为:)()()()(1100t t t t μωμωμ+=。从最小灰度值到最大灰度值遍历t ,当t 使得值211200)()(μμωμμω-+-=g 最大时t 即为分割的最佳阈值。对大津法可作如下理解:该式实际上就是类间方差值,阈值t 分割出的目标和背景两部分构成了整幅图像,而目标取值0μ,概率为 0ω,背景取值1μ,概率为1ω,总均值为μ,根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大说明构成图像的两部分差别越大,当部分目标点错分为背景或部分背景点错分为目标点都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小。

记),(j i f 为M N ?图像),(j i 点处的灰度值,灰度级为μ,不妨假设),(j i f 取值]1,0[-m 。记)(k p 为灰度值为k 的频率,则有:

∑==k

j i f MN k p ),(P 1

)( (6)

假设用灰度值t 为阈值分割出的目标与背景分别为:}),({t j i f ≤和}),({t j i f >,于是目标部分比例:

∑≤≤=t

i i p t 00)()(ω (7)

目标部分点数:

∑≤≤=t

i i p MN t N 00)( )( (8)

背景部分比例:

∑-≤<=

1

1)()(m i t i p t ω (9)

背景部分点数:

∑-≤<=1

1)()(m i t i P MN

t N (10)

目标均值:

∑≤≤=

t

i t i ip t 00

0)(/)()(ωμ (11)

背景均值:

∑-≤<=

1

1

1)(/)()(m i t t i ip t ωμ (12)

总均值:

)()()()(1100t t t t μωμωμ+= (13)

大津法指出求图像最佳阈值g 的公式为:

]))(()())(()([ 2112001

-m t 0μμωμμω-+-=≤≤t t t t Max Arg g (14)

该式右边括号内实际上就是类间方差值,阈值g 分割出的目标和背景两部分构成了整幅图像,而目标值)(0t μ,概率为)(1t ω,背景取值)(1t μ,概率为)(0t ω,总均值为μ,根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小,这便是大津法的真正含义。其实,换一种思想也能很好的理解大津方法。)(0t μ和)(1t μ,可以分别代表目标和背景的中心灰度,μ则代表整幅图像的中心灰度,要使目标和背景得到最好的分割,当然希望分割出的目标尽量远离图像中心,即20))((μμ-t 或|)(|0μμ-t 尽量大,背景也尽量远离中心,即

21))((μμ-t 或|)(|1μμ-t 尽量大,由于希望两者都大,于是有:

(1) 两者之加权和最大:

]))(()())(()([ 2112001

-m t 0μμωμμω-+-=≤≤t t t t Max Arg g (15)

(2) 两者之积最大:

]))(())(([ 21201

-m t 0μμμμ--=≤≤t t Max Arg g (16)

注意到有)()()()(1100t t t t μωμωμ+=,且)()(10t t μμμ≤≤,因此有:

2120211200))(())(())(()())(()(μμμμμμωμμω--=-+-t t t t t t 。可见是二者等价的。

Otsu 方法流程图如图7所示。

3.3.3.1 Otsu方法实验结果分析

对图8这六幅图像都采用Otsu算法进行图像二值化处理。其结果如图所示。lenna(256×256)、lenna(512×512)原始图像通过Otsu方法二值化后的所得到的二值图像如图13所示。barbara(256×256)、barbara(512×512)原始图像通过Otsu方法二值化后的所得到的二值图像如图14所示。peppers(256×256)、peppers(512×512)原始图像通过Otsu 方法二值化后的所得到的二值图像如图15所示。

(a) (b)

图13 Otsu方法二值化lenna图像

(a)二值lenna 图像(256×256); (b)二值lenna 图像(512×512)

(a) (b)

图14 Otsu 方法二值化barbara 图像

(a)二值barbara 图像(256×256); (b)二值barbara 图像(512×512)

(a) (b)

图15 Otsu 方法二值化barbara 图像

(a)二值peppers 图像(256×256); (b)二值peppers 图像(512×512) 实验结果分析如表3。

表3 Otsu 方法处理不同像素的不同图像

的图像时间为3.8750,阈值为129;lenna256×256的时间为1.0940,阈值为109。可知,512×512 图像的执行时间要比256×256图像的时间要长,说明图像越大,用Otsu 方法对其进行二值化处理所需时间越长;大图像的阈值也比小图像要大。熵值是衡量图像有序化程度的一个度量,熵值越低图像越有序,图13b 即lenna(512×512)在进行比较的图像中是最混乱的。

3.3.3.2 0tsu 方法和Bernsen 方法实验结果比较

比较其它参考文献可知,在表中用一些变量保存了有用的实验数据,T 表示Otsu 方法、Bernsen 方法的运行时间,单位为秒。H 表示由Otsu 方法、Bernsen 方法处理得到的二值图像的熵值,单位为比特/符号。熵值的定义为:

()()

==

M

i x p i i x p x H 1

/12

log )()( (17)

图像的熵值反映了整幅图像的效果。信息熵是信息论中用于度量信息量的一个概念。一幅图像越是有序,信息熵就越低;反之,一幅图像越是混乱,信息熵就越高。所以,信息熵也可以说是衡量图像有序化程度的一个度量。程序的运行时间代表算法运行效率,也是算法的一项性能指数。

两种性能比较如表4所示【12】

有固定的阈值。

程序运行时间T :T(Bernsen)>T(Otsu),可见Bernsen 算法要寻找局部极大、极小值,因此速度较慢;TOtsu(256×256)< TOtsu(512×512) ,TBernsen(256×256)< TBernsen(512×512),可见图像越大,二值化程序运行所需时间就越长。二值图像的熵值:H(Otsu)>H(Bernsen),可以见Otsu 方法对于光照不均、噪声干扰大的图像,其二值化效果较差,其反映了整个图像的整体灰度分布情况。 3.3.4 迭代法

迭代法是另外一种全局二值化方法,它要求图像分割阈值的算法是基于逼近的思想,首先选择一个近似阈值作为估计值的初始值,然后进行分割,产生子图像,并根据子图像的特性来选取新的阈值,再利用新的阈值分割图像,经过几次循环,使错误分割的图像像素点降到最少。这样做的效果好于用初始阈值直接分割图像的效果。具体算法步骤如下所述:

(1)求出图像中的最小灰度值和最大灰度值,分别记为Z min 和Z max ,则阈值初值T 0为:

min max

02

Z Z T += (18)

(2)根据阈值T K 将图像分割成目标和背景两部分,求出两部分的平均灰度值Z 0和Z G :

()()

()()

(),,,,,k

k

z i j T o z i j T z i j N i j Z N i j <

∑∑

(19)

()()

()()

(),,,,,k

k

z i j T G z i j T z i j N i j Z N i j >>?=

∑∑

(20)

式中z(i,j)为图像上(i,j)点的灰度值;N(i,j)为(i,j)点的权重系数,一般N(i,j)为z(i,j)

的个数。

(3) 利用下式求出新阈值:

0 12G

k Z Z

T

+

+

=(21)

(4)如果T

K =T

K+1

,则结束,否则K=K+1,转向(2)。

经实验测试发现,对于直方图双峰明显、谷底较深的图像,迭代法可以较快地获得满意结果;但是对于直方图双峰不明显或图像目标和背景比例差异悬殊,迭代法所选取的阈值不如OTSU法。

迭代法算法实现如图16示。

图16 迭代法算法实现

图17 迭代法效果图像

对某些特定图像,某些微小的变化却会引起分割效果的巨大变化,两者数据只是稍有变化,但分割效果却反差极大,其中原因还有待进一步研究。

4. 总结

Bernsen法虽然能够根据局部灰度特性来自适应地选取阀值,有较大的灵活性,但是仍然存在缺点和问题:实现速度慢、有伪影现象、有笔画断裂现象。简单阈值法能减少背景和噪声的干扰迭代所得的阀值分割的图像效果不好,丢失部分图像信息,所以我主要采用Otsu法和迭代法。Otsu 法是经典的非参数、无监督自适应阈值方法,是一种直方图技术。Otsu法实现简单,对于具有明显双峰直方图的图像效果明显,但对于低对比度和光

照不均匀的图像效果不佳,抗噪声能力差,因而应用范围受到极大限制。对于直方图双峰明显、谷底较深的图像,迭代法可以较快地获得满意结果;但是对于直方图双峰不明显或图像目标和背景比例差异悬殊,迭代法所选取的阈值不如OTSU法。几种常用的图像二值化算法各有优缺点,由于时间的问题本次设计没有逐一研究。

参考文献

[1] Liu Jieping,Yu Yinglin.A flexible method for image noise removal[J].Joural of South China

University Technology,2000,28(2):60~63.

[2] A Piva, M Barni,F Bartolini, V Cappellini. DCT-based watermark recovering without

resorting to the uncorrupted original image[A].Proceedings of 4th IEEE International Conference on Image Processing ICIP’97[C].Santa Barbara,CA,USA:ICIP,1997.

[3] Zhong wei.Image watermarking using Legendre array[J].Journal of china institute of

communications,2001,22(1):1~6.

[4] 王建卫.彩色图像的中值滤波算法的改进与应用[J].哈尔滨商业大学大学报:自然科学

版.2006,22(4):67~69.

[5] 陈丹,张蜂,贺贵明.一种改进的文本图像二值化算法[J].计算机工程,2003,29(13):85~86.

[6] A Hashizume, P S Yeh, A Rosenfeld. A Method of Detecting the Orientation of Aligned

Components[J]. Pattern Recognition Letters, 1986,4:125~132.

[7] L.O’Gorman. The Document Spectrum for Page Layout Analysis. IEEE Transactions. PAMI,

V ol.15,No.11, 1993:pp.1162~1173.

[8] 郑咸义,张颖豪.一个改进的LBG算法[J].计算机辅助设计与图形学学

报,1997,9(4):335~338.

[9] 张爱华,余胜生,周敬利. 一种基于边缘检测的阈值分割[J]. 661~663 算法,小型微型计

算机系统,2003,24(.4)

[10] 冯国进,顾国华,陈钱. 基于形态学的红外图像边缘增强[J]. 453~454 激光与红

外,2003,33(6)

[11] 章毓晋,图像理解与计算机视觉[J],北京: 清华大学出版社, 1999,4

[12] 吕俊哲,图像二值化算法的研究与实现.科技情报与经济,2004,54~55

The Research on the Binary Image Algorithm and

Its Realization

Abstract: Image binarization, as an important technology in image pre-processing, is widely-employed in pattern recognition, optical character recognition, medical imaging and so forth. In this paper, some notions and relative knowledge in digital image processing technology are introduced; then, the development of VC++ and its application in image processing briefly introduced; in addition, the method of grayscale image binarization and how to implement these algorithms based on VC++ are presented. This paper mainly implements the grayscale image binarization method in image segmentation technology, such as Otsu algorithm and Bernsen algorithm, and analyzes and compares the experimental results of the above algorithms.

Key words: Image processing; Binarization;VC++

基于熵的图像二值化算法设计二维最大熵分割

基于熵的图像二值化算法设计二维最大熵分割公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]

1设计目的与要求 设计目的 (1)熟悉和掌握MATLAB程序设计方法。 (2)学习和掌握MATLAB图像处理工具箱。 (2)了解图像分割和图像二值化的原理。 (3)掌握图像二值化技术阈值的选取。 (4)将原彩色图像变为二值化后的图像,通过二维最大熵图像分割法对图像进行分割达到预期目的。 设计要求 (1)了解图像变换的意义和手段。 (2)熟悉最大熵和二值化的基本性质。 (3)通过本实验掌握利用MATLAB编程实现数字图像处理。 (4)理解图像分割的原理,了解其应用,掌握最大熵和二值化分割的方法。

2 设计方案 图像二值化 图像二值化是数字图像处理技术中的一项基本技术,二值化图像的显示与打印十分方便,存储与传输也非常容易,在目标识别、图像分析、文本增强、字符识别等领域得到广泛应用。图像二值化是将灰度图像转化为只有黑白两类像素的图像,大多采用阈值化算法处理。在不同的应用中,阈值的选取决定着图像特。 征信息的保留。因此,图像二值化技术的关键在于如何选取阈值。 最大熵原理 最大熵原理:最大熵原理是在1957 年由 提出的,其主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。因为在这种情况下,符合已知知识的概率分布可能不止一个。我们知道,熵定义的实际上是一个随机变量的不确定性,熵最大的时候,说明随机变量最不确定,换句话说,也就是随机变量最随机,对其行为做准确预测最困难。 图像分割中最大熵的引入:在图像分割中若假定以灰度级T 分割图像,则图像中低于灰度级T 的像素点构成目标物体,高于灰度级T 的像素点构成背景那么各个灰度级在图像分割后的两区域中的概率如下: O :t i N N ???(0<=i<=t) () B : t i N N N - (t+1<=i<=255) () ? 其中Ni 为图像中灰度级为i 的像素点个数,Nt 为灰 度级从0~t 的像素点总和,N 为图像总像素点,t 为假定灰度阈值T 。 ) l og()(0 t i t i N N N N H ∑ -= ??? ? (0<=i<=t) ? ? ()

图像增强算法综述

图像增强算法研究综述 刘璐璐 宁波工程学院电子与信息工程学院计算机科学与技术071班,邮编:(315100) E-mail:375212239@https://www.doczj.com/doc/5210972181.html, 摘要:本文简要介绍图像增强的概念和图像增强算法的分类,从图像的直方图均衡化处理方法,直方图规定化处理方法和图像平滑处理方法三方面对图像增强算法进行讨论和研究,并说明了图像增强技术的应用和前景展望。 关键词:图像增强直方图均衡化直方图规定化平滑处理 近年来,随着电子计算机技术的进步,计算机图像处理得到了飞跃的发展,己经成功的应用于几乎所有与成像有关的领域,并正发挥着相当重要的作用。它利用计算机对数字图像进行系列操作,从而获得某种预期的结果。对图像进行处理时,经常运用图像增强技术以改善图像的质量增强对某种信息的辨识能力,以更好的应用于现代各种科技领域,图像增强技术的快速发展同它的广泛应用是分不开的,发展的动力来自稳定涌现的新的应用,我们可以预料,在未来社会中图像增强技术将会发挥更为重要的作用。在图像处理过程中,图像增强是十分重要的一个环节。 1.图像增强概念及现实应用 1.1 图像增强技术 图像增强是数字图像处理的基本内容之一。图像增强是指按特定的需要突出一幅图像中的某些信息,同时,削弱或去除某些不需要的信息。这类处理是为了某种应用目的去改善图像质量,处理的结果更适合于人的视觉特性或机器识别系统,图像增强处理并不能增加原始图像的信息,而只能增强对某种信息的辨识能力,使处理后的图像对某些特定的应用比原来的图像更加有效。 1.2图像增强技术的现实应用 目前,图像增强处理技术的应用己经渗透到医学诊断、航空航天、军事侦察、纹识别、无损探伤、卫星图片的处理等领域,在国民经济中发挥越来越大的作用。其中最典型的应用主要体现以下方面。 1

图像分割方法综述

图像分割方法综述

图像分割方法综述 摘要:图像分割是计算计视觉研究中的经典难题,已成为图像理解领域关注的一个热点,本文对近年来图像分割方法的研究现状与新进展进行了系统的阐述。同时也对图像分割未来的发展趋势进行了展望。 关键词:图像分割;区域生长;活动边缘;聚类分析;遗传算法 Abstract:Image segmentation is a classic problem in computer vision,and become a hot topic in the field of image understanding. the research actuality and new progress about image segmentation in recent years are stated in this paper. And discussed the development trend about the image segmentation. Key words: image segmentation; regional growing; active contour; clustering

analysis genetic algorithm 1 引言 图像分割是图像分析的第一步,是计算机视觉的基础,是图像理解的重要组成部分,同时也是图像处理中最困难的问题之一。所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的说就是在一副图像中,把目标从背景中分离出来。对于灰度图像来说,区域内部的像素一般具有灰度相似性,而在区域的边界上一般具有灰度不连续性。 关于图像分割技术,由于问题本身的重要性和困难性,从20世纪70年代起图像分割问题就吸引了很多研究人员为之付出了巨大的努力。虽然到目前为止,还不存在一个通用的完美的图像分割的方法,但是对于图像分割的一般性规律则基本上已经达成的共识,已经产生了相当多的研究成果和方法。本文根据图像发展的历程,从传统的图像分割方法、结合特定工具的图像分割方

图像去雾霭算法及其实现..

图像去雾霭算法及其实现 电气工程及其自动化 学生姓名杨超程指导教师李国辉 摘要雾霭等天气条件下获得的图像,具有图像不清晰,颜色失真等等一些图像退化的现象,直接影响了视觉系统的发挥。因此,为了有效的改善雾化图像的质量,降低雾霭等天气条件下造成户外系统成像的影响,对雾霭图像进行有效的去雾处理显得十分必要。 本设计提出了三种图像去雾算法,一种是基于光照分离模型的图像去雾算法;一种是基于直方图均衡化的图像去雾算法;还有一种是基于暗原色先验的图像去雾算法。并在MATLAB的基础上对现实生活的图像进行了去雾处理,最后对不同的方法的处理结果进行了简要的分析。 关键词:图像去雾光照分离直方图均衡化暗原色先验

Algorithm and its implementation of image dehazing Major Electrical engineering and automation Student Yang Chaocheng Supervisor Li Guohui Abstract Haze weather conditions so as to obtain the image, the image is not clear, the phenomenon of color distortion and so on some image degradation, directly influence the exertion of the visual system. Therefore, in order to effectively improve the atomization quality of the image, reduce the haze caused by outdoor weather conditions such as imaging system, the influence of the haze image effectively it is necessary to deal with the fog. This design introduced three kinds of algorithms of image to fog, a model is based on the separation of light image to fog algorithm; One is the image to fog algorithm based on histogram equalization; Another is based on the dark grey apriori algorithms of image to fog. And on the basis of MATLAB to the real life to deal with the fog, the image of the processing results of different methods are briefly analyzed. Key words:Image to fog Light separation histogram Dark grey

基于MATLAB的彩色图像灰度化处理

目录 第1章绪论............................................................................................................................ - 1 - 第2章设计原理.................................................................................................................... - 2 - 第3章彩色图像的灰度化处理............................................................................................ - 3 - 3.1加权平均法 .. (3) 3.2平均值法 (3) 3.3最大值法 (4) 3.4举例对比 (5) 3.5结果分析 (6) 第4章结论.......................................................................................................................... - 8 - 参考文献....................................................................................................... 错误!未定义书签。附录............................................................................................................................................ - 9 -

图像分割算法的比较与分析

中北大学 课程设计说明书 学生姓名:学号: 学生姓名:学号: 学生姓名:学号: 学生姓名:学号: 学院:信息与通信工程学院 专业:电子信息工程 题目:信息处理综合实践: 图像分割算法的比较与分析 指导教师:陈平职称: 副教授 2014 年12 月29 日

中北大学 课程设计任务书 14/15 学年第一学期 学院:信息与通信工程学院专业:电子信息工程 学生姓名:学号: 课程设计题目:信息处理综合实践: 图像分割算法的比较与分析起迄日期:2015年1月5日~2015年1月16日课程设计地点:电子信息工程专业实验室 指导教师:陈平 系主任:王浩全 下达任务书日期: 2014 年12月29 日课程设计任务书

课程设计任务书

目录 第一章绪论 (1) 研究目的和意义 (1) 图像分割的研究进展 (1) 第二章区域生长法分割图像 (4) 区域生长法介绍 (4) 区域生长法的原理 (4) 区域生长法的实现过程 (5) 第三章程序及结果 (6) 区域生长算法及程序 (6) 图像分割结果 (7) 第四章方法比较 (8) 阈值法 (8) 区域法 (8) 分水岭法 (8) 形态学方法 (9) 第五章总结 (10) 参考文献 (11)

第一章绪论 研究目的和意义 图像分割是一种重要的图像技术,在理论研究和实际应用中都得到了人们的广泛重视。图像分割的方法和种类有很多,有些分割运算可直接应用于任何图像,而另一些只能适用于特殊类别的图像。许多不同种类的图像或景物都可作为待分割的图像数据,不同类型的图像,已经有相对应的分割方法对其分割;但某些分割方法只是适合于某些特殊类型的图像分割,所以分割结果的好坏需要根据具体的场合及要求衡量。图像分割是从图像处理到图像分析的关键步骤,可以说,图像分割结果的好坏直接影响对图像的理解。 图像分割是由图像处理到图像分析的关键步骤,在图像工程中占有重要位置。一方面,它是目标表达的基础,对特征测量有重要的影响。另一方面,因为图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化为更抽象、更紧凑的表达形式,使得更高层的图像分析和理解成为可能。因此在实际应用中,图像分割不仅仅要把一幅图像分成满足上面五个条件的各具特性的区域,而且要把其中感兴趣的目标区域提取出来。只有这样才算真正完成了图像分割的任务,为下一步的图像分析做好准备,使更高层的图像分析和理解成为可能。 图像分割在很多方面,如医学图像分析,交通监控等,都有着非常广泛的应用,具有重要的意义。(1)分割的结果常用于图像分析,如不同形式图像的配准与融合,结构的测量,图像重建以及运动跟踪等。(2)在系统仿真,效果评估,图像的3D重建以及三维定位等可视化系统中,图像分割都是预处理的重要步骤。 (3)图像分割可在不丢失有用信息的前提下进行数据压缩,这就降低了传输的带宽,对提高图像在因特网上的传输速度至关重要。(4)分割后的图像与噪声的关系减弱,具有降噪功能,便于图像的理解。 图像分割的研究进展 图像分割是图像处理中的一项关键技术,至今已提出上千种分割算法。但因

指纹图像二值化算法的分析和比较

指纹图像二值化算法的分析和比较 1引言 指纹作为人体的重要特征,因其具有唯一性和终生不变性,已经成为生物识别领域的重要手段。它不仅应用于公安司法系统的犯罪识别,而且还广泛应用于如一些保密系统的身份验证,成为生物识别领域的新热点。在指纹自动识别系统中,图像采集设备所得到的图像是一幅含有较多噪声的灰度图,必须经过预处理,除去大量的噪声信号,得到一幅纹线清晰的点线图,才能进行指纹特征的提取和匹配。指纹图像的预处理是正确地进行特征提取、比对等操作的基础,而二值化是图像预处理中非常重要的一步,也是指纹细化并提取特征前的重要步骤。 不同的二值化经常会对后续的步骤产生极大的影响,常用的二值化方法由于仅仅利用了图像的灰度信息,没有考虑指纹图像自身的方向结构特点,对指纹图像的二值化效果不理想. 本文首先对常用的二值化算法进行了讨论,并主要通过实验比较了两种特别针对指纹图像的二值化算法。 通常认为一个好的针对指纹图像的二值化算法应满足以下几点要求[f。1]: ●保持纹线的原始走向; ●相关领域内指纹的纹线走向基本一致; ●避免造成指纹纹线的中断和粘连; ●避免生成虚假指纹纹线; ●纹线间的间距变化平稳; 2图像的二值化算法 在很多情况下,图象是由具有不同灰度的两类区域组成的。如在指纹图象中,指纹脊线和谷线就由不同的灰度构成,通常脊线要比谷线暗。所谓灰度图象的二值化就是通过设定阀值,把它变为仅用两个灰度值分别表示图象的前景和背景颜色的二值图象。图象的二值化可以根据下面的阀值来处理: 假设一幅灰度图的像素值为f(i,j)∈(r1,r2 ,…,rm),设有一阀值为T=ri ,1≤i≤m,则: 二值化的方法很多,关键在于阀值T的选取。而T的取值方法又取决于二值化的技术。T的选择有基于由点的像灰度值单独决定的、有由像素的局部特征决定的、也有基于全局像素决定的。阀值可以分为两类:全局阀值和局部阀值。 1)全局阈值 全局阈值是在整个图像中将灰度阈值的值设置为常数。如果背景的灰度值在整个图像中可以合理的看作恒定,而且所有的物体于背景都具有几乎相同的的对比度,那么只要选择了正确的阈值,使用一个全局阈值可以得到非常好的的效果。代表算法有最大类间方差法(OSTU方法)。 OSTU方法计算简单,稳定有效,是实际应用中经常采用的方法。但是它对噪声和目标大小十分敏感,仅对类间方差是单峰的图像有较好效果。当目标与背景的大小比例悬殊时,类间方差准则函数可能为双峰或多峰,此时OSTU方法就会失效。 2)自适应阈值 自适应阈值化算法也称动态局部阈值化算法。所谓动态是指根据每个像素及其邻域像素的灰度值情况动态地计算分割所需的阈值,如:Bernsen算法,它对图像上的每个点以之为中心取一个局部窗口,则该点的阈值为窗口中最大灰度和最小灰度的平均,依次对每个点根据其阈值进行二值化。 4.基于方向图的动态阈值指纹图像二值化方法

基于阈值的灰度图像分割

对以CPT算法为主的灰度阈值化方法的研究 目录: 第一章:绪论 第二章:图像的预处理 第三章:图像分割概述 第四章:灰度阈值化图像分割方法 第五章:CPT算法及其对它的改进 第六章:编程环境及用PhotoStar对改进的CPT算法和其他算法的实现 第七章:实验结果与分析 第一章:绪论 1.1数字图像处理技术的发展 人类传递信息的主要媒介是语音和图像。据统计,在人类接受的信息中,听觉信息占20%,视觉占60%,其他如味觉、触觉、嗅觉总的加起来不过占20%。所以,作为传递信息的重要媒体和手段——图像信息是十分重要的。【5】对于图像信息的处理,即图像处理当然对信息的传递产生很大影响。 数字图像处理技术起源于20世纪20年代,当时通过海底电缆从伦敦到纽约传输了一幅图片,它采用了数字压缩技术。1964年美国的喷气处理实验室处理了太空船“徘徊者七号”发回的月球照片,这标志着第三代计算机问世后数字图像处理概念得到应用。其后,数字图像处理技术发展迅速,目前已成为工程学、计算机科学、生物学、医学等领域各学科之间学习和研究的对象。 经过人们几十年的努力,数字图像处理这一学科已逐渐成熟起来。人们总是试图把各个学科应用到数字图像处理中去,并且每产生一种新方法,人们也会尝试它在数字图像处理中的应用。同时,数字图像处理也在很多学科中发挥着它越来越大的作用。 1.2图像分割概述和本论文的主要工作 图像分割的目的是把图像空间分成一些有意义的区域,是数字图像处理中的重要问题,是计算机视觉领域低层次视觉问题中的重要问题,同时它也是一个经典的难题。几十年来,很多图像分割的方法被人们提出来,但至今它尚无一个统一的理论。 图像分割的方法很多,有早先的阈值化方法、最新的基于形态学方法和基于神经网络的方法。 阈值化方法是一种古老的方法,但确是一种十分简单而有效的方法,近几十年人们对阈值化方法不断完善和探索,取得了显著的成就,使得阈值化方法在实际应用中占有很重要的地位。 本文将主要对图像分割的阈值化方法进行探讨。在对阈值化方法的研究过程中,本人首先将集中精力对效果比较好的阈值化方法进行探讨,并对其存在的不足加以改进,从而作出性能优良的计算机算法;由于目前很多方法各有其特点,所以将对具有不同特点的图像用不同的方法处理进行研究。在论文正文部分还将其应用到实践中去,并对其加以评价。 第二章:图像的预处理 2.1图像预处理的概述 由于切片染色和输入光照条件及采集过程电信号的影响,所采集的医学图

基于熵的图像二值化算法设计-二维最大熵分割

1设计目的与要求 1.1 设计目的 (1)熟悉和掌握MATLAB程序设计方法。 (2)学习和掌握MATLAB图像处理工具箱。 (2)了解图像分割和图像二值化的原理。 (3)掌握图像二值化技术阈值的选取。 (4)将原彩色图像变为二值化后的图像,通过二维最大熵图像分割法对图像进行分割达到预期目的。 1.2 设计要求 (1)了解图像变换的意义和手段。 (2)熟悉最大熵和二值化的基本性质。 (3)通过本实验掌握利用MATLAB编程实现数字图像处理。 (4)理解图像分割的原理,了解其应用,掌握最大熵和二值化分割的方法。

2 设计方案 2.1 图像二值化 图像二值化是数字图像处理技术中的一项基本技术,二值化图像的显示与打印十分方便,存储与传输也非常容易,在目标识别、图像分析、文本增强、字符识别等领域得到广泛应用。图像二值化是将灰度图像转化为只有黑白两类像素的图像,大多采用阈值化算法处理。在不同的应用中,阈值的选取决定着图像特。 征信息的保留。因此,图像二值化技术的关键在于如何选取阈值。 2.2 最大熵原理 最大熵原理:最大熵原理是在1957 年由E.T.Jaynes 提出的,其主要思想是,在只掌握关于未知分布的部分知识时,应该选取符合这些知识但熵值最大的概率分布。因为在这种情况下,符合已知知识的概率分布可能不止一个。我们知道,熵定义的实际上是一个随机变量的不确定性,熵最大的时候,说明随机变量最不确定,换句话说,也就是随机变量最随机,对其行为做准确预测最困难。 图像分割中最大熵的引入:在图像分割中若假定以灰度级T 分割图像,则图像中低于灰度级T 的像素点构成目标物体,高于灰度级T 的像素点构成背景那么各个灰度级在图像分割后的两区域中的概率如下: O :t i N N (0<=i<=t) (3.2.1) B : t i N N N - (t+1<=i<=255) (3.2.2) 其中Ni 为图像中灰度级为i 的像素点个数,Nt 为灰度级从0~t 的像素点总和,N 为 图像总像素点,t 为假定灰度阈值T 。 ) l og()( t i t i N N N N H ∑-= (0<=i<=t) (3.2.3) ) log()( t i t i B N N N N N N H ---=∑ (t+1<=i<=255) (3.2.4)

图像处理灰度变换实验

一. 实验名称:空间图像增强(一) 一.实验目的 1.熟悉和掌握利用matlab工具进行数字图像的读、写、显示、像素处理等数字图像处理的基本步骤和流程。 2.熟练掌握各种空间域图像增强的基本原理及方法。 3.熟悉通过灰度变换方式进行图像增强的基本原理、方法和实现。 4.熟悉直方图均衡化的基本原理、方法和实现。 二.实验原理 (一)数字图像的灰度变换 灰度变换是图像增强的一种经典而有效的方法。灰度变换的原理是将图像的每一个像素的灰度值通过一个函数,对应到另一个灰度值上去从而实现灰度的变换。常见的灰度变换有线性灰度变换和非线性灰度变换,其中非线性灰度变换包括对数变换和幂律(伽马)变换等。 1、线性灰度变换 1)当图像成像过程曝光不足或过度,或由于成像设备的非线性和图像记录设备动态范围太窄等因素,都会产生对比度不足的弊病,使图像中的细节分辨不清,图像缺少层次。这时,可将灰度范围进行线性的扩展或压缩,这种处理过程被称为图像的线性灰度变换。对灰度图像进行线性灰度变换能将输入图像的灰度值的动态范围按线性关系公式拉伸扩展至指定范围或整个动态范围。 2)令原图像f(x,y)的灰度范围为[a,b],线性变换后得到图像g(x,y),其灰度范围为[c,d],则线性灰度变换公式可表示为

a y x f b y x f a b y x f c c a y x f a b c d d y x g <≤≤>?????+---=),(),(),(, ,]),([,),( (1) 由(1)式可知,对于介于原图像f (x,y )的最大和最小灰度值之间的灰度值,可通过线性变换公式,一一对应到灰度范围[c,d]之间,其斜率为(d-c)/(b-a);对于小于原图像的最小灰度值或大于原图像的最大灰度值的灰度值,令其分别恒等于变换后的最小和最大灰度值。变换示意图如图1所示。 图1 线性灰度变换示意图 当斜率大于一时,变换后的灰度值范围得到拉伸,图像对比度得到提高;当斜率小于一时,变换后的灰度值范围被压缩,最小与最大灰度值的差变小,图像对比度降低;当斜率等于一时,相当于对图像不做变换。 3)由上述性质可知,线性灰度变换能选择性地加强或降低特定灰度值范围内的对比度,故线性灰度变换同样也可做分段处理:对于有价值的灰度范围,将斜率调整为大于一,用于图像细节;对于不重要的灰度范围,将图像压缩,降低对比度,减轻无用信息的干扰。最常用的分段线性变换的方法是分三段进行线性变换。 在原图像灰度值的最大值和最小值之间设置两个拐点,在拐点处,原图像的灰度值分别为r 1,r 2,该拐点对应的变换后的图像的灰度值分别为s 1,s 2,另外,取原图像灰度的最小值为r 0,最大值为r m ,对应的变换后的灰度值分别为s 0,s m 。

数字图像灰度阈值的图像分割技术matlab

1.课程设计的目的 (1)使学生通过实验体会一些主要的分割算子对图像处理的效果,以及各 种因素对分割效果的影响 (2)使用Matlab软件进行图像的分割 (3)能够进行自行评价各主要算子在无噪声条件下和噪声条件下的分割 性能 (4)能够掌握分割条件(阈值等)的选择 (5)完成规定图像的处理并要求正确评价处理结果,能够从理论上做出合 理的解释 2.课程设计的要求 (1)能对图像文件(bmp,jpg,tiff,gif)进行打开,保存,退出等功能操作 (2)包含功能模块:图像的边缘检测(使用不同梯度算子和拉普拉斯算子)(3)封闭轮廓边界 (4)区域分割算法:阈值分割,区域生长等

3.前言 3.1图像阈值分割技术基本原理 所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内,表现出一致性或相似性,而在不同区域间表现出明显的不同。简单的讲,就是在一幅图像中,把目标从背景中分离出来,以便于进一步处理。图像分割是图像处理与计算机视觉领域低层次视觉中最为基础和重要的领域之一,它是对图像进行视觉分析和模式识别的基本前提。同时它也是一个经典难题,到目前为止既不存在一种通用的图像分割方法,也不存在一种判断是否分割成功的客观标准]5[。 在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣,这些部分称为目标或前景(其他部分称为背景),他们一般对应图像中特定的、具有独特性质的区域。为了辨识和分析目标,需要将他们分离提取出来,在此基础上才有可能对目标进一步利用。图像分割就是指把图像分成格局特性的区域并提取出感兴趣目标的技术和过程。这里特性可以是象素的灰度、颜色、纹理等,预先定义的目标可以对应单个区域,也可以对应多个区域。现有的图像分割算法有:阈值分割、边缘检测和区域提取法。本文着重研究基于阈值法的图像分割技术。 若图像中目标和背景具有不同的灰度集合:目标灰度集合与背景灰度集合,且两个灰度集合可用一个灰度级阈值T进行分割。这样就可以用阈值分割灰度级的方法在图像中分割出目标区域与背景区域,这种方法称为灰度阈值分割方法。 在物体与背景有较强的对比度的图像中,此种方法应用特别有效。比如说物体内部灰度分布均匀一致,背景在另一个灰度级上也分布均匀,这时利用阈值可以将目标与背景分割得很好。如果目标和背景的差别是某些其他特征而不是灰度特征时,那么先将这些特征差别转化为灰度差别,然后再应用阈值分割方法进行处理,这样使用阈值分割技术也可能是有效的

车牌识别中二值化方法的研究与实现

车牌识别中二值化方法的研究与实现 摘要:在基于数字图像处理的车牌识别技术的研究过程中,因为车牌定位和字符分割一般都是基于车牌区域的二值化结果进行的,因此对图像的二值化是非常关键的一步。二值化最主要的是阈值的确定,文章对比了几种常规的车牌图像全局阈值二值化处理算法,发现这些方法不够理想,然后提出几种新的方法——基于图像直方图波形分析的车牌图像二值化处理算法;考虑到光照变化以及定位出的车牌周边环境和自身干扰等因素,提出了一种新的车牌二值化的方法,这种方法结合了高斯拉普拉斯算子法和迭代法;而不均匀光照下的图像二值化是数字图像处理中的另一个难题.为此,本文提出一种解决办法,首先使用同态滤波去掉车牌图像的不均匀光照的影响,然后使用改进的Bernsen算法对车牌图像进行二值化。实验表明,这三种方法在进行车牌图像二值化处理时效果比较理想。 关键词:车牌识别;二值化;高斯拉普拉斯算子;图像直方图;不均匀光线 Realize and Research on binarization method of license plate recognition Abstrac t:During the research for the license plate recognition based on the Distal Image Processing Technology,because the location and segmentation of license plate are usually based on the binarized image,the image binaryzation is a key step.The most important part of the image binaryzation is the determination of threshold.In this paper,severalmethods have been compared,and also the basic principles and computer simulation results of inter-class varimaxand maximum entropy method have been analyzed.But we have found that these methods are not optional when used to process vehicle license plate images.Therefore,a new method has been put forward,which is the arithtactic of license plate image binarization based on image histogram.Considering the changes of illumination,the surrounding environment of the license plate and the license plate itself,a new method of taking threshold value of binarization is introduced.This method combines the Gauss-Laplace method and the iteration method.It is a difficult task to binarize image under nonuniform illumination.A new method is presented as follows:at first,it enhances the plate image quality by homomorphic filtering to eliminate the bad effect of the nonuniform illumination;then,binarizes the plate image by a improved Bernsen algorithm.It has been proved that the three methods are well when used to process vehicle license plate images. Key words:Vehicle license plate recognition, binary, gaosilapulasi operator, image histogram, uneven light

三种不同灰度图像增强算法对比

三种不同灰度图像增强算法对比 一、摘要 本文主要是运用直方图均衡化、平滑、锐化三种常见的图像增强算法对图像进行处理,并在此基础上分别用这 3 种算法处理的灰度图像进行比较,比对它们对图像的处理效果, 分析3 种方法在图像增强处理能力的优劣之处。 结果发现,直方图均衡化可以均衡图像的灰度等级, 经过直方图的均衡化,图像的细节更加清楚了,但是由于直方图均衡化没有考虑图像的内容,只是简单的将图像进行直方图均衡,提高图像的对比度,使图像看起来亮度过高,使图像细节受到损失; 图像平滑的目的是减少或消除图像的噪声, 图像平滑可以使图像突兀的地方变得不明显, 但是会使图像模糊,这也是图像平滑后不可避免的后果,只能尽量减轻,尽量的平滑掉图像的噪声又尽量保持图像细节,这也是图像平滑研究的主要问题; 图像锐化使图像的边缘、轮廓变得清晰,并使其细节清晰,常对图像进行微分处理,但是图像的信噪比有所下降。 关键词: 图像增强灰度图直方图平滑锐化 二、三种图像增强算法 图像预处理是相对图像识别、图像理解而言的一种前期处理,主要是指按需要进行适当的变换突出某些有用的信息,去除或削弱无用的信息,在对图像进行分析之前, 通常要对图像质量进行改善,改善的目的就是要使处理后的图像比原始图像更适合特定的应用。影响图像清晰度的因素很多,主要有光照不足、线路传输收到干扰等。 现存的图像增强技术主要分为空间域法和频率域法两类,其中的增强方法主要有直方图的修正、灰度变换、图像平滑、图像锐化、伪彩色和假彩色处理等。下面主要采用直方图均衡化、图像平滑、图像线性锐化对图像进行增强处理, 对比他们的处理效果,分析 3 种方法的在图像增强处理方面的优劣。 1、直方图均衡化 直方图均衡化也称为直方图均匀化,是一种常见的灰度增强算法,是将原图像的直方图经过变换函数修整为均匀直方图,然后按均衡后的直方图修整原图像。 为方便研究,先将直方图归一化,然后图像增强变换函数需要满足2个条件。 假设灰度级为归一化至范围[0,1]内的连续量,设其中任一灰度级别Z归一化为r,变换后图像的任一灰度级Z'归一化为s,显然r,s应当满足:0<=r<=1,0<=s<=1 因此直方图修正就是对下列公式的计算过程:s=T(r)或r=T'(s) 式中T(r)为变换函数,它必须满足下列条件: a在0<=r<=1区间内是单值单调增加函数; b对于0<=r<=1,有T(r)在[0,1]内。 条件a 保证灰度级从黑到白的次序,而条件b确保映射后的像素灰度在允许的范围内,避免整个图像明显变亮或者变暗。 从S 到r的反变换关系为r=T'(s) ;T'(s)对r同样满足上述条件。 灰度变换是对图像上各个像素点的灰度值x 按某个函数T 变换到y ,将图像的灰度级整个范围或其中某一段( A, B)扩展或压缩到( A, B)。直方图均衡化是灰度变换的一个重要应用,是以累计分布函数变换为基础的直方图修正法, 可以产生一幅灰度级分布具有均匀概率密度的图像。一幅图像灰度级r k 出现的概率近似为 其中n 是图像中像素的总和, nk 是灰度级为r k 的像素个数, L 为图像中灰度级总数。若

基于matlab的数字图像增强算法研究与实现

基于matlab的数字图像增强算法研究与实现 摘要图像在获取和传输过程中,会受到各种噪声的干扰,使图像退化质量下降,对分析图像不利。图像的平滑或去噪一直是数字图像处理技术中的一项重要工作。为此,论述了在空间域中的各种数字图像平滑技术方法。 关键字:数字图像;图像增强;平滑处理

目录 第一章、概述 2 1.1 图像平滑意义 2 1.2图像平滑应用 2 1.3噪声模 型 (3) 第二章 、图像平滑方法 5 2.1 空域低通滤波 5 2.1.1 均值滤波器 6 2.1.2 中值滤波器 6 2.2 频域低通滤波 7 第三章、图像平滑处理与调试 9 3.1 模拟噪声图像 9 3.2均值滤波法 11 3.3 中值滤波法 14 3.4 频域低通滤波法 17 第四章、总结与体会 19 参考文献 20 第一章、概述 1.1图像平滑意义 图像平滑(S m o o t h i n g)的主要目的是减少图像噪声。图像噪声来自于多方面,有来自于系统外部的干扰(如电磁波或经

电源窜进系统内部的外部噪声),也有来自于系统内部的干扰(如摄像机的热噪声,电器机械运动而产生的抖动噪声内部噪声)。实际获得的图像都因受到干扰而有噪声,噪声产生的原因决定了噪声分布的特性及与图像信号的关系。减少噪声的方法可以在空间域或在频率域处理。在空间域中进行时,基本方法就是求像素的平均值或中值;在频域中则运用低通滤波技术。 图像中的噪声往往是和信号交织在一起的,尤其是乘性噪声,如果平滑不当,就会使图像本身的细节如边缘轮廓,线条等模糊不清,从而使图像降质。图像平滑总是要以一定的细节模糊为代价的,因此如何尽量平滑掉图像的噪声,又尽量保持图像的细节,是图像平滑研究的主要问题之一。 1.2图像平滑应用 图像平滑主要是为了消除被污染图像中的噪声,这是遥感图像处理研究的最基本内容之一,被广泛应用于图像显示、传 输、分析、动画制作、媒体合成等多个方面。该技术是出于人类视觉系统的生理接受特点而设计的一种改善图像质量的方法。处理对象是在图像生成、传输、处理、显示等过程中受到多种因素扰动形成的加噪图像。在图像处理体系中,图像平滑是图像复原技术针对“一幅图像中唯一存在的退化是噪声”时的特例。 1.3噪声模型 1.3.1噪声来源 一幅图像可能会受到各种噪声的干扰,而数字图像的实质就是光电信息,因此图像噪声主要可能来源于以下几个方面:光电传感器噪声、大气层电磁暴、闪电等引起的强脉冲干扰、

基于灰度直方图的图像分割阈值自适应选取方法

中北大学 毕业设计(论文)任务书 学院、系: 专业: 学生姓名:车永健学号: 设计(论文)题目:基于灰度直方图的图像分割阈值自适应选取方法 起迄日期: 2015年3月9日~2015年6月20日设计(论文)地点: 指导教师:郭晨霞 系主任: 发任务书日期:2015年 2 月25 日

任务书填写要求 1.毕业设计(论文)任务书由指导教师根据各课题的具体情况填写,经学生所在系的负责人审查、系领导签字后生效。此任务书应在毕业设计(论文)开始前一周内填好并发给学生; 2.任务书内容必须用黑墨水笔工整书写或按教务处统一设计的电子文档标准格式(可从教务处网页上下载)打印,不得随便涂改或潦草书写,禁止打印在其它纸上后剪贴; 3.任务书内填写的内容,必须和学生毕业设计(论文)完成的情况相一致,若有变更,应当经过所在专业及系主管领导审批后方可重新填写; 4.任务书内有关“学院、系”、“专业”等名称的填写,应写中文全称,不能写数字代码。学生的“学号”要写全号(如020*******,为10位数),不能只写最后2位或1位数字; 5.有关年月日等日期的填写,应当按照国标GB/T 7408—94《数据元和交换格式、信息交换、日期和时间表示法》规定的要求,一律用阿拉伯数字书写。如“2004年3月15日”或“2004-03-15”。

毕业设计(论文)任务书

毕业设计(论文)任务书 3.对毕业设计(论文)课题成果的要求〔包括毕业设计(论文)、图纸、实物样品等): 1、论文一份; 2、程序代码及图像结果; 3、英文翻译一份。 4.毕业设计(论文)课题工作进度计划: 起迄日期工作内容 2015年 3月 9 日~ 3 月20日 4 月 1 日~ 4月 20 日 4 月 21 日~ 5月 10 日 5 月 11 日~ 6月 15 日 6 月 16 日~ 6月 19 日查找资料,完成开题报告; 学习有关知识,方案确定,完成中期报告;完善算法并仿真验证; 撰写、修改、评阅毕业论文; 论文答辩 学生所在系审查意见: 系主任: 年月日

图像二值化算法研究与实现

图像二值化算法研究与实现 摘要:图像二值化是图像预处理中的一项重要技术,在模式识别、光学字符识别、医学成像等方面都有重要应用。论文介绍了图像及数字图像处理技术的一些概念和相关知识;对VC++ 软件的发展和软件在图像处理中的应用做了简要介绍;还介绍了图像二值化算法以及利用VC++软件工具进行算法的实现。论文重点实现了图像分割技术中常用灰度图像二值化算法,如Otsu算法、Bernsen算法,并对这些算法运行的实验结果进行分析与比较。 关键词:图像处理;二值化;VC++; 1.引言 1.1 图像与数字图像 图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。 数字图像:数字图像是将连续的模拟图像经过离散化处理后得到的计算机能够辨识的点阵图像。在严格意义上讲,数字图像是经过等距离矩形网格采样,对幅度进行等间隔量化的二维函数。因此,数字图像实际上就是被量化的二维采样数组。 1.2 数字图像处理技术内容与发展现状 数字图像处理就是采用一定的算法对数字图像进行处理,以获得人眼视觉或者某种接受系统所需要的图像处理过程。图像处理的基础是数字,主要任务是进行各种算法设计和算法实现。 图像处理技术的发展大致经历了初创期、发展期、普及期和实用化期4个阶段。初创期开始与20世纪60年代,当时的图像采用像素型光栅进行少秒显示,大多采用中、大型机对其处理。在这一时期,由于图像存储成本高、处理设备昂贵,其应用面很窄。进入20世纪70年代的发展期,开始大量采用中、小型机进行处理,图像处理也逐渐改用光栅扫描方式,特别是CT和卫星遥感图像的出现,对图像处理技术的发展起到了很好的推动作用。到了20世纪80年代,图像处理技术进入普及期,此时的微机已经能够担当起图形图像处理的任务。超大规模集成电路(Very Large Scale Integration, VLSI)的出现更使处理速度大大提高,设备造价也进一步降低,极大地促进了图形图像系统的普及和应用。20世纪90年代是图像处理技术的实用化时期,图像处理的信息量巨大,对处理速度的要求极高。 1.3 图像二值化原理及意义 图像二值化是指用灰度变换来研究灰度图像的一种常用方法,即设定某一阈值将灰度

相关主题
文本预览
相关文档 最新文档