第8章 二值图像处理
- 格式:ppt
- 大小:2.00 MB
- 文档页数:49
第三章 二值图像分析一幅数字图像是一个二维阵列,阵列元素值称为灰度值或强度值.实际上,图像在量化成数字图像前是一个连续强度函数的集合,场景信息就包含在这些强度值中.图像强度通常被量化成256个不同灰度级,对某些应用来说,也常有32、64、128或512个灰度级的情况,在医疗领域里甚至使用高达4096(12bits)个灰度级.很明显,灰度级越高,图像质量越好,但所需的内存也越大.在机器视觉研究的早期,由于内存和计算能力非常有限,而且十分昂贵,因此视觉研究人员把精力主要集中在研究输入图像仅包含两个灰度值的二值视觉系统上.人们注意到,人类视觉在理解仅由两个灰度级组成的线条、轮廓影像或其它图像时没有任何困难,而且应用场合很多,这一点对研究二值视觉系统的研究人员是一个极大的鼓舞.随着计算机计算能力的不断增强和计算成本的不断下降,人们普遍开始研究基于灰度图像、彩色图像和深度图像的视觉系统.尽管如此,二值视觉系统还是十分有用的,其原因如下:⑴ 计算二值图像特性的算法非常简单,容易理解和实现,并且计算速度很快.⑵ 二值视觉所需的内存小,对计算设备要求低.工作在256个灰度级的视觉系统所需内存是工作在相同大小二值图像视觉系统所需内存的八倍.如若利用游程长度编码等技术(见3.4节)还可使所需内存进一步减少.由于二值图像中的许多运算是逻辑运算而不是算术运算,所以所需的处理时间很短.(3)许多二值视觉系统技术也可以用于灰度图像视觉系统上.在灰度或彩色图像中,表示一个目标或物体的一种简易方法就是使用物体模板(mask),物体模板就是一幅二值图像,其中1表示目标上的点,0表示其它点.在物体从背景中分离出来后,为了进行决策,还需要求取物体的几何和拓扑特性,这些特性可以从它的二值图像计算出来.因此,尽管我们是在二值图像上讨论这些方法,但它们的应用并不限于二值图像.一般来说,当物体轮廓足以用来识别物体且周围环境可以适当地控制时,二值视觉系统是非常有用的.当使用特殊的照明技术和背景并且场景中只有少数物体时,物体可以很容易地从背景中分离出来,并可得到较好的轮廓,比如,许多工业场合都属于这种情况.二值视觉系统的输入一般是灰度图像,通常使用阈值法首先将图像变成二值图像,以便把物体从背景中分离出来,其中的阈值取决于照明条件和物体的反射特性.二值图像可用来计算特定任务中物体的几何和拓扑特性,在许多应用中,这种特性对识别物体来说是足够的.二值视觉系统已经在光学字符识别、染色体分析和工业零件的识别中得到了广泛应用.在下面的讨论中,假定二值图像大小为n m ⨯,其中物体像素值为1,背景像素值为0.3.1 阈值视觉系统中的一个重要问题是从图像中识别代表物体的区域(或子图像),这种对人来说是件非常容易的事,对计算机来说却是令人吃惊的困难.为了将物体区域同图像其它区域分离出来,需要首先对图像进行分割.把图像划分成区域的过程称为分割,即把图像],[j i F 划分成区域k p p p ,,,21⋅⋅⋅,使得每一个区域对应一个候选的物体.下面给出分割的严格定义.定义 分割是把像素聚合成区域的过程,使得:● ==i k i P 1 整幅图像 (}{i P 是一个完备分割 ). ● j i P P j i ≠∅=, ,(}{i P 是一个完备分割).● 每个区域i P 满足一个谓词,即区域内的所有点有某种共同的性质.● 不同区域的图像,不满足这一谓词.正如上面所表明的,分割满足一个谓词,这一谓词可能是简单的,如分割灰度图像时用的均匀灰度分布、相同纹理等谓词,但在大多数应用场合,谓词十分复杂.在图像理解过程中,分割是一个非常重要的步骤. 二值图像可以通过适当地分割灰度图像得到.如果物体的灰度值落在某一区间内,并且背景的灰度值在这一区间之外,则可以通过阈值运算得到物体的二值图像,即把区间内的点置成1,区间外的点置成0.对于二值视觉,分割和阈值化是同义的.阈值化可以通过软件来实现,也可以通过硬件直接完成.通过阈值运算是否可以有效地进行图像分割,取决于物体和背景之间是否有足够的对比度.设一幅灰度图像],[j i F 中物体的灰度分布在区间],[21T T 内,经过阈值运算后的图像为二值图像],[j i F T ,即:⎩⎨⎧≤≤=其它如果0],[ 1],[21T j i F T j i F T (3.1) 如果物体灰度值分布在几个不相邻区间内时,阈值化方案可表示为: ⎩⎨⎧∈=其它如果0],[ 1],[Z j i F j i F T (3.2) 其中Z 是组成物体各部分灰度值的集合.图3.1是对一幅灰度图像使用不同阈值得到的二值图像输出结果. 阈值算法与应用领域密切相关.事实上,某一阈值运算常常是为某一应用专门设计的,在其它应用领域可能无法工作.阈值选择常常是基于在某一应用领域获取的先验知识,因此在某些场合下,前几轮运算通常采用交互式方式来分析图像,以便确定合适的阈值.但是,在机器视觉系统中,由于视觉系统的自主性能(autonomy )要求,必须进行自动阈值选择.现在已经研究出许多利用图像灰度分布和有关的物体知识来自动选择适当阈值的技术.其中的一些方法将在3.2节介绍.图3.1 一幅灰度图像和使用不同阈值得到的二值图像结果.上左:原始灰度图像,上右:阈值T=100;左下:T=128.右下:T1=100|T2=128. 3.2 几何特性通过阈值化方法从图像中检测出物体后,下一步就要对物体进行识别和定位.在大多数工业应用中,摄像机的位置和环境是已知的,因此通过简单的几何知识就可以从物体的二维图像确定出物体的三维位置.在大多数应用中,物体的数量不是很多,如果物体的尺寸和形状完全不同,则可以利用尺度和形状特征来识别这些物体.实际上在许多工业应用中,经常使用区域的一些简单特征,如大小、位置和方向,来确定物体的位置并识别它们.3.2.1 尺寸和位置一幅二值图像区域的面积(或零阶矩)由下式给出:∑∑-=-==1010],[n i m j j i B A (3.3)在许多应用中,物体的位置起着十分重要的作用.工业应用中,物体通常出现在已知表面(如工作台面)上,而且摄像机相对台面的位置也是已知的.在这种情况下,图像中的物体位置决定了它的空间位置.确定物体位置的方法有许多,比如用物体的外接矩形、物体矩心(区域中心)等来表示物体的位置.区域中心是通过对图像进行“全局”运算得到的一个点,因此它对图像中的噪声相对来说是不敏感的.对于二值图像,物体的中心位置与物体的质心相同,因此可以使用下式求物体的中心位置:∑∑∑∑∑∑∑∑-=-=-=-=-=-=-=-=-==1010101010101010],[],[],[],[n i n i m j m j n i m j n i m j j i iB j i B y j i jB j i B x (3.4)其中x 和y 是区域相对于左上角图像的中心坐标.物体的位置为:Aj i iB y A j i jB x n i m j n i m j ∑∑∑∑-=-=-=-=-==10101010],[],[ (3.5)这些是一阶矩.注意,由于约定y 轴向上,因此方程3.4和3.5的第二个式子的等号右边加了负号.3.2.2 方向计算物体的方向比计算它的位置稍微复杂一点.某些形状(如圆)的方向不是唯一的,为了定义唯一的方向,一般假定物体是长形的,其长轴方向被定义为物体的方向.通常,二维平面上与最小惯量轴同方向的最小二阶矩轴被定为长轴.图像中物体的二阶矩轴是这样一条线,物体上的全部点到该线的距离平方和最小.给出一幅二值图像],[j i B ,计算物体点到直线的最小二乘方拟合,使所有物体点到直线的距离平方和最小:χ220101==-=-∑∑r B i j ij j m i n [,] (3.6)其中r ij 是物体点],[j i 到直线的距离.为了避免直线处于近似垂直时所出现的数值病态问题,人们一般把直线表示成极坐标形式:θθρsin cos y x += (3.7)如图3.2所示,θ是直线的法线与x 轴的夹角,ρ是直线到原点的距离.把点),(j i 坐标代入直线的极坐标方程得出距离r :22)sin cos (ρθθ-+=y x r (3.8)图3.2 直线的极坐标表示将方程3.8代入方程3.6并求极小化问题,可以确定参数ρ和θ:∑∑-=-=-+=101022],[)sin cos (n i m j ij ij j i B y x ρθθχ (3.9) 令2χ对ρ的导数等于零求解ρ得:)sin cos (θθρy x += (3.10) 它说明回归直线通过物体中心),(y x .用这一ρ值代入上面的2χ,则极小化问题变为:θθθθχ222sin cos sin cos c b a ++= (3.11)其中的参数:],[)(],[))((2],[)(10210101010102j i B y y c j i B y y x x b j i B x x a n i m j ij n i m j ij ij n i m j ij ∑∑∑∑∑∑-=-=-=-=-=-=-=--=-= (3.12)是二阶矩.表达式2χ可重写为:θθχ2sin 212cos )(21)(212b c a c a +-++=(3.13) 对2χ微分,并置微分结果为零,求解 值:ca b -=θ2tan (3.14) 因此,惯性轴的方向由下式给出: 2222)(2cos )(2sin c a b ca c ab b -+-±=-+±=θθ (3.15) 所以由2χ的最小值可以确定方向轴.注意,如果c a b ==,0,那么物体就不会只有唯一的方向轴.物体的伸长率E 是2χ的最大值与最小值之比:m inm ax χχ=E (3.16) 3.2.3 密集度和体态比区域的密集度(compact )可用下面的式子来度量:2pA C = (3.17) 其中,p 和A 分别为图形的周长和面积.根据这一衡量标准,圆是最密集的图形,其密集密度为最大值π4/1,其它一些图形的比值要小一些.让我们来看一下圆,当圆后仰时,形状成了一椭圆,面积减小了而周长却不象面积减小的那么快,因此密集度降低了.在后仰到极限角时,椭圆被压缩成了一条无限长直线,椭圆的周长为无穷大,故密集度变成了零.对于数字图像, 2p A 是指物体尺寸(像素点数量)除以边界长度的平方.这是一种很好的散布性或密集性度量方法.这一比值在许多应用中被用作为区域的一个特征.密集度的另一层意义是:在给定周长的条件下,密集度越高,围成的面积就越大.注意在等周长的情况下,正方形密集度大于长方形密集度.体态比定义为区域的最小外接矩形的长与宽之比,正方形和圆的体态比等于1,细长形物体的体态比大于1.图3.3所示的是几种形状的外接矩形.图3。
第一章引言一.填空题1. 数字图像是用一个数字阵列来表示的图像。
数字阵列中的每个数字,表示数字图像的一个最小单位,称为_像素_。
2. 数字图像处理可以理解为两个方面的操作:一是从图像到图像的处理,如图像增强等;二是_从图像到非图像的一种表示_,如图像测量等。
3. 数字图像处理可以理解为两个方面的操作:一是_从图像到图像的处理_,如图像增强等;二是从图像到非图像的一种表示,如图像测量等。
4. 图像可以分为物理图像和虚拟图像两种。
其中,采用数学的方法,将由概念形成的物体进行表示的图像是虚拟图像_。
5. 数字图像处理包含很多方面的研究内容。
其中,_图像重建_的目的是根据二维平面图像数据构造出三维物体的图像。
二.简答题1. 数字图像处理的主要研究内容包含很多方面,请列出并简述其中的5种。
①图像数字化:将一幅图像以数字的形式表示。
主要包括采样和量化两个过程。
②图像增强:将一幅图像中的有用信息进行增强,同时对其无用信息进行抑制,提高图像的可观察性。
③图像的几何变换:改变图像的大小或形状。
④图像变换:通过数学映射的方法,将空域的图像信息转换到频域、时频域等空间上进行分析。
⑤图像识别与理解:通过对图像中各种不同的物体特征进行定量化描述后,将其所期望获得的目标物进行提取,并且对所提取的目标物进行一定的定量分析。
2. 什么是图像识别与理解?图像识别与理解是指通过对图像中各种不同的物体特征进行定量化描述后,将其所期望获得的目标物进行提取,并且对所提取的目标物进行一定的定量分析。
比如要从一幅照片上确定是否包含某个犯罪分子的人脸信息,就需要先将照片上的人脸检测出来,进而将检测出来的人脸区域进行分析,确定其是否是该犯罪分子。
4. 简述数字图像处理的至少5种应用。
①在遥感中,比如土地测绘、气象监测、资源调查、环境污染监测等方面。
②在医学中,比如B超、CT机等方面。
③在通信中,比如可视电话、会议电视、传真等方面。
④在工业生产的质量检测中,比如对食品包装出厂前的质量检查、对机械制品质量的监控和筛选等方面。
图像处理技术中的阈值分割与二值化方法在图像处理领域中,阈值分割与二值化方法是一种常用且重要的技术。
它们可以将一幅灰度图像分为多个亮度不同的区域,从而提取出我们感兴趣的目标。
阈值分割与二值化方法在很多应用中都有广泛的应用,比如目标检测、图像增强、字符识别等。
本文将详细介绍这两种方法的原理和常见应用。
我们来了解一下阈值分割的原理。
阈值分割是基于图像的灰度值来进行图像分割的一种方法。
它主要通过设置一个阈值,将图像中的像素根据其灰度与阈值的关系划分为两类:亮区域和暗区域。
对于每个像素,如果其灰度值大于阈值,则划分为亮区域,否则划分为暗区域。
这样,我们就可以得到一幅二值图像,其中亮区域的像素值为255(白色),暗区域的像素值为0(黑色)。
阈值分割方法有多种,常见的有全局阈值分割、自适应阈值分割和多阈值分割等。
全局阈值分割是在整幅图像上寻找一个全局的阈值进行分割,适用于图像中目标与背景之间的灰度差异较大的情况。
自适应阈值分割则是根据图像中每个像素周围的灰度值来确定其阈值,适用于图像中目标与背景之间的灰度差异较小的情况。
多阈值分割则是将图像分为多个灰度级别的区域,适用于图像中存在多个目标的情况。
除了阈值分割,二值化方法也是一种常见的图像处理技术。
二值化方法将一幅灰度图像转换为二值图像,即将所有像素的灰度值限定为两种取值:0和255。
这种方法可以将图像的细节信息保留,同时降低图像的复杂度。
常见的二值化方法有全局二值化和局部二值化。
全局二值化方法是通过设定一个全局的灰度阈值,将图像中的像素根据其灰度与阈值的关系划分为两类。
与阈值分割类似,全局二值化也是将灰度值高于阈值的像素设为255(白色),低于阈值的像素设为0(黑色)。
不同之处在于,全局二值化是在灰度图像上进行的操作,而阈值分割可以是在原始彩色图像上进行。
局部二值化方法与全局二值化方法相比,更加适用于灰度变化较大、光照不均匀的图像。
它将图像分成很多个小块,在每个小块上进行局部阈值分割。
第一章概述一.填空题1. 数字图像是用一个数字阵列来表示的图像。
数字阵列中的每个数字,表示数字图像的一个最小单位,称为__________。
5. 数字图像处理包含很多方面的研究内容。
其中,________________的目的是根据二维平面图像数据构造出三维物体的图像。
解答:1. 像素5. 图像重建第二章数字图像处理的基础一.填空题1. 量化可以分为均匀量化和________________两大类。
3. 图像因其表现方式的不同,可以分为连续图像和________________两大类。
5. 对应于不同的场景内容,一般数字图像可以分为________________、灰度图像和彩色图像三类。
解答:1. 非均匀量化 3. 离散图像 5. 二值图像二.选择题1. 一幅数字图像是:( )A、一个观测系统。
B、一个有许多像素排列而成的实体。
C、一个2-D数组中的元素。
D、一个3-D空间的场景。
3. 图像与灰度直方图间的对应关系是:()A、一一对应B、多对一C、一对多D、都不对4. 下列算法中属于局部处理的是:()A、灰度线性变换B、二值化C、傅立叶变换D、中值滤波5. 一幅256*256的图像,若灰度级数为16,则该图像的大小是:()A、128KBB、32KBC、1MB C、2MB6. 一幅512*512的图像,若灰度级数为16,则该图像的大小是:()A、128KBB、32KBC、1MB C、2MB解答:1. B 3. B 4. D 5. B 6. A三.判断题1. 可以用f(x,y)来表示一幅2-D数字图像。
()3. 数字图像坐标系与直角坐标系一致。
()4. 矩阵坐标系与直角坐标系一致。
()5. 数字图像坐标系可以定义为矩阵坐标系。
()6. 图像中虚假轮廓的出现就其本质而言是由于图像的灰度级数不够多造成的。
()10. 采样是空间离散化的过程。
()解答:1. T 3. F 4. F 5. T 6. T 10. T1、马赫带效应是指图像不同灰度级条带之间在灰度交界处存在的毛边现象(√)第三章图像几何变换一.填空题1. 图像的基本位置变换包括了图像的________________、镜像及旋转。
【数字图像处理】灰度图像⼆值化灰度图像每副图像的每个像素对应⼆维空间中⼀个特定的位置,并且有⼀个或者多个与那个点相关的采样值组成数值。
灰度图像,也称为灰阶图像,图像中每个像素可以由0(⿊)到255(⽩)的亮度值(Intensity)表⽰。
0-255之间表⽰不同的灰度级。
灰度图像⼆值化⼆值化:以⼀个值(阈值)为基准,⼤于(等于)这个值的数全部变为是1(或者0),⼩于等于这个数的就全部将他们变为0(或1)。
⼆值化算法处理飞思卡尔赛道思路:设定⼀个阈值valve,对于图像矩阵中的每⼀⾏,从左⾄右⽐较各像素值和阈值的⼤⼩,若像素值⼤于或等于阈值,则判定该像素对应的是⽩⾊赛道;反之,则判定对应的是⿊⾊的⽬标引导线。
记下第⼀次和最后⼀次出现像素值⼩于阈值时的像素点的列号,算出两者的平均值,以此作为该⾏上⽬标引导线的位置。
摄像头的⼆值化的代码:Void image_binaryzation(){for(int i=0;i{for(int j=0;j{if(Image[i][j] >= Threshold)Image_new[i][j]=1;elseImage_new[i][j]=0;}}}Row是对应采集到的⾏数,Col是列数,Image[i][j]是摄像头采集未⼆值化的数据存放的数组,Img[i][j]是新建的存放⼆值化后的数组。
合适的阈值在阈值⼆值化中,最主要的是选取合适的阈值,这也是⼆值化的难点所在。
常⽤的⼆值化阈值选取⽅法有双峰法、p参数法、⼤律法(Otsu法)、最⼤熵阈值法、迭代法等。
⼤律法(Otsu法)Otsu⽅法⼜名最⼤类间差⽅法,通过统计整个图像的直⽅图特性来实现全局阈值T的⾃动选取,其算法步骤为:1) 先计算图像的直⽅图,即将图像所有的像素点按照0~255共256个bin,统计落在每个bin的像素点数量2) 归⼀化直⽅图,也即将每个bin中像素点数量除以总的像素点3) i表⽰分类的阈值,也即⼀个灰度级,从0开始迭代4) 通过归⼀化的直⽅图,统计0~i 灰度级的像素(假设像素值在此范围的像素叫做前景像素) 所占整幅图像的⽐例w0,并统计前景像素的平均灰度u0;统计i~255灰度级的像素(假设像素值在此范围的像素叫做背景像素) 所占整幅图像的⽐例w1,并统计背5) 计算前景像素和背景像素的⽅差 g = w0*w1*(u0-u1) (u0-u1)6) i++;转到4),直到i为256时结束迭代7)将最⼤g相应的i值作为图像的全局阈值缺陷:OSTU算法在处理光照不均匀的图像的时候,效果会明显不好,因为利⽤的是全局像素信息。
二值化处理的方法嘿,咱今儿来聊聊二值化处理的方法哈!你说这二值化处理,就好像是把一个花花世界一下子变成了非黑即白的两极世界。
想象一下啊,原本五彩斑斓、丰富多彩的图像或者数据,通过二值化处理,就只剩下了两种颜色,黑和白,简单粗暴得很呢!就好比咱过日子,有时候就得把复杂的事情简单化,二值化处理不就是这么个道理嘛。
常见的二值化处理方法有好几种呢。
比如说阈值法,这就像是给事情划了一道明确的线。
低于这个线的就是黑,高于这个线的就是白,多干脆!咱就根据这个阈值来决定每个像素是黑还是白,是不是挺有意思的?还有基于聚类的方法呢,这就好像把一堆东西分成两类,让它们各自找到自己的归属。
再来说说自适应阈值法,这可就高级了点儿哦。
它不是固定一个阈值,而是根据图像的不同区域自动调整阈值,多灵活啊!就跟咱人一样,在不同的环境下得有不同的应对方式,不能死板板的呀。
还有一种局部二值化方法,这就像是把一个大问题拆分成一个个小问题来解决。
针对图像的每个小局部进行二值化处理,这样能更细致、更准确地处理图像呢。
二值化处理在很多领域都有大用呢!比如在图像识别里,把复杂的图像简化,让计算机更容易识别和处理。
在文档处理中,也能把文字和背景区分开来,方便后续的操作。
你说这二值化处理是不是挺神奇的?它能把复杂变得简单,把混乱变得有序。
虽然看似简单粗暴,但却有着大大的用处。
就像咱生活中的一些小技巧,看似不起眼,用好了却能解决大问题。
总之呢,二值化处理的方法各有各的特点和用处,咱得根据具体的需求和情况来选择合适的方法。
这就跟咱出门穿啥衣服一样,得看天气、场合和心情不是?咱得好好琢磨琢磨,怎么才能把二值化处理用得恰到好处,让它为咱的工作和生活带来更多的便利和好处。
你说是不是这个理儿呀?。
数字图像处理知识点总结 1 / 9 数字图像办理知识点总结 第一章导论 1. 图像:对客观对象的一种相像性的生动性的描述或写真。 2. 图像分类:按可见性(可见图像、不行见图像) ,按波段数(单波段、多波段、超波段) ,按空间坐标和亮度的连续性(模拟和数字) 。 3. 图像办理:对图像进行一系列操作,以抵达预期目的的技术。 4. 图像办理三个层次:狭义图像办理、图像剖析和图像理解。 5. 图像办理五个模块:收集、显示、储存、通讯、办理和剖析。
第二章数字图像办理的基本观点 6. 模拟图像的表示: f(x , y) = i(x , y) × r(x ,y) ,照度重量 007. 图像数字化:将一幅画面转变为计算机能办理的形式——数字图像的过程。它包含采样和量化两个过程。像素的地点和灰度就是像素的属性。
8. 将空间上连续的图像变换成失散点的操作称为采样。采样间隔和采样孔径的大小是两个很重要的参数。采样方式 : 有缝、无缝和重叠。 9. 将像素灰度变换成失散的整数值的过程叫量化。 10. 表示像素明暗程度的整数称为像素的灰度级(或灰度值或灰度)。 11. 数字图像依据灰度级数的差别可分为:黑白图像、灰度图像和彩色图像。 12. 采样间隔对图像质量的影响:一般来说,采样间隔越大,所得图像像素数越少,空间分 辨率低,质量差,严重时出现像素呈块状的国际棋盘效应;采样间隔越小, 所得图像像素数越多,空间分辨率高,图像质量好,但数据量大。
13. 量化等级对图像质量的影响:量化等级越多,所得图像层次越丰富,灰度分辨率高,图像质量好,但数据量大;量化等级越少,图像层次欠丰富,灰度分辨率低,会出现假轮廓现象,图像质量变差, 但数据量小。但在很少量状况下对固定图像大小时,减少灰度级能改良 质量,产生这类状况的最可能原因是减少灰度级一般会增添图像的对照度。 比如对细节比较 丰富的图像数字化。 14. 数字化器构成: 1) 采样孔:保证独自观察特定的像素而不受其余部分的影响。 2) 图像扫描机构:使采样孔按早先确立的方式在图像上挪动。 3) 光传感器:经过采样孔丈量图像的每一个像素的亮度。 4) 量化器:将传感器输出的连续量转变为整数值。 5) 输出储存体:将像素灰度值储存起来。它能够是固态储存器,或磁盘等。 15. 灰度直方图反应的是一幅图像中各灰度级像素出现的频次。以灰度级为横坐标,纵坐标为灰度级的频次,绘制频次同灰度级的关系图就是灰度直方图。
二值化图像?二值化——图像只有两种色,黑白。
0-1,0=黑,1=白灰度:0-255彩色:255,255,255定义:图像的二值化,就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。
一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,常用的方法就是设定一个阈值T,用T将图像的数据分成两部分:大于T的像素群和小于T的像素群。
这是研究灰度变换的最特殊的方法,称为图像的二值化(Binarization)。
其实图像二值化的方法有不下二十种。
一般分为Global和Local两类,区别就是寻找那个阈值的时候使用到了哪里的信息。
一般是为了将感兴趣目标和背景分离。
图像的二值化是最简单的图像处理技术,它一般都跟具体算法联系在一起,很多算法的输入需要是二值数据。
比如你把图像文字转换为PDF 文字,PDF上只能是黑白两种颜色。
比如你给二维码解码,你需要知道哪块黑哪块白。
去掉图像两个字,二值化在视觉里面应用场景多一些。
比如早期的人脸检测很多手势识别的方法,第一步要找到皮肤块,所以需要把图像分为皮肤区域和非皮肤区域,这也算是一种二值化,但通常在方法上用的可能不是基于直方图的了(可能是ID3,随机森林,SVM,甚至神经网络)。
比如Haar特征,以及后来的BRIEF和FAST等,还有LBP实际上都是用到二值的思想。
图像二值化可以看作是聚类,可以看作是分类……这些其实不重要,重要的是它快。
它最明显的意义就是简化后期的处理,提高处理的速度。
`但是单一的图像二值化方法(指基于直方图的二值化)往往比不过其他的方法,因为,毕竟你信息丢了太多。
但是二值化快啊……你可以进行一百次不同的二值化,然后再得到一个更好的结果……上面右图中下面两个图是还可以对二值图像进行编码。
编码后就更好压缩了,那么我们就可以高度节省内存。
图像二值化方法:全局阈值局部阈值9.2 OpenCV中图像二值化方法:评判某个算法是否好,就看二值化图像信息是否丢失了很多。