基于K—means的图像文字识别与提取研究
- 格式:doc
- 大小:16.00 KB
- 文档页数:3
采⽤K-means的脑肿瘤磁共振图像分割与特征提取
采⽤K-means的脑肿瘤磁共振图像分割与特征提取
宗晓萍; ⽥伟倩
【期刊名称】《计算机⼯程与应⽤》
【年(卷),期】2020(056)003
【摘要】⼤脑肿瘤分割对于医师判断肿瘤恶化程度⾮常重要.然⽽,由于肿瘤的不规则形状、与周围组织的低对⽐度以及出现位置的不固定,给脑肿瘤的精确分割带来很⼤的困难.传统的K-means分割⽅法仅仅利⽤图像的灰度特征,很难准确分割肿瘤边界.利⽤灰度共⽣矩阵提取出的纹理特征,并结合图像⼏何不变矩特征对分割出的脑肿瘤图像进⾏特征提取.灰度共⽣矩阵定义为像素对的联合概率分布,是⼀个对称矩阵,它不仅反映图像灰度在相邻的⽅向、相邻间隔、变化幅度的综合信息,也反映了相同的灰度级像素之间的位置分布特征,是计算纹理特征的基础;⼏何矩(不变矩)具有旋转、平移、尺度等特性,能将图像分解为有限特征值,并且通过对⽐所提取出的同⼀病⼈的肿瘤图像的不变矩参数,可以获得该肿瘤⼏何形状变化程度.实验结果表明,该⽅法可以同时从纹理和⼏何特征对图像特征进⾏描述,与分别采⽤灰度共⽣矩阵和不变矩⽅法进⾏特征提取相⽐较,降低了算法计算量,同时提升了算法的抗噪性.
【总页数】7页(187-193)
【关键词】K-means; 特征提取; 灰度共⽣矩阵; 不变矩; 相关系数
【作者】宗晓萍; ⽥伟倩
【作者单位】河北⼤学电⼦信息⼯程学院河北保定 071000
【正⽂语种】中⽂
【中图分类】TP751。
技术创新39结合ca n ny边缘检测算法与k-means算法的图像文字识别◊内江师范学院数学与信息科学学院向涛杨乾辉邓云吴苹杨秀霞许雷本文就图像中文本的识别进行了深入的研究,在目前的技术领域,文本识别的技术还够成熟,但是依然有许多的方法能够解决文本识别问题,比如边缘特征法、将文本图像连通寻找适当新的区域法、还有就是基于一些文本自身独特的特征和机器学习的方法;其次是就算得到了一些文本数据,因为世界是多姿多彩的,每个文本在自然界中受到的光照强度、文本自身的大小、倾斜程度等都会给图像文本的识别增加更大的难度,但是也不是说不能够完全识别文本区域内容,只是各种方法各有各的优势,因此需要对应找到更实用的方法。
目前大部分文本识别算法的核心都差不多,基本上都是先确定文本的大致区域,缩小识别范围,从而降低识别时间,还能够提高文本识别的效率。
当今世界最先好的识别技术(OCR)m是很好的也是非常成熟的一个方法,通过大量的数据验证得到的结果是(OCR)皿具有良好的性能,但直接使用效果却不是很好,因此本文采用了canny边缘检测算法和k-means算法进行文本定位,在一定程度上增强了文本区域的识别。
1canny与k_means算法原理1.1基于canny边缘检测算法原理该算法舷于边缘特征的一个检测性算法,它在对文本的处理过程中会保留文本属性值不变,但是并不是对文本不加以处理,而是会将文本图像的数据规模进行缩减。
目前世界研究中基于边缘检测的算法还是比较多,本文采用的是canny算法,该算法能够很好的处理边缘检测问题,这为文本识别带来了优势。
边缘检测算法是多种多样的,而canny算法是找到最适合的f瞬检测,含义如下所示。
(1)搜寻最佳检测:边缘检测会把文本边缘的一些特征尽可能的提取到的同时,还需要满足漏检的概率值尽可能的小。
(2)边缘定位规则:要求搜寻到边缘的点与实际文本的边缘点相差不远,总之就是使得搜寻的边缘位置与实际文本的边缘位置的偏差不能够太大,从而提高识别精度。
Chinese text clustering algorithm based k-meansMingyu Yao,Dechang PiCollege of Information Science and Technology, Nanjing University of Aeronautics and AstronauticsNanjing, Jiangsu, 210016, PR China{my_yao@, dc.pi@}Xiangxiang CongSchool of Information Science & Engineering, East China University of Science and TechnologyShanghai, 200237, PR ChinaAbstract—Text clustering is an important means and method in text mining. The process of Chinese text clustering based on k-means was emphasized, we found that new center of a cluster was easily effected by isolated text after some experiments. Average similarity of one cluster was used as a parameter, and multiplied it with a modulus between 0.75 and 1.25 to get the similarity threshold value, the texts whose similarity with original cluster center was greater than or equal to the threshold value ware collected as a candidate collection, then updated the cluster center with center of candidate collection. The experiments show that improved method averagely increased purity and F value about 10 percent over the original method. Keywords-text cluster; k-means; Chinese text基于k-means的中文文本聚类算法姚明宇1,皮德常1,丛湘香21.南京航空航天大学 信息科学与技术学院,江苏 南京,中国,2100162.华东理工大学 信息科学与工程学院,上海,中国,2002371. my_yao@,2. dc.pi@【摘要】文本聚类是文本挖掘的重要手段和方法。
基于K-means颜色聚类分割与边缘检测的文字提取吴春法;潘亚文;王敬【期刊名称】《电脑知识与技术》【年(卷),期】2017(013)028【摘要】针对自然场景中文字提取受复杂环境因素的影响,如光照不均匀、自然场景背景颜色多样等因素影响,采用任何单一的图像分割技术都无法进行有效地进行文字区域分割和文字提取,提出一种两种方法相结合的自然环境场景中的文字提取方法.首先,采用实现颜色聚类的K-means算法对文本区域与有颜色背景分割,然后在文本区域内对文字进行二值化处理后运用边缘检测的方法提取文字.通过VC++编程环境及OpenCV技术作为该方法的验证平台,结果显示基于K-means算法实现颜色聚类与边缘检测方法相结合能有效进行自然环境中文字的提取.【总页数】3页(P206-207,210)【作者】吴春法;潘亚文;王敬【作者单位】福建师范大学闽南科技学院,福建泉州362332;福建师范大学闽南科技学院,福建泉州362332;福建师范大学闽南科技学院,福建泉州362332【正文语种】中文【中图分类】TP391【相关文献】1.基于 K-means的图像文字识别与提取研究 [J], 岳建杰;赵旦峰2.用小波变换及颜色聚类提取的视频图像内中文字幕 [J], 黄晓东;周源华3.基于K-means的图像文字识别与提取研究 [J], 段银雷;4.基于改进K-means图像分割算法的细叶作物覆盖度提取 [J], WU Huanli;CUI Kewang;ZHANG Xin;XUE Xuzhang;ZHENG Wengang;WANG Yan5.结合canny边缘检测算法与k-means算法的图像文字识别 [J], 向涛;杨乾辉;邓云;吴苹;杨秀霞;许雷因版权原因,仅展示原文概要,查看原文内容请购买。
2020·4(上)《科技传播》120作者简介:张鑫宇,江苏警官学院。
浅析K-Means聚类算法在刑事图像处理中的运用张鑫宇摘 要 刑事图像资料存在于痕迹、法医、文检、刑事照相等各个专业领域中,在刑事侦查和刑事审判中有着重要意义。
文章主要针对刑事活动中涉及的低质量图像,运用聚类中的K-Means 算法对图像进行计算分析,再基于图像分割,分离前景目标物与背景,排除背景干扰因素,以此帮助解决刑事图像处理过程中出现的一些难题。
关键词 聚类;K-Means 算法;刑事图像处理中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2020)256-0120-02近年来,先进的刑事图像处理技术给公安机关的侦查工作带来极为显著的成效。
运用刑事图像处理技术,能够为侦查过程中所涉及的刑事照相、图像增强、图像复原、图像测量等工作提供更加科学的技术支持和更为严谨的法律保证。
其中,K-Means 均值聚类算法在刑事图像分析中有着较广泛的 运用。
1 K-Means 聚类算法的简介聚类分析是分类学中的一个分支,但两者之间存在着本质的区别。
就目标而言,聚类算法处理数据的分类目标是未知的,而分类是按照预先设定的类别标准进行数据处理。
聚类算法作为一种重要的数据分析方法[1],基于层次、划分、密度、网格、模型等可分为不同的聚类算法,在实际使用中根据不同的数据量、数据类型、数据维度等应用于不同的领域。
K-Means 聚类算法由Steinhaus 于1955年首次提出,自它被提出后的60多年中,K-Means 算法一直是聚类算法中运用范围最广、使用频率最高的算法,这主要得益于其简易的算法、快速收敛的特性和处理大量数据的性能,但K-Means 聚类算法主要有两点局限性,一是只能适用于连续型数据,二是很难处理高纬度数据。
因此本文选择K-Means 聚类算法对包含背景干扰因素的图像进行细节分析,便于后期图像分割。
K-Means 聚类算法在n 个数据中随机选取k 个数据作为质心(k 为目标生成的族数,k ≤n),运用欧几里得距离、余弦相似度等比较剩余数据与质心之间的几何相似度,并划分到k 个族。
基于K—means颜色聚类分割与边缘检测的文字提取作者:吴春法潘亚文王敬来源:《电脑知识与技术》2017年第28期摘要:针对自然场景中文字提取受复杂环境因素的影响,如光照不均匀、自然场景背景颜色多样等因素影响,采用任何单一的图像分割技术都无法进行有效地进行文字区域分割和文字提取,提出一种两种方法相结合的自然环境场景中的文字提取方法。
首先,采用实现颜色聚类的K-means算法对文本区域与有颜色背景分割,然后在文本区域内对文字进行二值化处理后运用边缘检测的方法提取文字。
通过VC++编程环境及OpenCV技术作为该方法的验证平台,结果显示基于K-means算法实现颜色聚类与边缘检测方法相结合能有效进行自然环境中文字的提取。
关键词:自然场景文字;边缘检测; K-means;颜色聚类;连通分析; opencv中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2017)28-0206-02Abstract:According to the natural scene text extraction is influenced by complex environmental factors, such as uneven illumination, natural scene background colors and other factors,any single method is unable to effectively carry out the text segmentation and text extraction ,a method of combining two methods of regional segmentation and text extraction is proposed.Firstly, the K-means algorithm is used to segment the text area and the colored background, then the text is processed to white and black value in the text area, and then the edge detection method is used to extract the text. Through the VC++ programming environment and OpenCV technology as the verification platform of the method, the results show that the color clustering and edge detection Based on K-means algorithm can effectively extract the text in the natural environment.Key words:Natural scene text; edge detection; K-means; color clustering; connectivity analysis; opencv1 概述随着互联网技术及物联网技术的发展,自然场景中文字的提取显得尤为重要。
基于K—means的图像文字识别与提取研究作者:段银雷
来源:《电子技术与软件工程》2015年第09期
摘要 K-means聚类算法作为最常用的集合元素划分算法,在数字图像文字定位、提取与识别中有着广泛的应用。
文中针对当前图像文字识别与提取的最新发展状况,提出一种基于
K-means的图像文字识别与提取算法。
经过上机测试,该算法能够有效提高图像文字识别与提取的准确率与执行效率。
【关键词】K-means 图像文字提取文字识别 OCR
1 引言
K-means聚类算法是当前常用的基于划分的分类算法,能够按照既定标准与要求将集合进行划分。
在数字图像文字提取与识别中,可以通过对数字图像进行灰度处理,将文字背景与文字前景用不同的灰度像素来表示,并使用K-means聚类算法进行像素划分,从而将文字从数字图像中提取出来,作为OCR识别的图像输入。
2 K-means聚类算法基本原理
K-means聚类算法的基本思想是利用集合元素之间的距离为划分标准,在集合内部按照元素的分布密度的不同将元素划分为不同的子集合。
在划分过程中,通过定义元素之间的距离,按照元素到聚类中心之间的距离最小原则将元素进行聚合,从而得到最终的划分结果。
主要包括以下几个步骤:(1)根据元素划分的基本要求,从集合元素中随机选择k个元素作为划分结果的中心元素,并针对集合中的每个元素计算其到聚类中心元素的距离大小,并按照最小距离原则把各个元素划分到对应的聚类中心元素集合中;(2)按照划分结果对各个子集合中的元素计算特征均值,并根据计算结果对划分结果进行更新操作;(3)对更新后的子集合元素再次按照第一步中的方法进行聚类操作,从而得到更新后的元素划分结果;(4)按照上述步骤进行循环计算,当两次计算所得到的的聚类中心元素相同时,所得到的划分结果即为聚类结果。
K-means聚类算法的基本流程比较固定,其本质是在给定集合元素距离计算方法后,不断进行聚类迭代与循环运算对元素进行聚类划分,在应用过程中只需要定义合适的距离计算方法即可将K-means算法转化为软件程序进行上机运行。
采用K-means聚类算法的缺陷主要是在选择聚类中心元素时,算法受到样本元素的选择随机性和外部噪声的影响比较显著,如果不进行有效的算法优化则比较容易导致算法陷入局部最优,因此在采用K-means的图像文字提取与识别处理中需要根据图像特征对算法进行改进与优化。
3 算法流程设计
3.1 图像预处理
在本文提出的图像文字处理算法中,对数字图像进行的预处理包括图像灰度转换、二值化处理、文字块定位以及文字边缘检测等:
(1)图像灰度转换是将彩色图像转化为仅包含像素亮度信息的灰度图,并将数字图像中的背景冗余信息与其他噪声进行去除。
数字图像文字提取与识别中的噪声主要是由于外界光照、颜色等因素导致的图像有效信息受到干扰所产生的,因此噪声去除主要采用了滤波方式,包括领域平均滤波法及中位值滤波法等,将数字图像像素中的噪声去除。
(2)二值化处理是将黑白图像中的背景与前景进行,一般采用灰度像素阈值分离法来进行,包括全局域阈值分离法、局部阈值分离法及动态可变阈值分离法等。
由于动态阈值分离法的计算量大、处理效率低、分离效果较差,所以本算法采用局部最优阈值分离法,通过计算图像不同区块中像素的灰度梯度值变化对像素进行分离。
(3)边缘检测处理将经二值化后的图像进行特征区域划分,通过检测数字图像灰度变化、颜色变化及纹理特征的变化差异,实现文字块与背景的分离。
本算法的边缘检测算法中采用了一阶以及二阶微分算子来进行像素灰度导数值的计算,实现不同区域的边缘检测。
3.2 聚类处理
经过图像预处理之后即可采用K-means聚类算法进行文字提取。
通过对像素进行聚类处理,可从图像中提取到待识别文字目标区块,详细流程包括:
(1)对数字图像进行像素空间分类,将其划分为N个子簇,并在每个像素簇中随机选择一个像素作为中心点;
(2)采用欧氏距离作为像素距离的计算方式,计算N个像素簇中各像素点到中心点的距离,并按最小距离原则进行像素聚类,得到N个像素点子集合,记为Pi(n);
(3)随机选择像素子集合Pk和Pm,计算集合之间的最近距离,随后将Pk中距离Pm最近的像素点归入Pm集合,并从Pk中删除;
(4)重新计算经过上一步处理后得到的N个像素子集合的中心点,重复上述过程直到各个像素子集合不再发生变化;
(5)对N个像素子集合计算灰度均值,并以灰度值作为各个像素子集合的标记,采用局部聚类分类法得到最终的聚类结果。
3.3 图层选择与优化
由于图像文字的中心特性,可通过计算图层像素点距离中心区域的距离得到最终选择的图层。
在算法中为了提高图层选择的准确度,首先将图层集合按中心距离大小分为两个子集合。
并采用连通域分析、像素噪声去除等操作,选择距离最小的图像图层作为最终的选择结果,在此图层中包含了要提取与识别的文字块。
3.4 文字切分
在经过阈值分割后得到的图像区域中还包含了部分不属于文字区域的像素点,所以需要对噪音像素进行去除处理,经过切分处理后得到最终可被OCR识别的文字图像,主要步骤主要包括:
(1)将文字处理结果中明显不符合文字高宽比的像素进行去除;
(2)定义文字块的边缘密度,根据文字块边缘密度通常大于0.2的特征去除噪音;
(3)将处理结果中区域面积小于10个像素点的区域去除;
(4)对处理结果中的像素块进行融合,得到文字块。
通过算法上机仿真测试表明,本文提出的算法对数字图像中的文字区域定位比较准确,在文字排列比较复杂的情况下,算法的定位准确度保持在95%以上。
4 结语
通过对K-means算法进行分析,结合数字图像的灰度处理、二值化、边缘检测等技术,设计了基于聚类的图像文字处理算法,能够很好地对复杂数字图像背景中的文字进行定位与提取,得到可被OCR识别的图像,具有较高的执行效率与准确度。
参考文献
[1] 种耀华.基于NSCT图像文字信息提取新方法[J].计算机应用,2012(S2).
[2] 常莹.基于聚类与边缘检测的自然场景文本提取方法[J].计算机工程与设计,2010(18).
作者单位
四川大学计算机学院四川省成都市 610065。