当前位置:文档之家› 基于内容的图像检索系统报告

基于内容的图像检索系统报告

基于内容的图像检索系统报告
基于内容的图像检索系统报告

第六届浙江省大学生电子商务竞赛

作品名称:基于内容的网络商品图像检

索系统

作品类别:技术类

2011年3月13日

目录

第1章项目背景 (3)

第2章关键技术介绍 (6)

第3章系统分析与设计 (8)

3.1需求分析 (8)

3.1.1功能性需求分析 (8)

3.1.2非功能性需求分析 (8)

3.2系统设计 (10)

3.2.1 总体结构设计 (10)

3.2.2 功能模块设计 (11)

3.2.3 检索流程设计 (12)

3.2.4数据存储设计 (14)

3.2.5 算法设计 (17)

第4章系统实现 (25)

4.1 数据采集模块 (25)

4.2 数据检索模块 (28)

4.3 数据显示模块 (29)

4.4 数据推送模块 (34)

第5章盈利模式与市场营销推广策略 (36)

5.1目标市场 (36)

5.2盈利模式 (36)

5.3 系统推广策略 (37)

第6章财务分析 (41)

6.1搜索系统建设成本 (41)

6.2搜索引擎运行维护成本 (41)

6.3搜索系统宣传推广成本 (42)

第7章风险及对策 (43)

7.1市场风险及对策 (43)

7.2技术风险及对策 (43)

7.3项目风险及对策 (44)

7.4竞争风险及对策 (44)

第8章创新点 (45)

第9章总结 (46)

【参考文献】 (47)

第1章项目背景

随着计算机软硬件和互联网技术的飞速发展,多媒体数据的数量以惊人的速度增长。各行各业有越来越多的信息通过图像的形式进行表达,这些图像中包含了大量有用的信息。但是这些图像松散的分布在世界各地,缺少有效的组织,难以达到资源共享的目的。因此如何利用如此众多的图像信息并从中定位感兴趣的图像,是对图像信息的查询技术提出的重大挑战。

早在1951年,信息检索(Information Retrieval)这一术语就被Calvin M oores描述为使用户的信息需求能够变为最终的有用信息的过程。当然,他当时指的是文本格式的文件检索。但他的描述却揭示了信息检索系统的实质:帮助用户具体定位相关信息。

在1970年以后,随着数据库管理和计算机视觉两个领域的飞速发展,图像检索技术(Image Retrieval)的研究成为热点。由于图像检索在这两个领域的不同应用,所以它们采用的研究方法也各自有所侧重。数据库管理领域的研究采用基于文本的图像检索方法,而计算机视觉领域则偏重于基于视觉的图像检索。

基于文本的图像检索(text-based image retrieval),主要在数据库领域中进行研究,它的一个典型框架是,首先对图像用文本进行注解(关键字),然后用基于文本的数据库管理系统(DBMS)来进行图像关键字检索,诸如数据模型、多维度索引、查询评价等的研究进展均是沿着这一领域所作的。但是,基于文本的图像检索存在很大困难,尤其是图像的数据量非常大的时候,其一,手工对图像进行注释所需的工作量太大;其二,许多图像很难用文字的方式进行描述;其三,不同的人对同一幅图像的理解不一样,即使同一个人对同一幅图像在不同环境下理解也不完全相同,这样使得对图像的描述不唯一,造成检索结果的千差万别;其四,由于世界上存在许多语种,采用不同的语言文字对图像进行描述而建立的索引在应用中造成了一定的阻碍。因此基于文本方式的图像检索存在很大的局限性。

90年代初期,随着大规模数字图像库的出现,上述的问题变得越来越尖锐。为克服这些问题,基于内容的图像检索技术(content-based image retrieval)应运而生。区别于原有系统中对图像进行人工标注的做法,基于内容的检索技术

自动提取每幅图像的视觉内容特征作为其索引,如色彩、纹理、形状等。此后几年中,这个研究领域中的许多技术发展起来,一大批研究性的或商用的图像检索系统被建立起来。基于内容的图像检索系统具有与传统基于文本的检索系统完全不同的构架。首先,由于图像依赖其视觉特征而非文本描述进行索引,查询将根据图像视觉特征的相似度进行。用户通过选择具有代表性的一幅或多幅例子图像来构造查询,然后由系统查找与例子图像在视觉内容上比较相似的图像,按相似度大小排列返回给用户。这就是所请的通过例子图像的检索(query by image example)另外,基于内容的检索系统一般通过可视化界面和用户进行频繁的交EL,以便于用户能够方便地构造查询、评估检索结果和改进检索结果。基于内容的图像检索作为一种利用图像的颜色、纹理、形状等特征进行检索新的检索技术。它融合了传统的模式识别技术与多媒体良好的人机交互技术,有着广泛的发展应用前景,特别是在电子商务领域。

近年来,随着Imemet技术和电子商务技术的不断发展与成熟,以此为技术基础的网络购物平台层出不穷。网络购物平台中的商品货源广泛、品种齐全且价格合理,有着巨大的消费需求,因此得到了迅速的发展。目前,随着物流服务的完善,网络购物作为一种新型的购物方式已经渐渐取代了传统的购物方式,成为一种时尚。纵观国内外的知名购物网站,它们无一例外的都为用户提供了商品检索功能。然而,很多购物网站只为用户提供了基于关键字的检索功能。网络购物平台中的一些商品难于用文字来表达其自身的属性,这给用户挑选中意的商品带来的很大的不便。例如,服装的款式花色很难用文字表达,这使得用户难以用关键字检索到具有欣宜花色和款式的服装。然而,利用商品图像作为查询信息,这个问题就会迎刃而解。CBIR就像是一种为其量身定做的技术,可以很好的解决对某些不便于用文字描述其特征的商品图像的检索问题,极大地方便用户利用网络购物平台选购商品。

我国个人消费网购规模正在以每年超过100%的增速快速发展。根据艾瑞、易观等机构的统计数据,2009年中国个人消费网络购物的金额已经达到2500亿,预计到2012年将达到7130亿。尽管如此,网购交易额仍然只占个人消费总体消费额不到2%,发展空间巨大。

随着网购规模的发展,越来越多的商家和商品出现在互联网,这就给消费者挑选商品带来了越来越大的困难。根据统计,目前淘宝已经有超过300万家商户,在线超过3亿件商品。这就给购物搜索带来了巨大的市场机遇。根据艾瑞的统计,2009年购物搜索市场规模已经超过11亿,而且随着网购交易规模的发展,增速也越来越快。而图像购物搜索是购物搜索的重要组成部分,是近几年国内外研究的重点。

同时,近年来随着智能手机和3G通信网络的发展,人们又多了一种购物选择:利用手机实现移动购物。这种方式与传统网购相比更加快捷、灵活、方便,可以充分利用手机的照相功能,结合图像搜索,随时随地实现购物。由于移动商务需要基于手机平台进行操作,考虑到手机平台的特殊性,如何让商品更条理、更清晰的展示在用户面前是提升用户体验的核心因素。

在分析商品购物特点的基础上,设计与开发了基于内容的网络商品图像检索系统,通过对商品图像的自动识别,在海量商品数据中准确、快速的寻找消费者感兴趣的满意商品。开发的系统同时支持网络环境和移动环境。

第2章关键技术介绍

本系统采用Jsp+Servlet+Javabean三层结构,将用户界面、数据内容清晰地分离开来,明确了各个角色的定义。

Servlet程序在服务器端运行,动态地生成Web页面。与传统的CGI和许多其他类似CGI的技术相比,Java Servlet具有更高的效率,更容易使用,功能更强大,具有更好的可移植性,更节省投资。

下面就jsp,servlet,javabean三方面进行介绍。

1. servlet

servlet是在服务器端执行的,具有良好的移植性,不论操作系统是Windows、Linux、Unix等等,都能将写好的Servlet程序放在这些操作系统上执行,是真正的写一次,到处执行。另外Servlet功能强大,Servlet能完全发挥Java API的威力,想写网络目录查询程序,则可利用JNDI API,想连接数据库,则可利用JDBC等等。其次是性能,执行一次以后,会停留在内存中一段时间,当有相同的请求发生时,Servlet会利用不同的线程来处理,在性能上会有大幅的提升,而服务器会自动清除停留时间过长而且没有执行的Servlet,最后Servlet也有类型检查的特性,并且利用Java的垃圾收集与没有指针的设计,使得Servlet避免内存管理的问题。

2. jsp

为了弥补Servlet在开发Web-based系统不足的地方,JSP出现了。JSP 的出现大大简化了Servlet处理Web系统的工作量。

JSP是一种动态网页技术,即在传统的HTML里嵌入Java程序,客户端发出请求,服务器端执行,仅此而已。

3. JavaBean

JavaBean是一个可重复使用,且跨平台的软件组件,可以在JBuilder、eclipse等软件以可视化的方式来开发,它是一个类,并封装若干方法,当我们需要时,直接可以拿来用。

本系统中将jsp作为视图层,servlet作为控制层,javabean作为模型层,三者结合使用,取长补短,总的优点有如下几点:

1. 低耦合性

视图层和业务层分离,这样就允许更改视图层代码而不用重新编译模型和控制器代码,同样,一个应用的业务流程或者业务规则的改变只需要改动模型层即可。因为模型与控制器和视图相分离,所以很容易改变应用程序的数据层和业务规则。

2. 高重用性和可适用性

随着技术的不断进步,现在需要用越来越多的方式来访问应用程序。该架构允许使用各种不同样式的视图来访问同一个服务器端的代码。它包括任何WEB (HTTP)浏览器或者无线浏览器(wap),比如,用户可以通过电脑也可通过手机来订购某样产品,虽然订购的方式不一样,但处理订购产品的方式是一样的。由于模型返回的数据没有进行格式化,所以同样的构件能被不同的界面使用。例如,很多数据可能用HTML来表示,但是也有可能用WAP来表示,而这些表示所需要的命令是改变视图层的实现方式,而控制层和模型层无需做任何改变。

3. 较低的生命周期成本

使降低开发和维护用户接口的技术含量成为可能。

4. 快速的部署

使开发时间得到相当大的缩减,它使程序员(Java开发人员)集中精力于业务逻辑,界面程序员(HTML和JSP开发人员)集中精力于表现形式上。

5. 可维护性

分离视图层和业务逻辑层也使得WEB应用更易于维护和修改。

6. 有利于软件工程化管理

由于不同的层各司其职,每一层不同的应用具有某些相同的特征,有利于通过工程化、工具化管理程序代码

第3章系统分析与设计

3.1需求分析

3.1.1功能性需求分析

在一个基于内容检索的图像数据库中,用户可以根据自己定义的图像特征,查找类似或相关的图像。例如:服装设计师需要查找一些自己需要的服装样本:医学工作者需要从医学影像数据库中查找一些相关的病例资料;互联网爱好者可能需要在互联网上下载一些图像资料;文物工作者需要查找相关的文物图像资料;公安部门需要根据指纹、脚印等进行罪犯资料的查询;以及一些特殊环境里的电子锁装置(指纹识别、面容识别、掌纹等识别)等。

基于内容的网络商品图像检索系统是指用户提交一张商品图像,系统对该商品图像进行特征提取,用于检索的特征主要有颜色、纹理、形状、空间关系等,其中颜色、形状、纹理应用较为普遍,然后用提取出来的商品图像特征和商品图像库中商品图像的特征进行匹配,获得特征相符的图像集结果。

在进行图像查询时,图像的相似度是一个比较抽象的概念。它不像文字那样比较直观。在进行图像查询时,检索的结果在原则上应该达到人眼所能识别的程度。为了高效的进行图像查询,首先根据图像的自身信息,利用一些分析方法进行图像特征的提取,并将图像的特征信息存入图像数据库中。当这些图像由于需要被处理后,应该重新进行特征信息的抽取,并更新图像数据库中该图像对应的特征信息。在进行图像检索时,首先抽取被检索图像的特征信息,然后和图像数据库中图像的特征信息进行相似性比较。最后依据相似度的大小输出查询结果。这一查询技术是多学科结合的结果。具有较好的查询结果。

3.1.2非功能性需求分析

1.用户界面需求

用户界面需求如表3.1所示。

表3.1 用户界面需求

需求名称详细要求

合适性界面风格应合乎形象以及系统本身的用途

简洁易用界面应该简洁,不应花哨,使用户能够很快上手,各个操作均提供帮助

一致性保证系统各个窗体界面风格的一致

国际化设计应考虑国内和国际语言和文化的差异

美观界面应该专业美观

及时反馈信息对于处理时间较长的操作,应有进度提示

功能屏蔽对于不具备使用某功能权限的用户,系统对该功能进行屏蔽

2.系统质量需求

系统质量需求如表3.2 所示。

表3.2系统质量需求

主要质量属性详细要求

正确性系统的各项功能必须能够正确地运行

健壮性具有一定容错功能,在出现系统死机或网络出现故障及其其他

问题时候,应能通过重新运行程序或者重启系统恢复到上次正

常运行时候的状态

可靠性系统应能在相当长的时间内7*24小时运转

性能,效率响应用户请求不应该超过10秒,超过的必须提供进度提示

易用性操作应该简单方便

清晰性各个模块之间的关系应该清晰,做到强内聚、低耦合

安全性防止非法用户使用,对各级用户提供不同权限

可扩展性系统必须易于扩展功能,便于以后升级

兼容性兼容多种数据库

可移植性可以移植到Linux或Unix系统之上

3.2系统设计

3.2.1总体结构设计

本系统主要实现以下功能:用户上传一张商品图像,然后系统对上传的商品图像进行特征提取,并与服务器中的已提取特征的商品图像集进行匹配,由系统查找与用户上传商品图像特征相似的商品图像,并返回给用户的系统。本系统总体框架结构如图3.1所示。

图3.1 系统总体框架结构图 (1)查询接口

接收用户提交的查询商品图像,将查询请求传给检索模块进行操作。

(2)描述模块

将用户的查询要求转化为对图像内容的比较抽象的内容表达和描述,即通过图像的分析,从而以一定的、计算机可以方便表达的数据结构建立对图像内容的描述。这个模块在图像数据库建库时也需对每幅图像进行。

(3)检索匹配模块

数据源 用户

预处理 特征提取

目标库 网络爬虫、蜘蛛程序

特征提取子系统 查询子系统

查询接口

检索

索引/过滤

特征库

检索是指利用特征之间的距离函数来进行相似性匹配,模仿人类的认知过程,可以从特征库中寻找匹配的特征,也可以临时计算对象的特征。该模块接收用户查询请求,对于文本的查询直接搜索关键字与图像描述,对于提交的图像通过提取其的特征和特征库中的图像进行匹配,查找出符合条件的图像集。向用户返回匹配的结果并显示。在图像库中搜索所需的图像内容。因为对被查询图像建立的表达描述也以对图像数据库中的图像建立了,所以将对查询图的描述与图像数据库中被查询的描述进行内容匹配和比较就可以确定它们在内容上的一致性和相似性。这个匹配的结果将传给提取模块。

(4)提取模块

根据匹配的结果在图像数据库中对感兴趣的图像定位,并在内容匹配的基础上将图像数据库中所有满足给定要求的图像自动地提取出来以让用户使用。如果事先对图像数据库建立了索引,这样在提取时就可提高效率。

3.2.2功能模块设计

本系统主要包括数据采集、数据检索、数据显示和推送服务等功能,具体功能模块结构如图3.2所示。

基于内容的网络商品图像检索系统

数据采集数据检索数据显示推送服务

图3.2 系统功能模块结构图

(1)数据采集

从网上采集相关商品图像以及商品信息。通过对采集的网页分析,进行正则表达式匹配,解析出Deep Web中网页中商品图像的实际URL,有效地实现视商品图像的自动批量下载。

(2)数据检索

用户向系统提交一幅待查询的示例图像(又称关键图像),然后系统将用户提交的商品图像与本地商品图像库进行相似比较,检索出符合用户要求的商品图像及其信息。

(3)数据显示

检索后系统将满足一定相似要求的图像集结果反馈给用户。搜索结果可以采用缩略图和列表两种显示方式,并可以按照相似度进行排序。

(4)推送服务

通过分析用户历史操作记录,然后将其推送给系统服务器,服务器根据用户喜好对采集到的商品图像信息进行分析判断,并将符合条件的信息条目推送回客户。

3.2.3检索流程设计

图像检索子系统是整个系统的核心,系统根据用户提出具体的查询需求在图像数据库中进行检索,并将结果集返回给用户。这一阶段主要需要考虑的问题包括:用户需要的输入形式、特征向量的相似性匹配、检索结果的展示浏览、以及相关反馈的方式。因此图像检索子系统可以由查询接口,相似性匹配,结果浏览及相关反馈四个模块组成。图像检索的流程如图3.3所示。

开始

用户选择要匹配的图片

用户选择要查询的图片类型

提取用户图片特征向量

获取特征库中一幅图片的特征向量

相似性计算

数据库中还有

未搜索过的图

像?

返回相似度较高的图像

用户是否满

意?

结束

图3.3 图像检索流程

3.2.4数据存储设计

本系统数据库语言采用Microsoft SQL Server 2005 ,数据库名为ImageSerch,共有ImageInfo数据表、Admin数据表、User数据表、ImageFeature 数据表以及Matching数据表五张表。它们的关系如图3.4所示。

图3.4 数据表关系

ImageInfo数据表用来记录商品图像的各种信息,信息包括商品图像网站介绍,商品图像出处url,价格,产地,商家信息等。具体信息结构如表3.3所示。

表3.3 ImageInfo表

列名数据类型是否允许空是否主键备注id int 否是表id

imageId int 否否图像编号,对应存储的图像

名称

name nvarchar(80) 是否图像网站介绍url nvarchar(100) 是否图像出处url kind nvarchar(10) 是否类别price nvarchar(20) 是否价格production nvarchar(20) 是否货物产地sex char(2) 是否物品男/女用grade nvarchar(8) 是否商家等级

fullUrl nvarchar(210) 是否点击图像放大时显示图像的

url

describe char(1) 是否该商品是否是如实描述,0为不是,1为是

retire char(1) 是否该商品是否是7天退换,0为不是,1为是

Admin数据表用来记录管理员信息。具体信息如表3.4所示。

表3.4 Admin表

列名数据类型是否允许空是否主键备注

id int 否是表id adminName nvarchar(20) 是否管理员名passWd nvarchar(20) 是否登录密码regTime nvarchar(20) 是否注册时间

User数据表用来记录注册用户信息。具体信息如表3.5所示。

表3.5 User表

列名数据类型是否允许空是否主键备注

id int 否是表id userName nvarchar(20) 是否用户名

passWd nvarchar(20) 是否登录密码

regTime nvarchar(20) 是否注册时间

ImageFeature数据表用来记录各张商品图像的特征的信息,包括商品图像特征对应的商品图像信息表中的id,特征内容,商品图像类别等。具体信息如表3.6所示。

表3.6 ImageFeature表

列名数据类型是否允许空是否主键备注

id int 否是表id

imageInfoid nvarchar(40) 是否图像特征对应的图像信息表中的id

featureContent nvarchar(1000) 是否特征内容kind nvarchar(20) 是否图像类别

time nvarchar(20) 是否提取特征时

Matching数据表用来记录注册用户的历史搜索记录,为系统对用户个性化设置提供数据基础。具体信息如表3.7所示。

表3.7 Matching表

列名数据类型是否允许空是否主键备注

id int 否是表id userid nvarchar(40) 是否用户id

imageFeatureid nvarchar(1000) 是否图像特征表中的id

time nvarchar(20) 是否搜索时间

3.2.5算法设计

图像特征包括视觉特征和语义特征,如何实现这些特征的提取和表达是CBlR的基础和核心技术,特征选取的好坏对整个CBlR系统有着重要的影响。图像视觉特征包括颜色、纹理、形状、外观等。视觉特征又可分为一般特征和领域特征,前者包括颜色、纹理、形状和物体间方位关系等,而后者根据不同的应用有所不同,如人脸识别、指纹识别的专有特征等。本文中提到的特征都是视觉特征范畴中的一般特征。

对特征提取技术的基本要求是准确和快速,特征选取时要考虑下列四个原则:

(1)图像的区分能力:应能很好的区分视觉上差异较大的图像

(2)图像的描述能力:一次查询中能检索到的最大图像数(无关图像排除能力

(3)特征计算复杂度

(4)特征的存储空间需求

图像内容可以理解为一个简化了的层次模型,第一层为原始数据层,即图像的原始像素点;第二层为物理特征层,反映了图像内容的低层物理特征,如颜色、纹理、形状、轮廓、图像内容的空间关系和时间关系(对视频来说)等;第三层为语义特征层,是人们对图像内容概念性的反映,一般是对图像内容的文字性描述。图像特征的表示方法有三种:数值表示、关系表示和语义表示。譬如,图像的颜色可用R、G、B三种数值表示,图像中对象之间的位置关系就要用到关系表示,而语义表示方法需要对物体进行识别和解释,往往要借助人类的知识推理。采用的表示方式不同,查询时进行相似性比较的算法也不一样,如数值式的特征比较可采用多维空间中点的距离来计算。图像检索所用到的基本特征大多属于第二层特征,即颜色、纹理、形状、轮廓空间关系等等。

本系统涉及到的算法主要包括图像特征提取和相似度量两大部分。

1、图像特征提取

图像特征的提取是基于内容的图像检索技术的基础。从广义上讲,图像的特征包括基于文本(语义)特征(如关键字、注释等)和视觉特征(如色彩、纹理、形状、对象表面等)两类。在本项目中,主要针对图像视觉特征进行提取和表达。视觉特征又可分为通用的视觉特征和领域相关的视觉特征。前者用于描述所有图像共有的特征,与图像的具体内容无关,主要包括色彩、纹理和形状;后

者则建立在对所描述图像内容的某些先验知识(或假设)的基础上,与具体的应用紧密有关,例如人的面部特征或指纹特征等。由于领域相关的图像特征主要属于模式识别的研究范围,在此我们就不再详述,而只考虑通用的视觉特征。

对于某个特定的图像特征,通常又有多种不同的表达方法。由于人们主观认识上的千差万别,对于某个特征并不存在一个所谓的最佳的表达方式。事实上,图像特征的不同表达方式从各个不同的角度刻画了此特征的某些性质。下面分为颜色、纹理和形状特征三部分介绍。

(1)颜色特征

颜色特征是在图像检索中应用最为广泛的视觉特征,主要原因在于颜色与图像中所包含的物体或场景紧密相关。此外,与其他的视觉特征相比,颜色特征对图像本身的尺寸、方向、视角的依赖性较小,从而具有较高的鲁棒性。在提取颜色特征时,我们首先需要选择合适的颜色空间来描述颜色特征,然后采用一定的量化方法将颜色特征表达为向量的形式,最后定义一种相似度(距离)标准用来衡量图像之间在颜色上的相似性。在本节中,我们将主要采用颜色直方图作为颜色特征的表示方法。

颜色直方图是在许多图像检索系统中被广泛采用的颜色特征。它所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。

颜色直方图可以是基于不同的颜色空间和坐标系。最常用的颜色空间是RGB 颜色空间,原因在于大部分的数字图像都是用这种颜色空间表达的。然而,RGB 空间结构并不符合人们对颜色相似性的主观判断。因此,我们采用基于HSV空间、Luv空间和Lab空间的颜色直方图,因为它们更接近于人们对颜色的主观认识。其中HSV空间是直方图最常用的颜色空间。它的三个分量分别代表色彩(Hue)、饱和度(Saturation)和值(Value)。从RGB空间到HSV空间的转化公式如下所示:

[][]

[][]

[][]?????????????????--='--='--='???????????'-=='+≠='-=='+≠='-=='+=-==),,min( ),,min( ),,min( otherwise

5),,min( and ),,max( if 3)

,,min( and ),,max( if 3),,min( and ),,max( if 1),,min( and ),,max( if 1),,min( and ),,max( if 5)],,min([)

,,max(b g r v b v b b g r v g v g b g r v r v r r b g r r b g r b g b g r b b g r g b b g r b b g r g r b g r g b g r r g b g r g b g r r b h v

b g r v s b g r v (1)

其中r, g, b ∈ [0 … 1], h ∈ [0 … 6],且 s, v ∈ [0 … 1]。

计算颜色直方图需要将颜色空间划分成若干个小的颜色区间,每个小区间成为直方图的一个bin 。这个过程称为颜色量化(color quantization )。然后,通过计算颜色落在每个小区间内的像素数量可以得到颜色直方图。颜色量化有许多方法,例如向量量化、聚类方法或者神经网络方法。最为常用的做法是将颜色空间的各个分量(维度)均匀地进行划分。相比之下,聚类算法则会考虑到图像颜色特征在整个空间中的分布情况,从而避免出现某些bin 中的像素数量非常稀疏的情况,使量化更为有效。另外,如果图像是RGB 格式而直方图是HSV 空间中的,我们可以预先建立从量化的RGB 空间到量化的HSV 空间的查找表,从而加快直方图的计算过程。

(2)纹理特征

纹理特征是一种不依赖于颜色或亮度的反映图像中同质现象的视觉特征。它是所有物体表面共有的内在特性,例如云彩、树木、砖、织物等都有各自的纹理特征。纹理特征包含了物体表面结构组织排列的重要信息以及它们与周围环境的联系,在基于内容的图像检索中得到了广泛的应用。用户可以通过提交包含有某种纹理的图像来查找含有相似纹理的其他图像。在本节中,我们将着重介绍在基于内容的图像检索中采用的Tamura 纹理特征。

1)Tamura 纹理特征

基于人类对纹理的视觉感知的心理学的研究,Tamura 等人提出了纹理特征的表达。Tamura 纹理特征的六个分量对应于心理学角度上纹理特征的六种属性,分别是粗糙度(coarseness )、对比度(contrast )、方向度(directionality )、 线

数字图像处理实验报告完整版

数字图像处理 实验一 MATLAB数字图像处理初步 一、显示图像 1.利用imread( )函数读取一幅图像,假设其名为lily.tif,存入一个数组中; 2.利用whos 命令提取该读入图像flower.tif的基本信息; 3.利用imshow()函数来显示这幅图像; 实验结果如下图: 源代码: >>I=imread('lily.tif') >> whos I >> imshow(I) 二、压缩图像 4.利用imfinfo函数来获取图像文件的压缩,颜色等等其他的详细信息; 5.利用imwrite()函数来压缩这幅图象,将其保存为一幅压缩了像素的jpg文件,设为lily.jpg;语法:imwrite(原图像,新图像,‘quality’,q), q取0-100。 6.同样利用imwrite()函数将最初读入的tif图象另存为一幅bmp图像,设为flily.bmp。7.用imread()读入图像Sunset.jpg和Winter.jpg; 8.用imfinfo()获取图像Sunset.jpg和Winter.jpg的大小; 9.用figure,imshow()分别将Sunset.jpg和Winter.jpg显示出来,观察两幅图像的质量。 其中9的实验结果如下图:

源代码: 4~6(接上面两个) >>I=imread('lily.tif') >> imfinfo 'lily.tif'; >> imwrite(I,'lily.jpg','quality',20); >> imwrite(I,'lily.bmp'); 7~9 >>I=imread('Sunset.jpg'); >>J=imread('Winter.jpg') >>imfinfo 'Sunset.jpg' >> imfinfo 'Winter.jpg' >>figure(1),imshow('Sunset.jpg') >>figure(2),imshow('Winter.jpg') 三、二值化图像 10.用im2bw将一幅灰度图像转化为二值图像,并且用imshow显示出来观察图像的特征。实验结果如下图: 源代码: >> I=imread('lily.tif') >>gg=im2bw(I,0.4); F>>igure, imshow(gg)

数据挖掘聚类算法课程设计报告

数据挖掘聚类问题(Plants Data Set)实验报告 1.数据源描述 1.1数据特征 本实验用到的是关于植物信息的数据集,其中包含了每一种植物(种类和科属)以及它们生长的地区。数据集中总共有68个地区,主要分布在美国和加拿大。一条数据(对应于文件中的一行)包含一种植物(或者某一科属)及其在上述68个地区中的分布情况。可以这样理解,该数据集中每一条数据包含两部分内容,如下图所示。 图1 数据格式 例如一条数据:abronia fragrans,az,co,ks,mt,ne,nm,nd,ok,sd,tx,ut,wa,wy。其中abronia fragrans是植物名称(abronia是科属,fragrans是名称),从az一直到wy 是该植物的分布区域,采用缩写形式表示,如az代表的是美国Arizona州。植物名称和分布地区用逗号隔开,各地区之间也用逗号隔开。 1.2任务要求 聚类。采用聚类算法根据某种特征对所给数据集进行聚类分析,对于聚类形成的簇要使得簇内数据对象之间的差异尽可能小,簇之间的差距尽可能大。 2.数据预处理 2.1数据清理 所给数据集中包含一些对聚类过程无用的冗余数据。数据集中全部数据的组织结构是:先给出某一科属的植物及其所有分布地区,然后给出该科属下的具体植物及其分布地区。例如: ①abelmoschus,ct,dc,fl,hi,il,ky,la,md,mi,ms,nc,sc,va,pr,vi ②abelmoschus esculentus,ct,dc,fl,il,ky,la,md,mi,ms,nc,sc,va,pr,vi ③abelmoschus moschatus,hi,pr 上述数据中第①行给出了所有属于abelmoschus这一科属的植物的分布地区,接下来的②③两行分别列出了属于abelmoschus科属的两种具体植物及其分布地区。从中可以看出后两行给出的所有地区的并集正是第一行给出的地区集

数字图像处理实验报告

数字图像处理实验报告 实验一数字图像基本操作及灰度调整 一、实验目的 1)掌握读、写图像的基本方法。 2)掌握MATLAB语言中图像数据与信息的读取方法。 3)理解图像灰度变换处理在图像增强的作用。 4)掌握绘制灰度直方图的方法,理解灰度直方图的灰度变换及均衡化的方 法。 二、实验内容与要求 1.熟悉MATLAB语言中对图像数据读取,显示等基本函数 特别需要熟悉下列命令:熟悉imread()函数、imwrite()函数、size()函数、Subplot()函数、Figure()函数。 1)将MATLAB目录下work文件夹中的forest.tif图像文件读出.用到imread, imfinfo 等文件,观察一下图像数据,了解一下数字图像在MATLAB中的处理就是处理一个矩阵。将这个图像显示出来(用imshow)。尝试修改map颜色矩阵的值,再将图像显示出来,观察图像颜色的变化。 2)将MATLAB目录下work文件夹中的b747.jpg图像文件读出,用rgb2gray() 将其 转化为灰度图像,记为变量B。 2.图像灰度变换处理在图像增强的作用 读入不同情况的图像,请自己编程和调用Matlab函数用常用灰度变换函数对输入图像进行灰度变换,比较相应的处理效果。 3.绘制图像灰度直方图的方法,对图像进行均衡化处理 请自己编程和调用Matlab函数完成如下实验。 1)显示B的图像及灰度直方图,可以发现其灰度值集中在一段区域,用 imadjust函 数将它的灰度值调整到[0,1]之间,并观察调整后的图像与原图像的差别,调整后的灰

度直方图与原灰度直方图的区别。 2) 对B 进行直方图均衡化处理,试比较与源图的异同。 3) 对B 进行如图所示的分段线形变换处理,试比较与直方图均衡化处理的异同。 图1.1 分段线性变换函数 三、实验原理与算法分析 1. 灰度变换 灰度变换是图像增强的一种重要手段,它常用于改变图象的灰度范围及分布,是图象数字化及图象显示的重要工具。 1) 图像反转 灰度级范围为[0, L-1]的图像反转可由下式获得 r L s --=1 2) 对数运算:有时原图的动态范围太大,超出某些显示设备的允许动态范围, 如直接使用原图,则一部分细节可能丢失。解决的方法是对原图进行灰度压缩,如对数变换: s = c log(1 + r ),c 为常数,r ≥ 0 3) 幂次变换: 0,0,≥≥=γγc cr s 4) 对比拉伸:在实际应用中,为了突出图像中感兴趣的研究对象,常常要求 局部扩展拉伸某一范围的灰度值,或对不同范围的灰度值进行不同的拉伸处理,即分段线性拉伸: 其对应的数学表达式为:

数字图像处理实验报告

实验一灰度图像直方图统计 一、实验目的 掌握灰度图像直方图的概念和计算方法,了解直方图的作用和用途。提高学生编程能力,巩固所学知识。 二、实验内容和要求 (1)用Photoshop显示、了解图像平均明暗度和对比度等信息; (2)用MatLab读取和显示一幅灰度图像; (3)用MatLab编写直方图统计的程序。 三、实验步骤 1. 使用Photoshop显示直方图: 1)点击文件→打开,打开一幅图像; 2)对图像做增强处理,例如选择图像→调整→自动对比度对图像进行灰度拉伸,观察图像进行对比度增强前后的视觉变化。 3)利用统计灰度图像直方图的程序分别针对灰度拉伸前后的灰度图像绘制其灰度直方图,观察其前后的直方图变化。 2.用MatLab读取和显示一幅灰度图像; 3. 绘制图像的灰度直方图; function Display_Histogram()

Input=imread('timg.jpg'); figure(100); imshow(uint8(Input)); title('原始图像'); Input_Image=rgb2gray(Input); figure(200); imshow(uint8(Input_Image)); title('灰度图像'); sum=0; His_Image=zeros(1,256); [m,n]=size(Input_Image); for k=0:255 for I=1:m for j=1:n if Input_Image(I,j)==k His_Image(k+1)=His_Image(k+1)+1; end end end end figure(300); plot(His_Image); title('图像的灰度直方图'); 4.显示图像的灰度直方图。

数字图像处理教学大纲(2014新版)

数字图像处理 课程编码:3073009223 课程名称:数字图像处理 总学分: 2 总学时:32 (讲课28,实验4) 课程英文名称:Digital Image Processing 先修课程:概率论与数理统计、线性代数、C++程序设计 适用专业:自动化专业等 一、课程性质、地位和任务 数字图像处理课程是自动化专业的专业选修课。本课程着重于培养学生解决智能化检测与控制中应用问题的初步能力,为在计算机视觉、模式识别等领域从事研究与开发打下坚实的理论基础。主要任务是学习数字图像处理的基本概念、基本原理、实现方法和实用技术,并能应用这些基本方法开发数字图像处理系统,为学习图像处理新方法奠定理论基础。 二、教学目标及要求 1.了解图像处理的概念及图像处理系统组成。 2.掌握数字图像处理中的灰度变换和空间滤波的各种方法。 3.了解图像变换,主要是离散和快速傅里叶变换等的原理及性质。 4.理解图像复原与重建技术中空间域和频域滤波的各种方法。 5. 理解解彩色图像的基础概念、模型和处理方法。 6. 了解形态学图像处理技术。 7. 了解图像分割的基本概念和方法。 三、教学内容及安排 第一章:绪论(2学时) 教学目标:了解数字图像处理的基本概念,发展历史,应用领域和研究内容。通过大量的实例讲解数字图像处理的应用领域;了解数字图像处理的基本步骤;了解图像处理系统的组成。 重点难点:数字图像处理基本步骤和图像处理系统的各组成部分构成。 1.1 什么是数字图像处理 1.2 数字图像处理的起源

1.3.1 伽马射线成像 1.3.2 X射线成像 1.3.3 紫外波段成像 1.3.4 可见光及红外波段成像 1.3.5 微波波段成像 1.3.6 无线电波成像 1.3.7 使用其他成像方式的例子 1.4 数字图像处理的基本步骤 1.5 图像处理系统的组成 第二章:数字图像基础(4学时) 教学目标:了解视觉感知要素;了解几种常用的图像获取方法;掌握图像的数字化过程及其图像分辨率之间的关系;掌握像素间的联系的概念;了解数字图像处理中的常用数学工具。 重点难点:要求重点掌握图像数字化过程及图像中像素的联系。 2.1 视觉感知要素(1学时) 2.1.1 人眼的构造 2.1.2 眼镜中图像的形成 2.1.3 亮度适应和辨别 2.2 光和电磁波谱 2.3 图像感知和获取(1学时) 2.3.1 用单个传感器获取图像 2.3.2 用条带传感器获取图像 2.3.3 用传感器阵列获取图像 2.3.4 简单的图像形成模型 2.4 图像取样和量化(1学时) 2.4.1 取样和量化的基本概念 2.4.2 数字图像表示 2.4.3 空间和灰度级分辨率 2.4.4 图像内插 2.5 像素间的一些基本关系(1学时) 2.5.1 相邻像素 2.5.2 临接性、连通性、区域和边界 2.5.3 距离度量 2.6 数字图像处理中所用数学工具的介绍 2.6.1 阵列与矩阵操作

实验三 K-均值聚类算法实验报告

实验三 K-Means聚类算法 一、实验目的 1) 加深对非监督学习的理解和认识 2) 掌握动态聚类方法K-Means 算法的设计方法 二、实验环境 1) 具有相关编程软件的PC机 三、实验原理 1) 非监督学习的理论基础 2) 动态聚类分析的思想和理论依据 3) 聚类算法的评价指标 四、算法思想 K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类中心,然后计算其他数据距离这三个聚类中心的距离,将数据归入与其距离最近的聚类中心,之后再对这K个聚类的数据计算均值,作为新的聚类中心,继续以上步骤,直到新的聚类中心与上一次的聚类中心值相等时结束算法。 实验代码 function km(k,A)%函数名里不要出现“-” warning off [n,p]=size(A);%输入数据有n个样本,p个属性 cid=ones(k,p+1);%聚类中心组成k行p列的矩阵,k表示第几类,p是属性 %A(:,p+1)=100; A(:,p+1)=0; for i=1:k %cid(i,:)=A(i,:); %直接取前三个元祖作为聚类中心 m=i*floor(n/k)-floor(rand(1,1)*(n/k)) cid(i,:)=A(m,:); cid; end Asum=0; Csum2=NaN; flags=1; times=1; while flags flags=0; times=times+1; %计算每个向量到聚类中心的欧氏距离 for i=1:n

for j=1:k dist(i,j)=sqrt(sum((A(i,:)-cid(j,:)).^2));%欧氏距离 end %A(i,p+1)=min(dist(i,:));%与中心的最小距离 [x,y]=find(dist(i,:)==min(dist(i,:))); [c,d]=size(find(y==A(i,p+1))); if c==0 %说明聚类中心变了 flags=flags+1; A(i,p+1)=y(1,1); else continue; end end i flags for j=1:k Asum=0; [r,c]=find(A(:,p+1)==j); cid(j,:)=mean(A(r,:),1); for m=1:length(r) Asum=Asum+sqrt(sum((A(r(m),:)-cid(j,:)).^2)); end Csum(1,j)=Asum; end sum(Csum(1,:)) %if sum(Csum(1,:))>Csum2 % break; %end Csum2=sum(Csum(1,:)); Csum; cid; %得到新的聚类中心 end times display('A矩阵,最后一列是所属类别'); A for j=1:k [a,b]=size(find(A(:,p+1)==j)); numK(j)=a; end numK times xlswrite('data.xls',A);

东南大学数字图像处理实验报告

数字图像处理 实验报告 学号:04211734 姓名:付永钦 日期:2014/6/7 1.图像直方图统计 ①原理:灰度直方图是将数字图像的所有像素,按照灰度值的大小,统计其所出现的频度。 通常,灰度直方图的横坐标表示灰度值,纵坐标为半个像素个数,也可以采用某一灰度值的像素数占全图像素数的百分比作为纵坐标。 ②算法: clear all PS=imread('girl-grey1.jpg'); %读入JPG彩色图像文件figure(1);subplot(1,2,1);imshow(PS);title('原图像灰度图'); [m,n]=size(PS); %测量图像尺寸参数 GP=zeros(1,256); %预创建存放灰度出现概率的向量 for k=0:255 GP(k+1)=length(find(PS==k))/(m*n); %计算每级灰度出现的概率end figure(1);subplot(1,2,2);bar(0:255,GP,'g') %绘制直方图 axis([0 255 min(GP) max(GP)]); title('原图像直方图') xlabel('灰度值') ylabel('出现概率') ③处理结果:

原图像灰度图 100 200 0.005 0.010.0150.020.025 0.030.035 0.04原图像直方图 灰度值 出现概率 ④结果分析:由图可以看出,原图像的灰度直方图比较集中。 2. 图像的线性变换 ①原理:直方图均衡方法的基本原理是:对在图像中像素个数多的灰度值(即对画面起主 要作用的灰度值)进行展宽,而对像素个数少的灰度值(即对画面不起主要作用的灰度值)进行归并。从而达到清晰图像的目的。 ②算法: clear all %一,图像的预处理,读入彩色图像将其灰度化 PS=imread('girl-grey1.jpg'); figure(1);subplot(2,2,1);imshow(PS);title('原图像灰度图'); %二,绘制直方图 [m,n]=size(PS); %测量图像尺寸参数 GP=zeros(1,256); %预创建存放灰度出现概率的向量 for k=0:255

数字图像处理四个实验报告,带有源程序

数字图像处理 实验指导书 学院:通信与电子工程学院 专业:电子信息工程 班级: 学号: 姓名: XX理工大学

实验一 MATLAB数字图像处理初步 一、实验目的与要求 1.熟悉及掌握在MATLAB中能够处理哪些格式图像。 2.熟练掌握在MATLAB中如何读取图像。 3.掌握如何利用MATLAB来获取图像的大小、颜色、高度、宽度等等相关信息。 4.掌握如何在MATLAB中按照指定要求存储一幅图像的方法。 5.图像间如何转化。 二、实验原理及知识点 1、数字图像的表示和类别 一幅图像可以被定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标,f 在任何坐标处(x,y)处的振幅称为图像在该点的亮度。灰度是用来表示黑白图像亮度的一个术语,而彩色图像是由单个二维图像组合形成的。例如,在RGB彩色系统中,一幅彩色图像是由三幅独立的分量图像(红、绿、蓝)组成的。因此,许多为黑白图像处理开发的技术适用于彩色图像处理,方法是分别处理三副独立的分量图像即可。 图像关于x和y坐标以及振幅连续。要将这样的一幅图像转化为数字形式,就要求数字化坐标和振幅。将坐标值数字化成为取样;将振幅数字化成为量化。采样和量化的过程如图1所示。因此,当f的x、y分量和振幅都是有限且离散的量时,称该图像为数字图像。 作为MATLAB基本数据类型的数值数组本身十分适于表达图像,矩阵的元素和图像的像素之间有着十分自然的对应关系。 图1 图像的采样和量化 根据图像数据矩阵解释方法的不同,MA TLAB把其处理为4类: 亮度图像(Intensity images) 二值图像(Binary images) 索引图像(Indexed images) RGB图像(RGB images)

对数据进行聚类分析实验报告

对数据进行聚类分析实验报告 1.方法背景 聚类分析又称群分析,是多元统计分析中研究样本或指标的一种主要的分类方法,在古老的分类学中,人们主要靠经验和专业知识,很少利用数学方法。随着生产技术和科学的发展,分类越来越细,以致有时仅凭经验和专业知识还不能进行确切分类,于是数学这个有用的工具逐渐被引进到分类学中,形成了数值分类学。近些年来,数理统计的多元分析方法有了迅速的发展,多元分析的技术自然被引用到分类学中,于是从数值分类学中逐渐的分离出聚类分析这个新的分支。结合了更为强大的数学工具的聚类分析方法已经越来越多应用到经济分析和社会工作分析中。在经济领域中,主要是根据影响国家、地区及至单个企业的经济效益、发展水平的各项指标进行聚类分析,然后很据分析结果进行综合评价,以便得出科学的结论。 2.基本要求 用FAMALE.TXT、MALE.TXT和/或test2.txt的数据作为本次实验使用的样本集,利用C均值和分级聚类方法对样本集进行聚类分析,对结果进行分析,从而加深对所学内容的理解和感性认识。 3.实验要求 (1)把FAMALE.TXT和MALE.TXT两个文件合并成一个,同时采用身高和体重数据作为特征,设类别数为2,利用C均值聚类方法对数据进行聚类,并将聚类结果表示在二维平面上。尝试不同初始值对此数据集是否会造成不同的结果。 (2)对1中的数据利用C均值聚类方法分别进行两类、三类、四类、五类聚类,画出聚类指标与类别数之间的关系曲线,探讨是否可以确定出合理的类别数目。 (3)对1中的数据利用分级聚类方法进行聚类,分析聚类结果,体会分级聚类方法。。(4)利用test2.txt数据或者把test2.txt的数据与上述1中的数据合并在一起,重复上述实验,考察结果是否有变化,对观察到的现象进行分析,写出体会 4.实验步骤及流程图 根据以上实验要求,本次试验我们将分为两组:一、首先对FEMALE 与MALE中数据组成的样本按照上面要求用C均值法进行聚类分析,然后对FEMALE、MALE、test2中数据组成的样本集用C均值法进行聚类分析,比较二者结果。二、将上述两个样本用分即聚类方法进行聚类,观察聚类结果。并将两种聚类结果进行比较。 (1)、C均值算法思想

数字图像处理报告

数字图像处理的起源与应用 1.概述 数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理技术目前广泛应用于各个领域,其发挥的作用有效提高了人们的生产生活质量。 2.起源与发展 (1)20世纪 20 年代,数字图像处理最早应用于报纸行业。由于报纸行业信息传输的需要,一根海底电缆从英国伦敦连输到美国纽约,实现了第一幅数组照片的传送。(在当时那个年代如果不采用数字图像处理,一张图像传达的时间需要7 天,而借助数字图像处理技术仅耗费 3 小时)。 (2)20世纪50年代,当时的图像处理是以人为对象,以改善人的视觉效果为目的。 (3)20世纪60年代的美国喷气推进实验室是图像处理技术首次获得实际成功的应用,推动了数字图像处理这门学科的诞生。 (4)20世纪70年代英国EMI公司工程师Housfield发明了CT并获得了诺贝尔奖,这对人类的发展作出了划时代的贡献。借助计算机、人工智能等方面的快速发展,数字图像处理技术实现了更高层次的发展。相关工作人员已经着手研究如何使用计算机进行图像解释。 (5)20世纪 80 年代。研究人员将数字图像处理应用于地理信息系统。从这个阶段开始数字图像处理技术的应用领域不断扩大,在工业检测、遥感等方面也得到了广泛应用,在遥感方面实现了对卫星传送回来的图像的处理。 (6)20世纪 90 年代。数字图像处理技术就得到了一个快速发展,其中特别是小波理论和变换方法的诞生(Mallat在1988年有效地将小波分析应用于图像分解和重构),更好地实现了数字图像的分解与重构。 (7)进入到 21 世纪,借助计算机技术的飞速发展与各类理论的不断完善,数字图像处理技术的应用范围被拓宽,甚至已经在某些领域取得突破。从目前数字图像处理技术的特点进行分析,可以发现图像信息量巨大,在图像处理综合性方面显示出十分明显的优势,其中就借助了图像信息理论与通信理论的紧密联系。再加上数字图像处理技术具有处理精度高、灵活性强、再现性好、适用面广、信息压缩的潜力大等特点,因此已经成功地应用在各个领域。 3.应用 (1)航天和航空技术方面:早在1964年美国就利用图像处理技术对月球照片进行处理,并且成功地绘制出月球表面地图,这个重大的突破使得图像处理技术在航天技术中发挥着越来越重要的作用。“卡西尼”号飞船进入土星轨道后传回地球的土星环照片,“火星快车”拍摄到的火星山体滑坡照片,还有我国嫦娥探测器拍摄的月球表面照片,以及近来很火的“大疆”无人机航拍等等。这些照片都体现了数字图像处理技术在航空航天技术领域不可或缺的重要作用。 (2)遥感领域方面的应用:数字图像处理在遥感的应用,主要是获取地形地质及地面设施资料,矿藏探查、森林资源状况、海洋和农业等资源的调查、自然灾害预测预报、环境污染检测、气象卫星云图处理以及地面军事目标的识别。例

数字图像处理_图片识别

研究生课程考核试卷 (适用于课程论文、提交报告) 科目:数字图像处理教师:黄鸿 姓名:潘世强学号:20110802096 专业:仪器科学与技术类别:(学术)上课时间:2011年10月至2012年01月 考生成绩: 阅卷评语: 阅卷教师(签名) 重庆大学研究生院制

CHONGQING UNIVERSITY 数字图像处理 ——基于内容的图像检索系统 学院:光电工程学院 姓名:潘世强 学号:20110802096 指导教师:黄鸿 时间: 2012年01月08日

基于内容的图像检索系统 摘要:随着多媒体技术的迅速发展,图像数据库也急剧膨胀起来,如何高效、快速地从像资源中获取有用的图像成了信息检索技术研究的热点。 本文主要针对基于内容的图像检索技术(CBIR)做了相关的介绍,对基于图像检索技术中的特征提取技术进行了较为详细的阐述,研究了图像颜色的提取方法,以及图像间相似性度量方法。本文运用的特征值提取方法为颜色直方图的方法,对图像提取颜色特征,并根据这些特征对目标图片与图片库中的图片进行了相似度排序,最后运用Matlab软件对上述方法进行验证,得到图像检索结果,从而实现基于内容的图像检索。 关键词:直方图HIS彩色空间基于内容图像检索 1.引言 图像是对客观对象的一种相似性的、生动性的描述或写真。或者说图像是客观对象的一种表示,它包含了被描述对象的有关信息。它是人们最主要的信息源。据统计,一个人获取的信息大约有75%来自视觉。俗话说“百闻不如一见”,“一目了然”,都反映了图像在信息传递中的独特效果。所谓基于图像内容检索,即从图像库中查找含有特定目标的图像,也包括从连续的视频图像中检索含有特定目标的视频片段。它区别于传统的图像检索手段,融合了图像理解技术,从而可以提供更有效的检索手段。 本文主要针对基于内容的图像检索技术中的特征提取方法展开论述,简要地介绍了近年来基于内容的图像检索中颜色、纹理、形状及语义特征的描述方法,并对颜色特征的描述方法以及特征相似性做了详细的论述。

PAM聚类算法的分析与实现

毕业论文(设计)论文(设计)题目:PAM聚类算法的分析与实现 系别: 专业: 学号: 姓名: 指导教师: 时间:

毕业论文(设计)开题报告 系别:计算机与信息科学系专业:网络工程 学号姓名高华荣 论文(设计)题目PAM聚类算法的分析与实现 命题来源□√教师命题□学生自主命题□教师课题 选题意义(不少于300字): 随着计算机技术、网络技术的迅猛发展与广泛应用,人们面临着日益增多的业务数据,这些数据中往往隐含了大量的不易被人们察觉的宝贵信息,为了得到这些信息,人们想尽了一切办法。数据挖掘技术就是在这种状况下应运而生了。而聚类知识发现是数据挖掘中的一项重要的内容。 在日常生活、生产和科研工作中,经常要对被研究的对象经行分类。而聚类分析就是研究和处理给定对象的分类常用的数学方法。聚类就是将数据对象分组成多个簇,同一个簇中的对象之间具有较高的相似性,而不同簇中的对象具有较大的差异性。 在目前的许多聚类算法中,PAM算法的优势在于:PAM算法比较健壮,对“噪声”和孤立点数据不敏感;由它发现的族与测试数据的输入顺序无关;能够处理不同类型的数据点。 研究综述(前人的研究现状及进展情况,不少于600字): PAM(Partitioning Around Medoid,围绕中心点的划分)算法是是划分算法中一种很重要的算法,有时也称为k-中心点算法,是指用中心点来代表一个簇。PAM算法最早由Kaufman和Rousseevw提出,Medoid的意思就是位于中心位置的对象。PAM算法的目的是对n个数据对象给出k个划分。PAM算法的基本思想:PAM算法的目的是对成员集合D中的N个数据对象给出k个划分,形成k个簇,在每个簇中随机选取1个成员设置为中心点,然后在每一步中,对输入数据集中目前还不是中心点的成员根据其与中心点的相异度或者距离进行逐个比较,看是否可能成为中心点。用簇中的非中心点到簇的中心点的所有距离之和来度量聚类效果,其中成员总是被分配到离自身最近的簇中,以此来提高聚类的质量。 由于PAM算法对小数据集非常有效,但对大的数据集合没有良好的可伸缩性,就出现了结合PAM的CLARA(Cluster LARger Application)算法。CLARA是基于k-中心点类型的算法,能处理更大的数据集合。CLARA先抽取数据集合的多个样本,然后用PAM方法在抽取的样本中寻找最佳的k个中心点,返回最好的聚类结果作为输出。后来又出现了CLARNS(Cluster Larger Application based upon RANdomized

数字图像处理实验报告

数字图像处理试验报告 实验二:数字图像的空间滤波和频域滤波 姓名:XX学号:2XXXXXXX 实验日期:2017 年4 月26 日 1.实验目的 1. 掌握图像滤波的基本定义及目的。 2. 理解空间域滤波的基本原理及方法。 3. 掌握进行图像的空域滤波的方法。 4. 掌握傅立叶变换及逆变换的基本原理方法。 5. 理解频域滤波的基本原理及方法。 6. 掌握进行图像的频域滤波的方法。 2.实验内容与要求 1. 平滑空间滤波: 1) 读出一幅图像,给这幅图像分别加入椒盐噪声和高斯噪声后并与前一张图显示在同一 图像窗口中。 2) 对加入噪声图像选用不同的平滑(低通)模板做运算,对比不同模板所形成的效果,要 求在同一窗口中显示。 3) 使用函数 imfilter 时,分别采用不同的填充方法(或边界选项,如零填 充、’replicate’、’symmetric’、’circular’)进行低通滤波,显示处理后的图 像。 4) 运用 for 循环,将加有椒盐噪声的图像进行 10 次,20 次均值滤波,查看其特点, 显 示均值处理后的图像(提示:利用fspecial 函数的’average’类型生成均值滤波器)。 5) 对加入椒盐噪声的图像分别采用均值滤波法,和中值滤波法对有噪声的图像做处理,要 求在同一窗口中显示结果。 6) 自己设计平滑空间滤波器,并将其对噪声图像进行处理,显示处理后的图像。 2. 锐化空间滤波 1) 读出一幅图像,采用3×3 的拉普拉斯算子 w = [ 1, 1, 1; 1 – 8 1; 1, 1, 1] 对其进行滤波。 2) 编写函数w = genlaplacian(n),自动产生任一奇数尺寸n 的拉普拉斯算子,如5 ×5的拉普拉斯算子 w = [ 1 1 1 1 1 1 1 1 1 1 1 1 -24 1 1 1 1 1 1 1 1 1 1 1 1] 3) 分别采用5×5,9×9,15×15和25×25大小的拉普拉斯算子对

《数字图像处理》期末大作业(1)

《数字图像处理》期末大作业 大作业题目及要求: 一、题目: 本门课程的考核以作品形式进行。作品必须用Matlab完成。并提交相关文档。 二、作品要求: 1、用Matlab设计实现图形化界面,调用后台函数完成设计,函数可以调用Matlab工具箱中的函数,也可以自己编写函数。设计完成后,点击GUI图形界面上的菜单或者按钮,进行必要的交互式操作后,最终能显示运行结果。 2、要求实现以下功能:每个功能的演示窗口标题必须体现完成该功能的小组成员的学号和姓名。 1)对于打开的图像可以显示其灰度直方图,实现直方图均衡化。 2)实现灰度图像的对比度增强,要求实现线性变换和非线性变换(包括对数变换和指数变换)。

3)实现图像的缩放变换、旋转变换等。 4)图像加噪(用输入参数控制不同噪声),然后使用空域和频域进行滤波处理。 5)采用robert算子,prewitt算子,sobel算子,拉普拉斯算子对图像进行边缘提取。 6)读入两幅图像,一幅为背景图像,一幅为含有目标的图像,应用所学的知识提取出目标。 3、认真完成期末大作业报告的撰写,对各个算法的原理和实验结果务必进行仔细分析讨论。报告采用A4纸打印并装订成册。

附录:报告模板 《数字图像处理》 期末大作业 班级:计算机 小组编号:第9组 组长:王迪 小组成员:吴佳达

浙江万里学院计算机与信息学院 2014年12月

目录(自动生成) 1 绘制灰度直方图,实现直方图均衡化 (5) 1.1 算法原理 (5) 1.2 算法设计 (5) 1.3 实验结果及对比分析 (5) 2 灰度图像的对比度增强 (5) 2.1 算法原理 (5) 2.2 算法设计 (5) 2.3 实验结果及分析 (5) 3 图像的几何变换 (5) 3.1 算法原理 (5) 3.2 算法设计 (5) 3.3 实验结果及分析 (5) 4 图像加噪(用输入参数控制不同噪声),然后使用空域和频域进行滤波处理 (5) 4.1 算法原理 (5) 4.2 算法设计 (6) 4.3 实验结果及分析 (6) 5 采用robert,prewitt,sobel,拉普拉斯算子对图像进行边缘提取 (6) 5.1 算法原理 (6) 5.2 算法设计 (6) 5.3 实验结果及分析 (6) 6 读入两幅图像,一幅为背景图像,一幅为含有目标的图像,应用所学的知识提取出目标 (6) 6.1 算法原理 (6) 6.2 算法设计 (6) 6.3 实验结果及分析 (6) 7 小结(感受和体会) (6)

k均值聚类报告

K-均值聚类算法报告 摘要 K-均值是聚类方法中长用的一种划分方法,有很多优点,本文主要对K-均值是聚类方法的产生,工作原理,一般步骤,以及它的源码进行简单的介绍,了解K-均值是聚类!!! (一)课题名称:K-均值聚类(K-means clustering) (二)课题分析: J.B.MacQueen 在 1967 年提出的K-means算法[22]到目前为止用于科学和工业应用的诸多聚类算法中一种极有影响的技术。它是聚类方法中一个基本的划分方法,常常采用误差平方和准则函数作为聚类准则函数,误差平方和准则函数定义为: K-means 算法的特点——采用两阶段反复循环过程算法,结束的条件是不再有数据元素被重新分配: ① 指定聚类,即指定数据到某一个聚类,使得它与这个聚类中心的距离比它到其它聚类中心的距离要近。 ② 修改聚类中心。 优点:本算法确定的K 个划分到达平方误差最小。当聚类是密集的,且类与类之间区别明显时,效果较好。对于处理大数据集,这个算法是相对可伸缩和高效的,计算的复杂度为O(NKt),其中N是数据对象的数目,t是迭代的次数。一般来说,K<

(1)从 n个数据对象任意选择 k 个对象作为初始聚类中心; (2)循环(3)到(4)直到每个聚类不再发生变化为止; (3)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分; (4)重新计算每个(有变化)聚类的均值(中心对象) k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。 k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。 (三)总体检索思路: 利用goole,百度,搜狗等搜索引擎及校内的一些数据库进行相关内容的检索。主要检索内容为K-均值聚类算法的工作原理,一般步骤,源码。 (四)检索过程记录: 关键词:K-均值聚类算法 搜索引擎:百度 检索内容:①K-均值聚类算法工作原理 ②K-均值聚类算法的一般步骤 ③K-均值聚类算法的源码

数字图像处理实验报告

数字图像处理实验 报告 学生姓名:学号: 专业年级: 09级电子信息工程二班

实验一常用MATLAB图像处理命令 一、实验内容 1、读入一幅RGB图像,变换为灰度图像和二值图像,并在同一个窗口内分成三个子窗口来分别显示RGB图像和灰度图像,注上文字标题。 实验结果如右图: 代码如下: Subplot (1,3,1) i=imread('E:\数字图像处理\2.jpg') imshow(i) title('RGB') Subplot (1,3,2) j=rgb2gray(i) imshow(j) title('灰度') Subplot (1,3,3) k=im2bw(j,0.5) imshow(k) title('二值') 2、对两幅不同图像执行加、减、乘、除操作,在同一个窗口内分成五个子窗口来分别显示,注上文字标题。 实验结果如右图: 代码如下: Subplot (3,2,1) i=imread('E:\数字图像处理 \16.jpg') x=imresize(i,[250,320]) imshow(x) title('原图x') Subplot (3,2,2) j=imread(''E:\数字图像处理 \17.jpg') y=imresize(j,[250,320]) imshow(y) title('原图y') Subplot (3,2,3) z=imadd(x,y) imshow(z)

title('相加结果');Subplot (3,2,4);z=imsubtract(x,y);imshow(z);title('相减结果') Subplot (3,2,5);z=immultiply(x,y);imshow(z);title('相乘结果') Subplot (3,2,6);z=imdivide(x,y);imshow(z);title('相除结果') 3、对一幅图像进行灰度变化,实现图像变亮、变暗和负片效果,在同一个窗口内分成四个子窗口来分别显示,注上文字标题。 实验结果如右图: 代码如下: Subplot (2,2,1) i=imread('E:\数字图像处理 \23.jpg') imshow(i) title('原图') Subplot (2,2,2) J = imadjust(i,[],[],3); imshow(J) title('变暗') Subplot (2,2,3) J = imadjust(i,[],[],0.4) imshow(J) title('变亮') Subplot (2,2,4) J=255-i Imshow(J) title('变负') 二、实验总结 分析图像的代数运算结果,分别陈述图像的加、减、乘、除运算可能的应用领域。 解答:图像减运算与图像加运算的原理和用法类似,同样要求两幅图像X、Y的大小类型相同,但是图像减运算imsubtract()有可能导致结果中出现负数,此时系统将负数统一置为零,即为黑色。 乘运算实际上是对两幅原始图像X、Y对应的像素点进行点乘(X.*Y),将结果输出到矩阵Z中,若乘以一个常数,将改变图像的亮度:若常数值大于1,则乘运算后的图像将会变亮;叵常数值小于是,则图像将会会暗。可用来改变图像的灰度级,实现灰度级变换,也可以用来遮住图像的某些部分,其典型应用是用于获得掩膜图像。 除运算操作与乘运算操作互为逆运算,就是对两幅图像的对应像素点进行点(X./Y), imdivide()同样可以通过除以一个常数来改变原始图像的亮度,可用来改变图像的灰度级,其典型运用是比值图像处理。 加法运算的一个重要应用是对同一场景的多幅图像求平均值 减法运算常用于检测变化及运动的物体,图像相减运算又称为图像差分运算,差分运算还可以用于消除图像背景,用于混合图像的分离。

数字图像处理报告

《数字图像处理》 实验报告 院系:XXXXX 学号:XXXXXXX 姓名:XXX 指导老师:XX XX 完成时间:2020.02.02

题目一: (1)将宽为2n的正方形图像,用FFT算法从空域变换到频域,并用频域图像的模来进行显示; (2)使图像能量中心,对应到几何中心,并用频域图像的模来进行显示; (3)将频域图象,通过FFT逆变换到空域,并显示。 该题实现环境为操作系统:Windows 10 操作系统;编程环境:VS2013;内部核心处理算法库:OpenCV。 此题目的具体实现过程及其展示如下所示:

} imshow("原始图像", srcImage); //将输入图像延扩到最佳的尺寸,边界用0补充 int m = getOptimalDFTSize(srcImage.rows); int n = getOptimalDFTSize(srcImage.cols); //将添加的像素初始化为0. Mat padded; copyMakeBorder(srcImage, padded,0, m - srcImage.rows,0, n -srcImage.cols, BORDER_CONSTANT, Scalar::all(0)); //为傅立叶变换的结果(实部和虚部)分配存储空间。 //将planes数组组合合并成一个多通道的数组complexI Mat planes[]={ Mat_(padded), Mat::zeros(padded.size(), CV_32F)}; Mat complexI; merge(planes,2, complexI); //进行就地离散傅里叶变换 dft(complexI, complexI); //将复数转换为幅值,即=> log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2)) split(complexI, planes); // 将多通道数组complexI分离成几个单通道数组,planes[0] = Re(DFT(I), //planes[1] = Im(DFT(I))

数字图像处理基础程序及运行结果图像matlab程序 (1)

数字图像处理实验和matlab程序代码 目录 实验一MATLAB数字图像处理初步 (2) 实验二图像的代数运算 (6) 实验三图像增强—灰度变换 (9) 实验四图像增强—直方图变换 (11) 实验五图像增强—空域滤波 (13) 实验六图像的傅立叶变换 (17) 实验七图像增强—频域滤波 (19) 实验八彩色图像处理 (21) 实验九图像分割 (24) 实验十形态学运算 (27)

实验一 MATLAB数字图像处理初步 一、实验目的与要求 1.熟悉及掌握在MATLAB中能够处理哪些格式图像。 2.熟练掌握在MATLAB中如何读取图像。 3.掌握如何利用MATLAB来获取图像的大小、颜色、高度、宽度等等相关信息。 4.掌握如何在MATLAB中按照指定要求存储一幅图像的方法。 5.图像间如何转化。 二、实验内容及步骤 1.利用imread( )函数读取一幅图像,假设其名为flower.tif,存入一个数组中; 2.利用whos 命令提取该读入图像flower.tif的基本信息; 3.利用imshow()函数来显示这幅图像; 4.利用imfinfo函数来获取图像文件的压缩,颜色等等其他的详细信息; 5.利用imwrite()函数来压缩这幅图象,将其保存为一幅压缩了像素的jpg 文件,设为flower.jpg;语法:imwrite(原图像,新图像,‘quality’,q), q取0-100。 6.同样利用imwrite()函数将最初读入的tif图象另存为一幅bmp图像,设为flower.bmp。 7.用imread()读入图像:Lenna.jpg 和camema.jpg; 8.用imfinfo()获取图像Lenna.jpg和camema.jpg 的大小; 9.用figure,imshow()分别将Lenna.jpg和camema.jpg显示出来,观察两幅图像的质量。 10.用im2bw将一幅灰度图像转化为二值图像,并且用imshow显示出来观察图像的特征。 11.将每一步的函数执行语句拷贝下来,写入实验报告,并且将得到第3、 9、10步得到的图像效果拷贝下来 三、考核要点 1、熟悉在MATLAB中如何读入图像、如何获取图像文件的相关信息、如何显示图像及保存图像等,熟悉相关的处理函数。 2、明确不同的图像文件格式,由于其具体的图像存储方式不同,所以文件的大小不同,因此当对同一幅图像来说,有相同的文件大小时,质量不同。 五、实验仪器与软件

相关主题
文本预览
相关文档 最新文档