图像检索与数据库
- 格式:doc
- 大小:98.58 KB
- 文档页数:11
计算机复习信息检索信息检索是指通过计算机技术,根据用户的需求,在大规模的信息资源中准确、快速地找到相关的信息。
在当今信息爆炸的时代,信息检索的重要性不言而喻。
本文将介绍信息检索的基本概念、技术和应用,并附带答案和解析。
一、信息检索概述信息检索是指通过计算机对大规模信息资源进行全文检索、关键词检索等方式,根据用户需求提供相关信息的过程。
其目标是提高检索准确性和检索效率,帮助用户快速获取所需信息。
信息检索系统由信息资源、检索模型、检索方法和用户界面等组成。
其中,信息资源包括数据库、文档集合等;检索模型包括向量空间模型、布尔模型等;检索方法包括倒排索引、词频统计等;用户界面提供检索接口供用户输入查询词,并显示检索结果。
信息检索的基本流程包括:用户输入查询词->检索系统进行查询处理->检索系统返回相关文档。
二、信息检索技术1. 关键词检索关键词检索是最常见的信息检索方式,用户通过输入关键词,检索系统根据关键词在信息资源中进行匹配,并返回相关文档。
关键词检索常用的算法有向量空间模型、TF-IDF算法等。
全文检索是指对文档集合中的全部文本进行检索,而不仅仅是关键词。
全文检索主要通过分词、建立倒排索引等技术来实现。
用户输入的查询词可以是一个短语或一句话。
3. 自然语言查询自然语言查询是指用户使用自然语言进行查询,而不是像关键词查询那样只输入几个词。
自然语言查询需要将用户的自然语言转化为计算机可处理的查询语言,如SQL语句。
4. 语义检索语义检索是一种基于语义理解的检索方法,通过对查询词的语义进行分析,实现更精准、准确的检索。
语义检索常用的技术有词义消歧、词向量模型等。
三、信息检索应用1. 搜索引擎搜索引擎是信息检索的最常见应用之一,在互联网上广泛使用。
搜索引擎通过爬虫程序对互联网进行爬取,建立庞大的索引库,并通过用户输入的查询词返回相关页面。
2. 文献检索在学术界和科研领域,文献检索是非常重要的工作。
数据库在人工智能图像识别中的应用与研究人工智能(Artificial Intelligence,AI)和图像识别(Image Recognition)是当今技术领域炙手可热的研究方向。
随着大数据时代的到来,图像数据的增长速度显著加快,对于有关图像信息的存储和处理,数据库的角色变得越发重要。
本文将重点探讨和介绍数据库在人工智能图像识别中的应用和相关研究。
首先,数据库在人工智能图像识别中的应用包括存储、查询和处理图像数据。
在人工智能图像识别领域,大量的图像数据需要被存储并进行高效访问。
数据库系统可以提供稳定、安全的数据存储环境,允许研究人员和开发人员有效地管理和存储海量的图像数据。
通过数据库的数据管理功能,图像数据可以被合理分配存储位置和权限,降低了数据丢失和泄露的风险,同时也提高了数据的可用性和可靠性。
其次,数据库在图像数据查询方面发挥了重要作用。
在人工智能图像识别过程中,需要对海量的图像数据进行精确和快速的查询。
数据库系统可以根据用户需求和特定条件建立索引,并利用索引进行高效地查询。
通过使用数据库查询语言和合适的查询算法,研究人员可以更加准确地定位和获取所需的图像数据,提高了图像识别的准确性和效率。
另外,数据库的数据处理能力也对人工智能图像识别起到关键性的支持作用。
数据处理涉及到图像特征的提取、转换、融合等过程,这些步骤对于图像识别的性能和效果至关重要。
数据库系统可以利用其强大的数据处理功能,通过数据挖掘、机器学习和深度学习等技术,对图像数据进行处理和分析。
通过数据库的数据处理能力,数据特征可以被更好地提取和利用,从而提高了图像识别算法的准确率和鲁棒性。
在数据库在人工智能图像识别中的研究方面,有三个主要的研究方向:图像数据存储与管理、图像数据查询和索引技术、以及图像数据处理与分析。
第一,图像数据存储与管理是数据库在人工智能图像识别中的重要研究方向之一。
由于图像数据的特殊性,如数据量大、数据维数高等,研究人员需要设计高效的存储结构和存储算法来提高图像数据的存储效率。
如何利用计算机视觉技术进行图像搜索随着互联网的迅速发展,图像数据在各个领域中都得到了广泛应用。
人们在日常生活中经常会遇到需要搜索与某个图像相似的其他图像的情况,这就需要利用计算机视觉技术进行图像搜索。
本文将介绍如何利用计算机视觉技术进行图像搜索。
一、图像搜索的基本原理图像搜索是指通过计算机视觉技术,将一个给定的查询图像与数据库中的其他图像进行比较,找出与查询图像最相似的图像。
图像搜索的基本原理包括以下几个步骤:1. 图像特征提取:首先需要提取图像的特征向量,常用的特征包括颜色、纹理、形状等。
这些特征可以通过计算图像的像素值、灰度直方图、纹理的梯度等来获取。
2. 相似度计算:通过比较查询图像与数据库中其他图像的特征向量,计算它们之间的相似度。
常用的相似度计算方法有欧氏距离、余弦相似度等。
3. 结果排序:根据相似度的大小,将数据库中的图像按照与查询图像的相似程度进行排序,从而得到最相似的图像。
二、基于深度学习的图像搜索技术近年来,深度学习技术的发展推动了图像搜索的进步。
利用深度学习技术进行图像搜索的主要方法是利用卷积神经网络(CNN)进行图像特征的提取。
1. 迁移学习:利用事先在大规模图像数据集上预训练好的卷积神经网络,将其作为特征提取器。
通过删除网络的输出层,只保留前面几层用于特征提取,然后将提取到的特征输入到一个分类器中进行图像搜索。
2. 端到端学习:直接训练一个卷积神经网络,使其能够将输入的图像映射到一个高维特征空间中。
然后,利用这个高维特征空间中的距离度量来计算图像的相似度,并进行图像搜索。
基于深度学习的图像搜索技术相比传统的图像搜索方法有很多优势,如更好的特征表示能力、更高的准确率等。
三、基于哈希编码的图像搜索技术哈希编码是一种将图像映射到二进制编码的方法,通过计算图像的哈希码,可以实现快速的图像搜索。
1. 局部哈希编码:将图像分割成多个小的图像块,然后对每个图像块计算其哈希码。
通过比较查询图像的哈希码与数据库中的图像的哈希码,可以找到相似的图像块,并进行图像搜索。
EBSCO数据库使用指南1、登陆网址。
链接地址:,在我校IP范围内按地址自动登录。
2、检索方法2.1 检索界面基本检索界面,如图1高级检索界面,如图22.2 检索途径2.2.1 关键词检索点击关键词检索键,进入关键词检索界面。
在检索框中输入检索式。
基本检索和高级检索均默认为关键词检索。
(1)有关项目说明检索式检索式可以是一个词,也可以由检索字段标识符、检索词、逻辑算符以及位置算符等联合构成。
关键词关键词可以是一个完整的词,也可以使用通配符和截词符。
通配符主要用于拼写多变的单词,用问号“?”表示,只代替一个字符,可以输在词中或词尾,但不能用在词首。
截词符主要用于词根多变的词,以便扩大检索范围。
用星号“*”表示,可以代替一个或多个字符。
字段代码字段代码用两个字母表示,用于限定关键词检索的字段,输在检索词的前面。
缺省状态下在全文范围内检索。
其代码含义如下:AU为责任者、TI为题名、SU为主题词、AB为文摘、AN为登记号、IS为国际标准刊号、SO为刊名、AS作者自作文摘等。
根据数据库的不同,有的还有其它字段代码。
在高级检索界面下检索指导框的下拉菜单中都列了出来,可以参看。
逻辑算符该检索系统支持“and”、“or”、“not”三种逻辑运算,也可以用括弧括起来进行优先运算。
位置算符位置算符用于计算检索词之间能容纳的最大单词数。
它由一个字母和一个数字组成。
字母共有两个:N和W。
N是near的缩写,只限定检索词之间的单词数,而不限制检索词的顺序;W是within的缩写,既限定检索词之间的单词数,又保证检索词的顺序与输入的完全一致。
输入时放在检索词之间,如:taxn3reform或taxw5reform。
双引号“” 使用双引号,表示检索结果要与引号内的检索词完全匹配。
即检中的文献包含引号内的检索词,并且词序、词的位置都不变。
(2)逻辑关系的输入和选定在高级检索窗口下,逻辑关系可以直接输入,或者在检索指导框中选定逻辑算符,再点击检索指导框后的添加即可。
大数据分析中的图像处理方法与应用在当今信息时代,大数据的快速发展和普及应用已成为各行各业的趋势。
其中,图像数据作为大数据的重要组成部分,其处理和分析的方法与应用也备受关注。
本文将介绍一些大数据分析中常用的图像处理方法,并探讨它们在实际应用中的意义和价值。
一、图像处理方法1. 图像标注:图像标注是为图像数据附加描述性标签的过程。
通过标注,可以使图像数据具有更多的语义信息,方便后续的分析和理解。
图像标注方法可以分为手工标注和自动标注两种。
手工标注需要人工参与,对大规模数据来说工作量较大;而自动标注则利用机器学习和深度学习等技术,可以实现标注的自动化,提升效率。
2. 图像分类:图像分类是将图像数据划分到不同的类别或标签中。
在大数据分析中,图像分类方法常常利用卷积神经网络(Convolutional Neural Network,CNN)等深度学习模型,通过训练数据集来识别和分类图像。
图像分类的应用非常广泛,如人脸识别、物体检测、医学图像分析等领域。
3. 图像分割:图像分割是将图像划分为若干个不同区域的过程,每个区域具有相似的特征。
图像分割方法通常使用聚类算法、分水岭算法等。
图像分割在大数据分析中的应用包括遥感图像解译、目标跟踪、视频监控分析等。
4. 图像检索:图像检索是根据用户给定的查询图像,从数据库中检索出与之相似的图像。
图像检索方法可以基于颜色直方图、纹理特征、形状特征等。
在大数据分析中,图像检索可以帮助用户快速找到所需图像,实现图像的高效浏览与搜索。
5. 图像生成:图像生成是指基于已有图像数据生成新的图像。
图像生成方法可以通过生成对抗网络(Generative Adversarial Networks,GAN)等深度学习模型来实现。
图像生成在艺术创作、广告设计等领域有着广阔的应用前景。
二、图像处理在大数据分析中的应用1. 医疗健康领域:大数据分析结合图像处理技术在医疗健康领域有着重要的应用。
通过对医学图像数据的处理和分析,可以实现疾病预测、诊断辅助、药物研发等方面的进展。
如何使用MATLAB进行图像匹配与检索引言图像匹配与检索是图像处理和计算机视觉领域中的重要任务,其应用涵盖了人脸识别、图像搜索、智能监控等众多领域。
而MATLAB作为一款强大的数学计算和图像处理软件,提供了丰富的工具和函数,便于进行图像匹配与检索的研究与实践。
本文将介绍如何使用MATLAB进行图像匹配与检索的基本原理、方法以及示例应用。
一、图像匹配与检索的基本原理1.1 图像匹配图像匹配指的是在给定图像数据库中,找出与查询图像最相似的图像。
其基本原理是通过衡量图像间的相似度来进行匹配。
常用的相似度度量方法包括结构相似性指数(SSIM)、均方误差(MSE)、归一化互相关系数(NCC)等。
在MATLAB中,可以使用imfilter函数对图像进行滤波操作,并使用相关函数计算图像的相似度。
1.2 图像检索图像检索指的是根据查询图像的特征,从图像数据库中检索出相似的图像。
其基本原理是提取图像的特征,并根据特征之间的相似度进行检索。
常用的图像特征包括颜色直方图、边缘特征、纹理特征等。
在MATLAB中,可以使用histogram 函数对图像进行直方图特征提取,并使用特征匹配算法(如最近邻算法)进行图像检索。
二、图像匹配与检索的方法和实现2.1 图像匹配方法图像匹配方法包括基于特征点的匹配和基于全局特征的匹配。
前者是通过检测图像中的关键点,提取关键点的局部特征,然后通过寻找匹配点来实现图像匹配。
后者是通过提取图像的全局特征,比如颜色、纹理等信息,然后计算图像之间的相似度进行匹配。
在MATLAB中,可以使用SURF算法提取图像的特征点,或者使用Bag of Words(BoW)模型提取图像的全局特征,并通过最近邻算法进行匹配。
2.2 图像检索方法图像检索方法主要包括基于内容的检索和基于语义的检索。
前者是通过提取图像的低级视觉特征,比如颜色、形状等,然后根据相似度进行检索。
后者是通过利用机器学习和自然语言处理技术,将图像关联到语义标签,然后根据语义标签进行检索。
图像检索小结图像检索是一种根据图像内容进行搜索和导航的技术。
它主要涉及图像特征提取、特征匹配和相似度计算等步骤。
本文对图像检索技术进行了总结,包括特征提取方法、特征匹配算法和相似度计算方法等。
在图像检索中,特征提取是非常重要的一步。
常用的特征提取方法有颜色直方图、纹理特征、形状特征和深度学习特征等。
其中,颜色直方图是一种用于描述图像颜色分布的方法,可以通过统计每个颜色通道的像素数量来构造直方图。
纹理特征能够描述图像的纹理信息,可以通过局部二值模式(LBP)和灰度共生矩阵等方法进行提取。
形状特征可以通过提取图像的边缘或轮廓等几何形状信息来进行描述。
深度学习特征是近年来兴起的一种特征提取方法,它利用深度神经网络模型从图像中学习高层次的特征表示。
特征匹配是图像检索中的一个关键步骤,其目的是找到目标图像和数据库图像之间的对应关系。
常用的特征匹配算法有最邻近匹配法、RANSAC算法和局部特征匹配算法等。
最邻近匹配法是一种简单且高效的匹配算法,它通过计算不同图像中的特征向量之间的欧氏距离或余弦相似度来进行匹配。
RANSAC算法是一种鲁棒的特征匹配算法,它通过随机采样一组匹配特征点来计算模型参数,并通过剔除外点来提高匹配准确度。
局部特征匹配算法是一种基于图像局部区域的特征匹配方法,它通常利用局部关键点和描述子来进行匹配。
相似度计算是评估目标图像与数据库图像之间相似程度的一种方法。
在图像检索中,常用的相似度计算方法有欧氏距离、余弦相似度和基于深度学习的相似度计算等。
欧氏距离是一种简单的距离度量方法,可以用于计算特征向量之间的差异程度。
余弦相似度是一种比较特征向量之间夹角的相似度度量方法,可以有效地减小向量长度带来的影响。
基于深度学习的相似度计算是利用预训练的深度神经网络模型来计算图像的相似度,该方法通过特征提取和相似度度量两个步骤来实现,可以获得较好的检索性能。
图像检索是一门涉及多个领域的交叉学科,不仅包括计算机视觉、模式识别和机器学习等方面的知识,还需要结合人类对图像的感知和理解。
数据库在图像数据处理中的应用与优化概述图像是指由像素组成的二维数组,并且它是计算机视觉和图形学中常见的数据形式。
随着数字化时代的来临,各种领域需要处理大量图像数据,例如医疗、安防、娱乐等。
数据库是一种用来存储和管理大量结构化数据的工具,在图像数据处理中也扮演着非常重要的角色。
本文将讨论数据库在图像数据处理中的应用和优化技巧。
一、图像数据存储与管理图像数据的特点是数据量大、结构单一且关联性弱。
传统的图像存储方式是将图像直接保存为文件,但随着图像数量的增加,这种方式产生了一些问题。
数据库的引入使图像数据存储和管理变得更加高效和可靠。
数据库可以在磁盘上存储图像文件,同时通过索引和查询功能快速定位和检索图像,提高了存储和检索效率。
1.1 图像数据的存储模型数据库中图像数据的存储模型包括两种常用方式:BLOB (Binary Large Object)和文件链接。
BLOB方式是将图像数据直接存储在数据库中。
这种方式的优点是简单易用,方便管理,但不适合存储大量图像数据,因为它会占用大量的数据库磁盘空间,同时也会导致数据库的备份和恢复时间过长。
文件链接方式是将图像数据存储在文件系统中,然后在数据库中保存对应的文件路径。
这种方式的优点是节省数据库磁盘空间,同时也便于维护和管理图像文件。
使用文件链接方式需要注意数据库与文件系统之间的一致性和数据完整性,可以使用数据库事务和文件锁等技术进行保护。
1.2 图像数据的索引与查询数据库索引的目的是加快数据检索的速度。
对于图像数据,常用的索引方式有全文搜索索引和特征向量索引。
全文搜索索引可以根据用户输入的关键字搜索相关的图像。
这种索引方式适合用于图像的标签、描述等文本信息。
全文搜索索引需要在数据库中构建并维护索引表,以提高搜索效率。
特征向量索引则是利用计算机视觉的特征提取算法,将图像的特征向量存储在数据库中,并基于这些特征向量构建索引。
特征向量索引可以用于图像的内容查询、相似图像检索等场景。
使用MySQL进行图像存储和检索近年来,随着互联网的快速发展,图像处理和存储技术成为了研究和应用的热点之一。
在众多的数据库管理系统中,MySQL以其灵活性、高性能和可靠性而受到广泛关注。
本文将探讨如何使用MySQL进行图像存储和检索。
一、介绍图像存储和检索是指将图像文件存储到数据库,并通过各种方式对图像进行搜索和查询的过程。
在传统的图像存储方式中,我们常常将图像文件存储在文件系统中,然后利用文件路径进行检索。
然而,这种方式存在一些问题,比如不便于图像的组织和管理,不方便进行多条件的查询等。
而使用MySQL进行图像存储和检索,可以更好地解决这些问题。
二、图像存储在MySQL中存储图像可以使用BLOB(Binary Large Object)类型。
BLOB类型可以存储二进制数据,包括图像、音频、视频等。
在创建数据表时,可以为图像字段指定BLOB类型。
例如,创建一个名为image_table的数据表,其中包含一个image字段:CREATE TABLE image_table (id INT NOT NULL AUTO_INCREMENT,image BLOB,PRIMARY KEY (id));然后,可以使用INSERT语句将图像文件存储在image字段中。
例如,假设有一个名为image.jpg的图像文件,可以执行以下SQL语句将其存储在image_table 表中:INSERT INTO image_table (image) VALUES (LOAD_FILE('path/to/image.jpg'));需要注意的是,LOAD_FILE函数需要指定图像文件的完整路径。
同时,需要确保MySQL的配置文件中开启了该函数的权限。
三、图像检索在MySQL中进行图像检索可以借助于图像特征提取和相似度计算的技术。
常用的图像特征包括颜色直方图、纹理特征、形状特征等。
可以使用图像处理库,如OpenCV等,对图像进行特征提取,并将提取到的特征存储在MySQL数据库中。
基于大数据技术的图像检索与分类系统设计随着信息和数据量的不断增长,图像检索与分类系统在我们的日常生活中变得越来越重要。
基于大数据技术的图像检索与分类系统能够高效地处理海量图像数据,帮助用户快速准确地找到需要的信息。
本文将介绍一个基于大数据技术的图像检索与分类系统的设计。
一、系统需求分析1. 图像检索需求:- 用户能够通过输入关键词来搜索相关的图像;- 系统能够根据关键词快速检索出与之相关的图像;- 用户能够使用多种查询方式,如输入文字、上传图片、拍摄照片等。
2. 图像分类需求:- 系统能够自动将图像进行分类,并为每个类别建立索引;- 用户能够通过浏览系统提供的图像分类,选择感兴趣的类别;- 系统在新上传的图像中能够自动识别并分类。
3. 数据处理需求:- 建立大规模图像数据库,能够快速处理和存储海量图像数据;- 使用分布式计算和存储技术,提高系统的性能和可靠性;- 实现图像特征提取和匹配算法,提高图像检索和分类的准确性。
二、系统设计与实现1. 架构设计:- 系统采用分布式架构,包括前端UI、后端服务和存储数据库等组件;- 使用云计算平台,如AWS或阿里云,实现弹性扩展和高可用性;- 前端UI提供用户界面,包括图像搜索和分类的功能;- 后端服务负责图像检索和分类的算法实现。
2. 数据处理与存储:- 使用分布式文件系统,如Hadoop HDFS,存储海量图像数据;- 图像数据进行分片存储和备份,提高数据的可靠性和读写性能;- 图像特征提取和匹配算法使用分布式计算框架,如Spark或TensorFlow;- 建立图像特征索引,实现快速的图像检索和分类。
3. 图像特征提取与匹配:- 使用深度学习模型训练图像特征提取器,如卷积神经网络(CNN);- 提取图像的特征向量,并将其存储到图像特征索引中;- 使用相似性度量方法,如余弦相似度或欧氏距离,计算图像之间的相似度;- 根据相似度排序,返回与查询图像最相似的图像结果。
西北工业大学学号 ___________________________姓名 ___________________________考试课程 ___________________________考试日期 ___________________________图像检索与数据库近年来, 由于现代电子技术的发展,文字情报与文字情报一样,也能够经过数字化处理制成数据库用于计算机检索。
本文便是对图像数据库及其检索的初步探讨。
1、图像数据库1.1 图像数据库的类型数据库一般分为文献参考数据库和源数据库。
前者本身并不直接提供用户所需情报, 而是起着一种指示、介绍、牵线搭桥的作用;后者提供的是可供用户直接使用的一次情报。
显然图像数据库属于后一类型。
目前的图像数据库按照图像情报类型可分为三类, 即图形数据库、照片数据库、绘画图案数据库。
图形数据库大多应用于自然科学、工程技术领域, 收录的是用线条来表达概念的图形资料,包括设计图、配线图、住宅草图; 地图( 如地形图、地势图、道路地图、住宅地图、指路图;天气图等)。
照片数据库在图像数据库中占有主要地位, 广泛应用于社会, 人文科学和自然科学,工程技术各领域。
收录的主要内容有:报纸照片; X光片、C T 等医用诊断图;幻灯片;卫星照片、宇航照片等观测图;;资料照片、肖像、记录照片;商品广告用赠礼照片等等。
日本摄影研究中心的Photo Disc Library System 光盘数据库便属此类, 它收录了日本著名摄影家的5 万多幅彩色照片, 极富观赏性。
绘画·图案数据库数量也在逐年增多, 涉及的专业领域较多。
该类数据库一般收录绘画、插图、图案、CAD 、注册商标、公共设施标志等。
如美国专利商标局的Trademackscan一federal数据库收录了几十万个有效、被废弃、去消或期满的商标, 通过DIALOG 系统为用户提供联机服务。
图像数据库虽属源数据库之列, 但收录的内容不全是单纯的图像, 实际上它是图表、照片、书目记录甚至全文的握合体。
图像数据库有以下几个特点:1.输出内容具有视觉上的魅力;2.文档编排方法简单;3.减少情报传递中的语言障碍;4.收录其他数据库不能收的情报;5.图像可压缩;6.避免图像原件( 如名画、照片、标本等)年久劣化;7.方便复制。
1.2 图像的数字化处理图像的数字化处理不是通过键人的方法,而是采用自动图像处理技术进行的。
生成数字化图像的设备有计算机、图像扫瞄设备等。
图像扫瞄设备将图像分割成很细的扫瞄线, 继而将其分割成象素( 图像的最小单位), 并生成二进制的阵列, 每个二进制数代表一个象索的亮度, 所产生的二进制数据经过图像控制器的处理后存人载体中。
典型的8-1/ 2“ x l l”文件页, 以每英寸30 条扫瞄线扫瞄的话, 黑白图像约需I MB 的存贮容量;彩色图像所需的存贮容量则远远高于黑白图像。
若想存贮几万幅图像, 可想而知存贮设备得有多大的容量才行, 目前要做到这一点仍是不可能的。
实际应用中在不影响使用效果的情况下可以降低图像的精度( 若要数字化图像完全代替图像原件使用。
尤其是照片、绘画作品等, 需要很高的精度) 。
上述黑白图像由于同页面中相同的数据较多(例如空白部分多),通常可以压缩十分之九, 而彩色图像即使经过压缩仍需海量存贮装置。
所幸的是现在的磁、光存贮装置可以满足图像存贮对于容量的要求, 尤其是C D 一R OM 光盘可以存贮一万枚经过压缩的图像。
在实际应用中, 一般将光学字符识别和图像扫瞄结合起来使用。
如美国专利和注册商标局将专利中的文字以前者为手段转换成数字形式, 而以后者为手段对专利中的图形进行数字化处理, 并将处理过的图像存贮在光盘上。
2、图像检索图像检索,从90年代以来,主要使用基于图像内容的方法进行图像检索,也就是CBIR。
即基于图像特征从大型数据库中检索出用户所需要图像。
CBIR现今常用的检索方法为基于低层的视觉特征(如:颜色、纹理、形状、空间结构等) 进行检索,当然也有更高层的基于图像语义特征的检索,但是应用的技术还很不成熟。
但不管是什么样的检索,这些特征提取的过程必须是计算机自动完成的。
2.1 查询语言查询语言是用于帮助用户检索的高级语言, 是指各种操作的接口。
书目检索所采用的莱单、填空、SQL 及自然语言都可用于图像检索。
菜单是由若干个可供用户选择的项目组成的表。
用户从屏幕显示的若干个可选项中进行选择, 对无检索经验的用户特别方便。
这种方法可适用于选择项分级安排的系统。
填空是指用户用系统提示的关键词作为查找表达式, 可以使用布尔逻辑和其它方法扩缩检。
为了便于不熟练的用户使用, 常以菜单式, 用户友好接口软件结合使用。
不少图像检索系统都采用莱单方式提供检索。
如日本东京海洋生物公园情报检索系统,该系统收录200 种左右鱼类(91 年10 月)的文字和图像情报。
菜单提供海域、水槽、分类和名称四个选择项,每一选择项下又有若干下位选择项, 检索者通过连续选择, 即可获得所需海洋生物的图像。
如从海域角度检索叫红的鱼。
检索初期屏幕显示主菜单: 检索初期画面1 海域“选择根据生活, 海域”2 水槽“选择放养的水槽”3 种类“根据生物种类选择”4 名称“根据生物名选择”用手指轻触1, 即进人“海域”1 海域《世界地图》1) 东京的海2) 太平洋选择1)进人“东京的海”l) 东京的海《海域部分图》(l) 东京湾(2) 伊豆诸岛北部(3 ) 伊豆诸岛南部选择(3 )进人“伊豆诸岛南部”在这一层次的选择项上, 出现许多生活于该海域的鱼类名称, 选择红, 即出现静止的该鱼图像, 继而进一步提供有关该鱼的文字情报。
图像检索还可采用SQL(结构化查询语言)。
SQL 与关系数据库配套使用, 可采用布尔逻辑算符, 通过使用find、Print 等指令支持数据库的查找和其他操作, 具有正规的、强有力的语法。
日本国立民族学博物馆照片幻灯片数据库(Datab asc for Photo graphs and slides at the National Museum of Ethnology) 采用的便是这种语言。
检索时使用莱单, 屏幕上的检索卡上只有文字情报的项目名称, 数据部分是空白的, 由用户输入检索条件, 实行检索时通过PC 机将检索卡上的项目名称与用户填人卡中的字符串生成结构化查询语言的检索命令,再将期送人主机进行检索。
图像检索也可采用有一定限制的自然语言进行。
自然语言是最灵活的语言, 系统分析提问的语法, 辨认词类, 识别文档, 记录和字段名,并执行逻辑运算。
如DIALOG 的TRADEMARKSCAN-FEDERAL文档, 除了用人工语言外, 也可以用复合词或图像说明语中的词进行自然语言检索, 如STOOTSIE (w)POP? OR T00TSIEPOP? 用商标复合词检索。
2.2 平面图像检索书目信息(如题名、责任者、解说词等提图像数据库不可缺少的组成部分, 每个图像或多或少地带有相应的书目信息。
书目信息用文字的形式描述了图像的内部特征和外部特征,所以书目信息检索是最常用的图像检索方法。
不同的图像数据库其书目信息事项不尽相同。
以DIALOG 的TRADEMARKSCAN 一REDERAL为例, 该文档每条记录包括商标、美国分类号、国际分类号、所有人姓名, 商品或服务描述及有关该商标情况的其它信息。
许多记录还带有附加信息和历史数据。
该文档基本索引提供从商标名称检索的途径。
如作为完整词的字符串检索: S ROSE 。
也可以用复合词在T X 商标字段进行布尔逻辑检索: S(ROSE AND EXPRE SS ) OR ROSEEXPRESS?。
而该文档的辅助索引则提供了近50 个检索途径, 如As = 受让人,C L=美国分类代码,DS = 设计代码, R N =登记号等。
用户只要知遣其中任一信息, 便可采用相应字段检索。
2.3 立体图像检索人们在向他人描述立休形状时, 一般使用语言或类似图。
图像检索时, 人们也希望能采用这些方法。
但是要让计算机理解语言和类似图并不容易, 如果有“中问媒介”将人们对三维的表达与计算机对三维的表达结合起来, 就可以进行人机交流了。
现在除了通过书目信息检索立体图像外, 又出现了新的检索方式, 日本NTT Human Interface研究所开发的立体形状检索系统以超二次函数做三维索引,用数学式子来表达三维物体。
通过上面的叙述我们对图像数据库以及检索有了一定的认识,下面再来看看当今世界国内外发展的情况。
1.国外研究发展现状目前在国外比较成熟的各具技术特色的图像检索系统主要有IBM 的QBIC,MIT的Photobook,哥伦比亚大学的VisualSEEK,ILLIONS大学的MARS。
(1)QBIC系统QBIC是由IBM提出的、在基于图像检索领域应用最早的商用产品。
QBIC系统是基于图像的视觉内容,利用颜色百分比、颜色分布和纹理等特征进行检索,系统提出了多种查询方式,包括:支持用户使用例子查询、用户素描草图查询、扫描输入图像查询、制定特征查询方式、用户输入动态影像片段和前景中运动的对象等查询方式。
颜色主要使用在(R,G,B)、(Y,I,Q)、(L*,a*,b*)等颜色空间的颜色真方图。
纹理特征主要是文献的描述方法;形状信息主要采用面积、图形度、偏心度等。
另外,QBIC系统还考虑到了高维特征的索引,采用R*树作为索引结构。
(2)PhotobookPhotobook是MIT多媒体实验室开发的图像检索系统,Photobook有三个子部分,分别用于形状提取、纹理和面部特征。
因此,用户可以再这三个字部分中分别进行基于形状、基于纹理和基于面部特征的图像检索。
在Photobook的最新版本FourEyes中,Picard等人提出了把用户加入到图像注释和检索过程中的思想。
同事由于人的感知是主观的,他们又提出了“模糊集合”来结合人的因素。
实验结果哦表明,这种方法对于交互式图像注释来说非常有效。
(3)VisualSEEK和WebSEEK由美国哥伦比亚大学开发的姊妹系统。
Visualseek和Webseek 的主要特点是研究利用图像区域空间关系进行查询和压缩域提取视觉特征来进行检索。
系统中主要使用的特种是颜色特种和基于小波变换的纹理特征,并且使用基于Quad-Tree和R-Tree的索引结构以提高检索速度。
支持基于视觉特征及其相互之间的空间关系的检索。
Webseek主要是面向Web的搜索引擎,它包括3个模块,图像/视频收集,分类与索引和搜索,浏览和检索。
支持关键词检索,并使用用户相关反馈技术来改善检索结果。
(4)MARSMARS是多媒体分析检索系统。
其特点是使用比较全面的图像底层特征,提供基于树结构的多特征组合检索。