网络信息资源检索(1)
- 格式:ppt
- 大小:930.00 KB
- 文档页数:16
网络信息检索作业1.网络信息资源检索常用的检索技术有哪些?答:网络信息资源检索常用的检索技术有(1)布尔逻辑检索(Boolean search)(2)截词检索技术(Truncation search)(3)短语检索(4)临近检索(5)加权检索技术(Weigh search)2.搜索引擎主要分几类,例举各代表性的搜索引擎。
答:(一)按检索方式、方法可划分为:目录型搜索引擎、索引型搜索引擎(1)目录型搜索引擎有代表性的目录型搜索引擎有:Yahoo! 、Galaxy、Look Smart、中文雅虎、新浪、搜狐、网易等。
(2)索引型搜索引擎有代表性的索引型搜索引擎:中英文Google、Hotbot、AltaVista、Ask Jeeves、百度、天网等。
(二)按搜索功能可划分为:独立型搜索引擎、元搜索引擎(1)独立型搜索引擎大多数网络检索工具都是独立型的。
(2)元搜索引擎常用的元搜索引擎有:Dogpile、Metacrawler、Vivisimo、万纬搜索、搜乐搜索等。
(三)按检索内容、主题可划分为:综合型搜索引擎和专业型搜索引擎(1)综合型搜索引擎常用的Yahoo!、百度、Google等。
(2)专用型搜索引擎如医学领域、化学领域、专利信息查询等专门性的网络检索工具。
3.什么是开放存取?答:含义:对某文献的开放存取是指它在 Internet公共领域里可以被免费获取,并允许任何用户阅读、下载、复制、传递、打印、搜索、超链接,也允许用户为之建立索引,用作软件的输入数据或其他任何合法用途。
用户在使用该文献时不受财力、法律或技术的限制,而只需在存取时保持文献的完整性,对其复制和传递的惟一限制,或者说版权的惟一作用应是使作者有权控制其作品的完整性以及作品被正确接受和引用。
4.网络参考信息有哪些类型?答:(1)百科知识检索网站(2)人物信息检索网站(3)地理信息检索网站(4)机构信息检索网站(5)术语信息检索网站(6)统计信息检索网站。
第一部分1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有(C特征。
A、差异性B、传递性C、时效性D、共享性2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(B:A、信息意识B、信息心理C、信息能力D、信息道德3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是(。
A、获取知识的捷径B、科学研究的向导C、终身教育的基础D、创新知识的源泉4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面(是一次信息的别称。
A、灰色信息B、原始信息C、检索性信息D、参考性信息5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的(信息载体类型的特点。
A、印刷型B、电子型C、声像型D、微缩型6、谈谈你对“信息”的理解。
特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。
7、下列文献哪个是二次文献?(AA.文摘B.会议文献C.辞典D.百科全书8、“文章草稿”、“私人笔记”及“会议记录”属于(A。
A.零次文献B.一次文献C.二次文献D.三次文献9、下列选项中哪一项属于“国内统一刊号”(C。
A.ISBN7-04-014623-1B.ISSN0254-416411-2127/TPD.0254-4164/TP10、根据国标GB/T7714-2005规定,下面的横线上的信息是对(C参考文献的著录条目描述。
萧钰.出版业信息化迈入快车道[EB/OL].(2001-12-19[2002-04-15].http:∥www.….htm.A、标准文献B、期刊(杂志C、电子文献D、会议文献11、根据国标GB/T7714-2005规定,下面的横线上的信息是对(B参考文献的著录条目描述。
昂温G,昂温P S.外国出版史[M].陈生铮,译.北京:中国书籍出版社,2001:15-20A、期刊(JB、图书C、科技报告(RD、会议文献(Z12、下面哪些资料属于三次信息?(ACFLOPA、《2009年山东省统计年鉴》B、美国《工程索引》C、《新华字典》D、《新华文摘》E、《机械工业出版社2012年图书征订目录》F、《计算机科学技术百科全书》G、《计算机工程与应用》H、《网络营销》I、《NASA报告》。
网络信息检索方法与途径作为知识经济时代不可缺少的工具,因特网正将全世界丰富的信息资源带到我们每个人的面前。
可以说,人们所需要的信息绝大多数都可在因特网上获得,而且大多数都可以免费获得,关键在于能否准确地找到。
用户若想花最少的时间和金钱,获得网络上丰富的信息,掌握一定的检索方法和技巧必不可少。
图书馆作为信息的集散地,在网络的影响下纷纷向着电子化、数字化、网络化方向发展,为了使更多的读者充分利用图书馆资源并实现资源共享,众多图书馆建立了馆藏机读目录数据库并提供网络服务。
目前。
网上有6000多个电子图书馆,包括美国国会图书馆在内的600多所著名公共图书馆、大学图书馆及4000多个学术机构的馆藏机读书目数据库,通过网络对外开放,它可以完全不受时间、距离的限制,这也是在网络环境下的图书馆优于传统图书馆的地方。
网络的开放性及交互性使得网上有很多动态性很强的信息,如网上新闻、政策法规、通告、会议消息、论文集、研究成果、产品消息、广告、BBS等,这些网上动态信息都是网络信息资源的重要组成部分。
网络信息检索是一种基于超文本方式的信息查询方式,超文本查询是以结点为单位组织各种信息,一个结点是一个“信息块”。
在信息的组织上采用网状结构,结点之间通过关系链加以链接,构成表达特定内容的信息网络。
网络信息检索策略设计遵循快、准、全及低成本的原则,以实现检索策略最优化。
与传统信息检索相比,网络信息检索具有如下特点:(1)具备网状链拉结构。
能够按照不同查询条件链接结构,按照不同查询条件链接点信息,以供浏览、查询,具有较强的索引功能。
(2)信息丰富。
结点媒体多样化,每个结点都能集成文本、图形、图像、声音、视频、动画等多种媒体,并能用多窗口图形界面予以表现。
(3)导航能力强。
可引导读者在复杂的网络信息图中漫游而不至于迷失方向。
用户可以利用导航机制了解其所在网络图中的位置。
(4)良好的编辑功能。
包括修改、增加、删除结点和链接的能力,对结点内的信息也具有良好的编辑能力,可以进行多窗口编辑。
作业1网络信息资源检索搜索引擎为google一、搜索引擎基础搜索(利用baidu 或者google)1、用逻辑“或”查出:“汶川地震”或“四川地震” 的有关网页。
(要求:记录命中网页数量和前两篇网页的标题)注明所使用的搜索引擎检索式:汶川地震OR四川地震命中结果的数量:找到约10,300,000 条结果前两篇网页标题分别为:5·12汶川地震_百度百科;四川汶川发生8级地震-新闻频道-和讯网2、用逻辑“非”查出:中国电信(不含“上海公司”)有关的网页。
(要求:记录命中网页数量和前两篇网页的标题)检索式:中国电信-上海分公司命中结果的数量:找到约127,000,000 条结果前两篇网页标题分别为:中国电信网上营业厅·广东|为您提供电信业务办理、充值交费、费用 ...;中国电信网上营业厅公测版3利用Google“手气不错”功能检索:剑桥大学主页的URL。
(写出其网址)4利用高级检索查找过去1个月政府网站上有关禽流感治疗方面的资料。
(写出检索结果数。
)检索式:禽流感治疗site:找到约75,300 条结果二、搜索技巧练习。
(Baidu or Google)Google搜索(1)利用搜索引擎检索本专业方面的doc/pdf/ppt格式的文档各1篇(只需列出网址)。
检索式:"网络信息检索与利用" filetype:doc (pdf /ppt)(doc)/wxjs/2007qs/NO9.doc(pdf)116.53.253.213:8808/km/App_Pdf/昆明医学院文检教学大纲.pdf(ppt)(2)利用搜索引擎搜索中国教育网站内有关“学科资源导航”的所有消息,共有几条?(中国教育类网站)找到约1,640 条结果(3)在政府网站中查询网页标题中含有“胡锦涛”的页面,写下查询结果。
(写出检索式)(intitle与site语法结合)(政府类网站)使用百度搜索引擎检索式:site: intitle:"胡锦涛"搜索结果:百度为您找到相关结果约178,000个(4)查找中国互联网信息中心网站上关于“中国互联网发展状况统计报告‘的PDF文档。
【信息检索与利用考试题纲】信息检索与利用考试信息检索与利用考试题纲考试时间:11月5日,共90分钟考试形式:闭卷考试题型、题量、分值介绍:一、单项选择题﹙共8题,每题2分,共16分﹚二、不定项选择题(共6题,每题3分,共18分)三、判断题(共6题,每题1分,共6分)四、名词解释题(共4题,每题4分,共16分)五、简答题(共4题,每题6分,共24分)六、论述题(共2题,每题10分,共20分)第1章:检索基础知识文献,是用特定符号记录知识的一切载体的总称。
1.1信息概述文献的类型大致可以分为图书、期刊、研究报告、专利文献、科技报告、学位论文、会议文献、标准文献、科技档案、产品技术、政府出版物、报纸、声像资料、电子出版物、网络出版物、移动阅读设备等。
1.2文献检索的基本原理1.2.1检索工具的类型1.目录2.题录3.文摘4.索引5.搜索引擎1.2.2检索语言1.2.3文献检索的途径1.题名检索途径2.著者检索途径3.分类检索途径4.主题检索途径.1.2.4文献检索的步骤1.分析研究课题,明确检索要求、时间、范围2.确定检索策略(1)选择检索工具(2)确定检索途径(3)优选检索方法(4)制定、调整检索策略3.查找文献线索4.索取原始文献信息第2章:网络信息资源检索2.1网路信息检索技术信息检索技术是指应用于信息检索过程的原理、方法、策略、设备条件和检索手段等因素的总称。
2.1.1布尔逻辑检索技术布尔逻辑运算符有3种,逻辑与(AND)逻辑或(OR)逻辑非(NOT)。
2.2网络搜索引擎1.搜索引擎的工作原理搜索引擎的工作主要由两部分组成:信息收集处理和信息检索输出。
2.搜索引擎的分类(1)目录式搜索引擎(2)机器人搜索引擎(3)元搜索引擎2.2.2 常用的搜索引擎1.目录型搜索引擎(1)中文yahoo!(.yahoo..)(2)新浪搜索引擎(.sina..)2.机器人搜索引擎(1)Google搜索引擎(.google.)举例说明:例如用Google搜索引擎检索关于产品设计的幻灯片,可在高级检索页面中“包含以下全部的字词”栏键入“产品设计”,在“文件格式”栏选择“PPT”,同时为了缩小检索范围,可把检索结果限定在网页标题中执行检索。
第一部分1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有(C)特征。
A、差异性B、传递性C、时效性D、共享性2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(B):A、信息意识B、信息心理C、信息能力D、信息道德3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。
A、获取知识的捷径B、科学研究的向导C、终身教育的基础D、创新知识的源泉4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。
A、灰色信息B、原始信息C、检索性信息D、参考性信息5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。
A、印刷型B、电子型C、声像型D、微缩型6、谈谈你对“信息”的理解。
特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。
7、下列文献哪个是二次文献?(A)A.文摘B.会议文献C.辞典D.百科全书8、“文章草稿”、“私人笔记”及“会议记录”属于(A)。
A.零次文献B.一次文献C.二次文献D.三次文献9、下列选项中哪一项属于“国内统一刊号”(C)。
A.ISBN7-04-014623-1B.ISSN0254-416411-2127/TPD.0254-4164/TP10、根据国标GB/T7714-2005规定,下面的横线上的信息是对(C)参考文献的著录条目描述。
萧钰.出版业信息化迈入快车道[EB/OL].(2001-12-19)[2002-04-15].http:∥www.….htm.A、标准文献B、期刊(杂志)C、电子文献D、会议文献11、根据国标GB/T7714-2005规定,下面的横线上的信息是对(B)参考文献的著录条目描述。
南开19春学期(1503、1509、1603、1609、1703)《网络信息文献检索》在线作业-14、C一、单选题共20题,40分1、基于网络信息资源的特点,对于同一个网络信息资源,以下不符合其特点的描述是A可以供多人共同访问B可以在同一时间供多人访问C只能一人在一地单独访问D可以在在不同地点同时访问本题选择是:?2、以下检索系统包含的信息资源是单一类型信息资源的包括A中国知网总库B中国社会科学引文索引C读秀学术搜索D维普期刊整合服务平台本题选择是:?3、GB3469-84《文献类型与文献载体代码》的规定以单字母方式标识各种参考文献类型,下面这条文献属于哪种文献类型?()Teraoka K,Nonami T,Yokogawa Y,Taoda H and Kameyama T.Preparation of Ti02—coated hydroxyapatite single crystals[J].Journal of Material Research,2000,15(6);1243—1244.A期刊B会议文献C专利文献D学位论文本题选择是:?4、中国知网(CNKI)期刊数据库与维普期刊数据库中收录的信息资源A完全相同B完全不相同C有一部分相同D没有可比性本题选择是:?5、要改变检索式中,检索词的检索顺序,应该使用的符合是A()B{}C[]D「」本题选择是:?6、以下符号中,哪个不是信息检索中的逻辑算符AANDBORCNODNOT本题选择是:?7、以下哪项功能不是CNKI、维普、CSSCI3个数据库中都提供的A分类导航B高级检索C引文检索D参考文献到处本题选择是:?8、百科全书按文献的加工程度划分为( )A零次文献B一次文献C二次文献D三次文献本题选择是:?9、要检索到题名为“红楼梦”但不包含“石头记”的图书,应该使用的逻辑算符是A与B或C非D()本题选择是:?10、用( )将指定检索式括起来,系统首先检索其内概念A()B{}C""D[]本题选择是:?11、国家图书馆联合国内多家公共图书馆推出“数字图书馆移动阅读平台” /。
《网络信息资源检索》选修课上机实践练习(一)举例:请使用搜索引擎查询Internet上有关自己的信息,请写出(1)检索思路(2)检索结果?答案如下:(1)检索思路:a.分析自己有哪些信息。
B.提取关键字“自己的信息”。
C.选择搜索引擎。
(2)检索结果:a.使用搜索引擎查询。
1、“春风不度玉门关”中的“玉门关”古属何地?今属何地?2、楚图南为我国第一个教师节的题词是“滋兰九畹,树蕙百亩”。
该语出自何处?有何含义?3、美国发行的面值500美元纸币上的肖像是哪一位总统?4、请查找从临海发往上海的汽车车次、发车时间、价格等相关信息;5、请搜索出五副具有中国元素的Google logo;6、请检索出NBA球星凯文-加内特职业生涯的统计数据;7、请在网上寻找世界名画《蒙娜丽莎》的图片和介绍它被偷的文章。
8、请从网上找到至少一套适合做课堂教学的PPT模板,要求至少要有10张以上的不同版面设计幻灯片。
9、查找合肥市2012年8月的对外经济和旅游的统计数据;10、请搜索关于多媒体音视频文件格式转换的方法。
11、“我是一位音乐学院的老师,想查找莫扎特的所有音乐作品,做研究欣赏,我该如何查询呢?”12、查找中国近代十位国学大师及其生平简介。
13、利用搜索引擎查找关于“高等数学”的PPT文件。
(要求写出检索式,例举2个检索结果)。
14、请检索出该照片的摄影者及照片中寺庙的相关信息。
(1)检索思路(2)检索结果15、在网络时代盛行的初期,一段美丽的网络爱情故事就这么发生了……一个聊天室里:男孩:很高兴碰到你。
女孩:哈哈,是啊。
有缘千里来相会嘛。
男孩:你是做什么工作的啊?可以告诉我吗?女孩:我在一个购物中心做文秘呢!……经过几个月的网上聊天,男孩发现自己已经深深喜欢上了女孩。
见女孩一面的想法不断冲击着他。
不过,女孩并不同意见面。
男孩:你上班环境好吗?女孩:挺好的,而且旁边就有个的广场,还有展览馆,交通什么的都很方便。
男孩:哦。
网络信息资源检索方法
网络信息资源检索方法
一、通用检索方法
1.关键字检索法:利用随机检索词组进行检索,取得相关信息资源,在资源数量大多时十分有效。
2.元检索法:将检索词扩充为包含变体、前缀、词根、后缀等,以获得更大量的检索结果。
3.定向检索法:根据检索词的相关关系,建立检索词的主题及邻接词,定向检索更多内容相关的信息。
二、高级检索方法
1.混合检索法:将关键字检索和元检索相结合;利用元检索扩大检索词集,再进行关键字检索及筛选,把检索成果进一步提高。
2.前后文检索法:可选择检索词的前一句话网页和后一句的信息,来提高检索准确率。
3.元数据检索法:当Web页面使用XL节点,以ML格式保存时,可以通过检索XL或ML中的特性元数据信息的检索方法,来检索相关信息资源。
三、特殊检索方法
1.知识检索法:根据客观世界中知识,以抽象数学、计算机求解和启发式方法,来检索Web资源。
2.主题检索法:从其他网站内容中抽取信息,根据主题声明方式进行检索,以达到信息检索的目的。
3.联想检索法:根据网页关键字等特征,检索出相似但含义不同的信息资源,以全面检索主题性内容。
第4章网络信息资源检索1.搜索引擎的类型有哪些?常用的中文搜索引擎是什么?答:1)搜索引擎的类型:按信息覆盖范围及用户群可分为通用搜索引擎(综合搜索引擎)和垂直搜索引擎(专业搜索引擎);按搜索范围搜索引擎可以分为独立搜索引擎和元搜索引擎;按其工作方式(索引方式)分为目录式搜索引擎、全文搜索引擎和语义搜索引擎。
2)常用的中文搜索引擎:Google(谷歌)、百度搜索引擎、搜狗搜索引擎、必应搜索引擎、360搜索引擎等。
2. 简述搜索引擎的工作原理和常用搜索引擎提供的检索方式。
答:1)搜索引擎的工作原理可以归纳为三步:抓取网页——处理页面(建立索引数据库)——建立检索页面。
2)常用搜索引擎提供的检索方式主要是分类目录检索和关键词检索。
(1)分类目录检索:分类目录检索索引数据库通常称为目录(Catalog),该目录是由人工进行分类建立的,类似于图书馆的目录,适合于主题较宽或要求较为简单的查询。
(2)关键词检索:关键词检索主要是指利用搜索索引查找网页的方法,适合于主题较为专指、细小或狭窄的查询。
3. 如何在百度中快速地查找到“西藏”地图,如何使用检索技巧快速检索出文件类型(扩展名)为PPT的“有机化学”信息和中国教育网上有关“周济”的信息。
答:1)查找“西藏”地图步骤:(1)打开百度();(2)点击右上角的“地图”,在搜索框内输入“西藏”,点击回车即可。
2)检索有关“有机化学”、文件类型为PPT的信息方法有二:方法一步骤:(1)打开百度();(2)点击右上角的“设置”----“高级搜索”,指定文件格式为PPT(.ppt),在搜索框内输入“有机化学”,点击高级搜索即可。
方法二步骤:(1)打开百度(),利用高级检索语法filetype:直接输入检索式;(2)利用高级检索语法filetype:直接在主页搜索框中输入“有机化学filetype:ppt”,点【百度一下】或回车即可。
3)检索中国教育网上有关“周济”的信息:(1)打开百度();(2)直接利用百度高级语法site:,在主页搜索框输入直接输入“周济site:”,点【百度一下】或回车即可将检索结果限定在 中。
⽹络信息检索的⽅法 ⽹络信息检索(NIR:Network Information Retrieval)⼀般指因特⽹检索,是通过⽹络接⼝软件,⽤户可以在⼀终端查询各地上⽹的信息资源。
今天,店铺为你带来了⽹络信息检索的⽅法。
⽹络信息检索的⽅法是什么 1 主题指南与搜索引擎结合使⽤ 主题指南将信息系统地进⾏归类,可使⽤户⽅便地查找到某⼀⼤类信息,但其搜索范围较搜索引擎要⼩许多。
搜索引擎查询较为全⾯⽽充分,可以提供最全⾯、最⼴泛的搜索结果,但所提供的信息不像主题指南那样层次结构清晰,显得繁多⽽杂乱。
由于主题指南和搜索引擎各有优势,两者可以相互结合,取长补短,合理运⽤,以产⽣最佳结果。
总之,选择合适的搜索引擎是信息检索⾄关重要的⼀步。
搜索引擎在查询范围、检索能⼒、效率等⽅⾯各具特⾊,针对不同⽬的的检索,应选⽤不同的搜索引擎。
2 缩⼩检索范围 (1)采⽤恰当的检索表达式。
在检索表达式的构造中,可采⽤把⼀个短语作为⼀个整体进⾏查询的办法,或者采⽤强制包含或排除特定关键词的办法限定检索范围。
(2)限定检索范围。
当检索的范围过⼤时,可以对检索词的年代、语种、数量、学科等检索范围进⾏限定。
这些限定检索的运⽤可以有效控制检索的相关性,从⽽提⾼检准率,使检索结果接近⽤户需求。
(3)利⽤进阶检索功能。
进阶查询(Refine Query)是指利⽤前⼀次检索的结果作为后⼀次检索的依据,逐步缩⼩检索范围。
(4)搜索⼒求具体化。
检索⽂献信息资源时,要明确检索课题的需求,限定查询范围,选择确切的检索词,使检索要求具体化、明确化。
这样,有利于提⾼⽂献信息资源检索的查准率。
3 扩⼤检索范围 (1)使⽤同义词或近义词检索。
⽬前,检索软件的智能化程度较低,容易漏检与关键词意思相近或⼀致的内容。
此外,搜索引擎对⽹络信息资源中出现的多姓名的个⼈著者,更名的机关团体,同⼀事物的不同名称不像图书馆⽬录那样提供规范化的检索点,也容易出现漏检现象。
网络信息检索的工具(一)摘要]搜索引擎是人们使用Internet信息资源的重要工具。
本文对目前的中文搜索引擎进行了简要的分析,指出了其存在的缺陷和发展的方向。
关键词]信息检索中文搜索引擎存在的问题发展方向随着Internet信息资源的迅速增长,如何在浩瀚的信息海洋中准确、方便、快速地找到自己所需的信息,成了迫切需要解决的问题,从1995年开始出现的信息检索工具——搜索引擎很好地解决了这一问题。
然而各种搜索引擎,特别是尚处于发展初期的中文搜索引擎还存在着很多的缺陷有待改进,本文旨在分析目前中文搜索引擎存在的主要问题,并为解决此类问题提出一些建议和方法。
一、搜索引擎的概念和及类型搜索引擎又称检索引擎,是指运行在Internet上,以信息资源为对象,以信息检索的方式为用户提供所需数据的服务系统,主要包括信息存取、信息管理和信息检索三大部分。
目前,中文搜索引擎主要有三种类型:目录式搜索引擎、机器人搜索引擎(又称全文搜索引擎)和元搜索引擎。
1.目录式搜索引擎。
目录式搜索引擎是以人工或半人工方式收集信息,建立数据库,由编辑人员在访问了某个web站点后,对该站点进行描述,并根据站点的内容和性质将其归为一个预先分好的类别。
由于目录式搜索引擎的信息分类和信息搜集有人的参与,其搜索的准确度较高,导航质量也不错。
但因其人工的介入,维护量大,信息量少,信息更新不及时都使得人们利用它的程度有限。
国内著名的新浪、搜狐、中文雅虎都属于这种类型。
2.机器人搜索引擎。
这是一种目前运用较广泛的搜索引擎。
国内以百度,google、天网为代表。
它是使用自动采集软件Robot,搜集和发现信息,并下载到本地文档库,再对文档内容进行自动分析并建立索引。
对于用户提出的检索要求,通过检索模块检索索引,找出匹配文档返回给用户。
机器人搜索引擎具有庞大的全文索引数据库。
其优点是信息量大,范围广,较适用于检索难以查找的信息或一些较模糊的主题。
缺点是缺乏清晰的层次结构,检索结果重复较多,需要用户自己进行筛选。