当前位置:文档之家› 第四课网络信息检索的方法和使用搜索引擎

第四课网络信息检索的方法和使用搜索引擎

第四课网络信息检索的方法和使用搜索引擎
第四课网络信息检索的方法和使用搜索引擎

第四课网络信息检索的方法和使用搜索引擎

【学习任务】

一、观察老师运用各种网络信息检索的方法查询禾花雀的信息,学生填写课本P25的表2-6《网络信息检索方法分析》,并分析这些方法的差异性及其各自的优势。

要求:每位同学各自完成。

二、运用两种不同的搜索引擎搜索“华南虎”的相关信息,并填写课本P26的

表2-9《搜索过程记录卡》。

要求:按座位号2人一组完成。

三、选择一种搜索引擎查找有关番茄无土栽培的相关信息。并进行小组交流:课本P28的交流题。

要求:每位同学各自完成后2人为一组进行交流。

【学习过程】

一、情景引入:通过课本中的“开心辞典”中查询“华南虎数量”引入,使学生认

识到网络信息虽然丰富,但多而杂,没有一定的信息技术素养的人,即使身在网络中,也不一定能获取想要的信息。

二、掌握有关IE浏览器中“地址栏”的简单运用。

1)在“地址栏”键入用户要浏览的网站地址。

2)可以直接键入要搜索的内容。如“禾花雀”。

三、观察老师演示查询“禾花雀”的相关信息,并分析网络各种信息检索方法的差异性及其各自的优势。

四、学生自主学习P28表2-8和P27表2-10《搜索引擎的使用技巧》,完成任务并进行小组交流。

【学习资源】

网络信息检索的各种方法对比:

常用的搜索引擎:

关键词:搜索引擎

【课外实践】

各小组根据上节课所选的主题("学生饮用奶"或"番茄无土栽培"),利用本节课所学习的知识,上网搜索相关的信息(文字,图片),并把地址登记在信息采集卡上.

南航信息检索与利用大作业

基于嵌入式平台的无人机视觉跟踪避障方法研究 一、分析课题要求 1.文献出版类型(3种以上):期刊,学位论文,图书 2.学科范围:不限 3.时间范围:不限 二.撰写课题检索策略式,包含检索词、检索字段、逻辑算符、位置算符、截词算符。 检索词:嵌入式平台、无人机、视觉跟踪、避障 检索字段:主题 1.中文检索式:嵌入式平台and无人机and(视觉跟踪or避障) 2.外文检索式:embed* platform and (UAV or unmanned(W) aerial(W) vehicle) and (visual tracking or obstacle avoid* method) 三.选择检索工具,并记录每种检索工具的检索调整过程。(例如先选用什么词、做了何种设置,检索结果的准确度和数量;后来换了什么词、改变了什么设置、检索结果的准确度和数量有何变化;直到获得较为满意的检索结果。)1.中文期刊类检索工具(1种):CNKI 主题=嵌入式平台*无人机,结果为1 主题=嵌入式平台+无人机,结果为21126 主题=嵌入式平台+无人机*(视觉跟踪),结果为22 2.中文图书类检索工具(1种):读秀 (T=嵌入式平台*无人机),结果为0 (T=嵌入式平台|无人机),结果为196 (T=嵌入式平台|无人机|视觉跟踪|避障),结果为221 (T=嵌入式平台|无人机)*(k=视觉跟踪*避障),结果为0 (T=嵌入式平台|无人机)*(k=视觉跟踪|避障),结果为0

(T=嵌入式平台|无人机)*(K=视觉|跟踪|避障),结果为1 3.中文学位论文类数据库(1种):CNKI 主题=嵌入式平台*无人机,结果为5 主题=嵌入式平台+无人机,结果为3640 主题=嵌入式平台+无人机+视觉跟踪,结果为3876 主题=嵌入式平台+无人机+视觉跟踪+避障,结果为4573 主题=嵌入式平台*无人机*视觉跟踪+避障,结果为2 4.外文三大检索工具(1种):SCI TS=(embed* platform or (UAV or unmanned(W) aerial(W) vehicle) or visual tracking or obstacle avoid* method),结果为100750; TS=(embed* platform and (UAV or unmanned(W) aerial(W) vehicle) or visual

信息检索与利用期末复习

《信息检索与利用》考试题型说明: 一、判断题(1×10) 二、单选题(1×20) 客观题要涂答题卡。 三、填空题(2×5) 四、简答题(12×3) 五、实践题(12×2) 信息检索与利用客观复习题 一、判断题 1.在构建关键词时,我们尽量不要用自然语言,而要从自然语言中提炼关键词。 (对) 2.在信息检索时查询词表述准确是获得良好搜索结果的必要前提。(对) 3.目前的搜索引擎能很好的处理自然语言。(错) 4.用户可以通过Google图书搜索在线阅读任何一本搜索到的图书。(错) 5.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检 索。(错) 6.解决读者需求的无限性和馆藏的有限性的矛盾,唯一有效的方法就是在图书馆 间建立合作机制,实现资源共享。(对) 7.关键词语言的最大优点是能用计算机进行自动抽词标引,它适合于计算机自动 编制各种类型的词索引。(对) 8.信息素养由信息意识、信息能力、信息道德三个方面内容构成,其中,信息道 德是前提,信息能力是保证,信息意识是准则。(错) 9.搜索引擎与普通网站不同的是提供一个包含搜索框的页面,它不是一个WWW网 站。(错)

10.用搜索引擎google检索专利和期刊的全文比用中国国家知识产权局专利数据 库、《维普中文科技期刊数据库》等数据库的查全率和查准率都要高。(错)11.GB/T 16159-1996,汉语拼音正词法基本规则[S].北京:中国标准出版社, 1996.该文献类型为标准文献。(对) 12.在搜索引擎中输入“项目管理”和输入““项目管理””检索结果是不一样 的。(对) 13.在搜索引擎中常用的截词符是星号“*”,通常使用右截断。如输入comput*, 将检索出computer、computing、computerized等词汇。(对) 14.通用搜索引擎,如google、baidu、bing、yahoo,并不能囊括所有的网页。(对) 15.不同类型的搜索引擎对同一个主题进行搜索会得到不同的结果。(对) 16.一次文献是指原始创作,即作者以本人的研究成果为基本材料而创作(或撰写) 的文献,主要包括期刊论文、专利说明书、会议论文、科技报告和学位论文等。 (对) 17.从一次文献、二次文献到三次文献,是文献从无序到有序、从无组织到系统化 的过程。(错) 18.题录、目录属于一次文献;期刊论文属于二次文献。(错) 19.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后 者是未经过词表规范的自由词。(错) 20.利用某个图书馆的书刊目录查询系统(OPAC),可以了解该图书馆收藏有哪些印 刷型图书和期刊。(对) 21.截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。(对) 22.将“红外线”扩展成“远红外线”和“近红外线”运用了上下位概念扩展法。 (对)、

网络信息检索教案设计

网络信息检索教案设计 黑龙江省佳木斯市桦川县第一中学信息技术组马洪伟 教案背景 1、模块:信息技术基础 2、年级:高中一年级 3、所用教材章节:第二章第三节网络信息检索 4、学时数:40分钟 一、教材分析 教材中选取了分类检索和关键词查询两种常用信息检索方式,以关键词查询为主设计了活动,使学生通过操作理解这两种检索方式,为学生完成日常生活中所需信息获取提供了方法和途径,同时,也为学生今后的学习提供了强大的技术支持,从中培养学生信息获取的基本素养。并为选修教材中搜索引擎的学习打下基础。另外教材中还介绍了利用下载工具下载保存各类信息,并重点突出在下载前要建立分类文件夹,这为第四章信息资源管理的学习作了铺垫。 二、学情分析 需求分析:网络中信息资源分散,数量庞杂,从中寻找所需信息就像大海捞针一样,学生在平时完成活动的过程中已认识到这一点,因此对于本节课的学习学生是有一定需求的。 差异分析:学生动手操作能力都很强,在平时的生活学习中都能主动运用“搜索所需信息,一部分学生不仅能搜索到自己所需要的信息而且能利用工具下载,但绝大多数学生都没有知识产权和对信息进行管理的意识。大部分学生能积极主动的学习而且思维活跃,表达能力也很强,仅几名同学自控力不强,注意力易被分散。 情绪分析:学生对网络资源有着浓厚的兴趣,大部分学生都希望把喜欢的资源“据为已有”,这为本节课的学习奠定了良好的情绪基础。 三、教学目标 1、知识与技能 了解选择关键词的重要性;掌握分类检索和关键词查询的基本方法及技巧;能根据需要运用合适的探索方式和技巧检索信息;能使用合适的下载工具下载保存信息。 2、过程与方法 在实践中体验不同信息检索方式的检索效果,充分认识到搜索技巧在搜索信息过程中的重要性, 3、情感、态度价值观 树立合法获取信息的意识;初步体验信息资源管理中文件管理的重要性。 四、教学重、难点 重点:掌握因特网信息检索的基本方法与技巧;能够根据需要利用搜索引擎检索信息;掌握下载网络信息的常用方法。 难点:能够根据需要利用搜索引擎检索信息;能针对不同的信息选择合适的方法下载并保存。 五、教学策略设计 (1)教学方法 转变学生学习方式有利于学生知识的获取和构建、智力发展和非智力因素的培养,最终实现每一个学生全面发展的教育目标,根据这一新理念及教学内容和学生特点,我设计了诱思导学法、自主探究法、分组协作法、体验式教学法等 (2)学法指导 引导学生协作式学习、自主探究性学习、基于问题的学习,以亲自实践、积极动脑动手来学习新知。培养学生良好的学习方法与学习习惯,通过问题导学,以主题活动为主线,紧密联系生活实际,让学生从生活中发现问题,分析问题,从而解决问题。

信息检索与利用作业答案

《信息检索与利用》试题(本科) 一、单项选择题(每题分,共30分) 1. 人类社会的三大资源是( B ) (A)物质、能源、信息(B)物质、人力、资本 (C)物质、能源、管理(D)信息、管理、人力 2. 就信息与物质、能量的关系而言( B ) (A)信息是一种物质(B)信息是一种物质,同时具有一定的能量 (C)信息是一种能量(D)信息既非物质,也非能量 3. 信息论的创始人是( D ) (A)美国数学家哈特莱(B)美国数学家维纳 (C)中国数学家华罗庚(D)美国数学家香农 4.信息资源的本质特征是( D ) (A)依附性与可传递性(B)知识性与共享性 (C)共享性与价值不定性(D)可传递性与共享性 5. 如果分别以检索词a、b、c在某数据库的关键词字段进行检索都能得到相应的检索结果,结果不为0,下面哪个检索式表示检索结果数最少( C ) (A)a and b and c (B)a and b or c (C)a or b or c (D) a or b and c 6. 根据加工深度来划分文献,学位论文属于( B ) (A)零次文献(B)一次文献 (C)二次文献(D)三次文献 7. CNKI 是以下哪一种称谓的简称( C ) (A)清华同方(B)重庆维普 (C)中国知识基础设施(D)中国期刊全文数据库 8. 扩大检索范围的方式是( B ) (A)使用“逻辑与”(B)使用“逻辑或” (C)使用“逻辑非”(D)使用优先运算符 9. 下列能够检索图书信息的数据库是( B ) (A)维普《中文科技期刊数据库》(B)万方数据资源系统 (C)人大复印报刊资料全文数据库(D)超星数字图书馆

《信息检索与利用》期末复习1

《信息检索与利用》期末复习 试题题型 一、填空题(每空3分,共15分) 二、选择题(每题3分,共30分) 三、判断题(每题3分,共30分) 四、简答题(共25分) 1.(12分) 2.(13分) 复习题 第一章信息资源检索基础知识 一、填空题 1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.___________________________是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___________________________是对文献内容和形式特征进行选择和记录的过程。著录8.___________________________是指特定的数值型数据为对象的检索。数据检索 9.___________________________是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为_____________________、____________________、

信息检索与利用作业

作业一 一、单项选择 (1/30)、字段限定检索是指将检索词限定在特定的( )中进行检索。(2分) A、位置 B、检索式 C、数据库 D、字段 (2/30)、()是是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息范围,一环扣一环地追查下去的方法。(2分) A、工具法 B、追溯法 C、交替法 D、抽查法

(3/30)、()是用于在检索中排除不需要的概念或排除影响结果的概念。(2分) A、逻辑或(OR) B、逻辑与(AND) C、逻辑非(NOT) D、逻辑与和逻辑非 (4/30)、()是检索出的相关信息量与信息系统中的相关信息总量之比。(2分) A、查全率 B、失误率 C、查准率 D、检索效率 (5/30)、三次文献是在合理利用二次文献的基础上,对一次文献内容进行归纳综合撰写的专著。下列属于三次文献的是( )(2分) A、报纸、教材、期刊目录

B、手册、述评、进展报告 C、图书、专利、产品资料 D、报纸、图书、手册 (6/30)、二次检索是指把新一轮检索限制在( )范围内。这种方法有利于提高检索速度的检索的精确度,如 Google、百度在结 果页都提供相关检索和二次检索。(2分) A、一定数量 B、一定地域 C、一段时间 D、已经检索到的结果 (7/30)、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( )。(2分) A、逻辑或(OR) B、逻辑与和逻辑非 C、逻辑非(NOT)

D、逻辑与(AND) (8/30)、信息检索根据检索对象不同,一般分为()(2分) A、二次检索、高级检索 B、数据检索、事实检索、文献检索 C、分类检索、主题检索 D、计算机检索、手工检索 (9/30)、( )是检索出的相关信息量与检索出的信息总量之比。(2分) A、查全率 B、失误率 C、查准率 D、检索效率 (10/30)、( )是指将信息按一定方式组织和储存起来,并针对信息用户的特定需求查找出所需信息内容的过程。(2分) A、信息分析

四川农业大学信息检索与利用平时作业

一、单选题(共20题,30分) 1、信息资源的本质特征是依附性与可传递性 知识性与共享性 共享性与价值不定性 可传递性与共享性 2、扩大检索范围的方式是使用“逻辑与” 使用“逻辑或” 使用“逻辑非” 使用优先运算符 3、下述各项中,影响数据库质量的是检索式是否正确 检索者是否正确分析检索课题 检索词的选择质量 数据库的信息量 4、下列标引中属于内容特征描述的是著者标引、篇名标引 文献来源标引、著者工作单位标引 分类标引、主题标引 文献类型标引、语种标引 5、某条文献记录的内容为“生命之线—基因与遗传工程/(英)苏珊.奥尔德里奇;喻国根等译,---南京,江苏人民出版社,2000.7 ISBN7-214-02750-X,14.00元”,此文献为 某条文献记录的内容为“生命之线—基因与遗传工程/(英)苏珊.奥尔德里奇;喻国根等译,---南京,江苏人民出版社,2000.7 ISBN7-214-02750-X,14.00元”,此文献为 图书 期刊论文 会议论文 6、人类社会的三大资源是物质、能源、信息 物质、人力、资本 物质、能源、管理 信息、管理、人力 7、如果分别以检索词a、b、c在某数据库的关键词字段进行检索都能得到相应的检索结果,结果不为0,下面哪个检索式表示检索结果数最少a and b and c a and b or c a or b or c a or b and c 8、下列能够检索图书信息的数据库是维普《中文科技期刊数据库》 万方数据资源系统 人大复印报刊资料全文数据库 超星数字图书馆 9、以下哪个不是纸质文献的记录手段手写 油印 胶印 雕刻

10、利用引文追溯法检索文献是指利用数据库查找相关文献的方法利用手工检索刊物查找相关文献的方法 利用文献所附的参考文献查找相关文献的方法 利用Internet查找相关文献的方法 11、就信息与物质、能量的关系而言信息是一种物质 信息是一种物质,同时具有一定的能量 信息是一种能量 信息既非物质,也非能量 12、根据加工深度来划分文献,学位论文属于零次文献 一次文献 二次文献 三次文献 13、下列属于一次文献的正确答案是专刊说明书、索引、文摘刊物期刊论文、私人笔记、百科全书 会议论文、科技报告、期刊论文 字典、手册、年鉴 14、国际标准书号是ISBN ISSN CABI CNKI 15、文献记录中的ISSN号是属于内容特征 外表特征 既可能是内容特征,也可能是外表特征 上述答案皆不正确 16、信息论的创始人是美国数学家哈特莱 美国数学家维纳 中国数学家华罗庚 美国数学家香农 17、CNKI 是以下哪一种称谓的简称清华同方 重庆维普 中国知识基础设施 中国期刊全文数据库 18、以下四种信息检索语言中,不受《词表》控制的是标题词语言元词语言 叙词语言 关键词语言 19、我国专利法规定,发明专利的保护期限为专利权人终身享有30年 10年 20年 20、IPC是下列哪一种的缩写中国专利索引 国际专利分类表 美国专利分类法 国际标准化组织

最新信息检索与利用试卷及答案

一、单项选择题(30分) 1.( B )的主要功能是检索、通报、控制一次文献,帮助人们在较短时间内获取较多的文献信息。7 A.零次文献B.二次文献C.一次文献D.三次文献 2.一次文献、二次文献、三次文献是按照( A )进行区分的。7 A.加工深度B.原创的层次C.印刷的次数D.评论的次数 3.从文献的( B )角度区分,可将文献分为印刷型、缩微型等。6 A.内容公开次数B.载体类型C.出版类型D.公开程度 4.具有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物,称为( D )。8 A.图书B.会议文献C.学位论文D.期刊 5.( A )类型的专业文献出版周期最短、发行量最大、报道最迅速及时,成为多数论文发表渠道。8 A.期刊B.报纸C.会议文献D.专利 6.在公开出版物中,当前的(C )反映的信息内容可能最新。8 A.学位论文B.标准文献C.期刊论文D.报纸文献 7.当我们需要对陌生知识作一般了解时,我们可先参考( C )文献。8 A.专利B.报告C.图书D.标准 8.利用文献后面所附的参考文献进行检索的方法称为( A )。31 A.追溯法B.直接法C.抽查法D.综合法 9.中国图书馆图书分类法的分类号采用了( A )体系。34 A.拼音字母+数字B.英语字母+数字C.全部拼音字母D.全部数字 10.( B )是以报道文献出版或收藏信息为主要功能的工具。 A.题录B.索引C.文摘D.目录 11.按照顺序表述文献检索常用的五个步骤是( D )。32 A.明确要求和分析课题,选择检索系统,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略B.明确要求和分析课题,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略,选择检索系统C.明确要求和分析课题,实施检索以及调整检索策略,选择检索系统,获取原文,确定检索途径和检索策略D.明确要求和分析课题,选择检索系统,确定检索途径和检索策略,实施检索以及调整检索策略,获取原文12.图书分类法中,类名之间的上下位关系反映了学科概念之间的( A )关系。34 A.包含B.排斥C.延伸D.相容 13.图书分类法中,类名之间的同位类关系一般反映了学科概念之间的( B )关系。34 A.包含B.排斥c.延伸D.相容 14.分类途径是按照文献信息所属的学科门类,利用( D )进行检索的途径。29 A.学科名称B.专业名称C.分类号及其分类名D.A、B、C均可 15.如果希望查找“对用后均法进行数据处理的讨论”这个课题相关的文献,较好的检索词应该是( C )。36 A.后均法,进行,数据处理B.后均法,数据处理C.后均法,进行,数据处理,讨论D.用,后均法,进行,数据处理 16.如果希望查找“对宋词韵律的美学思考”这个课题相关的文献,较好的检索词应该是(A )。36 A.宋词,韵律,美学,思考B.宋词,韵律,美学C.宋词,美学,思考D.宋词,韵律,思考 17.逻辑“与”算符是用来组配( D )。41

信息检索与搜索引擎技术实验向量空间模型

信息检索与搜索引擎技术实 验向量空间模型 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

昆明理工大学信息工程与自动化学院学生实验报告 ( 2014—2015学年第 1学期) 课程名称:信息检索与搜索引擎技术开课实验室:信自楼445 2014 年12月 23日 一、上机目的及内容: 给定文档语料: d1: 北京安立文高新技术公司 d2: 新一代的网络访问技术 d3: 北京卫星网络有限公司 d4: 是最先进的总线技术。。。 d5: 北京升平卫星技术有限公司的新技术有。。。 设计一个针对这些文档的信息检索系统。具体要求是: 1)给出系统的有效词汇集合(说明取舍原因)。 2)写出d1和d2在VSM中的表示(使用tf*idf,写出各项的数字表达式,具体数值不必 实际计算出来)。 3)画出系统的倒排文件示意图。 4)按照向量夹角的余弦计算公式,给出针对查询“技术的公司”的前3个反馈结果。 2

二、实验原理 1)给出系统的有效词汇集合(说明取舍原因)。 北京、安、立、文、高新、技术、公司、新、网络、访问、卫星、有限、先进、总线、升、平 的、是、最、有,这些词作为停用词不能加入系统的有效集合 一、代,去除后并不影响原来句子语义的表达也不能算作系统的有效集合。 2)写出d1和d2在VSM中的表示(使用tf*idf,写出各项的数字表达式,具体数值不必实际 计算出来)。 得到的矩阵: 3

4 说明: TF :表示词项在该文档或者查询词中出现 的频度。即该词项出现次数除以该文档的长度(所有词的个数) :表示词项k 在D i 中的出现次数。 :表示该文档的长度(所有词的个数) IDF :表示词项在文档集合中的重要程度。一个词项出现的文档数越多,说明该词项的区分度越差,其在文档集合中的重要性就越低。 N :表示集合中的文档数; :表示出现词项k 的文档数。 d1中各词项的数字表达式 “北京”的 “安”的 “立”的 北京 1 0 1 0 1 3 安 1 0 0 0 0 1 立 1 0 0 0 0 1 文 1 0 0 0 0 1 高新 1 0 0 0 0 1 技术 1 1 0 0 1 3 公司 1 0 1 0 1 3 新 0 1 0 0 1 2 网络 0 1 1 0 0 2 访问 0 1 0 0 0 1 卫星 0 0 1 0 1 2 有限 0 0 1 0 1 2 先进 0 0 0 1 0 1 总线 0 0 0 1 0 1 升 0 0 0 0 1 1 平 0 0 0 0 1 1

兰大信息检索与利用13春在线作业1答案

兰大信息检索与利用13春在线作业1答案 一、单选题(共 10 道试题,共 40 分。) V 1. ()是最早出现的一种主题法。 A. 元词法 B. 叙词法 C. 关键词法 D. 标题法 满分:4 分 2. 文献计量方法中研究最活跃、发表文章最多的一个领域是() A. 内容分析 B. 引文分析 C. 文献统计 D. 聚类分析 满分:4 分 3. 现存最早的类书是() A. 《北堂书钞》 B. 《艺文类聚》 C. 《太平御览》 D. 《文苑英华》 满分:4 分 4. 假定在某个数据库中检索到了50篇文献,查准率和查全率分别为40%、80%,那么全部相 关文献有多少篇? A. 20 B. 25 C. 40

D. 50 E. 100 满分:4 分 5. 信息社会最根本的标志是() A. 社会物质化 B. 社会信息化 C. 终身教育 D. 信息爆炸 满分:4 分 6. 现存最早的专门记述一个朝代典章制度的断代政书是() A. 《清朝通志》 B. 《通典》 C. 《唐会要》 D. 《通志》 满分:4 分 7. 信息检索研究的核心内容是() A. 检索课题分析 B. 制定检索策略 C. 检索技术 D. 检索方法 满分:4 分 8. 通常,人们把信息密度大、刊载论文数量多、借阅率和被引率较高的,能够代表某一学科发 展水平的少数期刊,称为该学科或专业的()。 A. 学术性期刊 B. 资料性期刊 C. 核心期刊 D. 检索性期刊

E. 技术性期刊 满分:4 分 9. 根据国家标准《科学技术、学位论文和学术论文的编写格式》,一篇论文应选取() 个词作为关键词。 A. 1~5 B. 2~6 C. 3~8 D. 4~9 E. 5~10 满分:4 分 10. 目前世界上流行最广、影响最大的一部体系分类法是()。 A. 《冒号分类法》 B. 《中图法》 C. 《汉语主题词表》 D. 《国际十进分类法》 E. 《杜威十进分类法》 满分:4 分 二、多选题(共 5 道试题,共 20 分。) V 1. 维普中文科技期刊数据库检索的方式包括()等多种类型。 A. 快速检索 B. 传统检索 C. 高级检索 D. 分类检索 E. 期刊导航 满分:4 分

信息检索与利用试卷及答案1

信息检索与利用试卷及答案1

信息检索期末试卷 班级物流1081 姓名吴新华学号1081508130 一、单项选择题(30分) 1.( B )的主要功能是检索、通报、控制一次文献,帮助人们在较短时间内获取较多的文献信息。7 A.零次文献B.二次文献C.一次文献D.三次文献 2.一次文献、二次文献、三次文献是按照( A )进行区分的。7 A.加工深度B.原创的层次C.印刷的次数D.评论的次数 3.从文献的( B )角度区分,可将文献分为印刷型、缩微型等。6 A.内容公开次数B.载体类型C.出版类型D.公开程度 4.具有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物,称为( D )。8 A.图书B.会议文献C.学位论文D.期刊5.( A )类型的专业文献出版周期最短、发行量最大、报道最迅速及时,成为多数论文发表

渠道。8 A.期刊B.报纸C.会议文献D.专利 6.在公开出版物中,当前的(C )反映的信息内容可能最新。8 A.学位论文B.标准文献C.期刊论文D.报纸文献 7.当我们需要对陌生知识作一般了解时,我们可先参考( C )文献。8 A.专利B.报告C.图书D.标准 8.利用文献后面所附的参考文献进行检索的方法称为( A )。31 A.追溯法B.直接法C.抽查法D.综合法 9.中国图书馆图书分类法的分类号采用了( A )体系。34 A.拼音字母+数字B.英语字母+数字C.全部拼音字母D.全部数字 10.( B )是以报道文献出版或收藏信息为主要功能的工具。 A.题录B.索引C.文摘D.目录 11.按照顺序表述文献检索常用的五个步骤是( D )。32

信息检索与搜索引擎课程报告

《信息检索搜索引擎技术》期末考试报告 学期:2016-2017学年第一学期 任课教师:毛存礼 专业年级:计科133 学号:201310405339、 201310405326、 201310405330、201310405325 学生姓名:李然、毛子铭、张倩、黄枫

目录 一、系统概述 (3) 二、系统需求分析 (3) 2.1功能需求分析 (3) 三、程序实现 (4) 3.1 爬虫的实现 (4) 3.1.1 对网页进行分析 (4) 3.1.2编写爬虫 (5) 3.2索引的实现 (7) 3.2.1分词的实现 (7) 3.2.2索引的建立 (8) 3.2.3检索索引 (9) 3.3向量空间模型的实现 (10) 3.3.1向量空间模型概述 (10) 3.3.2建立向量空间模型 (11) 3.4利用Lucene打分机制对文档打分 (13) 四、测试 (14) 五、心得体会 (17)

一、系统概述 随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜索软件或网络登录等方式,将Intenet上大量网站的页面信息收集到本地,经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索做出响应,提供用户所需的信息或相关指针。 用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的检索。本系统基于HTMLUNIT框架,构建爬虫,基于LUCENE框架,构建索引,利用向量空间模型向量化表示文档间的相关性,利用LUCENE 给相关文档打分。 二、系统需求分析 2.1功能需求分析 该系统分为四个功能模块: (1)爬虫模块 (2)索引模块 (3)向量化表示模块 (4)打分模块 具体实现分工如下: ①爬虫模块:该模块采用Htmlunit框架,主要负责爬取网页内容,在 本地建立文档库,以便于索引功能模块,将文档库里的文档内容建立成索引。 (毛子铭所做) ②索引模块:该模块采用Lucene框架,功能分为两块:一是建立索引, 将爬取的内容建立成索引。二是检索索引,即提供给用户检索索引。(张倩所做) ③向量化表示模块:该模块采用向量空间模型,其功能是将查询文本和

信息检索与利用大作业

信息检索作业 一、分析课题要求: 1、文献出版类型:期刊、学位论为,学位论文 2、学科围:工程科技Ⅱ辑 3、时间跨度:2005~现在 二、撰写课题检索策略式 中文检索式:智能车辆 or 交通标志and检测技术研究 外文检索式:% intelligent vehicle or traffic sign and research on detecting technique 时间围:2000至今 三选择检索工具: 中文期刊类检索工具:选择了知网cnki (1)交通标志and检测技术研究 准确度较低,共57条结果。 (2)智能车辆 or交通标志and检测技术研究

准确度较高,共4条结果 中文图书类检索工具: 选择了超星 (1)交通标志and检测技术研究 4条,不准确 (2)智能车辆 or交通标志and检测技术研究

1条,准确 3、中文学位论文检索工具 选择了知网cnki为检索工具 (1)交通标志and检测技术研究 285条结果,不准确 (2)智能车辆 or交通标志and检测技术研究

227611结果,较准确 4、外文检索工具 选择了SCI (1)(% intelligent vehicle or traffic sign and research on detecting technique) 共15741条结果,不准确 (2)主题:(intelligent vehicle) AND主题:(traffic sign) OR主题:(detecting technique) 共15741条,不准确

共8431条结果,准确 5、搜索引擎 采用百度 (1)交通标志and检测技术研究 共24100条结果,不准确 (2)智能车辆 or交通标志and检测技术研究 共47100条结果,准确

信息检索与利用(期末考试题)

《信息检索与利用·农业》试题 姓名申秀军学号w320206220257 专业会计学 一、单选题(20分,每题1分) 1、个人信息源又称为(B )。 A、文献信息源 B、口头信息源 C、生物信息源 D、实物信息源 2、文献是记录有知识的(A)。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献( A )。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D )。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C )。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有( A )。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有( D )。 A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是(D) A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成( A) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在(A)类目下查找。 A、S类目 B、Q类目 C、T 类目 D、R类目

11、使用逻辑“与”是为了(B) A、提高查全率 B、提高查准率 C、减少漏检率 D、提高利用率 12、使用逻辑“或”是为了(A) A、提高查全率 B、提高查准率 C、缩小检索范围 D、提高利用率 13、利用文献末尾所附参考文献进行检索的方法是( C ) A、倒查法 B、顺查法 C、引文追溯法 D、抽查法 14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合, 称为(A)。 A、数据库 B、记录 C、字段 D、文档 15、广义的信息检索包含两个过程(B ) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 16、要查找李平老师所发表的文章,首选途径为( A ) A、着者途径 B、分类途径 C、主题途径 D、刊名途径 17、狭义的专利文献是指(C ) A、专利公报 B、专利目录 C、专利说明书 D、专利索引 18、中国国家标准的代码是( A ) A、GB B、CB C、ZG D、CG 19、政府出版物主要包括两大类型的文献(B ) A、专利与标准 B、行政文件与科技文献 C、图书与期刊 D、档案与标准 20、ISBN是( B)的缩写 A、国际标准刊号 B、国际标准书号 C、连续出版物代码 D、国内统一刊号 二、多选题(20分,每题2分) 1、文献的构成要素( ABC) A、信息内容 B、载体材料 C、信息符号 D、纸、光盘 2、下列各项哪些属于文献( AC ) A、图书、期刊 B、光盘、磁盘 C、光盘数据库 D、纸张 3、期刊论文的外部特征有( ABC ) A、文献题目 B、着者 C、文献出处 D、主题词 4、图书的外部特征有( BCD )

网络信息检索试题及答案

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有()特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

信息检索技术方法及搜索引擎

信息检索技术方法及搜索引擎.txt 1 截词检索技术 2 邻近检索技术 3 字段检索技术 4 布尔逻辑检索是指通过标准的布尔逻辑关系算符来表达检索词与检索词间的逻辑关系的检索 方法. 主要的布尔逻辑关系词有:逻辑与(AND),逻辑或(OR),逻辑非(NOT) 1 布尔逻辑检索技术 逻辑与 逻辑乘: "and"或"*"表示 组配方式:A*B或者A and B 表示两个概念的交叉和限定关系,只有同时含有这两个概念的记 录才算命中信息 作用:增加限制条件,即增加检索的专指性,以缩小提问范围,减少文献输出量,提高查准率. 逻辑或 又称逻辑和:"or","+" 组配方式:A OR B或者A+B,表示检索含有A词,或含有B词,或同时包含A,B两词的文章. 作用:放宽提问范围,增加检索结果,起扩检作用,提高查全率. 逻辑非 又称逻辑差: "not" "-" 组配方式:A-B,表示检索出含有A词而不含有B 词的文章. 作用:逻辑非用于排除不希望出现的检索词,它和"*"的作用相似,能够缩小命中文献范围,增 强检索的准确性. 例如检索:"打印机驱动程序" 查询关键词:打印机,驱动程序 检索表达式:打印机 AND 驱动程序 例如检索:"微型计算机"方面的有关信息 查询关键词:微型计算机,微机 检索表达式:微型计算机OR 微机 布尔逻辑检索举例 布尔运算符优先级比较 有括号时:括号内的先执行; 无括号时:NOT > AND > OR 例:检索"唐宋诗歌"的有关信息. 关键词:唐,宋,诗歌; 检索表达式: (唐 OR 宋)AND 诗歌; 唐 AND 诗歌 OR 宋 AND 诗歌; 错误表达式: 唐 OR 宋AND诗歌; 唐 AND 宋AND诗歌;

信息检索与利用作业模板

课程报告 课程名称: 系别: 班级: 指导教师: 学生姓名: 时间:____________________ 二〇一二年月日

实验1:各种类型中外文文献检索(6学时) 目的: 1.学会电子图书检索。 2.学会中文学位论文检索。 3.学会中文会议论文检索。 4.学会中文期刊论文检索。 5.学会国内重要专业人士、重要研究机构、重要文献、重要期刊等信息检索。 6.学会标准文献检索。 7. 学会科技成果检索。 8. 学会外文期刊论文检索。 内容: 1.自选检索课题。 2.分析检索课题,确定检索标识,编写提问式。 3.利用超星电子图书(免费阅览室) 、中国知网数字出版平台、国家科技图书文献中心等相关数据库。 4. 在相关检索提问框中输入提问式实施检索,筛选命中文献,选择检索结果输出格式并输出结果。如有必要可反复修改检索提问式优化检索结果。 5.记录检索过程,完成检索报告并提交。 要求: 1.电子图书 选择超星电子图书(免费阅览室)或其他电子书全文数据库中的1种数据库进行电子图书检索: 数据库名称____________________________ 检索策略(表达式)______________________ 命中文献数____________ 选取其中1条文献题录 书名: 作者姓名:出版时间: 总页数:章(或节)数: 参考文献数:

2.中文学位论文 选择中国知网数字出版平台——中国优秀硕士学位论文全文数据库、中国博士学位论文全文数据库、国家科技图书文献中心——中文学位论文等数据库中的1种数据库进行学位论文检索: 数据库名称______________________________________ 检索年限_______________________________________ 检索策略(表达式)________________________________ 命中文献数____________ 选取其中1条文献题录 论文题目: 作者姓名: 导师姓名: 授予学位级别: 作者专业名称: 学位授予单位: 授予学位时间: 论文总页数: 3.会议论文 选择中国知网数字出版平台——中国重要会议论文全文数据库、国家科技图书文献中心——中文会议论文等数据库中的1种数据库进行会议论文检索: 数据库名称______________________________________ 检索年限_______________________________________ 检索策略(表达式)________________________________ 命中文献数____________ 选取其中1条文献题录 论文题目: 作者姓名: 第一作者单位: 会议名称: 会议地点: 主办单位: 出处(会议录名称、出版时间、论文在会议录中的页码范围):

信息检索与利用期末考试

《信息检索与利用·计算机》期末考试试题 一、单选题(20分,每题1分) 1、个人信息源又称为( C)。 A、文献信息源 B、口头信息源 C、生物信息源 D、实物信息源 2、文献是记录有知识的( A )。 A、载体 B、纸张 C、光盘 D、磁盘 3、下列哪种文献属于一次文献( A )。 A、期刊论文 B、百科全书 C、综述 D、文摘 4、下列哪种文献属于二次文献( D )。 A、专利文献 B、学位论文 C、会议文献 D、目录 5、下列哪种文献属于三次文献( C )。 A、标准文献 B、学位论文 C、综述 D、文摘 6、下列选项中属于连续出版物类型的选项有( A )。 A、人民日报 B、学位论文 C、科技期刊 D、会议文献 7、下列选项中属于特种文献类型的有( A )。 A、学位论文 B、图书 C、科技期刊 D、标准文献 8、纸质信息源的载体是( D) A、光盘 B、缩微平片 C、感光材料 D、纸张 9、《中国图书分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。 A、S类目 B、Q类目 C、T 类目 D、R类目 11、使用逻辑“与”是为了( B) A、提高查全率 B、提高查准率 C、减少漏检率 D、提高利用率 12、使用逻辑“或”是为了( A ) A、提高查全率 B、提高查准率 C、缩小检索范围 D、提高利用率 13、利用文献末尾所附参考文献进行检索的方法是(C) A、倒查法 B、顺查法 C、引文追溯法 D、抽查法 14、至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为( A )。 A、数据库 B、记录 C、字段 D、文档 15、广义的信息检索包含两个过程( B ) A、检索与利用 B、存储与检索 C、存储与利用 D、检索与报道 16、要查找李平老师所发表的文章,首选途径为( A ) A、著者途径 B、分类途径 C、主题途径 D、刊名途径 17、狭义的专利文献是指( C ) A、专利公报 B、专利目录 C、专利说明书 D、专利索引 18、中国国家标准的代码是( A ) A、GB B、CB C、ZG D、CG 19、政府出版物主要包括两大类型的文献( B ) A、专利与标准 B、行政文件与科技文献 C、图书与期刊 D、档案与标准 20、ISBN是( B )的缩写

相关主题
文本预览
相关文档 最新文档