信息检索与利用8
- 格式:ppt
- 大小:2.48 MB
- 文档页数:45
信息检索技术与利用信息检索技术与利用一、信息检索技术简介信息检索技术是指通过计算机系统对大量文献或数据进行搜索和筛选,以便用户快速获取所需信息的技术。
其主要应用于互联网搜索引擎、数据库查询以及文献检索等领域。
二、信息检索技术的基本原理1.建立索引为了快速地查找到所需信息,首先需要对文献或数据建立索引。
这个过程包括对文本内容进行分词、去除停用词、统计词频等操作,最终生成一个包含关键词及其出现次数的索引表。
2.查询处理当用户输入查询请求后,系统会对其进行处理。
这个过程包括分析查询语句、提取关键词、构建查询表达式等操作。
最终生成一个能够匹配到相关文献或数据的查询结果。
3.排序算法在得到匹配结果后,需要将其按照相关性排序。
这通常使用TF-IDF算法来实现。
该算法将文档中每个词的重要性评估为该词在文档中出现的频率与所有文档中出现该词的频率之比,并根据此评估值对文档进行排序。
三、常见的信息检索技术1.全文检索全文检索是指对文本内容进行完整的搜索和匹配。
它可以快速地找到包含查询关键词的文档,并按照相关性进行排序。
全文检索常用于互联网搜索引擎、电子邮件系统、博客等领域。
2.元数据检索元数据检索是指对文档的属性信息进行搜索和匹配。
这些属性包括标题、作者、日期等。
元数据检索通常用于图书馆系统、数据库查询等领域。
3.语义检索语义检索是指通过分析查询语句的意思,而不只是关键词,来寻找相关文档或数据。
这种技术需要对自然语言处理有深入的了解,并且需要大量的人工标注数据来训练模型。
四、信息检索技术的应用1.互联网搜索引擎互联网搜索引擎是信息检索技术最广泛的应用之一。
通过对互联网上的网页进行全文检索,并使用复杂的排序算法,可以为用户提供准确和有用的搜索结果。
2.电子商务平台电子商务平台需要对大量商品信息进行管理和搜索。
通过建立商品分类体系和属性标签,并使用元数据检索技术,可以帮助用户快速地找到所需商品。
3.医学文献检索医学文献检索是指对大量医学文献进行搜索和筛选,以便医生和研究人员快速获得所需信息。
信息检索与利用一、解释Internet的概念Internet的全称是Inter-network,中文译成因特网、互联网或网际网,是通过通信媒介连接的世界性计算机网络的总称。
二、陈述接入Internet的基本方式1.利用电话线和通讯软件拨号连接;2.利用SLIP或PPP协议与一台上网主机连接;3.网络连接三、熟悉Internet提供的服务1.电子邮件(E-mail) ;2.文件传输(FTP);3.远程登录(Telnet);4.网络新闻(USENET);5.网络检索工具Gopher、WAIS、Archie等;6.万维网(WWW);7.电子公告栏(BBS);8.网上寻呼(ICQ);9.网上聊天(IRC)。
四、熟悉E-mail、FTP、Telnet、WWW的基本概念及使用(一)电子邮件1.概念:一种通过Internet与其它用户进行联系,方便、快捷、价廉的现代化通信手段。
2.电子邮件系统的功能:邮件起草与编辑、发送邮件、收信通知、读取与检索邮件、答复与转发邮件、退信说明及邮箱管理等。
3.电子邮件的地址:userid@hostname,地址中不能有空格。
4.电子邮件的格式:邮件头(mail header)和邮件体(mail body)。
(二)FTP1.概念:提供了任意两台计算机之间相互传输文件的功能。
2.常用命令:put和Mput命令;Ascii和Binary命令;(三)Telnet是指在网络通讯协议Telnet的支持下,用户的计算机通过Internet暂时成为远程计算机终端的过程。
(四)WWW1.概念:WWW是World Wide Web的缩写,也被简称为3W或Web,通常译为全球网、万维网。
它是一个把信息检索技术与超文本(Hyper Text)技术相融合而形成的环球信息系统。
超文本有两个含义:其一是信息的表达形式;其二是信息间的连接方式。
2:URL:URL(Uniform Resource Locator)是指统一资源定位器,实际是一个标识文件类型及所在WWW地址的字符串。
一、单项选择题(30分)1.( B )的主要功能是检索、通报、控制一次文献,帮助人们在较短时间内获取较多的文献信息。
7A.零次文献B.二次文献C.一次文献D.三次文献2.一次文献、二次文献、三次文献是按照( A )进行区分的。
7A.加工深度B.原创的层次C.印刷的次数D.评论的次数3.从文献的( B )角度区分,可将文献分为印刷型、缩微型等。
6A.内容公开次数B.载体类型C.出版类型D.公开程度4.具有固定名称、统一出版形式和一定出版规律的定期或不定期的连续出版物,称为( D )。
8A.图书B.会议文献C.学位论文D.期刊5.( A )类型的专业文献出版周期最短、发行量最大、报道最迅速及时,成为多数论文发表渠道。
8 A.期刊B.报纸C.会议文献D.专利6.在公开出版物中,当前的(C )反映的信息内容可能最新。
8A.学位论文B.标准文献C.期刊论文D.报纸文献7.当我们需要对陌生知识作一般了解时,我们可先参考( C )文献。
8A.专利B.报告C.图书D.标准8.利用文献后面所附的参考文献进行检索的方法称为( A )。
31A.追溯法B.直接法C.抽查法D.综合法9.中国图书馆图书分类法的分类号采用了( A )体系。
34A.拼音字母+数字B.英语字母+数字C.全部拼音字母D.全部数字10.( B )是以报道文献出版或收藏信息为主要功能的工具。
A.题录B.索引C.文摘D.目录11.按照顺序表述文献检索常用的五个步骤是( D )。
32A.明确要求和分析课题,选择检索系统,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略B.明确要求和分析课题,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略,选择检索系统C.明确要求和分析课题,实施检索以及调整检索策略,选择检索系统,获取原文,确定检索途径和检索策略D.明确要求和分析课题,选择检索系统,确定检索途径和检索策略,实施检索以及调整检索策略,获取原文12.图书分类法中,类名之间的上下位关系反映了学科概念之间的( A )关系。
综合测试时间: 答题数: 成绩:.....判断题...........................................................................................................................1.馆藏书目不仅能够反映单个文献的特征,更重要的能够反映整个图书馆或者多个图书馆的文献特征。
A.对2.上海教育网络图书馆能够很便捷的随时随地访问进行书目检索。
正确答案:B.错3.学位论文中的参考文献是指所有与撰写该论文有联系的文献资料。
正确答案:B.错4.新购读书卡没有注册过用户名,需要先进行新用户注册。
正确答案:A.对5.Google图书搜索可以用减号“-”表示逻辑“非”的关系。
正确答案:A.对6.利用信息检索,可以大大节省科技工作者大量宝贵的时间和资金。
可以大大提高用于思考的创造性劳动的时间的比例,以创造更多的成果。
正确答案:A.对7.美国未来学家阿尔温·托夫勒在《第三次浪潮》(1980年)中把第二次浪潮即工业化社会的特征归纳为规格化、专业化、同步化、集中化、最优化和集权化这6个相互联系的方面。
正确答案:B.错8.在Google图书搜索中,无预览可显示图书的相关信息并附有几小段内容,即含有搜索字词的相关句子。
正确答案:B.错9.WorldCat基本上反映了世界范围内的图书馆所拥有的图书和其他资料。
正确答案:A.对10.在构建关键词时,我们尽量不要用自然语言,而要从自然语言中提炼关键词。
正确答案:A.对11.信息是指在特定时间、特定状态下对特定的人提供的有用的知识。
正确答案:B.错12.相对于传统社会的信息环境来说,如今人类所面对的主要问题不是信息知识的匮乏和停滞,而是信息总量的无限膨胀。
正确答案:A.对13.中文科技期刊数据库在检索过程中,在选定关键词、刊名、作者、第一作者和分类号这五个检索字段进行检索时,系统提供的“模糊”和“精确”两种检索方式才生效。
《信息资源检索与利用100题集及答案》姓名:陈晨学号:110803021101班级:11级材料一班第一章绪论1.简述科技文献检索的意义。
答:人们无论学习、工作,还是进行科学研究,都离不开文献的检与利用。
具体来说,科技文献检索具有以下六个方面的意义:(1)有利于大学生信息素养的培育;(2)有利于复合性、开拓性人才的培养;(3)有利于促进智力资源的开发利用,推动社会进步与发展;(4)有利于帮助研究人员继承和借鉴前人的成果,避免重复研究和走弯路;(5)有利于节省研究人员查找文献的时间,提高科研效率;(6)有利于为决策提供科学依据。
2.信息、知识、情报、文献的概念是什么?答:(1)信息是被反映事物属性的再现。
信息不是事物本身,而是由事物发出的消息、指令、数据等所包含的内容。
(2)知识是人类认识的成果和结晶,是人类在认识和改造世界的社会实践中获得的对事物本质的认识。
(3)情报是人们在一定时间内为一定目的而传递的具有使用价值的知识或信息。
(4)文献是各种知识或信息载体的总称。
其由知识信息内容、载体材料和记录方式三要素组成。
3.试述科技文献检索的定义及作用。
答:所谓科技文献检索,是指文献资料的查找与获得。
其作用是检索者利用检索工具按照文献编排特点,采取一定的途径、方法和步骤迅速、准确地查获自己所需要的文献资料,便于学习、工作和进行科学研究。
4.科技文献有什么特点?答:现代科技文献的发展具有以下明显特点:(1)数量急剧增长;(2)内容交叉重复;(3)文献出版分散;(4)文献失效加快;(5)文献语种增多;(6)文献载体电子化,文献传播网络化。
5.试述一、二、三次文献的概念?它们之间的关系如何?答:(1)一次文献是作者在科学研究、教学和生产实践中以自己的研究成果为依据创作而成的文献,又称一级文献或原始文献;(2)二次文献是文献情报人员将大量分散的、无序的原始文献进行筛选、整理、报道和组织所形成的文献,又称二级文献或检索性文献;(3)三级文献是利用二级文献的线索,系统地检索出一批相关文献,并对其内容进行综合、分析、研究和评述而编写出来的文献,又称三级文献或参考性文献。
信息检索与利用试题及答案第一章绪论1.简述科技文献检索的意义。
答:人们无论学习、工作,还是进行科学研究,都离不开文献的检与利用。
具体来说,科技文献检索具有以下六个方面的意义:(1)有利于大学生信息素养的培育;(2)有利于复合性、开拓性人才的培养;(3)有利于促进智力资源的开发利用,推动社会进步与发展;(4)有利于帮助研究人员继承和借鉴前人的成果,避免重复研究和走弯路;(5)有利于节省研究人员查找文献的时间,提高科研效率;(6)有利于为决策提供科学依据。
2.信息、知识、情报、文献的概念是什么?答:(1)信息是被反映事物属性的再现。
信息不是事物本身,而是由事物发出的消息、指令、数据等所包含的内容。
(2)知识是人类认识的成果和结晶,是人类在认识和改造世界的社会实践中获得的对事物本质的认识。
(3)情报是人们在一定时间内为一定目的而传递的具有使用价值的知识或信息。
(4)文献是各种知识或信息载体的总称。
其由知识信息内容、载体材料和记录方式三要素组成。
3.试述科技文献检索的定义及作用。
答:所谓科技文献检索,是指文献资料的查找与获得。
其作用是检索者利用检索工具按照文献编排特点,采取一定的途径、方法和步骤迅速、准确地查获自己所需要的文献资料,便于学习、工作和进行科学研究。
4.科技文献有什么特点?答:现代科技文献的发展具有以下明显特点:(1)数量急剧增长;(2)内容交叉重复;(3)文献出版分散;(4)文献失效加快;(5)文献语种增多;(6)文献载体电子化,文献传播网络化。
5.试述一、二、三次文献的概念?它们之间的关系如何?答:(1)一次文献是作者在科学研究、教学和生产实践中以自己的研究成果为依据创作而成的文献,又称一级文献或原始文献;(2)二次文献是文献情报人员将大量分散的、无序的原始文献进行筛选、整理、报道和组织所形成的文献,又称二级文献或检索性文献;(3)三级文献是利用二级文献的线索,系统地检索出一批相关文献,并对其内容进行综合、分析、研究和评述而编写出来的文献,又称三级文献或参考性文献。
《信息检索与利用》试题(本科)一、单项选择题(每题1.5分,共30分)1. 人类社会的三大资源是( B )(A)物质、能源、信息(B)物质、人力、资本(C)物质、能源、管理(D)信息、管理、人力2. 就信息与物质、能量的关系而言( B )(A)信息是一种物质(B)信息是一种物质,同时具有一定的能量(C)信息是一种能量(D)信息既非物质,也非能量3. 信息论的创始人是( D )(A)美国数学家哈特莱(B)美国数学家维纳(C)中国数学家华罗庚(D)美国数学家香农4.信息资源的本质特征是(D )(A)依附性与可传递性(B)知识性与共享性(C)共享性与价值不定性(D)可传递性与共享性5. 如果分别以检索词a、b、c在某数据库的关键词字段进行检索都能得到相应的检索结果,结果不为0,下面哪个检索式表示检索结果数最少( C )(A)a and b and c (B)a and b or c (C)a or b or c (D)a or b and c6. 根据加工深度来划分文献,学位论文属于(B )(A)零次文献(B)一次文献(C)二次文献(D)三次文献7. CNKI 是以下哪一种称谓的简称( C )(A)清华同方(B)重庆维普(C)中国知识基础设施(D)中国期刊全文数据库8. 扩大检索范围的方式是(B )(A)使用“逻辑与”(B)使用“逻辑或”(C)使用“逻辑非”(D)使用优先运算符9. 下列能够检索图书信息的数据库是( B )(A)维普《中文科技期刊数据库》(B)万方数据资源系统(C)人大复印报刊资料全文数据库(D)超星数字图书馆10. 下列属于一次文献的正确答案是( C )(A)专刊说明书、索引、文摘刊物(B)期刊论文、私人笔记、百科全书(C)会议论文、科技报告、期刊论文(D)字典、手册、年鉴11. 以下四种信息检索语言中,不受《词表》控制的是( A )(A)标题词语言(B)元词语言(C)叙词语言(D)关键词语言12. 下述各项中,影响数据库质量的是( D )(A)检索式是否正确(B)检索者是否正确分析检索课题(C)检索词的选择质量(D)数据库的信息量13.以下哪个不是纸质文献的记录手段( D )(A)手写(B)油印(C)胶印(D)雕刻14. 国际标准书号是( A )(A)ISBN (B)ISSN(C)CABI (D)CNKI15.我国专利法规定,发明专利的保护期限为( D )(A)专利权人终身享有(B)30年(C)10年(D)20年16. 下列标引中属于内容特征描述的是(A )(A)著者标引、篇名标引(B)文献来源标引、著者工作单位标引(C)分类标引、主题标引(D)文献类型标引、语种标引17. 利用引文追溯法检索文献是指(C )(A)利用数据库查找相关文献的方法(B)利用手工检索刊物查找相关文献的方法(C)利用文献所附的参考文献查找相关文献的方法(D)利用Internet查找相关文献的方法18. 文献记录中的ISSN号是属于( C )(A)内容特征(B)外表特征(C)既可能是内容特征,也可能是外表特征(D)上述答案皆不正确19. IPC是下列哪一种的缩写(D )(A)中国专利索引(B)国际专利分类表(C)美国专利分类法(D)国际标准化组织20. 某条文献记录的内容为“生命之线—基因与遗传工程/(英)苏珊.奥尔德里奇;喻国根等译,---南京,江苏人民出版社,2000.7 ISBN7-214-02750-X,14.00元”,此文献为( C )(A)科技报告(B)图书C)期刊论文(D)会议论文二、多项选择题(每小题1.5分,共15分)1. 下列几种网络中有哪些是属于中国的四大骨干互联网?(CBD )(A)中国国际经济贸易互联网、(B)中国科学技术网(C)中国教育和科研计算机网(D)中国公用计算机互联网2. 在下列文献信息标引中,属于外表特征有:(ABC )(A)分类号(B)文献篇名(C)主题词(D)作者工作单位3. 在人类历史的发展进程中,与信息技术直接相关的重大发明是(AB )(A)电报(B)电话(C)汽车(D)蒸气机4. 国际著名三大标准组织是:(ABC )(A)国际标准化组织(B)国际电工委员会(C)国际电信联盟(D)美国国家标准学会5. 标准按照其使用范围划分包括有(AB )(A)国际标准(B)国家标准(C)法定标准(D)推荐标准6. 以下不属于二次文献的是(ACD )(A)私人笔记(B)设计草图(C)实验记录(D)目录7. 以文献外部特征为检索途径的有:(CD )(A)题名途径(B)机构途径(C)分类途径(D)著者途径8. 下列属于专利权特征的有:(BD )(A)独占性(B)创造性(C)时间性(D)新颖性9. 信息筛选是对原始信息进行(ABCD )(A)检索(B)挑选(C)鉴别(D)收集10. 期刊论文的文献出处包括(AC )(A)作者(B)作者工作单位(C)刊名(D)年卷期三、填空题:(每题2分,共30分)1. 构成文献的三要素是知识信息、载体材料、信符号和记录方式。