信息检索复习讲解

  • 格式:doc
  • 大小:228.51 KB
  • 文档页数:12

下载文档原格式

  / 12
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《医学信息检索教程》复习(研)

第一部分信息与信息检索基础

1.根据文献的定义判断某一事物是否是文献。P3文献信息资源是以语言、文字、图像、声频、视频等方式记录在特定载体上的信息资源,简称为文献。信息资源是文献的实质内容,载体是文献的外在形式,符号、文字、声音等是人体感觉信息的媒介,记录是把知识存附在载体上形成文献的手段。其最主要的特征是拥有不依附于人的物质载体。

2.从出版形式和内容两方面考虑图书和期刊的区别。P3时效性:图书不如期刊;成熟度:期刊不如图书。图书通常提供比较系统、成熟的知识,一般包括专著、教科书、丛书、论文集和参考工具书等。期刊也叫杂志,是指具有相对固定的刊名、编辑机构及版式装帧的连续出版物,如美国的《Science》。期刊的内容通常是能反映学科领域最新的理论、方法、技术的论文、综述、病例报告等。

3.特种文献包括哪几种?电子文献包括哪几种?P3—P4 特种文献包括:政府出版物;会议文件;专利文献;科技报告;技术标准和规范;学位论文;其他(报纸、手稿、内部刊物、病历档案、技术资料、产品样本)。电子文献包括:数据库、网络文献、印刷型文献的数字化。

4.一次文献和二次文献的定义及举例。P4一次文献即原始文献,是作者以生产或科研成果为依据而创作的原始文献,如专著、期刊论文、研究报告、学位论文、发明专利等。二次文献是根据一次文献的内容和外表特征进行加工整序后的文献,如目录、索引、文摘、书目数据库、搜索引擎。

5.狭义和广义信息检索定义的区别。P5广义的信息检索包括信息的存储和信息的检索,往往又称为“信息存储与检索”。狭义的信息检索是指人们从任何信息系统中高效、准确地查找到自己所需的有用信息,而不管它以何种形式出现,或借助于什么样的媒体。

6.按信息检索的对象分类,信息检索可分为哪几类?P6文献检索、数据检索、事实检索。后两者是一种确定性检索,其检索结果可以直接回答有或无。

7.按信息组织的方式分类,信息检索可分为哪几类?P6目录检索、题录检索、文摘检索、全文检索、超文本检索、超媒体检索。

8.目录检索和题录检索有什么区别?P6 目录检索可了解某一单位或数据库是否收藏有所需的图书或期刊等出版物;题录检索是以出版物中的单篇文献为检索结果。

9.信息检索语言的定义和类型。P7—P9信息检索语言是为建立信息检索系统而创建的专门用来描述文献特征(内容特征或外表特征)和表达检索提问的一种人工语言,又称为信息存储与检索语言、标引语言、索引语言等。类型:1.分类检索语言(中图分类号属于中国最普遍);2.主题词检索语言(主题词法;关键词法两者最多)。

10.我国使用最普遍的分类检索语言是什么?《中国图书馆分类法》P7

11.《中图法》有几个基本大类?医药卫生类的分类号是什么?P8 22个基本大类“R 医药、卫生”类下分17个二级类目。

12.医药卫生二级类目有哪些?P8中药学、护理学、肾脏疾病分别归入哪个二级类目?R2;R4;R6(CNKI首页→跨库高级检索→左侧总目录→医药卫生→R2中国医学R4临床

医学:诊断学、治疗学、护理学、临终关怀学、康复医学R6外科学:外科病理学、解剖学、泌尿科学等。)

13.主题词和关键词的区别。P9主题词又称叙词,是以规范化为基础,以揭示事物对象及其特征为出发点的信息检索语言。关键词是指出现在文献的题名、摘要或全文中,能够反映文献主题内容的专业名词或术语。关键词直接取自原文,不做规范化处理,可以提供更多的检索入口,适合计算机系统自动编制索引的需要,但由于词语没有规范化,不能进行选择和控制,容易造成漏检和误检。

14.美国国立医学图书馆《医学主题词表》的英文全称和简称。

P9 Medical Subject Headings, Mesh

15.文献的内容特征和外表特征。P12—P13 内容特征:指文献所论述的主题、观点、见解、结论及文献内容所属的学科范围,通常使用主题词、关键词或分类号等形式来表达文献的主题概念,揭示文献的内容特征,并建立严格有序的排检序列,为检索者提供重要的检索途径;外表特征:包括题名、作者、出版者以及某些特种文献自身的特征标识,如专利号、标准号、报告号等。

要求会判断某一检索途径是属于内容特征,还是外表特征?CNKI内容特征:主题、摘要、关键词、全文、参考文献;外表特征:题名、作者、第一作者、作者单位、来源、基金。16.掌ISBN号各数据段的含义。ISBN国际标准书号,P14

第二部分网络基础和搜索引擎

1.局域网、广域网和城域网的地理范围。P21分别是几十米到几千米、几十到几千公里、介于局域网和广域网之间。

2.我国七大主干网络的名称。P24中国科技网CSTNET,中国教育科研网CERNET; 中国公用计算机互联网(ChinaNET);中国金桥信息网(CHINAGBN);中国移动互联网(CMNET);中国联通互联网(UNINET);中国网通(CNC)

3.统一资源定位器的含义和组成。P31统一资源定位器URL用来定位信息资源所在位置,描述了浏览器检索资源所用的协议、资源所在的计算机的主机名以及资源的路径和文件名。Web中每一个页,以及每页中的每个元素也都有自己唯一的URL。标准的URL由访问的协议类型、主机名、端口号、文件目录、文件名组成。

4.什么是万维网?P31 WWW简称3W或万维网,是一个基于超级文本方式的信息查询工具,它将位于全世界Internet网上不同网址的相关数据信息有机地编织在一起,并通过浏览器提供一种友好生动的图形查询界面。浏览器是利用WWW的工具,代表性的有美国微软公司的Internet Explorer和美国网景公司的Netscape Navigator。

5.搜索引擎的类型及其工作原理。P61—P63类型:根据检索内容:综合性、专业性;根据检索功能:目录式、全文式(网页级)、智能式(FAQFinder);根据搜索范围:独立、元搜索引擎。

原理:P60通过自动索引程序或人工广泛搜集网络……

6.雅虎是最早的搜索引擎;Google是目前影响最大的综合性搜索引擎。

Google

检索网页数量达80亿,搜索引擎中排名第一;