当前位置:文档之家› 第1章信息检索概论

第1章信息检索概论

文献检索概述

《教育研究方法导论》笔记:第五章 一、文献检索概述 (一)文献:指记录有知识的一切载体,即以载体形式传递知识 教育科学文献是记载有关教育科学的情报信息和知识的载体。 (二)文献检索在教育研究中的作用 1、全面正确地掌握所要研究问题的情况,帮助研究人员选定研究课题和确定 研究方向 2、为教育研究提供科学的论证依据和研究方法 3、避免重复劳动,提高科学研究的效益 二、教育文献的种类及主要分布 (一)文献的等级 1、一次文献。包括专著、论文、调查报告、档案材料等以作者本人的实践为依据而创作的原始文献,是直接记录事件经过、研究成果、新知识、新技术的文献,具有创造性,有很高的直接参考和借鉴使用价值,但它贮存分散,不够系统。 2、二次文献。是对原始文献加工整理,使之系统、条理化的检索性文献,一般包括题录、书目、索引、提要和文摘等。二次文献具有报告性、汇编性和简明性,是对一次文献的认识,是检索工具的主要组成部分。 3、三次文献。是在利用二次文献基础上对某一范围内的一次文献进行广泛的深入的分析研究之后综合浓缩而成的参考性文献,包括动态综述、专题述评、进展报告、数据手册、年度百科大全以及专题研究报告等。这类综述性文献全面,浓缩度高、覆盖面宽、信息量大、内容新颖.即有综合性、浓缩性和参考性特点。教育科学文献的特点:内容广泛,数量众多。学科复杂。相互交叉渗透,系统性、积累性和继承性强。文献类型以专著论文、研究报告为主。 (二)教育文献的主要分布 1、书籍 包括名著要籍、教育专著、教科书、资料性工具书(如教育辞书和百科全书)及科普通俗读物。它是教育科学文献中品种最多、数量最大、历史最长的一种情报源。名著要籍指一个时代、一个学科、一个流派最有影响的权威著作,如马克思主义经典作家论教育,中外古今著名教育家、哲学家的教育名著等。它们是人类文化的瑰宝,是治学和研究的基石,因而大都作为必读书、必备书收入各种导读书目。专著(包括论文集)是就教育领域某一学科、某一专门问题进行系统全面深入的论述,内容专深,大多是作者多年研究成果的结晶。专著一般就某个问题发展历史和现状,研究方法和成果,不同学派的观点和争论,以及存在的问题和发展趋势加以论述,并附有大量的参考文献和书目。专著中阐明了作者自己的独到见解,介绍了新颖的材料,通常反映学术研究的最新进展,论述较系统,形式较规范。论文集往往是汇集了许多学者的学术论文,问题集中,论点鲜明,情报容量大,学术价值高。如瞿葆奎先生主编的26卷本大型《教育学文集》则属此种类型。 教科书是专业性书籍,具有严格的科学性、系统性和逻辑性。内容一般包括教育科学的基本理论、基础知识、学科领域内的科研成果以及讨论的问题。要求

《信息检索导论》课后习题答案

《信息组织与检索》作业答案 第一章布尔检索 习题1-2 考虑如下几篇文档: 文档1 breakthrough drug for schizophrenia 文档2 new schizophrenia drug 文档3 new approach for treatment of schizophrenia 文档4 new hopes for schizophrenia patients a. 画出文档集对应的词项—文档矩阵; b. 画出该文档集的倒排索引(参考图1-3中的例子)。 Term-Documentmatrix: 1234 approach0010 breakthrough1000 drug1100 for1011 hopes0001 new0111 of0010 patients0001 schizophrenia1111 treatment0010 Inverted Index: approach -> 3 breakthrough ->1 drug ->1->2 for ->1->3->4 hopes ->4 new ->2->3->4 of ->3 patients ->4 schizophrenia ->1->2->3->4 treatment >3 注意:倒排索引中的词表(dictionary)和每个词项的倒排列表(posting list)需要排序,便

于查找。这里我们暂不考虑词的正规化处理(如hopes->hope)。 补充习题1 写出AND查询的伪代码 ●面向过程风格的伪代码: 给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId查询结果存放在answer列表里。 这里应用了“化归”思想(将新问题转化归为旧问题来解决)。这里,比较两排序列表的首元素,排除较小的docId(不可能有匹配)后,我们构造出新的剩余列表,再次进行两列表的首元素的比较。 While p1 != null AND p2 != null If p1->docId==p2->docId //对两(剩余)列表的首元素进行比较 insert(answer, p1); p1=p1->next;//构造新的剩余列表,迭代执行 p2=p2->next;// Else if p1->docId < p2->docId p1=p1->next;//p1->docId不可能有匹配;构造新的剩余列表 Else p2=p2->next;//p2->docId不可能有匹配;构造新的剩余列表 End ●面向对象风格的伪代码: 注:为一个数据结构(对象)定义方法,通过方法操作自己的内部数据(List对象里隐含包含了一个成员变量,它是真正的链表或变长数组)。 While list1.currentItem() != null AND list2.currentItem() != null If list1.currentItem().getDocId() == list2.currentItem().getDocId() answer.insert(list1.currentItem()); list1.moveToNext(); list2.moveToNext(); Else if list1.currentItem().getDocId() < list2.currentItem().getDocId() list1.moveToNext(); Else list2.moveToNext(); End

文献检索期末复习完整版

第一章绪论 1.文献检索(information retrieval)是指收集整理文献并按一定方式组织和存储,同时根据用户的信息需求查找出相关信息的过程,又称为“文献存储与检索”。狭义的文献检索是指根据用户信息需求,利用检索工具或检索系统从文献信息集合里找出用户所需文献的过程。 2. 文献检索语言是根据文献检索需要而人工规范的语言系统,用来描述文献特征和表达信息检索提问的一种专用语言,供信息标引以及文献检索时使用。 3.文献指以文字、图像、公式、声频、视频、代码等手段将信息、知识记录或描述在一定的物质载体上,并能起到存贮和传播信息情报和知识作用的一切载体。 三个基本要素:内容上的知识或信息;揭示和表达知识信息的标识符号;记录信息符号的物质载体。 4. 信息素养 又称为信息素质,是伴随着社会信息化的形成和发展而出现的一个名词术语,指具有检索、分析、评价和利用各种信息源以解决信息需求及制定明智决策的能力,是对个人信息行为能力、独立学习能力以及批判性思维能力等概括性描述。 第二章医学文献信息资源 1.按文献内容的加工深度和内容性质划分 一次文献、二次文献、三次文献、零次文献 (1)零次文献零次文献指未经正式发表或未进入正式交流的最原始的文献。(2)一次文献是指作者以其本人的研究成果(如实验、观察、调查研究等的结果)为基本素材写成的原始创作,如专著、期刊论文、科技报告、学位论文等。

(3)二次文献是将大量无序分散的一次文献收集、整理、加工、著录其特征(如著者、篇名、分类、主题、出处等),并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式,如索引、文摘、目录以及其相应的数据库等。因其具有检索功能而称为检索工具或检索系统。 (4)三次文献是科技人员围绕某一专题,借助二次文献,在充分研究与利用大量一次文献的基础上,经过阅读、分析、归纳、概括,撰写而成的新的文献。 表现形式主要有:综述(Review)、述评(Comment)、进展(Progress、Advance)、现状(Update)、发展趋势(Trend)等期刊文献、百科全书、年鉴、手册等参考工具书。 2. 其中《中图法》具有比较突出的优点,已为大多数图书馆所取用。 3. 图书馆目录目录是著录一批相关文献,并按照一定次序排列而成的一种揭 示与报道文献的工具。 4. 查找馆藏图书的方法一般有两种,一种是直接进开架书库或阅览室到书架上 查找,另一种方法是先利用馆藏目录查到要找图书的索书号,再根据索书号到书库中索取。 5. 参考工具书类型 参考工具书:是根据一定需要以特定的编排形式和检索方法,为人们迅速提供某方面的基本知识或资料线索,专供查阅的特定类型的图书。 ?特点具有知识性、资料性、检索性。 ?按编辑体例与功用分:字典、词典、年鉴、手册、类书、政书、百科全书、表谱、图录、名录等。 ?按内容分有综合性的、专科性的; 6.馆际互借

文献检索概论习题

信息、知识与情报 信息:客观世界中各种事物的变化和特征的最新反映,以及经过传递后的再现。 信息是通过一定的物质载体形式反映出来的,是事物存在的状态、运动形式、运动规律及其相互关系、相互作用的表象。反映每件事物不同的运动状态和特征,分为自然信息、生物信息、电子信息、社会信息等。 知识:系统化、理论化的信息。 情报:人们在一定时间内为一定的目的而传递的有使用价值的信息或知识。 文献:记录有知识的一切载体。 一、文献的构成: 四要素:文献信息文献载体符号系统记录方式 二、医学文献的特点: 1、数量庞大 2、载体多样化 3、多文种化 4、学科交叉、出版分散 5、知识信息更新加快 6、交流传播速度加快 7.、电子化发展趋势 三、文献检索: 1概念:将文献按照一定的方式集中组织和存储起来,并按照文献用户需求查找出有关文献或有关文献中包含的信息内容的过程。 2类型: 1)检出结果的形式: 书目检索 全文检索 引文检索 2)情报检索角度 文献检索 数据检索 事实检索 3)检索手段 手工检索 计算机检索 3、外表特征:也成为自然标识,包括标题、作者、来源、卷期、页次、年月、 类型、号码、文种等项目。 4、内容特征:也称为人为标识、是指文献论述的主题及文献的中心内容,如主 题词、分类号、类目名称、文摘。 5、在计算机检索系统中,也就是检索数据库中,每一种文献特征称为字段,文

献特征标识就是字段值,所有的文献特征即构成一篇文献的题录 或文摘。 四、文献检索系统的评价: 1、报道信息的准确性 2、报道信息的及时性 3、索引体系的完善程度 4、对信息标引的深度 5、查全率与查准率 查全率(R)和查准率(P)是检索系统最为流行和重要的两个性能和效果评价标志。 R=检出的相关信息量/检索工具中相关信息总量X100% P=检出的相关信息量/检出的信息总量X100% P和R之间存在互逆关系,如果R较高,P将相对下降;反之亦然。两者只能相对提高,两者永远不可能达到100% 五、文献信息的类型: 1、按文献信息表现形式划分: 文字型、视频型、音频型、数字型 2、文献信息出版类型: 图书、期刊、政府出版物、科技报告、专利文献、会议文献、学位论文、标准文献、产品样品说明书、技术档案、报纸、新闻稿、统计资料、病案等3、文献信息的载体形式: 印刷型、缩微型、声像型、电子型 4、文献信息的加工程度: 零次文献信息:未公开或非正式 一次文献信息:原始资料 二次文献信息:检索工具 三次文献信息:综述研究类和参考工具类 六、电子文献资源: 1概念:以电子数据的形式把文字、声音、图像、视频等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的形式传输,并通过 网络通信、计算机或终端和其他外部设备等方式再现出来的一种新型文 献资源。 2特点: 存储介质和传播形式的改变 信息的表现形式多样化 文献资源类型多种多样 多层次的信息服务功能

信息检索导论王斌译第一章课后习题答案

习题1-1 forecasts 1 1 home 4 1 2 3 4 in 2 2 3 increase 1 3 july 3 2 3 4 new 2 1 4 rise 2 2 4 sales 4 1 2 3 4 top 1 1 把所有文档中的词抽取,按顺序排序。倒排记录也要按顺序排列,文档频率(几个文档中出现该词)要写 习题1-2 A题 1 2 3 4 approach 0 0 1 0 breakthrough 1 0 0 0 Drug 1 1 0 0 For 1 0 1 1 Hope 0 0 0 1 New 0 1 1 1 Of 0 0 1 0 Patient 0 0 0 1 Schizophrenia 1 1 1 1 Treatment 0 0 1 0 矩阵行是词,按顺序排列;列方向是文档编号。某文档出现某词,相应位置填1,否则填0 B题 Approach 1 3 Breakthrough 1 1 Drug 2 1 2 For 3 1 3 4 Hope 1 4 New 3 2 3 4 Of 1 3 Patient 1 4 Schizophrenia 4 1 2 3 4 Treatment 1 3 习题1-7 1.Kaleidoscope OR eyes 87009+213312 2.Marmalade OR skies 107913+271658

3.Tangerine OR trees 46653+316812 按估计的记录个数,从小到大的顺序 1 2 4 11 31 45 173 174 P 2 31 54 101 Q 1 1 2 4 11 31 45 54 101 173 174 相等把文档编号添加到结果集,两个一起往后移;不相等小的往后移 习题1-10 Answer <- <> While p1!=Nil or p2!=Nil Do if docID(p1)=docID(p2) Then Add(answer,docID(p1)) P1<-next(p1) P2<-next(p2) Else if docID(p1)

信息检索教程期末测验试卷 (含答案)

河北北方学院2014-2015学年第二学期期末考试试卷 《网络信息检索》 注意事项: 1.请按要求在试卷的密封区填写专业、班级、姓名和学号。 2.请仔细阅读各种题目的答题要求,在规定的位置填写答案。 3.不要在试卷上乱写乱画,不要在密封区填写无关的内容。 总分合计人: 复核人: 一、单项选择题 (共15题,每题3分。) 1. URL 指的是:( B ) A .万维网 B .网址 C .域名 D .超文本 2. 域名.edu 表示:( B ) A.商业组织 B. 教育机构 C.非营利组织 D. 信息服务单位 3.下列哪个途径是从文献的内部特征进行检索的?( D ) A. 刊名途径 B. 号码途径 C. 作者途径 D. 分类途径 4. 下列哪种对象检索属于相关性检索:( A ) A.文献检索 B.数据检索 C.事实检索 D.超媒体检索 5. 学位论文属于:( B ) A.零次文献 B.一次文献 C.二次文献 D.三次文献 专业_ ___ ___ _ 班级________ 姓名__________ 学号 _ ___ ___ _ …… ……… … … …… …………… …密 ……… …… … … … … … … … … 封 … … … … … …… …… …… …… …… 线 … …… …… …… … … …… … … … … ……

6. 在数据库中字段标识符AB代表:( B ) A. 题名 B. 文摘 C. 关键词 D. 作者 7. 以下哪个检索式查出的文献数量最多? ( B ) A. a and b and c B. (a or c)and b C. a and b or c D. a and c 8. 当需要评价某人的科研学术成就,评价某种期刊的质量,评价某一组织机构的科研水平时,应尽可能采用( B )进行检索。 A.电子期刊全文数据库 B.引文数据库 C.电子书 D.文摘数据库 9.在外文数据库进行作者检索时,作者姓名的正确书写格式为:( A ) A. 姓在前(全称)名在后(全称) B. 姓在前(全称)名在后(缩写) C. 名在前(全称)姓在后(全称) D. 名在前(缩写)姓在后(全称) 10. 在我国检索时主要依据的分类体系为( B ) A. 杜威分类法 B. 中图法 C. 人大法 D. 分类法 11. 二次检索指的是:( C ) A. 第二次检索 B. 只能检索两次 C. 在上一次检索的结果中,再一次进行的检索 D. 与上一次检索的结果进行对比,得到的检索 12.检索文献数据库时,下列哪种方法不能扩大检索范围:( C ) A. 用OR连接同义词 B. 调整位置算符,由严变松 C. 多用题名字段限制 D. 删除不重要的概念,减少and连接 13.下面哪个检索式的作用与短语检索"digiatal camera"等价: ( A )。 A. digiatal (W) camera B. digiatal (N) camera C. digiatal AND camera D. digiatal OR camera 14. 按学科属性检索文献,最好选用哪种途径:( C ) A. 引文途径 B. 主题途径 C. 分类途径 D. 著者途径 15.下列哪项信息服务是读秀电子图书系统可提供的服务( B ) A. 馆际互借 B. 文献传递 C. 定题服务 D. 个性导读

“中医药文献检索常用工具及检索方法”答案

中医药文献检索常用工具及检索方法 《中医药文献检索》概论 1、检索工具按著录方式及揭示内容程度分类,不包括的类型是(C) A、目录型检索工具 B 、题录型检索工具C卡片式检索工具 D、文摘型检索工具 2、(D)首次以“文献” 一词命名自己的专著《文献通考》 A、苏天爵 B、欧阳贞C 、揭篌斯D马端临 3、下列属于按不同记录方式分类的文献是(C) A、专利文献B 、会议文献C电子型文献D、光盘文献 4、一次文献,是指(D) A、主要包括两方面的内容,一是形成一次文献以前的知识信息,二是未经正式发表的原始文献,或未正式出版的各种书刊资料 B、根据二次文献所提供的线索对某一范围的一次文献加以集中、浓缩,系统整理并且概括论述形成的文献 C、对一次文献进行加工整理后的产物,其主要类型有目录、索引、文摘这些用以查找一次文献的工具 /、 D、作者本人以科研生产工作中取得的科技成果作为依据而撰写创作的原始文献 5、文献四要素中的符号系统指的是(A A、信息的携带者 B 、文献的外在表现形式 C、文献的思想内容,即文献所记录的知识 D 、文献的符号进入载体的方法和过程 6、下列关于文献与文献信息的说法错误的是(C) A、文献信息是以文献为载体的信息 B、文献和文献信息是表征同一事物的两个方面 C、文献信息是存储信息的物质形态的概括,即它的物质属性 D、文献记录了人类文明产生和发展的轨迹,存储了社会发展的知识信息,为人类社会的前进保存了文化积累 7、访谈的形式属于(A) A、零次文献B 、一次文献C、二次文献D、三次文献 8、纸制型文献一般以(B)为母体,母本采用光学摄影技术,把文献的体积缩小,固化到感光材料或者其他载体上 A、手写型文献 B、印刷型文献C 、电子型文献D 、声像型文献 9、下列关于检索工具的说法错误的是(B) A、用以报道、存贮和查找文献线索的工具 B、是附有检索标识的某一范围文献条目的集合,是三次文献 C、大多数检索工具为定期、不定期的连续出版物,所以又称为检索刊物 D、目前医学文献检索工具已从传统的手工检索工具发展为以计算机网络检索系统为主 10、按不同载体分类的文献的种类不包括(B) A、纸质型文献 B、印刷型文献C 、微缩型文献D 、磁盘文献 中文医药论文检索 1、CBM-Web<(C)检索系统具有良好兼容性 A、万方数据库 B 、CNKI数据库C、PubMed D 、维普数据库 2、可以全方位了解作者的主要的研究领域、研究成果、研究对象等情况,可以专一的研究某一个作者的整体情况的检索方式是(B) A、标准检索 B、作者发文检索 C 、来源期刊检索D、科研基金检索 3、我国中文医药论文的检索系统于上世纪(C)年代起步 A、60 B 、70 C 80 D 、90 4、下列不属于中国生物医学文献数据库特点的是(A)

文献检索学生版

中医药文献检索 绪论 一、本学科出现的学科背景 1、科技文献激增知识爆炸信息危机 2、中医药方面文献分布日益分散各学科相互渗透新兴学科 3、藏与用的矛盾载体类型 文献检索――指从众多的文献中迅速而准确地查找出符合特定需要的文献或某一问题的答案。 目的:获得情报 二、中医药文献检索的意义 1、促进文献资源的开发 中医药文献信息资源需要文献信息检索技能这把金钥匙 2、提高科研效率 1988年国家科委明文规定,所有科研项目在立题审查和成果鉴定时,必须有情报部门出具该项目的检索查新报告。反映该项目的新颖性、创造性和可行性。 3、培养新型人才的需要 4、信息意识的培养促进中医药事业的发展 三、学习方法 课堂讲授+检索实习+上机实践 第一章中医药文献概论 一、文献概述 信息:事物运动状态和运动方式的反映。 知识:人们在改造客观世界的实践中所获得的认识和经验的总和。 情报:知识经传递而起作用的部分。 文献:用文字、图像、符号、声频、视频等手段记录下来的一切知识的载体。 文献――记录有知识的一切载体。 构成文献必须具备四个要素:知识、载体、记录方式、出版形式。 载体:甲骨文的龟甲,竹木片,纸张,磁带,胶卷,光盘,U盘,移动硬盘等。 记录方式:手写,印刷,机录,光感等。 出版形式:图书、期刊、专利说明书等。

信息、知识、情报、文献之间的关系 二、中医药文献的演变历史 中医药文献:知识范畴属于中医药学领域的文献 中医古籍 辛亥革命(1911年) 中医现代文献 中医药古籍:以抄写和雕版印刷为主要记录手段而形成的医药文献。 1. 秦汉三国以前 《黄帝内经》引用古代医书21 种 殷墟出土的甲骨文,3000多年历史 两汉,竹简、帛书广泛使用《黄帝内经》、《神农本草经》、《伤寒杂病论》 2.两晋、隋唐时期 ⑴开始有组织的编撰医书 公元610年 隋太医博士巢元方《诸病源候论》 公元657年 唐太医署医官苏敬《新修本草》 ⑵出现综合性著作 唐 孙思邈 《千金要方》《千金翼方》 ⑶涌现不少专科著作 晋代 皇甫谧 《针灸甲乙经》 唐代 昝殷 《经效产宝》 隋唐 《颅卤经》 3.宋金元时期 印刷术 金元四大家:寒凉派 刘完素 火热论《素问玄机原病式》 攻下派 张从正 攻邪论《儒门事亲》 补土派 李杲 脾胃论 《脾胃论》 文献 记录 记录 情报 知识 事物 信息 产生 大脑加工 传递利用 传递利用

工程信息检索教程(第二版)-第一章答案-王知津

第一章基础篇 习题 1、简述信息检索的含义。 就信息检索这个概念而言,使用这个术语的不同使用者有不同的理解和解释,大体上可以分为两类: 第一类是广义的,是指将有用信息按照一定的方式组织存放起来,当用户需要这些信息时,再把它们从存放的地方查找和提取出来。因此,广义的信息检索是包含“存储”和“检索”这样两个阶段和过程,缺一不可。 第二类是狭义的,是指按照一定的方式从现有的信息集合或数据库中,找出并提取所需要的信息。可见,狭义的信息检索仅指“检索”这一个阶段或过程。 2、简述信息检索的基本原理。 广义信息检索的基本原理如图1-1所示。 图1-1 广义信息检索基本原理 在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中搜集有用信息,对有用信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用信息组织成可供检索用的数据库,并存储在定的介质上。 检索是存储的相似过程。信息用户在工作、学习和生活中产生了信息需求,为了检索并获取自己所需要的信息,用户必须对自己的需求进行主题内容的分析,找出能够全面、准确表达主题内容的概念,也要借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的检索规则和方式,制定检索策略,构造检索式,从数据库中查找并获取自己所需要的信息,最后,输出检索结果。当然,检索的全过程还应当包括对检索结果进行评价、反馈,或许还有重新制定检索策略,重新构造检索式,反复进行检索,直至检索出满意的结果为止。 狭义信息检索的基本原理就是广义信息检索中信息检索过程的那部分原理。 信息检索基本原理中的核心部分是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关系之间的比较和匹配机理。两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。 3、简述信息检索的类型和特点。 按照检索对象划分,包括文献检索、数值检索和事实检索。文献检索的对象是文献,

文献检索概述

文献检索概述 第一节文献检索概念 一、文献的概念、特点和作用 (一)文献的涵义 “文献”一词最早出现于《论语·八佾》之中:“夏礼吾能言之,杞不足徵也;殷礼吾能言之,宋不足徵也;文献不足故也,足,则吾能徵之矣。”南宋朱熹在《四书章句集注》中,对文献解释说:“文,典籍也,献,贤也。”其意思指典籍和贤人的言论为文献。宋元马端临在其《文献通考》自序中说:“凡叙事则本之经史,而参之以历代《会要》以及百家传记之书,信而证者从之,乖异传疑者不录,所谓‘文’也。凡论事则先取当时臣僚之奏疏,次及近代诸儒之评论,以至名流之燕谈、稗官之记录,凡一语一言可以订典故之得失、证史传之是非者,则采而录之,所谓‘献’也。”他把文献解释为:录之于书本的文字可称之为“文”,而传之于口的言论则称之为“献”。 《辞海》(1979年版)对“文献”一词所下定义为:“专指具有历史价值的图书文物资料,如历史文献。亦指与某学科有关的重要图书资料,如医学文献。”强调了文献的历史继承性,认为只有“图书文物资料”才可以称之为文献,而贤者言论则不在文献的范畴之内。 随着社会的发展,科学技术的进步,文字记录的方式和记录的载

体发生了巨大变化,文献其本身的含义也发生了很大变化,它不仅包括传统上的刻、写和印刷,而且还包括胶卷、胶片、音频、视频、数字载体的文献。因此,我国根据出现的新情况,于1983年颁布实施的《中华人民共和国国家标准文献著录总则》中,把文献定义为“记录有知识的一切栽体”。文献的定义在于利用各种不同的技术,把知识记录在一切能记载知识的载体上。知识信息必须通过文献进行存储和传递,所以,构成文献内核的知识信息,负载知识信息的物质载体和记录知识信息的符号和技术称之为文献的三个构成要素,缺一不可。知识决定文献内容,载体决定文献的物质形态,而记录知识的技术手段,包括文字、符号、图形、声频、视频、数字等把知识物化在不同载体之上,构成论文、科技报告、档案资料等常见的纸质印刷品,而且还包括胶卷、胶片、影音磁带、磁盘、光盘、硬盘等以实物形态存在的各种文献资料。 文献的基本属性: 1、知识性。知识性是文献的本质,文献存在的意义在于记录知识,存储知识,离开了知识,文献也不复存在。 2、传递性。知识要通过文献进行交流、传递,文献记载的知识能够通过时空进行传递,传授给不同时间和地点的信息接受者,并使知识在传递中不断得到优化,促进新知识的产生。 3、动态性。文献本身的含义也在发生变化,随着时代的发展,不断赋予它新的含义,记载知识的载体、技术和内容也在不断发生变化,由于文献的存在,它静静地、无声无息地推动着社会和科学技术的发展变化。

第一章文献检索绪论

医学信息检索练习题 主编:华北煤炭医学院医学信息检索教研室 第一章绪论 一、名词解释: 1.信息资源:可供人类开发利用的各类信息的集合。 2.二次文献:又称检索工具,是对许多无序的、分散的一次文献进行收集整理,著录其特征,并按照一定的顺序加以编排,形成系统,便于检索的文献。 3.关键词:又称键词,是从文献的题名、摘要、章节标题或正文中抽取出来的,具有实质意义,并能表达文献的主题内容的语词,但未经严格规范化处理,因此须有检索者在检索时加以控制使用。 4.主题词:又称叙词,是经人工规范化处理的最能表达文中主题概念的语词,是人工语言。 二、填空题 1. 情报的3个基本要素是:(1) 知识或信息(2) 经过传递;(3) 经过用户使用产生效益. 2. 文献检索的方法主要有:(1) 顺查法(2) 倒查法(3) 抽查法(4) 追溯法 3. 情报源于:知识,知识源于:信息,文献:是信息、知识、情报的主要载体形式。 4. 按文献内容的加工级次分类,文献分为(1) ________;(2)_________;(3)________。 5. 主题检索语言主要包括______________________和______________________两类词。 6.信息的特征主要表现为信息具有⑴_______;(2)_______;(3)________;(4)________⑸ _________;⑹________;⑺_________。 7. ___________是经过人类选取、组织、序化的有用信息的集合。 8.二次文献是图书情报机构组织人力物力编辑出版的,其主要功能是 __________________________。 9.一次文献又称原始文献,主要包括______、______、______、______等。 10.三次文献是利用______并在其指引下,对大量的______进行综合分析、加以浓缩和提 炼而写成的文献,是在______的基础上进行在创作的成果。 11.根据检出内容的详略,文献检索分为_______________和_______________。 12.常见的检索途径主要有:(1)_______;(2)_______;(3)________;(4)________

文献信息检索第1章 习题与答案

第1章文献信息基础知识 1.简述什么是文献及文献类型。 答:文献是用各种形式的载体记录下来的一切有价值的人类知识,是以文字、图形、符号、声频、视频等手段记录和传播人类最宝贵的物质和精神文化的载体,即文献是记录有知识的一切载体的总称。 文献类型: 1)按文献信息资源载体形式进行划分:印刷型、缩微型、电子出版物、声像资料和网络出版物; 2)按文献出版类型划分:图书、期刊、报纸、科技报告、会议文献、专利文献、学位论文、标准文献、政府出版物、产品样本、档案文献; 3)按文献信息的内容加工层次划分:零次文献、一次文献、二次文献、三次文献; 4)按文献获取方式的明朗程度划分:白色文献、黑色文献、灰色文献。 2.简述按文献出版类型划分图书、期刊等11种文献的相同和不同之处以及各自的特点。 答:相同之处:除了政府出版物、产品样本和档案文献,其他的8种文献均具备著录项目和识别标志;所有文献都属于一次文献,其中除图书、期刊、报纸属传统文献外,其余均属特种文献。 不同之处及特点:每种文献的著录项目和识别标志的内容不同,且每种文献又具备自身的特点,如下: 1)图书:内容较系统、全面、成熟、可靠,但出版周期较长,报道速度相对较慢,具有相对滞后性; 2)期刊:出版周期短、内容新颖、报道速度快、信息含量大、发行面广、能及时传递当代社会和科技的最新信息; 3)报纸:出版周期最短,发行量最大的出版物。以刊载各类最新消息为主,具有内容新颖、影响面宽、报道的内容广泛、和人们的生活息息相关等特点; 1

4)科技报告:反映新技术、新学科较快,内容比较专深、新颖,数据比较可靠,保密性较强。有相当一部分科技报告不公开发行; 5)会议文献:传播信息及时、论题集中、内容新颖、专业性强、质量较高,但其内容与期刊相比可能不太成熟; 6)专利文献:内容翔实、创造性、实用性强、格式规范、流通面广、易于获得; 7)学位论文:理论性、系统性较强,内容专一,阐述详细,具有一定的独创性; 8)标准文献:能较全面地反映标准制定国的经济和技术政策,技术、生产及工艺水平,自然条件及资源情况;具有严肃性、法律性、时效性和滞后性; 9)政府出版物:内容可靠,是了解某一国家的科技政策、经济政策、经济现状、科技活动、科技成果、科学技术水平的重要依据; 10)产品样本:附有实物图片,图文并茂、技术成熟、数据可靠; 11)档案文献:自然形成的第一手材料,内容真实、准确可靠,具有保密性。3.简述网络信息资源的特点及分类 答:网络信息资源的特点: 1)来源广泛、分散无序; 2)更新迅速、变化频繁; 3)内容庞杂、质量不一; 4)数量巨大、形式多样。 网络信息资源的分类: 1)按信息表现形式划分:文本信息;超文本信息;超媒体信息;多媒体信息 2)按信息交流方式划分:正式出版信息;半正式出版信息;非正式出版信息 3)按网络传输协议划分:Gopher信息;Telnet信息;FTP信息;用户服务组信息;万维网(World Wide Web, WWW)信息。 2

医学文献检索笔记

医学文献检索 第一章绪论 1.信息——信息指物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反映,他提供了客观世界事物的消息、知识,是事物的一种普遍属性。医学信息是指通过观察,实验或借助于其他工具,对健康/疾病人体生理或病理状态特征的认识及其反应。 2.知识——是人类在认识和改造客观世界实践中获得的对事物本质的认识和经验的综合,是人们通过时间对客观事物及其运动过程和规律的认识。知识来源于信息,是信息的一部分,即被人们理解和认识并经大脑重新组织和系列化的那部分信息。 3.情报——指人们以各种方式传递与交流的具有一定目的与时效的信息,是人们为一定目的搜集的有使用价值的知识或信息。重要属性有传递性,知识性和效用性。文献交流是情报的主要形式。 4.文献——指以文字、图像、公式、声频、视频、代码等手段将信息、知识记录或秒素在一定物质载体上,并能起到存储和传播信息情报和知识作用的一切载体。文献由三个基本要素构成:内容上的知识或信息,揭示和表达知识信息的标识符号,记录信息符号的物质载体。 5.文献与信息,知识,情报之间的关系 ⑴文献是信息、知识、情报存储、传递、利用的重要方式 ⑵信息可以成为情报,但是一般要经过选择、综合、研究、分析等加工过程,也就是要经过去粗存精、去伪存真、由此及彼的过程 ⑶信息是知识的重要组成部分,但不是全部,只有系统化、理论化的信息才能称作知识 ⑷情报是知识或信息经传递并起作用的部分,即运用一定的形式,传递给特定用户,在一定的时间内产生效用的知识或信息。 7.医学文献信息资源的特点 ⑴数量庞大 ⑵载体多样化 ⑶语言障碍增加 ⑷重复发表、学科交叉与出版分散 ⑸知识信息更新加快 ⑹时滞问题严重 8.《中图法》——采用汉语拼音字母与阿拉伯数字相结合的混合制号码进行编号。分为5大部类,22个基本大类(一级类目)。每个大类用一个大写字母表示。R表示医药、卫生。二级类目中R4表示临床医学。 9.《中图法》的索书号的结构一般由字母数字并和号码组成,前面的为分类号,后面的为著者号或者种次号,分类号反映学科属性,书次号由种次号,版次号和卷次号组成,

文献检索概述

第一章文献检索概述 第一节文献检索概念 一、文献的概念、特点和作用 (一)文献的涵义 “文献”一词最早出现于《论语·八佾》之中:“夏礼吾能言之,杞不足徵也;殷礼吾能言之,宋不足徵也;文献不足故也,足,则吾能徵之矣。”南宋朱熹在《四书章句集注》中,对文献解释说:“文,典籍也,献,贤也。”其意思指典籍和贤人的言论为文献。宋元马端临在其《文献通考》自序中说:“凡叙事则本之经史,而参之以历代《会要》以及百家传记之书,信而证者从之,乖异传疑者不录,所谓‘文’也。凡论事则先取当时臣僚之奏疏,次及近代诸儒之评论,以至名流之燕谈、稗官之记录,凡一语一言可以订典故之得失、证史传之是非者,则采而录之,所谓‘献’也。”他把文献解释为:录之于书本的文字可称之为“文”,而传之于口的言论则称之为“献”。 《辞海》(1979年版)对“文献”一词所下定义为:“专指具有历史价值的图书文物资料,如历史文献。亦指与某学科有关的重要图书资料,如医学文献。”强调了文献的历史继承性,认为只有“图书文物资料”才可以称之为文献,而贤者言论则不在文献的畴之。 随着社会的发展,科学技术的进步,文字记录的方式和记录的载体发生了巨大变化,文献其本身的含义也发生了很大变化,它不仅包括传统上的刻、写和印刷,而且还包括胶卷、胶片、音频、视频、数字载体的文献。因此,我国根据出现的新情况,于1983年颁布实施的《中华人民国国家标准文献著录总则》中,把文献定义为“记录有知识的一切栽体”。文献的定义在于利用各种不同的技术,把知识记录在一切能记载知识的载体上。知识信息必须通过文献进行存储和传递,所以,构成文献核的知识信息,负载知识信息的物质载体和记录知识信息的符号和技术称之为文献的三个构成要素,缺一不可。知识决定文献容,载体决定文献的物质形态,而记录知识的技术手段,包括文字、符号、图形、声频、视频、数字等把知识物化在不同载体之上,构成论文、科技报告、档案资料等常见的纸质印刷品,而且还包括胶卷、胶片、影音磁带、磁盘、光盘、硬盘等以实物形态存在的各种文献资料。 文献的基本属性: 1、知识性。知识性是文献的本质,文献存在的意义在于记录知识,存储知识,离开了知识,文献也不复存在。 2、传递性。知识要通过文献进行交流、传递,文献记载的知识能够通过时

信息检索导论课后习题答案

《信息组织与检索》作业答案第一章布尔检索 习题1-2 考虑如下几篇文档: 文档1 breakthrough drug for schizophrenia 文档2 new schizophrenia drug 文档3 new approach for treatment of schizophrenia 文档4 new hopes for schizophrenia patients a. 画出文档集对应的词项—文档矩阵; b. 画出该文档集的倒排索引(参考图1-3中的例子)。 Term-Documentmatrix: 1234 approach0010 breakthrough1000 drug1100 for1011 hopes0001 new0111 of0010 patients0001 schizophrenia1111 treatment0010 Inverted Index: approach -> 3 breakthrough ->1 drug ->1->2 for ->1->3->4 hopes ->4 new ->2->3->4 of ->3 patients ->4 schizophrenia ->1->2->3->4 treatment >3

注意:倒排索引中的词表(dictionary)和每个词项的倒排列表(posting list)需要排序,便于查找。这里我们暂不考虑词的正规化处理(如hopes->hope)。 补充习题1 写出AND查询的伪代码 ●面向过程风格的伪代码: 给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId查询结果存放在answer列表里。 这里应用了“化归”思想(将新问题转化归为旧问题来解决)。这里,比较两排序列表的首元素,排除较小的docId(不可能有匹配)后,我们构造出新的剩余列表,再次进行两列表的首元素的比较。 While p1 != null AND p2 != null If p1->docId==p2->docId //对两(剩余)列表的首元素进行比较 insert(answer, p1); p1=p1->next;//构造新的剩余列表,迭代执行 p2=p2->next;// Else if p1->docId < p2->docId p1=p1->next;//p1->docId不可能有匹配;构造新的剩余列表 Else p2=p2->next;//p2->docId不可能有匹配;构造新的剩余列表 End ●面向对象风格的伪代码: 注:为一个数据结构(对象)定义方法,通过方法操作自己的内部数据(List对象里隐含包含了一个成员变量,它是真正的链表或变长数组)。 While list1.currentItem() != null AND list2.currentItem() != null If list1.currentItem().getDocId() == list2.currentItem().getDocId() answer.insert(list1.currentItem()); list1.moveToNext(); list2.moveToNext(); Else if list1.currentItem().getDocId() < list2.currentItem().getDocId() list1.moveToNext(); Else list2.moveToNext();

科技文献检索教案

科技文献检索课教案缩编 图书馆王泽琪 第一章绪论及文献检索基础知识 教学目的: 了解科技文献检索的概况和意义,掌握文献检索的基本原理,了解检索的概况和一般特点教学内容分析 教学重点: 十大文献类型、特点及文献识别 检索语言的分类 科技文献检索步骤、文献来源还原、原文索取 教学难点: 十大文献类型西文文献识别 分类语言和主题语言的不同 叙词、关键词语言概念的理解 关键: 学生能掌握十大文献类型的特点,能识别前7个文献类型 学生在检索时能意识到叙词和关键词的不同 尽量使用提供的叙词检索使用关键词检索时应尽量考虑到不同的关键词 教法设计和教学手段: 讲述为主,辅助于电子文稿演示 教学过程:(4课时) 学习文献检索课的意义 知识、信息、情报、文献及文献检索的概念 科技文献的特点及划分 十大文献类型、特点及文献识别(重点、难点) 检索语言(重点为分类、叙词、关键词语言)标引、组配、词间关系 主题词表(重点叙词表) 科技文献检索步骤、文献来源还原、原文索取(重点) 思考题: 1图书、期刊、会议文献、科技报告、学位论文、专利文献的特点有什么不同?如何识别以上六种西文文献? 2叙词和关键词在实际检索时有什么不同?使用时应注意什么? 3检索结果文献来源为非英文的语种如何处理? 教学讲稿 一、为什么要学习文献检索课 1节省查找文献的时间 2促进专业学习和提高 3正确决策,避免重复浪费 如:我国实行科技重新制度

4发挥科技文献的作用,借鉴国外先进科技成果 二、信息、情报、文献与文献检索 三、科技文献 1科技文献的特点 ①数量大、增长速度快 ②内容交叉重复、各学科文献相互渗透 ③失效加快 ④载文聚散,分布有序 2。文献的划分 ①按文献的载体形式印刷型、缩微型、电子型、音像型 ②按信息加工层次 一次文献( ) 二次文献( ) 三次文献( ③按出版类型 四、文献出版类型及其识别 1图书(): 特点:系统全面成熟定型出版时间较长 识别依据:a有书名著者(编者) b有出版地、出版社、出版年(此项最重要) c非第一版的有版次 d有时有号 e常见英语单词, .(). 如:. , ,,1981国际标准书号()由10位数字分成4段组成,各段依次是:地区或语种号-出版商代号-书名号-校验号。其中地区或语种号:英、美、加、南非等英语区为0,其它英语区为1,法语区为2,德语区为3,日本是4,俄语区为5,中国大陆为7,印度等为8,东南亚地区为9。如7-302-02372-7,表示中国大陆代号为302的(清华大学)出版社,出版的一种图书,其书号为02372、该书的校验码为7。 2期刊(、、):俗称杂志(), 定期或不定期出版的报道新技术和新理论的连续出版物。期刊按内容和性质划分,主要有学术性期刊、快报性期刊、检索性期刊等。 特点:周期短、内容新、信息量大、反映信息成果及时、利用率高。 识别依据:a作者和篇名 b刊名常缩写,有时斜体 c 必有卷次号,有的有期号 d有时有号由8位数字分两段组成,如1000-0135,前7位是期刊代号,末位是校验号。我国正式出版的期刊都有国内统一刊号(),它由地区号、报刊登记号和《中图法》分类号组成,如11-22573。地区号依《中华人民共和国行政区划编码表 2260-82》取前两位,如北京为11、天津12、上海31、辽宁21、吉林22等。 记录中英语单词(J.)(.) 3科技报告( ): 是科研技术成果的总结,或是研究过程每一阶段进展情况的实际记录,反映新兴科学和尖端科学的研究成果。代表一个国家的研究水平。各国极为重视。

相关主题
文本预览
相关文档 最新文档