第二章 信息资源及其分类汇编
- 格式:ppt
- 大小:489.00 KB
- 文档页数:150
第二章一、信息需求的确定确定信息内容确定信息的类型:指信息的载体形式二、信息来源的确定信息来源分为四大类:纸质媒介、电子媒介、人和事物如下表所示。
纸质媒介电子媒介人事物辞典百科全书报纸、杂志专业文献日志、传记电话簿黄页、、、、、、广播、电视电子百科全书网站光盘(DVD、VCD、CD)录像带、录音等、、、、、、专业人士知情人当事人朋友老师同学、、、、、、公共场所各类活动、会议事件现场感官直接接触到的具体事物、、、、、、优点:全面、系统不足:查找费力优点:生动、直观不足:需要设备优点:灵活、方便不足:主观、片面优点:直观、真切不足:表面、零散可用的信息来源:信息是决策依据,拥有信息量的多少影响着任务的完成和问题的解决。
在确定信息来源时,要从自身所处的环境和条件出发,尽量拓展信息来源。
可靠的信息来源:为了提高解决问题的效率,一般需要从可利用的所有信息来源中,挑选出最合适、最有效、最可靠的信息来源。
例如,新闻信息的来源以电视、广播、报刊、和网络为佳;而要获取与健康有关的信息,最好查看医学书刊,或咨询医学专业人士、访问医疗保健方面的网站。
三、获取信息的方法阅读法,文献法,访谈法,视听法,实验法,调查法,观察法,问卷法,网络检索法,遥感遥测法、、、、、、1、网络信息检索搜索引擎(search engine)是指自动从因特网上搜集并保存信息,按照一定的规则进行编排以后,提供给用户进行查询的系统。
利用搜索引擎检索信息主要有目录检索和关键词查询两种方式。
目录检索:也称为分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜集到网页的内容,将其网站分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。
目录检索无需输入任何文字,只要根据网站提供的主题分类目录(subject directory或catalogue),层层点击进入,便可查找到所需的网络信息资源。
第一章绪论1.什么是信息资源?信息资源,就是指人类社会信息活动中积累起来的以信息为核心的各类信息活动要素(信息技术、设备、设施、信息生产者等)的集合。
2.信息资源有哪些特征?信息资源作为经济资源,与物质资源和能源资源一样,具有经济资源的一般特征。
这些特征包括:1. 作为生产要素的人类需求性2. 稀缺性 3. 使用方向的可选择性信息资源与物质资源和能源资源相比较,又有诸多的特殊性。
这些特殊性包括:1. 共享性2. 时效性3. 生产和使用中的不可分性4. 不同一性 5. 驾驭性6. 累积性与再生性第二章信息资源管理中的内容管理1.可以根据哪些标准来划分信息资源类型?一,二,三次信息资源之间有何联系?(1)按信息载体划分(按载体材料和存储技术分)印刷型信息资源,缩微型信息资源,声像型信息资源,数字化信息资源(2)按加工深度划分零次信息,一次信息,二次信息,三次信息联系:一次信息是指作者本人的研究工作或者研制成果为依据撰写的,制作和发布的信息,又称为原始文献或者第一手资料。
二次信息是信息工作者对一次信息进行整理,加工,提炼和压缩之后的信息,是为了便于管理和利用大量的,分散的,无序的一次信息,按照一定的方法编辑,出版或者积累起来的工具性信息资源,又称为二手资料。
三次信息是根据一定的目的和需求,在大量利用有关的一,二次信息和其他三次信息的基础上,对有关的信息和知识进行综合分析,提炼,重组,概括而成的信息。
2.文本类信息资源有哪些主要类型?文本类信息资源按出版形式划分,可分为:1. 图书2. 期刊3. 会议文献4. 学位论文5. 专利文献6. 研究报告7. 政府出版物8. 标准文献9. 产品资料10. 文书档案3.数据类信息资源有哪些主要类型?简述各类资源的来源。
经济数据资源,科学数据资源和科学数据共享工程。
4.简述数据挖掘的过程,方法,应用领域。
过程:数据集成→数据简约化→实施挖掘→评价→表示方法:采用较多的技术有决策树,神经网络,遗传算法等。
信息资源管理(马费成赖茂生)复习重点整理信息资源管理第1章绪论小题1、信息:在认识论层次上,我们可以将信息定义为:主体所感知或表述的事物存在的方式和运动状态。
2、信息资源:就是指人类社会信息活动中积累起来的以信息为核心的各类信息活动要素(信息技术、设备、设施、信息生产者等)的集合。
3、依据信息源的层次及其加工和集约程度,信息源可分为一次信息源,二次信息源,三次信息源,四次信息源。
4、依据信息源的内容类别,信息源可分为五类信息源:1. 自然信息源;2. 社会信息源;3. 经济信息源;4. 科技信息源;5. 控制信息源。
5、依据信息源的运动方式,信息源还可分为静态信息源和动态信息源两大类。
6、信息资源作为经济资源的一般特征:1. 作为生产要素的人类需求性2. 稀缺性3. 使用方向的可选择性7、信息资源与物质资源和能源资源相比较特殊性:1. 共享性2. 时效性3. 生产和使用中的不可分性4. 不同一性5. 驾驭性6. 累积性与再生性8、信息资源与物质资源和能源资源一起,已经成为现代社会经济发展的三大支柱。
9、信息资源管理(Information Resource Management,简称IRM),是指管理者(如中央或地方政府部门、企业或事业单位)为达到预定的目标,运用现代化的管理手段和管理方法来研究信息资源在经济活动和其他活动中利用的规律,并依据这些规律对信息资源进行组织、规划、协调、配置和控制的活动。
10、信息资源管理的总目标可以确定为:保证信息资源的开发利用在有领导、有组织的统一规划和管理下,协调一致、有条不紊地进行,使各类信息资源以更高的效率、效能和更低的成本在国家社会进步、经济发展、人民物质文化生活水平的提高中充分发挥应有的作用。
11、信息资源管理活动也可相应地划分为宏观管理、中观管理和微观管理三个层次。
简答1、信息资源管理的主要手段是什么?包括哪些内容?从其性质来划分,信息资源管理的手段主要有技术手段、经济手段、法律手段和行政手段四大类。
信息资源分为哪些类型
1)表⽰⽅式和载体
①⼝语信息资源:以⼝头⽅式表述,演讲授课等⽅式交流利⽤
②体语信息资源:特点⽂化背景下,以表情⼿势姿态表述,以表演舞蹈⽅式表现交流
③实物信息资源:模型样品雕塑等实物进⾏展⽰交流
④⽂献信息资源:⽤⽂字图形,图像,⾳视频等⽅式记录在⼀定的载体上
2) 按信息载体划分:信息资源按载体材料和存储技术可分为
①印刷型信息资源:
以纸质材料为载体,采⽤各种印刷技术把⽂字图像记录在纸上,便于阅读流通存储密度低加⼯难以⾃动化
②缩微型信息资源:
感光材料为载体,利⽤光学缩微技术将⽂字图像记录在感光材料上,存储密度⾼便于收藏阅读设备投资⾼
③声像型信息资源:
磁性和光学材料为载体,磁录光录技术将声⾳和图像记录,密度⾼内容直观表达⼒强易于接受需阅读设备
④数字化信息资源
计算机和存储技术,⽂字图像⾳视频转为数字化信息,磁光盘和⽹络载体等,密度⾼读取快⾼速远距传输
3)按加⼯深度划分
①零次信息
成为⽂献前的信息存在状态即进⾏中的研究,值可能⽐已发表⽂献⾼,可填补某些⾼新技术领域⽂献空⽩。
②⼀次信息
本⼈研究⼯作或成果为依据撰写制作发布。
提供新的知识,直接借鉴参考使⽤价值,检索利⽤的主要对象。
③⼆次信息
对⼀次信息整理加⼯提炼和压缩之后得到的信息,便于管理⼤量分散⽆序的⼀次信息的⼯具性信息⼜称⼆⼿资料。
提供⼀次信息的线索节省查找时间。
④三次信息
根据⼀定⽬的和需求,⼤量利⽤有关⼀⼆次信息和其他三次信息基础上,对有关信息知识综合分析提,重组概括形成,对现有信息知识的再创作再创造,使其进⼀步增值,有综合性参考价值⾼,系统性好的特点。
②弱相关检索强调检索的全面性,用于向用户提供系统完整信息的检索。
这种检索注重查全,要求检索出一段时间期限内有关特定主题的所有信息,为了尽量避免漏检相关信息,一般对于检索的准确性要求较低。
较多的时候,用户对于检索的要求介于两者之间,既要求查找对口的信息,又希望得到所有的信息。
事实上,检索的相关性也往往成为评价检索质量优劣的指标,即查全率与查准率。
查全率是指系统在进行某一检索时,检出的相关信息数与检索库中所有相关信息总数的比率;查准率(Precision Factor)是指系统在进行某一检索时,检出的相关信息数与被检出的信息总数(包括相关信息和非相关信息)的比率。
查全率=被检出的相关信息数/检索库中所有相关信息总数×100%查准率=被检出的相关信息数/被检出信息总数×100%依据用户使用信息的目的不同,信息检索对检索相关性有不同要求。
(1)撰写论文的信息检索这类检索大部分是为了写论文而要求检索较新的期刊和学位论文等文献,主要强调查准率,一般检索5~10年以内的文献。
写一般的论文往往需要10篇左右的参考文献,而撰写博士论文往往需要100篇以上参考文献。
(2)学科建设和科学研究的信息检索为学科建设和科学研究而进行的信息检索通常要求全面而系统,强调查全率,对查准率的要求可适当放宽,允许适当的误检。
不仅要求得到本学科的相关信息,而且也希望得到相近学科和交叉学科的有关信息。
这类检索非常重视事实数据,同时对时间往往也会有要求。
对于研究层次低、发展快的学科,则检索的时段可以适当缩短,反之,则适当延长。
一般来说,社会科学、基础科学、高层次的科学研究都要求检索近20年的相关信息;自然科学一般要求检索近10年左右;应用科学和一般层次的研究检索近5年的相关信息就能满足要求。
以下是不同的检索目的所对应的检索要求。
•立项查新。
立项查新是申报各级、各类科技计划,申请科研课题和专利时的资料查询,这类检索特别要防止漏检。
1、信息资源类型(1)以内容形式划分:图书、期刊、专利文献、标准文献、科技报告、会议文献等(2)以加工程度划分:1)一次信息资源:期刊论文、学术报告、专利文献、会议文献、研究报告、专著、译文等——一次文献2)二次信息资源:目录、题录、索引、文摘等——检索工具3)三次信息资源:科技动态、专题综述、情报调研报告、决策参考、述评、年鉴、进展、手册、指南等——参考性文献4)零次信息资源:素材、底稿、书信、实验记录、原始统计数字、工作文稿工程图纸等——未正式发表和大范围交流(3)从获取难易程度:1)白色信息资源:公开发行,易获得2)黑色信息资源:未公开发行,处于保密状态,极难获得3)灰色信息资源:不容易获得(4)从载体形式:纸质型、微缩型、视听型、电子型2、信息检索类型:数据检索、事实检索、文献检索3、检索语言类型:分类检索语言、主题检索语言4、关键词与叙词的区别:(1)关键词为非规范性语言,叙词为规范性语言;(2)关键词作为主题词检索时不受词表控制,叙词作为主题词检索时严格受《主题词表》控制5、信息检索方法:常规法(顺查、倒查、抽查)、引文法、交替法、浏览法6、信息检索途径:题名途径、责任者途径、号码途径、分类途径、主题途径、其他途径(1)外表特征:书名、刊名、责任者、序号等(2)内容特征:分类、主题、分子式等7、检索效果指标:查全率(被检出相关文献量/相关文献总量)和查准率(被检出文献量/被检出文献总量)8、影响检索结果的因素(1)客观:由于当今信息爆炸,文献量大增,学科之间交叉日趋频繁,各种学科知识之间相互渗透、相互包容,这是影响查全率和查准率的主要原因(2)主观:主要包括两个方面:一是编制者在编制检索工具或数据库时收录文献不全面、不明确,在编制过程中人为造成各种错误;二是使用者在检索课题时对课题内容分析不确切和选定错误的检索入口9、工具书的组成:前言、凡例、目录、正文、辅助索引及附表10、药典:国家药品质量标准的法规,属于标准文献,一般五年修订一次11、《中华人民共和国药典/CP》:1953年首版,2005版开始分为中药、西药和生物制品三部;2010版分为中药、化学药和生物制品三部12、《美国药典》及处方集:《美国药典》The United State Pharmacopeia 简称USP,1883年第一版,到2000年出至第19版;处方集 National Formulary 简称NF13、《英国药典》:British Pharmacopoeia 简称BP14、《欧洲药典》:European Pharmacopoeia 简称EP15、《日本药局方》16、手册:《贝尔斯坦有机化学手册》17、百科全书:《默克索引》收录药物基本信息:化学物质不同名称、结构式、专利号、CA登记号及有关参考文献;著录格式分析18、大全:《马丁代尔氏大药典》非法定药典19、年鉴:《中国药学年鉴》我国级别最高的药学书20、光谱:《萨德勒标准光谱图集》收集的光谱图使世界上最完备的光谱文献21、中国药学文摘:总体分为12大类,70小类;著录格式分析;检索方法:分类、主题和外文药名22、图书的检索途径:(1)利用检索工具书刊;(2)利用馆藏目录或联合目录;(3)利用附录书目或参考文献目录;(4)利用网络检索23、美国《化学文摘》:分为五大部分,80 个类目,,每个类目按文献类型不同分为四个区域:综述等;新书;专利文献;参见内容(1)期刊论文著录格式分析(2)文摘号前面的字母代码表示特定的文献类型:B——新书;P——专利;R ——综述;Pr——与化学制备有关;cat——催化信息;ret——反应信息(3)专利文献著录格式(4)期索引:1)关键词索引(KWI):查新;当卷缩印GS、CS出版后即失去意义2)专利索引(PI):同族专利;基本专利;等同专利;相关专利;专利索引著录格式;3)著者索引(AI):发明者姓在前用全称,名用缩写在后(5)卷索引:化学物质索引(CS)、普通主题词索引(GS)、分子式索引(FI)、著者索引(AI)、专利索引(PI)(6)工具性索引:索引指南(IG)、资料来源索引(CASSI)、登记号手册24、BA/RRM:《生物学文摘/报告、评论、会议》题录型25、药学专科检索(1)美国《国际药学文摘》International Pharmaceutical Abstracts IPA;侧重于临床应用和药代动力学(2)《药物研制信息》Pharmaprojects 可查到CA的IG中没有收载的最新化合物CA名及登记号(3)《未来药物》Drugs of the Future(4)《药物》Drugs26、其他相关检索刊物(1)美国《医学索引》Index Medicus,MI(2)荷兰《医学文摘》Excerpta Medicus ,EM(3)《化学工业摘记》 Chemical Industry Notes,CIN(4)《日本科学文献速报》简称《速报》(5)美国《科学引文索引》Science Citation Index(6)中国科学引文索引China Science Citation Index27、美国四大报告:(1)美国政府的PB报告;(2)军事系统的AD报告;(3)国家宇航局的NASA报告;(4)能源部的DOE报告28、授予专利的实质条件:新颖性、创造性、实用性29、我国专利种类:发明专利(期限20年);实用新型专利(期限10年);外观设计专利(期限10年)30、专利文献的特点(1)内容广泛(2)内容详尽(3)反映新技术早于其他文献(4)完整性及系统性强(5)法律作用强(6)大量的重复报道31、专利文献检索的意义(1)了解国内外同行最新技术水平,获得世界最新研究技术情报,力求创新,避免侵权(2)为引进国外先进工艺技术服务,解决专利纠纷(3)确定专利权法律状态,以利对策(4)可从专利文献中找到借鉴或对某个部门或学科专业技术实力进行评价与预测32、专利文献检索工具(1)中国专利文献检索工具:《中国专利公报》、《中国专利索引》(2)英国德温特出版公司的专利检索工具33、计算机检索技术(1)布尔逻辑检索1)逻辑与:用“*”或“AND”算符表示;缩小检索范围,提高查准率2)逻辑或:用“+”或“OR”算符表示;扩大检索范围,提高查全率3)逻辑非:用“-”或“NOT”算符表示,缩小检索范围,提高查准率(2)截词检索:通常用于西文检索中,通用的截词符有?和*1)?代表一个字符(有限截断),*代表不定个字符(无限截断)2)如wom?n可查到women和woman;prepar*可查到prepare,preparation,prepared等所有以prepar开头的词3)按截断的位置不同又分为左截断、右截断和中间截断(3)位置运算检索:是进行全文检索时,对检索词的位置进行限定的检索1)A(nW)B A、B两词最多相隔n词且前后次序不变;n=1时表示A、B 两词必需紧密相连,空格和标点除外,次序不变2)A(nN)B A、B两词最多相隔n词且前后次序不限;n=1时表示A、B 两词必需紧密相连,空格和标点除外,次序不限3)A(S)B A、B两词在同一句子中出现4)A(F)B A、B两词必需在同一字段里出现5)限制程度大小:W>N>S>F(4)字段限制检索1)基本字段限制基本字段及其代码:题目TI、叙词DE、标示词ID、文摘AB用法:检索词/字段代码2)辅助字段限制包括“in,=,<,>”等对特定字段进行限制检索,如年份PY限制检索、语种LA限制检索、文献类型DT限制检索等如:要求检索的文献为英文文献English in LA34、检索策略的制定和调整(1)检索策略的制定:1)分析检索课题2)选择检索系统及数据库3)构造检索式,选择检索入口4)调整检索策略(2)检索策略的调整1)检索结果信息量过多(错检)原因:一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短方法:减少同义词与同族相关词增加限制概念,采用逻辑“与”连接检索词使用字段限定,将检索词限定在某个或某些字段范围使用逻辑“非”算符,排除无关概念调整位置算符,由松变严。