信息检索与阅读翻译重点
- 格式:docx
- 大小:17.81 KB
- 文档页数:4
信息检索知识点 Revised by Liu Jing on January 12, 2021信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
第一章信息检索概述1. 信息检索的概念。
狭义信息检索是指用户找出有关信息的过程。
广义信息检索是将信息按照一定的方式组织和存储起来,并根据用户的需求找出有关信息的过程。
2. 信息检索的类型(1)按照检索对象的不同划分早期分为:文献检索、事实检索、数据检索。
当前三分方法:文本检索、音频与视频检索、数值检索。
(2)按检索手段划分:手工检索、机器检索3.简述信息检索的基本原理信息检索的基本原理:对信息集合与需求集合的匹配与选择。
实现信息检索,主要涉及三个关键要素:信息集合、用户信息需求、匹配选择。
一、信息集合:信息集合是指有关某一领域的,经采集、加工的信息集合体。
二、需求集合:用户的信息需求是在社会实践活动中产生的。
当人们在完成某一任务或工作时,经常觉得缺少某些知识,这就产生了信息需求。
三、选择与匹配:要在信息集合中快速获取用户所需信息,需要信息检索提供一种匹配机制,能够把需求集合与信息集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。
匹配机制至少包括两个要素:第一是匹配标准,即相似性标准;第二是执行匹配的动因。
4.计算机信息检索经历了脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段。
5.信息检索领域的主要研究问题有哪些?⑴信息检索理论:检索语言、检索模型、标引理论、相关性理论、知识组织与表示理论⑵信息检索工具/系统:信息检索系统的结构、功能、设计开发、管理运营、应用评价等⑶信息资源及其收集、加工:信息存储、数据库⑷检索技术与方法:文本检索技术、数值检索技术、音频与视频检索技术、网络搜索技术⑸用户研究与检索策略:用户的查询心理、检索需求及其类型、用户查询信息的行为特征等、用户信息需求分析、检索式构造、相关反馈方法、检索过程调整与控制等⑹其他密切相关的自动化处理技术:自动聚类与分类、自动摘要、信息可视化、信息过滤、信息提取、机器翻译、人机交互等。
信息检索的两种研究方式:以计算机为中心和以用户为中心,以计算机为中心的IR 问题是主流。
信息检索1、信息检索概念:P12、信息检索的原理一整节内容要自己理解:P3-P4图1-1要掌握文献替代和文献整序的概念要掌握3、信息检索在历史上的不同表现:联机检索、光盘检索、网络检索的区别和特征:P6-P94、信息检索的模型概念:P95、布尔模型、向量空间模型、经典概率模型要理解并掌握各自的优缺点:P11-P126、信息检索系统的概念:P127、检索效果的评价指标:P15-P164个指标:查全率、查准率、漏检率、误检率掌握它们的含义并懂得计算8、网络检索的表达式:布尔逻辑检索、邻近检索、短语检索、截词检索的特点、区别和联系:P17-P219、信息检索的技巧要理解尤其是要掌握及时调整检索策略:P33-P3610、搜索引擎的概念:P3711、数据库知识,实验内容,特点12、引文的概念13、搜索引擎的分类:P40-41搜索引擎划分的类别以及元搜索引擎的概念要掌握12、CBR概念P11312、多媒体信息检索的原理和方法:P110-P114其中要重点理解基于内容的多媒体信息检索的检索形式(可以结合课件)13、专利的概念:P12514、专利的类型:P126(理解一下各类型的区别)15、专利文献的概念:P12716、专利文献的类型:P127(理解一下各类型的区别)17、灰色文献的概念:P14718、会议文献的概念:P15819、科技报告的概念:P16320、查新的概念:P20021、科技查新的作用:P201(每一个小标题后面要自己展开一段)关于上课讲的那几个数据库大家自己看一下PPT,掌握一下。
以上纯属个人观点题型:名词解释:5*4=20简答题:4*10=40论述题:2*20=40考试时间:1月8日上午:9:00—11:001.信息检索的概念(P1)信息检索有广义和狭义两重含义。
广义上说,信息检索是指将信息按照一定的方式组织和存储起来,并根据信息用户的需求查找相关信息的过程。
它包含信息存储和信息查找两个过程。
第一章信息检索概述信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
信息素养:人们在解答问题时利用信息的技术和技能。
信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。
信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索 2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。
信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。
存储是检索的基础,检索是存储的目的。
信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。
信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。
其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。
信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。
信息检索的历史:最早的信息检索主要依靠信息分类。
1手工检索 2机械信息检索。
3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型1浏览型模型:扁平式模型、结构导向模型、超文本模型 2检索型模型:结构化模型、基于内容的检索型模型。
信息检索模型是信息检索的核心。
信息检索系统:是具有信息存储和信息查询功能的一类服务设施。
信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS.信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。
1.信息检索(information retrieval) 定义(1)广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关的信息的过程和技术。
所以它的全称又叫信息存储与检索(information storage and retrieval).(2)狭义的信息检索:指广义的信息检索的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们的所说的信息查寻。
(information search)2.检索工具定义:检索工具是人们用来存储、报道和查找文献的工具。
因此,它具有存储和检索的功能。
存储是把分散、无序的文献,采用一定的检索语言使其集中,组织起来,成为有规律的检索系统,变成检索工具。
检索是人们按照有关检索语言,采用一定的方法和途径,检出自己所需的文献。
3.检索策略的定义陈光祚:所谓检索策略就是在弄清用户情报需求实质的前提下,选择检索途径、检索用词以及明确各词之间逻辑关系和查找步骤的科学安排。
赖茂生:所谓检索策赂,是指为实现检索目的而制定的全盘计划和方案,是对整个检索过程的谋划和指导。
4.信息资源:是人类存储与载体(包括人脑)上的已知或未知的可利用的信息。
信息中的载体信息和主体信息是使信息资源的最基本的组成部分。
填空一.检索工具的功能(1)报道功能。
(2)标识功能。
(3)辅助检索功能。
二.检索工具的类型1 按检索方法划分检索工具可以划分为手工检索和机械检索工具两大类型,机械检索工具主要是指计算机检索。
2 按收录范围划分检索工具可分为综合性检索工具、专业性检索工具、单一性检索工具3种。
综合性检索工具收录范围广,涉及多门学科。
专业性检索工具收录的范围仅限于某一学科领域。
单一性检索工具只收录某一特种类型的文献,但学科范围可广可窄。
3 按出版形式划分检索工具又可分为书本式、卡片式、磁带式和缩微制品等形式,书本式又包括书刊式、单卷式和附录式3种。
4 按收录文献的对象和揭示方式来划分⑴目录目录是一批图书或其他单独出版的资料的系统化记载及内容的揭示。
信息检索初步知识点总结信息检索是指利用计算机系统来检索和获取文档或者信息资源的技术和方法。
在当今信息爆炸的时代,信息检索具有非常重要的意义。
信息检索系统可以帮助人们快速准确地获取所需要的信息资源,不仅可以提高工作和学习效率,还可以帮助人们更好地利用信息资源。
在信息检索中,有一些基本的知识点是非常重要的,下面我将对这些知识点进行总结。
1. 信息检索的概念和发展历史信息检索是指从信息库中按照一定的要求来搜索、检索信息的过程。
它主要是利用计算机技术来实现信息的存储、检索和利用。
信息检索的发展可以追溯到20世纪50年代,随着计算机技术的发展,信息检索技术也得到了很大的发展。
现代信息检索系统不仅能够实现文档的存储和检索,还可以实现自然语言处理、信息抽取、信息过滤等功能。
2. 信息检索的基本过程信息检索的基本过程包括信息需求分析、文档表示和查询处理、检索模型和算法、评价和反馈等几个方面。
其中,信息需求分析是整个信息检索过程的第一步,它包括对用户的信息需求进行分析和建模,确定用户的检索目标和检索词,为后续的检索准备工作做好准备。
文档表示和查询处理是指对文档和查询进行适当的表示和处理,以便计算机系统能够理解和利用。
检索模型和算法是指根据文档和查询的表示,计算出相关度得分,以确定文档的相关性。
最后,评价和反馈是指对检索结果进行评价和反馈,以优化检索系统的性能。
3. 信息检索的技术手段信息检索的技术手段主要包括文本索引技术、全文搜索技术、信息抽取技术、信息推荐技术等几个方面。
其中,文本索引技术是指将文档中的关键词进行索引,以便计算机系统能够快速地定位到相关的文档。
全文搜索技术是指利用全文索引进行搜索,可以实现对文档中所有内容的搜索。
信息抽取技术是指从文档中抽取出有用的信息,以便为用户提供更精确的搜索结果。
信息推荐技术是指根据用户的行为和偏好,为用户推荐相关的信息资源。
4. 信息检索的评价指标信息检索的评价指标主要包括召回率、准确率、F值、MAP值等几个方面。
1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。
狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。
相当于我们所说的信息查询(information search)。
2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。
如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。
其主要特点是内容新颖,但不成熟,不公开交流,难以获得。
3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。
如期刊论文、科技报告、专利说明书、会议论文、学位论文等。
体现创作性。
其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。
4)二次文献(Secondary Document):就是检索工具。
是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。
如文摘,目录、索引等。
它有存贮、检索、报道的功能。
体现高度的浓缩性。
其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。
二次文献具有汇集性、工具性、综合性、交流性等特点。
5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。
三次文献是情报研究的产物和成果。
具有很强的的综合性。
总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。
6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。
如何判断自己具备哪些素质1能够独立决定所需要信息种类和程度2能够高效的获取所需要的信息3能够根据现有的知识背景和评价标准对信息及来源进行评价和遴选4能够有效的利用信息达到某一特定的目的5能够在信息利用过程中遵守相关的法律法规知识是信息的提炼,情报是激活了的知识文献三要素:知识、载体、记录方式文献分类,按出版方式分科技图书、科技周刊、科技文献,按内容层次分一次文献(期刊论文、专利说明书、会议论文、科学报告、学位论文)、二次文献(书目、索引、文摘)、三次文献(词典、手册、年鉴、百科全书、专著、教科书、论文丛集、述评、文献指南),按载体分印刷型、缩微型、声像型、机读型、多媒体型关于物流管理专业的核心刊物有国家发展研究中心《管理世界》、南开大学商学院《南开管理详论》、中国科学院工业经济研究所《经济管理》、中国人民大学《经济理论与经济管理》《中国软科学》《管理科学学报》《管理工程学报》《中国管理科学》《科学管理研究》《生产力研究》《中国流通经济》《物流技术》《物流工程与管理》《中国物流与采购》《物流技术》D(代)UF 指引非正式主题词S(属)BT 指引上位主题词F(分)NT 指引下位主题词C(参)RT 指引相关主题词Z(族)CC 指引族首主题词(最上位词)知网节——推目标在知识的海洋中自由遨游,从一篇文章,一个知识点,链接到更多相关知识,提供主动学习功能知识网络根据知识的体系结构和文献的内容关联来组织文献,可以形成以各种特征为节点的文献网络和知识网络,如主题网络、分类网络等。
节点文献题录摘要:篇名、作者、机构、关键词、摘要、刊名、刊期等信息及链接参考文献链接:反映本文研究工作的背景和依据引证文献链接:引用本文的文献同被引文献链接:与本文同时被作为参考文献引用的文献,与本文共同作为进一步研究的基础二级参考文献链接:本文参考文献的参考文献。
进一步反映本文研究工作的背景和依据二级引证文献链接:本文引证文献的引证文献。
第一课:1.It has now been found that the water of crystallization can be withdrawn from the barium hydroxide hydrate either by heating the same in an organic solvent, the water being azeotropically(共沸蒸馏)distilled off with the solvent, or by removing it from the barium hydroxidehydrate merely by digestion(浸提)in a suitable solvent at elevated temperature(升温).现在发现可以通过两种方法把氢氧化钡水合物中的结晶水除去:将其在某一有机溶剂中加热,水可以通过与溶剂一起共沸蒸馏而除去;或在升温条件下用合适的溶剂将水从氢氧化钡水合物中浸提出去。
2.It is, however, necessary to select a solvent which is chemically inert(化学惰性的)to barium hydroxide, but the selected solvent may be a solvent mixture.然而,所选择的溶剂必须对氢氧化钡是化学惰性的,且可能是一种混合溶剂。
anic solvents which, in the liquid phase, are not miscible(易混合的,互溶的)with water in any proportion(比例)have been found to be especially useful for performing the Azeotropic(共沸蒸馏)distillation, so that the continuous and complete separation of the water can be effected in a receiver(接受器)fitted with an overflow(溢流口).液相时以任意比例都不能和水互溶的有机溶剂在进行共沸蒸馏时是特别有用的,因此使用装有溢流口的接收器可以连续并完全地将水分离出去。
4.It is then possible to dehydrate relatively large quantities of barium hydroxide hydrate with the aid of a constant quantity of solvent.因而使用一定量的溶剂就可能使相当大量的氢氧化钡水合物脱水5.In the case of barium hydroxide octahydrate a solvent must be selected which has a boiling point(沸点)near the congruent melting point (共熔点,同成分熔点)of 78℃,and an azeotropic boiling point(共沸点)which below this meltingPoint(熔点).对于八水合氢氧化钡而言,所选择的溶剂必须具有与同成分熔点即78℃相近的沸点和低于此熔点的共沸点。
6.The process of dehydration can be discontinued when a desired quantity of water has been removed so that barium hydroxides in any desired stage ofhydration can thus be obtained.当一定量的水被除去时,脱水过程可以随时中止,因此可以获得所希望的结晶水数目的氢氧化钡。
7.For lower hydrates of barium hydroxide the selection of a suitable solvent is not determined in the above manner, and the boiling point of pure solvent and of the azeotropic mixture should be above and as close as possible respectively (分别地)to theboiling point of water.对于结晶水数目较少的氢氧化钡,合适溶剂的选择与上述方式不同:纯溶剂和共沸混合物的沸点应分别高于和尽可能接近水的沸点。
第二课11.4 Determine the inflection point (point of maximum change in pH per millilitre of alkali solution) to the nearest 0.1 mL by plotting the pH readings againstthe millilitres of alkali used.以pH读数对所用碱的mL数作图求算突变点,精确到0.1mL(每mL碱引起pH变化最大的点)。
For great accuracy, a plot may be made of the change in pH per millilitre of alkali, against the pH. The peak of this curve will indicate the exact inflection point. The inflection point shall be taken as the end of the titration以每mL碱所引起pH的变化值对pH作图可提高结果的准确度。
此曲线的峰值表示确切的突变点。
突变点可以认为是滴定的终点。
Alternatively, if an automatic titrator is used, the end point shall be taken either as the inflection point from the plotted curve or pH 10.8 (Note 3) withinstruments which titrate to a preset value.另外,如果使用自动电位滴定仪,终点除了可由曲线的突变点来判断,还可以通过滴定到仪器预先设置的pH10.8来判断。
第三课Zinc and Aluminum are not a problem if present in these amounts (we think they originate from a reducing agent used in the production), but the Iron content is in fact much higher than the 30-40ppmindicated by the producer.Zn: zinc Al: aluminum Fe: ironCu: copperreducing agent: 还原剂(reducer)锌和铝即使以这些含量存在也没有问题(我们认为它们来自生产过程使用的还原剂),但是铁含量实际上比生产商所表明的30-40ppm要高得多b) Vat Black 9 DPCRetreated lot No 99-35 (renamed lot 2000-16) tested, copper and iron values are improved (Cu below 500ppm, Fe only 100 ppm), but we are unable to get reasonableprocessing results with this lot.b)还原黑9 DPC对经过重新处理的第99-35批次样品(重命名为2000-16批次)进行测试,铜、铁含量有了改进(铜低于500ppm,铁仅为100ppm),但是对于本批样品我们不能够获得合理的处理结果。
After reaching a certain level of fineness in particles we are unable to mill further to achieve the desire particle size, even when doubling the milling time to 18 passes results are not acceptable.当粒子达到一定的细度后,我们无法通过进一步研磨来获得希望的粒径,即使双倍增加研磨时间到18个轮回,结果仍然是不合意的。
We have compared the 2 t delivered to us from the original lot 99-35 with this improved sample lot 2000-16 and can confirm that the original lot has much better processing properties.我们把发送给我们的2吨原始99-35批次与改进后的本2000-16批次样品进行了比较,发现原始批次具有更好的可处理性质。
第四课1.FOB Free on Board 离岸价格A) The Seller shall, __days before the shipment date specified under clause (5) of this Contract advise the Buyer by CABLE/TELEX/FAX of the contract number, the name of commodity, quantity, invoice value, package numbers, total weight and volume and the date from which goods is ready for loading at the port of shipment in order that the Buyer can charter a vessel/book shipping space.) 卖方应该在本合同第五条规定的装货日期前__天通过电报/电传/传真通知买方合同号、商品名称、数量、发票价值、包裹号、总重量和体积、货物准备在装货港口装载的日期,以便买方能够租船/预定舱位。