计算机检索基础

  • 格式:ppt
  • 大小:4.95 MB
  • 文档页数:77

下载文档原格式

  / 77
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

光盘检索时期 (1980年代中期开始) Internet网络化检索时期 (1990年代至今)
文献数据库
文献数据库是将各个学科领域、各种专业技 术方面的文献信息汇集在一起,经过分门别类的 组织、加工、编排后形成的数据库。它能够提供 人们方便而快速地,更具针对性地查找各种文献 资料的线索或者全文。
文献数据库的类型
选择数据库的方法: 1、注重平时的积累 2、不要盲目检索,应养成检索前了解一下数据库 的习惯 3、注重与他人的交流 4、重视图书馆主页的资源
课题:有关污水生物法脱氮除磷的工艺
• 检索系统的选择 –首先选择中文数据库:CNKI,万方数据,中国专 利数据库 –外文数据库选择:Ebsco, Springer, DII –参考一些环境科学门户网站:中国污水处理工程网、 国家环境保护部、CO土木在线、水网论坛、水世界 论坛、美国环保总署、科学在线等 –利用搜索引擎查找网络文档:
• 例四:提炼关键的、核心的词为检索词,少用
或者不用对课题检索意义不大的词。
展望、趋势、现状、近况
Байду номын сангаас
应用、利用、作用
开发、研究、方法、影响
研究、对策、分析、探讨
课题:有关污水生物法脱氮除磷的工艺
这个课题,主题词比较明显,可以基本确 定为“生物脱氮”,“生物除磷”,“污水” 为了防止漏检,我们还可以考虑增加“生物脱 氮除磷”、“生物”、“废水”、“脱氮除磷” 英文关键词:
• (nW)算符:“n words‖的缩写 (nW)是从(W)算符引伸出来,检索词之间允许插 入0-n个词,词序不许颠倒 例 anticorrosion (1W) paint 可检出 anticorrosion paint 和 anticorrosion of paint 例 检索“材料磨损”(wear of materials)方面的 文献, 检索式: wear (1W) materials
海绵是海洋中的多孔类动物。口语中的海绵是 指聚胺脂泡沫塑料和泡沫橡胶。
(泡沫塑料 OR 泡沫橡胶)and (制造 or 生产 or 工艺)
• 例二
注意同义词、近义词
patron-customer- client-shop per-consumer-user-reader 自行车—单车—脚踏车 airplane–aircraft–plane VC-抗坏血酸-维他命C
例 sewage + sewerage + wastewater userface or interface 污水处理 或 废水处理
• 非、NOT、- A NOT B :A必须存在,同时不允许B的存 在。 从原检索范围中剔除一部分不需要的内容,提 高检准率。
例: Energy-Nuclear
除核能以外的有关能源方面的文献才被命中。
J
艺术
K
O Q
历史、地理
数理科学和化学 生物科学
N 自然科学总论 P 天文学、地球科学
R 医药、卫生
T 工业技术 V 航空、航天 Z 综合性图书
S
X
农业科学
环境科学、安全科学
U 交通运输
层层展开、渐趋精确
T 工业技术 TP 自动化技术、计算机技术 TP3 计算技术、计算机技术 TP31 计算机软件 TP311 程序设计、软件工程 TP311.1 程序设计 TP311.13 数据库理论与系统 TP311.131 数据库理论
逻辑检索概念示意图
A
B
A
B
A and B
A or B
A
B
B not A
• 与、AND、* A AND B :A、B两个检索词必须同时存在。 用于概念交叉和限定。起缩小检索范围和提 高文献查准率的作用。
例 Solar * Energy 组织文化 and 管理决策 生物法 与 脱氮除磷
• 或、OR、+ A OR B :A或B两个检索词单独一个词存 在即可,或同时存在。 用于概念之间并列关系的组配。增加主题的 同义词,以扩大检索范围,避免文献漏检。
主题法和主题检索语言 主题检索语言是直接以代表文献内容 特征的科学概念作为检索标识,并按其外 部形式(字顺)组织起来的一种检索语言。 包括主题词、关键词、受控词等。
• 以自然语言为基础, “主题词”通常 是一些名词和名词性词组。 • 标识符是文字。如 “金属陶瓷”、 “感光材料”、“载重汽车” • 主题法中经常使用禁用词表来淘汰那些 不具有检索意义的词。如英语中的and or the not 等 ,汉语中的、是、 不是等。
按收录文献的类型划分 按提供信息的详略划分
图书文献数据库 文摘数据库 期刊文献数据库
专利文献数据库 会议文献数据库
全文数据库
字段:如在数据库中题名、作者、作者单位、期 刊名、摘要、全文等等均是字段;一条记录由 多个字段值组成;对计算机检索来说字段相当 于检索入口。如:
作者(文章的责任者,如:沈从文) 篇名(或题名,如:昆虫记) 机构(如沈阳建筑大学) 关键词(如污水处理、高层建筑) 主题词(规范化的主题概念,如用激光不用镭射)
全文(或者全记录)
选择检索词
• 利用主题词表选取规范化的主题词或词组
• 自由语言与数据库标引语言要对等
• 注意同义词、近义词、词形变化
• 分析隐性概念
• 提炼关键、核心的词为检索词,少用或者不 用对课题检索意义不大的词
• 例一,自由语言与数据库标引语言要对等
海绵的制造工艺
海绵 and (制造 or 工艺)
Agenda
• 计算机检索概述
• 计算机检索步骤
• 习题
文献数据库检索步骤
分析检索课题
选择检索点与 检索词 检索方案的调整 选择检索系统
检索式的制定 检索结果输出
分析检索课题
• 分析课题的主要内容及其所涉及的学科范围。 • 所需文献的类型、语种、年代及文献量的范
围。
• 对查新、查准、查全的指标要求,及其侧重。
Biological phosphorus removal
Biological nitrogen removal
(wastewater ,sewage, sewerage) treatment
检索式的制定
常用检索算符
• 逻辑算符 • 位置算符 • 截词符
•布尔逻辑检索
即采用逻辑和(OR)、逻辑乘(AND) 逻辑非(NOT)等算符,将检索提问转换成逻 辑表达式。
组织文化
管理决策
逻辑“乘”能够 缩小检索范围, 提高检准率
利用逻辑“和”算符,可 以扩大检索命中文献数
位置算符
• (W)或( )算符:“With‖的缩写 词序不许颠倒 两词之间不许插词,只许空格或连字符 号 例 : CD(W)ROM 将 命 中 CD ROM 或 CD-ROM solar ( ) energy 检出 solar energy
将图书分为五在部类、22大类。
五大部类:
n 马克思主义、列宁主义、毛泽东思想、邓小
平理论
n 哲学、宗教 n 社会科学 n 自然科学 n 综合类图书
A B
马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 C 社会科学总论
D
F
政治、法律
经济
E
G I
军事
文化、科学、教育、体育 文学
H 语言、文字
• 例三,注意分析隐性概念
查“多元共渗”方面的英文资料。
由于汉英词典上没有对应的词,因此必须进 行概念分析,进而选择主题词。 多元共渗是指多种元素在一定温度、压力、浓 度条件下自金属表面扩散的能力有所提高,利用 的是扩散涂层原理,因此,通过Diffusion Coati ng就可以找到有关文献。
• 例四:提炼关键的、核心的词为检索词,少用
截词检索
就是把检索词截断(加上截断符号),让计 算机按照字的片断同索引词对比。包括:
• 右截断:把截词符号放在字根的右边。 • 中间截断:把截词符号放在词中间有变化的地 方。 • 左截断:把截词符号放在字根的左边。
例如:查Computer 这个词时,若用截词符号*, 则可以写成Computer*,则索引词Computer , Com
课题:有关污水生物法脱氮除磷的工艺
• 分析检索课题
氮和磷是生物重要营养源,污水中氮磷含量超标, 会导致水体富营养化。长期以来,城市污水处理均以去 除有机物和悬浮物为目的,没有考虑对氮磷等无机营养 物质的去除,所以在污水处理中,只有10%--20%的 氮、磷被去除,造成水体污染。在各种污水处理工艺中, 生物脱氮除磷是最廉价、最有效的方法。生物脱氮除磷 原理的研究和应用是当前国内外该领域研究的热点之一。 生物脱氮除磷新工艺不断涌现,本课题主要查找有关用 生物法来处理氮和磷的新工艺。
第三章 计算机检索基础
ISI Web of Knowledge 4.0
汤姆森科技信息集团
为全球研究人员 提供服务
ISI Web of Knowledge 服务于: •2千万使用者,81个国家 •超过3,000家用户 •每天15万使用者
ISI Web of Knowledge 覆盖:
• 22,000+ 期刊, 3,100百万件专利, 6万个会议录, 5,500 专业网站, 5,000本学术专著, 2 百万化学结构
Google, Virtue library, Buble Link
选择检索点和检索词
选择检索点
作者(文章的责任者,如:钱钟书)
篇名(或题名,如:红楼梦)
机构(如:国家统计局) 关键词(如:污水处理、高层建筑) 主题词(规范化的主题概念,如用激光不用雷射) 文摘(论文或图书的摘要或内容提要) 引文(即参考文献) 基金(如:国家自然科学基金项目) 刊名(期刊的名称,如:环球银幕)
http://www.ztflh.com
《中国图书馆图书分类法》
分类号由字母和数字组成,采用等级列举表达 从属关系。上位类目一定包含各个下位类目,分类 号越长,表示的学科范围越窄。 为了清楚醒目, 通常分类号的第三位数字后, 隔以.,如:
F279.712,TQ032.4
美国企业 经济管理 催化 反应
ISI Web of Knowledge 提供:
• 一个世纪的科学发展 - 100 年的科学引文
ISI Web of Knowledge 包含:
• 230多个学科 深度的主题索引
EBSCOhost 2.0
A Smarter Search Experience. Beginning in July 2008.
专利号(CN1584184 ) 基金(如:国家自然科学基金项目) 分类号(G257)
外表特征标识 题名 作者 专利号….
• 包括
分类号
内容特征标识
主题词 关键词
体系分类法和分类检索语言
所谓“类”,是指具有共同属性的事物 的集合。 文献分类是按照文献中所含知识的学科 属性对文献进行区分。
《中国图书馆图书分类法》
Agenda
• 计算机检索概述
• 计算机检索步骤
• 习题
计算机检索是指人们在计算机或计算 机检索网络的终端机上,使用特定的检索 指令、检索词和检索策略,从计算机检索
系统的数据库中检索出需要的信息,继而
再由终端设备显示或打印的过程。
计算机检索的发展
脱机批处理检索时期 (Off-lineBatchProcessing) (1950---1960年代) 联机实时检索时期 (On-line Real Time) (1960年代中期到70年代初)
或者不用对课题检索意义不大的词。
“网络数据库的安全性研究”
关键词1:网络数据库——(研究对象)
关键词2:安全——(研究目的)
而意义太泛的词“研究”不应作为检索词
―基于代理技术的网络入侵检测” 关键词1:(网络)入侵检测,但入侵检测一般即 指网络中的入侵检测,意义重复,网络可不要。 关键词2:代理(技术),在入侵检测中使用“代 理”,“代理”本身就是指的一项技术,因而 也可不要。
选择数据库的4C标准
• Content, 指数据库的内容,涉及它的学科范围、科技 含量、数据库类型、数据来源等。 • Coverage, 指数据库的规模,涉及它的时间和地理范 围、机构来源、文献量等。 • Currency,指数据库的更新的及时性,更新的频率、 周期。 • Cost,指数据库的费用,各种数据库、各种检索输出 方式和格式的收费是不一样的。
课题:有关污水生物法脱氮除磷的工艺
• 分析检索课题 脱氮除磷工艺主要涉及到环境科学和水污染治理方 面的知识。 需要检索的资料以学术论文和专利技术为主。包括 中文资料和同一主题的英文资料。由于是需要掌握脱氮 除磷的新工艺、新技术,所以对资料的新颖性的要求较 高。时间限定为最近五年的资料。
选择检索系统和数据库