中文检索工具以中文出版国内读者无语言文字障碍阅读速度快
- 格式:pptx
- 大小:3.79 MB
- 文档页数:86
中文文献检索通常用什么工具
Lucene是apache软件基金会项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。
Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
Lucene的简单易用性是它广受欢迎和成功的关键因素之一。
Lucene是一个设计得非常优秀的软件因为它向用户提供了简单易用的索引和搜索API,并屏蔽了复杂的实现过程。
它是一个高性能的、可扩展的信息检索工具库,你可以把它带入到应用程序中以增加索引和搜索功能。
lucene是一个纯java实现的成熟、自由、开源的软件项目;它是备受程序员欢迎的开源组织ApacheJakarta的成员项目,基于Apache软件许可协议的授权。
Lucene还包括使用其他编程语言的版本:CLucene(C++),dotLucene(.NET),Lucene4C(C),LuceneKit(Objective-C),Lupy(Python),PLucene(Perl),MUTIS(Delphi),Ferret(Ruby)等等,本文使用的是Java语言版本。
《文献检索》作业讲评(1)一、名词解释1.文献检索:是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。
广义的文献检索包括文献的存储和文献的检索两个过程。
狭义的文献检索就是找出自己所需的文献。
2.检索语言:是用于描述检索系统中文献的内容特征及外表特征和表达用户检索提问的一种专门化的标识系统。
检索的匹配就是通过检索语言的匹配来实现的。
3.后组织式语言:是指在检索前检索系统中的检索标识是独立的,实施检索后,才根据检索需要进行组配的检索语言。
如叙词语言、单元词语言、关键词语言属此类型。
4.电子文献资源:电子文献资源是以电子数据的形式,把文学、声音、图像、视频等多种形式的文献存储在光、磁等非印刷纸质的载体中,以电信号、光信号的形式传输,并通过网络通信、计算机或终端和其他外部设备等方式再现出来的一种新型文献资源。
5.参考数据库:是指包括各种数据、信息或知识的原始来源和属性的数据库。
数据库的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。
一般来说,参考数据库主要针对印刷型出版物而开发的,它包括书目数据库和指南数据库两种。
6.OPAC:是英文Online Public Access Catlogue的首字母缩写,可以译为“联机公共书目查询系统”,是一个基于网络,供读者查询图书馆藏书目信息的联机检索系统。
它是图书馆自动化的基础,也是未来数字图书馆的有机组成部分。
二、问答题1.简述文献检索的概念和类型。
答:文献检索是将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。
按照检出结果的形式划分,文献检索可以分为如下三种:(1)书目检索。
(2)全文检索。
(3)引文检索。
如果从情报检索角度划分,可以分为三种:(1)文献检索。
(2)数据检索。
(3)事实检索。
按照检索手段划分,可以分为两种:(1)手工检索。
文献信息检索与利用课程教案授课内容:第五讲检索工具与参考工具5.1 检索工具的概念检索工具是指以存储、报道和检索文献的工具。
如前所述,科技文献的数量庞大、交叉重复、高度分散,而且增长的速度越来越快,这就给文献的利用带来很大的困难。
为此人们在长期的实践过程中,提出了压缩文献内容的办法,即提取文献特征,加以标引,并按一定的顺序排列起来,从而形成检索工具,便于人们用较少的时间从不同角度获取大量文献。
一般检索工具必须具备四个基本条件:⑴必须详细记录文献的外部特征和内容特征。
⑵必须具有既定的检索标识。
如主题词、分类号、著者姓名和文献序号等。
⑶必须根据标识的顺序,系统地、科学地排列文献,使其成为一个有机的整体。
⑷能够提供多种检索途径。
5.2 检索工具的作用:⑴检索工具能将不同类型、不同语种的文献按学科或主题加以集中组织在一起,避免了直接检索的分散性、盲目性和偶然性,从而在查全率和查准率两个方面都能保证其检索效率。
⑵借助于检索工具检索文献可以缩短检索过程、节省读者的时间。
检索者不必去阅读大量分散的各种类型及文种的原始文献,因为检索工具使科技人员所面对的不再是文献的全文,而是反映原文状况的一些著录事项,因而大加快了检索速度。
⑶检索工具中的标识〔分类号、主题词等〕是按照一定的检索语言来排列的因此,它可以提供有规律的检索途径,使检索者可以根据需要灵活地从多种角度进行检索。
⑷帮助科技人员消除了语言文字的障碍。
目前世界上出版的科技文献所使用的语言有60~70种之多,科技人员直接查阅文献时,常常受到语种的限制而漏查一些有重要参考价值的文献,而一种检索工具可以用一种语言来收录和报道不同文种的文献,检索者只要掌握少数几种语言后,就能查阅多种文字的文献资料。
5.3检索工具的类型:⑴文献检索工具文献检索工具是进行文献检索时提供原始文献的线索不提供原文的的控制型检索工具。
这一大类检索工具的功用是向用户提供经过加工、整理、并按照一定方式排列的文献资料线索、出处等。
文献检索导学1.文献信息检索课的意义“文献检索课”正是“关于哪儿可以获得这些知识的知识”的一门课程。
高校开设《文献检索与利用》课的目的是使学生了解文献和文献检索的基本知识,训练学生检索与利用文献的技能,以提高学生的自学能力和独立研究的能力。
提高信息素养是新型人才的必备能力、终身教育的需要、科学研究工作者的基本素质。
2.信息素养“信息素养(素质)”的本质是全球信息化需要人们具备的一种基本能力。
信息素养的内涵信息意识、信息知识、信息能力、信息道德。
3.平台的使用交作业提醒:作业提交完后,一定要打开浏览一下,以免将附件粘贴错误;在老师未批改之前,可以自行删除作业,并重新提交;作业要保持原题的格式;作业要一次性提交,不能分次交。
4.有关本课的几点说明本课为选修课,学分2分综合成绩为:30%平时成绩+70%期末测验平时成绩:出勤+作业+发言期末测验:笔试、开卷奖励第一讲绪论1.1文献信息检索的重要意义提高信息素养(素质)(见导学)1.2信息、知识、文献1.2.1信息的概念信息是物质的一种属性,是物质存在方式或运动状态的显示或反映,是由物质发出的消息、指令和数据。
信息这一概念应用非常广泛。
不同学科、不同领域的人们分别从各自的角度研究信息、描述信息,因此,有关信息的概念就有众多不同的表述。
据统计,目前关于信息的定义已有百余种之多。
信息的基本性质:普遍性、客观性、中介性、无限性、传递性、时效性、依附性、共享性。
1.2.2知识“知识是人类认识的成果或结晶”,是人类在认识和改造世界的社会实践中获得的对客观事物本质和运动规律的认识。
从不同角度分类。
如按成熟程度可分为经验知识、理论知识;按知识内容的学科性质将知识划分为哲学知识、自然科学知识和社会科学知识等。
1.2.3文献“文献是记录有知识的一切载体”。
这个定义明确了构成文献的三要素,即:知识、记录手段和载体。
知识是文献的内容,载体是文献的形式,记录手段则是联系文献内容与形式的桥梁。
第六章中文数据库检索第一节中国期刊全文数据库一、CNKI(/)简介CNKI(China National Knowledge Infrastructure),中国知识基础设施,简称CNKI 工程。
它由清华大学、清华同方发起,始建于1999 年6 月。
经过近十年努力,建成了世界上全文信息量规模最大的"CNKI 数字图书馆",并启动建设《中国知识资源总库》及CNKI 网格资源共享平台,通过产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台。
CNKI工程已经建立了遍布全国并延伸至海内外的全球化网络化传播服务体系,形成在不同使用方式下的CNKI中心网站——各地镜像站点(CNKI 知识网络管理服务中心)——包库用户并以封闭式镜像站点和光盘为补充的知识生产与传播的良性循环体系。
CNKI 系列数据库产品包括《中国期刊全文数据库》、《中国优秀博硕士论文全文数据库》、《中国重要会议论文全文数据库》和《中国重要报纸全文数据库》等。
全部数据库包含近8000种期刊/杂志,300所大学研究院所博士硕士论文,1000种学术会议论文集,1000种重要报纸文章。
数据涵盖自然科学、工程技术、医学、农业、生物、文学、历史、哲学、政治、经济、法律、教育等领域的最新科技文献资料。
二、中国期刊全文数据库概况《中国期刊全文数据库》(China Journal Full-text Database)是目前世界上最大的连续动态更新的中国期刊全文数据库,目前收录7600 多种综合期刊与专业特色期刊的全文,内容覆盖自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域,其中核心期刊1735 种。
数据服务有网上服务、镜像、光盘等多种形式。
数据库收集时间从1994 年开始,近几年对其中的4000 多种期刊回溯至创刊,到2007年3 月31 日底,文献累积量达2290多万篇。
中国期刊全文数据库所收录的文献覆盖了现有的所有学科,以学科分类为基础,兼顾用户对文献的使用习惯,将数据库中的文献分为九个专辑,每个专辑下分为若干个专题,共计168 个专题。
中文文献检索的常用资源中文文献检索是进行科研工作和学术论文撰写的必要工作。
以下是常用的中文文献检索资源。
1. 中国知网中国知网是国内最大的数字化学术资源库之一,包含文献、期刊、博硕士论文、会议论文等多种类型的学术资源。
其中,文献检索是中国知网的一个重要功能,用户可通过关键词、作者、文献类型等多种方式检索到所需文献。
2. CNKI学术搜索CNKI学术搜索是中国知网旗下的搜索引擎,提供包括文献检索、综合搜索、知识图谱等多种功能。
该搜索引擎集成了国内外各大知名数据库的文献资源,用户可通过关键词、作者、机构等多种方式检索到所需文献。
3. 万方数据库万方数据库是国内知名的学术文献数据库之一,涵盖了学术期刊、学位论文、会议论文、报纸、图书等多种类型的学术资源。
用户可通过关键词、作者、机构等多种方式检索到所需文献。
4. 维普资讯维普资讯是中国知网旗下的另一个学术文献数据库,涵盖了学术期刊、学位论文、会议论文、报纸、图书等多种类型的学术资源。
用户可通过关键词、作者、机构等多种方式检索到所需文献。
5. 中文科技期刊数据库中文科技期刊数据库是由中国科学技术信息研究所建立的一个学术期刊数据库,涵盖了自然科学、工程技术、农业科学、医药卫生、社会科学等多个领域。
用户可通过关键词、期刊、分类等多种方式检索到所需文献。
6. 中国国家图书馆中国国家图书馆是国家级图书馆,拥有着丰富的中文文献资源。
用户可通过图书馆的在线检索系统,检索到所需的中文文献资源。
以上是常用的中文文献检索资源,其中中国知网和CNKI学术搜索是最为常用的资源。
在使用这些资源时,用户需要注意选择合适的检索方式和关键词,以获得更准确的检索结果。
同时,用户还需要注意文献的来源和质量,以保证所引用的文献资源的可信度和权威性。