全文数据库(中文)
- 格式:ppt
- 大小:8.37 MB
- 文档页数:84
中文三大全文数据库的比较摘要通过本课程的学习,结合本人的学习情况从三大数据库对论文的收录情况、检索功能、检索结果、检索界面等方面对中文三大全文数据库——《中文期刊网全文数据库》、《维普中文科技期刊数据库》和《万方数据资源系统数字化期刊》进行了比较,阐述了一些自己对这三大全文数据库的认识。
最后并谈了谈本人的学习收获和对本课程的些许建议。
关键词中文期刊网全文数据库维普中文科技期刊数据库万方数据资源系统数字化期刊全文数据库收录情况:这三个数据库基本覆盖了科学技术和社会科学的各个领域。
其中“维普”期刊的收藏量占有绝对优势,几乎覆盖了中国出版的所有中文期刊,并且收录了大量内部发行期刊,收录的年限最长,其中收录自然科学和工程技术方面的期刊量比“CNKI”多出近50%,但在文史哲类方面则几乎是空白,因此,“维普”适合用户进行科技文献的回溯性检索。
“CNKI”重点收录了国内公开出版的核心期刊与具有专业特色的中西文期刊,综合性上做得较好。
而“万方”收录期刊数量为三者中最少,但核心期刊比率高,收录文献的质量最高。
检索功能:三个数据库都提供了关键词、篇名、刊名、作者、机构、文摘等6个检索入口。
就其特殊检索功能而言,“CNKI”在每个检索入口提供了检索词字典,通过使用它可以规范所输入的检索词,有利于更全更准地检索文献信息。
“维普”在主题标引用词的基础上,编制了同义词库,有助于相关文献的检索,提高文献的查全率。
“万方”在检索时,可以对期刊所分布的地域进行限定。
检索结果:比如通过著者字段的检索,张安将教授是从事化学研究的,他所发表的论文是科技方面的,在上表中“CNKI”收录了16篇,“万方”收录了5篇,而“维普”收录了24篇(换成医学方面的);张靖龙教授是从事文学研究的,在上表中“CNKI”收录了9篇,“万方”收录了0篇,“维普”收录了1篇。
从这个比较中可以看出,三个数据库中综合性最强的是“CNKI”。
三个数据库中文摘做得最好的是“CNKI”,不仅可以从中获得文献的基本情况,而且能通过超级链接的方式,找到更多与查找主题相关的内容。
中文期刊全文数据库
主要有哪几个中文全文数据库?
KI中国知网(China National Knowledge Infrastructure):包含期刊、学位论文、报纸等多种形式的文献,多个子数据库,成为目前国内最权威的中文全文数据库,基本上能够检索到各学术期刊从创刊到目前的文章。
2.万方数据:包含期刊、学位论文、会议论文、标准等多种形式的文献,尤其是有标准数据库,可以下载国内各种标准的全文。
数字化期刊这部分内容收录的期刊种类较少,大体上能够检索98年以后的文章。
3.维谱中文期刊全文数据库:以科技期刊为主,能够检索到1989年之后的文章。
CNKI中国知网
•主页内容布局
•期刊文章检索(简单检索、高级检索、专业检索,检索结果的分组与排序、详细记录中文献引用关系
•检索实例
•专业检索作者检索同句检索期刊导航•CNKI知识元简介
检索实例
检索课题:雾霾的监测
课题分析:
1 本课题包含二个概念:雾霾监测。
2 概念扩展:
“雾霾”相关词有:灰霾霾pm2.5
“监测”相关词有:监控
检索式:
TI=(霾+pm2.5)*(监测+监控)
万方数据库
1.主页内容布局
2.期刊文章检索(简单检索、高级检索、检索结果记录特点)
3.学术趋势
维普科技期刊数据库传统检索(同义词与同名作者)高级检索(扩展功能)
分类检索。
中文全文数据库随着信息时代的来临,人们对大量数据的需求越来越高。
其中,文本数据是其中的重要组成部分。
为了更好地对文本数据进行存储、检索和分析,中文全文数据库应运而生。
中文全文数据库是一种以中文文本为对象的数据库系统。
它可以对大量的中文文本进行有效的存储和管理,同时提供快速的检索和分析功能。
中文全文数据库的建立需要通过文本预处理、索引建立和查询处理三个主要步骤来完成。
首先,文本预处理是中文全文数据库的基础工作。
它主要包括中文分词、词性标注和命名实体识别等步骤。
中文分词是将连续的中文字符序列切分成有意义的词汇单元,以便后续的处理。
词性标注是为每个词汇单元确定其在句子中的词性,以便后续的语义分析。
命名实体识别是对文本中的人名、地名、机构名等特定实体进行识别和标注。
其次,索引建立是中文全文数据库的核心步骤。
它主要通过构建适当的索引结构,提高数据库的检索效率。
常用的索引结构包括倒排索引和正排索引。
倒排索引是将每个词汇单元映射到包含该词汇单元的文档集合,以便通过词汇进行文本检索。
正排索引是将每个文档映射到该文档所包含的词汇单元集合,以便通过文档进行文本检索。
索引建立需要考虑索引的更新、压缩和优化等方面的问题。
最后,查询处理是中文全文数据库的重要功能。
它主要包括文本检索、文本相似度计算和文本聚类等操作。
文本检索是通过用户给定的查询语句,从数据库中检索出与查询语句相关的文本集合。
文本相似度计算是通过计算不同文本之间的相似度,为用户提供相关度排序结果。
文本聚类是将数据库中的文本按照一定的相似性进行分组,以便用户更好地理解和分析文本数据。
中文全文数据库的建立和应用,具有广泛的应用场景。
例如,在新闻媒体领域,中文全文数据库可以帮助媒体机构建立新闻文献库,进行新闻内容的存储和检索。
在电商领域,中文全文数据库可以帮助电商平台建立商品信息库,进行商品信息的存储和检索。
在法律领域,中文全文数据库可以帮助律师事务所建立案件文书库,进行案件文书的存储和检索。
1、CNKI中提供()种格式的全文下载。
*• A.一• B.二• C.三• D.四2、CNKI的专业检索中可检索字段“FT”代表()。
*• A.题名• B.关键词• C.全文• D.摘要3、CNKI中可检索到核心期刊影响因子的检索方式是()。
*• A.期刊导航• B.跨库检索• C.专业检索• D.快速检索4、CNKI的句子检索是指()。
*• A.在题目的同一句话中同时包含两个词• B.摘要的同一段中同时包含两个词• C.摘要中的同一句中包含两个词• D.全文的同一句或同一段中同时包含两个词5、以下哪个数据库可创建个人数字图书馆?() *• KI• B.中国生物医学文献数据库(CBM)• C.万方数据库• D.维普数据库6、CNKI中可实现一个检索项包含多个检索词以及多个检索项之间组配的检索是()。
*• A.标准检索• B.高级检索• C.专业检索• D.快速检索7、在维普数据库的传统检索界面检索作者王伟发表的文献,可以通过勾选()选项排除同名不同单位的其他作者。
*• A.同义词• B.同名作者• C.关键词• D.摘要8、()可以实现原貌打印封面和目录页。
*• KI• B.维普数据库• C.万方数据库• D.sinomed9、维普中文科技期刊数据库的检索途径不包括()。
*• A.引文检索• B.基本检索• C.高级检索• D.传统检索10、CNKI的检索结果可以实现()的批量导出和下载。
*• A.题录文摘• B.全文• C.图片• D.表格11、万方数据库无法检索()。
*• A.期刊论文• B.学位论文• C.会议文献• D.年鉴12、CNKI中的检索结果能以哪种方式显示?() *• A.NE格式• B.全文格式• C.题录列表或摘要格式• D.引文格式13、下列哪个数据库收录了中华医学会系列期刊2008年以后的全文?() *• A.中国生物医学文献数据库(CBM)• B.维普科技期刊全文数据库• C.万方全文数据库• KI14、维普数据库分类导航系统是依据()。
1、中国生物医学文献数据库(CBM)中,最多可以保存多少条检索式?(B) *∙ A.一百∙ B.两百∙ C.三百∙ D.四百2、以下说法正确的是(D)。
*∙ A.中国生物医学文献数据库(CBM)和CNKI都有主题词表。
∙ C.中国生物医学文献数据库(CBM)和PubMed均采用医学主题词表和中医药学主题词表进行主题标引。
∙ D.在中国生物医学文献数据库(CBM)高级检索的检索入口中,常用字段是中文标题、摘要、关键词、主题词的组合项。
3、中国生物医学文献数据库(CBM)的检索有关某个课题“Meta分析”方面的文章可以从以下哪类限定里选择?(C) *∙ A.年代范围∙ B.对象类型∙ C.文献类型∙ D.年龄组4、可以区分“第一作者机构分布”的是以下哪种检索途径?(C) *∙ A.主题检索∙ B.期刊检索∙ C.作者检索∙ D.高级检索5、以下说法正确的是(A)。
*∙ A.检索中国生物医学文献数据库(CBM)有关研究对象是65岁以上老年人的文章可以利用限定检索功能。
∙6、中国生物医学文献数据库(CBM)中,以下哪项检索式是不正确的?(A) *∙ A.国家*基金∙ B.国家%基金7、在中国生物医学文献数据库(CBM)中检索“高血压的并发症”方面的核心期刊文献,下列哪个选项是正确的?(D) *∙ A.主题检索,选择主题词“ 高血压”,选择副主题词“并发症”,执行检索∙ B.基本检索,输入“高血压的并发症”,执行检索∙ C.主题检索,选择主题词“高血压”,选择副主题词“并发症”,检索结果界面,限定条件设置文献类型为综述∙ D.主题检索,选择主题词“高血压”,选择副主题词“并发症”,检索结果界面,限定条件设置文献类型为核心期刊8、在中国生物医学文献数据库(CBM)中检索“肥厚性胃炎的预防”方面的综述文献,最优的检索策略是(C)。
*∙ A.主题检索,选择主题词“ 胃炎, 肥厚性”,选择副主题词“预防和控制”,执行检索"∙ B.基本检索,输入“肥厚性胃炎的预防”,执行检索∙ C.主题检索,选择主题词“胃炎, 肥厚性”,选择副主题词“预防和控制”,检索结果界面,限定条件设置文献类型为综述∙ D.主题检索,选择主题词“胃炎, 肥厚性”,选择副主题词“预防和控制”,检索结果界面,限定条件设置文献类型为病例报告9、中国生物医学文献数据库(CBM)中快速检索中集成的智能检索包括(B)。