中文信息检索系统
- 格式:ppt
- 大小:4.51 MB
- 文档页数:35
一、实习背景随着信息技术的飞速发展,数据库已经成为我们获取信息、开展研究的重要工具。
为了提高自身的数据库检索能力,我参加了中文数据库检索实习,通过实际操作,掌握中文数据库的检索技巧,提高信息检索的效率。
二、实习目的1. 熟悉中文数据库的基本结构、检索方法和特点;2. 学会运用数据库检索工具进行文献检索,提高信息检索能力;3. 培养严谨的学术态度和良好的信息素养。
三、实习内容本次实习主要涉及以下中文数据库:中国知网(CNKI)、万方数据资源系统、维普中文科技期刊数据库、超星数字图书馆等。
1. 中国知网(CNKI)(1)检索步骤:打开中国知网首页,选择“高级检索”或“快速检索”,根据所需检索的文献类型(如期刊、学位论文、会议论文等)进行选择,然后输入关键词、作者、机构等检索条件,点击“检索”即可。
(2)著录方法:检索结果页面显示文献列表,点击所需文献标题,进入详细页面。
详细页面包括文献信息、作者信息、机构信息、关键词、摘要等内容。
根据实际需要,对文献进行下载、收藏或打印。
2. 万方数据资源系统(1)检索步骤:打开万方数据资源系统首页,选择“高级检索”或“快速检索”,输入关键词、作者、机构等检索条件,点击“检索”即可。
(2)著录方法:检索结果页面显示文献列表,点击所需文献标题,进入详细页面。
详细页面包括文献信息、作者信息、机构信息、关键词、摘要等内容。
根据实际需要,对文献进行下载、收藏或打印。
3. 维普中文科技期刊数据库(1)检索步骤:打开维普中文科技期刊数据库首页,选择“高级检索”或“快速检索”,输入关键词、作者、机构等检索条件,点击“检索”即可。
(2)著录方法:检索结果页面显示文献列表,点击所需文献标题,进入详细页面。
详细页面包括文献信息、作者信息、机构信息、关键词、摘要等内容。
根据实际需要,对文献进行下载、收藏或打印。
4. 超星数字图书馆(1)检索步骤:打开超星数字图书馆首页,选择“高级检索”或“快速检索”,输入关键词、作者、机构等检索条件,点击“检索”即可。
一、填空题1.NSTL是(国家科技图书文献中心)的简称。
2.(信息检索系统)是指由一定的设备和信息集合构成,具有一定存储、检索与传送技术设备,提供一定的存贮与检索方法及检索服务功能的工作系统。
3.体系分类表通常由(类目表、标记符号、说明和注释、类目索引)4个部分组成。
4. 正式出版的中文期刊在检索工具和数据库中一般著录有国际标准刊号(ISSN)和国内统一刊号(CN)。
5. 缩写刊名“J.Anal.Chem.”还原成原刊名为(Journal of Analytical Chemistry)。
6. CASHL是指(中国高校人文社会科学文献中心),其英文全称是China Academic Social Sciences and Humanities Library,是全国性的、唯一的人文社科外文期刊收藏和服务中心。
2002年开始规划建设,2004年3月15日正式启动7. 电子期刊,指以(数字或称电子)形式出版发行的期刊,英文为(electronicJournal),简称e-journal.8. 国家知识基础设施(National Knowledge Infrastructure,NKI)的概念,由世界银行提出于1998年。
CNKI是指(中国基础知识设施工程),它是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于(1999)年6月。
KI平台的检索方式有(单库检索)、(跨库检索)、(数据库导航),在单库和跨库检索中有(初级)、(高级)、(专业)三种检索方式。
10.(报告号)是识别科技报告的显著标志。
11. 专利文献著录中,除了和专利有关的(专利名称)、(发明人)和(专利权人)等之外,还著录有(专利公布号)、(国际专利分类号)、(优先权号),有的还有申请号和申请日期、公布日期等。
13. 分类检索语言又称分类法,是用(分类号)和(类名)来表达信息的主题概念,并且按照知识门类的逻辑次序将信息系统地组织和划分的语言。
重庆大学硕士学位论文中文摘要摘要问答技术是自然语言处理领域中一个非常热门的研究方向,它综合运用了各种自然语言处理技术。
目前,国内外有很多的科研机构参与了英文问答技术的研究,甚至己经有相对成熟的英文问答系统,但是参与中文自动问答技术研究的科研机构并不是很多,而且基本没有成型的中文问答系统。
本文正是对中文问答技术研究的一个探索。
基于自然语言处理的中文问答系统包括五个主要组成部分:问题理解、信息检索、信息处理、答案抽取、FAQ模块五个子系统。
信息检索模块是自动问答系统中最重要的模块之一,检索的结果对后面的处理,以至找到问题的正确答案都有很大的影响,同时它也是智能咨询系统、机器对话等研究的重要方面。
本文充分结合了汉语语言的特点以及计算语言学的技术,对问答系统中信息检索模块进行了深入分析,指出了在实际的使用问答系统的时候,用户的回答质量参差不齐。
我们不但要尽量检索相似度高的文档,而且还希望检索出来的文档的质量尽可能的好,而传统的信息检索中常用的四种数学模型:布尔模型、模糊逻辑模型、向量模型和概率模型以及基于语言模型的信息检索模型在计算相似度的时候都没有考虑到问题的质量。
本文通过最大熵方法用困惑度、序列模型、词的搭配作为特征来评估文档的质量,最后利用翻译模型把问题质量成功的集成到检索模型中。
最后,我们从社区问答系统中抽取问答对作为语料进行测试,试验结果表明引入文档质量到检索模型中比传统的检索模型能取得更好的试验结果。
关键词:问答系统,信息检索,文档质量,语言模型,最大熵我本沉默ELIZA扮演一个心理学专家的角色,采用启发式的心理疗法,通过反问应对精神病人的提问,诱导病人不停地说话,从而达到对病人进行心理治疗的目的。
1971年,Winograd利用MACLISP语言开发了SHRDLU问答系统。
SHRDLU包括解析器、英语语法识别器、语义分析器、一般问题解答器等。
该系统主要是用于儿童积木话题,并且取得了较好的效果。