自动问答综述_郑实福

格式：pdf
大小：206.33 KB
文档页数：7

下载文档原格式

/ 7

自动问答系统中的问题理解的研究的开题报告

自动问答系统中的问题理解的研究的开题报告题目：自动问答系统中的问题理解的研究一、研究背景和意义：随着互联网技术的发展，自动问答系统越来越受到人们的关注。

自动问答系统就是根据用户提出的问题，自动回答相应的答案，如若能够解决用户的问题，会极大优化人们的工作效率，而且在该领域具有重大的应用价值。

然而，目前自动问答系统在问题理解、答案生成、推荐等方面，仍存在较大的问题，因此，本文主要围绕自动问答系统中的问题理解这一方面进行深入研究。

二、文献综述：自动问答系统在英国、美国和日本等国家和地区得到了较为广泛的研究，其重要的一环就是问题理解。

目前自然语言处理技术的发展，为自动问答系统中的问题理解提供了极大的帮助。

具体而言，自然语言处理技术可以帮助自动问答系统对自然语言进行分析、理解和推理，从而更准确地解析用户的问题，进而更好地回答用户的问题。

三、研究问题和内容：本文主要围绕自动问答系统中的问题理解展开研究，旨在解决以下难点：1. 如何对用户提出的问题进行准确、全面的理解，以便更好地回答用户的问题？2. 如何在具体的应用场景下，针对特定的领域、语种和文化环境等不同条件进行问题理解和答案产生？3. 如何在自动问答系统中利用自然语言处理、机器学习等技术，从而优化问题理解和答案生成的效果？本文将通过分析自动问答系统中的问题理解需求和难点，开展对问题理解的方法、技术和应用的深入研究，从而为自动问答系统的设计和应用提供更加科学、有效的理论依据和操作指南。

四、研究方法和步骤：本文将采用文献综述、问题归纳、方案设计、实验验证等多种研究方法和步骤，进行自动问答系统中问题理解的研究。

具体而言，将从以下方面展开工作：1. 收集和分析相关文献，以充分了解自动问答系统中的问题理解和相关技术；2. 对自动问答系统中的问题理解进行分析和总结，找出需求和难点；3. 列出问题理解的方法、技术和应用方案，构建自动问答系统的问题理解模型；4. 通过实验验证，检验问题理解模型的性能和准确性；5. 对研究结果进行总结和分析，提出有关自动问答系统中问题理解的结论和建议。

人工智能中基于大数据的自动问答系统研究

人工智能中基于大数据的自动问答系统研究随着人工智能技术的不断发展，自动问答系统作为其中的一个重点领域也得到了广泛的关注。

自动问答系统是指能够通过计算机程序对自然语言的问题进行处理，从而提供相应的答案。

而这种系统大多数都是基于大数据的，也就是通过对海量数据的处理和分析，提取出其中的规律和知识，从而为自动问答系统提供答案。

自动问答系统的研究可以追溯到上世纪90年代，当时的问答系统主要是以规则为基础的，基本思路是通过人工设定的规则来判断问题的类型，并将其映射到相应的答案上。

但这种方法存在着很多问题，比如处理效率低、受限于规则的表达能力等。

因此更多的研究开始转向基于统计学习的自动问答系统，也就是我们常说的“机器学习”。

自动问答系统的工作原理主要有两个步骤：提问和回答。

其中提问是指将自然语言的问题转化为计算机可处理的形式，回答则是通过分析问题特征和关键词，从大数据中提取相应的答案，并将其转化为自然语言。

因此，自动问答系统需要有一个庞大的数据库支持，这个数据库中不仅包含基本的知识库和词典，还需要对数据进行处理和分析，从而依据问题来提供合理的答案。

基于大数据的自动问答系统的构建难度较大，需要包含以下几个方面的内容：1. 数据预处理由于从互联网上获取的数据可能存在格式不规范、内容不统一、结构复杂等问题，因此需要对数据进行预处理。

这样才能保证后续的问题处理和答案提取的准确性。

数据预处理的具体工作包括：分词、词性标注、命名实体识别、依存句法分析等。

2. 问题分类对于输入的自然语言问题，需要先将其分类，以便针对不同的问题类型采用不同的处理方法。

一般来说，问题分类可分为开放领域和封闭领域，对于开放领域的问题，需要采用更加智能化的技术进行处理。

3. 答案提取在得到问题的类型之后，系统需要从大数据中提取出相应的答案。

答案提取需要依据问题中的关键词进行匹配，同时根据数据分析的结果进行计算和综合，从而得出最终的答案。

4. 答案评估对于得到的答案，需要进行评估，以确保其与问题相匹配，并且可以提供准确的答案。

主体鉴别和信任逻辑（下）

主体鉴别和信任逻辑（下）
南湘浩
【期刊名称】《计算机安全》
【年(卷),期】2002(000)018
【摘要】二、信任逻辑1.问题的提出'美国国防部DoD PKI策略'和'美国联办政府FBCA策略'中也都明确提出,本系统建立在信任转移的基础上。

在'信息保险技术框架'一书中还提到:'信任关系的最重要的扩展是通过交叉认证(cross-certification)将外域合并过来,。

【总页数】3页(P23-25)
【作者】南湘浩
【作者单位】无
【正文语种】中文
【中图分类】TP309
【相关文献】
1.从制度信任到制度自信:改革开放40年国家治理变革的主体逻辑 [J], 杨雪冬
2.社会转型时期我国政府信任生成的内在逻辑--基于公民主体视角的考察 [J], 汪家焰;赵晖
3.主体鉴别和信任逻辑(下) [J],
4.从制度信任到制度自信:改革开放40年国家治理变革的主体逻辑 [J], 杨雪冬[1]
5.BIM应用下项目主体间信任和被信任感对合作创新绩效的影响研究 [J], 张涑贤;王强;王文隆
因版权原因，仅展示原文概要，查看原文内容请购买。

基于本体知识库的智能问答系统研究

基于本体知识库的智能问答系统研究智能问答系统是一种人工智能技术，旨在让机器能够理解和回答人类提出的问题。

基于本体知识库的智能问答系统是将本体知识表示和推理与问答系统相结合，以提供更精确和准确的答案。

本文将探讨基于本体知识库的智能问答系统的研究现状和发展趋势。

近年来，随着人工智能技术的快速发展，智能问答系统在各个领域得到了广泛的应用。

基于本体知识库的智能问答系统是其中一种重要的研究方向。

本体是一种形式化的知识表示方式，将领域知识组织成概念和关系的集合。

通过将本体嵌入到问答系统中，可以使系统更好地理解和回答用户提出的问题。

目前，基于本体知识库的智能问答系统主要分为两个阶段：信息抽取和问答生成。

在信息抽取阶段，系统从本体知识库中提取和整理与问题相关的知识片段。

这个过程通常涉及到实体识别、关系抽取和知识推理等技术。

在问答生成阶段，系统根据从知识库中抽取的知识片段，生成具体的答案。

这个过程通常涉及到自然语言处理和生成、推理和排序等技术。

随着人工智能技术的发展，基于本体知识库的智能问答系统面临一些挑战和问题。

首先，如何构建面向用户需求的本体知识库是一个重要的问题。

本体知识库需要覆盖广泛的领域，并且与用户的实际需求相匹配。

其次，如何有效地从本体知识库中提取和整理与问题相关的知识片段也是一个挑战。

知识库往往非常庞大且复杂，要快速准确地找到与问题相关的知识片段并不是一件容易的事情。

最后，如何生成准确、详细的答案也是一个重要问题。

由于自然语言的复杂性，生成可读且准确的答案仍然是一个具有挑战性的任务。

为了克服这些挑战和问题，一些研究者提出了一些创新的方法和技术。

例如，一些研究者提出了基于图谱的方法来构建本体知识库，将实体、属性和关系组织成图的形式。

这种方法可以更好地表示实体之间的关联和依赖关系。

另一些研究者提出了基于深度学习的方法来进行信息抽取和问答生成。

深度学习模型可以从大量的数据中学习模式和规律，并生成更准确的答案。

高校图书馆参考咨询自动问答体系研究

不是很多。因此，高校图书馆参考咨询自动问答体系的研发及对应用是十分必要的，它为用户提供了一种新型的利用数字资源的方式，它使网络环境下的高校参考咨询服务更加注重主动性和规范性，突破了传统图书馆时间、间及人力资源等限制，空实
现了高校图书馆由“ 藏为中心” 读者为中心 ” 馆向“ 的转移，实现
构建大规模的结构知识库。答疑系统管理模块处理来自浏览器
的各类请求，它需要对用户的提问生成查询关键词，即将使用者的问题经过中文分词、标注后，提取问句中的关键词，然后确定提问答案类型，进行概念语义分析、实体关联等；检索模块根据提问，使用传统的检索方式，检索出相关的信息。最后由答案抽取模块检索出相关段落或从相关段落中抽取与提问答案类型一
人性化，于此，基简述了问答式检索体系的组成及其原理，绍了体系建设中应注意的介
几个问题。
关键词：高校图书馆；参考咨询服务；自动问答体系
中图分类号：２８６Ｇ５．文献标识码：Ａ
ｌ研究背景
科技情报开发与经济
文章编号：０５６３（０２１－０９０１０—０３２１）１０３—３
ＳＩＴＣＦＲＡＩＮＤＶＬＰＥＴ＆ＥＯＯＹＣ—ＥＨＩＯＭＴＯＥＥＯＭＮＮＣＮＭ
２１年０２
第２卷２
第１期１
收稿日期：０２０ — １２１— ２０
参考咨询服务自创立发展至今已有１０年历史。随着高校３图书馆参考咨询服务范围的扩大和深入，国内外越来越多的图

基于人工智能的自动化问答系统研究与实现

基于人工智能的自动化问答系统研究与实现第一章研究背景近年来，随着人工智能技术的快速发展，在各个领域都有着广泛的应用。

其中，自然语言处理领域的发展尤为迅猛。

自然语言处理技术用于处理人与机器之间的交互，其中最核心的技术之一就是问答系统。

问答系统是一种能够自动回答用户提出的自然语言问题的机器应用程序。

基于人工智能的自动化问答系统具有准确、快速、实用等特点，极大地提高了智能提问答案的效率和质量。

然而，目前市面上的问答系统仍然存在不足。

例如，传统的基于检索式(Information Retrieval, IR)的问答系统仅能够根据关键字从海量数据中搜索出相关答案，但缺乏语义分析，不能准确理解用户的意图。

因此，如何结合自然语言处理和人工智能技术来构建更加高效精准的问答系统是当前自然语言处理领域最为重要的研究课题之一。

第二章研究现状目前，已经有许多学者利用自然语言处理和人工智能技术来构建自动化问答系统。

其中，国内外学者采用的主要方法可分为两类：一种是基于规则的方法，另一种是基于机器学习的方法。

基于规则的方法通过构建规则库，利用人工手动设计应对用户提问的规则，再通过知识库的查询和推理实现答案的匹配。

这种方法可控性较高、效率较快，但需要消耗大量的人工成本，并且由于规则库的复杂性，难以适应大量的场景和不同的语境。

基于机器学习的方法则是通过训练模型，利用大数据集和算法建立模型，实现对用户问答的分析和学习，而后对用户提问进行分类和预测。

与规则法相比，机器学习法不需要构建大量规则库，具有较强的智能性和可拓展性，但是需要大量的数据和计算资源，训练时间较长。

值得一提的是，近来涌现出以预训练模型BERT或者其变种为基础的自动问答系统，具有对语言的深刻理解和较高的精度。

第三章系统架构设计在本系统的架构设计中，我们采用了一种混合框架，将传统的规则匹配和机器学习法相结合。

具体实现步骤如下:首先，我们将常见的问题分类，例如：“什么是xx？”，“xx怎么做？”，“xx是谁”，把更好的答案匹配给不同的问题类型，构建了基于规则的问题类型库。

一种机器学习发现系统

一种机器学习发现系统
蔡庆生
【期刊名称】《北京理工大学学报》
【年(卷),期】1990(0)S2
【摘要】提出了一种联想类比法,这种方法把概念类比与方法类比融化一体,其实现使机器在模拟人的类比思维的道路上向前迈进了一步。

本文从理论上给出了不同的类比联想条件,这是联想类比的一个重要问题。

并介绍了作者研制的一个类比学习发现系统GAP,此系统实现了把命题逻辑的概念与推理方法类比到图论中,建立了图形逻辑代数系统,填补了图论中图形逻辑推理的空白。

【总页数】8页(P142-149)
【关键词】联想类比法;智能化;机器学习;类比学习发现系统
【作者】蔡庆生
【作者单位】中国科技大学计算机系
【正文语种】中文
【中图分类】N55
【相关文献】
1.机器学习在图书馆知识发现系统中的应用初探——以基于知识图谱的发现工具Yewno为例 [J], 只莹莹
2.一种基于机器学习发现服务器开放端口的方法 [J], 戴海燕;
3.机器学习与知识发现在高校公共突发事件智能预警系统中的应用 [J], 仇计清;李
晓华;苏连青
4.一种基于机器学习的日志预警发现方法 [J], 黄文博; 王祎珺; 陈佩佩; 汪立欣
5.一种基于阵列式PVDF触觉传感器和机器学习的针刺手法识别系统 [J], 苟升异;宿翀;王磊;赵亚楠;陈捷
因版权原因，仅展示原文概要，查看原文内容请购买。

基于人工智能的自动问答系统研究与应用

基于人工智能的自动问答系统研究与应用随着信息技术的不断发展和普及，人工智能已经成为了当今社会技术领域的热门话题。

人工智能不仅可以替代人工劳动，降低人力成本，还可以提高工作效率和准确性，带来了广阔的市场前景。

在大数据时代，人工智能也被广泛应用于自动问答系统，为人们提供及时、准确、有效的问题解答服务。

一、自动问答系统概述自动问答系统是一种基于人工智能技术的智能化系统，通过自然语言处理、机器学习、语义分析等技术，实现对问题的智能解答。

自动问答系统可以根据用户输入的问题，推测出用户的意图，并从众多的知识库中查找答案，以最简洁清晰的方式向用户提供答案。

自动问答系统的实现主要依赖于技术的创新，如语义理解和知识图谱等技术，这些技术的应用，使自动问答系统愈发精准。

二、自动问答技术原理自然语言处理是自动问答技术的核心，是将人类语言转换为计算机可识别的语言，实现机器与人之间的对话交流。

自动问答技术依赖于自然语言处理技术对语言的处理分析，如分词、词性标注、句法分析和语义分析等技术。

在这些基础技术上，还需要涉及到实体识别、关系抽取和主题分类等衍生技术，以提高答案的质量和准确性。

三、自动问答系统的应用场景自动问答系统不仅在日常生活中得到广泛应用，在企业信息化、医疗健康、金融服务、教育培训和公共服务等领域也有较好的应用前景。

在企业信息化方面，可以将自动问答系统应用于企业官网、客服热线、社交媒体和微信公众号等渠道，通过自动回答常见问题，为客户提供24小时不间断的在线服务。

在医疗健康方面，自动问答系统可以应用于医疗咨询、电子病历管理、健康管理等领域，通过自动回答患者常见问题，为患者提供7*24小时的健康问答服务。

在金融服务方面，自动问答系统可以应用于新客户服务、资讯查询、贷款申请、在线投诉等领域，通过自动回答客户提出的问题，为客户提供更加智能、丰富的金融服务。

在教育培训方面，自动问答系统可以应用于在线教育、虚拟学习环境、智能学习辅助等领域，通过自动回答学生提出的问题，帮助学生更好地理解和掌握知识。

问答系统研究综述

主要数据处理流程如下： (1) 根据问题特点来分析问题, 产生一个结构数据的查询语言格式的查询(对应于问答系统的问题分析部分)。 (2) 将产生的查询提交给管理结构数据的系统 (如数据库等), 系统根据查询的限制条件筛选数据 (对应于问答系统的信息检索部分, 即缩小答案可能存在的范围)。 (3) 把匹配的数据作为答案返回给用户(对应于问答系统的答案抽取部分, 由于数据库查询的精确匹配特性, “抽取”的动作不明显)。系统结构如图 1 所示。
1.2 问答系统的一般处理流程
给定一个问题, 问答系统的处理流程一般如下：首先分析问题, 得到问题的句子成分信息、所属类别和潜在答案类型等信息; 然后根据问题分析得到的信息在数据集中得到可能含有答案的数据, 这缩小了进一步精确分析的范围; 在得到的小范围数据中采用各种技术提取答案或者答案集合; 最后将答案返回给用户。
摘要：近年来, 问答系统被大量广泛地研究。问答系统的目标是给定一个问题, 能够得到简短、精确的答案。根据处理数据的不同, 将问答系统分为三类：基于结构化数据的问答系统、基于自由文本的问答系统、基于问题答案对的问答系统。对这三大类系统的特点、面临的问题和相关的研究分别进行了叙述和总结。最后, 讨论了问答系统未来可能的研究方向。关键词：问答系统(QA); 传统问答系统(TQA); 基于社区的问答系统(CQA); 信息检索; 答案抽取
由于各个阶段处理的数据格式和形式不同, 导致各个阶段解决问答系统的三个基本问题的方法和技术各不相同。本文将分别对这三个阶段各自的问题进行叙述 1)。
3 基于结构化数据的问答系统
基于结构化数据的问答系统的主要思想是通过分析问题, 把问题转化为一个查询(query), 然后在结构化数据中进行查询, 返回的查询结果即为问题的答案。从其基本思想可知, 这种方法一般只能用在限定领域。

基于深度学习的自动问答系统研究

基于深度学习的自动问答系统研究近年来，随着人工智能技术的迅速发展，自然语言处理成为研究的热点之一。

其中，基于深度学习的自动问答系统成为了自然语言处理中的一个重要分支，其可应用于信息检索、智能客服、智能问答等领域。

本文旨在介绍基于深度学习的自动问答系统的研究现状、问题及未来的发展方向。

一、基于深度学习的自动问答系统研究现状自动问答系统是一个包含问答模型和知识库的系统，其中问答模型用于理解用户提问并输出与用户提问相关的答案，而知识库则存储了系统所需的各种知识和信息。

近年来，基于深度学习的自动问答系统已经得到广泛研究和应用。

其中，深度学习模型往往通过学习大量已有的问答对，来实现自动问答的功能。

在模型选择方面，基于循环神经网络(RNN)的模型，如长短时记忆(LSTM)模型，在自然语言处理领域取得了一定的成果。

另外，也有一些基于卷积神经网络(CNN)的模型进行研究，如递归卷积神经网络(R-CNN)等。

在深度学习问答模型的设计方面，通常采用端到端(end-to-end)来实现。

此外，基于知识图谱、无监督自学习等方法也被广泛用于模型的训练和优化。

尽管在研究上，基于深度学习的自动问答系统已取得很大进展，但在实践应用中还面临许多问题。

二、基于深度学习的自动问答系统存在的问题1.数据稀缺性造成的模型不准确随着信息化程度的提高，海量信息的可利用价值越来越高。

但是，在许多任务中，如非常具体的垂直领域等，面临的是过度稀缺的数据问题。

这会严重限制模型的准确性和可信度。

如何解决数据稀缺性，是当前研究的关键方向之一。

2.多领域语义理解能力有限同一个领域内的自然语言理解相比较而言还相对简单，但是在多个领域的情况下，模型往往会遇到词汇方面的问题。

为了解决这些问题，需要采用更深入的语义理解方法。

3.人类的知识是复杂的由于人类的知识是复杂的，包含了不少的常识、抽象概念等对于这一点，没一些调研可发现，自动问答模型对于那些包含常识性问题时，往往难以解决。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

中　文　信　息　学　报第16卷第6期　JOURNAL OF CHINESE INF ORMATION PROCESSING Vol.16No.6自动问答综述郑实福　刘　挺　秦　兵　李　生(哈尔滨工业大学信息检索实验室　哈尔滨　150001)摘要:自动问答技术是自然语言处理领域中一个非常热门的研究方向,它综合运用了各种自然语言处理技术。

本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。

自动问答系统一般包括三个主要组成部分:问题分析、信息检索和答案抽取。

本文分别介绍了这三个主要组成部分的主要功能和常用的方法。

最后还介绍了自动问答系统的评价问题。

关键词:自动问答;问题分类;信息检索;答案抽取中图分类号:TP391.3Overview of Question-AnsweringZHENG Shi-fu　LIU Tin g　QIN Bing　LI Sheng(Information Retrieval Laboratory　Harbin Institute of Technol ogy　Harbin　150001　China)A bstract:Question-Ans wering is a hot research field in Natural Language Processing,which includes many kinds of NLP technology.This paper introduces the current research status and the methods that are often used in Question-Ans wering.In general,a Question-Answering system is made up of three parts:Question Analysis,Information Retrieval and Ans wer Extrac-tion.This paper describes the main functions of these three parts and the common approach used in these parts in detail.At last,this paper introduces the evaluation of Question-Ans wering system.Key words:Question-Answering;question classification;in formation retrieval;ans wer extraction一、引言随着互联网的普及,互联网上的信息越来越丰富,现在人们能够通过搜索引擎方便的得到自己想要的各种信息。

比较有名的搜索引擎有Google、Sohu、Yahoo等。

无论哪方面的内容,这些搜索引擎都能帮助人们快速地找到相关的网页。

用户只需输入一些关键字,它们马上就会搜索出相关的网页。

但是这些传统的搜索引擎存在很多不足的地方,其中主要有三个方面:一是相关性信息太多。

传统的搜索引擎返回的相关网页太多,用户很难快速准确地定位到所需的信息。

例如,用户在Google上输入几个关键字,它有可能返回成千上万个网页,用户将浪费很多时间在这些网页中查找自己所需要的信息。

二是以关键词的逻辑组合来表达检索需求,因为人们的检索需求往往是非常复杂而特殊的,是无法以几个关键词的简单组合来表达的,这样用户都没有将自己的检索意图表达清楚,搜索引擎自然也就没有办法找出令用户满意的答案了。

三是以关键词为基础的索引、匹配算法尽管简单易行,毕竟停留在语言的表层,而没有触及语义,因此检索收稿日期:2002-5-10基金项目:哈尔滨工业大学校自然科学基金项目(HIT.2000.50)郑实福,男,1977年生,硕士生,主要研究方向为自动问答、多文档自动文摘、信息检索.效果很难进一步提高。

为了克服传统搜索引擎的弊端,国外一些有实力的科研机构和大公司正在探索新的检索技术,在这方面最成功的检索系统是美国AskJeeves公司的检索系统,网址为:http:∥www. askjeeves.c om/。

AskJeeves最突出的特点是允许用户用自然语言句子提问,检索系统会自动分析用户的提问,然后通过反问,即人机交互方式,准确地辨识用户的意图,这样用户就能够充分表达他的检索需求,这比Yahoo的关键词检索方式有了明显的进步。

香港科技大学参考AskJeeves的思路正在做中文的提问式搜索引擎Weniwen,网址为:http:∥/。

100多个学生被组织起来对Internet上的各个网页进行提问,这些提问被记录下来作为网页的索引,在实际使用时,如果用户的某个提问与作为索引的某些提问在语义上非常接近,那么就把与这些提问相连的网页返还给用户。

AskJeeves和Weniwen提供了自然语言句子的提问方式,这和关键词的提问方式相比,无疑是一个进步,但是AskJeeves和Weniwen的返回结果仍然是网页,而不是问题的直接答案。

和AskJeeves以及Weniwen不同,自动问答系统既能用自然语言句子提问,又能为用户直接返回所需的答案,而不是相关的网页。

所以,问答系统能更好的满足用户的检索需求,能更快地找出用户所需的答案。

可以说,问答系统就是新一代的搜索引擎。

对于问答系统,用户不需要把自己的问题分解成关键字,用户可以把整个问题直接交给问答系统。

问答系统结合自然语言处理技术,通过对问题理解,能够直接提交给用户想要的答案。

问答系统就像一个知识渊博的专家,可以快速准确地回答任何问题。

比如,用户提交一个问题“上海的简称是什么?”问答系统将会直接给出答案“上海的简称是沪”。

可以看出,问答系统要比传统的搜索引擎方便、快捷、高效。

二、研究概况早在60年代人工智能研究刚开始的时候,就提出了让计算机用自然语言来回答人们的问题,这就是指自动问答系统。

问答系统在80年代的自然语言处理领域曾风行一时,因为Turing 实验告诉人们如果计算机能够象人一样与人进行对话,就可以认为计算机有智能,所以研究者们为了探索语言理解技术,纷纷研究自然语言问答系统。

但是,由于当时的条件限制,所有的实验都是在非常受限的领域,甚至是固定段落上进行的,所以自动问答一直被限制在特殊领域的专家系统。

此后,由于大规模文本处理技术的兴起,问答系统的研究受到了冷落。

最近几年,随着网络和信息技术的快速发展,同时人们想更快地获取信息的愿望也重新促进了自动问答技术的发展。

最近有越来越多的的公司和科研院所参与了自动问答技术的研究。

比如,微软和IB M等著名的跨国公司。

在每年一度的文本信息检索(TRE C)会议上,自动问答(Question Answering Track)是最受关注的主题之一。

越来越多的大学和科研机构参与了TREC会议的Question Answering Track。

在2000年10月召开的ACL2000国际计算语言学学术会议上,有一个专题讨论会,题目是“Open-Domain Question Answering”。

目前,国外已经开发出一些相对成熟的问答系统。

麻省理工(MIT)就开发出一个问答系统Start,从1993年开始发布在Internet上,网址如下:http:∥/projects/infolab/。

可以回答一些有关地理、历史、文化、科技、娱乐等方面的简单问题。

比如:对于问题“What is the longest river in the world?”Start将会回答“With a length of4,180miles,the Nile River is the longest river in the world.”另外还有一个比较成熟的问答系统AnswerBus的网址是:http:∥/～zzheng/qa-new/。

AnswerBus是个多语种的自动问答系统,它不仅可以回答英语的问题,还可以回答法语、西班牙语、德语、意大利语和葡萄牙语的问题。

问答系统一般包括三个主要部分:问题分析、信息检索和答案抽取。

如图1所示:图1　自动问答系统结构对于用户提交的问题,首先要对问题进行分析,要理解用户的要问的是什么。

比如,“华山在哪里?”问题分析模块通过对这个问题的分析,就可以知道用户是在问华山的地理位置。

问题的分析一般包括问题的分类、关键词的提取和关键词扩展。

如果是中文,还需要进行分词处理。

通过问题分析而得到的关键词集需要提交给信息检索模块来查找相关的文档。

检索系统的任务就是在已有的文档库中搜索和关键词集相关的文档。

为了保证对任何问题都能找到相关的文档,文档库必须足够大。

文档库中可以从互联网上下载。

也可以把百科全书加到文档库中。

信息检索模块返回的是一堆相关的网页。

然后答案抽取模块从这些相关的网页中找出相关的答案(一句话,或者是一段)提交给用户。

答案抽取是问答系统的最后一部分,也是难度最大的一部分。

如果答案抽取模块不能准确地把正确答案抽取出来,将严重影响整个问答系统的准确性。

除了上述三个模块之外,有的问答系统还包括了一个常问问题(FAQ)库,把用户经常问的问题及其答案保存起来。

有了FAQ库之后,对用户问的问题先在FAQ库中搜索,看看有没有相同的问题,如果有,就可以直接把FAQ库中这个问题的答案返回。

这样,对于用户常问的问题,问答系统就可以很快给出答案,而不需要经过复杂的处理,而且还能保证答案的正确。

所以有了FAQ库之后,既能提高问答系统的效率,又能提高准确性。

三、问题分析问题的分析是问答系统首先进行的分析工作,这个过程分析的效果对后面的处理过程有着重要的影响。

问题分析部分需要完成以下几部分工作:确定问题的类型、提取出问题的关键词、依据问题的类型等因素对关键词进行适当的扩展。

如果是汉语的问答系统,首先要对问题进行分词以及词性标注等。

有一部分的问答系统还对问题进行了语法分析和语义分析。

3.1　问题分类对不同类型的问题,往往有不同的处理方法,所以不论是英文自动问答系统还是中文自动问答系统一般都有问题分类这个过程。

这里我们以中文问答系统为例。

一般的问答系统都按照疑问短语来对问题的进行分类。

下表列出了常见的问题类型:针对于不同类型的问题制定相应的答案抽取规则,以便在答案抽取阶段应用这些规则来抽取问题的答案。

比如对于询问地点的问题,我们就可以规定,答案中必须含有位置信息。

大部分的自动问答系统都是按照事先规定好的类别进行分类。

但是这种分类还是存在很多不足的地方,太多人为的因素,而且分类太粗,并不能完全符合实际的要求。

所以也有一部分研究人员提出对问题自动分类的思想。