问答系统研究现状
- 格式:docx
- 大小:9.12 KB
- 文档页数:3
基于自然语言处理的医疗问答系统研究与实现一、综述随着互联网的普及和医疗知识的不断更新,越来越多的人开始关注医疗健康问题。
然而由于医学专业知识的复杂性和专业性,很多人在遇到疾病或健康问题时,往往感到无从下手,不知道如何获取准确的信息。
这就催生了医疗问答系统的需求。
医疗问答系统是一种基于自然语言处理技术的智能问答系统,它可以为用户提供实时、准确、便捷的医疗咨询服务。
通过分析用户的提问,系统可以自动识别问题的关键词,从海量的医学数据库中检索相关信息,并以易于理解的方式呈现给用户。
这样一来用户不仅可以快速了解疾病的病因、症状、治疗方法等基本信息,还可以根据自己的实际情况,得到专业的建议和指导。
目前国内外已经有很多研究团队和企业投入到医疗问答系统的开发和应用中。
例如美国的健康问询公司Cerner推出了Cerner Connect OnQ,一个面向患者的移动医疗问答平台;我国的阿里巴巴、腾讯等互联网巨头也纷纷涉足这一领域,推出了一些具有代表性的产品和服务。
尽管目前已有的一些医疗问答系统在一定程度上缓解了人们的求医难题,但仍然存在许多不足之处。
例如系统的回答可能不够准确、全面;对于一些复杂疾病或特殊情况,系统的诊断能力有限;此外,现有的医疗问答系统大多以文字形式呈现信息,用户体验相对较差。
因此本文旨在通过对现有研究的总结和分析,探讨基于自然语言处理技术的医疗问答系统的研究现状和发展趋势,以期为相关领域的研究者和实践者提供参考。
1. 背景和意义:介绍自然语言处理技术在医疗行业中的应用现状和前景,以及本文的写作目的和意义咱们都知道,自然语言处理(NLP)技术已经在各个领域取得了显著的成果,从智能客服到机器翻译,从情感分析到文本摘要。
而在医疗行业,NLP技术也有着广泛的应用前景,它可以帮助医生更高效地处理大量的医学文献、病历数据,提高诊断准确率,降低误诊率,同时也能让患者更方便地获取专业的医疗建议。
因此研究并实现一个基于自然语言处理的医疗问答系统,对于推动医疗行业的智能化发展具有重要的意义。
基于本体知识库的智能问答系统研究智能问答系统是一种人工智能技术,旨在让机器能够理解和回答人类提出的问题。
基于本体知识库的智能问答系统是将本体知识表示和推理与问答系统相结合,以提供更精确和准确的答案。
本文将探讨基于本体知识库的智能问答系统的研究现状和发展趋势。
近年来,随着人工智能技术的快速发展,智能问答系统在各个领域得到了广泛的应用。
基于本体知识库的智能问答系统是其中一种重要的研究方向。
本体是一种形式化的知识表示方式,将领域知识组织成概念和关系的集合。
通过将本体嵌入到问答系统中,可以使系统更好地理解和回答用户提出的问题。
目前,基于本体知识库的智能问答系统主要分为两个阶段:信息抽取和问答生成。
在信息抽取阶段,系统从本体知识库中提取和整理与问题相关的知识片段。
这个过程通常涉及到实体识别、关系抽取和知识推理等技术。
在问答生成阶段,系统根据从知识库中抽取的知识片段,生成具体的答案。
这个过程通常涉及到自然语言处理和生成、推理和排序等技术。
随着人工智能技术的发展,基于本体知识库的智能问答系统面临一些挑战和问题。
首先,如何构建面向用户需求的本体知识库是一个重要的问题。
本体知识库需要覆盖广泛的领域,并且与用户的实际需求相匹配。
其次,如何有效地从本体知识库中提取和整理与问题相关的知识片段也是一个挑战。
知识库往往非常庞大且复杂,要快速准确地找到与问题相关的知识片段并不是一件容易的事情。
最后,如何生成准确、详细的答案也是一个重要问题。
由于自然语言的复杂性,生成可读且准确的答案仍然是一个具有挑战性的任务。
为了克服这些挑战和问题,一些研究者提出了一些创新的方法和技术。
例如,一些研究者提出了基于图谱的方法来构建本体知识库,将实体、属性和关系组织成图的形式。
这种方法可以更好地表示实体之间的关联和依赖关系。
另一些研究者提出了基于深度学习的方法来进行信息抽取和问答生成。
深度学习模型可以从大量的数据中学习模式和规律,并生成更准确的答案。
基于人工智能的自动问答系统研究及应用引言随着人工智能技术的发展和普及,自动问答系统(QA System)被广泛应用于各个领域。
这些系统通过自然语言处理技术和机器学习算法来理解用户提出的问题,并返回最合适的答案或解决方案。
自动问答系统在教育、医疗、客服等领域已经取得了显著的成果。
本文将重点介绍基于人工智能的自动问答系统的研究现状和应用。
一、自动问答系统的研究现状自动问答系统是一个复杂的技术系统,涉及自然语言处理、知识表示和推理、互联网搜索等多个领域。
目前,自动问答系统的研究主要集中在以下几个方面。
1. 自然语言理解自然语言理解是自动问答系统中最重要的一部分。
这个阶段需要将用户提出的自然语言问题转化为机器能够处理的形式,如意图识别、实体识别、关系提取等。
目前,自然语言处理技术已经取得了很大的进展,如情感分析、文本分类、语义分析等技术已经可以解决困难的问题。
2. 知识表示和推理知识表示和推理是自动问答系统的另一个关键组成部分。
这个阶段需要将用户的问题与相应的知识库进行匹配,如基于本体的知识表示和推理、基于图谱的知识表示和推理等。
现在,已有大量的知识库可以供自动问答系统使用,如Freebase、YAGO、Wikidata等知识库。
3. 智能检索和融合智能检索和融合是自动问答系统的最后一步。
这个阶段需要将答案或解决方案从不同的知识源中进行合并,如基于关键字的答案检索、基于语义相似度的答案检索、基于本体和知识图谱的答案检索等。
二、自动问答系统的应用自动问答系统在各个领域都有着广泛的应用。
1. 教育领域自动问答系统在教育领域中的应用主要集中在在线学习和MOOC教育上。
学生可以通过自动问答系统向老师提出问题,老师可以利用系统来回答这些问题。
同时,MOOC教育平台也可以通过自动问答系统来对学生进行自动评估和反馈。
2. 医疗领域自动问答系统在医疗领域中的应用主要集中在临床支持系统和医疗智能问答系统上。
临床支持系统可以帮助医生对病情进行准确的诊断和治疗计划,医疗智能问答系统则可以帮助患者更好地理解医学知识和医学问题。
《融合FAQ、本体和推理技术的问答系统研究》一、引言随着互联网的迅猛发展,信息量的爆炸式增长使得用户对于快速、准确获取信息的需求日益增强。
问答系统作为一种能够直接回答用户问题的技术手段,受到了广泛关注。
本文将重点研究融合FAQ、本体和推理技术的问答系统,探讨其研究背景、意义、现状及发展趋势。
二、研究背景与意义在当今信息爆炸的时代,问答系统成为用户获取信息的重要途径。
FAQ(Frequently Asked Questions)作为常见的问题解答方式,具有简单、直接的特点。
本体作为一种知识表示方法,能够有效地描述领域知识。
推理技术则能够根据已知信息推导出未知信息。
将FAQ、本体和推理技术融合,可以构建一个高效、智能的问答系统,提高用户获取信息的效率。
三、国内外研究现状目前,国内外学者在问答系统领域进行了大量研究。
在FAQ 方面,许多网站通过整理常见问题及答案,为用户提供便捷的信息获取方式。
本体技术方面,研究者们利用本体描述语言构建领域本体,实现知识的语义化表示。
推理技术方面,各种推理算法被广泛应用于知识推理、问答系统等领域。
然而,将FAQ、本体和推理技术融合的问答系统研究尚处于初级阶段,仍需进一步探索。
四、融合FAQ、本体和推理技术的问答系统4.1 系统架构融合FAQ、本体和推理技术的问答系统架构主要包括数据层、知识层和逻辑层。
数据层负责存储FAQ数据和领域知识;知识层利用本体技术构建领域本体,实现知识的语义化表示;逻辑层则负责实现问答系统的推理功能。
4.2 关键技术(1)FAQ处理:对FAQ数据进行预处理,提取关键信息和问题类型。
(2)本体构建:利用本体描述语言构建领域本体,实现知识的语义化表示。
(3)推理技术:采用各种推理算法,根据用户问题推导出相关答案。
(4)问答匹配:将用户问题与知识库中的信息进行匹配,找出最佳答案。
4.3 系统实现在系统实现过程中,需要解决以下问题:如何将FAQ数据与领域知识融合?如何构建有效的领域本体?如何设计高效的推理算法?针对这些问题,可以采用以下方法:(1)将FAQ数据转化为结构化知识,与领域知识进行融合。
中文问答系统问句分析研究综述随着科学技术的不断发展,人工智能技术在各个领域得到广泛应用,极大地改善了人们的生活质量。
中文问答系统的出现,为人们解决科技大爆炸中所存在的诸多困惑提供了可行的解决方案。
本文综述了当前在中文问答系统问句分析领域开展的有关研究,对研究进行了归纳与总结。
一、中文问答系统问句分析的研究现状近年来,中文问答系统的研究日趋成熟,并受到广大研究者的热情关注。
例如,郝育明等人就研究了一种深度学习中文问答系统,提出了一种新的深度学习模型,用于从大规模中文文本中快速学习机器学习技术,具有更高的准确性和可靠性;詹林刚等人提出了一种新的中文问答系统,结合机器学习和调查方法,可以自动抽取文本中问句、答句,构建中文问答数据库,以解决自然语言处理中问答理解问题;李明华等人提出了一种基于共现信息的中文问答系统,通过对文本的多层分析,能够从共现信息中提取词语,形成词汇组合,用于构建问答知识网络,帮助理解语义,可提高回答的准确性。
二、中文问答系统问句分析的挑战实际上,中文问答系统问句分析领域仍然有着很多挑战和不足:首先,数据缺乏。
虽然有一些语料库可以用于训练,但是这些语料库不全面且数量有限,无法覆盖语料库中所有类型的问句;其次,语言表达多样化,句子结构复杂。
由于汉语是一种复杂而多变的语言,语句结构多样且常常具有变化性,而普通的机器学习技术无法很好地跟踪和理解这种变化;此外,文本数据繁多,问答数据量大。
中文文本数据量十分庞大,如何高效、准确地从大量文本中抽取有效信息一直是机器学习技术面临的一大挑战。
三、中文问答系统问句分析的发展鉴于当前技术的不足,未来中文问答系统问句分析的发展方向可以分为三个方面:(1)深化语言理解,加强句法分析。
借助语言理解技术,在句法分析上应该深入研究,开展更多更深入的研究,如自然语言处理、话语分析等,以提高系统的语言理解能力。
(2)实现自然语言生成。
应借鉴人类自然语言表达能力,完善机器对文本理解能力,开发基于自然语言生成模型的中文问答系统,让机器能够根据用户问句的语义更准确地进行回答。
基于人工智能的自动化问答系统研究与实现第一章研究背景近年来,随着人工智能技术的快速发展,在各个领域都有着广泛的应用。
其中,自然语言处理领域的发展尤为迅猛。
自然语言处理技术用于处理人与机器之间的交互,其中最核心的技术之一就是问答系统。
问答系统是一种能够自动回答用户提出的自然语言问题的机器应用程序。
基于人工智能的自动化问答系统具有准确、快速、实用等特点,极大地提高了智能提问答案的效率和质量。
然而,目前市面上的问答系统仍然存在不足。
例如,传统的基于检索式(Information Retrieval, IR)的问答系统仅能够根据关键字从海量数据中搜索出相关答案,但缺乏语义分析,不能准确理解用户的意图。
因此,如何结合自然语言处理和人工智能技术来构建更加高效精准的问答系统是当前自然语言处理领域最为重要的研究课题之一。
第二章研究现状目前,已经有许多学者利用自然语言处理和人工智能技术来构建自动化问答系统。
其中,国内外学者采用的主要方法可分为两类:一种是基于规则的方法,另一种是基于机器学习的方法。
基于规则的方法通过构建规则库,利用人工手动设计应对用户提问的规则,再通过知识库的查询和推理实现答案的匹配。
这种方法可控性较高、效率较快,但需要消耗大量的人工成本,并且由于规则库的复杂性,难以适应大量的场景和不同的语境。
基于机器学习的方法则是通过训练模型,利用大数据集和算法建立模型,实现对用户问答的分析和学习,而后对用户提问进行分类和预测。
与规则法相比,机器学习法不需要构建大量规则库,具有较强的智能性和可拓展性,但是需要大量的数据和计算资源,训练时间较长。
值得一提的是,近来涌现出以预训练模型BERT或者其变种为基础的自动问答系统,具有对语言的深刻理解和较高的精度。
第三章系统架构设计在本系统的架构设计中,我们采用了一种混合框架,将传统的规则匹配和机器学习法相结合。
具体实现步骤如下:首先,我们将常见的问题分类,例如:“什么是xx?”,“xx怎么做?”,“xx是谁”,把更好的答案匹配给不同的问题类型,构建了基于规则的问题类型库。
基于知识库的智能问答技术研究智能问答技术是人工智能领域的重要应用之一,主要目的是让机器能够理解人类提出的问题,并给出准确有效的答案。
随着互联网的发展,知识库的建设和应用越来越普及,这使得基于知识库的智能问答技术成为了热门研究方向之一。
从大数据时代到人工智能时代的转变,知识管理的能力已经成为新时代具有全球竞争力的企业所需要的核心能力之一。
本文将重点介绍基于知识库的智能问答技术的研究现状和未来发展趋势。
一、知识库的概念和特点知识库是一种数据仓库,用于存储和管理组织内的知识和经验。
它可以包括各种形式的知识,如文本文档、图像、音频或视频等。
知识库的主要特点包括以下几个方面:1.全面性。
知识库可以包括组织内各个部门的知识和信息,不仅仅是特定领域的知识。
2.实时性。
知识库中的信息应当及时更新和发布。
3.可信性。
知识库中的信息应当经过验证和审核,确保其准确性和可靠性。
4.可重用性。
知识库中的知识和经验应当能够在不同的场景中重复使用,提高效率和准确率。
二、基于知识库的智能问答技术的研究现状基于知识库的智能问答技术的研究已经持续了多年,主要分为以下几个方面的研究:1.自然语言理解。
智能问答技术的核心是自然语言的理解和处理,因此自然语言理解研究一直是该领域的重要研究方向。
2.知识表示和存储。
知识库是智能问答系统的核心组成部分,因此知识的表示和存储也是该领域的研究重点。
3.问题解析和回答生成。
问题解析和回答生成是整个智能问答过程中最重要的两个环节,也是该领域研究的热点之一。
4.用户交互和界面设计。
用户交互和界面设计是智能问答系统与用户交互的方式,因此合理的交互设计和界面设计对于系统的使用效果至关重要。
三、智能问答技术的应用和未来发展趋势智能问答技术已经在许多领域得到了广泛应用,如:1.智能客服。
智能问答技术可以用于客服自动应答系统的实现,帮助企业提高客户服务质量和效率。
2.智能助手。
智能问答技术可以应用于智能助手,如智能音箱、智能手机等产品,使用户可以通过简单的语音指令获取所需信息。
基于深度学习的自动问答系统研究近年来,随着人工智能技术的迅速发展,自然语言处理成为研究的热点之一。
其中,基于深度学习的自动问答系统成为了自然语言处理中的一个重要分支,其可应用于信息检索、智能客服、智能问答等领域。
本文旨在介绍基于深度学习的自动问答系统的研究现状、问题及未来的发展方向。
一、基于深度学习的自动问答系统研究现状自动问答系统是一个包含问答模型和知识库的系统,其中问答模型用于理解用户提问并输出与用户提问相关的答案,而知识库则存储了系统所需的各种知识和信息。
近年来,基于深度学习的自动问答系统已经得到广泛研究和应用。
其中,深度学习模型往往通过学习大量已有的问答对,来实现自动问答的功能。
在模型选择方面,基于循环神经网络(RNN)的模型,如长短时记忆(LSTM)模型,在自然语言处理领域取得了一定的成果。
另外,也有一些基于卷积神经网络(CNN)的模型进行研究,如递归卷积神经网络(R-CNN)等。
在深度学习问答模型的设计方面,通常采用端到端(end-to-end)来实现。
此外,基于知识图谱、无监督自学习等方法也被广泛用于模型的训练和优化。
尽管在研究上,基于深度学习的自动问答系统已取得很大进展,但在实践应用中还面临许多问题。
二、基于深度学习的自动问答系统存在的问题1.数据稀缺性造成的模型不准确随着信息化程度的提高,海量信息的可利用价值越来越高。
但是,在许多任务中,如非常具体的垂直领域等,面临的是过度稀缺的数据问题。
这会严重限制模型的准确性和可信度。
如何解决数据稀缺性,是当前研究的关键方向之一。
2.多领域语义理解能力有限同一个领域内的自然语言理解相比较而言还相对简单,但是在多个领域的情况下,模型往往会遇到词汇方面的问题。
为了解决这些问题,需要采用更深入的语义理解方法。
3.人类的知识是复杂的由于人类的知识是复杂的,包含了不少的常识、抽象概念等对于这一点,没一些调研可发现,自动问答模型对于那些包含常识性问题时,往往难以解决。
检索式自动问答研究综述随着技术的快速发展,检索式自动问答作为一种重要的应用,已经引起了广泛的和研究。
本文将综述检索式自动问答领域的研究现状、存在的问题和发展趋势,旨在为相关研究和应用提供参考和借鉴。
检索式自动问答是一种基于自然语言处理和信息检索技术的人工智能系统,它可以通过对用户提出的问题进行分析和理解,自动地在海量数据中寻找匹配的答案。
这种技术具有广泛的应用前景,可以应用于考试系统、咨询系统、智能客服等领域,为人们提供更加便捷和高效的信息获取方式。
检索式自动问答的定义、原理和实现方法检索式自动问答是基于自然语言处理和信息检索技术的智能化问答系统。
其基本原理是将用户提出的问题转化为计算机可理解的语言,通过在大量的数据中进行信息检索,找到与问题相关的答案。
实现方法主要包括文本匹配、语义理解和深度学习等。
检索式自动问答在考试系统、咨询系统、智能客服等领域的应用在考试系统中,检索式自动问答技术可以用于智能出题、自动判卷和个性化学习等方面。
在咨询系统中,它可以用于自动化客服、智能推荐和聊天机器人等方面。
在智能客服领域,检索式自动问答技术可以用于自动化回复、智能问答和语音识别等方面。
尽管检索式自动问答技术已经取得了很大的进展,但是仍然存在一些问题和挑战。
数据采集和自然语言处理是检索式自动问答技术的核心,但是这些技术的精度和效率还有待提高。
人机交互方面也存在一些问题,如理解用户的意图、生成自然的回复等。
如何构建大规模的高质量知识库是检索式自动问答技术面临的又一挑战。
根据前人的研究,检索式自动问答技术的发展趋势和未来研究方向可以总结为以下几点:随着强化学习和深度学习等新的学习方法的不断发展,如何将这些方法应用于检索式自动问答技术中,以提高答案的精度和效率是未来的一个重要研究方向。
例如,可以通过深度学习方法来提高自然语言处理的精度,从而进一步提高检索式自动问答的效率。
自然语言处理和数据挖掘等技术的融合,可以帮助进一步提高检索式自动问答技术的效率和精度。
AI智能问答近年来,随着人工智能技术的迅猛发展,AI智能问答系统越来越受到人们的关注。
这些系统利用自然语言处理、知识图谱和机器学习等技术,使得机器能够理解并回答用户提出的问题。
本文将从定义和原理、应用领域、优势与挑战等方面,探讨AI智能问答系统的发展现状和未来前景。
1. 定义和原理AI智能问答系统是一种能够通过自然语言进行交互、理解用户问题并给出准确答案的人工智能系统。
其基本原理是将用户提问转化为机器可以理解和处理的形式,然后通过数据挖掘、自然语言处理和知识图谱等技术,从大规模的数据和知识库中提取与问题相关的信息,最终给出用户满意的回答。
2. 应用领域AI智能问答系统在许多领域都有广泛的应用。
首先是教育领域,这些系统可以作为学生学习的辅助工具,为学生提供及时、准确的答案和解释,帮助他们更好地理解和掌握知识。
其次是客服领域,许多企业和组织可以利用智能问答系统来解决客户的问题和需求,提高服务质量和效率。
此外,智能问答系统还可以用于医疗、法律、金融等专业领域,为专业人士提供准确的答案和指导。
3. 优势与挑战AI智能问答系统具有一些明显的优势。
首先,它们可以处理大量的信息和知识,并能够快速提供准确的答案,节省用户的时间和精力。
其次,智能问答系统可以通过不断学习和优化,不断提高自己的准确性和智能程度。
然而,智能问答系统也面临一些挑战。
例如,理解用户的问题并找到相关的答案需要解决自然语言处理中的语义理解和语义匹配问题。
此外,智能问答系统还需要有效地处理多义词、复杂的问题结构和领域特定的知识。
4. 发展现状与前景目前,AI智能问答系统已经在某些领域取得了令人瞩目的成就。
例如,IBM的Watson系统在2011年赢得了美国电视常识竞答节目《危险边缘》的冠军,并成功应用于医疗、金融和客服等领域。
此外,类似百度的小度和苹果的Siri等智能语音助手也广泛应用于智能问答系统。
未来,随着技术的进一步发展和应用场景的扩大,AI智能问答系统有望在不同领域发挥更大的作用。
问答系统研究现状
作者:宋华丽,张玉芳
来源:《计算机光盘软件与应用》2011年第15期
摘要:问答系统是信息检索的高级形式,也是该领域的研究重点和热点。
该文首先给出问答系统的定义,然后对现有各类问答系统进行了介绍,并对其核心技术、测评标准进行了分析,最后对问答系统的发展方向进行了展望。
关键词:问答系统;聊天机器人;问答式检索系统;测评标准
中图分类号:TP391 文献标识码:A文章编号:1007-9599 (2011) 15-0000-01
Q&A System Research Status
Song Huali1,Zhang Yufang2
(1.Southwestern University Yucai College Institute of
Technology,Chongqing401524,China;2.School of Computer Science,Chongqing
University,Chongqing400044,China)
Abstract:Q&A system is an advanced form of information retrieval,but also in the field of research priorities and focus.This paper first gives the definition of Q system,then the existing types of question answering system was introduced,and its core technologies,measurement standards were analyzed,and finally on the answering system development was predicted.
Keywords:Question answering system;Chat robot;Questions and answers retrieval
system;Evaluation criteria
一、引言
問答系统是指能够对计算机用户输入的用自然语言描述的问句做出回答的计算机程序。
这种回答通常是一小段文字,其中显式或隐式地包含问题的答案。
作为自然语言处理技术的一个重要的应用,问答系统必须具备对自然语言进行分析和处理的能力。
随着网络在线文档的急剧增加,人们对于迅速从网上获取信息的需求越来越迫切,这极大促进了基于国际互联网的问答系统的发展。
这类问答系统研究的目的是全自动地直接从网络文档中获取用户关心的问题的答案,而用户的问题通常用自然语言来描述。
二、早期问答系统
早在60年代人工智能的研究起步时,人们就提出了让计算机用自然语言来回答人们的问题的设想。
但是,由于当时所有的实验都是在非常受限的领域,甚至是固定段落上进行的,所以自动问答一直被视为特殊领域的专家系统而少有人问津。
在此问答领域上最早进行的尝试是1972年Winograd研制的SHRDLU系统,该系统仅能够回答地球物理领域里的简单问题。
除此之外,早期比较著名的问答系统还包括Dyer的BORIS系统。
Lehnert等人对自然语言问句分类方面也进行了有益探索。
早期问答系统的不足在于它们通常以手工编写的领域知识,用户经常询问的问题以及一些报刊文章作为该类系统的基础数据库,这无疑需要耗费大量的人力资源。
限于当时的技术条件,问答技术的研究在很长的一段时间里发展十分缓慢。
三、问答系统分类
(一)聊天机器人(ChatBot)。
所谓聊天机器人,是指这样的问答系统:它模仿人的语言习惯,给出的答案较为人性化。
ALICE由Richard S.Wallac开发的聊天机器人。
它使用AIML(Artificial Intelligence Mark-up Language)表示其知识,用Java作为引擎对用户输入进行分析,在知识库中寻找最合适的回答并返回给用户。
通过对聊天记录的分析,ALICE可以得到还没有明确答案的问题,并给出建议的模式。
(二)基于知识库的问答系统。
拥有一个或多个知识库,存储一个或多个领域的知识,并利用检索、推理等技术,来理解与求解用户问题的问答系统,称为基于知识库的问答系统。
和聊天机器人不同的是,这类系统擅长于知识问答,对于不能回答的问题,就老实回答说“不知道”,而非故意转移话题。
(三)问答式检索系统。
根据以自然语言方式提交的用户查询,从系统文档集合或WWW中,检索出相关文本或网页,并将其返还给用户,这种系统称为问答式检索系统,也称问答式搜索引擎、智能搜索引擎。
问答式检索系统需要正确理解自然语言形式的用户查询,充分领会用户的查询意图,并检索出与用户需求最相关的文本或网页。
Start是世界上第一个基于Web的问答系统。
Start只能回答有关地理、历史、文化等方面的简单问题,并且对连续的问句缺乏关联处理能力,即还不能处理语义的上下文理解。
Encarta是由Microsoft公司开发的。
作为一个在线百科全书式的问答式搜索引擎,也提供了多种语言的支持。
其回答问题速度较快,答案也比较准确。
问答式检索系统主要需要两种技术:用户查询处理技术、信息检索(IR)技术。
后者目前已经比较成熟,而前者的实现主要有两种方法。
第一种方法,对问句进行分词处理,识别出其中的关键词,利用查询扩展技术,借助HowNet等语义词典,将关键词的同义词、近义词,一并交给后继检索系统。
第二种方法,就是使用问句模板,对于系统面向的领域非常狭窄的情况,该方法的好处显而易见。
(四)基于自由文本的问答系统。
自由文本又称非结构化文本,指未经人工处理的原始文档、网页等。
现有基于自由文本的问答系统,很多都是利用搜索引擎来设计的。
基于自由文本的问答系统,是目前检索和问答系统的主流。
不需要建立大规模知识库,节省大量人力物力,而且系统返回的是具体的答案,使用非常方便,受到用户欢迎。
四、问答系统的评测
如何客观而科学地评测问答系统的性能,是该研究领域一个很重要的问题。
目前的QA测评标准,并不太成熟,就连TREC QA Track的评测标准,也有相当的主观成分在里面。
一般来讲,一个优秀的问答系统应该满足以下要求:系统给出的答案应该是准确而全面的;系统响应时间必须越小越好;系统给出的答案应该语句流畅、简短扼要;对于每个问题,标出其难度系数,难度系数正比于系统得分。
五、结论
本文对现有各类问答系统作了介绍,并分析了其核心技术,最后提出了问答系统的评测指标。
可以看出,建立一个真正成熟的智能化的问答系统并非易事,要利用的知识和技术相当广泛。
借鉴ontology的理论和方法,建立面向问答的中文语义知识库并结合现有搜索引擎强大检索能力于一身的中文智能化知识检索系统,是当前最前沿的研究方向。
参考文献:
[1]王继承等.web信息检索研究进展[J].计算机研究与发展,1999,16(2):31-39
[2]冯志伟.中文信息处理与汉语研究[M].北京商务印书馆,1995
[3]Gazdar,Mellish.Natural Language Processing in LISP[M].1994。