智能答疑系统的设计与研究
- 格式:pdf
- 大小:91.76 KB
- 文档页数:4
基于本体的网络教育智能答疑系统模型研究[摘要]答疑是任何一种教学方式都具有的重要环节,对于网络远程教学来说,也是如此。
本文提出基于本体论的网络教育智能答疑系统模型和相关技术,以期解决在远程教育实践中,答疑系统智能性、交互性和资源共享性3个方面的问题。
[关键词]智能答疑、本体中图分类号:tb381 文献标识码:a 文章编号:1009-914x(2013)12-0155-01一、研究意义和国内外研究概况:本体是近几年来的研究热点,研究主要集中在知识表示、资源共享、软件工程、信息检索等方面。
国外高水平研究的推动下,涌现了不少有代表性的项目,比如:cyc研究项目,其目的是通过本体开发为常识推理提供基础。
美国斯坦福大学知识系统实验室的k开项目,主要研究知识的本质特征和基本属性。
ittalks,ittalks是美国马里兰大学在darpa资助下开发的一个基于本体的web门户系统,主要用于对it领域内的各种会议信息进行智能集成和智能在线检索。
本研究结合本体与自然语言处理技术,设计了基于本体的网络教育智能答疑系统模型。
其工作原理主要是:转换自然语言提问为形式化的本体查询语言,然后到基于领域本体的知识库中查询知识;并且利用基于本体的推理,不但可以完成基本的基于自然语言的知识查询,而且还可以在此基础上进行知识扩展、知识推理并将结果反馈给学生。
国内,关于本体的研究起步较晚,无论在理论研究、实证研究还是在技术手段的实现和应用方面都相对落后,与国外高水平的不平究相比存在很大差距。
二、系统的设计目标对于网络教育来说,由于师生相对分离,缺少老师面对面的解释和演绎。
因此,以教师为主导,学生为主体的教学模式在网络教育中越来越多被强调。
当学习者遇到学习障碍需要帮助的时候,及时的答疑和帮助就成了远程学习支持服务必不可少的内容。
在充分调查总结现有网络教育答疑系统,研究相关理论技术的基础上作者认为满足当代网络教育的答疑系统应该做到以下几点:1.答疑及时:及时解决学习障碍可以保持学习的热情,增强学习信心;2.答疑知识易共享:避免资源的重复建设,有利于广泛的知识共享;3.答疑智能:系统更加智能,让学习者有更好的使用体验。
远程教育中智能答疑系统的设计与实现完整文档资料可直接使用,可编辑,欢迎下载北京交通大学硕士学位论文远程教育中智能答疑系统的设计与实现姓名:胡娜申请学位级别:硕士专业:教育技术学指导教师:赵宏20071201jb塞銮道盔堂亟±堂僮迨塞生塞翅垂中文摘要摘要:随着网络技术的发展和网络应用的普及,依托于网络技术的远程教育正在迅猛地发展。
基于网络环境下的教育模式,采用的是探索式学习方式,它支持学生根据自己的情况,浏览相关的教学资源,实现优秀教育资源和教育方法的共享。
但是,在远程教学中,学生和教师是时空相对分离的,学生无法与教师直接交流,于是答疑作为其教学活动中的一个重要环节,正日益引起人们的关注。
设计一个好的远程教育答疑系统,能及时有效地解决学生在学习过程中历产生的疑问,这样可以提高远程学生的学习效率,保证远程教育的质量。
一般的答疑系统采用的是基于搜索引擎的关键字查询方式,这种答疑系统需要学生自己输入关键字进行提问,对学生提炼总结关键字的能力有一定要求,并且搜索的效果并不理想,需要学生进一步来筛选系统反馈的答案,使得学习效率不高,这种答疑系统有必要进一步优化。
智能答疑系统是一个具有知识记忆、数据计算统计、逻辑推理、知识学习和实现友好人机交互的智能系统,其本质是一个具有智能性的知识系统。
它支持自然语言的提问、自动检索问题并呈现有效答案,能够通过学习自动扩展和更新答案知识库。
它的这些特点,使学生在学习时能够使用自己熟悉的方式表达问题,并能够及时获得与问题较为相关的一些反馈答案。
本文首先论述了研究智能答疑系统的背景和意义,并在分析了远程教育模式特点及对比了现有的答疑系统的基础上,对答疑系统做了统一的设计和开发,提出了一个基于本体以及XML的智能答疑系统的设计,初步建立了本体库以及知识库,给出了完整的体系结构及其架构开发模式,并对开发智能答疑系统环境中的关键技术进行了深入的研究,最后给出了智能答疑系统的实现方法。
智能答疑系统的设计与研究
智能答疑系统的设计与研究
摘要:提出了一个高效的、科学的智能答疑系统。
介绍了该系统开发的环境、分析了该系统组成的各个模块以及关键技术,最后实践证明了该系统提高了教学效率和教学手段,达到了较为理想的教学效果。
关键词:智能答疑系统;知识库;中文分词技术;RSS技术
随着Internet上远程教学普及,远程教学中的答疑成为人们关注的焦点之一。
学习者从听众变成索求者,当遇到无法理解需要帮助时,及时的答疑和帮助成了必不可少的内容。
在远程教学中建立智能答疑系统,可以使得学生在任何时间、任何地点都可以得到解答。
教师也不必一直在线回答学生问题或重复回答相似问题。
答疑系统自动回答学生的问题,一方面提高学生学习热情,提高解答效率,另一方面可以节约教师的时间,间接提高工作效率。
本文通过.net建立一个简单高效的智能答疑系统,教师将疑难问题按一定组织方式,存放到知识和信息库中。
学生提交问题时,通过中英文分词技术来分析并自动地匹配学生所提出的问题,自动地给予问题解答。
当在知识库中没有搜索到信息可以采用电子邮件或是通过在线方式征求解答,有人解答后,系统自动将解答发给学生。
1开发环境系统采用C#编码,利用VS2005+SQL2005数据库平台开发智能答疑系统,使用实现对数据库的访问。
2模块的设计智能答疑系统是一个智能适应性的知识库系统,在教学设计阶段,教师将最常见的疑难问题按一定的组织方式,存放到知识库中,当学生在遇到疑难问题时,对学生
以自然语言形式提出的问题进行预处理,主要是采用分词技术对问题语句进行切分处理,提取出匹配所需要的关键词,根据预先建立的基于关键词的索引结构,将答案快速定位,找出问题匹配度最高的答案。
若在知识库中没有搜索到信息可以采用电子邮件或是通过在线方式征求解答,有人解答后,系统自动将解答发给学生。
总之,智能答疑系统是一种支持同步和异步答疑以及讨论的系统。
,该系统包括以下几个模块:
(1)提问模块学生可以使用提问模块来寻求问题的答案,这是使用系统的基本手段之一。
对于问题文本首先采用正规表达式取出中文和英文,然后采用分词技术,主要是按照一定的策略将要分析的字串与词典中的词条进行匹配来分解一系列的子串。
然后在系统的知识库中以及讨论形成的材料中搜索与问题相关的材料,并按照相关程度返回结果。
(2)讨论模块讨论模块是学生使用智能答疑系统的另外一种基本手段。
用户可以参加BBS和聊天室等来进行讨论。
当学生在没有得到系统满意的问题解答时,系统提供了给教师发邮件模块来请求教师解答,并且提供了给教师手机发短信模块,以便提醒教师邮箱里有提示;还提供讨论模块,请求系统别的学生帮助解答;还提供了RSS阅读器,可以在其中查看预订的相关网上讨论社区中的资源。
(3)RSS模块RSS模块可以简单地理解为一种方便的信息获取工具。
RSS获取信息的模式与加入邮件列表模式相似,无需登录到各个提供信息的站点即可自动获取。
该模块主要建立一个RSS 阅读器来订阅知识点,一旦网站上的这些知识点被更新,就会自动发送到链接源阅读器中。
这样就可以不断更新和扩充知识库中的内容,。
3关键技术3.1正规表达式正规表达式允许快速有效地处理文本。
被处理的文本小到一个电子邮件地址,大到一个多行的输入框内容。
正规表达式的使用不仅允许使用一个定义模式来校验文本,而且还允许从匹配一个给定模式的文本中提取数据。
本系统使用正规表达式来取出学生问题中的中文和英文,然后执行相应的中英文分词技术,。
3.2中文分词技术中文分词(Chinese Word Segmentation)指的是将一个汉字序列切分成一个一个单独的词。
分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。
现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。
基于字符串匹配的分词方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。
按照扫描方向的不同,串匹配分词方法可以分为正向匹配和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;《计算机基础》课程的智能答疑系统采用的是机械分词方法中的正向最大匹配算法。
3.2.1分词算法采用基于字符串匹配的分词方法,它是按照正向最大匹配法(由左到右的方向);将待分析的汉字串与一个“充分大的”机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。
例如,对一个字符串S,从前到后扫描,对扫描的每个字,从词库中寻找最长匹配。
比如假设S=“我是中华
人民共和国公民”,词库中有“中华人民共和国”,“中华”,“公民”,“人民”,“共和国”……等词。
当扫描到“中”字,那么从中字开始,向后分别取1,2,3,……个字(“中”,“中华”,“中华人”,“中华人民”,“中华人民共”,“中华人民共和”,“中华人民共和国”,“中华人民共和国公”),词库中的最长匹配字符串是“中华人民共和国”,那么就此切分开,扫描器推进到“公”字。
3.2.2数据结构哈希表是一种高效的数据结构。
哈希表最大的优点,就是把数据的存储和查找消耗的时间大大降低,几乎可以看成是常数时间;而代价仅仅是消耗比较多的内存。
然而在当前可利用内存越来越多的情况下,用空间换时间的做法是值得的。
另外,编码比较容易也是它的特点之一。
本系统采用哈希表(Hashtable)记录词库。
首先将词典中的词进行处理,对每一个词语,如果该词语有N个字,则将该词语的1,1~2,1~3,…,1~N个字作为键,插入相应词长度的哈希表中,而同一个键如果重复插入,则后面的值递增,。
该智能答疑系统能在一定程度上减少答案域的搜索范围,并能获得准确的答案。
实践证明该智能答疑系统是有一定的智能性、主动性和方便性等特点,提高了教学效率和教学手段。