当前位置:文档之家› 基于Web的半结构化信息抽取技术研究

基于Web的半结构化信息抽取技术研究

基于Web的半结构化信息抽取技术研究
基于Web的半结构化信息抽取技术研究

基于Web的半结构化信息抽取技术研究

张树瑜;杜国宁;朱仲英

【摘要】对信息抽取技术的发展和趋势作了一定分析,并讨论了当前半结构化信息检索领域的先进抽取技术.从应用的角度提出一种新的半结构化信息获取方法.该方

法包括网页分析过程、映射的自动生成和信息抽取过程.通过建立标记树来进行网

页结构分析,利用实例路径归纳学习出用户需求信息的公共路径,将效用的抽取结果

提交用户,减少了用户负担,提高了查全率和查准率,为进一步满足Web信息抽取提

供了一种新的高效信息抽取工具.

【期刊名称】《系统工程与电子技术》

【年(卷),期】2004(026)005

【总页数】3页(P610-612)

【关键词】互联网;半结构化;标记树;自动映射

【作者】张树瑜;杜国宁;朱仲英

【作者单位】上海交通大学自动化系,上海,200030;上海交通大学自动化系,上

海,200030;上海交通大学自动化系,上海,200030

【正文语种】中文

【中图分类】基础科学

基于 W e b 的半结构化信息抽取技术研究张树瑜,杜国宁,朱仲英(上海交通大学自动化系,上海 200030)摘要:对信息抽取技术的发展和趋

势作了一定分析,并讨论了当前半结构化信息检索领域的先进抽取技术。

相关主题
文本预览
相关文档 最新文档