当前位置:文档之家 > 话题检测与跟踪的评测及研究综述

话题检测与跟踪的评测及研究综述

第21卷 第6期2007年11月

中文信息学报

J OU RNAL OF CH IN ESE IN FORMA TION PROCESSIN G

Vol.21,No.6Nov.,2007

文章编号:100320077(2007)0620071217

话题检测与跟踪的评测及研究综述

洪宇,张宇,刘挺,李生

(哈尔滨工业大学计算机科学与技术学院信息检索研究室,黑龙江哈尔滨150001)

摘 要:

话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从

1996年前瞻性的探索以来,该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平

台。由于话题检测与跟踪相对于信息检索、信息挖掘和信息抽取等自然语言处理技术具备很多共性,并面向具备突发性和延续性规律的新闻语料,因此逐渐成为当前信息处理领域的研究热点。本文简要介绍了话题检测与跟踪的研究背景、任务定义、评测方法以及相关技术,并通过分析目前TD T 领域的研究现状展望未来的发展趋势。关键词:计算机应用;中文信息处理;综述;话题检测与跟踪;自然语言处理;事件;新闻报道中图分类号:TP391    文献标识码:A

Topic Detection and T racking R evie w

HON G Yu ,ZHAN G Yu ,L IU Ting ,L I Sheng

(Information Retrieval Lab ,School of Computer Science and Technology ,Harbin Institute of Technology ,Harbin ,Heilongjiang 150001,China )

Abstract :Topic detection and tracking ,as one of natural language processing technologies ,is to detect unknown topic and track known topic f rom the information of news medium.Since its pilot research in 1996,several large 2scale evaluation conferences have provided a good environment for evaluating technologies of recognition ,collection and organization.As topic detection and tracking shares similar challenges with information retrieval ,data mining and information extraction in abrupt and successive data ,it has become a hot research issue in the field of nature lan 2guage processing.This paper introduced the background ,definition ,evaluation and methods in topic detection and tracking ,and explored its future development trend through analyzing current research.

K eyw ords :computer application ;Chinese information processing ;overview ;topic detection and tracking ;natural language processing ;event ;news story

收稿日期:2007203213 定稿日期:2007207204

基金项目:国家自然科学基金资助项目(60435020,60575042,60503072)

作者简介:洪宇(1978—

),男,博士生,研究方向为话题检测与跟踪,个性化信息定制;张宇(1972—),男,副教授,主要研究方向为软件容错和基于相应系统的星载计算机的设计与实现;刘挺(1972—

),男,教授,主要研究方向为信息检索和自然语言处理。

1 引言

话题检测与跟踪(Topic Detection and Track 2ing ,简写为TD T )起
源于早期面向事件的检测与跟踪(Event Detection and Tracking ,简写为ED T )。TD T 面向多语言文本和语音形式的新闻报道,主要从事报道边界自动识别、锁定和收集突发性新闻话题、跟踪话题发展以及跨语言检测与跟踪等相关任

话题检测与跟踪(Topic Detection and Track 2ing ,简写为TD T )起源于早期面向事件的检测与跟踪(Event Detection and Tracking ,简写为ED T )。TD T 面向多语言文本和语音形式的新闻报道,主要从事报道边界自动识别、锁定和收集突发性新闻话题、跟踪话题发展以及跨语言检测与跟踪等相关任

务。与ED T 不同,TD T 检测与跟踪的对象从特定

时间和地点发生的事件扩展为具备更多相关性外延的话题,相应的理论与应用研究也同时从传统对于事件的识别跨越到包含突发事件及其后续相关报道的话题检测与跟踪。

TD T 的任务以及评测体系是由美国国防高级研究计划局(DA RPA )、马萨诸塞大学(University of Massachusett s )、卡耐基—梅隆大学(Carnegie Mellon University )和Dragon Systems 公司联合制定

话题检测与跟踪的评测及研究综述

下载Word文档免费下载:

话题检测与跟踪的评测及研究综述下载

(共17页)

[综述]话题检测与跟踪的评测及研究综述

[综述]话题检测与跟踪的评测及研究综述_物理_自然科学_专业资料。[ [综述]话题检测与跟踪的评测及研究综述 摘 要:话题检测与跟踪是一项面向新闻媒体...

话题检测与跟踪关键技术研究

暂无评价|0人阅读|0次下载 话题检测与跟踪关键技术研究_电子/电路_工程科技...语言处理和信息检索领域的热点 研究课题,笔者对该技术的研究现状和发展前...

话题检测与跟踪技术的综述

话题检测与跟踪的评测及研... 17页 2财富值 话题检测与跟踪综述(精简版......2010 话题检测与跟踪研究进展综述张瑾 杨森 王孝宗 罗维 杜攀 程学旗摘要:随着...

话题追踪技术研究综述

话题追踪技术研究综述 摘要: 海量的网络媒体信息使得人们在有限的时间内...话题检测与跟踪的评测及... 166人阅读 17页 免费 自动目标识别与跟踪...

话题检测与跟踪技术的发展与研究

话题检测与跟踪技术的发展与研究 - 话题检测与跟踪技术的发展与研究 骆卫华 刘群 程学旗 中国科学院计算技术研究 软件研究室 比京 108所000{oeu,u,q@i.. ...

话题检测与跟踪技术的发展与研究

话题检测与跟踪技术的发展与研究 - 话题 检 测与跟踪技 术的发展 与研 究 骆卫 华 刘群 程学旗 中 国科 学 院计算 技术研 究所 软件 研究室北京‘· 摘...

网络热门话题的跟踪建模与检测分析

网络热门话题的跟踪建模与检测分析 - 网络热门话题的跟踪对社会稳定、国家安全具有重要作用,针对传统网络热门话题跟踪模型误差大的缺陷,提出改进神经网络的网络热门话题...

话题识别与跟踪方法的研究

话题识别与跟踪方法的研究 - 话题识别与跟踪方法的研究 【摘要】 话题识别与跟踪旨在实现对新闻媒体信息流中新话题的自动检测 以及对已知话题的动态跟踪...

话题检测跟踪技术

暂无评价|0人阅读|0次下载|举报文档 话题检测跟踪技术_计算机软件及应用_IT/计算机...话题检测与跟踪技术的发... 9页 免费 话题检测与跟踪综述(精简... 18页 ...

于满泉2003话题识别与跟踪中的层次化话题识别技术研究

评测,话题识别与跟踪已成为国际上自然语言处理尤其是信息检索领域的一个研究...话题检测与跟踪综述(精简... 18页 免费 周期分类和Single_Pass聚... 5页 ...