当前位置:文档之家 > 话题检测与跟踪的评测及研究综述

话题检测与跟踪的评测及研究综述

第21卷 第6期2007年11月

中文信息学报

J OU RNAL OF CH IN ESE IN FORMA TION PROCESSIN G

Vol.21,No.6Nov.,2007

文章编号:100320077(2007)0620071217

话题检测与跟踪的评测及研究综述

洪宇,张宇,刘挺,李生

(哈尔滨工业大学计算机科学与技术学院信息检索研究室,黑龙江哈尔滨150001)

摘 要:

话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从

1996年前瞻性的探索以来,该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平

台。由于话题检测与跟踪相对于信息检索、信息挖掘和信息抽取等自然语言处理技术具备很多共性,并面向具备突发性和延续性规律的新闻语料,因此逐渐成为当前信息处理领域的研究热点。本文简要介绍了话题检测与跟踪的研究背景、任务定义、评测方法以及相关技术,并通过分析目前TD T 领域的研究现状展望未来的发展趋势。关键词:计算机应用;中文信息处理;综述;话题检测与跟踪;自然语言处理;事件;新闻报道中图分类号:TP391    文献标识码:A

Topic Detection and T racking R evie w

HON G Yu ,ZHAN G Yu ,L IU Ting ,L I Sheng

(Information Retrieval Lab ,School of Computer Science and Technology ,Harbin Institute of Technology ,Harbin ,Heilongjiang 150001,China )

Abstract :Topic detection and tracking ,as one of natural language processing technologies ,is to detect unknown topic and track known topic f rom the information of news medium.Since its pilot research in 1996,several large 2scale evaluation conferences have provided a good environment for evaluating technologies of recognition ,collection and organization.As topic detection and tracking shares similar challenges with information retrieval ,data mining and information extraction in abrupt and successive data ,it has become a hot research issue in the field of nature lan 2guage processing.This paper introduced the background ,definition ,evaluation and methods in topic detection and tracking ,and explored its future development trend through analyzing current research.

K eyw ords :computer application ;Chinese information processing ;overview ;topic detection and tracking ;natural language processing ;event ;news story

收稿日期:2007203213 定稿日期:2007207204

基金项目:国家自然科学基金资助项目(60435020,60575042,60503072)

作者简介:洪宇(1978—

),男,博士生,研究方向为话题检测与跟踪,个性化信息定制;张宇(1972—),男,副教授,主要研究方向为软件容错和基于相应系统的星载计算机的设计与实现;刘挺(1972—

),男,教授,主要研究方向为信息检索和自然语言处理。

1 引言

话题检测与跟踪(Topic Detection and Track 2ing ,简写为TD T )起
源于早期面向事件的检测与跟踪(Event Detection and Tracking ,简写为ED T )。TD T 面向多语言文本和语音形式的新闻报道,主要从事报道边界自动识别、锁定和收集突发性新闻话题、跟踪话题发展以及跨语言检测与跟踪等相关任

话题检测与跟踪(Topic Detection and Track 2ing ,简写为TD T )起源于早期面向事件的检测与跟踪(Event Detection and Tracking ,简写为ED T )。TD T 面向多语言文本和语音形式的新闻报道,主要从事报道边界自动识别、锁定和收集突发性新闻话题、跟踪话题发展以及跨语言检测与跟踪等相关任

务。与ED T 不同,TD T 检测与跟踪的对象从特定

时间和地点发生的事件扩展为具备更多相关性外延的话题,相应的理论与应用研究也同时从传统对于事件的识别跨越到包含突发事件及其后续相关报道的话题检测与跟踪。

TD T 的任务以及评测体系是由美国国防高级研究计划局(DA RPA )、马萨诸塞大学(University of Massachusett s )、卡耐基—梅隆大学(Carnegie Mellon University )和Dragon Systems 公司联合制定

话题检测与跟踪的评测及研究综述

下载Word文档免费下载:

话题检测与跟踪的评测及研究综述下载

(共17页)

话题检测与跟踪的评测及研究综述

话题检测与跟踪的评测及研究综述 - 话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从1996年前瞻性的探索以来,...

[综述]话题检测与跟踪的评测及研究综述

[综述]话题检测与跟踪的评测及研究综述_物理_自然科学_专业资料。[ [综述]话题检测与跟踪的评测及研究综述 摘 要:话题检测与跟踪是一项面向新闻媒体...

话题检测与跟踪关键技术研究

暂无评价|0人阅读|0次下载 话题检测与跟踪关键技术研究_电子/电路_工程科技...语言处理和信息检索领域的热点 研究课题,笔者对该技术的研究现状和发展前...

话题检测与跟踪技术的发展与研究.

话题检测与跟踪技术的发展与研究. - 话题检测与跟踪技术的发展与研究 骆卫华刘群 {luoweihua, liuqun}@ 中国科学院计算技术研究所 摘要:...

基于主题模型的微博话题检测与跟踪研究

基于主题模型的微博话题检测与跟踪研究 - 随着互联网技术的飞速发展,如今的网络在线数据以短文本的形式呈爆炸性趋势增长。话题检测与跟踪技术就是为了应对日益严重的...

话题检测与跟踪技术的综述

话题检测与跟踪的评测及研... 17页 2财富值 话题检测与跟踪综述(精简版......2010 话题检测与跟踪研究进展综述张瑾 杨森 王孝宗 罗维 杜攀 程学旗摘要:随着...

话题检测与跟踪技术的发展与研究

话题检测与跟踪技术的发展与研究 - 话题检测与跟踪技术的发展与研究 骆卫华 刘群 程学旗 中国科学院计算技术研究 软件研究室 比京 108所000{oeu,u,q@i.. ...

网络热门话题的跟踪建模与检测分析

网络热门话题的跟踪建模与检测分析 - 网络热门话题的跟踪对社会稳定、国家安全具有重要作用,针对传统网络热门话题跟踪模型误差大的缺陷,提出改进神经网络的网络热门话题...

面向微博事件流的话题检测与追踪技术研究与实现

暂无评价|0人阅读|0次下载 面向微博事件流的话题检测与追踪技术研究与实现_电子/电路_工程科技_专业资料。微博客(即微博,Microblog)作为一种新兴的Web2.0应用,已经...

话题识别与跟踪方法的研究

话题识别与跟踪方法的研究 - 话题识别与跟踪方法的研究 【摘要】 话题识别与跟踪旨在实现对新闻媒体信息流中新话题的自动检测 以及对已知话题的动态跟踪...