当前位置:文档之家 > 话题检测与跟踪的评测及研究综述

话题检测与跟踪的评测及研究综述

第21卷 第6期2007年11月

中文信息学报

J OU RNAL OF CH IN ESE IN FORMA TION PROCESSIN G

Vol. 21, No. 6Nov. , 2007

文章编号:100320077(2007) 0620071217

话题检测与跟踪的评测及研究综述

洪宇, 张宇, 刘挺, 李生

(哈尔滨工业大学计算机科学与技术学院信息检索研究室, 黑龙江哈尔滨150001)

摘 要:

1996年前瞻性的探索以来, 该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平

台。由于话题检测与跟踪相对于信息检索、, 并面向具备突发性和延续性规律的新闻语料, 因此逐渐成为当前信息处理领域的研究热点。的研究背景、任务定义、评测方法以及相关技术, TD T 。关键词:计算机应用; 中文信息处理; 综述; 话题检测与跟踪; ; ; 中图分类号:TP391    文献标识码:A

and T racking R evie w

HON G Yu ,ZHAN G Yu ,L IU Ting ,L I Sheng

(Information Retrieval Lab , School of Computer Science and Technology , Harbin Institute of Technology , Harbin , Heilongjiang 150001, China )

Abstract :Topic detection and tracking , as one of natural language processing technologies , is to detect unknown topic and track known topic f rom the information of news medium. Since its pilot research in 1996, several large 2scale evaluation conferences have provided a good environment for evaluating technologies of recognition , collection and organization. As topic detection and tracking shares similar challenges with information retrieval , data mining and information extraction in abrupt and successive data , it has become a hot research issue in the field of nature lan 2guage processing. This paper introduced the background , definition , evaluation and methods in topic detection and tracking , and explored its future development trend through analyzing current research.

K eyw ords :computer application ; Chinese information processing ; overview ; topic detection and tracking ; natural language processing ; event ; news story

收稿日期:2007203213 定稿日期:2007207204

基金项目:国家自然科学基金资助项目(60435020,60575042,60503072)

作者简介:洪宇(1978—

) , 男, 博士生, 研究方向为话题检测与跟踪, 个性化信息定制; 张宇(1972—) , 男, 副教授, 主要研究方向为软件容错和基于相应系统的星载计算机的设计与实现; (1972—

) , 男, 教授, 主要研究方向为信息检索和自然语言处理。

1 引言

话题检测与跟踪(Topic Detection and Track 2ing , 简写为TD T ) 起源于早期面向事件
的检测与跟踪(Event Detection and Tracking , 简写为ED T ) 。TD T 面向多语言文本和语音形式的新闻报道, 主要从事报道边界自动识别、锁定和收集突发性新闻话题、跟踪话题发展以及跨语言检测与跟踪等相关任

话题检测与跟踪(Topic Detection and Track 2ing , 简写为TD T ) 起源于早期面向事件的检测与跟踪(Event Detection and Tracking , 简写为ED T ) 。TD T 面向多语言文本和语音形式的新闻报道, 主要从事报道边界自动识别、锁定和收集突发性新闻话题、跟踪话题发展以及跨语言检测与跟踪等相关任

务。与ED T 不同, TD T 检测与跟踪的对象从特定

时间和地点发生的事件扩展为具备更多相关性外延的话题, 相应的理论与应用研究也同时从传统对于事件的识别跨越到包含突发事件及其后续相关报道的话题检测与跟踪。

TD T 的任务以及评测体系是由美国国防高级研究计划局(DA RPA ) 、马萨诸塞大学(University of Massachusett s ) 、卡耐基—梅隆大学(Carnegie Mellon University ) 和Dragon Systems 公司联合制定

话题检测与跟踪的评测及研究综述

下载Word文档免费下载:

话题检测与跟踪的评测及研究综述下载

(共17页)

话题检测与跟踪的评测及研究综述

文章编号 : 100320077 ( 2007) 0620071217 language p rocessing ; event ; news sto ry 话题检测与跟踪的评测及研究综述洪 宇 ,张宇 ,刘挺 ,李生 ( 哈尔滨...

话题检测与跟踪的评测及研究综述

话题检测与跟踪的评测及研究综述_信息与通信_工程科技_专业资料。话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从1996年...

目标跟踪相关研究综述

暂无评价|0人阅读|0次下载|举报文档目标跟踪相关研究综述_哲学/历史_人文社科_...分别进行描述:运动目标的表示与 建模、特征选取、目标检测和目标跟踪,下面进行...

话题追踪技术研究综述

暂无评价|0人阅读|0次下载话题追踪技术研究综述_教育学/心理学_人文社科...通过话题检测来发现话题,通过话题追踪技术来对话题进行 后续跟踪,这样就...

话题识别与跟踪技术发展研究

本文首先介绍话题识别与跟踪的主要任务、相关概念和 评价方法, 然后对话题识别国内外研究现状进行详细论述,最后对话题识别的发 展趋势和未来的研究方向进行分析。 [...

话题检测与跟踪技术的发展与研究

事件 的再现 从年 开始 在 支持 下美 国国 家标准技术 研究所 每年 都要 举办话题 检测 与跟踪 国 际会议 并进 行相应 的系统评测 这个 系列 评测会 ! ...

改进的话题检测和跟踪算法研究

改进的话题检测和跟踪算法研究_物理_自然科学_专业资料 暂无评价|0人阅读|0次下载|举报文档 改进的话题检测和跟踪算法研究_物理_自然科学_专业资料。第2 4卷第 ...

话题检测与跟踪技术的发展与研究

话题检测与跟踪技术的发展与研究_理学_高等教育_教育专区。话题检测与跟踪技术的发展与研究话题检测与跟踪技术的发展与研究骆卫华 刘群 程学旗中国科学院计算技术研究 ...

事件关系检测的语言学资源、评测及研究综述?

话题检测与跟踪的评测及研究综述[J]. 中文信息学报, 2007, (6): 71-84 [15] LEEK T, SCHWARTZ R, SISTA S. Probabilistic approaches to topic detection ...

话题检测与跟踪的评测及研究综述

话题检测与跟踪的评测及研究综述_IT/计算机_专业资料。话题检测与跟踪的评测及研究综述第21 卷 6 期第 2007 年 11 月 中文信息学报 J OU RNAL O F C H ...