当前位置:文档之家 > 话题检测与跟踪的评测及研究综述

话题检测与跟踪的评测及研究综述

第21卷 第6期2007年11月

中文信息学报

J OU RNAL OF CH IN ESE IN FORMA TION PROCESSIN G

Vol.21,No.6Nov.,2007

文章编号:100320077(2007)0620071217

话题检测与跟踪的评测及研究综述

洪宇,张宇,刘挺,李生

(哈尔滨工业大学计算机科学与技术学院信息检索研究室,黑龙江哈尔滨150001)

摘 要:

话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从

1996年前瞻性的探索以来,该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平

台。由于话题检测与跟踪相对于信息检索、信息挖掘和信息抽取等自然语言处理技术具备很多共性,并面向具备突发性和延续性规律的新闻语料,因此逐渐成为当前信息处理领域的研究热点。本文简要介绍了话题检测与跟踪的研究背景、任务定义、评测方法以及相关技术,并通过分析目前TD T 领域的研究现状展望未来的发展趋势。关键词:计算机应用;中文信息处理;综述;话题检测与跟踪;自然语言处理;事件;新闻报道中图分类号:TP391    文献标识码:A

Topic Detection and T racking R evie w

HON G Yu ,ZHAN G Yu ,L IU Ting ,L I Sheng

(Information Retrieval Lab ,School of Computer Science and Technology ,Harbin Institute of Technology ,Harbin ,Heilongjiang 150001,China )

Abstract :Topic detection and tracking ,as one of natural language processing technologies ,is to detect unknown topic and track known topic f rom the information of news medium.Since its pilot research in 1996,several large 2scale evaluation conferences have provided a good environment for evaluating technologies of recognition ,collection and organization.As topic detection and tracking shares similar challenges with information retrieval ,data mining and information extraction in abrupt and successive data ,it has become a hot research issue in the field of nature lan 2guage processing.This paper introduced the background ,definition ,evaluation and methods in topic detection and tracking ,and explored its future development trend through analyzing current research.

K eyw ords :computer application ;Chinese information processing ;overview ;topic detection and tracking ;natural language processing ;event ;news story

收稿日期:2007203213 定稿日期:2007207204

基金项目:国家自然科学基金资助项目(60435020,60575042,60503072)

作者简介:洪宇(1978—

),男,博士生,研究方向为话题检测与跟踪,个性化信息定制;张宇(1972—),男,副教授,主要研究方向为软件容错和基于相应系统的星载计算机的设计与实现;刘挺(1972—

),男,教授,主要研究方向为信息检索和自然语言处理。

1 引言

话题检测与跟踪(Topic Detection and Track 2ing ,简写为TD T )起
源于早期面向事件的检测与跟踪(Event Detection and Tracking ,简写为ED T )。TD T 面向多语言文本和语音形式的新闻报道,主要从事报道边界自动识别、锁定和收集突发性新闻话题、跟踪话题发展以及跨语言检测与跟踪等相关任

话题检测与跟踪(Topic Detection and Track 2ing ,简写为TD T )起源于早期面向事件的检测与跟踪(Event Detection and Tracking ,简写为ED T )。TD T 面向多语言文本和语音形式的新闻报道,主要从事报道边界自动识别、锁定和收集突发性新闻话题、跟踪话题发展以及跨语言检测与跟踪等相关任

务。与ED T 不同,TD T 检测与跟踪的对象从特定

时间和地点发生的事件扩展为具备更多相关性外延的话题,相应的理论与应用研究也同时从传统对于事件的识别跨越到包含突发事件及其后续相关报道的话题检测与跟踪。

TD T 的任务以及评测体系是由美国国防高级研究计划局(DA RPA )、马萨诸塞大学(University of Massachusett s )、卡耐基—梅隆大学(Carnegie Mellon University )和Dragon Systems 公司联合制定

话题检测与跟踪的评测及研究综述

下载Word文档免费下载:

话题检测与跟踪的评测及研究综述下载

(共17页)

话题检测与跟踪技术的综述

2010 话题检测与跟踪研究进展综述张瑾 杨森 王孝宗 罗维 杜攀 程学旗摘要:随着...对话题检测与跟踪 的评价方法进行了分析;最后展望了话题检测与跟踪方法的发展趋势...

话题检测跟踪技术

研究所 Email:yangjw@pku.edu.cn 1 话题检测跟踪...结果评价 25 Evaluation Metrics Miss: miss = c/...话题检测与跟踪综述(精简... 18页 免费 【计算机科学...

改进的话题检测和跟踪算法研究

改进的话题检测和跟踪算法研究_物理_自然科学_专业资料 暂无评价|0人阅读|0次下载|举报文档 改进的话题检测和跟踪算法研究_物理_自然科学_专业资料。第2 4卷第 ...

话题检测与跟踪技术的发展与研究

话题检测与跟踪技术的发展与研究 - 话题检测与跟踪技术的发展与研究 骆卫华 刘群 程学旗 中国科学院计算技术研究 软件研究室 比京 108所000{oeu,u,q@i.. ...

话题检测与跟踪技术的发展与研究

话题检测与跟踪技术的发展与研究 - 话题 检 测与跟踪技 术的发展 与研 究 骆卫 华 刘群 程学旗 中 国科 学 院计算 技术研 究所 软件 研究室北京‘· 摘...

TDT1

TDT1 - 话题检测与跟踪技术 2012-12-8 主要内容 ? ? ? ? ? 相关概念 TDT语料 TDT评测 TDT任务 TDT国内外研究现状 2012-12-8 相关概...

话题识别与跟踪研究_李保利

自 %::& 年以来连续举行的多次大规模评测使得话题识 别与跟踪研究正...好的关系识别系统也可用于解决 话题跟踪、 识别以及对新发生事件的检测等...

文献检索报告

文献检索报告 - 检索报告 2012 级 信息工程 院系 计算机科学与技术专业 学姓成 号名绩 201011031571 楚敏南 一 话题检测与跟踪算法的研究 检索...

LDA及主题词相关性的新事件检测

LDA及主题词相关性的新事件检测 - 目前,话题检测与跟踪已被广泛应用,新事件检测作为话题检测与跟踪领域中的研究任务之一,为跟踪后续话题发展的先验知识,在话题检测...

一种改进的Single-Pass算法及其在话题检测与跟踪中的应用

一种改进的Single-Pass算法及其在话题检测与跟踪中的应用 - 2O1 6年 1 1月 武警工程大学学报 Journal of En ...