当前位置:文档之家› 浅析报业集团知识库平台的构建

浅析报业集团知识库平台的构建

浅析报业知识库平台的构建

苏州日报报业集团莫正荣

【摘要】:本文从报业集团信息化及内容管理的现状出发,通过目前报业内容资源管理存在的不足,提出报业集团建设报业知识库的必要性和可行性,结合推荐引擎项目及报业集团历史全文数据库项目的经验,提出一系列构建报业集团知识库平台的原则及报业知识库构建的核心与重点。

【关键词】:信息处理知识库内容管理数据索引检索推荐引擎

【中图分类号】:G202;G211;TP391.1

我国报业的信息化进程已经经历了两次划时代的革命:第一次革命就是采用计算机激光照排系统替代人工铅字排版,人们形象地称之为“告别铅与火”的“印刷革命”;第二次则是应用计算机新闻网络采编系统替代传统的使用笔与纸进行新闻编写、上栏、签发等流程,人们形象地称之为“甩掉纸与笔”的“采编革命”;那么,报业信息化的第三次革命将会是什么呢?

随着信息自动采集、发布、加工、创建、存储等技术的发展,以及信息数据在分类、索引、聚类、关联、翻译、挖掘、摘要等智能处理技术不断走向成熟和大规模的应用,为报业知识库的建设奠定了基础。我国报业正酝酿着新一波信息化革命的热潮。有关权威人士认为,新一波报业信息化的重点,将从信息基础设施的改造和建设转向新闻信息资源的开发与利用;新一波报业信息化的着眼点,将从提供生产手段、劳动工具和处理系统,转向借助人工智能等信息处理技术,对这些数字内容资产进行有效管理和数据挖掘整理形成报业核心资产的报业知识库,实现新闻媒体内容价值链的最优化,从简单的“内容管理”逐步扩展到“知识管理”,实现从“手的延长”到“脑的扩展”的转变。报业信息资料的深度加工处理将成为报业信息化建设的重要核心内容之一。新一波的报业信息化将是,在“告别铅与火”、“甩掉纸与笔”之后,迎来了“扩展脑与库”的报业知识库建设与使用的时代。

报业内容管理现状

报业集团知识库平台的构建是一个系统性项目,对报业集团新闻内容及相关行政管理类文档管理现状的了解是很有必要的。

首先。传统的采编出版流程是一种比较简单的线性结构,一次采集,一次发布。从记者采访,编辑拼版,总编把关签发后出版印刷成纸质报纸,再由发行部打包分发,整个出版流程就结束了。接下来对这些内容资源的管理就仅限于资料室把纸质报纸装订存储起来,以备查找;信息化系统中的归档系统自动将值班总编签发见报的文章、图片以及版面进行归档处理建立归档数据库并存储。在这个传统流程中只简单保留了见报的文字和降低了质量的图片资源以及只可用于浏览的版面信息。而很多被弃用的内容资源就没有被保留下来。

其次,知识管理面向的主体人群是创建和使用知识库的报业集团的决策领导层和采编一线具有知识性、自主性、学习性和强烈个性感等特点的知识型采编人员。而目前的状况是每个人在知识层次、关注领域、资源控制能力等方面都千差万别。每个人都拥有自己经过长期

积累而建立的私有的资源资料库,而这些分散的内容资源、图片、音视频资料只是根据个人的知识结构和习惯进行了简单的分类存储,使用范围也仅限于一个人使用,没有最大限度地发挥内容资源的最优化加工与共享利用。

再次,集团所有的文件、规章、制度包括采编业务方面的公用文档或规范要求(如市委班子排序等)主要在各部门内部以纸质或数字文档形式共享。

所有这些内容资源都没有进行统一标注、分类、索引等加工处理,没有完成从孤立的数据经处理变成有实际应用价值的信息进而成为知识的创建过程。

报业知识库平台构建的必要性

1、什么是知识库

形象的说:“知识库”是一个企业或集团范围的在线数据库,它存储来自企业不同领域的经过最佳阐释的实践经验。知识管理的本质是提供恰当的策略,使恰当的知识在恰当的时间以恰当的方式提供给恰当的人。

2、全媒体时代,报业核心竞争力的需要。

我们已经进入了全媒体时代,报纸、广播、电视三足鼎立的天下早已被打破,网络、手机报、IP电视、3G……传统媒体网络化,网络媒体集群化;移动手机媒体化,固定电视移动化。面对信息科技的飞速发展,媒体的生态版图也在发生根本性的改变。在快速、实时等方面传统平面媒体被新媒体全面超越。作为传统平面媒体的报纸,面临着严峻的挑战。报业要在全媒体时代占有一席之地,只有在新闻做深、做透等方面发挥传统报业的人才和内容资源优势。比如“新闻链接”、“新闻背景”、“评论新闻”、“分析新闻”这些在网站网页和报纸版面屡屡出现的新品种,大多需要通过检索后在拥有大量信息资料的基础上写成的,在信息化的社会里,获得信息的渠道很多很多,独家新闻不再是报纸唯一核心竞争力的表现。在很多情况下,读者对一个新闻事件的发生,不但要知其然,还要知其所以然。这样在同等的条件下,谁的内容制作得好,谁就占据优势,谁就拥有更强的竞争力。这就需要有强大的报业内容资源信息管理平台作支撑,为报业采编人员提供强大的知识源泉与生产动力。

3、报业内容资源管理的需要。

集团对内容资源管理的现状已经不能满足报业发展的需要,在报业生产运行中采编人员产生了很多有价值的信息,但传统的文档管理仅保存了见报的文字和图片资料,其余的都被丢弃了,被弃用的这些内容并不是没有价值,比如对一次大型活动或事件的采访,可能不同子报都去了记者,也可能同一子报去了不同部门的记者,副刊部的记者与经济部的记者对活动或事件的关注点肯定不同;同样,不同的摄影记者甚至是同一摄影记者对同一活动或事件的拍摄角度、视点和所要传达的拍摄者的思想也肯定不同。但当天的报纸可能是在某一个主题下,则采用了经济部记者的文字稿和与之相符的摄影记者的图片。如果过了一段时间,需要从另外一个角度对这次活动或事件进行关联的深入分析或跟踪报道,或者其他有关记者编辑需要为这次活动或事件制作专题背景资料(比如这此活动中的重要人物再次造访时),需要更贴合主题或全方位的文章和图片时因为没有成熟的内容管理系统则无从查找相关的资源。如果集团构建了更为智慧的知识库系统。这些问题就会迎刃而解。

4、报业从业人员对智能高效的内容资源系统的迫切需要。

新闻系统是一个知识高度密集的组织,除了深入群众、深入实际、调查研究、掌握第一手材料等这些记者不可或缺的基本功外,利用先进技术手段,扩大新闻视野、搜索新闻线索、采集新闻素材、积累背景资料,也是不可缺少的。但目前集团采编人员可以利用的资源

除了个人私有的内容资源以外,就只有互联网,互联网的出现,将一个浩如烟海的全球信息库呈现在我们的面前。但互联网上的信息又存在着:有用信息被大量杂乱的信息垃圾所淹没、信息的真实性存在质疑等问题。这导致互联网这个巨大的信息库对报业从业人员只能起到有限的作用。如果有了报业知识库,在知识库中,不仅能搜索到报业历史全文数据库的最权威信息,而且在知识库的智能推荐引擎中,系统会根据搜索人员的知识结构和工作性质以及他以往使用知识库的习惯智能地推荐他最需要的和最关注的内容资源。

基于以上一些原因,在报业信息化的第三波热潮下,报业知识库的建设将是报业信息化建设的重点与核心,也是传统平面媒体突围新媒体的杀手锏。

报业集团知识库平台建立的原则

1、简单高效:知识库的作用重在使用而非建设,知识管理的目的是为了更有效地利用它,而不是将太多的时间花费在知识管理本身上面。如果我们花费了大量时间来学习如何做知识管理,学习如何使用知识管理工具,则偏离了我们做个人知识管理的初衷了。知识库系统设计一定要人性化,简单高效,将复杂的处理过程留给后台的信息管理人员和专家系统。

2、明确要管理的知识。在任何一个企业内部,都有各种各样的知识,而在知识管理的实践中,并非每个类型知识都需要去管理。所以在知识库建设的初期必须明确要管理的知识类型、其价值在何处,这样才不至于眉毛胡子一把抓,导致核心知识和外围知识都无法很好管理的状况出现。

3、确定知识的来源和动力。人是知识的载体,也是知识产生、组织、利用、创新的源泉。在知识库建设中,必须明晰知识的来源:谁应该产生何种知识,他为什么要产生。如果不能结合组织内的每个岗位、流程去分析,那么就很难要求知识共享,在这种情况下即便产出了“知识”,知识的价值也不能保证。还有一个问题就是员工为什么要共享,这是知识管理的动力问题。要确立人人为我,我为人人的观念。对知识共享必需给予鼓励和奖励。

4、加强知识的组织与利用。知识本身没有价值,只有被利用的知识才能发挥作用。如果要更好地利用知识,则对知识的组织提出了比较高的要求。组织知识就是将产生出来的知识进行整理,系统化、合理地分类和提供检索工具以方便人们自如地获取和利用。

5、知识的创新是关键。创新并不神秘,只有创新才能赢得持续的竞争优势,而所有的业务、管理、技术创新第一步都是先要有知识创新。

报业集团知识库构建的重点与核心

1、报业知识库与其他行业知识库的区别

知识库的建设可以按照成熟的建设方案进行,一般在完成基础数据库、各职能模块数据库、各智能模块专家系统三个阶段以后知识库的雏形就基本完成了。但是针对于报业的知识库应有别于其他行业知识库的建设。其他行业比如制造业、或者商业,在他们的各自行业知识库的建设中主要针对本领域的解决问题的能力知识。而作为报业系统,除了新闻采访编辑等业务能力和其它行业知识库建设没有区别外,对于报业生产的产品——“新闻”本身就是内容资源或者本身也是一定层次的知识。它不同于一台冰箱产品,对于一个生产冰箱的企业知识库可能主要任务是解决冰箱生产过程中会出现的问题并提供解决方法。而报业的知识库它不但要为采编人员生产新闻提供采编业务能力方面的知识支持,更主要的是报业知识库它直接成为报业采编人员生产新闻的原材料和生产工具。

因此,报业知识库建设的重点和核心是在海量的内容资源中如何将特定的内容资源在采编人员最需要的时候以恰当的方式提供给特定的采编人员。也就是需要一个智能的推荐系统和一个高度智能可行的前期信息数据深度加工处理系统。

2、人类智慧与计算机人工智能相结合的前期处理系统

要实现报业知识库的高效实用,基础数据的分类、聚类、索引等计算机智能处理是报业知识库区别其他行业知识库建设的一个重点与核心。其他行业知识形成的过程,可能是企业的知识运营主管及其团队进行知识的抽取,分类,创建。而报业除了采编业务能力及各项规章及规范文档外。海量的历史文档图片等资源处理形成知识库的主要组成部分。海量内容资源的智能处理在目前的技术条件下其实用性还达不到实际应用的水平。海量文档智能处理要达到准确和实用的阶段,目前最合理的解决方案是计算机人工智能结合报业采编人员的智慧。在构建知识库的初期数据的建模阶段,充分考虑并利用使用知识库的采编人员的主观能动性,将系统设计成人机互动,相互补充,高度可配置和系统自适应,自主学习的高效系统。例如,在人工智能进行内容资源智能分类,聚类等处理以后,再参照使用人员的主观判断进行适当调整,如一篇文章系统根据文章出现相关关键词汇频度等相应的算法比较运算后,被归入经济类,而在多数采编人员阅读该篇文章以后觉得归入时政类更合适一些,在系统与人的交互活动中,系统会以更高的权重来考虑采编人员的判断并做适当的调整。

3、智能的推荐系统

在报业知识库建设中另一个区别于其它行业知识库建设的核心,就是如何构建一个完善的智能推荐系统。这个推荐系统会根据使用人的工作性质,部门,类别,职务,专业,兴趣爱好等特定因素给使用人推荐最适合的内容资源。例如,同样输入“人民代表大会”作为关键词进行搜索后,针对编辑身份的人,系统除了提供有关编辑业务知识相关的文档外,会将知识库中历年召开人民代表大会期间的所有版面以比较高的相关度出现在编辑的推荐列表中供编辑人员参考;针对记者身份的人员,系统除了提供有关采访业务相关的知识文档外,会将有关“人民代表大会”的相关文章出现在推荐列表中,而针对不同部门或条线的记者,推荐的文章列表也是不同的,可能有关“人民代表大会”召开的会议组织等方面的文章会以高的相关度排在靠前的位置推荐给总编室的记者,而有关社会民生的“人民代表”所提的议案建议之类的文章则会以比较高的相关度提供给社会生活部的记者。

因为报业知识库主要的特点是海量的知识资源信息,所以数据的前期处理和后期使用工具就成了构建报业知识库时的重点与核心,正确成功地处理好了这两个环节,是报业知识库成功的关键所在。

总之,报业知识库的构建既是报业核心资产升值增值,报业之于其他新媒体核心竞争力提升的手段,也是全媒体时代报业从业人员拥有智力支持系统的迫切需要,是全媒体时代,传统平面媒体必需要进行的第三次技术更新的重点与核心。

参考文献:

[1] 姜圣瑜:《全媒体时代与小众化传播》传媒观察 2010年第4期

[2] 孙宝传:《报业信息化的第三波是什么》人民网

[3]中国报协电子技术工作委员会:《把握媒体改革机遇大力推进报业信息化——报业“十一五”信息化发展的几点建议》人民网

[4] 《受新媒体冲击美国传统报刊产业面临严峻挑战》新华网传媒频道

相关主题
文本预览
相关文档 最新文档