当前位置:文档之家› 珠海市统计局网站信息采编发系统的设计与实现

珠海市统计局网站信息采编发系统的设计与实现

珠海市统计局网站信息采编发系统的设计与实现
珠海市统计局网站信息采编发系统的设计与实现

●冯坚福万浩

珠海市统计局网站信息采编发系统的设计与实现

[摘要] 本文简要叙述了“珠海市统计局网站信息采编发系统”的系统需求,主要阐述了其文类流程和网站模板的设计思想和实现方法。

统计局计算中心的一个重要工作是维护其统计信息网的内容。维护工作普遍采用DreamWare或类似软件配合的半人工方法来进行。该方法在虽然技术实现上没有难度,但效率不高,同时也存在纰漏,更造成了人力物力的浪费。对于目前大部分地区的计算中心工作人员数量少、技术力量薄弱的现状来说,无疑是雪上加霜。同时,计算中心一般没有固定资金来源,无力购买现有采编发系统。对于这个矛盾,珠海市统计局充分发挥自身技术力量的优势,自行研究开发了该系统。

该系统是基于珠海市统计信息化远程规划,充分考虑系统的可适应性,从公文流转系统的高度上进行分析设计的。在网站模板和文类①流程的设计上具有一定的特色。

一、系统简要需求

珠海市统计信息的产量丰饶。据不完全统计,2004年全市统计部门共撰写统计分析和统计信息318篇,上报信息省统计局采用量在全省21个地级市中排名第二位,国家统计局采用量排名第三位。同时,我局信息采用数量在全市政务信息网络单位中排名第二,采用率排名第一。另外,我局管理的网站一共有三个:统计信息内网、统计信息外网和领导服务专区。众多信息中,不同类型的信息会有不同的上网要求:或只能上其中一个网站,或只能上其中两个网站,或三个网站都要上。

由于信息量大、上网要求复杂。特别是在目前人力不足的情况下,还要安排专人进行信息上网。这造成了很大程度上的人力资源浪费,影响了计算中心其他工作的正常开展,影响了统计信息的发布效率。这种情况下,我们急需建立一个处理信息发布的自动化系统。(一)系统总体目标

考虑到我市统计信息化远程规划的安排,该系统作为目前工作的一个辅助软件工具,也将成为我局公文流转系统的基础和重要组成部分。因此系统设计上应该满足以下目标:1.使信息发布工作自动化:摈弃以前DreamWare软件与HTML代码相结合的发布方式;系统要简单易用,使得一般用户都能方便地操作。

2.提高信息发布效率:降低信息从录入到发布的时间间隔,实现即来即发的高效率,使得网站信息的更新接近实时效果。

3.降低信息发布人员的工作量:信息发布人员只需进行少量操作就能将信息发布到相关网站,从而降低工作量,解放人力资源。

4.系统能扩展为公文流转系统:公文流转系统能在该系统的基础上进行完善和扩充,降低公文流转系统的开发成本和开发周期,从而加快我市统计信息化进程。

(二)系统功能需求

系统的首要目标就是实现信息发布的自动化,这也是其功能需求的根本出发点。系统要求能对信息的采集、编辑、审核、发布等进行必要管理。

1.采集功能,要求三个支持:(1)支持各种文章格式,包括Word、Excel、Txt;(2)支持各类对象,包括文字、表格、图片、视频、可下载附件;(3)支持各种采集方式:键盘录入、文件导入、剪贴板粘贴。

2.编辑功能:用户根据权限可以在系统中修改处于适当状态的文章,包括除其文章代码外的一切属性。

3.审核功能:用户根据权限可以将文章进行审核。对于审核通过的文章,可以被用户发布。对于审核未通过的文章,则退回重新编辑。

4.发布功能:系统可以将文章发布到用户指定的栏目。并在网站的其他相关地方反映该文章的发布,包括网站首页、栏目的文章列表页面等。

5.系统管理功能:对系统用户及其权限、网站及其栏目结构、文类及其流程、发布模板等进行管理。

(三)系统适应性要求

适应性是系统生命力的表现之一。本系统主要考虑以下三方面的适应:

1.文类流程的变动:一是不同的文类具有不同的处理流程,系统应该能同时处理多种文类的不同流程。二是同一文类的处理流程也可能随时间的变化而变化,系统不能在程序代码中限定文类的流程。

2.网站的改版:网站风格和文章版面都不是一成不变的,具体有两方面要求:一是已经产生的HTML文档要求能比较简便地移植到改版后的网站;二是系统能按照改版后的网站风格产生以后的HTML文档。

3.向公文流转系统的升级:系统能以较小代价扩展为公文流转系统。

二、系统设计与实现

采编发系统通过采集模块进行文章的录入,并通过编辑模块对文章进行修改直至通过用户审核。通过审核的文章将会被发布到多个网站。系统服务器上的数据库是所有目标网站内容的并集,各目标网站的内容只是服务器数据库内容的一部分,可以将其看成是服务器数据库的视图。

系统通过发布模块生成目标网站内容时,将首先在服务器上生成一份网站内容的镜像。然后通过网站内容镜像软件用FTP方式传送到目标网站的服务器上。如图所示:

根据目前珠海市局三个网站的结构及其内容,我们首先对该采编发系统的处理对象进行了概括,认为系统的处理对象包括五类,分别为:网站及其栏目、文章及其文类、发布模板。

每篇文章都属于且仅属于某个文类;一个文类具有用户定义的流转流程;文章根据其所属文类的流转流程进行其整个生命周期内的流转;网站由栏目构的;文章应用发布模板后,

将在目标栏目生成一个HTML文件,并对应修改栏目和网站的其他内容。

从这个对象模型中可以看出,系统关键功能包括两方面的内容:文章的流转和发布。

(一)文类流程设计

珠海市统计局撰写的《用自动化理论研究公文流转流程问题》(详见《统计信息化》2005/3期)一文中已经对该公文流转流程的设计和实现方案进行了详细而具体的描述。这里不再重复,只是简述其基本思想。

因为文章流程过程中的每一步都可以用一个公式来描述:当前状态+动作=> 后继状态。该表示公式可以非常简便地将文类流转流程转化为有限状态自动机的状态转换过程。因此,我们借鉴了自动化理论中的有限状态自动机理论,将一篇文章的整个生命周期用一个有限状态自动机来描述:文章的状态等价于有限状态自动机的状态,对文章的操作等价于有限状态自动机的状态间转换条件。

由于属于同一文类的所有文章,一般具有相同的处理流程。因此,每个文类对应一个确定的有限状态自动机。一篇文章由其目前状态和所属文类的有限状态自动机,就可以确定其可以接受的用户操作,并由用户操作改变文章的状态。

在具体实现上,我们用模块化的思想封装文章状态和对文章的各种操作,用数据库记录表示文类流转流程有限状态自动机。使得系统可以采用模块和插件的方式进行扩展,用户可以根据系统中已经存在的状态和操作,灵活地自定义各种文类的处理流程。

(二)模板设计

网站发布模板方面,系统将常用的网站结构和内容进行了归纳和分类,并结合目前各地统计局计算中心较常用的DreamWare软件,提出了五种模板类型来实现用户对网站风格的自定义。该设计使得系统能与DreamWare进行简便的衔接,既实现了网站栏目风格的灵活管理,又方便了对网站信息的更新维护。

1.栏目与文章、文类的关系

我们认为,栏目与网站的界限是模糊的。一个网站本身也可以看成是一个大栏目,某个栏目还可以是另外一个网站。网站上的所有栏目,包括子栏目,与网站自身栏目一起,形成了树状结构的栏目关系。树根就是网站这个根栏目。

虽然栏目结构是树状的,但栏目里的文章的链接却是网状的。一篇文章可能会在多个栏目中看到其链接或内容。例如:一篇有关先进性教育的政务信息,可能在“先进性教育专栏”、“党建动态”、“统计动态”等多个栏目中都有到该文章的链接或内容。

从文类与栏目的关系看。一个栏目可能会包含多个文类,例如“最新更新”栏目包括了网站内所有文类的文章;一个文类的文章也可能发往多个栏目,例如“政务信息”文类,可能发往“经普信息”、“党建动态”、“统计动态”等多个栏目。

对于这些关系,我们用栏目发布关联来处理。我们把所有发布到同一个物理网站的文章,不管其要求在多少个栏目中有链接,都只在其中一个栏目中产生唯一一个HTML文件,其他栏目只是到该文件的链接。该真实HTML文件所在的栏目被称为该文章的发布目标栏目,其他栏目被称为该文章的发布关联栏目。系统对每个文类都设定了几个可选目标栏目,每个可选目标栏目都可以存在一些关联栏目。当用户试图发布一篇文章时,系统将给出其所属文类的可选目标栏目供用户选择。用户选择了目标栏目时,系统也就获取了其关联栏目的信息。

2.发布模板类别

根据对网站栏目结构和内容的分析,我们认为网站就是栏目的树型结构,可以简称为栏目树。而栏目可以分为两类:节点栏目和叶子栏目。

节点栏目是指位于栏目树分支点上的栏目。这类栏目一般只有首页型索引,主要提供栏目说明和到子栏目的链接,同时也可以提供到子栏目部分文章(一般是最新文章)的链接。节点栏目自身不能有文章,只能有子栏目。

叶子栏目是指位于栏目树叶子点上的栏目,它下面不再有子栏目,而只有文章。这类栏目一般是给出本栏目所有文章的链接,供用户浏览文章内容。链接的给出方式有两种:一种是用列表的方式直接给出;另外一种是用分类的方式给出,例如“月报指标”栏目内的文章可以根据月度进行分类划分。

在显示风格上,同属一个栏目的所有文章一般有一致的页面风格。就是说,该栏目内的所有HTML页面,其网页顶端的网站信息、网页左边或右边的索引信息等都是一致的。

同样,同属一个文类的所有文章,其字体、排版风格等也是统一的。

因此,网站内容主要有几个组成部分:文类的版面风格、栏目的页面风格、栏目的部分文章列表、栏目的最新文章列表、栏目的分类索引列表、栏目的索引首页。

据此,我们对应设计了六类模板:

(1)文类模板

文类模板是作用在文章的基本信息及其内容上的。它将文章的标题、副标题、正文等内容按照要求组成一定的字体、排版风格的文章。该模板不产生任何文件,而是将应用了文类模板产生后的文章存放在数据库中。

(2)栏目页面模板

栏目页面模板反映一个栏目的外观。它是发布到该栏目的所有文章都必须遵循的格式。它主要规定除文章内容风格外的网站首页、网站其他栏目、网站其他信息的布局,并读取应用了文类模板后的文章,从而形成一个网页。

右图就是一个“统计动态”栏目的栏目页面

模板产生的HTML文档。图中,红色椭圆的框

住的部分就是该文章根据其所属的文类模板产

生的文章风格内容。

(3)栏目最新文章列表模板

该模板将发布到该栏目的最近N篇文章(N

值由用户指定)形成链接列表。

该模板在模板对应的文件夹中产生

topnindex.htm文档。该文件一般不供互联网用户直接读取,而是以的