当前位置:文档之家› 内容自动摘要系统的研究与设计

内容自动摘要系统的研究与设计

内容自动摘要系统的研究与设计
内容自动摘要系统的研究与设计

存档日期:存档编号:

XXXX 大学

毕业设计报告

题目:内容自动摘要系统的研究与设计

学号:

姓名:

院系:

班级:

指导教师:

xxx大学教务处印制

目录

前言 (4)

第一章主要技术概要 (5)

1.1传统式的摘要法 (5)

1.2模仿人工摘要法 (5)

1.3自动摘要法 (6)

第二章自动摘要技术的发展 (7)

2.1 自动摘要技术的起源和研究意义 (7)

2.2 新技术的提出 (8)

2.2.1 互依赖模型 (8)

2.2.2 自动确定摘要的长度的算法 (8)

2.3 关键句提取方面的新的研究方案 (10)

2.4 句子的相似度向量模型适用于自动摘要 (10)

第三章系统设计 (11)

3.1 Microsoft的基本类库MFC简介 (11)

3.2 系统所要解决的问题 (12)

3.3 系统流程 (12)

3.4 详细设计 (13)

3.5系统运行界面和结果分析 (26)

第四章用户手册 (29)

4.1软件条件 (29)

4.2 硬件条件 (29)

第五章毕业设计体会 (29)

第六章致谢 (30)

参考文献 (30)

内容自动摘要系统的

研究与设计

摘要:摘要是对文档内容的概括,在信息检索中起着重要的作用。分析了机械式自动摘要的局限性,提出一种模仿人工进行自动摘要的方法;探讨了基于文本的自动摘要系统的结构模型,在此基础上对模型中的提取关键词模块和关键句的提取模块进行了分析。最后,结合实例对系统进行了进一步地讨论。结果表明:该系统能够达到较好的质量和效率。

关键词:自动摘要;权值;统计

The Research on Simple Automatic

Summarization

System on Chinese Documents

Abstract : Abstract summarizes the content of Chinese documents , and plays an important role in information retrieval. After analyzing the limitation of mechanic automatic summarization , the paper shows a method of automatic summarization by simulating human being. And the paper also discusses simple architecture model of automatic summarization system on Chinese documents. Based on which the paper analyzes Chinese word segmentation module and the module of extracting sentences which make up of abstract . At last the paper discusses the system ulteriorly combining an instance , and the result shows that the system can reach better quality and efficiency.

Key words :automatic summarization ; weight ; statistic

前言

经济迅速发展的今天,信息已成为人们生活中不可缺少的部分,文献数量也成指数地增长。为了合理地运用这些信息,必须认真地对信息的筛选和浓缩等问题进行研究。由于摘要是对原始文章的主要内容进行筛选从中选择主要的语句,因此它可以帮助读者从整体上了解有关文章的主要内容,快速地掌握信息,准确地找到自己所需要的材料。但想使摘要能正确地反映文章的主要内容,编制工作量很大,且对摘要的要求也很高,加上目前信息数量的剧增,如果只靠人工来编制摘要,速度远远跟不上发展的要求。因此摘要自动化的研究就应运而生。自动摘要技术的使用前景是非常广泛的,在经济高速发展的今天信息的快速获得是通向成功的关键一步。随着计算机网络的普及全球信息一体化的发展,自动摘要技术有了更加宽广的使用空间。主要应用在搜索引擎方面、学科专业知识的搜集等方面。它可以使读者更加快速地查找到所需要的信息,为人们适应快节奏的经济社会发展提供了有力的帮助。所以基于文本的自动技术的发展程度是人类进入高速信息化社会的一个重要的表现。

目前基于文本的自动摘要技术很多,有很多的科学家都提出了很多自动摘要方面的方法,但是受到了现实科学技术发展的束缚。目前基于文本的自动摘要技术主要分为两大类:一类是基于理解的自动摘要方法,另一类是基于统计的自动摘要方法。基于理解的自动摘要方法建立在人工智能和对自然语言理解的基础之上,利用语言学知识对文章进行复杂的语法分析、语义分析、语用分析,最后生成文章摘要。由于这类方法实现了对文章主题内容的理解,并且许多摘要的句子都是由系统自动生成的,因此,从质量的角度来看,摘要反映原文主题的程度相对较高,且语句精炼、连贯性好。我们知道目前人工智能与自然语言理解还存在着许多难以解决的问题,使得目前这类方法还不能够得到快速的发展。另外,这类方法与文章所涉及的领域关系非常密切,从而使得基于这类方法的自动摘要系统的可移植性较差。基于统计的自动摘要方法则是根据文章的篇章结构,利用统计的方法来获取文章的主题内容。基于统计的自动摘要方法处理速度快,对于一般结构比较规范的文章处理效果较好。由于这类方法过分依赖于文章结构的规范性,且对句子或段落没有进行语义分析,因此存在着明显的不足,特别是对包含有多个主题的文章进行摘要时,常常出现遗漏主题或者摘要不连贯等现象。目前解决这个问题的唯一办法是利用人工智能的方法但是此技术受限制于当前科学技术的发展程度,仍处在初期阶段还没有得到很好的解决需要很长一段的时间进行探索和研究。

本软件是用Visual C++开发的,由于Visual C++提供了大量的API函数,使得开发软件变得简单了很多。本软件采用了Visual C++中的框架MFC的大量类库,加之本人对自动摘要技术发展的理解编写了该软件。

第一章主要技术概要

对于文本的自动摘要技术国外发展的比较早,早在1952年,美国的H. P. Luhn 就开始了自动文摘方法的研究,并于1958 年发表了第一篇有关文摘的自动生成方法文章。相对来说,国内自动摘要技术的研究起步较晚,直到1987 年左右才开始这方面的研究;加之中文与英文等在分词上的不同,更增加了中文自动摘要研究的复杂性和难度,因此目前与国外的差距很大。鉴于自动摘要技术的重要性,国家863计划对此立项进行了专门的研究和开发并取得了一定的成就[9]。总观自动摘要技术的发展整体上经历了三大阶段:一、传统式的摘要法。二、模仿人工编写摘要。三自动摘要系统。

1.1传统式的摘要法

传统机械式摘要法主要有段落摘要法、首尾句摘要法、标题摘要法以及关键词摘要法等几种。这几种方法都是从原文中机械地摘取一定数量的原句,经过适当的顺序组合成一段话作为文档的摘要。段落摘要法是指机械地从文档中提取第一段或最后一段作为文章的摘要,有些搜索引擎就是采用的这种方法;首尾句摘要法是指从原文中提取各段的首尾句,按顺序组合成摘要;标题摘要法是指从原文中提取一些重要章节的标题,然后加上一些类似“本文论述了”、“本文的目的”等总结性的词和连词,组合成摘要;关键词摘要法是指根据用户提供的关键词,将原文中含有这些关键词的句子提取出来,按顺序组合形成摘要。传统机械式摘要法虽在一定程度上解决了查阅大量信息时效率低的问题,大大节约了阅读时间,而且实现简单,但存在着许多局限性。1) 没有对原文进行必要的理解,只是机械地提取句子进行组合,易丢掉原文中的某些内容,造成摘要的不完整。2) 摘要的质量受文档的首尾句以及用户提供的关键词的影响比较大,当首尾句或关键词不能很好地反映主题时,摘要质量就会下降。3) 形成的摘要只是语句的堆积,没有经过优化,很可能使上下文不通顺。虽然可能包含了主要内容,但形式上与摘要存有差距[1]。随着计算机技术的发展,对摘要质量的要求也越来越高,传统的机械式摘要只局限于文本表层信息,技术发展已近极限,不能满足用户的需求。尤其对于中文文档要提高摘要的质量,必须要用到中文语言处理技术及理解技术。这样让计算机能够模仿人类的理解方法进行文章的摘要会大大地提高摘要的效率。为此, 提出了一种模仿人工摘要过程进行自动摘要的方法。

1.2模仿人工摘要法

模仿人工摘要系统的一般步骤如下:浏览全文、抓住全文的主要内容和中心思想,结合文章内容和类型,决定摘要的类型和阐述的重点,用尽量简洁、通顺的语言按一定的格式要求书写摘要。一般是从原文中摘录能够准确反映文章主题和中心思想的句子组成,最后复核检查。将人工摘要的过程对应到自动摘要中,让计算机模仿人工来生成摘要,分为以下四步:第一步,从人工摘要的过程来看,首先应抓住文章的主要内容,也就是抓住关键词句。以前关键词的提取主要是通过主题词词典扫描匹配全文,从中提取主题词词典中含有的词,然后进行筛选,确定关键词。这样做虽较简单,但需要主题词词典,在应用上要受到领域的限制。另外词典中可能遗漏涉及文档主题的关键词,导致这些词不能被准确提取。在提取关键词时,采用了统计词权并提取关键词与主题词词典

相结合的方法。统计词权即首先对文档进行分词并统计词频,根据词频和词在文档中的相对位置确定词权。然后去掉文档中属于停用词表中的词,停用词表是由出现频率较高的常用词组成。最后提取权值大于阈值的词作为本文档的关键词。这种方法避免了关键词的遗漏,而且不受领域的限制。当然如果只针对某一领域的文档提取关键词,就可以与关键词词典匹配法结合起来,从而达到更好的效果。第二步,人工摘要中,在抓住文档的主要内容后,将结合文档内容确定摘要重点,即确定能够反映文档核心的关键句。在目前的技术条件下,虽然计算机可通过对关键词的分析组合成一个完整的句子,但实现起来比较复杂,而且技术也很不成熟。所以目前比较简单的方法,仍然是从原文中提取原句作为关键句。因此,怎样提取关键句就成了关系到摘要成功的关键问题。这里采取了统计句权的方法,即将相关句子根据制定的规则(位置、是否含关键词等) 加权,然后根据加权结果选取文摘句。可作为文摘句的句子主要有以下几种: ①包含已确定的关键词的句子可作为文摘句;②包含已含重要信息的标题关键词的句子可作为文摘句;

③统计研究表明,80 %以上的文档的主题句都出现在段落首句或尾句,所以摘要时也应优先考虑段首尾句;④研究发现,包含“综上所述”、“本文论述了”、“总之”、“总而言之”等短语的句子大多数都是文档主要内容的精辟概述也可作为文摘句。第三步,人工摘要中,确定文档主要内容后,就应该开始书写摘要,即文摘句的组合。但由于摘要中一般都是陈述句,所以先要将以上句子中的疑问句、感叹句排除,再适当地综合加权。加权后将各被选句的权值按大小排序,将权值大于阈值的句子按在原文中的顺序排列组成文摘。第四步,最后可根据一般的摘要格式,对上面提取的摘要进行必要的修改、润色,去掉一些连接词、转折词,添加一些连词或指示性的短语,以使摘要保持通顺。但是这一步还处在初期阶段,因为这个阶段要与人工智能技术的发展紧密地结合在一起[1]。

人工摘要系统的流程图:

图1-1 人工摘要法流程图

1.3自动摘要法

自动摘要系统的方法是通过对模仿人工编写摘要法的分析、总结提出了一个简单的自动摘要系统的结构模型。该模型主要包括6个模块。①提取模块,主要由用户从文档库里选择或提交需要摘要的文档;②分词模块,将提交的文档进行分词;③统计分析模块,将分词进行统计处理,确定关键词;④提取文摘句模块,根据分配权值算法对句子分配权值,提取文摘句;⑤组织整理模块,提取的文摘句按在原文中的顺序排列成文摘,并进行适当的处理;⑥输出模块,将形成的摘要输出给用户。

其结构的模型图如下:

图1-2 自动摘要法流程图

第二章自动摘要技术的发展

2.1 自动摘要技术的起源和研究意义

所谓自动文摘就是利用计算机自动地从原始文献中提取文摘。文摘是准确全面地反映某一文献中心内容的简洁连贯的短文。自动文摘的研究是由H.P.Luhn于1952年开始的。1958年他发表了一篇题为“The Automatic Creation of Literature Abstracts(Auto —Abstracts)”的论文,从此揭开了计算机编制文摘的序幕。此后,Baxendale、Oswald、Edmundson和WyUys、Earl、IBM 公司以及俄亥俄州立大学等相继进行了研究,自动文摘技术得到不断的发展与完善[4]。1993年12月在德国Wadern召开了历史上第一次以自动文摘为主题的国际研讨会,标志着自动文摘时代的到来。目前已研究出多种自动文摘系统。70年代初,俄亥俄州立大学的教授James A.Rush和他的学生开发了ADAM (Automatic Document Abstracting Method)系统;1979年美国耶鲁大学研制了著名的FRUMP系统;新加坡南洋大学研制了图书馆新闻删节系统(Library Newspaper Cutting System)[5]。一个最新的应用是网典。网典是一个基于汉语语法、词的上下文和语义等中文信息处理技术,自动收集、识别Internet网上的WWW和News信息,智能化地提取摘要和关键词、建立索引、提供查询和对不良信息的监控、报警功能的网络信息自动发现和查询系统[10]。

自动文摘技术研究的意义:(1)它可以提高文摘杂志的时效。文摘杂志是一种二次出版物,人工编制文摘成本高、效率低,从原始文献的出版到文摘的出版往往有相当长的时差。自动编制文摘不仅可以缩短加工文献和编辑时间,较及时地给用户提供文献线索,而且成本大大降低。(2)更重要的是,当今电子出版物如潮而至,国际互联网蓬勃发展,大量的文献以机器读取的形式出现,网上信息极大丰富。要想在信息的海洋中找到所需信息,不仅需要先进的信息检索技术,还应该拥有一个能自动压缩信息甚至自动提炼信息的智能系统。(3)这也是快速阅读的要求。人们要了解某一领域的知识,往往要翻阅许多文献。一个好的自动摘要系统可以为读者提供文献的概要与精华,这对读者快速选择文献与快速阅读了解文献内容是很重要的[4]。

2.2 新技术的提出

在以上三个发展阶段的过程之中大多数的自动摘要方法中,都是采用摘句的方法而且都有一个共同的特点——摘要的长度均需预先给定。然而,实际的情况是,随着信息样本的不同,该信息样本所包含的信息量也是不同的,为了能够全面地反映信息样本的所有主题内容,又不产生信息冗余,就要求根据具体信息样本,动态地确定结果摘要的长度。据此,很多的研究者提出了一种动态确定摘要长度的算法,从具体样本中循序渐进地抽取出其所包含的所有主题句,这些主题句的集合构成了该信息样本的主题思想。然后,再根据主题句的数量确定摘要的长度。另外,为了减少摘要长度确定算法中的计算量,一些研究人员又提出了新的互依赖模型,将其用于提取关键词,可以较为准确而有效地降低计算的维数,并使后续算法的计算量大幅度减少。目前,关于动态确定摘要长度的研究虽然还没有专门的报道,但是已经有一些专家从理论上开始研究这种自动确定摘要长度的算法。基于内容和主题词的自动摘要方法将文章与内容分析相结合,生成具有良好的连贯性和流畅性的摘要。与仅基于内容的自动摘要系统相比较,可以使生成的摘要质量有明显的提高[8]。下面主要介绍了几位已经在理论上取得了很好效果的专家的成果。具体的算法主要是从具体样本中循序渐进地抽取出其所包含的所有主题句,再根据主题句的数量确定摘要的长度。另外,为了减少摘要长度确定算法中的计算量,采用互依赖模型对原文进行预处理,较为准确而有效地降维数,使后续算法的计算量大为减少。

2.2.1 互依赖模型

关键词的提取是自动摘要工作中一个较为重要的步骤,为了使提取的关键词较为准确,减少后续工作的计算量,有些研究人员提出了互依赖模型,将其N-gram 相结合来循序渐进地确定关键词。

定义1互依赖(mutual dependence , MD)定义两个变量χ和η之间的互依赖为:

MD (χ , η ) = [ F(s)×L - F(χ) ×F(η ) ]×;其中,F(χ)和F(η )是两

个变量出现的频率,F(s)是两个变量共现的频率,两个变量χ和η之间互依赖的取值范围为[0 ,1/4 ×log L),L是样本长度。当将MD模型应用于自动摘要时,所有这些频率均从需要摘要的文档中直接获得。这样做的优点是:首先,不需要字典支持;其次,所取出的关键词直接来自该文档,使得知识表达更加准确;再者,由于单篇文档的信息量是有限的,所以,取得的词语的数量也是有限的,从而保证最终向量空间的维数不会过高。在后续算法中,需要依据MD的取值范围,确定相关参数[2]。

2.2.2 自动确定摘要的长度的算法

现在大多数的文本自动摘要技术都是用的预先限定摘要长度的方法来去得摘要的这样做会使得摘要的内容不连贯没有说明性,甚至使文章的摘要没有概括全文的大概意思就断开了没有起到概括大意的作用。因此,就有很多的研究人员就想让程序在摘要的过程之中自动地确定该文本的摘要所需要的长度。该算法可以使程序根据文本的不同来

确定摘要的长度[2]。

输入:一篇待提取摘要的文档;n-gram的n值;MD的上界μ1和下界μ2;投影计数下限值δ;词频的上界δ1和下界δ2。

输出:最终摘要的长度L num;原文中词语的频率表W和原文中有意义词的集合U。

步骤1:互依赖结合n-gram循序渐进地切词;

(1)I=1; /*I是文档中的读取游标*/

(2)读取原文中游标I处的字Word( I );

(3)判断Word ( I )是否是有效的字,是,则转步骤1第(4)步;否则I = I+ 1,

转步骤1第(2)步;

(4)在频率表W中查找Word ( I ),若存在,将Word ( I )的频率增1,存回W;否

则,在W中建一个新记录,关键词为Word( I),频率值为1;

(5)For J= 2 To n从原文中连续读取从游标当前位置开始的长度为J的词String

( I , J);判断String ( I , J)是否是一个有效的词,若String ( I , J)

是一个有效的词,则在频率表W中查找String ( I , J),如果存在,将String

( I , J )的频率增1,存回W;否则,在W中建一个新记录,关键词为String

( I , J),频率值为1;若String ( I , J)不是一个有效的词,则退出此循

环;Next J;

(6)游标是否已经到文件尾部,是,则转步骤1第(7)步;否则I=I+1,转步骤1第

(2)步;

(7)将较低频(<δ2)和较高频(>δ1)的词从集合W中去除,得到U;

(8)For I = n To 2 Step-1

Do从U中取出一个尚未处理的I-gram词,尝试分解成集合U中的词,根据U中的频率和互依赖公式计算互依赖MD;

if MD>μ1 then

将U中组成该词的词的频率减去该I-gram词的频率;

else if MD<μ2 then

从集合U中删除当前的I-gram词;

end if

Until U中的所有I-gram词均处理完成;

Next I;

(9)将较低频(<δ2)和较高频(>δ1)的词从集合U中删除;

(10)采用降维规则再次降维;

步骤2:寻求摘要长度:

(1)基于词集U中的词语建立向量空间V;

(2)向量空间的维数D=当前词集U中的词语数;

(3)取k=1; /* k是向量子空间的维数*/

(4)将原文中的语句向k维子空间投影;

(5)根据投影焦点区及其上界和下界算法,求得原文在k维子空间上的投影焦点

区,将投影焦点区的数量记入Lnum,并得到原文中投影在所有k维子空间投影

焦点区内的语句的集合Vk;

(6)k=k+1;

(7)根据投影焦点区及其上界和下界算法,求得Vk-1中的语句在k维子空间上的

投影焦点区,将投影焦点区的数量记入Lnum,并得到原文中投影在所有k维子

空间投影焦点区内的语句的集合Vk;

(8)if k = D then 转下一步;

else 转步骤2 第(6)步;

end if

(9)输出最终摘要的长度Lnum;

经过以上的步骤就可以确定最终摘要所要输出的长度,经过了专家的论证该算法可以使摘要的内容不存在冗余,并且能够很全面地概括原文的内容。

2.3 关键句提取方面的新的研究方案

在现在关键句提取的方法之中,主要使用的是先提取关键词然后在文章中找到关键词所在的句子,将它们提取出来按照它们在文章中出现的先后顺序组合成一篇文章。但是这中方法所摘取出来的文字只是简单的句子的组合,会出现语句不通顺现象。因此,很多专家就提出了新的解决方案。主要是从词语和句子之间相关度方面来解决的。主要分为:词形相关度、句长相关度、距离相关度[6]。

词形相关度:语句之间的相关度与语句之间的相同关键词的个数密切相关,语句之间相同非重复关键词个数越多,则其间的相关度也就越高。语句Q、A的词形相关度为:

其中len (Q)、len (A)分别表示语句Q、A的长度

(即Q、A中所含词的个数) ,SameWC( Q, A)表示Q和A中相同单词的个数,若一个单词在Q、A中出现的次数不同,则以出现次数少的计数。容易证明0 ≤WordSim( Q ,A) ≤1。

句长相关度:两个语句的长度越相近,则其间的相关度也就越高,语句Q、A的句长

相关度为:其中abs() 表示绝对值。容易证明0 ≤LenSim( Q, A ) ≤1。

距离相关度:距离相关度是指语句之间关键词距离的大小,两句的相同关键词之间的距离越小,则两句也就越相关;如果同一关键词在句子中出现多次则以产生最小距离

的关键词为准。语句Q、A的距离相关度为:其中Dis(Q) 表示Q中非重复关键词中最左及最右关键词之间的距离,Dis(A)表示A中与Q相

同的最左及最右关键词之间的距离。容易证明0 ≤DisSim( Q, A )≤1。

综合上述的三个算法可以计算出关键句的相关度:Sim( Q,A )=λ1WordSim( Q,A) +λ2LenSim( Q, A )+λ3DisSim( Q , A ) ,其中λ1、λ2、λ 3 表示语句间词形相关度、句长相关度、距离相关度在语句相关度中所占的权重,且λ 1 +λ 2 +λ 3 = 1 ,显然0≤Sim( Q , A )≤1。

2.4 句子的相似度向量模型适用于自动摘要

本算法起源于通过分析句子或者段落之间的相似度来决定如何抽取句子的研究在

几年以前也已经开始。G.Salton和他的同事们在1999年的论文中介绍了他们的工作。

他们的工作是以段落为单位进行分析。根据段落间相似度建立一个图,图中的每个节点对应一个段落,节点的度代表段落的重要性。Jae.Hoon Kim等人基于同样的思想提出新的方法,并在G.Sahon方法的基础上做了一些改进。这个方法以句子为分析处理的对象。通过迭代计算句子间的相似度,然后根据句子间的相似度计算句子所包含的信息量,再从中选取包含信息量最多的一组句子作为文摘。Sasha Blair-Goldensohm等采用的是一种叫做SC的算法[3]。SC算法的核心思想就是首先将句子聚类,然后根据包含越多句子的类的代表句子就越重要的假设,根据每个类中句子的数目抽取出若干句子作为文摘。句子的相似度计算通过表示句子的向量间的Cosine值得到。这些算法都有一个共同的特点,就是都需要根据句子间的相似度来进行计算,因此句子间的相似度计算结果就成为了影响结果的一个重要方面。上述所有算法所采用的相似度计算方法都是根据表示段落或者句子的向量间的Cosine来计算的。这种相似度的计算方法有一个关键的局限就是,没有考虑单词之间的前后关系,忽略了单词的前后顺序的信息。这样计算出来的相似度对最终的结果有不小的影响。他们又对该算法在一些方面进行了改进,并加进了一些顺序关系的信息。在此基础上提出了一个基于向量模型的文本自动摘要方法,该方法的核心是首先计算所有句子间的相似度和权重,再根据句子的权重选择要抽取的句子;在一个句子被抽取成为摘要句之后,根据句子间的相似度调整剩下的句子的权重。使得那些与已经抽取出句子的相似度很高的句子(子句)所对应向量长度变得较小;然后在调整过的句子中继续上述过程直到抽取出来的句子达到相应的长度。

基于向量模型的文本摘要方法的基本步骤是:

步骤1:根据在句子的位置、查询、标题等特征计算句子的权重。

步骤2:计算句子间的相似度。

步骤3:根据句子的权重抽取句子

步骤4:根据被抽取出来的句子,用权重调整算法根据句子间的相似度调整句子的权重。步骤5:转到步骤3,直到抽取的句子数目达到一定界限。

第三章系统设计

3.1 Microsoft的基本类库MFC简介

早期程序员编写Windows的应用程序是一项非常艰苦的工作,他们必须使用Windows 中的API函数,自从Microsoft推出了基本类库MFC(Microsoft Foundation Class),程序员在编写Windows应用程序时必须编写的大量的重复代码,都由MFC的类和支持代码提供,它们提供标准的Windows编程任务框架[7]。MFC是提供辅助开发Windows应用程序的强有力的工具,使得应用程序的开发工作变得相当的轻松和高效,在MFC中封装了SDK结构、功能及应用程序框架内部技术,隐藏了过去很多Windows应用程序不得不处理的许多重复的工作。更重要的是基于MFC基本类库开发的应用程序具有良好的通用性和移植性。

下面为本系统使用的主要基类:

CMainFrame类是主框架窗口类,它的基类是CFrameWnd。头文件为MainFrame.h,实现文件为MainFrame.cpp。主框架窗口类用于管理主程序的窗口,来显示标题栏、工具栏、状态栏等,同时还处理对窗口操作的消息。

CWinApp类是应用程序类,头文件为Win.h,实现文件为Win.cpp。应用程序类控制应用程序的所有对象,包括文档、视图和边框窗口,并且完成应用程序的初始化工作和

程序退出时的清除工作。每一个基于MFC的应用程序都必须有一个从CWinApp类派生的对象。CWinApp类是应用类的基类。应用类对象为应用程序进行初始化和运行提供成员函数。在应用类中必须重载InitInstance成员函数,并做必要的初始化。

CDialog类它提供了编程接口来管理对话框。对话框是Windows中用于显示信息和获取用户输入信息的最重要的交互设备之一。对话框资源所提供的仅仅是一个数据结构,要利用所创建的对话框资源,必须要创建以它为资源的对话框类,所以的对话框类都是从CDialog类派生出的子类。CDialog类管理的对话框有两种类型:有模式对话框和无模式对话框。主要提供了按钮、列表框和文本框等。

CView类是视图类,它为用户派生的视图提供了基本的功能,视图与文档相联系,并且是文档与用户之间的中介。视图将文档的图象发送给屏幕和打印机并同时把用户的输入转换为对文档的操作。视图类最基本的函数有GetDocument()函数、UpdateAllView()函数、OnUpdate()函数和OnInitialUpdate()函数。CView类及其派生类只需要调用GetDocument()函数就可以取得CDocument类的对象指针,从而用此指针来访问文档类中的所以可见的数据。OnUpdate()函数是一个虚函数,当应用程序调用了CDocument类的UpdateAllView()函数时,应用程序框架就会相应的调用此函数,当然也可以直接在派生试图中调用它,通常在派生视图类中的OnUpdate()函数要对文档进行访问,读取文档的数据,然后再对视图的数据成员或控制进行更新,以便反映出文档的变化。

CRecordset类的对象代表一组从数据库选择的记录集。为使用派生类应先打开一个数据库,然后构造一个记录的对象,并打开数据库的CDatabase对象的指针传递给记录集类的构造函数。然后调用Open从数据源中选择数据,使用其成员函数和数据成员完成对数据项的操作。

CDocument类是所有文档类的基类,一个文档代表一个数据单元,CDocument类提供处理文档的基本功能。文档通过文档模板和与之关联的视图相互作用,视图提供了处理数据的可视用户界面。一个应用程序可支持一个以上的文档类型。

ODBC是一种使用SOL的程序设计接口,使用ODBC能使用户编写的数据库应用程序变得容易简单,避免了与数据源相连接的复杂性。利用ODBC创建数据库应用程序,以驱动程序的方式提供连接外部数据库的标准方法。ODBC是体系结构由应用程序、驱动程序管理器、数据库驱动程序和数据源组成。ODBC可以与数据源进行交互。主要任务是:建立与数据源的连接、向应用程序返回结果、将错误格式转化为标准错误代码并返回给应用程序等。ODBC提供了多种数据驱动程序。

3.2 系统所要解决的问题

随着互联网的普及、信息获取途径的增加,每天都有不断涌现的大量信息。为了从这些大量信息中快速、准确地获取所需要的信息,就需要一种能够把文本内容摘要成概括大意的技术。此技术可以将大量信息缩减为一段具有说明性的概括的文字能够使读者节省大量的时间。因此内容的自动摘要技术变得越来越重要。通过阅读文章摘要而不是全文能极大地加快信息过滤速度,帮助人们了解概况或确定是否应详读原文。该系统所要解决的就是这个问题。

3.3 系统流程

1.系统流程图:

图3-1系统流程图

2.系统实现的具体步骤:

1)本系统将所要摘要的文章进行中文分词,借助于中文分词技术将文章分为以词为最小单位的独立部分。

2)将独立的词存入数据库。

3)将存入的词对照停用词表把不能表达意思的词删除掉。

4)利用一个循环语句将各个词在文章中出现的次数统计起来存入数据库中作为词频,并计算各个词的权值。

5)在数据库中找到权值最大的词并在文章中提取此词所在的句子,并且按照此句子在文章中出现先后顺序,存储在一个字符串数组中。

3.4 详细设计

本系统充分地使用了VC++提供的类和函数。主要使用了CRecordView类、CRecordset类和CWinApp类所包含的成员函数。

本系统建了一个工程名为WENZISUOJIAN的工程。

本系统主要包含以下几个类:

图3-2类的结构图

在CWENZISUOJIANApp类中主要包含以下方法:

图3-3CWENZISUOJIANApp类方法图

在CWENZISUOJIANSet类中主要包含以下方法和变量:

图3-4CWENZISUOJIANSet类方法图

其中m_tyzi、m_gjzi、m_quanzi分别对应了数据库里的停用词、关键词、权值三个字段。

在CWENZISUOJIANView类中主要包含以下方法和变量:

图3-5CWENZISUOJIANView类方法图

m_int1、m_int2、m_strLine、m_strline1、m_strline2是全局变量。其中m_int1、m_int2是int型,m_strLine、m_strline1、m_strline2是CString型。

函数CTyongci(CString m_strline)是过滤停用词、函数CTjiaxinci()是向数据库中添加新词、函数CTjiciquan()是向数据库中添加各个词的词频、函数

CXqzuidaquanzhi(CString m_str)是选取数据库中词频最大的词语(即关键词)、函数CZquguanjianju(CString m_strline)是摘取词频最大的词语所对应的关键句。

代码实现:

该软件在VC++中所使用的全局变量和所有的函数定义

class CWENZISUOJIANView : public CRecordView

{

protected: // create from serialization only

CWENZISUOJIANView();

DECLARE_DYNCREATE(CWENZISUOJIANView)

CString m_strline2;

CString m_strline1;

CString m_strLine;

int m_int1;

int m_int2;

public:

//{{AFX_DATA(CWENZISUOJIANView)

enum{ IDD = IDD_WENZISUOJIAN_FORM };

CWENZISUOJIANSet* m_pSet;

// NOTE: the ClassWizard will add data members here

//}}AFX_DATA

// Attributes

public:

CWENZISUOJIANDoc* GetDocument();

// Operations

public:

// Overrides

// ClassWizard generated virtual function overrides

//{{AFX_VIRTUAL(CWENZISUOJIANView)

public:

virtual CRecordset* OnGetRecordset();

virtual BOOL PreCreateWindow(CREATESTRUCT& cs);

protected:

virtual void DoDataExchange(CDataExchange* pDX); // DDX/DDV support

virtual void OnInitialUpdate(); // called first time after construct

virtual BOOL OnPreparePrinting(CPrintInfo* pInfo);

virtual void OnBeginPrinting(CDC* pDC, CPrintInfo* pInfo);

virtual void OnEndPrinting(CDC* pDC, CPrintInfo* pInfo);

//}}AFX_VIRTUAL

// Implementation

public:

CString CXqzuidaquanzhi(CString m_str);

CString CZquguanjianju(CString m_strline);

void CTjiciquan();

void CTjiaxinci();

CString CTyongci(CString m_strline);

virtual ~CWENZISUOJIANView();

#ifdef _DEBUG

virtual void AssertValid() const;

virtual void Dump(CDumpContext& dc) const;

#endif

protected:

// Generated message map functions

protected:

//{{AFX_MSG(CWENZISUOJIANView)

afx_msg void OnCancel();

afx_msg void OnOk();

afx_msg void OnChangeTianjiawenzi();

//}}AFX_MSG

DECLARE_MESSAGE_MAP()

};

#ifndef _DEBUG // debug version in WENZISUOJIANView.cpp

inline CWENZISUOJIANDoc* CWENZISUOJIANView::GetDocument()

{ return (CWENZISUOJIANDoc*)m_pDocument; }

#endif

使要摘要的文章过滤掉数据库中的停用词(停用此即是文章中的一些不能表达意思的词。如,助词)使文章的体积减小。该函数经过运行返回一个经过过滤后的一个CString 类型的m_strline变量。算法:将待摘要的段落文字存放在一个CString类型的变量m_strline中,利用一个for()循环语句取出m_strline中的词m_str1与一个CString类型存放了数据库中的停用词的m_str2进行比较如果相同就从m_strline中删除,直到循环结束。

流程图:

图3-6 去掉停用词流程图CString CWENZISUOJIANView::CTyongci(CString m_strline) {

m_int1=m_strline.GetLength();

int i;

CString m_str1,m_str2;

CWENZISUOJIANSet m_set;

if(m_set.IsOpen())

m_set.Close();

m_set.Open(AFX_DB_USE_DEFAULT_TYPE,"wenzisuojian"); do{

m_str2=m_set.m_tyzi;

for(i=0;i

{

m_str1=m_strline.Mid(i,2);

if(m_str2==m_str1)

{

m_strline.Delete(i,2);

m_int1=m_int1-2;

}

}

m_set.MoveNext();

}while(!m_set.IsEOF());

m_set.Close();

return m_strline;

}

当文章刷掉停用词以后,就将文章中的词语添加到数据库中。为统计词频做准备。该函数只是对数据库中的m_gjzi数据进行了改写,没有任何返回值。算法:首先取一个布尔型的变aa初始值为false,利用一个for()循环语句分别取m_str3中的词和一个数据库中的词进行比较如果相等就将aa设置为true并退出do…while()循环并添加到数据库中然后继续for()循环比较直到循环结束。

流程图:

图3-7 添加新词流程图

void CWENZISUOJIANView::CTjiaxinci()

{

int i=0;

CString m_str1,m_str2,m_str3;

m_str3=CTyongci(m_strline2);

CWENZISUOJIANSet m_set;

bool aa;

aa=false;

m_set.Open(AFX_DB_USE_DEFAULT_TYPE,"wenzisuojian");

m_set.MoveFirst();

m_int1=m_str3.GetLength();

for(i=0;i<=m_int1;i+=2)

{

m_set.MoveFirst();

aa=false;

m_str1=m_str3.Mid(i,2);

do{

m_str2=m_set.m_gjzi;

if(m_str1!=m_str2)

m_set.MoveNext();

else

{

aa=true;

break;

}

}while(!m_set.IsEOF());

if(aa==false)

{

m_set.AddNew();

m_set.m_gjzi=m_str1;

m_set.m_quanzi=1;

m_set.Update();

}

}

m_set.Close();

}

当数据库中添加了新的词语以后就要对各个词语统计出现次数并存入数据库中。提取出文章的关键词为找出文章的关键句做准备。(在新出版的研究理论中寻找关键词是靠着词的权值获得,但是涉及到很多数学专业领域方面的知识,本人能力有限所以本系统没有采用。)算法:用一个CString类型的变量m_str3存储经过停用词表过滤后的字符串,将m_str3中的词存放到m_str1中,用m_str2存放数据库中的词,利用一个for()循环语句比较m_str1和m_str2是否相等,如果相等就将m_str2对应词的m_quanzi加1。该函数只是对数据库中的各个词的m_quanzi进行改写,不返回任何值。

流程图:

图3-8 统计词频流程图

void CWENZISUOJIANView::CTjiciquan()

{

int j=0;

CString m_str1,m_str2,m_str3;

m_str3=CTyongci(m_strline2);

CWENZISUOJIANSet m_set;

if(m_set.IsOpen())

m_set.Close();

m_set.Open(AFX_DB_USE_DEFAULT_TYPE,"wenzisuojian");

m_set.MoveFirst();

m_int2=m_str3.GetLength();

do{

m_str2=m_set.m_gjzi;

for(j=0;j<=m_int2;j+=2)

{

m_str1=m_str3.Mid(j,2);

if(m_str2==m_str1)

{

m_set.Edit();

m_set.m_quanzi++;

m_set.Update();

}

}

m_set.MoveNext();

}while(!m_set.IsEOF());

}

当各个词语的词频存入数据库以后,就要寻找词频最大的词语作为关键词。为摘取关键句做准备。算法:首先取数据库中的第一个词频m_set.m_quanzi存放到一个int型变量a 中并把对应的m_set.m_gjzi存储到m_str中,然后将数据库对象变量移到下一个位置取出m_set.m_quanzi存储到b中并比较a和b的大小将大的值赋给a并将对应的m_set.m_gjzi赋给m_str。直到m_set指向数据库的最后位置循环结束。并返回m_str变量的值。

流程图:

人事管理系统项目详细设计说明书

目录 1. 概述 1.1.目的 本文为教学案例项目SQLServer功能规范说明书。本说明书将: ●描述数据库设计的目的 ●说明数据库设计中的主要组成部分 ●说明数据库设计中涵盖的教学知识要点 1.2.内容 本文档主要内容包括对数据库设计结构的总体描述,对数据库中各种对象的描述(包括对象的名称、对象的属性、对象和其他对象的直接关系)。本文档中包含对以下数据库内容的描述: ●数据表 ●视图 ●存储过程 ●用户自定义函数 ●触发器 ●约束 在数据库主要对象之外,本文还将描述数据库安全性设置、数据库属性设置和数据库备份策略,为数据库管理员维护数据库安全稳定地运行提供参考。

1.3.与其他项目的关联 教学案例项目的数据库设计与教学项目(Web部分和Windows部分)功能密切相关。教学案例项目的数据库将按照教学项目程序部分的功能需求而设计,数据库设计将配合教学案例的程序部分,以实现一个功能完备的企业环境内的应用。 2. 数据库 2.1.数据库名称 数据库的名称一定要设为RGB,否则本案例设计的Web部分的应用程序和Windows 部分的应用程序将无法使用该数据库。 答案:USE[master] GO /******Object:Database[RGB]ScriptDate:06/18/201108:55:58******/ CREATEDATABASE[RGB]ONPRIMARY (NAME=N'RGB',FILENAME=N'C:\ProgramFiles\MicrosoftSQLServer\MSSQL10.MSSQLSERVE R\MSSQL\DATA\RGB.mdf',SIZE=3072KB,MAXSIZE=UNLIMITED,FILEGROWTH=1024KB) LOG ON (NAME=N'RGB_log',FILENAME=N'C:\ProgramFiles\MicrosoftSQLServer\MSSQL10.MSSQLS ERVER\MSSQL\DATA\RGB_log.ldf',SIZE=1024KB,MAXSIZE=2048GB,FILEGROWTH=10%) GO ALTERDATABASE[RGB]SETCOMPATIBILITY_LEVEL=100 GO IF(1=FULLTEXTSERVICEPROPERTY('IsFullTextInstalled')) begin EXEC[RGB].[dbo].[sp_fulltext_database]@action='enable' end GO ALTERDATABASE[RGB]SETANSI_NULL_DEFAULTOFF GO ALTERDATABASE[RGB]SETANSI_NULLSOFF GO ALTERDATABASE[RGB]SETANSI_PADDINGOFF GO ALTERDATABASE[RGB]SETANSI_WARNINGSOFF

学生信息管理系统概要设计

第5章学生管理系统概要设计 5.1引言 5.1.1编写目的 由于现在的学校规模在逐渐的扩大,设置的专业类别、分支机构及老师、学生人数越来越多,对于过去的学生信息管理系统,不能满足当前学生信息管理的服务性能要求。本报告对于开发新的<<学生信息管理系统>>面临的问题及解决方案进行初步的设计与合理的安排,对用户需求进行了全面细致的分析,更清晰的理解学生信息管理系统业务需求,深入描述软件的功能和性能与界面,确定该软件设计的限制和定义软件的其他有效性需求,对开发计划进行了总体的规划确定开发的需求与面临困难的可行性分析。 5.1.2背景 开发软件的名称:《学生信息管理系统》 项目提出者: 项目开发者: 用户:管理员、老师、学生 5.1.3定义 数据流图:简称DFD,它从数据传递和加工角度,以图形方式来表达系统的逻辑功能、数据在系统内部的逻辑流向和逻辑变换过程,是结构化系统分析方法的主要表达工具及用于表示软件模型的一种图示方法。 数据字典:是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。 https://www.doczj.com/doc/0114043246.html,:是一项微软公司的技术,是一种使嵌入网页中的脚本可由特网服务器执行的服务器端脚本技术。指 Active Server Pages(动态服务器页面),运行于 IIS 之中的程序。

C#:(C Sharp)是微软(Microsoft)为。NET Framework量身订做的程序语言,微软公司在2000年6月发布的一种新的编程语言。C#拥有C/C++的强大功能以及Visual Basic简易使用的特性,是第一个组件导向(Component-oriented)的程序语言,和C++与Java一样亦为对象导向(object-oriented)程序语言。 SQL:(Structured Query Language)结构化查询语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。同时也是数据库脚本文件的扩展名。 SQL Server 2005:SQL Server 是一个关系数据库管理系统。它最初是由Microsoft Sybase 和Ashton-Tate三家公司共同开发的,于1988 年推出了第一个OS/2 版本。在Windows NT 推出后,Microsoft与Sybase 在SQL Server 的开发上就分道扬镳了,Microsoft 将SQL Server 移植到Windows NT系统上,专注于开发推广SQL Server 的Windows NT 版本。Sybase 则较专注于SQL Server在UNIX 操作系统上的应SQL Server安装界面用。 B/S :(Client/Server,客户机/服务器)模式又称C/S结构,是20世纪80年代末逐步成长起来的一种模式,是软件系统体系结构的一种。C/S结构的关键在于功能的分布,一些功能放在前端机(即客户机)上执行,另一些功能放在后端机(即服务器)上执行。功能的分布在于减少计算机系统的各种瓶颈问题。C/S模式简单地讲就是基于企业内部网络的应用系统。与B/S(Browser/Server,浏览器/服务器)模式相比,C/S模式的应用系统最大的好处是不依赖企业外网环境,即无论企业是否能够上网,都不影响应用。 5.1.4参考资料 [1] 张海藩主编,《软件工程导论》,清华大学出版社 [2] 陆丽娜主编,《软件工程》,经济科学出版社 [3] 瞿中主编,《软件工程》,机械工业出版社 [4]《数据库系统概论》——萨师煊高等教育出版社 [5]《https://www.doczj.com/doc/0114043246.html,实用案例教程》--石志国 [6]《C#入门经典》--齐立波,清华大学出版社 [7]《计算机软件文档编制规范》GB-T8567-2006 [8]需求分析与可行性研究报告

人力资源管理人事管理系统分析与设计

(人力资源管理)人事管理系统分析与设计

目录 第壹章可行性分析方案 1.1引言 (1) 1.2系统建设的背景、必要性和意义 (1) 1.2.1背景 (1) 1.2.2必要性 (2) 1.2.3意义 (2) 1.3拟建系统的候选方案 (2) 1.3.1候选方案壹 (2) 1.3.1候选方案二 (2) 1.4可行性论证 (2) 1.4.1经济可行性研究 (2) 1.4.2社会可行性研究 (3) 1.4.3技术可行性研究 (3) 1.5几个方案的比较 (3) 第二章系统说明书 2.1引言 (4) 2.1.1系统的名称 (4) 2.1.2系统功能和系统目标 (4) 2.1.3系统开发的背景 (4) 2.2项目概述 (4) 2.2.1项目的主要工作内容 (4) 2.2.2现行系统的调查情况 (5)

2.2.3新系统的逻辑模型 (5) 2.2.4人事管理系统模块图 (9) 2.3实施计划 (9) 2.3.1工作任务的分解 (9) 2.3.2进度 (10) 第三章系统设计说明书 3.1引言 (11) 3.1.1项目背景 (11) 3.2系统总体技术方案 (11) 3.2.1模块设计 (11) 3.2.2模块划分及功能介绍 (13) 3.3运行测试 (14) 第壹章可行性分析方案 1.1引言 项目名称:人事管理系统 可行性研究工作的基本内容:于开发过程中,我们为了尽量给用户以方便,考虑到用户需求的实际情况,建立较为简单易明的系统服务,开发此系统无论于经济上,操作上,仍是于技术上均是可行的。 本次可行性方案的编写目的于于研究公司的人事管理部门的人事管理系统的各种需要。人事档案管理信息系统,作为数据库管理系统的壹个具体应用,于实际工作中得到了广泛的应用,因为通过它能对企事业单位的人力资源进行卓有成效的管理,提高了管理的效率,方便了使用,通过壹系列的操作能够快速、可靠的进行人事档案的更新、查找,极大的提高了工作效率,是现代企事业单位必

教务管理系统概要设计说明

教务处管理系统概要设计说明书

1 概述(设计思想) 教务管理系统是一个面向学校教务管理人员、教师和学生,为其提供服务的综合管理系统,随着教学体制的不断改革,尤其是学分制、选课制的展开和深入,使得教务日常管理工作日趋繁重、复杂,而现有的教务管理软件基本上都是单机版本的,已满足不了现在教务工作需要。因此迫切需要研制开发基于互联网的综合网上教务管理软件。 该教务管理系统总体设计思想:面向学校各部门以及各层次用户的多模块综合信息管理系统为了充分利用高校现已有的网络资源。实现教务各上下级之间迅速便捷的沟通,在系统的架构上采用了当前流行的B/S结构与C Z S结构及 Internet 网络相结合的技术突破了系统使用地域的局限性,使整个校园网甚至Internet 上的用户都可访问本教务系统并进入相应的教务信息查询,如查询课程表、教学进程等等.为了体现分散操作、统一管理的思想,实现教务信息的集中管理、分散操作、信息共享,使传统的教务管理朝数字化、无纸化、智能化、综合化的方向发展,实现教务各上下级之间迅速便捷的沟通,形成充满活力的新型的教务管理机制。 教务管理系统由两部分组成:前台和后台。前台客户层采用了最新的webstart 工具,使得客户端可以自动升级、即时更新,减轻了系性;后台数据层采用了对象关系型数据库,它将数据进行统一管理,所有的客户端都从后台捌用数据,实现了资源共享、保证了数据的一致性并且后台数据还具有自动备份功能,来保证数据库中数据的安全性与可靠性.后台主要有系统管理员,前台则主要面对在校学生和教务处人员和各院系教务员及任课教师使用,教务网的管理员分初级管理员和高级管理员:初级管理员是各科室的负责人,提交本科室的待发布教学通知、公告等信息,管理本科室的上传文件并接受高级管理员的管理;高级管理员管理所有上传的文件,审核并发布各科室提交的信息,管理教务信箱和教务网界面等。教务处长属于高级管理员。 2 系统策略 系统性 该教务管理系统实时更新,系统比较完善可靠,技术成熟,可以按照不同学校对于教务的不同需求进行更改,满足用户需求。 先进性 该教务管理系统技术先进,系统先进,比较完善。 安全性 数据库考虑到安全性问题,对文件进行加密,提高了安全度,保证了系统的安全。可维护性 该教务管理系统界面可以再后台管理前台显示的界面,模块化程度高,可维护性强。 正确性 该教务管理系统可以正确反映教务的信息,实时更新数据,保证信息正确和可靠 简单性 该教务管理系统操作简单,界面简洁,后台管理易学,维护复杂度比较小适应性 该教务管理系统可以在多平台下使用,对浏览器的兼容性强,适用性强。

人事管理系统项目详细设计说明书

目录 1.概述 1.1.目的 本文为教学案例项目SQLServer功能规范说明书。本说明书将: 描述数据库设计的目的 说明数据库设计中的主要组成部分 说明数据库设计中涵盖的教学知识要点 1.2.内容 本文档主要内容包括对数据库设计结构的总体描述,对数据库中各种对象的描述(包括对象的名称、对象的属性、对象和其他对象的直接关系)。本文档中包含对以下数据库内容的描述: 数据表 视图 存储过程 用户自定义函数 触发器 约束 在数据库主要对象之外,本文还将描述数据库安全性设置、数据库属性设置和数据库备份策略,为数据库管理员维护数据库安全稳定地运行提供参考。

1.3.与其他项目的关联 教学案例项目的数据库设计与教学项目(Web部分和Windows部分)功能密切相关。教学案例项目的数据库将按照教学项目程序部分的功能需求而设计,数据库设计将配合教学案例的程序部分,以实现一个功能完备的企业环境内的应用。 2.数据库 2.1.数据库名称 数据库的名称一定要设为RGB,否则本案例设计的Web部分的应用程序和Windows 部分的应用程序将无法使用该数据库。 答案:USE[master] GO /******Object:Database[RGB]ScriptDate:06/18/201108:55:58******/ CREATEDATABASE[RGB]ONPRIMARY (NAME=N'RGB',FILENAME=N'C:\ProgramFiles\MicrosoftSQLServer\\MSSQL\DATA\',SIZE=3072KB,MAXSIZE= UNLIMITED,FILEGROWTH=1024KB) LOG ON (NAME=N'RGB_log',FILENAME=N'C:\ProgramFiles\MicrosoftSQLServer\\MSSQL\DATA\',SIZE=1024KB,MAXS IZE=2048GB,FILEGROWTH=10%) GO ALTERDATABASE[RGB]SETCOMPATIBILITY_LEVEL=100 GO IF(1=FULLTEXTSERVICEPROPERTY('IsFullTextInstalled')) begin EXEC[RGB].[dbo].[sp_fulltext_database]@action='enable' end GO ALTERDATABASE[RGB]SETANSI_NULL_DEFAULTOFF GO ALTERDATABASE[RGB]SETANSI_NULLSOFF GO ALTERDATABASE[RGB]SETANSI_PADDINGOFF GO ALTERDATABASE[RGB]SETANSI_WARNINGSOFF

电脑销售信息管理系统概要设计说明书

电脑销售系统概要设计说明书 一、引言 1.1 此文档的编写目的 该项目的是开发一个联想笔记本电脑销售管理系统 1.2项目背景 对于我们大学生而言,我们每个人都有一台笔记本电脑或者是一台式机吧,一般来说,电脑里面知识丰富多彩,多姿多样,五彩缤纷,陶醉迷人,你只需要动一下你的手指头,里面的场景是多么的迷人和吸引人呀,同时也看到了最近的发生的最新消息,最近的市场行情的变动,最近的网站网页,最近的歌曲等等,我们这些是从何而知道的呢,是从网上吧,不,使我们的电脑,是电脑第一时间给我最新的消息,是它第一时间给我传达的,是它让我学会在网上购物。 所以,电脑的出现,也随着网络的飞速发展如雨后春笋般盛行起来,同样也给我们提供大量的网络资源我与我们学计算机的学生来说基本上每个人都需要电脑,不管是笔记本电脑还是台式机电脑,我们消费者一样可以在家里拥有足不出门的待遇和享受乐趣。 网络大量资源收集,通过电脑的广泛运用,我们作为消费者就可以很快地查阅你想要的资料,你想看的电影和电视,比如留言板、QQ聊天、电子邮箱发送、论坛区、浏览网页,更多的是为了IT行业和我们学计算机的专业的学生提供了很多的帮助和贡献。 因此,趋于激烈的市场竞争,销售商不断提高业务处理效率、和信息处理速度,及时、正确的掌握市场需求。由于业务量的不断扩展,传统的手工管理方式已无法满足管理者的需求,造成业务管理混乱、财务账目不请,工作效率低下等问题,从而影响企业发展。 项目任务提出者:客户。 项目开发者:电脑销售信息管理系统项目组。 本电脑销售信息管理系统项目主要由两部分形成: 1.各分公司中的前台客户销售程序; 2.总公司中的数据库服务器程序; 1.3 定义 1.SQL SERVER: 系统服务器所使用的数据库管理系统(DBMS)。 2.SQL: 一种用于访问查询数据库的语言 3.SQL: Structured Query Language(结构化查询语言)。 1.4参考资料 以下列出在概要设计过程中所使用到的有关资料: 1.电脑销售系统项目计划任务书3开发小组2012/4 2.电脑销售系统项目开发计划3开发小组2012/4 3.电脑销售系统需求规格说明书3开发小组2012/4 4.电脑销售系统用户操作手册(初稿)3开发小组2012/4

软件工程课程设计报告人事管理系统

软件工程课程设计报告人事管理系统

软件工程课程设计 题目人事管理系统 系计算机系 专业班级软件工程(动画方向)(2)班 学生姓名贾秋洪 学号 2358069 指导教师姜青山 年 6 月 18 日 1.课程题目 人事管理系统设计 2.概述 2.1本课题的来源 A公司是一家以寿险营销为目的的寿险公司,公司员工众多业务流量大,为了方便管理,我制作了一个人事管理系统。主要经

过员工基本信息录入、修改、查询、删除以及员工考勤等方面来对员工综合考评。以便对员工发放工资进行合理分配。这样能提高领导的人事管理水平还能提高员工的积极性。经过现代计算机技术与企业管理相结合,实现人事管理系统的科学化、信息化、现代化,而且适合一般人群使用。 企业人事管理是相对企业内部员工的管理。集人员、考勤、工资、员工培训、系统功能等于一体的大型管理系统,为公司在人事管理等方面提供极大的方便。本软件是以中小型企业为背景而设计开发的,界面美观、使用方便。本系统主要以人员管理、考勤管理、统计分析管理、工资核算等,是企业人事管理必不可缺的好帮手。 2.2本课题目的、实现功能与预期成果 2.2.1目的 当前市面上流行的人事管理系统不少。可是,对于A公司来说,不需要大型的数据库系统。只需要一个操作方便,功能实用,能满足本中心对数据的管理及需求的系统。我们的目标就是在于开发一个功能实用、操作方便,简单明了的人事管理系统。 2.2.2实现功能 能够录入人事的基本资料,在操作上能够完成诸如添加、修改、删除、按各种条件进行查询、新用户的设置及密码修改等方

面的工作,基本满足人事日常业务的需要。 2.2.3预期成果 所做出的人事管理系统能让A公司管理层在操作简单的前提下并有效的提高对该公司的人事管理,并经过该系统提高员工的能力。尽量使本系统做到是一个科学化、信息化、简单使用的人事管理系统。 3.系统分析 3.1系统调研 正式开发管理信息系统之前进行调研是非常必要的,必要对现行系统进行详细的调查,明确用户需求,保证开发的新系统的功能与用户的要求相吻合,避免耗费大量的人力、物力、财力,新系统的开发却失败的悲剧发生。 3.2可行性分析概述 可行性分析是在A公司的要求和系统调研的基础上进行的,对新系统的开发从社会、技术、经济、管理等方面进行分析,并得出新系统的开发工作可行、不可行、需要修改、追加投资、暂缓开发、分步实施等方案和结论,最后完成可行性分析。 可行性分析一般可定义为:可行性分析是在建设的前期对工程项目的一种考察和鉴定,对拟议中的项目进行全面与综合的技术、经济能力的调查,判断它是否可行。 可行性分析阶段的主要工作包括以下几个方面:

系统概要设计文档

系统概要设计文档
1 / 18

目录
系统概要设计文档 ....................................................................................................... 1b5E2RGbCAP 目录 ................................................................................................................................2p1EanqFDPw 1 引言 .............................................................................................................................. 3DXDiTa9E3d 1.1 编写目的及阅读建议 ...................................................................................... 3RTCrpUDGiT 1.2 系统概述 ......................................................................................................... 35PCzVD7HxA 1.3 文档概述 ............................................................................................................. 3jLBHrnAILg 1.4 设计原则与设计要求 ......................................................................................3xHAQX74J0X 2 引用文件 ...................................................................................................................... 3LDAYtRyKfE 3 设计概述 ....................................................................................................................... 4Zzz6ZB2Ltk 3.1 功能需求规定 .................................................................................................... 4dvzfvkwMI1 3.2 运行环境 ........................................................................................................... 4rqyn14ZNXI 4 系统体系结构设计 ..................................................................................................... 4EmxvxOtOco 4.1 系统总体设计 ................................................................................................... 4SixE2yXPq5 4.1.1 概述 ........................................................................................................ 46ewMyirQFL 4.1.2 设计思想 ............................................................................................... 5kavU42VRUs 4.1.3 基本处理流程 ........................................................................................ 6y6v3ALoS89 4.1.4 系统数据结构设计 ............................................................................... 9M2ub6vSTnP 4.4 接口设计 ........................................................................................................ 100YujCfmUCw 4.4.1 用户接口 ............................................................................................. 10eUts8ZQVRd 4.4.2 外部接口 ............................................................................................ 10sQsAEJkW5T 4.4.3 内部接口 ............................................................................................. 11GMsIasNXkA 5 运行设计 ..................................................................................................................... 11TIrRGchYzg 5.1 系统初始化 ................................................................................................... 117EqZcWLZNX 5.2 运行控制 ........................................................................................................... 11lzq7IGf02E 5.3 运行结束 .......................................................................................................... 11zvpgeqJ1hk 6 系统出错处理设计 ..................................................................................................... 11NrpoJac3v1 6.1 出错信息 ..........................................................................................................111nowfTG4KI 6.2 补救措施 .......................................................................................................... 12fjnFLDa5Zo 7 系统维护设计 ............................................................................................................. 12tfnNhnE6e5 附录 ............................................................................................................................. 12HbmVN777sL
2 / 18

企业人事管理系统详细设计说明方案

精心整理企业人事管理系统 详细设计说明书 文档作者谭聪 学号 一. 1.1 阶段中, 1.2背景 1.3 主键:数据库表中的关键域。值互不相同。 外部主键:数据库表中与其他表主键关联的域。 ROLLBACK:数据库的错误恢复机制。 1.4参考资料 1.人事管理系统项目计划任务书,XXX公司 2.人事管理系统项目开发计划,软件开发小组 3.用户操作手册(初稿),软件开发小组 4.软件工程及其应用,周苏、王文等,天津科学技术出版社 5.软件工程,张海藩,清华大学出版社 二.系统结构 模块结构由各个成员分别完成 身份认证模块及人员信息统计模块见《身份认证及人员信息统计模块》分页 人员信息维护模块见《人员信息维护模块》分页

人员信息查询模块见《人员信息查询模块》分页 工资信息维护模块见《工资信息维护模块》分页 工资信息查询模块见《工资信息查询模块》分页 三.身份认证模块 3.1软件结构 模块的界面参见概要设计文档 身份认证模块: 3.2 1. Check()过程: 对登陆的用户名及密码进行检验,如果通过验证则返回turu,进入系统主菜单,否则返回faulse,调用错误处理程序。 Callmenu()过程: 被check()过程调用,列出系统主菜单,并调用系统功能模块。

系统菜单: 2.性能 3 4 5 已经在软件结构中进行描述。四.统计模块 4.1软件结构

4.2 1 2.性能 统计模块对所有的或者选中类型的数据进行统计,在精度方面必须满足统计要求,精确到小数点后3位。 3.输入项目 统计模块要求用户选择统计方法,采用单选框的方式输入。 4.输出项目 统计模块输出统计结果,并列出被统计的条目,所有列出的条目及统计信息均为不可编辑项。 5.程序逻辑 已经在软件结构中进行描述。 五.人员基本信息查询模块

医院信息管理系统-概要设计说明书V1.1.doc

. 医院信息管理系统概要设计说明书 编写人 审核人: 编写日期: 2012/4/18

版本更新内容日期修改人1.0新建2012/4/18 1.1接口设计2012/4/23

医院信息管理系统 (1) 概要设计说明书 (1) 1 引言 (5) 1.1 编写目的 (5) 1.2 背景 (5) 1.3 定义 (5) 1.4 参考资料 (6) 2 总体设计 (6) 2.1 需求规定 (6) 2.2 运行环境 (7) 2.3 基本设计概念和处理流程 (7) 2.4 结构 (8) 2.5 功能需求与程序的关系 (10) 2.6 人工处理过程 (12) 2.7 尚未解决的问题 (13) 3 接口设计 (13) 3.1 用户接口 (13) 3.2 外部接口 (15) 3.3 内部接口 (15) 4 运行设计 (15) 4.1 运行模块组合 (15) 4.2 运行控制15

. 4.3 运行时间 (16) 5 系统数据结构设计 (16) 5.1 逻辑结构设计要点 (16) 5.2 物理结构设计要点 (22) 5.3 数据结构与程序的关系 (22) 6 系统出错处理设计 (24) 6.1 出错信息 (24) 6.2 补救措施 (24) 6.3 系统维护设计 (24)

. 1引言 1.1 编写目的 根据需求分析说明书中的用户需求,编写概要设计说明书,为开发过程提供 了较为扼要的说明,使系统开发各类技术人员对整个系统所需实现的功能以及测 试过程中的各项测试内容有较为具体的认识,为整个系统的开发、测试、评定和移交的提供基础,本报告一旦确认后将成为系统开发各类技术人员共同遵守的准 则,并为以后的修改工作提供依据。 本说明书的预期读者为本项目负责人以及负责项目开发的各类技术人员、测试人员、管理人员、项目评审人员。 1.2 背景 说明: 系统名称:医院管理系统概要设计说明书 项目提出者:郑州大学10 级软工一班某小组 开发者:郑州大学10 级软工一班某小组 用户:各个医院 运行该软件的计算机(中心):各个医院计算机局域网 1.3 定义 SQL STRUCTURE QUERY LANGUAGE数据库语言

人事管理系统的设计说明

目录 前言 摘要 关键词 第一章人事管理系统概述 1.1 人事管理系统简介 1.2 企业信息化发展 1.3 关于人事管理系统的几个误区第二章人事管理系统分析 2.1 系统初步调查 2.2 系统可行性分析 2.3 系统详细调查 2.4 系统的安全性 第三章人事管理系统设计 3.1 方案设计 3.2 开发工具选择 3.3 数据库设计 3.3.1人事管理系统的详细调查 3.3.2系统逻辑模型的提出 3.3.3数据字典 3.4 数据模块设计图 第四章人事管理系统的实现 4.1 开发环境的选择 4.2 人事管理系统模块设计举例 4.3 人事管理系统测试 4.4 系统运行与维护 4.5系统的转换方案 第五章开发总结 参考文献

人事管理系统的设计 前言 随着计算机技术的不断发展,计算机作为知识经济时代的产物,已被广泛应用于社会各个行业和领域。随着我国国企改革的深入和社会主义市场经济的日趋繁荣,导致各企业间的竞争日益激烈,迫使企业采取先进的计算机硬件设备以及高质量。。。。。。。。。。。。 摘要 本论文是从现代企业管理中的人事管理现状出发,针对人事管理的复杂程序,经过详细的系统调查,开发出的操作简单而且方便实用的一个人事管理系。。。。。。。。。 关键词 人事管理系统,Visual Basic 6.0,Access 2000 【Abstract】 This thesis is from the modern business enterprise present condition, aim at the personal management of the complicated procedure operation, pass by detailed system investigate, develop simple and convenient practical such a personal management system. The head tool of this system development is Visual Basic 6.0, the engine of the backstage database so。。。。。。。

概要设计范本

概要设计范本

[XXXX公司办公自动化] 概要设计说明书 [V1.0(版本号)] 拟制人________ ______________ 审核人______________________ 批准人______________________

[二○○三年四月二十一日]

概要设计说明书 引言 1.1编写目的 信息化是当今世界经济和社会发展的大趋势。推进电力系统的信息化建设,对于提高现代化管理水平,提高工作效率,都具有重要意义。为了适应国际形势和我国经济建设与社会发展的需要,我国必须加快电力系统信息化的发展。 对于电力系统的企业,如何充分、快捷、有效地利用企业内外的大量信息,为企业的发展服务,提高企业的工作效率,是企业需要充分考虑的问题之一。随着企业规模的扩大以及服务内容和办公设施的现代化,这种情况日益突出。同时为了提高单位的日常办公效率,减轻手工劳动强度,使单位的日常运营纳入高效而快捷的轨道,就必须利用现代的信息手段。现代的信息技术优势在于对信息的处理高效而精确,可以充分实现信息的共享和传输,及时地反映企业办公的变动

情况,完善办公调度,提高企业服务质量,进而实现企业经营管理的信息化、科学化。 充分利用现代的信息技术,是提高企业竞争力的必要手段。XXXX公司计划建设的办公自动化系统将以先进的信息技术为依托,通过建立全局八个部门的信息网络,全面提高办公效率,并做到信息传输自动化、公共服务远程化、公文交换无纸化、管理决策网络化,实现全局办公系统全面信息化。 本说明书给出XXXX公司办公自动化系统的设计说明,包括最终实现的软件必须满足的功能、性能、接口和用户界面、附属工具程序的功能以及设计约束等。 目的在于: ?为编码人员提供依据; ?为修改、维护提供条件; ?项目负责人将按计划书的要求布置和控制开发工作全过程; ?项目质量保证组将按此计划书做阶段性和总结性的质量验证和确认。 本说明书的预期读者包括:

事业单位人事管理系统详细设计

石河子大学信息技术学院 数据库系统课程设计 某单位人事管理系统的数据库信息 姓名:曾晨2010508013 李沁梅2010508063 老师:于宝华 专业:计算机科学与技术 学院:信息科学与技术学院 页脚内容1

完成日期:2013-1-17 目录 一、........................................................................... 人事管理信息系统概述5 1.1、项目简介 (5) 1.2、项目背景及现状分析 (5) 二、.............................................................................................. 可行性分析6 三、.................................................................................................. 需求分析7 3.1、系统的性能要求 (7) 3.2、总体需求 (7) 3.3、数据流分析 (7) 四、.................................................................................................. 系统规划9 4.1、系统的功能模块划分 (9) 4.2.、系统功能 (10) 五、.............................................................................................. 数据库设计11 5.1、系统E-R图 (11) 页脚内容2

煤矿信息综合信息化管理系统概要设计

煤矿信息综合信息化管理系统 概要设计

1.概述 1.1.编写目的 本文档是根据《矾石沟煤矿调研需求说明》内列出的各项功能需求进行全面分析并准确表达出用户的需求。并且不拘泥与矾石沟煤矿,对大多数煤矿企业具有适应性。本文档是为了确切地表达出系统的每项需求,并做为设计的基础,为软件设计人员提供明确的指导方向,并为软件的功能测试提供测试依据。 1.2.读者对象 本《系统需求说明书》的预期读者是: 部门经理 技术部经理 项目组所有人员 测试组人员 1.3.术语和缩写 名词解释 HRM Human Resource Management 人力资源管理系统 1.4.参考资料 序号文档名 称 标识号/出版号备注 1、 《矾石沟煤矿调研需求说明》 2.应用现状分析: 二十世纪九十年代以来,随着以计算机技术为代表的信息技术在企业的经营、管理、设计和制造中得到日益广泛深入的应用,世界煤炭工业的大公司和发

达国家的煤炭生产企业在技术发展和自身竞争需求的推动下,迅速由生产过程自动化向企业信息化转变,对扩大经营规模并有效控制经营成本,提升企业的核心竞争力起到巨大的推动作用。目前,在世界煤炭工业的大公司和发达国家的煤炭生产企业中,企业信息化水平已经达到相当高的程度。通过企业信息化建设,改进了企业的生产工艺和流程,极大地提高了生产效率,为企业生产经营中的信息获取、存储、处理、传输等创造了条件,为企业扩大经营并有效控制经营成本提供了有力的技术手段。 我国煤炭企业的信息化建设起步并不晚,但信息化水平与其他行业相比相对较低。企业信息化系统的开发和应用绝大部分任然停留在重复的单项开发和单项应用的水平上,形成了一个个的“信息孤岛”;部分企业建立了计算机网络,但大多数也只是空网,没有充分发挥其效用,即使有部分应用也是各自独立,各子系统之间没有共享数据。目前,很少有煤炭企业建成完善的管理信息系统,只有少数企业初步实现了基本的应用系统集成,建成了管理信息系统雏形。 3.系统业务流程分析 3.1.组织机构 3.1.1.部门管理 部门基础信息注册,树形结构维护。

人事管理系统架构设计

系统软件架构设计 题目人事管理系统架构设计 学生姓名:贾金录 专业名称:软件工程 指导教师:陈国志 目录 1.1.3 员工管理 ............................................................................ 1总体设计 1.1系统功能结构设计 以某公司为例,某公司需要对员工基本资料、所在部门、员工请假/休假、人事考勤、加班及工 资进行合理的规划。通过与人力资源部门及相关人员进行需求沟通后,确定系统需要具有如下的功能。 用户登录管理:用户登录后才能进入系统,包含用户名和密码检查员工信息管理:员工信息的添加、删除、 更改,可添加员工照片部门管理:能够以树状视图显示员工所在的部门休假管理:员工的休假信息添加、查询及统计功能 考勤管理:员工的考勤记录、考勤历史查询及考勤统计功能 加班管理:录入加班信息、加班汇总及特定员工的加班查询功能 工资管理:录入员工的发薪记录、查询特定员工的发薪记录及发薪历史信息 系统日志:记录当前用户的所有操作信息,提供查询功能 需求分析用例图如图所示。

人事管理系统用例图 1.1.1 顶层系统结构 系统顶层系统结构功能图 1.1.2 用户登录功能结构图 用户登录功能结构图用户登录功能包含用户登录及更改密码两个:用户登录:用户输入帐号及密码,系统验证,成功则进入系统,否则给予提示。更改密码:在用户登录界面提供一个更改密码按钮,通过此按钮可以弹开一个更改密码的界面,用户输入原有帐号及密码,以及新密码进行更改。 1.1.3 员工管理 员工管理功能结构图提供一个窗口显示所有员工信息列表,用户可以通过鼠标选择一条记录,窗口中提供当前选中记录的信息显示,并提供所列功能的功能按钮。 员工管理功能:新员工添加:通过在界面上的各种输入框、列表框输入新用户信息,包括用户头像选择,添加新用户删除员工信息:通过员工管理页面选择要删除的员工记录,点击删除按钮,进行删除。在删除的时候提示用户是否确定删除。 更改员工信息:在员工管理页面显示当前选中员工的所有信息,在相应的控件内进行更改,并保存。 1.1.4 部门管理 部门管理功能结构图提供一个窗口,以树状结构显示所有部门列表,并包含部门员工,提供添加、删除、更改、拖拽等功能。 部门管理功能:新部门添加:通过添加窗口输入新部门名称,然后在部门管理主窗口的树状结构添加新结点;删除现有部门:通过选择树状结构中的部门名称,点击删除按钮进行删除;更改部门名称:选中树状结构中的部门名称,点击更改部门名称按钮,在弹出的对话框中输入新名称; 调整部门结构:以拖拽的形式在树状结构里调整部门结构。 1.1.5 休假管理 休假管理功能结构图提供一个窗口显示所有历史休假记录,用户可以通过鼠标选择一条记录,窗口中提供当前选中记录的信息显示,并提供所列功能的功能按钮。 休假管理: 添加新休假记录:通过在界面上的各种输入框、列表框输入新休假信息,点击添加按钮确定添加; 查询员工休假记录:在弹出窗口中输入查询条件,确定后在主界面窗口中的记录列表中显示查询结果; 统计员工休假信息:在弹出窗口中选需统计的员工名称,确定后弹出统计界面。 1.1.6人事考勤 人事考勤功能结构图 提供一个窗口显示所有历史考勤记录。历史考勤记录列表上方提供输入新考勤记录的输入控件。

相关主题
文本预览
相关文档 最新文档