当前位置:文档之家› 文档归类方法

文档归类方法

文档归类方法
文档归类方法

文书档案归档整理操作方法

档案分为文书档案、科技档案(基本建设、科学研究、设备仪器、产品)、会计档案、干部职工档案(人事档案)、诉讼档案、还有照片档案、音像档案、电子档案等等,不同种类,不同载体的档案有不同的整理方法和要求。但整理原则是相同。即“遵循文件的形成规律,保持文件之间的有机联系,区分不同价值,便于保管和利用”。

一、基本要求:

要整理好文书档案就必须学习领会中华人民共和国档案行业标准《归档文件整理规则》(DA/T22-2000)和《海南省归档文件整理规则实施细则》。

二、基本概念:

(一)归档文件:立档单位在其职能活动中形成的,办理完毕应作为文书档案保存的纸质文件材料。

(二)归档文件的整理,将归档文件以件为单位进行装订、分类、排列、加盖归档章(编号)、编目(编制归档文件目录)、装盒,使之有序化的过程。

归档的意义:归档是文件向档案转化的标志,是文书处理的终点、档案管理的起点。

(三)全宗:指一个独立的机关、团体或其它的组织、个人在社会活动中形成的档案有机整体,设立全宗的主要资格是立档单位具有独立的法人资格,可以独立行使职权,并能主要以自己的名义单独对外行文。一般来说,一个立档单位的全部档案就是一全宗。

(四)全宗号:是档案馆给立档单位的代号。

三、整理方法:

(一)收集:收集是归档整理的前提、根本,没有收集齐全完整的文件材料,归档整理就不能很好地反映立档单位的历史面貌和工作情况。因此,收集应归档的文件材料必须保证齐全完整;收集范围是本单位的收文、发文、内部文件。必须采取以下相应措施:

1.立档单位要建立健全收发文登记制度,有完整的收文登记本、发文登记本、印章登记本、依据归档范围,收集所登记的“红头文件”的归档。

2.检查本单位在年度工作中产生的“白头文件”材料是否收集归档。如①会议材料:本单位年度工作会议材料(总结、计划)、表彰材料,专业会议材料,代表发言材料;本单位在上级工作会议上发言、汇报、经验材料、典型材料、交流或发表论文、考察报告。②综合材料:会议记录本(党委、党组会议,行政、办公会议)等;各类花名册、登记簿(干部职工、党员、专业技术人员等花名册及主要业务工作登记簿);年报表(业务、党员、人事劳资等各种统计报表);各种介绍信存根(党团组织关系、干部调动、行政事务等)、协议、合同。

以上收集到的“红头文件”和“白头文件”材料是本单位工作过程中形成的属于立档单位应收集的文件材料。

(二)归档判断:立档单位将收集到的材料,依照《机关文件材料归档范围和文书档案保管期限规定》(国家档案局令第8号)的归档范围和不归档范围,剔除不归档的文件材料,剩下的就是立档单位应归档的文件材料,必须进行归档。不归档的文件材料主要有三方面的文件:①重份文件。指本单位的发文及部分收文的重份文件。②普发性文件。主要指上级、本级非隶属单位给本单位的普发性不需本机关办理的文件材料,任免、奖励非本机关

工作人员的文件材料,供工作参考的抄件等。③未生效文件。如本单位代上级机关起草的未成为正式文件的稿本等。

(三)装订:用不锈钢钉或线将归档范围中的归档文件以“件”为单位固定在一起即单“件”装订,便于保管利用。

1.整理单位:确定以件为归档文件的整理单位。一般以每份文件为一件,文件正本与定稿为一件,正文与附件为一件,原件与复制件为一件,转发文与被转发文为一件,重要文件的正本与历次修改稿可各为一件;计算机及其网络环境中形成的文件,无定稿的或打印出来的定稿上无领导修改手迹、批示而定稿不存档的,将正本与发文稿纸为一件,报表、名册、图册、会议记录、介绍信存根等按其原来的装订方式,一个自然本(册)为一件,未装订的式样同一的表格,以一定的单位组合,可装订在一起的为一件;来文与复文可为一件,未装订成套的会议材料各为一件,正文与文件处理单为一件。

2.文件的装订:归档文件按件装订具体要求:正本在前,定稿在后;正文在前,附件在后;原件在前,复制件在后;转发文在前,被转发文在后;复文在前,来复在后;汉文在前,少数民族文字在后;不同文字的文本,无特殊规定的,中文在前,外文在后;有文件处理的,文件处理单在前,正文在后。

3.装订的部位与对齐方式及注意事项:?文件装订时应以左、下侧对齐,以便装订和利用。?装订时,应将保管期限为永久的归档文件中去掉不符合保管要求的一般订书钉,采用不锈钢订书钉装订(注意:采用不锈钢订书钉装订的档案不能用微波设备进行消毒,否则可能会引起火灾)。或较厚的文件采用“三孔一线”的线装方法装订。

(四)分类:

归档文件采用年度——保管期限分类法进行分类。同全宗应保持分类方案的稳定。

1.区分年度

①年度以落款日期为准。如2009年形成的《2008年工作总结》应归入2009年。

②跨年度的文件放入办结的年度。如2008年形成的《2009-2010年工作规划》应归入2008年度; 某单位2007年立案、2008年结案的某信访案件,其文件材料统一在结案年度归档,即归入2008年。

③几分文件作为一件,“件”的日期应以装订时排在最前面的文件日期为准。具体地说来文与复文为一件,以复文为准等。

④会议记录本以该本最后一次会议记录时间为准。

⑤文件没有标注日期时,需要分析该文件内容,制成材料、格式、字体以及各种标识,通过对照等手段来考证和推断文件的准确日期或近似日期,并据此按年度合理归类。

2.区分保管期限

将每年的归档文件按永久、定期分开,定期一般分为30年、10年。

永久保管档案的的确定:属于归档范围的文件,哪些需要永久保存呢?《规定》第七条列出了八款,《文书档案保管管理期限表》中列出了41款文件材料,约占整个期限表的一半。可以概括为以下四个方面:

①反映机关主要历史面貌的文件材料。如:大事记、组织改革、机构设置、人员编制等文件材料。

②反映机关行政管理、行政执法活动的重要文件材料。如行政管理工作制度、行政管理工作中形成的审批、审查、核准等文件材料;房产、地产、固定资产、行政审批、行政许可、合同、协议、国有资产管理等文件材料。

③反映机关主要职能活动的重要文件材料。如:党组(党委)、行政办公会议记录、会议纪要、工作会议、专题会议材料,上级机关、上级领导视察本机关工作文件材料;本机关制定的方针政策性法规文件、业务文件、调研报告、请示、批复、外事活动文件等。

④反映机关人事管理活动的文件材料。如人事任免、奖励材料与处分材料,录用、转正、聘任、调资、定级、停薪留职、辞职、离退休、死亡、抚恤材料;人事考核、职称评审、职工调动、职工名册、党团员名册、党团材料等这些文件材料在反映本机关的历史面貌,主要职能活动,维护国家、机关和职工权益等方面具有长远的利用价值和凭证价值,是各机关形成文件的重点和核心。

准确理解保管期价值的鉴定是归档文件整理工作的难点。《规定》把保管期限划分为永久、定期两种,在具体划分文书档案保管期限时,突出以本机关文件为主(即以我为主),在操作时,实现对每级文件(上级、本级、同级、下级)文件进行两分制:上级机关文件:针对本机关的文件或属于本机关主管业务的永久保存。如同级党委、政府关于本机关机构设置、领导人任免、人员编制等文件;上级机关对本机关或人员的表彰文件;上级机关对主管业务工作的规划、意见、批复等。其他需要贯彻执行或查考的保存10年。

本机关文件:反映本机关主要职能活动的永久保存;一般的保存30年或10年(表中界定具体清晰)

同级机关文件:非本机关主管业务但要贯彻执行的文件材料保存10年。

下级机关文件:报送的重要的总结、报告保存30年,一般的保存10年。

(五)排列

1.把同一年度、同一保管期限的文件分开排在一起。即立档单位每年只编永久、30年、10年三条流水号分开排列。不同年度、不同保管期限的文件不能排列在一起。

2.在同一保管期限内,把同一机构(或问题、文号)有内在联系(如同一次活动、同一项工作,同一个会议)的文件排在一起,即同一事由的相关文件应当排列在一起。是“遵循文件的形成规律,保持文件之间的有机联系”整理原则的体现。排列顺序应保持相对固定。

3.最后在同一保管期限、同一机构、问题或文号内按成文时间的生后顺序排列。

(六)编号

归档文件编号是指将归档文件在全宗中的位置标识为符号,并以归档章的形式在归档文件上注明。编号是编目工作的起点和基础,其目的是反映分类、排列这些系统工作的成果。通过编号,使归档文件在全宗中的位置得以确定,并为后续的编目工作以及将来查找利用时的实体存取提供了条件。件号即文件的排列顺序号,它是反映归档文件在全宗中的位置和固定归档文件的排列先后顺序的重要标识。

归档文件应依分类方案和排列顺序逐件编号,在文件首页上端的空白位置加盖归档章并填写相关内容。文件处理单随同归档的,归档章盖在文件处理单上,以保护文件正本的原貌。归档章设置全宗号、年度、保管期限、件号等必备项目。

1.全宗号:档案馆给立档单位编制的代号。档案室如没有全宗号可暂时不填。

2.年度:文件形成年度,以4位阿拉伯数字标注公元纪年,如2008。

3.保管期限:归档文件保管期限的填写为永久、30年、10年。

4.件号:归档文件的排列顺序号。以年度为界,每年必须从1编起,不能跨年度连续编号,各期限分别编流失号(即每年分期限共编三条流水号)。

件号包括室编件号和馆编件,分别在归档文件整理和档案移交后编制。室编件号的编制方法为:在分类方案的最低一级类目内;按文件排列顺序从“1”开始标注,每种保管期限各编一个流水顺序号,如2007年永久件号:1、2、3 (82)

30年件号:1、2、3 (73)

10年件号:1、2、3 (243)

馆编件号待档案移交给档案馆后,由档案馆根据需要填写。

(七)编目

归档文件应依据分类方案和室编件号顺序编制归档文件目录。

归档文件应逐件编目。来文与复文为一件时,只对复文进行编目。通过检查复文来实现对相应来文的查找。

归档文件目录包括件号、责任者、文号、题名、日期、页数和备注等项目。

1.件号:填写室编件号。

2.责任者:指发文的组织或个人,即文件的发文机关或署名者。①填写责任者时一般应使用全称或通用简称,如“海南省纪委“,不能使用“本厅”、“省教育厅”等含义不明,难判断的简称。②联合发文责任者过多时,可适应省略,但立档单位是责任者的必须抄录。以体现“以我为中心”的精神。③未署责任者的归档文件,编目时应根据文件内容形式等特征加以考证并填写。

3.文号:文件的发文字号,是由发文机关按发文次序编制的顺序号,一般由机关代字、年度、顺序号组成。如琼府办[2008]198号、琼邮管[2008]68号,没有发文字号的不填写。文号栏内不得填写诸如“会议文件之一”等文件顺序号,亦不得填写“情况反映”等刊物名册。

4.题名:即文件标题,一般应照实抄录。没有题名或题名不规范的,应根据文件内容,重新拟写或补充标题,外加“〔〕”号附于原标题之后。如海南省档案局关于转发档发[2008]18号文件的通知,应重拟提题名并抄录为海南声省档案局关于转发[国家档案局关于汛期档案安全管理的几点意见]的通知。

5.日期:文件的形成时间,以8位阿拉伯数字标注年、月、日,如20080708、20081112表示月、日的数字可回行填写,如2008

0708。

6.页数:每一件归档文件的总页数、文件中有图文的页面为一页。

7.备注:用于填写归档文件需要补充和说明的情况。包括密级、缺损、修改、补充、移出、销毁等等。如果有些条目须说明的情况较多,备注栏难以填写时,可在备注栏中加注“*”号,将具体内容填写入备考表中。

(八)装盒

装盒是将归档文件按室编件号顺序装入档案盒,填写备考表、编制档案盒封面及盒脊。不同年度,不同保管期限的文件不能装在同一档案盒内。

1.装盒要求:归档文件应严格按照件号的先后顺序装入档案盒,与归档文件目录中相应条目的排列顺序相一致,保证检索到文件条目后能对应找到文件实体。档案利用完毕后归位时,同样要注意将其按件号顺序装入相应档案盒中,否则,在以件为单位进行管理的情况下,一旦归位错误,将很难再找回,甚至可能从此成为“死档”。

2.档案盒应采用无酸纸制作,各立档单位应到各级档案行政管理部门购买。以保证档案盒制成材料的质量。

3.档案盒应根据摆放方式的不同,在盒脊或底边设置全宗号、年度、保管期限、起止件号、盒号等必备项。其中起止件号填写盒内第一件文件和最后一件文件的件号,中间用“/”号连接。

4.备考表放在盒内所有归档文件之后,用以对盒内归档文件进行必要的注释说明。项目包括盒内文件情况说明、整理人、检查人和日期。

①盒内文件情况说明:填写盒内归档文件需要说明的情况,包括文件收集的齐全完整程度、文件本身的状况(如字迹模糊、缺损)等。整理工作完毕后归档文件如有修改、补充、移出、销毁等情况,应在备考表中加以说明。进行归档文件整理时,如某件文件须说明的情况复杂,目录备注栏填写不下,也可在备考表中详细说明,并在目录相关条目的备注项中加“*”号标示。

②整理人:填写负责整理归档文件的人员姓名,以明确责任。

③检查人:填写负责检查归档文件整理质量的人员姓名,以示对整理质量的监督检查。

④日期:填写归档文件整理完毕的日期。

(九)编制检索工具

1.归档说明(全宗说明)内容包括本单位主要工作职能、本年度内设机构设置情况(领导班子、内设机构及领导任职情况)本年度主要工作概况、本年度文书档案归档情况(含归档工作的组织情况、文件材料完整与否,档案数量,有何缺陷)。

2.打印归档文件目录(采用国际标准A4型纸,永久目录打印一式三份,30年、10年期限的目录打印一式一份)。编制封面,并根据需要分保管期限与归档说明(全宗说明)装订成册:归档说明(全宗说明)、永久目录装订一式两本;归档说明(全宗说明)、永久、30年、10年目录合订一本。归档文件目录封面设置全宗名称、年度、保管期限等项目。

全宗名称:立档单位的名称,填写时应使用全称或规范化简称。

年度:填写本目录所登录文件的形成年度。如:2003年、2003-2008年

保管期限:根据目录中所登文件的保管期限填写。如:永久,永久、30年、10年

公文种类包括

公文种类包括: (一)命令(令) (二)决定 (三)公告 (四)通告 (五)通知 (六)通报 (七)议案 (八)报告 (九)请示 (十)批复 (十一)意见 (十二)函 (十三)会议纪要 11 公文的特定格式 11.1 信函式格式 发文机关名称上边缘距上页边的距离为30mm,推荐使用小标宋体字,字号由发文机关酌定;发文机关全称下4mm处为一条武文线(上粗下细),距下页边20mm处为一条武文线(上细下粗),两条线长均为170mm。每行距中排28个字。发文机关名称及双线均印红色。两线之间各要素的标识方法从本标准相应要素说明。 11.2 命令格式

命令标识由发文机关名称加“命令”或“令”组成,用红色小标宋体字,字号由发文机关酌定。命令标识上边缘距版心上边缘20mm,下边缘空2行居中标识令号;令号下空2行标识正文;正文下一行右空4字标识签发人名章,签名章左空2字标识签发人职务;联合发布的命令或令的签发人职务应标识全称。在签发人名章下一行右空2字标识成文时间。分送机关标识方法同抄送机关。其他从本标准相关要素说明。 11.3 会议纪要格式 会议纪要标识由“××××会议纪要”组成。其标识位置同8.1.4,用红色小标宋体字,字号由发文机关酌定。会议纪要不加盖印章。其他要素从本标准规定。12新的公文的特定格式 1、信函式公文格式 发文机关标识用全称,但不加“文件“二字,发文机关名称上边缘距土页边的距离为30mm,用红色小标宋体字20mnm×14mm,发文机关全称下4mm处为一条武文线上粗下细,距下页边20mm 处,为一条文武红(上细下粗)两条线均为170 mm,每页排22行每行居中排28个字首页不显页码。其他各要素的标识方法均同“文件式“公文格式标识(发文文号、秘密等级和紧急程度标识在红线下右或左项格标识)。 2、命令格式 发文机关名称加“令“组成不能用简称用红色标识。命令标识上边缘距版心边缘为20mnm下边缘空2行居中标识令号〈用黑体字〉令

预测方法的分类

预测方法的分类 郑XX 预测方法的分类 由于预测的对象、目标、内容和期限不同,形成了多种多样的预测方法。据不完全统计,目前世界上共有近千种预测方法,其中较为成熟的有150多种,常用的有30多种,用得最为普遍的有10多种。 1-1预测方法的分类体系 1)按预测技术的差异性分类 可分为定性预测技术、定量预测技术、定时预测技术、定比预测技术和评价预测 技术,共五类。 2)按预测方法的客观性分类 可分为主观预测方法和客观预测方法两类。前者主要依靠经验判断,后者主要借 助数学模型。 3)按预测分析的途径分类 可分为直观型预测方法、时间序列预测方法、计量经济模型预测方法、因果分析 预测方法等。 4)按采用模型的特点分类 可分为经验预测模型和正规的预测模型。后者包括时间关系模型、因果关系模 型、结构关系模型等。 1-2 常用的方法分类 1)定性分析预测法 定性分析预测法是指预测者根据历史与现实的观察资料,依赖个人或集体的经验与智慧,对未来的发展状态和变化趋势作出判断的预测方法。 定性预测优缺点 定性预测的优点在于: 注重于事物发展在性质方面的预测,具有较大的灵活性,易于充分发挥人的主观能动作用,且简单的迅速,省时省费用。

定性预测的缺点是: 易受主观因素的影响,比较注重于人的经验和主观判断能力,从而易受人的知识、经验和能力的多少大小的束缚和限制,尤其是缺乏对事物发展作数量上的精确描述。 2)定量分析预测法 定量分析预测法是依据调查研究所得的数据资料,运用统计方法和数学模型,近似地揭示预测对象及其影响因素的数量变动关系,建立对应的预测模型,据此对预测目标作出定量测算的预测方法。通常有时间序列分析预测法和因果分析预测法。 ⅰ时间序列分析预测法 时间序列分析预测法是以连续性预测原理作指导,利用历史观察值形成的时间数列,对预测目标未来状态和发展趋势作出定量判断的预测方法。

基于机器学习的文本分类方法

基于机器学习算法的文本分类方法综述 摘要:文本分类是机器学习领域新的研究热点。基于机器学习算法的文本分类方法比传统的文本分类方法优势明显。本文综述了现有的基于机器学习的文本分类方法,讨论了各种方法的优缺点,并指出了文本分类方法未来可能的发展趋势。 1.引言 随着计算机技术、数据库技术,网络技术的飞速发展,Internet的广泛应用,信息交换越来越方便,各个领域都不断产生海量数据,使得互联网数据及资源呈现海量特征,尤其是海量的文本数据。如何利用海量数据挖掘出有用的信息和知识,方便人们的查阅和应用,已经成为一个日趋重要的问题。因此,基于文本内容的信息检索和数据挖掘逐渐成为备受关注的领域。文本分类(text categorization,TC)技术是信息检索和文本挖掘的重要基础技术,其作用是根据文本的某些特征,在预先给定的类别标记(label)集合下,根据文本内容判定它的类别。传统的文本分类模式是基于知识工程和专家系统的,在灵活性和分类效果上都有很大的缺陷。例如卡内基集团为路透社开发的Construe专家系统就是采用知识工程方法构造的一个著名的文本分类系统,但该系统的开发工作量达到了10个人年,当需要进行信息更新时,维护非常困难。因此,知识工程方法已不适用于日益复杂的海量数据文本分类系统需求[1]。20世纪90年代以来,机器学习的分类算法有了日新月异的发展,很多分类器模型逐步被应用到文本分类之中,比如支持向量机(SVM,Support Vector Machine)[2-4]、最近邻法(Nearest Neighbor)[5]、决策树(Decision tree)[6]、朴素贝叶斯(Naive Bayes)[7]等。逐渐成熟的基于机器学习的文本分类方法,更注重分类器的模型自动挖掘和生成及动态优化能力,在分类效果和灵活性上都比之前基于知识工程和专家系统的文本分类模式有所突破,取得了很好的分类效果。 本文主要综述基于机器学习算法的文本分类方法。首先对文本分类问题进行概述,阐述文本分类的一般流程以及文本表述、特征选择方面的方法,然后具体研究基于及其学习的文本分类的典型方法,最后指出该领域的研究发展趋势。 2.文本自动分类概述 文本自动分类可简单定义为:给定分类体系后,根据文本内容自动确定文本关联的类别。从数学角度来看,文本分类是一个映射过程,该映射可以是一一映射,也可以是一对多映射过程。文本分类的映射规则是,系统根据已知类别中若干样本的数据信息总结出分类的规律性,建立类别判别公式或判别规则。当遇到新文本时,根据总结出的类别判别规则确定文本所属的类别。也就是说自动文本分类通过监督学习自动构建出分类器,从而实现对新的给定文本的自动归类。文本自动分类一般包括文本表达、特征选取、分类器的选择与训练、分类等几个步骤,其中文本表达和特征选取是文本分类的基础技术,而分类器的选择与训练则是文本自动分类技术的重点,基于机器学习的文本分来就是通过将机器学习领域的分类算法用于文本分类中来[8]。图1是文本自动分类的一般流程。

常见蔬菜种类三种蔬菜分类方法

常见蔬菜种类三种蔬菜分类方法 蔬菜作物种类繁多,据统计,世界范围内的蔬菜共有200多种,在同一种类中,还有许多变种,每一变种中又有许多品种。为了便于研究和学习,就需要对这些蔬菜进行系统的分类。常用蔬菜分类方法有三种,即植物学分类法、食用器官分类法和农业生物学分类法。 常见蔬菜种类三种蔬菜分类方法 一、植物学分类法 依照植物自然进化系统,按照科、属、种和变种进行分类的方法。我国普遍栽培的蔬菜,除食用菌外,分别属于种子植物门双子叶植物纲和单子叶植物纲的不同科。采用植物学分类可以明确科、属、种间在形态、生理上的关系,以及遗传学、系统进化上的亲缘关系,对于蔬菜的轮作倒茬、病虫害防治、种子繁育和栽培管理等有较好的指导作用。常见蔬菜按科分类如下: (一)单子叶植物 1、禾本科(Gramineae)毛竹笋、麻竹、菜玉米、茭白。 2、百合科(Liliaceae)黄花菜、芦笋、卷丹百合、洋葱、韭葱、大蒜、南欧葱(大头葱)、大葱、分葱、韭菜、薤。 3、天南星科(Araceae)芋、魔芋。 4、薯蓣科(Dioscoreaceae)普通山药、田薯(大薯)。 5、姜科(Zingiberaceae)生姜。 (二)双子叶植物

1、藜科(Chenopodiaceae)根菾菜(叶菾菜)、菠菜。 2、落葵科(Basellaceae)红落葵、白落葵。 3、苋科(Amaranthaceae)苋菜。 4、睡莲科(Nymphaeaceae)莲藕、芡实。 5、十字花科(Cruciferae)萝卜、芜菁、芜菁甘蓝、芥蓝、结球甘蓝、抱子甘蓝、羽衣甘蓝、花椰菜、青花菜、球茎甘蓝、小白菜、结球白菜、叶用芥菜、茎用芥菜、芽用芥菜、根用芥菜、辣根、豆瓣菜、荠菜。 6、豆科(Leguminosae)豆薯、菜豆、豌豆、蚕豆、豇豆、菜用大豆、扁豆、刀豆、矮刀豆、苜蓿。 7、伞形科(Umbelliferae)芹菜、根芹、水芹、芫荽、胡萝卜、小茴香、美国防风。 8、旋花科(Convolvulaceae)蕹菜。 9、唇形科(Labiatae)薄荷、荆芥、罗勒、草石蚕。 10、茄科(Solanaceae)马铃薯、茄子、番茄、辣椒、香艳茄、酸浆。 11、葫芦科(Cucurbitaceae)黄瓜、甜瓜、南瓜(中国南瓜)、笋瓜(印度南瓜)、西葫芦(美洲南瓜)、西瓜、冬瓜、瓠瓜(葫芦)、普通丝瓜(有棱丝瓜)、苦瓜、佛手瓜、蛇瓜。 12、菊科(Compositae)莴苣(莴笋、长叶莴苣、皱叶莴苣、结球莴苣)、茼蒿、菊芋、苦苣、紫背天葵、牛蒡、朝鲜蓟。 13、锦葵科(Malvaceae)黄秋葵、冬寒菜。 14、楝科(Meliaceae)香椿。

文本分类方法研究

毕业论文 题目:文本分类方法研究 姓名:贾云璠 院系:理学院物理系 专业:物理学 年级: 2013级 学号: 201341021 指导教师:郑伟 二〇一七年六月

摘要 近些年来,随着信息技术的发展与应用,互联网上的数据错综复杂,面对如此纷繁复杂的数据,需要借助数据挖掘对数据进行处理来实现对数据的分类,以便查询和搜索,实现数据的最大利用价值。 文本分类在信息处理方面占有重要的作用,到目前为止,有很多种方法:KNN SVM 决策树,以及贝叶斯等算法可以帮助我们快速的对文本进行自动分类,本文主要研究KNN SVM两种方法,在比较这两种分类对中文文本分类的基础之上,分析了K 临近算法和支持向量机的优缺点,因SVM和KNN具有互补的可能性,提出了SVM和KNN组合[1]的算法。实验表明:SVM和KNN有很好的分类效果。 关键词:文本分类,SVM、KNN,线性组合

Abstract In recent years, with the development of information technology and application, the complexity of the data on the Internet in the face of so complicated data, need with the help of data mining, data processing to implement the data classification, in order to query and search, and realize the maximum utilization of the data value. Chinese text classification plays an important role in Chinese information processing, for example, Chinese information retrieval and search engine, KNN SVM decision tree, and the bayesian algorithm can be applied to Chinese text classification, based on the research analysis compares the two kinds of KNN and SVM classification method, and the experimental comparison of the two algorithms of Chinese text classification effect, on the basis of analyzing the K near the advantages and disadvantages of the algorithm and support vector machine (SVM), found that the SVM and KNN has the possibility of complementary, SVM and KNN algorithm of linear combination is presented. Key words: Text classification, SVM, KNN, linear combination

种公文分类 五

种公文分类五 13种公文分类(2009-08-19 12:29:21)转载标签:文化 公文简介 1、公文的含义 公文,即公务文书的简称,属于应用文。公文是国家机关、社会团体、企事业单位在公务活动中使用的文件。国家行政机关的公文(公务文书),则是传达贯彻党和国家的方针、政策,发布行政法规和规章,施行行政措施,请示和答复问题,指导、布置和商洽工作,报告情况,交流经验的一种具有特定格式的文字材料。 2、公文的分类 公文按其行文方向,可分为上行文、下行文、平行文。上行文是指下级机关向上级机关报送的公文,如请示、报告等。下行文是指上级机关向所属下级机关的行文,如决定、指示、公告、通知、通知、通报等。平行文指同级机关或不同隶属机关之间的行文,如函等。通知、公文纪要有时也可作为平行文。

公文按其时限要求,可分为特急公文、急办公文、常规公文。公文内容有时限要求,需迅速传递办理的,称紧急公文。紧急文件可分为特急和急件两种,紧急公文应随到随办,时限要求越高,传递、办理的速度也就要求越快,但要“快中求准”。随着社会的发展,对公文的时效要求越来越高,即使常规公文,也应随到随办,以提高办文效率。 公文按其机密程度,可分为绝密公文、机密公文、秘密公文、普通公文。绝密、机密、秘密公文又称保密文件,是指内容涉及党和国家的机密,需要控制知密范围和知密对象的文件。文件的密级越高,传达、阅办、保管的要求也越严。 3、公文撰拟的过程(公文形成的环节) (1)草撰。秘书人员根据领导意图下笔起草公文稿的过程; (2)审核。机关部门领导或办公部门初步审核拟成文稿的过程; (3)签发。机关领导参照审核意见,审阅定稿并签署发文意见的过程;

公文的特点

公文的特点 This model paper was revised by the Standardization Office on December 10, 2020

一、公文的特点 公文是政府机关及实行行政管理的重要工具,与一般的应用文书有明显的区别。归纳起来有以下特点: (1)公文具有鲜明的政治性; (2)公文是由法定作者制成和发布的; (3)公文具有法定的权威性和行政约束力; (4)公文具有严格的时效性; (5)公文具有特定的体式。 二、公文的种类 (1)按适用范围分类 《办法》按适用范围将公文分为13种:命令(令)、决定、公告、通告、通知、通报、议案、报告、请示、批复、意见、函、会议纪要。 (2)按公文来源分类 按公文的来源,可分为收文和发文两种。收文是指本机关收到上级、下级及不相隶属机关单位所制发的文件。发文是指本机关拟制并向外发送的文件。 (3)按行文方向分类 按行文方向区分公文,是对发文的进一步分门别类,可分为下行文、上行文、平行文三种。下行文是指向所属下级机关发送的公文。属于这一类的文种最多,有命令(令)、决定、通知、公告、通告、通报、批复、会议纪要等。

上行文是指向所属上级机关呈送的公文,主要文种有报告和请示。平行文是指同级机关或不相隶属机关之间往来的行文,最常用的是函。 (4)按性质作用分类 按公文的性质作用,可分为法规性公文、指挥性公文、公布性公文、报请性公文、通联性公文和记录性公文六种。 (5)按保密程度分类 保密公文是指涉及党和国家机密内容,需要控制知密范围、知密对象的公文。按涉及机密的程度,保密公文分为绝密件、机密件、秘密件三种。 (6)按办文时限要求分类 按办文时限要求,分为特急件、急件和平件。

监管分类中常用的具体分类方法

监督分类中常用的具体分类方法包括: 最小距离分类法(minimum distance classifier):最小距离分类法是用特征空间中的距离作为像元分类依据的。最小距离分类包括最小距离判别法和最近邻域分类法。最小距离判别法要求对遥感图像中每一个类别选一个具有代表意义的统计特征量(均值),首先计算待分象元与已知类别之间的距离,然后将其归属于距离最小的一类。最近邻域分类法是上述方法在多波段遥感图像分类的推广。在多波段遥感图像分类中,每一类别具有多个统计特征量。最近邻域分类法首先计算待分象元到每一类中每一个统计特征量间的距离,这样,该象元到每一类都有几个距离值,取其中最小的一个距离作为该象元到该类别的距离,最后比较该待分象元到所有类别间的距离,将其归属于距离最小的一类。最小距离分类法原理简单,分类精度不高,但计算速度快,它可以在快速浏览分类概况中使用。 多级切割分类法(multi-level slice classifier): 是根据设定在各轴上值域分割多维特征空间的分类方法。通过分割得到的多维长方体对应各分类类别。经过反复对定义的这些长方体的值域进行内外判断而完成各象元的分类。这种方法要求通过选取训练区详细了解分类类别(总体)的特征,并以较高的精度设定每个分类类别的光谱特征上限值和下限值,以便构成特征子空间。多级切割分类法要求训练区样本选择必须覆盖所有

的类型,在分类过程中,需要利用待分类像元光谱特征值与各个类别特征子空间在每一维上的值域进行内外判断,检查其落入哪个类别特征子空间中,直到完成各像元的分类。 多级分割法分类便于直观理解如何分割特征空间,以及待分类像元如何与分类类别相对应。由于分类中不需要复杂的计算,与其它监督分类方法比较,具有速度快的特点。但多级分割法要求分割面总是与各特征轴正交,如果各类别在特征空间中呈现倾斜分布,就会产生分类误差。因此运用多级分割法分类前,需要先进行主成分分析,或采用其它方法对各轴进行相互独立的正交变换,然后进行多级分割。 最大似然分类法(maximum likelihood classifier):最大似然分类法是经常使用的监督分类方法之一,它是通过求出每个像元对于各类别归属概率(似然度)(likelihood),把该像元分到归属概率(似然度)最大的类别中去的方法。最大似然法假定训练区地物的光谱特征和自然界大部分随机现象一样,近似服从正态分布,利用训练区可求出均值、方差以及协方差等特征参数,从而可求出总体的先验概率密度函数。当总体分布不符合正态分布时,其分类可靠性将下降,这种情况下不宜采用最大似然分类法。 最大似然分类法在多类别分类时,常采用统计学方法建立起一个判别函数集,然后根据这个判别函数集计算各待分象元的归

档案的整理方法

科技档案的整理方法 一般讲,基层档案部门对科技档案的整理,大体要经过分类、案卷组织与排列、编目几个环节。 一、分类。科技档案分类,就是根据科技档案的内容性质和形成特点,把一定范围的科技档案划分成不同的类别层次,从而形成具有一定从属关系和平行关系的不同等级的科技档案库藏系统。 1、分类的要求。搞好科技档案的分类,应注意以下几点: (1)科技档案的分类要遵循同一规则。在一个单位内部或一个专业系统,同一种科技档案的分类标准应该一致。 (2)科技档案分类要遵循效用规则。即科技档案分类要适应科技档案及其管理特点,追求分类的整体适用效果。也就是说,科技档案的分类,要符合档案形成专业和档案形成单位科技活动的性质和特点。 (3)科技档案分类要遵循排它规则。即同一级类目必须互相排斥而不能重合。(4)要编制一个合理和切实可行的科技档案分类方案。分类方案是进行科学分类的依据性文件,在编制科技档案分类方案时,要了解和掌握本单位科技档案的内容构成和形成特点,确定明确的分类标准和分类方法,设置科学、合理的类目体系,形成完整的科技档案分类方案。 2、分类的方法。基层档案部门对科技档案的分类,实际上是在分类方案的指导下进行的。科技档案的种类很多,因此可运用的分类标准或进行分类的方法也是较多的,大体上,科技档案实体分类基本是采用对象分类法和特征分类法两种方法。对象分类法就是以一个实物对象的设计、生产制造等活动形成的整套科技档案为单元进行分类的方法,其典型的形式是型号分类法、工程项目分类法和课题分类法。特征分类法就是以科技档案的内容特征为依据进行分类的方法,其典型的形式是专业特征分类法、时间特征分类法和地域特征分类法。(1)工程项目分类法。它适用于对基本建设工程档案的分类,就是在本单位全部基建档案范围内,以工程项目为分类单元,划分科技档案的类别。 (2)型号分类法。它适用于产品档案和设备档案的分类,就是以各个型号的产品或设备为分类单元,划分科技档案的类别。 (3)课题分类法。适用于对科研档案的分类,以各个独立的研究课题为分类单元,划分科技档案的类别。 (4)专业特征分类法。按照科技档案所反映的专业性质划分科研档案的类别。 (5)地域特征分类法。根据科技档案内容所反映的地域特征划分科技档案的类别。 (6)时间特征分类法。按科技档案内容所反映的时间特征划分科技档案的类别。 以上几种基本方法,在实际应用时,可根据具体情况,结合其中几种灵活运用。基本建设档案的分类,具体到不同单位和不同基建项目,其档案主要有性质——工程项目分类法、流域——工程项目分类法。产品档案的分类,由于产品种类繁多,各种产品代号也不尽相同,因此在型号分类法的基础上,派生出许多具体分类方法,比较常用的有使用性质——型号分类法、系列——型号分类法、年度——纱号分类法。设备档案的分类,根据组织形式和设备类型的不同,设备档案具体的分类主要有性质——型号分类法、工序——型号分类法。科研档案的分类方法主要有学科——课题分类法、专业——课题分类法。 二、案卷组织与排列 案卷是一组具有有机联系、价值相同、密级相同的科技文件的最小集合体。科技文件之间的联系是多方面的,因此组织案卷的方法也是多种多样的。一般情况下,组织案卷的方法应当与该类科技档案的分类方法相一致。常用的案卷组织方法有以下几种:按结构组织案卷、按

15种公文类型的文本特点

15种公文类型的文本特点 第五种类:公告 一、公告的内涵:公告是行政公文的主要文种之一,它和通告都属于发布范围广泛的晓谕性文种。公告是向国内外宣布重要事项或者法定事项时使用的公文。适用于向国内外宣布重要事项或者法定事项。 公告是用于向国内外宣布重要事项或者法定事项的公文。公告主要有两种,一是宣布重要事项,如最近中国将在东海进行地对地导弹发射训练;二是宣布法定事项,如宣布某项法规或规章,宣布国家领导人选举结果。有一类公告是属于专业性的或向特定对象发布的,如经济上的招标公告,按国家专利法规定公布申请专利的公告,属专业性公告;也有按国家民事诉讼法规定,法院递交诉讼文书无法送本人或代收人时,可以发布公告间接送达,是向特定对象发布的,这些都不属行政机关公文。 二、公告的使用范围。公告通常是以国家的名义向国内外宣布重大事件或者法定事项。重要事项是指有关国家政治、经济、文化、军事、科技、人事、外交等方面的大事;法定事项是指由国家权力机关、行政机关等依据法律法规和法定程序公开的事项。如公布国家领导人的出国访问,国家领导人的选举结果,洲际导弹、人造卫星的发射等。地方行

政机关有时也可用公告。 公告还用于人民法院审理案件,如向被告送达法律文书等。国家机关使用公告公布事项,只限于在自己的职权范围内,基层单位一般不能制发公告。 三、主要特点。一是发文机关的特定性。仅限于国家权力机关、行政机关,以及被授权的部门。由于公告宣布的是重大事项和法定事项,发文的权力被限制在高层行政机关及其职能部门的范围之内。具体说,国家最高权力机关(人大及其常委会),国家最高行政机关(国务院)及其所属部门,各省市、自治区、直辖市行政领导机关,某些法定机关,如税务局、海关、铁路局、人民银行、检察院、法院等,有制发公告的权力。其他地方行政机关,一般不能发布公告。党团组织、社会团体、企事业单位,不能发布公告。二是内容的庄重性。所宣布的事项都是有关重大的、国内外关注的事项,体现国家及其权力机关的威严,它的使用还要考虑到在国内可能产生的政治影响。三是发布范围的广泛性。公告是向“国内外”发布重要事项和法定事项的公文,其信息传达范围有时是全国,有时是全世界。譬如,中国曾以公告的形式公布中国科学院院士名单,一方面确立他们在我国科学界学术带头人地位,一方面尽力为他们争取在国际科学界的地位。这样的公告肯定会在世界科学界产生一定的影响。中国有关部门还曾在《人民日报》上刊登公告,公布中国名酒和

文本分类的常见方法

文本分类的常见方法

文本分类的过程: (1)选择训练文本。好的训练文本对分类器的最终结果起到至关重要的作用。 (2)选择文本特征。对训练样本和测试样本进行数据预处理,包括分词、去停用词、消除噪音等。目前的文本分类研究,主要选取一些具有代表性的词、词组、短语来表示文本。(3)建立文本表示模型。为了便于计算机理解和计算相关的文本属性,需要对文本进行表示,其中向量空间模型(Vector Space Model VSM)运用最为广泛。 (4)选择分类方法。文本分类的核心部分,不同的分类方法原理不同需要处理的数 据也不同。经典分类算法有朴素贝叶斯(Naive Bayes NB)、K-近邻(K-Nearest Neighbor KNN)、决策树(Decision Tree DTree)、算数平均质心(Arithmetical Average Centroid AAC)、支持向量机(Support Vector Machine SVM)。 (5)分类结果的评估。目前主流的评估标准准确率、召回率和F1值。

选择文本特征 我们需要将文档转换为计算机可以衡量、运算的形式。现在运用最广泛的形式:将文档映射入向量空间。具体流程如图1。 张三说的确实在理。李四买了一张三角桌子。 张三/说/的/确实/在理。 李四/买/了/一张/三角/桌子。 对中文文档进行分词 中文分词系统:盘古、Lucene 张三、在理 李四、三角、桌子 去除停顿词 在理、三角、桌子 特征项提取 评判的标准:信息增益、期望交叉熵 互信息、开放检验 这样就将一篇文章映射成了为了向量空间中的一个向量。在把文章都映射完成后,我们可以根据自己不同的需求,在向量空间中进行运算。比如计算两篇文章的相似度:我们把向量的起点都映射到原点,则我们可以比较向量的长度、向量的夹角、向量两个终点的距离等等;我们还可以宏观的观察大量的向量在向量空间中的分布情况,对大量聚集在一起的向量抽取它们的共性:计算他们的中心、他们整体的方向等。其实数学模型很好,只不过限于计算机的存储、运算水平,向量空间的维度过高、文档数量过大、计算复杂度过高会使得模型的计算机实现变得困

档案整理的方法及分类、档号编制及质量要求

邵东档案整理的方法及分类、档号编制及质量要求 (文书、业务、会计、声像、实物、电子、科技) 一、档案整理几个概念 (一)档案整理定义:是指将处于零乱的和需要进一步条理化的档案,进行基本的分类、组合、排列、编号、编制目录、建立全宗等,组成有序体系的过程。 (二)档案整理的基本要求:遵循文件材料的形成规律和特点,保持文件材料之间的有机联系;区分文件材料的价值,确定档案的保管期限;便于保管和利用。 (三)档案整理的文件范围:凡是本机关工作活动中形成的,具有查考保存价值的文件材料,包括收发文电、内部文件、会议文件、电话记录、图表、簿册、照片、录音、录像、计算机盘片、实物以及本机关编印的出版物等,在办理完毕后均须整理保存。(四)档案整理的方法:一是以“案卷”为单位整理。二是以“件”为单位整理。 1、以“案卷”为单位整理。 1)以“案卷”为单位整理就是立卷,即按照文件材料在形成和处理过程中的联系将其组合为案卷。 2)所谓案卷,就是一组密切联系的文件的组合体。立卷是

一个分类、组合、编目的过程。分类即按照立档单位的档案分类方案,对文件材料进行实体分类;组合即将经过分类的文件材料,按一定形式组合起来;编目即将经过组合以后的文件材料,进行系统排列和编目。 3)以“案卷”为单位整理的档案,其基本保管单位是案卷。案卷卷皮有软卷皮和硬卷皮2种,硬卷皮型号有1.2,1.5,2.0cm 三个规格,以软卷皮装订的档案必须按案卷顺序装入档案盒。 4)以“案卷”为单位档案整理的依据是1987年12月国家档案发布的《机关档案工作业务建设规范》和《文书档案案卷格式》 5)以“案卷”为单位档案整理的适应范围 (1)大部分单位短期保管(现10年)的文书档案,乡财政所、中心学校等二级机构文书档案一般按“卷”整理 (2)各单位专门业务档案一般按“卷”或是“盒”整理。 (3)科技档案按“卷”整理,整理要求按照国家质量技术监督局颁布的《科学技术档案案卷构成的一般要求》(GB/T 11822-2000)执行。其中科研档案还可按国家档案局颁发的《科学技术研究课题档案管理规范》DA/T2-92执行。基建工程档案按照国家档案局、国家计委1988年颁发的《基本建设项目档案资料管理暂行规定》执行。 (4)会计档案按“盒(卷)”整理,整理的依据是财政部、国 (财会字…1998?家档案局1998年发布的关于《会计档案管理办法》

常用的公文种类和格式

常用的公文种类: 一、决议。经会议讨论通过的重要决策事项,用“决议”。 二、决定。对重要事项或重大行动作出安排,用“决定”。 三、公告。向内外宣布重要事项或者法定事项,用“公告”。 四、通告。在一定范围内公布应当遵守或周知的事项,用“通告”。 五、通知。发布规章和行政措施,转发上级机关、同级机关和不相隶属机关的公文,批转下级机关的公文,要求下级 机关办理和需要周知或共同执行的事项,任免和聘用干部,用“通知”。 六、通报。表扬先进,批评错误,传达重要精神、交流重要情况,用“通报”。 七、报告。向上级机关汇报工作、反映情况、提出建议,用“报告”。 八、请示。向上级机关请求指示、批准,用“请示”。 九、批复。答复下级机关的请示事项,用“批复”。 十、条例。用于制定规范工作、活动和行为的规章制度,用“条例”。 十一、规定。用于对特定范围内的工作和事务制定具有约束力的行为规范,用“规定”。 十二、意见。对某一重要问题提出设想、建议和安排,用“意见”。 十三、函。不相隶属机关之间相互商洽工作、询问和答复问题,向有关主管部门请求批准等,用“函”。 十四、会议纪要。记载、传达会议议定事项和主要精神,用“会议纪要”。

公文格式: 第一条公文一般由眉首,正文、文尾三部分组成。 第二条公文眉首包括发文机关、发文字号、签发人、紧急程度、机密等级等内容,一般用横线与正文部分隔开。 一、发文机关(公文版头)用醒目、整齐、庄重字体套红印刷,置于眉首上部,居中。 二、发文字号由发文机关代字、年份和顺序号组成,置于发文机关之下、横线之上,居中。 三、向上级报送的重要文件,要标注签发人,置于发文字号的同行右端。 四、紧急文件分“急件”、“特急件”两种,标于眉首右上角。 五、秘密文件应准确标明“绝密”、“机密”、“秘密”,标于眉首右上角。 第三条正文部分一般包括标题、主送机关、内容、附件、落款、附注等。 一、标题置于眉首之下,主送机关之上,居中。标题一般包括发文机关名称、事由和公文种类,要准确简要地概括公文的主要内容,除发布和批转上级规章性文件外,标题一般,不加书名号,也不用其它标点符号。 二、“公告”“通告”“条例”“规定”“决议”“决定”等公文可不标明主送机关,其它公文应标明主送机关。主送机关一般置于正文内容之上、左端顶格。“决议”“决定”若标明主送机关也可置于文稿尾抄送栏。 三、正文内容的结构层次序数依次为“一、”“(一)”“1.”“(1)”。规章和规范性文件,按有关规定,用章、节、条、款、项标明层次。 四、附件名称标于内容之后,成文日期之前。附件一般与主件合订发送,不能合订的应在附件首页左上角注明文件发文字号,与主件同时发送。 五、文件落款,指正文末尾的发文机关名称、印章和成文日期。成文日期以领导签发日期为准。 六、公文除会议纪要外,应当加盖公章。加盖印章的公文一般不再另署发文机关名称。 文尾部分,包括主题词、抄送栏、印发机关栏、印发日期、份数等项。 第四条主题词。置于横线之上左端,按主题词表规定标引,词目间间隔一个汉字距离。 第五条抄送栏。在主题词横线之下。抄送单位可使用规范化的简称。 第六条印发机关及日期栏。在抄送栏下用横线与抄送栏隔开,左端署印发机关全称,右端署印发日期。 第七条文件份数。标于印发机关及日期栏横线之下,居右。 第八条公文文字从左至右横写,横排。公文用纸为A4 型,并用统一印制的红头公文纸印刷,左侧装订。张贴的公文用纸大小,根据实际需要确定。公文标题用二号宋体字,内容用三号仿宋体。

人工智能的文本分类方法简述

人工智能的文本分类方法简述 摘要:本文阐述了一些基本的文本分类的方法,以及一些改进的文本文类的方法,并包含了一些文本分类的实际应用。其中着重阐述了贝叶斯分类以及一些其他的的文本分类方法。最后提出了现在文本分类方法中存在的一些问题。 关键词:文本分类;贝叶斯方法;数据挖掘;分类算法。 0 引言 文本分类是指在给定分类体系下, 根据文本内容(自动) 确定文本类别的过程。20世纪90年代以前,占主导地位的文本分类方法一直是基于知识工程的分类方法, 即由专业人员手工进行分类。目前在国内也已经开始对中文文本分类方法进行研究, 相比于英文文本分类, 中文文本分类的一个重要的差别在于预处理阶段: 中文文本的读取需要分词, 不像英文文本的单词那样有空格来区分。从简单的查词典的方法, 到后来的基于统计语言模型的分词方法, 中文分词的技术已趋于成熟。并在信息检索、Web文档自动分类、数字图书馆、自动文摘、分类新闻组、文本过滤、单词语义辨析以及文档的组织和管理等多个领域得到了初步的应用。 人工智能的基本方法就是对人类智能活动的仿真。小样本数据可以看作是一种先验知识不完全的数据集。人类在处理类似的决策问题时,通常采用的策略为: 1,利用多专家决策来提高决策的可信度; 2,专家的决策技能在决策的过程中可以得到不断的增强,即专家具有学习功能; 3,在专家的技能得到增强的基础上,再进行决策可以提高决策的正确性。 这种方法同样适用于小样本数据的分类识别。通过对上述方法的仿真,本文提出了智能分类器,它不仅可以对未知样本进行分类,同时它还具有多专家决策、预分类和学习功能。 1 分类的基本概念 分类就是根据数据集的特点找出类别的概念描述, 这个概念描述代表了这类数据的整体信息,也就是该类的内涵描述,并使用这种类的描述对未来的测试数据进行分类。 分类的过程一般分为两个步骤:第一步, 通过已知数据集建立概念描述模型; 第二步, 就是利用所获得的模型进行分类操作。 对各种分类方法的评估可以根据以下几条标准进行: 1)预测准确率,指模型能够正确预测未知数据类别的能力; 2)速度,指构造和使用模型时的计算效率; 3) 鲁棒性,指在数据带有噪声或有数据遗失的情况下,模型仍能进行正确预测的能力; 4) 可扩展性, 指对处理大量数据并构造相应有效模型的能力; 5) 易理解性, 指所获模型提供的可理解程度。 2 常用的分类算法

档案整理的方法及分类

档案整理的方法及分类、档号编制及质量要求(文书业务、会计声像、实物电子、科技 邵东档案整理的方法及分类、档号编制及质量要求(文书、业务、会计、声像、实物、电子、科技) 编写吴金林 一、档案整理几个概念 (一)档案整理定义:是指将处于零乱的和需要进一步条理化的档案,进行基本的分类、组合、排列、编号、编制目录、建立全宗等,组成有序体系的过程。 (二)档案整理的基本要求:遵循文件材料的形成规律和特点,保持文件材料之间的有机联系;区分文件材料的价值,确定档案的保管期限;便于保管和利用。 (三)档案整理的文件范围:凡是本机关工作活动中形成的,具有查考保存价值的文件材料,包括收发文电、内部文件、会议文件、电话记录、图表、簿册、照片、录音、录像、计算机盘片、实物以及本机关编印的出版物等,在办理完毕后均须整理保存。 (四)档案整理的方法:一是以“案卷”为单位整理。二是以“件”为单位整理。 1、以“案卷”为单位整理。 1)以“案卷”为单位整理就是立卷,即按照文件材料在形成和处理过程中的联系将其组合为案卷。 2)所谓案卷,就是一组密切联系的文件的组合体。立卷是一个分类、组合、编目的过程。分类即按照立档单位的档案分类方案,对文件材料进行实体分类;组合即将经过分类的文件材料,按一定形式组合起来;编目即将经过组合以后的文件材料,进行系统排列和编目。3)以“案卷”为单位整理的档案,其基本保管单位是案卷。案卷卷皮有软卷皮和硬卷皮2种,硬卷皮型号有1.2,1.5,2.0cm三个规格,以软卷皮装订的档案必须按案卷顺序装入档案盒。4)以“案卷”为单位档案整理的依据是1987年12月国家档案发布的《机关档案工作业务建设规范》和《文书档案案卷格式》 5)以“案卷”为单位档案整理的适应范围 (1)大部分单位短期保管(现10年)的文书档案,乡财政所、中心学校等二级机构文书档案一般按“卷”整理 (2)各单位专门业务档案一般按“卷”或是“盒”整理。 (3)科技档案按“卷”整理,整理要求按照国家质量技术监督局颁布的《科学技术档案案卷构成的一般要求》(GB/T 11822-2000)执行。其中科研档案还可按国家档案局颁发的《科学技术研究课题档案管理规范》DA/T2-92执行。基建工程档案按照国家档案局、国家计委1988年颁发的《基本建设项目档案资料管理暂行规定》执行。

公文具体分类

常用公文相关知识 一、什么是公文、文件 公文是党政机关、人民团体、企业事业单位实施领导、履行职能、处理公务的过程中所形成的、按照规定程序办理并在法定的范围内使用的、具有特定效力和规范体式的文书,是传达贯彻党和国家的方针政策,公布法规、规章或管理规章,施行行政措施和领导管理职能,指导、布置和商洽工作,请示和答复问题,报告、通报和交流情况等的重要手段和工具。 人们又常把公文称作文件,文件可以从广义和狭义两个角度来理解。广义的文件包括公务文件和私人文件,实质上就是文书的别称。本书不采用此说。 狭义的文件即指公文。从这个角度上来理解,文件就是公文,只不过不同场合用法不同。一是在泛指或使用集合说法时,一般用“公文”;而在具体指称公文即专指时,一般不说“公文”而说“文件”。如“公文写作学”、“公文培训班”,一般不说为“文件写作学”、“文件培训班”;而“一份文件”、“贯彻×号文件精神”,一般也不说为“一份公文”、“贯彻×号公文精神”。二是在口头表达时,习惯上都说文件而不说公文,如“学习文件”、“红头文件”、“去领文件”,其中“文件”一般不说为“公文”。 二、公文的分类 (一)按发文机关的行文方向划分,可分为上行文、下行文、平行文三类。 1. 上行文: 指向所属上级领导机关或组织发出的公文;

2. 下行文: 指向所属被领导、指导的下级机关或组织发出的公文; 3.平行文: 指向同一组织系统中的同级机关、组织或非同一组织系统中不相隶属的任何机关、组织制发的公文。 (二)根据公文的来源,可分为收文、发文两类。 收文指本机关或组织收到的来自外部的公文。发文又可分为两类:一类是指由本机关或组织制成发往外部的公文;一类是由本机关或组织制成只供内部使用的公文,这一类也可另立一类称为“内部公文”。 三、公文具体种类(13种) (一)请示用于向上级机关请求指示、批准。 (二)报告用于向上级机关汇报工作,反映情况,回复上级机关的询问。 (三)意见用于对重要问题提出见解和处理方法。 ****** 以上三个文种多用于上行文 (四)通知用于发布、传达要求下级机关执行和有关单位周知或者执行的事项,批转、转发公文。 (五)通报用于表彰先进,批评错误,传达重要精神和告知重要情况。

常见公文种类及范文

常见公文种类及范文 一、通知:是运用最为广泛的下行文,行政公文和党的机关公文都把它列为主要文种。 格式内容: 通知的写作形式多样、方法灵活,不同类型的通知使用不同的写作方法。 (一)印发、批转、转发性通知的写法。标题由发文机关、被印发、批转、转发的公文标题和文种组成,也可省去发文机关名称。正文须把握三点:对印发、批转、转发的文件提出意见,表明态度,如“同意”、“原则同意”、“要认真贯彻执行”、“望遵照执行”、“参照执行”等;写明所印发、批转、转发文件的目的和意义;提出希望和要求。最后写明发文日期。 (二)批示性通知的写法。标题由发文机关、事由和文种组成,也可省去发文机关名称。正文由缘由、内容包括要求等部分组成。缘由要简洁明了,说理充分。内容要具体明确、条理清楚、详略得当,充分体现指示性通知的政策性、权威性、原则性。要求要切实可行,便于受文单位具体操作。 (三)知照性通知的写法。这种通知使用广泛,体式多样,主要是根据通知的内容,交代清楚知照事项。 1 / 12 -------------------------------------------------- -------精品文档

(四)事务性通知的写法。通常由发文缘由、具体任务、执行要求等组成。会议通知也属事务性通知的一种,但写法又与一般事务性通知有所不同。会议通知的内容一般应写明召开会议的原因、目的、名称,通知对象,会议的时间、地点,需准备的材料等 (五)任免、聘用通知的写法。一般只写决定任免、聘用的机关、依据,以及任免、聘用人员的具体职务即可。 ××厂关于召开计划生育工作会议的通知 所属各单位: 为了总结交流经验,研究分析存在的问题,进一步贯彻落实省、市计划生育工作会议精神,做好今年计划生育工作,经研究决定召开计划生育工作会议。现将有关事项通知如下: 一、会议内容:…… 二、参加人员:…… 三、会议时间、地点:…… 四、要求:…… ××厂 ×年×月×日 2 / 12 -------------------------------------------------- -------精品文档

文本分类的常见方法

文本分类的过程: (1) 选择训练文本。好的训练文本对分类器的最终结果起到至关重要的作用。 (2) 选择文本特征。 对训练样本和测试样本进行数据预处理,包括分词、去停用词、 消除噪音等。目前的文本分类研究,主要选取一些具有代表性的词、词组、短语来表示文本。 (3) 建立文本表示模型。 为了便于计算机理解和计算相关的文本属性,需要对文本 进行表示,其中向量空间模型(Vector Space Model VSM)运用最为广泛。 (4) 选择分类方法。 文本分类的核心部分,不同的分类方法原理不同需要处理的数 据也不同。经典分类算法有朴素贝叶斯(Naive Bayes NB)、K-近邻(K-Nearest Neighbor KNN)、决策树(Decision Tree DTree)、算数平均质心(Arithmetical Average Centroid AAC)、支持向量机(Support Vector Machine SVM)。 (5) 分类结果的评估。 目前主流的评估标准准确率、召回率和F1值。 选择文本特征 我们需要将文档转换为计算机可以衡量、运算的形式。现在运用最广泛的形式:将文档映射入向量空间。具体流程如图1。 这样就将一篇文章映射成了为了向量空间中的一个向量。在把文章都映射完成后,我们可以根据自己不同的需求,在向量空间中进行运算。比如计算两篇文章的相似度:我们把向量的起点都映射到原点,则我们可以比较向量的长度、向量的夹角、向量两个终点的距离等等;我们还可以宏观的观察大量的向量在向量空间中的分布情况,对大量聚集在一起的向量抽取它们的共性:计算他们的中心、他们整体的方向等。其实数学模型很好,只不过限于计算机的存储、运算水平,向量空间的维度过高、文档数量过大、计算复杂度过高会使得模型的计算机实现变得困难,我们不得不进行简化:向量空间维度降低、较低复杂度的计算分析方法等等。而根据简化的合理程度,影响我们得到的结果质量。

相关主题
文本预览
相关文档 最新文档