大集中下加强数据质量管理的思考
- 格式:doc
- 大小:24.50 KB
- 文档页数:5
随着大数据时代的到来,大数据分析已经成为了企业决策和发展的重要工具。
然而,在进行大数据分析时,数据质量问题往往会给分析带来一定的困难和挑战。
因此,如何在大数据分析中应对数据质量问题成为了许多企业和数据分析师面临的重要问题。
本文将从数据质量问题的原因、影响和解决方案等方面进行论述。
一、数据质量问题的原因数据质量问题的原因有很多,其中最主要的原因包括数据来源的不确定性、数据采集和存储过程中的错误、数据处理和清洗不当等。
首先,数据来源的不确定性是数据质量问题的主要原因之一。
在大数据分析中,数据往往来自各种不同的来源,包括传感器、社交媒体、互联网等,这些数据来源的不确定性往往会导致数据的不准确和不完整。
其次,数据采集和存储过程中的错误也会导致数据质量问题。
在数据采集和存储的过程中,可能会发生各种错误,比如数据丢失、数据冗余、数据格式错误等,这些错误会直接影响到数据的质量。
最后,数据处理和清洗不当也是导致数据质量问题的原因之一。
在数据分析的过程中,数据处理和清洗是至关重要的环节,如果处理和清洗不当,会导致数据的不准确和不可靠。
二、数据质量问题的影响数据质量问题会对大数据分析产生一系列的影响。
首先,数据质量问题会导致分析结果的不准确。
如果分析所使用的数据质量不高,那么所得到的分析结果很可能是不准确的。
其次,数据质量问题会影响到企业的决策和发展。
在大数据时代,企业的决策和发展往往依赖于数据分析,如果数据质量有问题,那么企业的决策和发展也会受到影响。
最后,数据质量问题还会影响到企业的声誉和信誉。
在信息化的今天,企业的声誉和信誉对其发展至关重要,如果企业使用的数据质量有问题,那么会直接影响到企业的声誉和信誉。
三、应对数据质量问题的解决方案为了解决数据质量问题,我们可以采取一系列的解决方案。
首先,我们要加强数据采集和存储过程的管理。
在数据采集和存储的过程中,我们要严格管理,确保数据的准确和完整。
其次,我们要加强数据处理和清洗的环节。
切实加强数据建设不断提高数据质量甘肃省工商局12315 指挥中心数据质量建设是工商行政管理信息系统的一项重要基础性工作,是信息技术与工商行政管理业务之间融合的基础和纽带,在行政执法监管、消保维权、规范市场秩序等方面,具有不可替代的重要作用,因此,甘肃省工商局按照国家工商总局的部署,构建“行政执法、行业自律、社会监督”为一体的12315 行政执法体系工作中,以先进的科学理念为指导,以促进社会和谐为使命,以保障市场消费安全为重点,以信息化建设为技术支撑,通过搭建覆盖全省的12315 信息化网络平台过程中,同时建立起全省“大集中”的数据管理中心,12315 信息化网络的建成,达到了五级贯通的要求,工商各业务的数据都存入该数据库中,这里包括市场主体、执法办案、消费维权、食品流通、市场信用、网络监管、政务监督,还有法律法规知识库等,其中12315 数据量占第一,近130 万余条,达到了国家工商总局12315 行政执法监督体系的要求。
一、数据分析利用工作方面的做法一是领导重视,突出狠抓基础数据建设。
突出加强前瞻性,体现便捷性,注重实用性,在建设“大集中”的信息化网络平台时,同步建立了12315 指挥中心和数据中心,其中将数据中心设在省局信息处,把硬件建设工作放在了首位,为数据的分析利用奠定了坚实的基础,使12315 的信息从开始就进入了数据库,有利于数据的查询、共享、分析和利用。
2009 年、2013 年先后对12315 网络进行了升级改造,按照国家工商总局数据质量标准要求,提出数据分析软件需求,将单一数据分析向数据网络化、整体化、多元化转变,实现了数据分析的预测性、准确性、完整性和科学性。
二是措施得力,突出狠抓数据制度建设。
建立数据采集、分析、发布、利用制度。
通过数据的深度挖掘,我们做到每日有分析,每周有要点,每月有简报,定期发布综合分析和专项分析,适时向政府呈送《情况反映》,及时发布消费警示,为工商市场监管和行政执法提供了可靠的案源线索;为政府决策提供了科学的数据支持;为保护消费者合法权益不受侵害提供了方便快捷的服务;为督促企业提高产品和服务质量提供了有价值的信息。
集中管控总结汇报材料集中管控是指通过集中协调和管理,对各种资源、人员和活动进行统一监管和控制,以实现更高的效率和更好的管理。
在各个领域广泛应用,如企业管理、城市管理、环境保护等。
本文将对集中管控进行总结汇报,并分析其优势和应用案例。
一、集中管控的优势1.提高资源利用效率:通过集中管控,可以对各种资源进行更好的配置和管理,避免资源浪费和重复使用。
例如,在企业生产过程中,可以通过集中管控来优化生产计划,更好地利用设备和人力资源,提高生产效率和产品质量。
2.提升管理效能:集中管控可以实现对各个环节和部门的统一管理和协调,减少信息交流和协调成本,提高管理效能。
例如,在城市管理中,借助集中管控系统可以实现对城市交通、环境、安全等方面的综合管理,提升城市管理水平。
3.加强安全管理:通过集中管控,可以对安全风险进行及时识别和监控,减少事故发生的可能性。
例如,在企业生产过程中,集中管控系统可以及时检测安全隐患,并采取相应的预警和控制措施,保障员工和设备安全。
4.提供决策支持:集中管控可以对各种数据进行收集和分析,提供准确的信息和决策支持。
例如,在企业经营管理中,集中管控系统可以通过对销售数据、市场需求等信息进行分析,帮助管理者制定更科学的决策。
二、集中管控的应用案例1.智能交通系统:通过集中管控系统,可以实现对城市交通信号、公交车辆等的实时监控和调度,优化交通流量,减少拥堵和交通事故的发生。
例如,中国的城市深圳就成功应用了智能交通系统,大大提升了交通管理水平。
2.环境保护:集中管控系统可以监测城市空气质量、水质状况等环境指标,实时预警和监控污染源,减少环境污染,改善人居环境。
例如,中国上海对于空气质量的监控和管控非常严格,通过集中管控系统实现了空气质量的实时监测和预警。
3.企业生产管理:集中管控系统可以对生产设备、原材料、人力资源等进行集中管理和协调,提高生产效率和产品质量。
例如,德国的工业企业使用集中管控系统对生产过程进行监控和控制,提高了生产的自动化程度和效率。
企业全面质量管理的实践与思考摘要企业全面质量管理是一种集中于客户需求的管理体系,旨在减少缺陷、提高效率和持续改进产品和服务的质量。
本文通过剖析企业全面质量管理的意义、基本原则和关键组成部分,阐述实际应用中的经验和案例,以期提供一些思考和参考材料以促进企业质量管理的不断完善。
关键词:全面质量管理、客户需求、缺陷减少、效率提高、持续改进正文一、企业全面质量管理的意义在全球市场竞争日益激烈的背景下,企业要取得成功,必须具备突出的市场竞争力。
质量是产生竞争力的关键因素之一。
企业全面质量管理是控制产品和服务质量的一套有效的管理体系,它能够有效地降低制品缺陷率、提高工作效率、识别顾客群体的需求并以此来提供产品及服务。
二、企业全面质量管理的基本原则1. 客户导向原则企业的普遍目的是满足顾客需求。
因此,围绕客户需求制定企业运营计划、产品设计和生产策略,是全面质量管理的根本原则。
2. 持续改进原则企业全面质量管理最大的优势是持续改进。
持续改进有助于提高工作流程,优化绩效,减少制品缺陷率,并增加客户满意度。
3. 以事实为基础的决策原则经验和尝试是企业管理的不可或缺的部分。
然而,制定决策必须基于可靠数据和事实,而不是主观臆断。
4. 科学管理原则全面质量管理需要根据计划、流程、制造安排等重要的因素进行科学管理,以便索引工作过程、最大程度地减少缺陷率。
5. 利益共享原则建议开发一种“利益共享”政策,这样工作团队和管理层可以在协调的框架内交流信息和经验,从而共享利益、共创成功和相互关心。
三、企业全面质量管理的关键组成部分1. 公司组织结构行业中卓越的企业必须对自己的生产和制造任务进行深入的思考,并将这些任务转化为可靠的组织结构。
这样可以将工作流程清晰化、最大程度地减少制品缺陷率。
2. 绩效测量企业全面质量管理需要通过指标去衡量企业绩效,比如:缺陷率、工作效率、成本价值。
这些指标有助于制定管理决策、行动计划并降低风险。
3. 员工培训所有方面的员工都需要接受持续的培训和实践。
大数据平台的数据质量管理随着互联网的快速发展,数据统计和分析的重要性越来越受到重视。
大数据平台作为一个集中处理和储存大量数据的系统,对于数据质量的管理也越来越关注。
本文将就大数据平台的数据质量管理展开讨论。
一、大数据平台的数据质量大数据平台所管理的数据类型不同,其数据质量的标准也有所不同。
但是无论是什么类型的数据,在进行数据分析和挖掘之前,都需要进行数据质量评估和管理。
数据质量管理主要涉及以下几个方面:1.数据精度:数据精度是指数据的准确性,即数据与真实情况之间的差距。
数据精度不高会导致分析和挖掘结果的不准确性,严重影响数据价值。
2.数据完整性:数据完整性是指数据的完整程度,包括是否存在空值、重复值和逻辑错误等情况。
数据完整性较低会给后续分析和挖掘带来影响。
3.数据一致性:如果数据背后的逻辑关系不一致、含糊或者矛盾,将会导致分析和挖掘的数据配合错误。
4.数据可靠性:数据可靠性是指数据的来源是否可靠。
如果数据来源不可靠,那么数据的整体价值将大打折扣。
二、大数据平台的数据质量管理大数据平台的数据质量管理主要涉及以下两个阶段:1. 数据采集阶段数据质量管理的第一个步骤是:确保所有数据源都具有可信度,并按照预定规则采集。
一旦发现质量混乱或者不符合规定,数据采集过程立即终止。
同时,在交付到大数据平台之前,数据应该进行清洗和转换,以确保数据的可靠性和完整性。
数据标准化过程中还包括正则表达式的使用、语言特征的归一化和基于特征梯度的预处理等。
2. 数据处理阶段在数据采集之后,大数据平台需要确保数据质量达到一定的标准。
这涉及到数据清晰度、数据质量、客户满意度等。
数据质量的指标由平台根据标准主导,或像样本数据比较和标准比较等通用的工业发展办法构成。
数据采集和分析必须遵守数据质量规范,重要的分析数据必须由专业技能人员来确认和验证。
通常这些验证过程是由常规审核、恶意挖掘和各种分析策略组成的。
三、大数据平台的数据质量评估大数据平台还需要定期评估数据质量,以确定平台所管理的数据质量符合预期标准。
浅议后大集中时期的税收管理工作摘要:在“五位一体”互动机制的基础上,结合“抓大、评中、定小”税源分类管理思路,实施以“信息管税”为核心的地税管理新模式,是浙江省地税工作在“大集中”工程背景下的新要求。
本文在综合大集中模式产生背景基础上,对大集中模式运行状况开展深入分析,并结合工作体验,发现:大集中时期的税收征管工作更加高效、规范和便捷,但也存在着不少问题。
提高中小微企业税收征管质量和效率,为引导经济转型升级发挥积极作用。
需要从更新税收征管理念、创新税收征管模式入手,在充分肯定提高数据管理质量重要性的基础上,加强税收数据的深度分析和应用。
关键词:税收征管;信息化;数据分析所谓“大集中”,是旨在与过去的“数据分散”和“有限集中”相区别的一种通俗的说法。
它是社会在信息化发展阶段出现的,是以集中存储、处理和备份数据为手段,通过建立统一的业务和管理系统,推动业务处理集中和管理集中的过程。
根据公认的经典米歇模型和诺兰模型,税务信息化的总体进程已经经过了初始、蔓延、集成阶段,“实现数据的集中和应用系统的整合”。
“大集中”诞生于1994年税收征管改革。
1994年,为满足社会主义市场经济发展的需要和新一轮财税制度改革的客观要求,国家税务总局结合之前探索的税收征管改革成功经验,借鉴和吸收了国外税收征管的有益经验,通过组建中央和地方两套税务机关,实行分税制,确立了纳税申报制度,推广税务代理制度,推进税收征管工作信息化,建立严格的税务稽查制度。
通过若干个阶段的试验和实践后,最终在2003年确定了“以申报纳税和优化服务为基础,以计算机网络为依托,集中征收、重点稽查、强化管理”的税收征管模式。
基于信息化建设的“大集中”概念应运而生。
一、大集中时期取得的税收管理成效“大集中”为税收管理搭建了一个高层面、高效益、高质量运行的现代化平台,通过省级税库银联网,统一数据采集口径,简化了税款入库流程;坚持以标准促规范,全部业务一律按照ISO9000标准执行,确保“大集中”系统功能齐全、操作规范。
基于人工智能的大规模数据集的数据质量评估和监控技术研究数据质量评估和监控是在大规模数据集中进行的重要任务。
随着人工智能的快速发展和广泛应用,大规模数据集的质量问题变得尤为重要。
本文将探讨基于人工智能的大规模数据集的数据质量评估和监控技术研究,重点关注该领域中存在的挑战和解决方案。
1. 引言随着互联网技术和计算能力的快速发展,人工智能应用已经广泛渗透到各个领域。
在这个过程中,大规模数据集起到了至关重要的作用。
然而,随着数据量不断增加,数据质量问题也逐渐凸显出来。
因此,进行准确而高效地对大规模数据集进行评估和监控变得尤为关键。
2. 大规模数据集中存在的挑战在大规模数据集中进行质量评估和监控面临许多挑战。
首先是高维度问题。
随着维度增加,对于每个维度进行评估变得非常困难,并且可能导致计算复杂性增加。
此外,在大规模数据集中存在许多异常值和噪声,这可能会影响数据质量评估的准确性。
同时,数据集的动态性也是一个挑战,因为数据集可能会随时间不断变化。
3. 数据质量评估技术为了解决大规模数据集中的质量问题,研究人员提出了许多数据质量评估技术。
其中之一是基于统计方法的评估技术。
这种方法通过计算各种统计指标来衡量数据集的质量,如均值、方差和相关性等。
此外,还可以使用基于规则的方法来评估数据集中存在的异常值和噪声。
另一种常用的技术是基于机器学习算法的评估方法。
这种方法通过训练模型来学习大规模数据集中正常和异常样本之间的差异,并使用该模型对新样本进行分类。
通过这种方式,可以自动检测和识别出存在问题的样本,并提供更准确、更高效地对大规模数据集进行质量评估。
4. 数据监控技术除了对大规模数据集进行质量评估外,还需要实时监控该数据集以及相关应用程序中可能出现的问题。
为此,研究人员提出了一系列监控技术。
其中之一是基于规则的监控技术。
这种方法通过定义一系列规则来监控数据集中的异常情况。
例如,可以定义一个规则来检测数据集中的缺失值或异常值。
大数据背景下企业财务管理高质量发展探讨大数据时代带来了企业财务管理的革命性变化,借助大数据技术和工具,企业可以准确地获取和分析海量的财务数据,为决策提供更有力的支持。
企业要制定相应的策略和措施,与时俱进,革新落后的观念和财务管理模式,以实现财务管理的高质量发展。
一、大数据时代企业财务管理的趋势(一)收集和使用多种结构的数据,拓宽数据来源在大数据时代,企业财务管理趋向于收集和使用多种结构的数据,不仅限于传统的财务数据,如财务报表和交易记录等,企业还可以利用其他数据来源,如供应链数据、客户数据、市场数据等。
多样化的数据源可以为财务管理提供更全面的信息,帮助企业更好地理解和预测市场趋势,优化财务决策和资源配置。
(二)财务管理中关注非结构化数据的应用价值企业财务管理在大数据背景下,越来越关注非结构化数据的应用价值,非结构化数据包括社交媒体数据、文字、图像、音频等形式的数据,其特点是数据量大、类型多样、难以直接处理和分析。
通过分析社交媒体数据、消费者评论、新闻报道等非结构化数据,企业可以了解消费者对产品和品牌的评价、竞争对手的市场表现等信息,借助此类信息,为企业制定市场策略、调整产品定价、改进产品设计等提供重要参考。
非结构化数据可以帮助企业了解消费者对品牌的态度和看法,评估品牌声誉的变化和趋势,对社交媒体数据、在线评论进行分析,协助企业及时发现和回应消费者对品牌的关注和问题,维护品牌形象和声誉。
同时非结构化数据的应用具有风险管理和预警功能,分析社交媒体数据、新闻报道等非结构化数据,企业可以及时发现市场变化、行业趋势、竞争风险等因素,及时调整经营策略、降低风险和提前预警。
(三)财务管理应满足会计信息使用者的个性化需求随着大数据时代的到来,会计信息使用者对财务数据的需求个性化特色增加,企业财务管理需要根据不同利益相关者的需求,提供个性化的财务信息和报告,为投资者提供更详细的财务分析和预测,向管理层提供实时的业绩指标和决策支持,为监管机构提供符合规范要求的财务报告,以及结合员工和供应商需求,为其提供与其相关的财务信息[1]。
大集中下加强数据质量管理的思考发布日期:2010-03-11 信息来源:如东县地税局作者:潘永东信息管税作为我国税收领域内近期出现的热点话题,进入决策者视线并在今年明晰为税收征管和科技工作的思路后,会不断在实践中把一些前所未有的重要问题摆在我们面前。
今年全省地税大集中系统的成功上线,可谓契合了这一变革性发展时期。
如何依托这一平台,推进信息管税,是需要进一步深思和探究的大课题。
本文以信息管税的核心——信息采集和利用为切入,对加强大集中下数据质量管理作一些思考和剖析。
观点一:提高对数据质量重要性认识的基础是对数据质量基本属性的认识。
数据是有效开展税收信息化管理和辅助决策分析的依据,是实现税收信息化高速发展的重要保障,因此其质量和时效性已经越来越受到高度关注。
我们对数据建设和应用进行了重点投入,目的就是能够拥有丰富、准确、及时、有效的数据资源,占据现代税收信息化管理中的优势地位。
数据就是资产的理念已被普遍认识,但要从基本上提高对数据质量重要性的认识,并潜化为工作方式和习惯,就必须立足于对数据及其质量本质的解析,从而推动实践,把握进程。
思考:大集中环境下数据的属性有哪些?如何去监控这些要素达到提高数据质量的目的?数据作为税收信息化应用的主体,它具有多重属性,其基本质量特性主要包括适用性、准确性、完整性、及时性、有效性等五个方面,要对数据质量进行较好地控制,就必须对数据的五个基本质量特性进行很好了解,从而在各个方面采取措施,杜绝数据质量问题的出现,使数据监控工作能够真正达到控制数据质量的目的。
1.数据的适用性。
在税收业务开展过程中,会产生大量的各类税收数据,这些数据有税收动态信息等反应不断变化的数量型数据,也有相应税收静态信息等相对稳定的属性信息。
这些数据有的是为税收管理和决策服务的,有的则是满足各级管理和分析的需求,这就从客观上造成数据的多样化,同时也是为满足不同专业、不同岗位的操作人员服务的。
不同的数据具有不同的使用范围,每个数据的正确性都要求它是进入正确的专业应用,换句话说:无论多么准确、及时的数据,如果不具有适用性,它就不能产生任何效益,甚至操作人员使用之后会造成损失。
2.数据的准确性。
数据的准确性一般是说数据测量值与真实值相比的符合情况,但在税务登记的基础数据的采集和录入处理过程中,数据的准确性往往变成是指所采集入库的数据值与实际应采集记录的正确值之间的差异。
在数据监控和质量控制的过程中,准确性越好的数据,其误差应该越小。
影响数据准确性的因素很多,数据误差在数据采集、审核、录入、传输和处理等的各个环节都可能产生。
我们需要从各个方面分析影响数据准确性的因素,同时有效控制不同类型数据的合理变化范围,将数据误差控制在尽可能理想的范围内,以保证数据的准确性。
3.数据的及时性。
在税务部门日常数据的管理中,往往要求能够更快、更准地收集到所需的数据。
在日常生活中,也有“时间就是金钱”的说法。
把这些要求应用到数据上,那就是说数据也必须要有及时性。
比如对于地税部门某个分局数据,如果有一条线的税款征收发生滞后,导致税收统计不实了,但在税收数据上如果不能及时有效获得有效税款征收信息,那么拿在手里的征收数据就没有任何及时性,也是毫无意义的。
一个好的应用系统在使用数据时不仅要求数据的适用性还必须考虑数据的及时性,应用系统引入税收管理的主要目的是提高工作效率,把大量复杂、繁重的重复计算、统计、分类工作交由计算机处理并迅速得出准确结果。
如果数据不及时,那么应用系统的处理结果就可能违背了程序设计和使用者的初衷,不仅无法提高工作效率,还可能由于数据滞后而影响税款征收的正常化。
因此根据数据应用需求及时采集数据,按照操作人员要求及时发布数据,是保证数据及时性的重要一环。
4.数据的完整性。
数据的完整性相对于准确性和及时性来说并不显得那么重要,但其实它引起的问题并不比前两者轻松。
数据的完整性就是我们日常所说“数据齐、全、准”当中的“全”。
在数据采集过程中,要把所需信息全部采集完整,比如税务登记,如果只记录一组数字“320623************”,谁也不知道这组数字是什么东西,也就是说这组数字采集得不全。
如果记录成“张三身份证号为320623************”,那么这组数据就完整了,对税务登记的管理和分析才有意义。
从这里可以看出,数据的完整性一点也不亚于准确性的重要程度,在数据表格、数据库充分应用的情况,对数字的规范化填写要求越来越完善,单独强调数据完整性的情况会越来越少。
5.数据的有效性。
在解决好数据适用性、准确性、及时性、完整性的情况,需要考虑数据的有效性。
对于一个及时采集获得,准确、及时、完整的数据,还需要考虑这个数据使用的时间和对象。
一堆过期的数据无异于废品或垃圾,是不产生价值的,因此在使用数据时,要考虑它是否有效。
举一个简单的例子,我们在3年前采集了某个企业的按月征收的税款统计数据,记录了当月各种税款的征收数,而该企业现在已经注销了,那么我们拿着这一些数据来分析、管理这户企业,还有效没有呢?这是显而易见的,这很好地说明了数据的有效性问题。
当然,数据除拥有以上的质量特性之外,还具有可取得性、可衔接性、可解释性、客观性、专业性、可比性等属性特性,这些属性特性对于数据的质量控制也有一定的影响,因此我们在重点监控五个基本质量特性外,也要关注这些属性特征,尤其是在加工和利用中通过技术手段来规范这类属性,达到提高数据质量的目标。
结论:数据是否可信、可用,这是税务部门关心数据的两个层面。
是否可信是指数据在适用性、准确性、完整性、及时性和有效性方面,是否满足应用要求;是否可用是指数据的格式、内容等能否被操作人员读取和使用,能不能很方便地进行深入处理和分析。
以上两个层面中,可信就是数据的基本质量问题,需要通过采取管理手段、技术手段等各方面的努力来解决;可用是技术层面的问题,主要通过技术手段使数据规范化、格式化。
观点二:坚持数据质量可控的前提下,对目前大集中运行中存在的数据质量问题要理性对待、科学解决、持续改进随着大集中系统的成功运行,全省地税系统税收信息化建设实现了又一历史性跨越,税收业务流程的处理愈加便捷,涉税数据的管理更加规范,数据管理手段的现代化也对数据的准确性、操作的熟练性也提出更高的要求。
自新系统运行以来,各层面尤其是基层总体感觉运行流畅、业务全面、满足需求,较原系统而言更合理化、人性化,但由于地区差异、管理模式差异,流程传递的差异,个别方面还存在个别矛盾有待化解。
而数据质量作为影响整个流程的起始环节,其问题尤其使大家敏感和关注。
思考:目前大集中环境下,在数据质量方面的问题和难点主要有哪些?解决的路径如何去选择?目前,影响数据质量的因素主要表现在以下几个方面:1.缺乏科学、规范、完整的数据质量标准。
有些情况下对录入数据的格式或来源没有统一明确的要求,缺少统一、规范的审核程序和标准,在录入后就成为问题数据,或在数据加工、利用过程中形成垃圾数据。
2.数据采集手段相对单一,不能全面采集纳税人数据。
目前,地税部门大多依靠纳税人自行申报来实施管理行为,信息来源面窄,获取信息的手段落后,致使数据质量受到影响。
数据采集不全的问题比较突出,多侧重于对纳税人静态信息的收集,而对动态数据的采集不够全面,不能真实掌握纳税人的实际经营状况。
3.数据信息共享程度差。
一方面表现为系统内部各软件间数据定义没有统一标准,数据关联性差,信息资源无法得到充分利用;另一方面,由于受社会条件的制约,国税、地税、工商、银行等部门之间信息化建设程度各不相同,不能有效利用社会信息资源。
4.缺乏系统的数据质量管理机制。
如大集中系统操作人员无后台权限,查询不便、修改不便,导致数据纠错机制运转不畅;没有统一规范的数据质量标准,导致对数据审核、监督和考核机制缺失等等。
5.人员操作水平制约数据质量的提升。
一方面,基层分局存在老龄化、信息化基础薄弱的现象。
个别分局35岁以下的不到20%,40岁以下的不到30%,部分老同志很多是军转干部出身,尽管系统上线前期开展了多种多样的岗前培训,而且从主观上这部分同志也希望能够全面掌握,但是由于基础薄弱导致操作的熟练程度、准确程度有所欠缺。
也有极个别现象同志工作责任心不强,对待一些简单重复性的工作缺少工作耐心,致使错误数据屡屡出现。
另一方面,办税人员对网上申报等系统的掌握程度不一,以及诚信纳税的意识不同,也影响到了原始数据的真实性和及时性。
针对以上存在问题,结合目前工作实际,提出以下解决思路。
1.建立数据质量管理标准。
有了统一的数据标准后,数据录入采集、加工处理等诸过程都将按照标准要求进行,数据混乱出错的情况将大为减少。
需要整理发布的基础性数据标准包括业务元数据的标准和相关代码的标准。
业务元数据是关于业务数据的数据,即对业务数据或信息进行描述的数据。
发布业务元数据的标准就是提供一个统一的业务数据项定义和描述方法,对数据元素名称、数据元素定义、数据来源、源数据载体、数据类型、逻辑一致性、采集主体、采集频率、更新等级、业务类别等方面作详细说明。
例如定义业务元数据“纳税人名称”的标准:元数据名称纳税人名称描述纳税人(企业)税务登记证上的正式名称数据来源(输入)纳税人办理税务登记申请时,由税务机关根据税务登记申请审批表录入数据用途(输出)查询的输入参数,可以模糊查询;打印税务登记证正副本,各类查询的输出结果数据格式长度大于或等于4个字符的字符串代码的标准就是提出相关代码规范化的取值范围。
可分为三类处理。
一类是已有国家级标准的,采用国家标准代码,如国标行业代码;另一类是暂时还没有国家标准的,但是国税总局或其他部委已制定标准的,依据总局标准或参考其他部委标准;第三类,是需要自己制定标准,在本市(本单位)范围内使用,将来会被更高级标准取代。
比如收入归属代码、税金状态代码等。
2.完善数据质量管理机制。
为了保证业务数据准确、及时、完整一致,必须要有专门的机构和岗位负责业务数据质量的监督管理。
当前,各级要在建立健全税源管理中心的机制、职能的过程中,专门设置数据质量管理岗,或将数据管理的职能详细明确到相关岗位,牵头负责税收业务数据的质量管理,使得业务数据质量管理工作制度化、常规化。
如征管部门负责统筹税收业务数据质量管理工作,制定有关制度和办法,业务数据加工处理过程中的质量控制,按照规定进行技术岗位数据变更,并对系统税收业务数据质量情况进行考核;信息部门负责系统数据资源的安全传输和存储;各业务部门根据各自业务管理权限,负责对应范围内的税收业务数据质量管理,参与相关制度办法、数据审计规则和问题数据处理方案的制定;各基层单位所负责本部门业务范围内税收业务数据质量管理;各岗位人员对自身采集录入的业务数据质量负责;对其他岗位采集录入的,且属于本岗位管辖范围的数据质量负责。