当前位置:文档之家› 数据分析技术在税务信息化建设中的应用

数据分析技术在税务信息化建设中的应用

48

决策探索2007.5.下

CAISHUIJINGMAO

财税

经贸一、

运用数据仓库技术搭建数据分析平台

(一)数据仓库技术

数据仓库是支持管理决策过程的、面向主题的、集成的、随时间而变的、持久的数据集合。它与数据库的区别:所谓面向主题即根据最终用户的观点组织和提供数据,而数据库只能根据应用的观点组织数据;持久的数据集合是指除了当前数据外,还包含大量的历史数据,而这些数据在数据库中通常是被删除或更新的,故数据仓库的容量比数据库大得多;其中的历史数据由于是在不同时间数据库模式的不同版本中,所以需要集成和关联来自多个数据库和应用程序获得的、随时间变化的数据,由此聚集并提供的信息比数据库提供的信息更概括、更本质、更全面。数据仓库不是现成的单一产品,它的建立不是取

代数据库,而是建立在一个全面、完善

的信息应用基础上的综合了多种技术的计算环境。

数据仓库系统由数据仓库、仓库管理和分析工具组成。它的功能主要有两个:一是从各信息源提取需要的数据,加工处理后存储到数据仓库;二是直接在数据仓库上处理用户的查询和决策分析请求,尽量避免访问信息源。由此可知,数据仓库的主要应用有两个方面:在数据仓库中寻找有用信息和支持高层决策分析。

(二)数据仓库技术在税收征管中的应用

要使数据质量有深层次的提高,必须注重数据的整合与分析。征管数据整合与分析是在原有征管信息系统的基础上,通过数据挖掘、数据仓库技术对业务信息进行深加工,从中抽取知识或规律,并从不同的角度进行分析研究,

将所发现的知识运用到税收管理中去。这将是以后征管信息系统应用的重点。例如,目前可以将征管软件的数据和金税工程的数据进行整合,进行有效的税控处理和数据的增值利用。在数据整合的基础上还可以在外部网站上设立一些查询系统,供纳税人使用。这样,数据的质量自然也就得到了提高,采用先进技术,促进信息资源的有效利用。

近年来,我国的税务系统初步建成了一定规模的计算机局域网络、广域网络,但是网络功能的低下使得已有的信息资源得不到系统管理、集中处理,分

析与监控的能力不够强。没有有效地与海关、工商、金融等相关部门实现信息资源的共享,影响了税收征管的效率。从国外的成功经验来看,我们应加强对先进技术的研究与应用,使税务部门已有的信息资源得到充分的利用。目前,较为先进的数据挖掘技术越来越得到人们的青睐。数据挖掘是一门综合性的新技术,汇集了从数据库技术发展到现代的数据仓库技术以及统计分析的各种方法。人工智能的方法等诸多方面,能自动地从大量资料中发掘出对决策有用的信息,用尽量少的案例获得尽可能多的信息。这种技术在税收方面取得了有效的成绩。美国在采用了数据挖掘技术后节省了大量的开支,大大降低了税收成本。如政府收1000元的税,在日本要花10元的成本,在美国是5元的成本。由于我国在税收方面已经掌握了相当多的资料,因而数据挖掘技术的应用前景是乐观的。

数据分析技术

在税务信息化建设中的应用

○河南省舞阳县国税局

随着国税系统信息化建设的不断深入,各级税务机关积累了大量的业务数据,但由于缺乏有效的技术手段,决策者很难从这些数据中获得深入的、有价值的信息。反之,大量垃圾数据的出现,将直接侵占税收网络资源,干扰税收征管信息系统的运行质量和效率,影响国家税收的征收管理。因此,充分利用数据分析技术基于数据仓库技术的应用,自动地从大量数据中发掘出对决策有用的信息,促进信息资源的有效利用意义重大。

财税

经贸CAISHUIJINGMAO

二、数据分析技术和工具的引进

税务系统应用计算机局域网技术来进行税收业务管理,多年来积累了大量的税收业务管理数据。但目前对于这些历史数据,只是将其存放在计算机中,偶尔进行一下查询,没有发挥其应有的作用。在对大量的数据进行管理时,不应仅仅局限于日常事务处理的计算机化和对数据的存储和查询等内容。如何对这些数据进行有效、合理的分析和利用以及从中挖掘出对决策有帮助的知识,才是目前应当研究的重点。随着数据仓库和数据挖掘技术的发展,对这些数据的开发利用成为可能。我们可以通过引入有效的数据分析工具来对这些宝贵的资源进行处理,将数据分析的理念引入到税务工作中,从而为加强税收业务管理和领导决策分析提供有力的支持。

(一)数据分析的目的

数据分析的目的主要是从现有的数据中发现并证实一些过去不了解的信息,从而达到“了解过去、掌握现在、预测未来”的目的,从而更好地改进税务工作,作出更可信的决策。例如,通过对过去几年税收收入的分析,预测未来一年内各月的税收收入情况,从而合理制定下年度的税收计划;通过对过去一年内纳税人的纳税信用分析,预测本年内各纳税人的纳税依从性,从而确定稽查的重点对象,从更少的纳税人中稽查到同样数量的逃漏税额。

(二)数据分析工具如何实施数据分析

数据分析在信息化发展、决策支持上具有重要作用,而数据分析工具的广泛发展,也使得数据分析与人们的实践活动越来越靠近。那么,数据分析工具是如何实施数据分析的呢?

任何一个数据分析项目的实施,都大致遵循这样一个流程:计划阶段、数据收集阶段、数据获取阶段、数据加工处理阶段、数据分析阶段、结果报告

阶段、结果发布阶段。其中,第四阶

段——

—数据分析阶段是一个项目的核

心阶段,也是数据分析工具的主要职

能所在。除此阶段之外,数据分析工具

的功能还上延到了数据获取阶段,下

伸到了结果报告阶段。从税务信息系

统的数据库中获取数据,依据分析要

求对数据进行加工处理和分析,以报

表——

—如税收月报表、图形——

—如用

饼图展示各省税收收入份额、模

型——

—如用于预测下年度税收的模

型,或者单个数字——

—如预测得的每

个纳税人的逃漏税概率的形式给出结

果。对于可用的模型,可以进行一定的

开发,将其填加到税务信息系统中备

用;对于可用的数字结果,可以将其添

加到数据库中备用。数据分析还可以

通过报表、模型的形式增强业务人员

对业务的理解,发现业务知识,以便将

这些知识应用到新的实践中。

(三)数据分析工具与信息系统的

结合

分析系统与信息系统的结合实际

上可以分为两部分,第一部分是分析

系统从信息系统中获取数据,第二部

分是将分析结果应用到信息系统中。

下面我们具体介绍两部分内容,

第一,分析系统与前端数据库的结合;

第二,分析系统结果后端与信息系统

的结合。

分析系统与前端数据库的结合,

简单地说,就是分析系统从数据库中

获取数据。分析系统从数据库中获取

数据大致有三种方式,第一,通过

ODBC去读取数据。第二,通过JDBC

去读取数据。第三,分析系统与数据库

为同一厂商产品时,分析产品直接通

过专用通道从数据库中读取数据。其

中,第三种方式显得更理想一些,但这

也限制了我们的选购范围,我们很难

同时找到最理想的数据库和分析系

统。通过ODBC或通过JDBC数据库去

读取数据时,由于ODBC和JDBC是数

据库厂商的一个一般规范,主流数据

库大部分都支持ODBC和JDBC。数据

分析软件如果能够通过ODBC和JD-

BC读取数据,则此部分问题大致就解

决了。

分析系统的结果大致可以分为以

下几类:报表、图形、数值、模型。报表、

图形其实是两部分比较简单的结果,它

们要么作为汇报材料交给领导,要么作

为公布结果发布到网上。而对于数值

型结果,则可能有两种要求,一种如报

表、图形一样直接生成报告,一种是要

写回到数据库中备用。对于分析系统

产生的有用模型、有用知识,则有可能

希望应用到将来的信息业务系统中。

因此,要作一定的开发,以供日常工作

中应用。

因此,数据分析工具与信息系统的

结合是完全可行的。

(四)应该如何选择数据分析工具

在选择数据分析工具时,要注意以

下几点:一是数据分析工具应是专业

的,首先要囊括可能用到的数据分析算

法。二是由于数据分析前,往往要针对

特定的分析目的进行必要的数据整理,

因此,数据分析工具还要集成强大的数

据准备功能。三是数据分析工具要能

够从你现有的数据库中获取数据,并且

要考虑未来是否可能更换别的数据库

系统。四是数据分析的结果还要易于

发布到结果报告网上。数据分析工具

产生的模型要能够进行进一步的开发

利用。数据分析产生的必要结果要能

写回到数据库中。五是数据分析工具

的可发展性。此外,还要考虑数据分析

工具与当前平台、软硬件的兼容性等

等。

三、总结

新阶段的税务信息化建设是一场

税收管理的革命,坚持科技加管理的

方针,正确处理一体化原则下的个性

和共性问题,广开思路,调动一切可

以调动的积极性,我国的税收工作就

一定能够为国民经济和社会发展作出

更大贡献。

49

2007.5.下决策探索

相关主题
文本预览
相关文档 最新文档