当前位置:文档之家› 基于粗糙集理论与支持向量机的纳税评估模型

基于粗糙集理论与支持向量机的纳税评估模型

第26卷第12期计算机仿真2009年12月文章编号:1006—9348(2009)12-0253—04

基于粗糙集理论与支持向量机的纳税评估模型

刘晗,余小清,万旺根,马秀丽

(上海大学通信与信息工程学院,上海200072)

摘要:研究纳税评估是对纳税人纳税情况进行评价的一种管理模式。为了区分纳税人是否正常申报税款。融合了粗糙集理论与支持向量机机器学习方法的优点,提出了一种新的纳税评估模型。通过选取纳税申报表中的指标,建立纳税评估指标体系.并利用粗糙集理论对指标进行属性约简,采用支持向量机对纳税人进行分类处理,建立了纳税评估模型。最后对上述模型进行了实例验证,实验结果表明,模型具有良好的纳税评估预测性能。

关键词:粗糙集;支持向量机;纳税评估

中圈分类号:TP391.6文献标识码:B

ATaxAssessmentModelBasedon

RoughSetTheoryand

SVMAlgorithms

LIUHart,YUXiao—qing,WANWang—gen,MAXiu—li

(SchoolofCommunicationandInformationEngineering,ShanghaiUniversity,Shanghai200072,China)

ABSTRACT:Taxassessmentis8newmanagementpatternwhich888es嘲thetax

payment

oftaxpayers.Toclassify

whetherthetaxpayerdeclaresnormallyornot,theSVMmachinelearningtheoryiscombinedwithRoughSettheorytofoundataxassessmentmodel.Firstlyindexisselectedfromtaxreturnstobuildanindexsystemoftaxassessment.thenthemug}IsettheoryisusedtoreducetheattributesandSVMisusedtoclassifythetaxpayers.Finallyataxa8.seasmentmodelbasedonroughsettheoryandSVMalgorithmsispropo舱d,whichisapphedtocorporateincometax.Experimentalresultsshowthatthismodel岫舯wellbothindataclassificationaccuracyandpredictiveaccuracy.KEYWORDS:RougIIset;SVM;Taxassessment

1引言

近几年,随着市场经济的不断完善和税收征管改革的逐步深入,纳税评估逐渐出现在我国的税收管理工作中。纳税评估工作是现代征管模式下的一种新的税收征管方式,纳税评估是税务机关通过对纳税人相关数据信息的分析,对纳税人纳税申报的真实性和准确性做出定性和定量判断,并据此采取进一步征管措施的税务管理行为。税务机关通过设置专门的评估机构和专门的人员,进行纳税评估,很好地做好了税源的管理,辅导和校正纳税人不规范的纳税行为,同时也有力地打击了刻意逃税行为。纳税评估一般采用经验判定法、比较法、趋势分析法、结构分析法等方法来对纳税对象进行评估。但是目前,评估人员通过手工操作选取纳税评估

基金项目:国际科技合作基金项目(075107035)、国家自然科学基金项目(60872115)、上海市教委重点学科建设资助项目(J50104)

收稿日期:2008—10—10修回日期:2008~11一11的指标,并根据经验或者简单计算来选择阈值进行纳税评估,缺乏一定的科学性、公正性¨J。数据挖掘技术具有面向海量数据和“自动发现知识”的特点,非常适合税务系统数据和业务模式。因此,将数据挖掘技术和纳税评估系统结合起来,能提高纳税评估系统的智能化,提高纳税评估的效能。

目前国内学者对于纳税评估的研究,主要集中在增值税领域,通过运用ID3.C4.5决策树和关联规则等数据挖掘算法来建屯纳税评估模型的。倪涛¨’在《基于c4.5挖掘算法的纳税评估模型设计》提出通过C4.5挖掘算法计算行业税负率来进行评估。蔡伟鸿¨1利用BP神经网络算法来进行纳税评估。但是从实验结果来看,通过计算行业税负率的方法选取的指标比较单一;神经网络生成的模型虽然分类效果不错,但是在节点构造上花费的时间较长。

基于统计学习理论的支持向量机(SVM)是新近研究机器学习、人工智能领域的一个热点。其在图像、音频中的广泛运用已经证明了在处理高维数据非线性问题上的突出优势。支持向量机算法,与传统的模式识别算法相比,不仅使

—-一253..一

万方数据

相关主题
文本预览
相关文档 最新文档