注册会计师利用KDD技术加强审计抽样风险控制
- 格式:doc
- 大小:42.50 KB
- 文档页数:4
2023注会CPA《审计》点睛提分卷及答案学校:________ 班级:________ 姓名:________ 考号:________一、单选题(25题)1.下列关于应收账款询证函的表述中,正确的是()。
A.询证函应以会计师事务所的名义寄发B.消极式询证函,未收到回函则应重新寄发询证函C.应收账款询证函可以作为催款信函D.注册会计师应严格控制应收账款询证函的收发过程2.注册会计师应当针对评估的财务报表层次重大错报风险确定总体应对措施,下列各项中,不属于总体应对措施的是()。
A.向项目组强调保持职业怀疑的必要性B.在选择拟实施的进一步审计程序时融入更多的不可预见的因素C.在期末而非期中实施更多的审计程序D.增加应收账款函证的数量3.针对舞弊导致的认定层次重大错报风险,下列应对措施中不恰当的是( )。
A.改变拟实施审计程序的性质,以获取更为可靠、相关的审计证据B.改变实质性程序的时间.包括在期末或接近期末实施实质性程序,或针对本期较早时间发生的交易事项或贯穿于本会计期间的交易事项实施测试C.在选择审计程序的性质、时间安排和范围时,增加审计程序的不可预见性D.改变审计程序的范围.包括扩大样本规模、采用更详细的数据实施分析程序等4.下列各项中,不属于审计的固有限制的是()。
A.许多财务报表项目涉及主观决策、评估或一定程度的不确定性,并且可能存在一系列可接受的解释或判断B.审计不是对涉嫌违法行为的官方调查C.注册会计师错误解读了审计结论D.舞弊可能涉及精心策划和蓄意实施进行隐瞒5.下列情况中,注册会计师不得利用内部审计工作的是()。
A.内部审计人员的胜任能力较低B.评价收集的审计证据时涉及较多的判断C.当评估的认定层次重大错报风险较高,需要对识别出的特别风险予以特殊考虑D.内部审计在被审计单位中的地位以及相关政策和程序不足以支持内部审计人员的客观性6.下列审计程序中,不适用于细节测试的是()。
A.函证B.重新执行C.检查D.询问7.下列有关注册会计师评价管理层对被审计单位持续经营能力作出的评估的说法中,错误的是()。
四川省资阳市注册会计审计重点汇总(含答案)学校:________ 班级:________ 姓名:________ 考号:________一、单选题(50题)1.注册会计师在考虑是否在期中实施实质性程序时,下列说法中不恰当的是( )。
A.注册会计师评估的某项认定的重大错报风险越高,越应当考虑将实质性程序集中于期中而非接近期末实施B.如果针对某项认定实施实质性程序的目标仅包括获取该认定的期中审计证据(从而与期末比较),注册会计师应在期中实施实质性程序C.如果实施实质性程序所需信息在期中之后获取并不存在明显困难,则注册会计师一般在期中之后实施实质性程序D.控制环境和其他相关的控制越薄弱,注册会计师越不宜在期中实施实质性程序2.在控制测试中,注册会计师遇到下列与审计抽样相关的事项,其中正确是()。
A.在采用询问的方式进行控制测试时,采用统计抽样比采用非统计抽样更为有效B.如果抽样结果有95%的可信赖程度,则抽样结果有5%的可容忍误差C.对控制测试的结果分析时,应以样本的误差率推断总体误差率,并考虑推断误差对特定审计目标及审计其他方面的影响D.计划评估的控制有效性越高,注册会计师确定的可容忍偏差率通常越低,所需的样本规模就越大3.针对以下比较财务信息的事项,注册会计师考虑在审计报告中增加强调事项段的是()。
A.以前针对上期财务报表发表了非无保留意见,且导致非无保留意见的事项尚未解决,该尚未解决的事项可能对本期数据影响重大B.如果存在错报的上期财务报表(无保留意见)尚未更正,并且没有重新出具审计报告,但对应数据已在本期财务报表中得到适当重述或恰当披露C.针对比较财务报表,认为存在影响上期财务报表的重大错报,而前任注册会计师以前出具了无保留意见的审计报告,如果上期财务报表已经更正,但前任注册会计师可能无法或不愿对上期财务报表重新出具审计报告D.上期发表非无保留意见的事项未解决,但是对本期数据的影响不重大4.2013年1月5日,甲公司为满足不同预期使用者的需求,特委托ABC 会计师事务所同时针对2012年财务报表进行审计和审阅,并出具审计报告和审阅报告,下列归整审计档案的做法中,ABC会计师事务所应当采用的是( )。
2023年注册会计师-审计考试备考题库附带答案第1卷一.全考点押密题库(共50题)1.(单项选择题)(每题 1.00 分) 在下列事项中,注册会计师通常不应与治理层沟通的是()。
A. 管理层不愿意按照要求对被审计单位持续经营能力进行评估B. 注册会计师对应收账款进行函证的样本数量有限而管理层不愿意承担注册会计师未实施足够审计程序的责任C. 在审计报告中拟增加强调事项段D. 重要性的概念正确答案:B,2.(单项选择题)(每题 1.00 分) 下列有关抽样风险的说法中,正确的是()。
A. 注册会计师实施审计抽样时,可以准确地计量和控制抽样风险B. 细节测试中的抽样风险包括误受风险和误拒风险C. 注册会计师可以通过扩大样本规模降低非抽样风险D. 除非注册会计师对总体中所有的项目都实施检查,否则不存在抽样风险正确答案:B,3.(单项选择题)(每题 1.00 分) 下列关于与集团财务报表审计有关的概念的说法中,不正确的是()。
A. 所有组成部分的财务信息均应当包括在集团财务报表中B. 组成部分的财务信息可由集团编制,也可由组成部分管理层编制C. 集团项目组负责制定集团财务报表整体的重要性,组成部分注册会计师负责制定组成部分重要性D. 集团至少拥有一个以上的组成部分正确答案:C,4.(单项选择题)(每题 1.00 分) 注册会计师应当针对评估的由于舞弊导致的财务报表层次重大错报风险确定总体应对措施。
下列各项措施中,错误的是()。
C. 指派更有经验、知识、技能和能力的项目组成员D. 在确定审计程序的性质、时间安排和范围时,增加审计程序的不可预见性正确答案:A,5.(单项选择题)(每题 1.00 分) 在对存货实施监盘程序时,下列做法中,注册会计师不应该选择的是()。
A. 对于已作质押的存货,向债权人函证与被质押存货相关的内容B. 对于受托代存的存货,实施向存货所有权人函证等审计程序C. 对于因性质特殊而无法监盘的存货,实施向顾客或供应商函证等审计程序D. 对受托代存的存货也应纳人盘点范围,但应与被审计单位的存货区分正确答案:D,6.(多项选择题)(每题 1.00 分)下列各项中,注册会计师不会将其记录在审计工作底稿中的有()。
2023(CPA)注册会计师《审计》高频错题(含答案)学校:________ 班级:________ 姓名:________ 考号:________一、单选题(25题)1.下列有关注册会计师使用审计抽样实施控制测试的说法中,错误的是()。
A.使用统计抽样方法,总体偏差率上限略低于可容忍偏差率,则总体不能接受B.当总体偏差率低于可容忍偏差率,注册会计师应当考虑实际的总体偏差率仍有可能大于可容忍偏差率的风险C.样本偏差率就是注册会计师对总体偏差率的最佳估计D.注册会计师通常可以对所有控制测试确定一个统一的可接受信赖过度风险水平,对每一项控制测试分别确定可容忍偏差率2.下列选项中不属于自动控制能够为企业带来的好处的是()。
A.自动控制比较不容易被绕过B.自动信息系统可以提高信息的及时性、准确性并使信息变得容易获取C.自动信息系统可以提高管理层对企业业务活动及相关政策的监督水平D.自动控制可以更有效地应对不常出现的或需要职业判断的业务3.下列情形中,注册会计师可以在内部控制审计报告增加强调事项段予以说明的是()。
A.注册会计师注意到非财务报告内部控制重大缺陷B.注册会计师知悉对基准日内部控制有效性有重大负面影响的期后事项C.被审计单位在基准日前对存在的财务报告内部控制重大缺陷进行了整改,但新控制尚未运行足够长的时间D.法律法规的相关豁免规定允许被审计单位不将某些实体纳入内部控制的评价范围,注册会计师拟不将这些实体纳入内部控制审计的范围4.下列有关注册会计师评估特别风险的说法中,正确的是()。
A.注册会计师应当将具有高度估计不确定性的会计估计评估为存在特别风险B.注册会计师应当将涉及重大管理层判断和重大审计判断的事项评估为存在特别风险C.注册会计师应当将管理层凌驾于控制之上的风险作为特别风险D.注册会计师应当将重大非常规交易评估为存在特别风险5.下列选项中,不属于侵占资产导致的错报的是( )。
A.贪污收到的款项B.盗窃实物资产或无形资产C.使被审计单位对未收到的商品或未接受的劳务付款D.在财务报表中错误表达或故意漏记事项、交易或其他重要信息6.下列关于书面声明的说法中,错误的是()。
第一章单元测试1、单选题:下列关于注册会计师审计的说法中,正确的是()。
选项:A:注册会计师的职业责任在很大程度上反映财务报表使用人的期望,但存在差距B:审计业务的三方关系人分别是注册会计师、被审计单位管理层被审计单位治理层C:注册会计师审计与政府审计的目标和对不同,但是审计的标准相同D:审计业务提供绝对保证,审阅业务提供合理保证答案:【注册会计师的职业责任在很大程度上反映财务报表使用人的期望,但存在差距】2、单选题:为了适应产品的更新换代需要,X公司已支付大额资金引进全新的生产线代替原有设备,对新老设备进行实物检查后,注册会计师可能最需要关注()的重错报风险。
选项:A:固定资产的存在B:固定资产的准确性、计价和分摊C:应付账款的完整性D:营业成本的准确性答案:【固定资产的准确性、计价和分摊】3、单选题:甲公司由于市场竞争对手推出新产品,现有产品因滞销而导致大量积压,据此,注册会计师最应当关注甲公司()的重大错报风险。
选项:A:应收账款的完整性认定B:营业收入项目的发生认定C:存货项目的准确性、计价和分摊认定D:营业成本项目的准确性认定答案:【存货项目的准确性、计价和分摊认定】4、多选题:关于注册会计师执行财务报表审计工作的总体目标,下列说法中,正确的有()。
选项:A:对财务报表整体是否不存在重大错报获取合理保证,使得注册会计师能够对财务报表是否在所有重大方面按照适用的财务报告编制基础编制发表审计意见B:对被审计单位内部控制是否存在值得关注的缺陷提供合理保证C:按照审计准则的规定,根据审计结果对财务报表出具审计报告,并与管理层和治理层沟通D:对被审计单位的持续经营能力提供合理保证答案:【对财务报表整体是否不存在重大错报获取合理保证,使得注册会计师能够对财务报表是否在所有重大方面按照适用的财务报告编制基础编制发表审计意见;按照审计准则的规定,根据审计结果对财务报表出具审计报告,并与管理层和治理层沟通】5、多选题:如果蓝天公司财务报表日资产负债表中存货项目期末显示的1000万元,根据对认定的理解,以下表述中,恰当的有()。
第八章审计抽样一、单项选择题1、在采用统计抽样进行控制测试时,注册会计师应当在推断的总体误差与可容忍误差进行比较,并根据比较结果确定是否接受所测试的内部控制总体。
以下与此相关的说法中,正确的是()。
A.如果总体偏差率低于可容忍偏差率,可以接受总体B.如果估计的总体偏差率上限等于可容忍偏差率,则样本结果不支持计划的重大风险错报水平C.如果总体偏差率远低于可容忍偏差率,可以接受总体D.如果估计的总体偏差率上限低于且很接近于可容忍偏差率,则样本结果支持了计划的重大风险错报水平2、可容忍误差在控制测试中表现为可容忍偏差率,注册会计师在确定可容忍偏差率时,主要考虑的因素是()。
A.重大错报风险的初步评估水平B.对被审单位及其环境的了解程度C.计划估计的控制有效性D.控制风险的高低3、注册会计师在控制测试中使用统计抽样,估计的总体偏差率上限低于但接近可容忍偏差率,则其应得出的结论和采取的措施为()。
A.注册会计师应确认总体可接受,不用采取任何措施B.注册会计师应确认总体不可接受,并修正重大错报风险评估水平,增加实质性程序的数量C.注册会计师应确认总体不可接受,并对影响重大错报风险评估水平的其他控制进行测试,以支持计划的重大错报风险评估水平D.注册会计师应当结合其他审计程序的结果,考虑是否接受总体,并考虑是否需要扩大测试范围4、X注册会计师在对Y公司主营业务收入进行测试的同时,一并对应收账款进行了测试。
假定Y公司2009年12月31日应收账款明细账显示其有2 000户顾客,账面余额为10 0 00万元。
X注册会计师拟通过抽样函证应收账款账面余额,抽取130个样本。
样本账户账面余额为500万元,审定后认定的余额为450万元。
根据样本结果采用差额估计抽样法推断应收账款的总体余额为()万元。
A.-769.23B.9 230.76C.6 923.08D.8 2005、A注册会计师在利用差额估计抽样审查甲公司的应收账款时,采用随机抽样方法从300笔业务构成的应收账款总体中抽取了50笔业务进行逐笔审查。
2023年(CPA)注会考试《审计》模拟试题及答案学校:________ 班级:________ 姓名:________ 考号:________一、单选题(25题)1.下列有关抽样风险的说法中,错误的是()。
A.控制测试中的抽样风险包括信赖过度风险和信赖不足风险B.细节测试中的抽样风险包括误受风险和误拒风险C.信赖过度风险和误拒风险影响审计效果D.无论是控制测试还是细节测试,注册会计师都可以通过扩大样本规模降低抽样风险2.注册会计师在控制测试中使用统计抽样,估计的总体偏差率上限低于但接近可容忍偏差率,则其应得出的结论和采取的措施为()。
A.注册会计师应确认总体可接受,不用采取任何措施B.注册会计师应确认总体不可接受,并修正重大错报风险评估水平,增加实质性程序的数量C.注册会计师应确认总体不可接受,并对影响重大错报风险评估水平的其他控制进行测试,以支持计划的重大错报风险评估水平D.注册会计师应当结合其他审计程序的结果,考虑是否接受总体,并考虑是否需要扩大测试范围3.下列关于信息技术一般控制、应用控制与公司层面控制三者之间的关系的说法,错误的是( )。
A.公司层面信息技术控制决定了信息技术一般控制和信息技术应用控制的风险基调B.信息技术一般控制的有效与否会直接关系到信息技术应用控制的有效性是否能够信任C.信息技术一般控制是基础D.信息技术一般控制决定信息技术应用控制的风险基调4.下列有关审计证据的充分性和适当性的说法中,错误的是()。
A.审计证据的充分性和适当性分别是对审计证据数量和质量的衡量B.审计证据的充分性会影响审计证据的适当性C.只有充分且适当的审计证据才有证明力D.审计证据的适当性会影响审计证据的充分性5.下列各项中,不属于审计要素的是()。
A.审计报告B.审计业务约定书C.审计证据D.审计业务的三方关系人6.下列关于信息技术一般控制和应用控制的说法中,错误的是()。
A.信息技术一般控制通常对实现部分或全部财务报表认定作出间接贡献B.信息技术一般控制是基础,其有效与否直接关系到信息技术应用控制的有效性C.有效的信息技术一般控制确保了应用系统控制和依赖计算机处理的自动会计程序得以持续有效地运行D.信息技术一般控制一般要经过输入、处理及输出等环节7.下列各项因素中,注册会计师在确定明显微小错报的临界值时通常无需考虑的是()A.以前年度审计中识别出的错报的数量和金额B.财务报表使用者的经济决策受错报影响的程度C.财务指标是否勉强达到监管机构的要求D.治理层和管理层对注册会计师与其沟通错报的期望8.在内部控制审计中,注册会计师识别重要账户、列报及其相关认定的相关说法中,错误的是()。
2023年注会全国统一考试(CPA)《审计》高频错题练习(含答案)学校:________ 班级:________ 姓名:________ 考号:________一、单选题(25题)1.下列有关控制环境的说法中,错误的是()。
A.控制环境中存在的弱点可能削弱控制的有效性B.有效的控制环境能够保证注册会计师在以前年度和期中所测试的控制将继续有效运行C.在对控制环境进行了解时不采用穿行测试D.注册会计师在进行风险评估时,如果认为被审计单位控制环境薄弱,则很难认定某一流程的控制是有效的2.下面关于分析程序的说法中,错误的是()。
A.在风险评估程序中,必须实施分析程序B.实质性分析程序是细节测试的一种补充,注册会计师仅依靠实质性分析程序难以获取充分、适当的审计证据C.针对同一认定可以结合使用细节测试和实质性分析程序D.分析程序,是指注册会计师通过分析不同财务数据之间以及财务数据与非财务数据之间的内在关系,对财务信息作出评价3.下列选项中,不用于衡量职业判断质量的是()。
A.职业判断的复杂性B.职业判断的意见一致性C.职业判断的决策一贯性D.职业判断的可辩护性4.下列有关分析程序用作风险评估程序的说法中,错误的是()。
A.分析程序用作风险评估程序时,使用的数据汇总性比较强,分析的对象主要是账户余额及其相互之间的关系B.在风险评估中运用分析程序是强制要求C.当分析程序用于风险评估时,应重点关注关键的账户余额、趋势和财务比率等方面D.注册会计师需要在了解被审计单位及其环境的每一方面都实施分析程序5.下列各项中,不属于内部控制要素的是()。
A.控制环境B.风险评估过程C.特别风险D.控制活动6.下列各项要素中,不属于控制环境的是()。
A.对诚信和道德价值观念的沟通与落实B.对胜任能力的重视C.业绩评价D.人力资源政策与实务7.下列关于风险评估的说法中,错误的是()。
A. 财务报表层次的重大错报风险很可能源于薄弱的控制环境B.在判断哪些风险是特别风险时,注册会计师应当考虑控制的抵销和遏制作用C.注册会计师应将识别出的风险与认定层次可能发生错报的领域相联系D.在评估重大错报风险时,注册会计师应将所了解的控制与特定认定相联系8.下列各项中,属于具体审计计划的是()A.确定重要性水平B.确定审计资源的规划与调配C.签订审计业务约定书D.确定风险评估程序的性质、时间安排和范围9.甲公司存在的下列各项错报中,导致营业收入违反发生认定的是()。
2023年度(CPA)注册会计师全国统一考试《审计》高频考题汇编(含答案) 学校:________ 班级:________ 姓名:________ 考号:________一、单选题(25题)1.下列有关注册会计师在内部控制审计中选择拟测试的控制的说法中,错误的是()。
A.在采用自上而下的方法执行内部控制审计时,如果识别并选取了能够充分应对重大错报风险的控制,则不需要再测试针对同样认定的其他控制B.注册会计师应当选择测试对形成内部控制审计意见有重大影响的控制C.注册会计师应当针对每一相关认定获取控制有效性的审计证据,并对单项控制的有效性发表意见D.注册会计师在选取拟测试的控制时,通常不会选取整个流程中的所有控制,而是选择关键控制2.下列选项中,不属于侵占资产导致的错报的是( )。
A.贪污收到的款项B.盗窃实物资产或无形资产C.使被审计单位对未收到的商品或未接受的劳务付款D.在财务报表中错误表达或故意漏记事项、交易或其他重要信息3.下列各项中,不属于评价专家工作恰当性的内容是()。
A.专家的工作结果与其他审计证据的一致性B.评价专家工作涉及使用的重要的假设和方法的相关性和合理性C.评价专家的工作结果或结论的相关性和合理性D.提请管理层评价专家涉及使用的重要原始数据的相关性、完整性和准确性4.下列有关注册会计师实施分析程序的目的的说法中,错误的是()。
A.用作风险评估程序B.用作控制测试C.用作实质性程序D.用作临近审计结束时对财务报表进行的总体复核5.下列各项中,通常不用于审计抽样的是()。
A.整群选样B.系统选样C.简单随机选样D.随意选样6.下列选项中,属于鉴证业务的是()。
A.税务咨询B.财务报表审阅C.内部审计服务D.招聘服务7.下列与内部控制有关的审计工作中,通常可以使用审计抽样的是()。
A.评价内部控制设计的合理性B.测试自动化应用控制的运行有效性C.确定控制是否得到执行D.测试留下运行轨迹的人工控制的运行有效性8.下列各项中,不属于检查性控制的是()。
2023(CPA)注会全国统一考试《审计》点睛提分卷(含答案)学校:________ 班级:________ 姓名:________ 考号:________一、单选题(25题)1.下列有关控制环境的说法中,错误的是()。
A.控制环境中存在的弱点可能削弱控制的有效性B.有效的控制环境能够保证注册会计师在以前年度和期中所测试的控制将继续有效运行C.在对控制环境进行了解时不采用穿行测试D.注册会计师在进行风险评估时,如果认为被审计单位控制环境薄弱,则很难认定某一流程的控制是有效的2.以下审计证据中,与应付账款完整性认定相关性最高的是()。
A.连续编号的订购单B.供应商对账单C.连续编号的验收单D.供应商发票3.在确定审计证据相关性时,注册会计师无需考虑的是()。
A.针对同一项认定可以从不同来源获取审计证据或获取不同性质的审计证据B.直接获取的审计证据比推论得出的审计证据更可靠C.只与特定认定相关的审计证据并不能替代与其他认定相关的审计证据D.特定的审计程序可能只为某些认定提供相关的审计证据,而与其他认定无关4.在审计集团财务报表时,下列工作类型中,不适用于可能存在导致集团财务报表发生重大错报的特别风险的重要组成部分的是()。
A.对组成部分财务信息实施审计B.对组成部分财务信息实施审阅C.对可能导致集团财务报表发生重大错报的特别风险实施特定的审计程序D.针对与可能导致集团财务报表发生重大错报的特别风险相关的一个或多个账户余额、一类或多类交易或披露事项实施审计5.下列各项中,通常不用于审计抽样的是()。
A.整群选样B.系统选样C.简单随机选样D.随意选样6.下列各项中,属于检查性控制的是()。
A.计算机程序自动生成收货报告,同时也更新采购档案B.对仓库发货所采用的出库凭证连续编号C.销售发票上的单价根据价格清单上的信息确定D.每季度复核应收账款贷方余额并找出原因7.下列各项中,不属于在审计工作底稿归档期间的事务性变动的是()。
注册会计师利用KDD技术加强审计抽样风险控制KDD是指数据库中的知识发现(Knowledge Discovery Database),也称为数据
挖掘技术,是一种特定应用的数据分析过程,它可以从包含大量冗余信息的数据中提取尽可能多的隐藏知识,从而为做出正确的判断提供基础。
KDD的定义简单地说,数据挖掘是从大量数据中提取或“挖掘”知识。
也有许多学者将数据库中的知识发现或KDD视为数据挖掘的同义词,还有许多类似的术语,如知识提取、数据模式分析、数据捞取等。
[1]本文采用关于数据挖掘的广义的观点:数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据中发现和提取有趣知识的过程,且数据挖掘是知识发现过程的一个步骤
审计风险是指审计组织或审计人员在审计过程中由于受到某些不确定因素的影响,而使审计结论与客观事实发生背离,从而受有关关系人指控并遭受某种损失的可能性。
审计抽样风险是指注册会计师依据抽样结果得出的结论与审计对象总体特征不相符合的可能性。
抽样风险与样本量成反比,样本量越大抽样风险越低。
数据挖掘技术在国民经济其他行业已有成功的应用,但在审计风险控制与管理中的应用尚不多见,在注册会计师行业更是不多见。
本文提出了一种有效的控制抽样风险的方法,该方法充分利用数据库技术的最新成果,将数据挖掘技术中的分类、聚类及离群点挖掘等应用到审计风险管理中去。
运用这种方法不仅能减轻CPA的负担,而且还能提高审计风险控制的水平。
一、KDD技术的分类
数据挖掘是数据库研究中的一个极富应用前景的新领域。
对于数据挖掘,可做出不同的分类模式:(一)依据所挖掘的数据库的种类进行分类。
若挖掘系统从关系数据库中发现知识,则相应系统为关系数据挖掘系统。
其它数据库系统如面向对象的数据库、演绎型数据库、空间数据库、时间数据库、多媒体数据库、异质数据库、主动数据库、遗留数据库和互联网信息库均可作为挖掘系统挖掘的对象。
(二)依据挖掘知识的种类进行分类。
数据挖掘系统可以发现几种典型的知识,包括关联规则、特征规则、分类规则、聚类规则、离群数据挖掘、数据总结、偏差分析、序列模式分析、趋势分析、回归分析等。
(三)依据采用的技术进行分类。
常用的数据挖掘技术主要有人工神经网络、遗传算法、决策树方法、邻近搜索、规则归纳、方法等。
二、关联规则的挖掘
关联规则的挖掘是数据挖掘领域中一个非常重要的研究课题,关联规则的挖掘问题可形式化描述如下:设I={I1,I2,…,Im}是由m个不同的项目组成的集合,给定一个事务数据库D,其中的每一个事务T是I中一组项目的集合,即TI,T有唯一的标识符TID。
一条关联规则就是一个形如XY的蕴含式,其中,XI,YI,X∩Y=Φ。
关联规则XY成立的条件是:1、它具有支持度s,即事务数据库D中至少有s%的事务包含X∪Y;2、它具有置信度c,即在事务数据库D所包含X的事务中,至少有c%的事务同时也包含Y,关联规则的挖掘问题就是在事务数据库D中找出具有用户给定的最小支持度Smin和最小置信度Cmin的关联规则。
挖掘关联规则可以分解为以下两个子问题:1、找出事务数据库中的所有大项集,大项集是指支持度不小于用户给定的最小支持度的项集。
2、利用大项集生成关联规则。
目前大多数研究均集中在第1个子问题上,因为这个问题的主要挑战性在于数据量巨大,所以算法的效率是关键。
三、特征规则的挖掘
在数据库的原始概念层,数据和对象往往包含很详细的信息。
人们希望能将大数据集中的数据进行总结概括,并将其在更高的概念层次上呈现出来。
如:经销商们可能希望对一些销售活动中的交易集合进行概括、总结从而得到更一般性的描述。
这就要求数据挖掘系统具有数据概括的功能。
数据概括是将数据库中的大量相关数据从较低概念层次抽象为较高层次的过程。
通常有两种方法可以有效地进行数据概括:1、数据立方体法;2、面向属性的归纳方法。
四、分类规则的挖掘
数据分类是指在数据库的各个对象中找出共同特性,并按照一定的分类模型对它们进行分类。
为了构建这样的一个分类模型,需要一个样本数据库E作为训练集,E中的每一个元组与大型数据库W中的元组包含着同样的属性集,并且每一个元组有一个已知的类标识。
分类的目标是首先分析训练集数据,利用数据的可用特征为每个类建立一个精确的描述或模型,然后把这些模型用作对数据库W中其它数据进行分类或建立一个更好的描述,即分类规则。
常用的分类方法有基于决策树的分类方法、统计方法、粗集方法等。
五、聚类规则的挖掘
聚类是数理统计中研究“物以类聚”的一种方法,它的任务是把一组个体按照相似性归成若干类,其目的是使得属于同一个类别数据之间的相似性尽可能大,而不同类别的数据之间的相似性尽可能小。
它与分类分析不同,聚类分析输入的是一组未分类的记录,并且这些记录应分成几类事先也不知道。
聚类分析就是首先通过分析数据库中的数据,合理地划分记录,然后再确定每个记录所在类别。
在统计方法中,聚类算法一般分为基于概率的聚类算法和基于距离的聚类算法两种,如欧氏距离等。
基于概率的聚类算法在挖掘海量数据集合时效率非常低;而基于距离的聚类算法在数据挖掘领域应用则相当广泛,而且其基本思想是属于同一类别的个体之间的距离尽可能小,而不同类别上的个体间距离尽可能大。
六、KDD技术在审计风险管理中的应用
审计风险管理是人们对审计风险进行识别、估计、衡量、控制等一系列具有系统性、规范性的方法和手段的总称。
审计风险管理是一个连续的过程,为了便于分析,我们可以将其分为三个阶段:即审计风险识别、审计风险评价与估计、审计风险处理。
这三个阶段有着内在的逻辑联系,详见图1所示。
审计风险识别有两大任务:一是判明审计活动中存在什么风险;二是找出引起这些风险的原因。
这两点实际上是结合在一起的。
审计人员判明了审计活动中存在什么风险,也就意味着在一定程度上找出引起这些风险的原因。
审计风险识别是审计风险管理的第一阶段,正确识别审计风险将为成功的风险管理奠定基础。
审计风险评估是在风险识别的基础上,通过对收集到的大量信息加以分析,运用概率论和数理统计的方法来评估风险因素发生的概率和风险发生的程度,然后根据企业的可接受风险的标准去判断风险。
审计风险管理是在识别和评估风险之后,针对不同类型、不同概率和规模的风险,采取相应的措施或方法,使审计风险减少到最小程度。
综上所述,我们可以得到如下五条选择审计样本的策略:1、由分类或聚类规则算法将所有证据分成若干类,并且为每个等价类规定一个唯一的编号;2、在每一个等价类中,选择一个或多个样本进行重点分析;3、由聚类规则算法确定离群数据;4、对离群数据进行重点分析;5、采用其它方法进行补充。