数据式审计常用的数据分析方法
- 格式:docx
- 大小:25.81 KB
- 文档页数:8
审计师工作中的数据分析与数据处理数据分析和数据处理是审计师工作中非常重要的环节。
通过对数据的分析和处理,审计师可以获取准确可靠的信息,帮助其进行风险评估、发现潜在问题并提供有效建议。
本文将探讨审计师工作中数据分析与数据处理的方法和技巧。
一、数据分析数据分析是审计师进行工作的基础。
通过对客户的数据进行分析,审计师能够识别潜在的风险和异常情况,并帮助其确定审计重点。
以下是一些常用的数据分析方法:1. 比率分析:审计师可以通过计算各种比率来评估企业的财务状况。
比如,利润率、负债比率和存货周转率等。
比率分析可以帮助审计师了解企业的盈利能力、偿债能力和经营效率。
2. 趋势分析:审计师可以通过对历史数据的分析来识别出企业的发展趋势。
这有助于审计师了解企业的长期表现,并预测未来的发展方向。
3. 异常分析:审计师可以通过比较数据的异常情况来识别潜在的错误或欺诈。
例如,如果某个账户的交易量与其他账户相比异常高或异常低,那就可能存在问题。
4. 数据挖掘:在大数据时代,审计师可以利用数据挖掘技术来识别隐藏在大量数据中的信息。
例如,通过文本挖掘技术可以分析客户的合同、协议等文本,帮助审计师了解潜在的法律风险。
二、数据处理数据处理是指对采集到的数据进行整理、清洗和加工,以便于审计师进行后续的分析和使用。
以下是一些常用的数据处理方法:1. 数据清洗:在数据处理的过程中,审计师需要对数据进行清洗,去除重复、无效或错误的数据。
这可以提高数据的准确性和可靠性。
2. 数据转换:审计师可能需要对数据进行转换,以便于进行分析和比较。
例如,将货币金额转换为统一的货币单位。
3. 数据归档:为了方便审计师的后续使用,数据应该进行归档和备份。
这样可以保证数据的安全性和可追溯性。
4. 数据可视化:通过数据可视化工具,审计师可以将分析结果以图表形式展示,帮助他们更好地理解和传达数据。
这种可视化的方式对于解释复杂数据分析结果非常有帮助。
总结数据分析和数据处理在审计师工作中起着重要的作用。
数据式审计常用的数据分析方法数据分析是在数据式审计中广泛使用的一种技术,它通过对大量的数据进行收集、整理和分析,从中提取出有价值的信息和洞察力,帮助审计师更好地了解被审计主体的经营情况和财务状况。
本文将介绍几种常用的数据分析方法,以帮助审计师更加高效地进行数据式审计。
1. 趋势分析趋势分析是一种基于数据的分析方法,它通过比较不同时间点的数据,揭示出数据的发展趋势和周期性变化。
在数据式审计中,趋势分析可以帮助审计师了解被审计主体在一段时间内的变化情况,发现数据的异常波动和潜在的风险因素。
审计师可以使用Excel等数据分析工具来进行趋势分析,通过绘制折线图或柱状图来展示数据的变化趋势。
2. 比较分析比较分析是一种通过比较不同数据之间的差异,揭示出数据的相对优劣和潜在问题的分析方法。
在数据式审计中,比较分析可以用来比较不同被审计主体之间的数据,或者比较被审计主体的数据与行业标准或预期值之间的差异。
审计师可以使用Excel等数据分析工具进行比较分析,通过制作条形图或扇形图来可视化比较结果,帮助发现数据的特征和异常情况。
3. 环比分析环比分析是指将当前时间段的数据与上一个时间段的数据进行比较,揭示出数据的变化趋势和增长率的分析方法。
在数据式审计中,环比分析常用于分析被审计主体在不同周期内的数据变化情况,比如比较当前月份的销售额与上个月份的销售额的变化情况。
审计师可以使用Excel等数据分析工具进行环比分析,通过制作折线图或柱状图来展示数据的变化趋势,更好地了解被审计主体的经营动态。
4. 异常检测异常检测是一种通过对数据进行统计分析,发现不符合正常模式或预期范围的数据点的分析方法。
在数据式审计中,异常检测可以帮助审计师发现被审计主体的数据中可能存在的异常情况或潜在的风险因素。
审计师可以使用统计学方法或机器学习算法进行异常检测,通过数据可视化或模型预测来辅助判断是否存在异常数据。
5. 关联分析关联分析是一种通过寻找数据之间的关联关系,揭示出数据之间的相互依赖和相关性的分析方法。
审计师行业工作中的数据分析方法与工具在审计师行业的工作中,数据分析方法和工具起着至关重要的作用。
随着数字化时代的发展,数据分析已经成为审计师进行有效和准确审计的必备技能。
本文将探讨在审计师行业工作中常用的数据分析方法和工具。
一、数据分析方法1. 抽样法抽样法是审计师在进行大规模数据分析时常用的方法。
通过抽取样本数据并进行分析,可以为审计师提供对总体数据的了解。
常用的抽样方法包括随机抽样、系统抽样和目标抽样等。
2. 比较法比较法是审计师用来进行数据分析的常见方法之一。
通过对比不同时间段、不同企业或不同部门的数据,审计师可以发现潜在的风险和异常情况。
比较法的一种常见形式是趋势分析,利用时间序列数据进行比较和分析,以便更好地了解企业的经营情况。
3. 比率和比例分析审计师经常使用比率和比例分析来评估企业的财务状况和业务绩效。
比率和比例分析可以帮助审计师了解企业的盈利能力、偿债能力、运营效率等方面的情况。
常见的比率和比例包括资产负债率、营业利润率、存货周转率等。
4. 帕累托分析帕累托分析可以帮助审计师确定重要的问题和风险。
审计师可以通过该方法识别出导致绝大部分问题的关键因素,进而有针对性地进行数据采集和分析。
帕累托分析以其简单性和实用性而受到广泛应用。
二、数据分析工具1. 电子表格软件电子表格软件如Excel是审计师最常用的工具之一。
通过Excel等电子表格软件,审计师可以对数据进行排序、筛选、计算和可视化等处理。
此外,电子表格软件还提供了各种函数和宏,方便审计师进行数据分析和处理。
2. 数据挖掘工具数据挖掘工具可以帮助审计师从大规模数据中发现隐藏的信息和模式。
这些工具可以对数据进行聚类、分类、关联规则挖掘等分析。
常见的数据挖掘工具包括RapidMiner、KNIME和Weka等。
3. 数据可视化工具数据可视化工具如Tableau和Power BI等能够将数据以图表、仪表盘等形式进行可视化。
通过数据可视化,审计师可以更直观地呈现分析结果,发现数据中的趋势和异常情况。
内部审计数据分析模板(通用版)1. 背景内部审计是组织中保持有效运营和风险管理的关键部分。
数据分析在内部审计中发挥着重要的作用,通过对大量数据进行收集、处理和分析,可以帮助识别潜在的问题和机会。
为了提高数据分析工作的效率和一致性,我们在此提供了一个通用的内部审计数据分析模板。
2. 数据收集与整理2.1 数据源数据源是进行数据分析的基础,因此需要确定可靠、完整的数据源。
在收集数据时,要确保数据的准确性和一致性。
2.2 数据提取和导入数据提取和导入是将数据从源系统导入到分析工具中的过程。
需要选择合适的工具和方法,确保数据的完整性和准确性。
2.3 数据清洗和转换数据清洗和转换是为了使数据符合分析的要求。
在清洗数据时,需要处理缺失值、异常值以及重复数据。
在转换数据时,可以进行数据格式的调整和变量的衍生。
3. 数据分析方法3.1 描述性统计分析描述性统计分析用于对数据进行总结和描述,帮助了解数据的基本特征。
常用的描述性统计指标包括均值、中位数、标准差等。
3.2 关联分析关联分析用于发现数据中的相关关系。
通过计算不同变量之间的相关系数或建立关联规则,可以找出潜在的关联关系。
3.3 趋势分析趋势分析用于分析数据的变化趋势。
通过绘制趋势图或计算趋势指标,可以了解数据的发展方向和变化幅度。
3.4 异常检测异常检测用于发现数据中的异常值或异常模式。
通过统计方法或机器研究算法,可以辨别出与正常数据不符的异常情况。
4. 分析结果呈现和解释4.1 可视化呈现通过图表、图形和仪表板等方式,将分析结果以直观的形式展示出来。
可视化能够使数据更易于理解和分析。
4.2 结果解释和报告对分析结果进行解释,并编写相应的报告。
在解释结果时,要注明分析方法和数据限制,以提高结果的可信度和合理性。
5. 结论和建议基于数据分析的结果,总结出结论,并提出相应的建议。
结论和建议应该是清晰、具体和可行的,有助于组织进行决策和改进。
以上是内部审计数据分析模板的概要内容,根据具体情况,可以进一步扩展和调整。
审计数据的分析可分为三个层次:即以审计专家经验和常规审计分析技术为基础的审计,以审计分析模型和多维数据分析技术为基础的审计,以数据挖掘技术为基础的审计。
第一个层次表现为用户对数据库中的记录进行访问和查询,可通过SQL 等语言来交互式地描述查询要求,或者根据查询需求采用开辟工具定制查询软件,实现的是查询型分析;第二个层次是用户先提出自己的假设,然后利用各种工具通过反复的、递归的检索查询,以验证或者否定自己的假设,从用户的观点来看,他们是在从数据中发现事实,于是实现的是验证型分析;第三个层次是指用户从大量数据中发现数据模式,预测趋势和行为的数据分析模式,它能挖掘数据间潜在的模式,发现用户可能忽略的信息,并为审计人员做出前瞻性的、基于知识的决策提供匡助,于是实现的是验证型分析。
可见,前两个层次是基于现有的审计知识,这构成为了智能审计的基础;第三个层次是通过主动挖掘潜在的审计知识,这是智能审计的核心。
(一) 合规分析方法。
合规分析法就是用审计软件的会计核算部份,根据会计准则和被审计单位业务处理逻辑的数据处理要求,检查是否有账证不符、账账不符、账表不符、表表不符的情况;账户对应关系是否正常;是否存在非正常挂账、非正常调账现象;账户余额方向是否存在异常;是否有违背被审计单位业务处理逻辑的情况等。
(二) 趋势分析方法。
趋势分析法是指审计人员将被审计单位若干期相关数据进行比较和分析,从中找出规律或者发现异常变动的方法。
它是审计人员利用少量时间点上或者期间的经济数据来进行比较分析的特殊时间序列法,此法有助于审计人员从宏观上把握实务的发展规律。
审计人员可根据审计需要来确定时间序列的粒度,如年、季、月、旬、日等。
(三)结构分析方法。
结构分析法也叫比重分析法,是通过计算各个组成部份占总体的比重来揭示总体的结构关系和各个构成项目的相对重要程度,从而确定重点构成项目,提示进一步分析的方向。
结构分析法和趋势分析法还可结合应用,进行数据结构比例在若干期间的变动趋势分析。
数据式审计常用的数据分析方法在当今数字化时代,数据式审计已成为审计工作的重要手段。
而在数据式审计中,数据分析方法的选择和应用直接关系到审计的效率和效果。
下面,让我们一起来了解一些常用的数据式审计数据分析方法。
一、数据查询与筛选这是最基础也是最常用的方法之一。
审计人员可以通过数据库管理系统(如 SQL)或数据分析工具,根据特定的条件对数据进行查询和筛选。
例如,查找某一时间段内的交易记录、筛选出金额超过特定阈值的业务等。
通过这种方法,可以快速缩小数据范围,聚焦于关键信息。
二、数据汇总与统计对数据进行汇总和统计能够帮助审计人员了解总体情况和趋势。
常见的统计方法包括求和、平均值、计数、最大值、最小值等。
比如,计算某个部门在一定时期内的费用总和,或者统计某类业务的发生次数。
通过这些统计结果,可以与预期或标准进行对比,发现异常情况。
三、数据关联与整合在实际的业务中,数据往往分散在不同的系统或表格中。
通过数据关联和整合,可以将相关的数据集中起来进行分析。
例如,将销售数据与库存数据关联,以了解销售对库存的影响;或者将员工信息与绩效数据整合,分析员工绩效与个人特征之间的关系。
四、趋势分析观察数据随时间的变化趋势,有助于发现潜在的问题或风险。
可以通过折线图、柱状图等图表形式直观地展示数据的趋势。
比如,分析营业收入的月度或年度变化趋势,判断业务的增长或衰退情况;或者观察成本费用的趋势,看是否存在不合理的波动。
五、比较分析将不同的数据集、时间段或业务单元进行比较,能够突出差异和异常。
可以是同一企业不同时期的比较,也可以是不同企业之间的横向比较。
例如,比较两个分公司的销售业绩,找出业绩差异较大的原因;或者对比今年和去年的财务指标,评估企业的发展状况。
六、异常检测通过设定合理的阈值或运用统计模型,识别出数据中的异常值。
这些异常值可能暗示着错误、欺诈或其他需要关注的问题。
例如,在销售数据中,如果某个客户的购买行为与其他客户明显不同,就需要进一步调查其原因。
审计师行业工作中的数据分析方法与工具一、引言数据分析在现代审计师的工作中起着至关重要的作用。
随着科技的发展和大数据时代的到来,传统的审计方法已逐渐不能满足审计师对数据处理和分析的需求。
因此,本文将探讨审计师行业工作中的数据分析方法与工具,主要包括数据收集、数据清洗、数据可视化和数据挖掘。
二、数据收集审计师在进行数据分析前,首先需要收集各项审计对象的数据。
这些数据可以来自于会计师事务所、审计对象以及外部数据提供者。
在数据收集过程中,审计师需要确保数据的准确性和完整性,以便为后续的数据分析工作奠定基础。
常用的数据收集方法包括数据提取、数据下载以及数据导入。
在数据提取过程中,审计师可以利用SQL查询语言从数据库中获取所需数据,也可以通过API接口从其他软件或平台获取数据。
三、数据清洗数据清洗是数据分析过程中不可缺少的一步。
由于数据源的多样性和数据质量的不确定性,数据中常常存在着噪声、缺失值和异常值等问题。
为了确保数据分析的准确性和可靠性,审计师需要对数据进行清洗处理。
常见的数据清洗方法包括去重、填充缺失值、删除异常值、处理重复数据以及筛选合适的数据样本。
此外,审计师还可以利用数据转换和数据归一化等技术手段,使原始数据变得更加规范和易于分析。
四、数据可视化数据可视化是审计师进行数据分析的重要方式之一。
通过将数据以图表、报表和图像等形式展示出来,审计师可以更加直观地理解和分析数据。
数据可视化还能够帮助审计师发现数据中的模式、趋势和异常情况,为审计工作提供更加全面和深入的视角。
在数据可视化方面,审计师可以利用各类图表工具如柱状图、折线图、饼状图等来展示数据,也可以运用仪表盘和大屏展示等方式,实时监控和分析数据。
五、数据挖掘数据挖掘是将数据分析和统计技术应用于大规模数据集中,以发现其中潜在的、有价值的信息和知识。
对于审计师而言,数据挖掘技术有助于发现潜在的经济犯罪行为、异常交易、虚假财务报表等不正常的现象。
常用的数据挖掘方法包括聚类分析、关联规则挖掘、异常检测以及时间序列分析等。
审计行业的数据分析与方法数据分析在现代审计行业中扮演着至关重要的角色,不仅可以提高审计效率和准确性,还可以发现潜在的内部控制问题和业务风险。
本文将介绍审计行业中常用的数据分析方法,并讨论其在提升审计质量和效果方面的应用。
一、数据分析方法概述数据分析方法是指在审计过程中应用数据科学技术来处理和分析大量数据,以识别异常、发现风险,从而为审计师提供必要的证据和信息。
常用的数据分析方法包括统计分析、比对分析、异常检测、主观评估等。
1. 统计分析统计分析是最常用的数据分析方法之一,通过对数据集进行统计计算和图表展示,可以帮助审计师理解数据的分布情况和趋势变化。
例如,利用统计分析方法可以计算财务报表中的各项指标的平均值、标准差、极值等,从而了解财务数据是否存在异常情况。
2. 比对分析比对分析是将不同数据源的数据进行对比和核对,以发现其中的差异和异常情况。
审计师可以将企业的财务数据与行业平均水平、历史数据进行比对,以判断企业的财务状况是否正常。
此外,还可以将财务数据与非财务数据进行比对,发现潜在的内部控制问题和风险。
3. 异常检测异常检测方法可以通过比较数据的实际值和预期值来判断是否存在异常情况。
审计师可以利用各种统计模型和算法来识别数据中的离群点和异常值,从而发现潜在的财务风险和问题。
例如,通过对销售数据进行异常检测,可以发现销售额大幅度波动、营业额与库存不匹配等问题。
4. 主观评估主观评估方法是根据审计师的经验和专业知识,对数据进行综合分析和评估。
在进行主观评估时,审计师可以考虑各种可能因素,并根据判断来确定问题的严重程度和后续处理措施。
主观评估方法在审计行业中具有重要的意义,可以补充其他数据分析方法的不足。
二、数据分析在审计行业中的应用数据分析在审计行业中的应用非常广泛,可以涵盖财务审计、内部审计、合规审计等多个领域。
以下是数据分析在审计行业中的典型应用案例。
1. 财务数据分析利用数据分析方法可以对企业的财务数据进行全面和深入的分析,了解财务状况和运营情况。
审计师如何进行审计工作的数据分析数据分析在审计工作中扮演着重要的角色,它帮助审计师识别潜在的风险和问题,并提供有力的证据来支持审计结论。
本文将介绍审计师在进行数据分析时应采取的步骤和技巧。
一、确定审计目标和数据需求在进行数据分析之前,审计师需要明确审计目标和数据需求。
审计目标可以包括发现潜在的错误、确认数据的准确性和完整性等。
数据需求可以涵盖财务报表数据、销售数据、采购数据等。
审计师需要与客户沟通,了解其业务模式和数据系统,以便确定审计目标和数据需求。
二、收集和准备数据确立审计目标和数据需求后,审计师需要收集相关的数据,并进行适当的准备工作。
数据可以来自内部会计系统、电子表格、数据库等。
审计师应确保数据的完整性和准确性,如果有必要,可以对数据进行清洗和整理,以便后续的分析工作。
三、应用数据分析技术数据分析技术可以帮助审计师更快、更准确地发现潜在的问题和风险。
以下是一些常用的数据分析技术:1.趋势分析:审计师可以通过对历史数据的分析,找出潜在的异常和趋势变化。
例如,在财务报表中,审计师可以比较不同年度的数据,查找异常的销售额或成本费用变动。
如果发现异常,审计师需要进一步调查,并寻找合理的解释。
2.比率分析:比率分析可以帮助审计师评估企业的财务状况和经营绩效。
审计师可以计算各种比率,如流动比率、资产负债比率等,并与行业标准进行比较。
如果发现比率远离行业平均水平,审计师需要进一步研究原因。
3.异常检测:异常检测可以帮助审计师发现不符合规则或异常的交易。
审计师可以使用统计方法和模型来识别异常模式,如离群点分析、回归分析等。
如果发现异常,审计师需要进一步调查,并评估其对财务报表的影响。
四、审查和解释结果数据分析只是审计工作的一部分,审计师还需要审查和解释分析结果。
审计师应确保分析结果的准确性和可靠性,并将其与审计证据相结合,得出合理的审计结论。
此外,审计师还需要与客户和其他利益相关方进行沟通,就分析结果进行解释,并回答他们可能有的问题和疑虑。
如何进行有效的审计数据分析审计是指对财务报表、会计记录、业务操作等进行全面、系统、独立的审查、核实和评价的活动。
而数据分析则是指使用各种统计方法和技术对数据进行挖掘、分析和解释,以发现其中的模式、关联和异常,为决策提供有力支持。
有效的审计数据分析,是对审计工作进行科学化、精细化的提升和优化。
一、审计数据分析的意义审计数据分析的意义在于提升审计工作的效率和准确性,能够帮助审计师更好地了解被审计单位的经营状况、财务状况以及存在的风险,从而更好地发现问题、识别风险,并提供相应的建议和对策。
二、审计数据分析的步骤1. 数据收集和整理首先,审计师需要收集被审计单位的财务数据、会计记录以及相关业务数据,通过将这些数据进行整理和分类,为后续的分析提供可靠的数据基础。
2. 数据预处理在对数据进行分析之前,需要进行数据的清洗和预处理。
这包括去除重复数据、处理缺失值、处理异常值等步骤,以保证数据的准确性和可靠性。
3. 数据探索性分析数据探索性分析是审计数据分析的重要环节,通过对数据的可视化、统计描述等方式,发现数据的特征、规律以及异常情况。
这可以帮助审计师对数据有更深入的认识,并为后续的分析提供指导。
4. 数据模型建立在数据探索性分析的基础上,审计师可以根据实际情况选择合适的数据模型进行建立。
常用的数据模型包括回归分析、时间序列分析、聚类分析等。
通过建立适当的模型,可以对数据进行更深入的挖掘和分析。
5. 数据分析与解释在完成数据模型的建立后,需要进行数据分析和解释。
通过对数据模型结果的分析,审计师可以了解其中的模式、关联和异常情况,并判断其对审计结果的影响以及可能存在的风险。
6. 结果报告与建议最后,审计师需要将数据分析的结果进行整理和归纳,编写相应的审计报告,并提供相应的建议和对策。
这些报告和建议可以为被审计单位提供改进和优化的方向。
三、审计数据分析的工具和技术在进行审计数据分析时,审计师可以使用一些专业的数据分析工具和技术,以提高效率和准确性。
数据式审计常用的数据分析方法审计数据的分析可分为三个层次:即以审计专家经验和常规审计分析技术为基础的审计,以审计分析模型和多维数据分析技术为基础的审计,以数据挖掘技术为基础的审计。
第一个层次表现为用户对数据库中的记录进行访问和查询,可通过SQL等语言来交互式地描述查询要求,或根据查询需求采用开发工具定制查询软件,实现的是查询型分析;第二个层次是用户先提出自己的假设,然后利用各种工具通过反复的、递归的检索查询,以验证或否定自己的假设,从用户的观点来看,他们是在从数据中发现事实,因而实现的是验证型分析;第三个层次是指用户从大量数据中发现数据模式,预测趋势和行为的数据分析模式,它能挖掘数据间潜在的模式,发现用户可能忽略的信息,并为审计人员做出前瞻性的、基于知识的决策提供帮助,因而实现的是验证型分析。
可见,前两个层次是基于现有的审计知识,这构成了智能审计的基础;第三个层次是通过主动挖掘潜在的审计知识,这是智能审计的核心。
一、基于现有审计知识的数据分析方法(一)合规分析方法。
合规分析法就是用审计软件的会计核算部分,根据会计准则和被审计单位业务处理逻辑的数据处理要求,检查是否有账证不符、账账不符、账表不符、表表不符的情况;账户对应关系是否正常;是否存在非正常挂账、非正常调账现象;账户余额方向是否存在异常;是否有违背被审计单位业务处理逻辑的情况等。
(二)趋势分析方法。
趋势分析法是指审计人员将被审计单位若干期相关数据进行比较和分析,从中找出规律或发现异常变动的方法。
它是审计人员利用少量时间点上或期间的经济数据来进行比较分析的特殊时间序列法,此法有助于审计人员从宏观上把握实务的发展规律。
审计人员可根据审计需要来确定时间序列的粒度,如年、季、月、旬、日等。
(三)结构分析方法。
结构分析法也叫比重分析法,是通过计算各个组成部分占总体的比重来揭示总体的结构关系和各个构成项目的相对重要程度,从而确定重点构成项目,提示进一步分析的方向。
结构分析法和趋势分析法还可结合应用,进行数据结构比例在若干期间的变动趋势分析。
应用结构分析法和趋势分析法,对被审计单位的资产、负债、损益和现金流的结构分析、趋势分析以及结构比例的趋势分析,对被审计单位的总体财务状况、经营成果和现金流量形成总体的了解。
(四)比率分析方法。
比率是两个相关联的经济数据的相对比较,主要用除法,它体现各要素之间的内在联系。
比率分析法计算简单,结果简单,便于审计人员判断。
由于采用了相对数,它可以适用不同国家、地区、行业、规模的客户。
(五)经验分析方法。
审计人员在长期的对某类问题的反复审计中,往往能摸索、总结出此类问题的表征。
在审计实践中抓住这种表征,从现象分析至实质,就可以较为方便地核查问题。
将审计人员的这种经验运用到计算机审计中,将问题的表征转化为特定的数据特征,通过编写结构化查询语句(SQL)或利用审计软件来检索,查询出可疑的数据,并深入核实、排查来判断、发现问题,便能实现根据审计经验构建个体分析模型的目的。
(六)多维数据分析。
联机分析处理(on- line analysis processing,OLAP)工具为多维数据分析提供了十分有效的功能,它能够从多种角度对从原始数据中转化出来的、可真正为用户所理解的、并真实反映企业的多维特性的信息进行快速、一致、交互地存取,获得对数据的深入了解。
现代OLAP系统一般是以数据仓库为基础,即从数据仓库中抽取详细数据的一个子集,并经过必要的聚集存储到OLAP存储器中,供前端分析工具读取。
建立数据仓库的目的,是为了支持数据分析和决策制定过程。
数据仓库中存储的数据是面向分析目标的经提炼、加工后的数据集合。
这种数据的存储结构为OLAP实施提供了理想的环境。
而OLAP作为一种多维查询和分析工具,是数据仓库功能的自然扩展,也是数据仓库中的大容量数据得以有效利用的重要保障。
二、应用数据挖掘技术发掘未知审计知识常规数据分析方法利用的是审计人员已有的知识,这存在多处不足:一是审计人员的经验和知识是“有限的”,被审计对象行业跨度大,各单位情况千差万别,当审计经验无法运用时,面对海量数据真如“瞎子摸象”;二是数据是不断发展的,审计经验相对于数据往往是滞后的,这种不同步性给审计带来了巨大的潜在风险;三是对统一数据审计,不同的审计人员可能会得出完全不同的结论,知识的不对称性无法保障审计质量;四是传统的数据分析方法无法处理庞大的数据库系统;五是我国经济飞速发展,金融和各类市场的发育使审计范围和规模逐步扩大,信用危机以及各式各样的金融犯罪也对审计提出了更高的要求,电子化和网络化环境使得作弊手法越发隐蔽,数据难以追踪,审计无从下手。
为了解决日益严重的“数据丰富、知识贫乏”的问题,数据挖掘(Data Mining)技术在20世纪90年代应运而生,并得到了迅速发展。
数据挖掘是针对日益庞大的电子数据应运而生的一种新型信息处理技术。
它一般排除人为因素而通过自动的方式,来发现数据中新的、隐藏的或不可预见的模式或活动。
这些模式是指隐藏在大型数据库、数据仓库或其他大量信息存储的知识。
利用数据仓库中包含的信息,数据挖掘可以发现审计人员原先根本没有想过的问题。
它是在对数据集全面而深刻认识的基础上,对数据内在和本质的高度抽象和概括,也是对数据从理性认识到感性认识的升华。
数据挖掘方法千差万别,不同的方法应用于不同的领域和对象。
选取合适可行的挖掘算法对挖掘的效果起着重要的作用,它将直接影响到决策。
在世纪运用过程中,很多挖掘方法不是单独使用的,它往往和其他方法结合起来,才能产生预期的效果。
(一)关联分析方法。
关联(Association)分析技术是从操作数据库的所有细节或事务中抽取频繁出现的模式。
这种方式促进了关联规则的发展,关联规则总结了一组事件或条目与其他事件或条目的相互联系。
关联算法下的规则经常这样表述,如“包含A、B、C项的记录中有83%的记录也包含D、E项。
”其中的百分比表示规则的可信程度,关联在规则两边可以有任意多个条目。
货篮分析是关联分析中最常用的形式,用支持度(Support)和置信度(Confidence)两个属性来度量。
组成“支持度-置信度”框架。
经过分析购物者篮子中的产品,并使用关联规则算法对大量篮子进行比较,就可以发现特定产品之间的密切关系了。
在对财务数据或经济数据的审计中,同类或不同类会计科目及数据项之间可能存在某种对应关系,按照非财务逻辑关系的规律来查找、挖掘,可发现一些隐藏的经济活动,为审计人员的进一步工作提供参考。
(二)聚类分析方法。
运用聚类分析可进行一些“孤立点”的挖掘。
所谓“孤立点”就是存在一些数据,他们不符合数据的一般模型。
数据中的异常点可能隐藏了重要的信息,反映了企业经营中潜伏的问题或暗藏的商机。
孤立点挖掘通常描述为:给定一个n个数据点或对象的集合及预期的孤立点数目k,发现与剩余的数据相比时显著相异的、异常的或不一致的k个数据。
孤立点挖掘运用广泛,能用于欺诈检测,如探测不寻常的信用卡使用或电信服务;在市场分析中可以用于确定极低或极高收入的客户的消费行为。
(三)神经网络方法。
神经网络是一门活跃的边缘性交叉学科,其中以人工神经网络最具代表性。
神经网络既是高度非线性动力学系统,又是自组织自适应系统,可以用来描述认知、决策和控制的智能行为。
人工神经网络(Artificial Neural Network,ANN)是相对于生物学中所说的生物神经网络系统而言的,它提出的目的在于,用一定的简单的数学模型来对生物神经网络结构进行描述,并在一定的算法指导下使其能够在某种程度上模拟生物神经网络所具有的智能行为,解决用传统算法所不能胜任的智能信息处理的问题。
ANN是一个并列分布处理的结构,它由处理单元及称为连接单元的信号通道互连而成。
处理单元具有局部内存,并可以完成局部操作。
每个处理单元有一个单一的输出连接,这个输出可以根据需要被分成希望个数的许多并行连接,这些连接都输出相同的信号,即相应处理单元的信号大小不因分支的多少而变化。
处理单元的输出信号,可以是任意需要的数学模型,每个处理单元中进行的操作必须是完全局部的,也就是说,它必须仅仅依赖于经过输入连接到达处理单元的所有输入信号的当前值和存储在处理单元局部内存中的值。
人工神经网络具有学习的能力,它可以根据所在的环境去改变它的行为,即可以接受用户提交的样本集合,依照系统给定的算法,不断修正用来确定系统行为的神经元之间连接的强度,而且在网络的基本构成确定后,这种改变是根据其接受的样本集合自然进行的。
在学习过程中,ANN不断地接受从样本集合中提取的该集合所蕴涵的基本知识,并将其以神经元之间连接权重的形式存放于系统中。
(四)数值分析方法。
数值分析法是根据字段具体的数据值的分布情况、出现频率等对字段进行分析,从而发现审计线索的一种数据处理方法。
这种方法从“微观”角度对电子数据进行分析,它在使用时不用考虑具体的业务,对分析出的可疑数据,再结合具体的业务进行审计判断,从而发现审计线索。
相对于其他方法,这种审计数据处理方法易于发现被审计数据中隐藏的信息。
常用的数值分析方法主要有重号分析、断号分析、Benford 法则分析,这些数字方法已经被国际著名审计软件ACL、IDEA 等采用。
重号分析是用来计算某个字段中相同数值的重复次数;断号分析是对统计字段的数据记录是否连续进行分析,如果有断点,则统计出来,否则只列出统计字段的最大值和最小值,它主要针对整型和日期型数据。
班福法则(Benford’s Law)认为数据库中的数据与数据顺序必然遵循某种预定的形式,即符合班福分布,若某个系列的数据分布与班福分布不符,就可能存在发生的错误、潜在的舞弊或其他违规行为。
作者:应里孟作者单位:浙江温州大学城市学院。