基于层次分析法的数据挖掘技术研究与应用
- 格式:doc
- 大小:21.50 KB
- 文档页数:6
数据挖掘技术分析与研究摘要:随着现代信息技术、网络、数据库技术的迅速发展及数据库管理系统的广泛应用,各种类型信息数据越来越多。
数据挖掘就是从大量的实际应用数据中提取隐含信息和知识,它利用了数据库、人工智能和数理统计等多方面的技术,是一类深层次的数据分析方法。
对大量数据进行高速的分析和提取。
关键词:数据挖掘;决策算法;遗传算法;近邻算法中图分类号:tp301 文献标识码:a 文章编号:1674-7712 (2013)04-0065-01一、数据挖掘概念及技术数据挖掘就是又译为资料探勘、数据采矿。
它是数据库知识发现(英语:knowledge-discoveryindatabases,简称:kdd)中的一个步骤。
数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于associationrulelearning)的信息的过程。
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
其实实质是一种透过数理模式来分析企业内储存的大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法。
其方法如下:(一)人工神经网络:数据挖掘中使用最为广泛的技术,神经网络的数据挖掘方法就是通过模仿人的神经系统来反复训练学习数据集,从待分析的数据中发现用于预测和分类的模式。
神经元网络适用于结果比可理解性更重要的分类和预测的复杂情况,可用于聚类、关联、演变分析和离散点分析。
(二)决策树归纳算法:从关系数据库中提取关联规则是主要的数据挖掘方法之一,挖掘关联是通过搜索系统中的所有事物,并从中找到出现条件概率较高的模式,适合于探测式知识的发现,广泛用于医学、制造和生产、金融分析、天文学和分子生物学。
(三)遗传算法:分类和预测是数据分析的两种重要形式,可以用于提取描述重要数据类的模型或预测未来的数据趋势。
主要方法包括:决策树,判定树、贝叶斯法、bp神经网络算法、遗传算法、粗糙集、模糊集等。
基于数据分析与层次分析法解决信贷决策问题作者:熊宇迪刘根茂林芷彤韦宝迎来源:《中国集体经济》2021年第27期摘要:中小微企業在我国国民经济中占有重要地位,近年来,国家高度重视中小微企业信贷服务工作,但是因为中小微企业抵押资产缺乏、规模也较小,所以银行往往会根据国家的具体信贷政策、企业供求关系的平衡性、企业账目流水及综合影响因子等来评估各企业的综合实力,从而择优向企业提供合理的贷款。
如果不对企业进行评估,就对缺少抵押资产的企业放贷,最后可能导致银行损失严重。
为制定出最优的信贷策略,银行首先要根据各企业的实力、信誉对其信贷风险进行评估,再依据信贷风险等因素来确定是否放贷及贷款额度、利率和期限等信贷策略。
文章从数据分析的角度入手,利用层次分析法,对有信贷记录企业及无信贷记录企业的相关数据和贷款利率与客户流失率关系的统计数据进行分析,根据信誉评级,银行的判定标准,对这些标准进行量化分析,评判标准大致分三部分,企业信誉、实力及供求关系,利用EXCEL查找替换、筛选和数据透视表功能等将相关数据进行数据预处理,并给出数据处理流程图。
关键词:数据分析;层次分析法;量化分析一、引言中小微企业作为国民经济发展的重要推动力,其融资困境却仍旧没有得到有效改善。
在实际中,因为中小微企业抵押资产缺乏、规模也较小,所以银行往往根据国家的具体信贷政策、企业供求关系的平衡性、企业账目流水及综合影响因子等来评估各企业的综合实力,从而择优向企业提供合理的贷款,并可对高信誉、小风险企业给予一定的利率优待条件。
在保证银行利益最大化的前提下,为制定出最优的信贷策略,银行首先根据中小微企业的实力、信誉对其信贷风险做出评估,然后依据信贷风险等因素来确定对企业是否放贷及贷款额度、利率和期限等信贷策略。
二、评估各企业实力为了提高数据挖掘的质量,首先,对数据进行分析比对,发现进项发票信息表以及销项发票信息表中的部分数据是以文本形式存储,这可能导致计算时出现错误,为避免在计算各项数据时出现错误,将以文本存储的数字转为数字格式。
多维数据挖掘处理对层次分析法构建挖掘模型的应用作者:郭浩来源:《计算机光盘软件与应用》2013年第21期摘要:层次分析法构建挖掘模型(ACMC)策略让整个数据挖掘流程更加的直观,它升华了原来的层次分析概念,在复杂的数据环境中,实现了高效率、高质量的数据预测分析,并且从方法论、实践方面提供了根据数据挖掘过程的策略分析,实现了ACMC系统的规范设计。
提高了挖掘数据的准确性。
下面本文就对ACMC在多维数据挖掘处理中的应用探讨。
关键词:ACMC;多维数据挖掘;应用中图分类号:TP311.13层次分析方法是对某些复杂的决策问题的各种影响因素以及其中的内在关系进行深入分析,选用较少的定量信息让决策的思维过程变成数学化,进一步为无结构特征、多准则的高难度决策问题提供简单有效的决策方法。
而数据挖掘即数据库中的知识发现,从繁杂的数据中选取含有潜在信息量的过程。
而ACMC是把层次分析方法和多维数据挖掘方法相结合的方法,它能够提供一个可扩张、插拨、相互支持操作。
重构的多维数据挖掘体系。
下面本文就多重数据挖掘层次分析方法进行研究分析,以期让数据挖掘过程更加清晰可见,选取的模块更加准确。
1 ACMC和多维数据挖掘的基本认识1.1 数据挖掘技术简要分析随着数据库与人工智能技术的发展,数据挖掘技术应运而生,这是一个从数据集中识别有效、新颖,具有潜在利用价值到可理解模式的高级处理环节。
一般包括数据清理、数据集成以及数据变换、数据挖掘、知识表示等,其中数据挖掘是中心。
数据挖掘的目的主要用于指定数据挖掘任务中要查找的相关模式,通常把数据挖掘任务分成描述与预测两种。
其中描述性数据挖掘的任务主要是刻画数据库内数据的一般特征;预测性数据挖掘任务是参照现阶段的数据进一步推理,然后进行预测分析。
数据挖掘系统模型如下图1所示。
图1 数据挖掘系统模型1.2 层次分析法构建挖掘模型策略在知识数据库的复杂数据环境中,层次分析法构建挖掘模型不仅仅能从训练数据库中获得大量的信息数据,还可以用“Model Refresh”以及“Model Evaluation”对模型进行评估打分,然后选出正确的模型执行。
多维数据分析的数据挖掘方法与实现随着互联网技术的不断发展,数据量的爆炸式增长以及数据种类和形式的多样化,传统的数据分析方法面临着巨大的挑战。
人们需要更加高效、智能化的数据分析方法来解决如何从海量数据中发现有用的信息、洞察趋势和规律的问题。
而此时,多维数据分析和数据挖掘的方法就成为了一种重要的解决方案。
一、什么是多维数据分析多维数据分析是一种能够从不同维度、角度对数据进行深入分析和洞察的方法。
它能够将海量数据进行分层次管理和分析,让人们能够以一种运用角度而不是搜索字符的方式来发现潜在的规律和行业趋势。
多维数据分析不再是简单的筛选和排序,而是将数据进行了一种维度的切片,使得数据能够在不同的角度和维度下展现出不同的特性和趋势,为人们提供了更加高效、精准和及时的数据支持。
二、多维数据分析的实现方法针对多维数据分析应用场景的不同,可以选择不同的数据分析方法。
目前比较常见的方法包括OLAP(联机分析处理)、数据挖掘、人工智能等。
1.OLAP(联机分析处理)OLAP(联机分析处理)是一种处理多维数据的技术。
将数据处理程序与数据库紧密集成,使得用户能够快速自由的对数据进行查询和分析。
用户可以通过图表、表格等方式来直观的展现数据,同时在查询数据时也不会对数据库造成太大的压力。
OLAP有一种叫做Rolap的实现方式,具体是应用一些基于存储的索引数据结构来增加分析效率。
2.数据挖掘数据挖掘是一种通过挖掘大量数据来发现其中规律、趋势的方法。
数据挖掘可以通过对数据进行聚类、分类、预测等操作来发现其中的信息和潜在的趋势。
此时,选择适当的算法和模型是十分重要的,比如k-means算法、朴素贝叶斯分类等。
3.人工智能人工智能是一种能够模拟人脑智慧的技术。
通过让计算机具有自主决策、学习、推理等能力,让计算机能够帮助人们更好的处理和分析大量的数据。
比如使用神经网络来进行数据分析,或者是通过机器学习来进行数据预测等。
三、多维数据分析的实践案例1.电商行业中的数据分析电商行业中的数据分析是很常见的应用场景。
实验一Clementine12.0数据挖掘分析方法与应用一、[实验目的]熟悉Clementine12.0进行数据挖掘的基本操作方法与流程,对实际的问题能熟练利用Clementine12.0开展数据挖掘分析工作。
二、[知识要点]1、数据挖掘概念;2、数据挖掘流程;3、Clementine12.0进行数据挖掘的基本操作方法。
三、[实验内容与要求]1、熟悉Clementine12.0操作界面;2、理解工作流的模型构建方法;3、安装、运行Clementine12.0软件;4、构建挖掘流。
四、[实验条件]Clementine12.0软件。
五、[实验步骤]1、主要数据挖掘模式分析;2、数据挖掘流程分析;3、Clementine12.0下载与安装;4、Clementine12.0功能分析;5、Clementine12.0决策分析实例。
六、[思考与练习]1、Clementine12.0软件进行数据挖掘的主要特点是什么?2、利用Clementine12.0构建一个关联挖掘流(购物篮分析)。
实验部分一、Clementine简述Clementine是ISL(Integral Solutions Limited)公司开发的数据挖掘工具平台。
1999年SPSS公司收购了ISL公司,对Clementine产品进行重新整合和开发,现在Clementine已经成为SPSS公司的又一亮点。
作为一个数据挖掘平台,Clementine结合商业技术可以快速建立预测性模型,进而应用到商业活动中,帮助人们改进决策过程。
强大的数据挖掘功能和显著的投资回报率使得Clementine在业界久负盛誉。
同那些仅仅着重于模型的外在表现而忽略了数据挖掘在整个业务流程中的应用价值的其它数据挖掘工具相比,Clementine其功能强大的数据挖掘算法,使数据挖掘贯穿业务流程的始终,在缩短投资回报周期的同时极大提高了投资回报率。
为了解决各种商务问题,企业需要以不同的方式来处理各种类型迥异的数据,相异的任务类型和数据类型就要求有不同的分析技术。
大数据时代的数据挖掘与应用摘要:随着社会经济水平的不断提高和信息时代的不断发展,数据挖掘在社会的各个领域中得到广泛的应用和普及,给人们的生活方式、学习方式和工作方式带来方便的同时,却引发了一系列的网络安全问题。
基于此,本文针对大数据和大数据时代的概念进行了概述,分析了数据挖掘应用的分析方法,在此基础上探讨了大数据时代数据的挖掘与应用。
关键词:大数据时代;数据挖掘;应用引言如今是一个数据时代,互联网的飞速发展使人们的各项信息都可以被数据化,所以数据挖掘技术有着十分重要的意义。
在经济发展的过程当中,数据挖掘技术是一种新的数据库技术,通过从生活当中存在的海量数据来挖掘一些相应的价值规则。
在不断发展的过程当中,高度重视数据挖掘技术,能够令人们在上网过程中得到更好地体验,同时提高人们上网的网络速度,减少人们浪费在互联网上的时间。
数据挖掘技术的出现令用户们利用网络的情况数据化,让用户们的上网体验感更好,以此提高用户体验感。
1大数据挖掘技术的重要性大数据时代的数据挖掘大数据的合理挖掘和整理,让经营者在海量的数据中提取出对经营的最有利的黄金数据,推动经营盈利的最大化是大数据背景中数据挖掘重要意义的体现,因此数据挖掘的本质就是对一系列数据的处理和分析,通过分析和处理找出对自己最有利的信息。
大数据时代是人类在信息上的一次历史性的颠覆,其对人民的生产生活有着深远的影响,拉近人与人之间的距离,世界联系得更加紧密。
相对于以前的种种实体资产的重要性,转换成对各类信息资源的重视性,大数据时代下的数据资源已成为人类的一种宝贵财富,而这些海量的数据资源就如一座堆积而成的宝藏山,需要人民采用科学合理的方法去挖掘,因此在大数据时代的潮流中,如何学会数据的挖掘和深加工是理财致富的一条重要途径。
2数据挖掘技术的分析方法2.1关联分析自然界中的事物具有一定得联系,借助这一特征在数据挖掘的过程中借助不同数据之间的联系区别,能够更好查找数据集合与对象集合之间的因果结构。
数据仓库与数据挖掘技术研究与应用1. 引言数据是当今社会的核心资源之一,企业需要从海量数据中提取有价值的信息以支持业务决策和发展。
数据仓库和数据挖掘技术是处理和分析大规模企业数据的重要手段。
本文将探讨数据仓库和数据挖掘技术的研究与应用。
2. 数据仓库技术2.1 数据仓库定义和特点数据仓库是一个面向主题、集成、历史和稳定的数据存储库。
数据仓库的主要特点包括:面向主题,即聚焦于特定业务领域的数据集合;集成,即从不同数据源中提取数据,转换为一致的格式和编码;历史,即保留不同时间点的数据快照以分析趋势和历史演变;稳定,即数据仓库结构和内容相对稳定,不随源系统而改变。
2.2 数据仓库架构数据仓库架构包括数据源层、ETL层、存储层和应用层。
数据源层包括企业各个应用系统、数据文件和传感器等各种数据来源。
ETL层负责数据的提取、转换和加载,将数据转换为适合数据仓库的格式。
存储层为数据提供持久化存储,包括数据仓库、数据集市和数据清单等不同层次的存储结构。
应用层提供多种用户界面和分析工具,以供用户查询和分析数据。
2.3 数据仓库建设数据仓库建设需要遵循一些基本原则,如需求驱动、迭代开发、数据治理和数据质量保障等。
实施建设的流程包括:需求分析、设计规划、技术实现和运营管理。
在规避风险和提高效率方面,可采用敏捷开发、自动化测试和基础设施自动化等现代开发技术。
3. 数据挖掘技术3.1 数据挖掘定义和技术分类数据挖掘是指从大量数据中提取有用信息的技术。
数据挖掘技术可分为分类、聚类、关联规则和最优化等多种类型。
分类是明确将数据分为不同类别,如预测客户流失或判断股票波动等;聚类是将相似的数据分为同一类别,如在销售数据中识别消费者购买偏好;关联规则是寻找数据项之间的联系和规律,如在购物篮数据中识别购物行为模式;最优化则是寻求最佳状态或解决方案,如关于生产效率和资源利用的优化问题。
3.2 数据挖掘流程数据挖掘流程包括问题定义、数据准备、建模、评估和应用等阶段。
基于数据挖掘的大数据分析技术研究随着网络技术的不断发展和普及,大数据时代已经到来。
在现今信息社会中,大量的数据被不断地产生和积累,大数据的价值和应用愈发凸显。
数据挖掘作为一种重要的大数据分析技术,已经成为数据科学领域不可或缺的一部分。
一、什么是数据挖掘数据挖掘指通过数据分析的方法,从大型数据集中发掘出潜在的、未知的、先前未被预测的信息和模式。
其目的是发现数据中的规律以及隐含的关系,进一步分析这些规律和关系所代表的含义,从而为人们提供更加准确的预测和决策依据。
数据挖掘技术可以应用于各个领域,如智能推荐、金融风险评估、医疗诊断和市场营销等。
二、数据挖掘技术在大数据分析中的应用数据挖掘技术在大数据领域的应用十分广泛,以下列举几个常见的应用场景。
1.智能推荐通过分析用户行为和偏好,在海量的商品数据中推荐用户可能感兴趣的商品,这是智能推荐系统的基本功能。
一般采用协同过滤算法、内容过滤算法和基于深度学习的神经网络算法等。
2.金融风险评估金融机构可通过数据挖掘技术进行风险评估。
包括信用评估、反欺诈、交易监控等,基于风险评估结果,金融机构可结合其他数据,为企业和个人提供贷款、信用卡等服务。
3.医疗诊断医疗影像、病历和诊断数据,以及生物信息数据是大数据中的一个重要部分。
利用数据挖掘技术,可对这些数据进行分析,提高医学诊断的准确性和效率。
4.市场营销企业可利用数据挖掘技术,对自己的产品、广告、促销等进行分析,从而调整自己的市场营销策略。
同时,企业还可以通过数据挖掘技术,了解客户需求和消费习惯,为客户提供更好的产品和服务。
三、数据挖掘技术的主要方法1.分类分类是数据挖掘中最常用的方法之一,其目的是根据数据集中的属性特征,将数据分为不同的类别,从而为后续的分析和决策提供依据。
常见的分类算法包括朴素贝叶斯、决策树、支持向量机等。
2.聚类聚类是指将数据按照某种规则或变量进行分组或分类的过程,相似的数据放在一组中。
聚类后可以用于研究数据之间的相互关系,挖掘数据潜在的规律和内在的结构。
基于层次分析法的企业中层管理者绩效评价【摘要】本文围绕基于层次分析法的企业中层管理者绩效评价展开研究。
在探讨了研究背景、研究目的和研究意义;在分析了层次分析法在绩效评价中的应用、企业中层管理者绩效评价的重要性,提出了构建绩效评价指标体系和评价流程的方法,并进行了案例分析;结论部分总结了基于层次分析法的绩效评价的有效性,并探讨了未来研究方向。
通过本文的研究,可以为企业提供更科学有效的中层管理者绩效评价方法,提升企业管理水平和绩效。
【关键词】层次分析法、企业中层管理者、绩效评价、指标体系、评价流程、案例分析、有效性、未来研究方向、结论总结1. 引言1.1 研究背景企业中层管理者在组织中扮演着至关重要的角色。
他们既需要贯彻执行高层领导者的战略决策,又需要管理和指导基层员工的日常工作。
对于企业来说,中层管理者的绩效评价是至关重要的。
传统的绩效评价方法往往存在主观评价、缺乏客观指标和不公平性的问题,难以准确评价中层管理者的工作表现。
为了解决这一问题,越来越多的企业开始探索基于科学方法的绩效评价体系。
在当前越来越激烈的市场竞争中,企业需要有能力的中层管理者来驱动组织的发展。
构建基于层次分析法的企业中层管理者绩效评价体系是迫切需要的。
通过科学的评价方法,企业可以更好地激励中层管理者的工作表现,提高组织整体的运营效率和绩效水平。
1.2 研究目的企业中层管理者绩效评价是组织管理中非常重要的一环,直接影响着企业的运营效率和绩效水平。
通过对中层管理者的工作表现进行科学评价,可以更好地激励员工的工作积极性和创造力,提升企业整体绩效水平。
本研究旨在通过基于层次分析法的方法,构建一个科学合理的企业中层管理者绩效评价指标体系,为企业提供有效的评价工具,帮助企业实现中层管理者的精准评价,提高管理水平和绩效表现。
1.3 研究意义企业中层管理者在组织中具有重要的作用,其绩效评价对于企业发展和运营管理具有重要意义。
通过对企业中层管理者的绩效进行科学、客观、全面的评价,可以有效激励中层管理者的积极性和创造性,提高他们的工作绩效和管理水平,进而促进企业整体绩效的提升。
基于层次分析法的数据挖掘技术研究与应用作者:范鹏轩陈松孙静来源:《电脑知识与技术》2008年第34期摘要:构建数据挖掘算法模型是数据挖掘技术研究的重点和难点。
层次分析法是一种定性与定量相结合的多准则决策方法,可以将人的主观判断用数量形式表达和处理。
研究和实现基于层次分析法的数据挖掘技术,可进一步拓宽数据挖掘算法模型的类型,对数据挖掘技术的应用具有普遍意义。
关键词:数据挖掘;数据挖掘算法;层次分析法;判断矩阵中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2008)34-1542-03The Research and Application of Data Mining Based on AHPFAN Peng-xuan1, CHEN Song1, SUN Jing2(1.School of Information Science and Engineering, Chongqing Jiaotong Univ., Chongqing 400074, China;2.Zhengzhou Electronic Information Vocational & Technical College, Zhengzhou 451450, China )Abstract: Building the data mining algorithms and models is the focus and difficulty of the study in the data mining field. The Analytic Hierarchy Process is a kind of multiple-criterion measures combined quality and quantity to illustrate subjective judgment in quantitative index. Researching and achieving data mining technology that based-on the Analytic Hierarchy Process can further expand the types of Data Mining algorithms and models, and also have a universal meaning to the application of the Data Mining technology.Key words: Data Mining; the Analytic Hierarchy Process; Data Mining Algorithm; Comparison measuring1 引言数据挖掘(Data Mining)即知识发现,是指从大量的、不完全的、有噪声的、模糊的、随机的、实际应用数据库中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识[1]。
数据挖掘技术伴随着“如何不被海量信息淹没,而是从中发时发现有用的知识、提高信息利用率?”的问题而快速发展并应用起来。
数据挖掘是一门汇集统计学、机器学习、数据库、模式识别、知识获取、专家系统、数据可视化和高性能计算等多种学科的新兴交叉学科,它为自动和智能地把海量的数据转化为有用的信息知识提供了有力的手段。
数据挖掘是一个多阶段数据处理过程,一般而言主要包括以下几个步骤[2-3]:1) 确定挖掘目标;2) 建立目标数据集;3) 数据预处理;4) 选择数据挖掘功能;5) 选择适合的数据挖掘算法进行数据挖掘;6) 模式评估。
在这个数据处理过程中,如何构建一个适合且有效的数据挖掘算法模型进行有效的数据挖掘是最重要的步骤之一,因此也一直是数据挖掘领域研究的重要和关键问题。
本文探讨了一个已经广泛应用于处理社会、政治、经济、技术等结构较为复杂,决策准则较多而且不易量化的决策问题的层次分析方法在数据挖掘技术中的应用,从而提出一个可应用于数据挖掘的技术,层次分析方法。
2 层次分析方法的原理与步骤2.1 层次分析法的原理层次分析法[4-5](Analytic Hierarchy Process简称AHP)是一种定性与定量相结合的方法,它能将决策者对复杂的决策思维过程系统化、模型化、数字化,可解决多目标、多层次、多准则的决策问题。
尤其是对于各个评价指标权重因子的确定。
其思路主要是:1) 把复杂问题中各种因素通过划分相互联系的有序层次使之条理化;2) 根据对一定客观现实的判断就每一层次的相对重要性给予定量表示;3) 利用数学方法确定表达每一层次的全部元素相对重要性次序的权值;4) 通过排序结果分析、解决问题。
2.2 层次分析法的步骤层次分析法的过程可以分为以下几个步骤:1) 建立层次结构模型。
根据问题的性质和要达到的目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响以及隶属关系,将因素按不同层次聚集组合,形成一个多层次的分析结构模型。
同一层的诸因素从属于上一层的因素或对上层因素有影响,同时又支配下一层的因素或受到下层因素的作用。
主要分为最高层、中间层和最底层。
其中,最高层:是目标层,表示解决问题的目的,即层次分析要达到的总目标。
中间层:包括准则层和指标层,表示采取某一方案来实现预定总目标所涉及的中间环节。
最底层:是方案层,表示要选用的解决问题的各种措施、策略、方案等。
2) 构造判断矩阵。
任何系统分析都以一定的数据信息为基础。
层次分析法的数据信息基础主要是决策者每一层元素的互相重要性给出的判断,即判断矩阵。
判断矩阵可以表示上层某一元素所支配的下层有关元素之间的相对重要性。
也就是说下层各因素两两比较,那一个比较重要,重要程度如何。
为了使决策判断定量化,形成数值判断矩阵,通常采用通常采用A.L.Saaty建议的1-9刻度法。
如表1所示。
采用9级标度法给元素赋值构造的判断矩阵一般为A。
■3) 层次中的单排序。
在得到判断矩阵的基础上,可以用数学法求得某一层中某个因素对上一层次某一因素的影响程度,排除次序来。
由于判断矩阵本身存在相当的误差,而层次但排序中各因素的权重值,从本质上讲是表达定性的概念,因此可用近似方法来解判断矩阵的最大特征值和特征向量。
4) 用规范几何法求判断矩阵的特征值和特征向量。
①对判断矩阵每一列规范化■②求规范列的平均值■ ,则W=[W1 W2…Wn]T即为所求的特征向量。
③计算判断矩阵的最大特征根■,其中(AW)I表示向量AW的第i个元素。
5) 判断矩阵的一致性检验在构造判断矩阵的过程中,通过引入1~9标度法,是定性问题定量化。
从理论上分析得到:如果判断矩阵是完全一致的成对比较矩阵,应该有bikbkj=bij,但实际上在构造成对比较矩阵时要求满足上述众多等式是不可能的。
因此只要求判断矩阵有一定的一致性。
即要求判断矩阵的绝对值最大的特征值和该矩阵的维数相差不大。
检验其一致性的步骤如下:①计算一致性指标CI=(λmax-n)/(n-1), λmax为判断矩阵的最大特征值。
②计算平均随机一致性指标CR=CL/RI,式中RI表示同阶平均随机一致性指标,它只与矩阵阶数有关。
6)层次总排序计算组合权向量并做组合一致性检验。
计算最下层在准则层度量下对目标层的组合权向量,并根据公式做组合一致性检验,若检验通过,则可按照组合权向量表示的结果进行决策,否则需要重新考虑模型或重新构造那些一致性比率较大的成对比较阵。
层次总排序需要从上之下逐层进行。
3 基于层次分析法的虚拟投资项目数据挖掘应用现在我们假设某公司拥有一笔投资资金,目的是选择合适的投资项目,以期获得最大的受益。
我们可以用层次分析法来分析各个项目的投资与收益比,从而选择最佳的投资方案。
3.1 层次分析法对投资项目的层次结构数据分析首先进行系统分析。
目标层“最优项目”。
准则层为总投资额、全部投资财务内部收益率、自有资金财务内部收益率、贷款偿还期、投资回收期、专家对项目风险评价、盈亏平衡点。
方案层为投资项目1、投资项目2……、投资项目n。
3.2 层次分析法的投资项目数据挖掘假设以下为待选投资项目的各方面基本情况[6]。
(假设数据,如下表2)表2 项目基本情况■1) 目标层与标准层经专家比较法得以下“总投资额I1,收益率I2,利润率I3,贷款期I4,投资回收期I5,盈亏平衡点I6,风险预测I7 ”构造判断矩阵如表3所示。
λmax=■■=7.01369 CI=0.00228CR=CI/CR=0.00228/1.32=0.00173<0.1(一致性通过)2) 准则层对方案层“项目1、项目2、项目3、项目4、”的判断矩阵按照以下原则确定判断矩阵。
①总投资额(表4为投资额判断矩阵)λmax=■■=4.031CI=0.0103CR=CI/CR =0.0103/0.9=0.011482<0.1(一致性通过)同样的方法可计算得②内部收益率 CR=CI/CR =0.0103/0.9=0.011482<0.1(一致性通过)且其特征向量 W=[0.76 2.21 0.45 1.32]T③利润率 CR=CI/CR =0.0103/0.9=0.011482<0.1(一致性通过)且其特征向量 W=[0.76 2.21 0.45 1.32]T④贷款期 CR=CI/CR =0.0103/0.9=0.011482<0.1(一致性通过)且其特征向量W =[1.32 0.76 2.21 0.45]T⑤投资回收期CR=CI/CR =0.0103/0.9=0.011482<0.1(一致性通过)且其特征向量 W =[2.21 0.76 1.32 0.45]T⑥盈亏平衡点CR= CI/CR =0.0103/0.9=0.011482<0.1(一致性通过)且其特征向量W=[0.76 1.32 0.45 2.21]T⑦风险预测CR=CI/CR =0.0103/0.9=0.011482<0.1(一致性通过)且其特征向量W=[1.32 0.76 2.21 0.45]T3) 总排序V总排序表如表5所示。
CI=■WjCIj=0.07818RI=■WjCIj=6.831 CR=CR/RI=0.01144<0.1(一致性通过)采用此层此分析法的数据挖掘结果表明,相对于选择最佳方案这个目标而言,相对优先顺序为:项目2 > 项目3 > 项目4 > 项目1综合以上分析,我们可得出项目2为最优方案,接下来依次是项目3、项目4和项目1。
从而验证了层次分析法对此投资项目财务评价数据挖掘的有效性。
4 结论近几年来,数据挖掘的研究和应用成为计算机领域富有挑战性的问题,各种挖掘方法层出不穷,优秀的挖掘算法可以给人们带来巨大的经济效益,使用户在激烈的竞争中立于不败之地。