商业银行的个人信用评估研究:基于PCA-GA-BP算法
- 格式:pdf
- 大小:252.92 KB
- 文档页数:3
BP神经网络模型概要说明BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。
BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。
它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)(如图5.2所示)。
2.相关理论BP算法由数据流的前向计算(正向传播)和误差信号的反向传播两个过程构成。
正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元。
若在输出层得不到期望的输出,则转向误差信号的反向传播流程。
通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。
1989年Robert Hecht—Nielon证明了对于任何在闭区间的一个连续函数都可以用一个隐层的BP网络来逼近,因而一个3层的BP网络可以完成任意的N维到M 维的映射,因此在BP网络中多采用单隐层网络。
下面我们以三层神经网络为例来说明BP 网络的标准学习算法。
BP 算法信号的正向传播设定BP 网络的输入层有n 个神经元,隐含层有p 个神经元,输出层有q 个神经元,输入层与隐层之间的权值为 ki ν,隐层与输出层之间的权值为 jk ω。
隐层的传递函数为f 1(·),输出层的传递函数为f 2(·),则隐层节点的输出为10()1,2,....n k ki i i z f x k ν===∑输出层节点的输出为:20()1,2,....q j jk k k y f z j ω===∑至此BP 网络就完成了n 维空间向量对m 维空间的近似映射。
数学建模论文题目优选专业题目128个1. 基于偏最小二乘法的回归模型研究2. 城市道路网优化设计模型研究3. 基于多元时间序列的股票价格预测模型4. 基于PCA的图像压缩算法研究5. 基于神经网络的手写数字识别模型研究6. 基于逻辑回归的信用评分模型研究7. 基于多元回归的考试成绩预测模型8. 基于分层抽样的调查数据分析模型研究9. 基于粒子群算法的车辆路径规划模型10. 基于高斯混合模型的人脸识别模型研究11. 基于时间序列的气象预测模型研究12. 基于模糊数学的交通运输成本评价模型13. 基于Bayesian模型的风险管理模型研究14. 基于熵权法的供应链绩效评价模型研究15. 基于人工神经网络的物流配送路径规划模型16. 基于聚类分析的消费者购物行为模型研究17. 基于ARIMA模型的股票价格预测研究18. 基于线性规划的资源优化配置模型研究19. 基于灰色关联分析的品牌效应评价模型20. 基于神经网络的信用卡欺诈检测模型研究21. 基于分类决策树的客户流失预测模型22. 基于支持向量机的情感分类模型研究23. 基于聚类分析的企业竞争战略研究24. 基于随机森林算法的文本分类研究25. 基于多元回归的商品价格预测模型研究26. 基于模糊层次分析法的公共设施优化布局模型27. 基于BP神经网络的电网负荷预测模型研究28. 基于熵增资金流动模型的投资组合优化研究29. 基于支持向量机的时序自然语言处理模型研究30. 基于贝叶斯网络的风险评估模型研究31. 基于特征选择的糖尿病研究模型32. 基于ARMA-GARCH模型的黄金价格预测研究33. 基于随机森林算法的房价预测模型研究34. 基于半监督学习的数据建模方法研究35. 基于神经网络的新闻情感分析模型研究36. 基于多元回归的用户购买意愿预测研究37. 基于主成分分析法的医学数据挖掘模型研究38. 基于熵增二次规划的环保决策模型研究39. 基于支持向量机的产品缺陷分析模型研究40. 基于遗传算法的旅游路线规划模型研究41. 基于BP神经网络的房产估价模型研究42. 基于多元线性回归的企业税收影响因素研究43. 基于LDA主题模型的新闻推荐模型研究44. 基于半监督学习的文本分类方法研究45. 基于动态规划的优化管理模型研究46. 基于人工神经网络的汽车质量控制模型研究47. 基于SVM的留学生综合评价模型研究48. 基于熵权法的企业绩效评价模型研究49. 基于色彩分类的图像检索模型研究50. 基于PCA的公司财务分析模型研究51. 基于最小二乘法的时序预测模型研究52. 基于BP神经网络的信用风险评估模型研究53. 基于ARIMA模型的国际贸易数据预测研究54. 基于分层抽样的公共政策效果评价模型研究55. 基于遗传算法的网络优化模型研究56. 基于Logistic回归的客户流失模型研究57. 基于主成分回归的能源消费预测模型研究58. 基于熵增多目标规划的医院资源配置模型研究59. 基于LSTM的短期气温预测模型研究60. 基于支持向量机的销售预测模型研究61. 基于偏最小二乘法的时间序列分析模型研究62. 基于线性规划的物流成本控制模型研究63. 基于粒子群算法的生产排程问题研究64. 基于K-Means算法的用户购物行为分析模型研究65. 基于BP神经网络的就业市场预测模型研究66. 基于多元回归的房价分析模型研究67. 基于PCA-LDA算法的股票投资组合优化研究68. 基于熵增法的金融客户信用评估模型研究69. 基于ARIMA模型的出口贸易预测研究70. 基于主成分回归的汽车销售预测研究71. 基于支持向量机的客户信贷风险评估模型研究72. 基于自回归模型的煤矿生产数据分析模型研究73. 基于半监督学习的文本聚类算法研究74. 基于偏最小二乘法的多元时间序列预测模型研究75. 基于数据挖掘的酒店客户消费分析模型研究76. 基于BP神经网络的固定资产折旧预测模型研究77. 基于LSTM的外汇汇率预测模型研究78. 基于GARCH模型的期货价格波动预测研究79. 基于随机森林算法的个人信用评估模型研究80. 基于分层抽样的医院评价模型研究81. 基于主成分回归的员工绩效评价模型研究82. 基于特征选择的电商商品分类预测研究83. 基于组合多目标规划的供应链资源配置模型研究84. 基于支持向量机的农村扶贫模型研究85. 基于因子分析法的股票投资风险评估模型研究86. 基于熵权法的环境效益评价模型研究87. 基于ARMA-GJR模型的期权价格波动预测研究88. 基于线性规划的房地产项目开发决策模型研究89. 基于支持向量机的人体姿势识别模型研究90. 基于逻辑回归的疾病风险评估模型研究91. 基于随机森林算法的人群画像建模研究92. 基于特征选择的电商用户购买行为模型研究93. 基于主成分回归的债券价格预测研究94. 基于半监督学习的视频分类方法研究95. 基于GARCH模型的黄金价格波动预测研究96. 基于线性规划的物流配送网络优化模型研究97. 基于神经网络的推荐系统算法研究98. 基于多元回归的城市房价分析模型研究99. 基于决策树的产品质量评估模型研究100. 基于熵增的生态系统评价模型研究101. 基于ARMA-GARCH模型的汇率波动预测研究102. 基于偏最小二乘法的长期股票价格预测模型研究103. 基于支持向量机的广告点击率预测模型研究104. 基于最小二乘法的用户行为分析模型研究105. 基于主成分分析的国际贸易影响因素研究106. 基于熵权法的固体废物处置模型研究107. 基于BP神经网络的猪价预测模型研究108. 基于多元回归的医疗保险费用预测模型研究109. 基于半监督学习的语义分析方法研究110. 基于GARCH模型的股票市场风险度量研究111. 基于多元回归的房屋安全预测模型研究112. 基于主成分回归的银行收益预测模型研究113. 基于支持向量机的人脸识别模型研究114. 基于逻辑回归的考生录取预测模型研究115. 基于随机森林算法的股票涨跌预测模型研究116. 基于线性规划的生产物流系统优化研究117. 基于支持向量机的非线性预测模型研究118. 基于LSTM的股票走势预测模型研究119. 基于因子分析法的环保技术影响因素分析研究120. 基于聚类分析的电商平台用户行为分析研究121. 基于人工神经网络的物流配送路线优化模型研究122. 基于多元回归的房产投资模型分析研究123. 基于主成分回归的教育支出预测研究124. 基于熵增的商业银行绩效评价模型研究125. 基于遗传算法的能源资源优化配置模型研究126. 基于半监督学习的情感分类方法研究127. 基于GARCH模型的商品期货价格波动研究128. 基于支持向量机的房地产投资风险评估模型研究。
国外个人信用评估体系的发展及对我国的启示1. 引言1.1 国外个人信用评估体系的定义国外个人信用评估体系的定义是指通过对个人信用信息进行收集、整理、分析,评定个人信用状况的一套制度化工具。
这个体系主要包括对个人消费行为、还款记录、社会关系等方面的信息进行评估,从而形成一个客观、全面的个人信用评价体系。
该评估体系可以帮助金融机构、雇主、房东等在与个人交往时更准确地评估个人信用水平,从而减少信用风险和提高效率。
个人信用评估体系的建立旨在建立一个公正、透明的信用评估机制,激励个人维护良好信用记录,促进社会诚信建设。
在国外,个人信用评估体系已经相当完善,各国金融机构、企业和政府部门都广泛应用这一制度,取得了显著的社会效益。
1.2 国外个人信用评估体系的重要性国外个人信用评估体系的重要性在当今社会具有重要的意义和价值。
个人信用评估体系是指通过对个人信用记录和行为的收集、整理和分析,综合评定个人信用状况,为金融机构、零售商和其他企业提供参考,以便决定是否与其合作或提供信贷服务。
这一体系的重要性主要体现在以下几个方面:国外个人信用评估体系的建立有助于提高金融服务的效率和质量。
通过对个人信用状况的评估,金融机构可以更准确地判断个人的信用风险,从而制定更科学合理的信贷政策,降低不良贷款率,提高贷款的成功率。
国外个人信用评估体系的建立有助于促进消费者信用意识的培养和提高。
个人信用评估体系的存在可以激励个人维护自身信用良好的动力,有助于培养消费者守法守信的信用观念,提高整个社会的信用文化水平。
国外个人信用评估体系的建立还可以促进金融市场的健康有序发展。
通过建立健全的个人信用评估体系,可以有效减少信息不对称,提高金融市场的透明度和公平性,促进金融市场的稳定发展。
国外个人信用评估体系的重要性在于其对金融服务效率、消费者信用意识和金融市场发展的积极影响,是推动经济社会发展的重要基础和保障。
2. 正文2.1 国外个人信用评估体系的发展历程国外个人信用评估体系的发展历程可以追溯到19世纪末20世纪初。
深度学习模型在银行业信贷风险评估中的应用研究随着金融行业的发展和技术的进步,银行业信贷风险评估成为金融机构中关键的环节之一。
传统的信贷风险评估方法存在着许多局限性,如特征提取不准确、模型无法处理大规模数据等。
然而,近年来深度学习模型的出现为解决这些问题提供了有效的途径。
本文将探讨深度学习模型在银行业信贷风险评估中的应用,并探讨其优势和挑战。
一、深度学习模型概述深度学习模型是一种基于人工神经网络的机器学习方法,其主要特点是具有多层非线性处理单元。
通过多个处理层的级联,深度学习模型可以自动学习复杂的特征表示,从而发现数据中的隐藏模式。
深度学习模型在自然语言处理、计算机视觉和语音识别等领域取得了巨大的成功,其强大的模式识别能力也被广泛应用于金融领域。
二、深度学习模型在信贷风险评估中的应用1. 数据预处理深度学习模型的成功关键之一是数据的准备和预处理。
在信贷风险评估中,通过对信用历史、财务状况、借贷记录和其他相关数据的收集和整理,可以得到一个相对完整的数据集。
然而,由于数据的高维度和复杂性,传统的数据处理方法可能无法有效提取有用的特征。
深度学习模型可以通过自动学习特征表示,有效地处理这些高维度和复杂的数据,提高预测模型的性能。
2. 特征提取和选择在信贷风险评估中,选择适当的特征是非常关键的。
传统的特征选择方法依赖于领域专家的经验和人工选择,存在主观性和局限性。
而深度学习模型可以通过自动学习特征表示,避免了人工选择特征的繁琐过程。
通过神经网络的层次化结构,深度学习模型可以自动从原始数据中提取有用的特征,并且可以针对不同的特征进行不同的权重分配,提高模型的表达能力和预测准确度。
3. 风险评估模型建立在深度学习领域,常用的模型包括卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)。
这些模型都具有强大的非线性处理能力,适用于复杂场景下的模式识别。
在信贷风险评估中,深度学习模型可以通过学习大量的数据样本,构建准确的信用评估模型。
基于SMOTE—贝叶斯网络的商业银行风险评估模型研究摘要商业银行风险评估是银行业务中至关重要的一环,在现代化的金融风险管理中占据重要地位。
由于银行贷款业务存在风险,因此需要通过风险评估来衡量和控制风险水平。
本文基于SMOTE-贝叶斯网络算法,针对商业银行风险评估的问题进行了研究和探究,并提出了一种适用于商业银行风险评估的模型。
该模型考虑了信贷风险的多种因素,包括信用评级、利率、收入情况等,同时利用SMOTE算法对样本不平衡问题进行处理,提升了模型的准确性和可靠性。
通过对模型的实证分析发现,所提出的基于SMOTE-贝叶斯网络的商业银行风险评估模型相较于其他模型具有更高的预测准确率和有效性,具有一定的应用价值和推广意义。
关键词:商业银行;风险评估;SMOTE算法;贝叶斯网络;样本不平衡AbstractCommercial bank risk assessment is an essential part of banking business and occupies an important position in modern financial risk management. Due to the risks associated with bank lending business, risk assessment is necessary to measure and control risk levels. Based on the SMOTE-Bayesian network algorithm, this paperhas conducted research and exploration on the issue of commercial bank risk assessment and proposes a model suitable for commercial bank risk assessment. The model considers various factors of credit risk, including credit rating, interest rates, income situation, etc., and uses the SMOTE algorithm to address the problem of sample imbalance, which enhances the accuracy and reliability of the model. The empirical analysis of the model shows that the proposed SMOTE-Bayesian network-based commercial bank risk assessment model has a higher prediction accuracy and effectiveness than other models, and has a certain application value and promotion significance.Keywords: commercial bank; risk assessment; SMOTE algorithm; Bayesian network; sample imbalance一、绪论随着金融市场的不断发展和完善,商业银行作为重要的金融机构在经济发展中扮演着重要的角色。
基于PCA-RBF神经网络的PPP项目风险智能评价研究陆晓琴;黄元君;王喜【摘要】随着新一轮政府和社会资本合作(public—private—parmership,PPP)模式在基础设施领域的推广运用,对其风险评估也开始备受关注.鉴于PPP项目风险影响因素众多和传统评估方法过度依赖主观评价等问题,在构建PPP项目风险评价指标体系的基础上,通过将主成分分析(principal component analysis,PCA)技术降维并结合模糊综合评价结果,建立自适应的径向基神经网络(RBF)的智能风险评价模型,并以入库的浙江省发改委10个PPP项目为例进行实证检验,结果显示3个项目处于风险较小、6个项目处于风险不大、1个项目处于风险中等.PCA-RBF智能评价模型所训练预测的结果与模糊综合评价结论一致,且在一定程度上提高了计算效率、增强了评价的客观性,为PPP项目风险智能评估提供理论上的参考.%With new round promotion and application of PPP (public—private—partnership) model in infrastructure,much attention has been given to its risk assessment.In view of the many influence factors to the PPP project risk and traditional methods relying too much on subjective evaluation,this paper,on the basis of building the PPP project risk evaluation index system,develops an adaptive RBF neural network intelligent risk evaluation model by PCA dimension reduction technology combined with fuzzy comprehensive evaluation results,taking for example those ten PPP projects put in storage by Zhejiang Provincial Development and Reform Commission for empirical test.Results show less risk for three out of them,httle risk for six and medium risk for one.The results of training and prediction of PCA-RBF intelligent evaluation model is consistent with thefuzzy comprehensive evaluation conclusion,which improves the computational efficiency,and enhances the objectivity of the evaluation.It also provides theoretical reference for intelligent assessment of PPP project risks.【期刊名称】《科技管理研究》【年(卷),期】2017(037)014【总页数】5页(P59-63)【关键词】PPP项目;PCA-RBF神经网络;智能评价模型;风险评估【作者】陆晓琴;黄元君;王喜【作者单位】嘉兴学院,浙江嘉兴314001;东华大学,上海201620;嘉兴职业技术学院,浙江嘉兴 314036;嘉兴学院,浙江嘉兴314001【正文语种】中文【中图分类】F283;F224政府和社会资本合作PPP(public—private—partnership)模式作为一种创新型的融资机制,在新型城镇化和“一带一路”背景下得到了广泛的应用,而其组织结构的特殊性伴随着其风险的复杂性,如何有效评价其风险便成为了当下各级政府部门、金融机构等所亟待解决的难题[1-2]。
基于PCA-SaDE-ELM优化算法的煤层底板破坏深度预测及
工程应用
刘世伟;赵家鑫;孙利辉;袁乐忠;杨江华;王中海
【期刊名称】《煤炭技术》
【年(卷),期】2024(43)6
【摘要】基于煤层底板破坏深度实测结果统计分析,通过优化数据样本空间,引入自适应差分进化改进的极限学习机算法,构建了煤层底板破坏深度预测模型,与实测结果对比分析验证,并应用于云驾岭煤矿9^(#)煤层底板破坏深度预测。
结果表明:模型预测的最大绝对误差不超过0.7 m,相比现有其他预测模型,该模型预测精度提高约70%;云驾岭煤矿19101、19103和19105这3个典型工作面的破坏深度分别为10.80、10.94、11.34 m,介于规范方法和滑移场理论预测结果之间,进一步反映了模型的可靠性;建议对9#煤层底板加固改造后再进行回采。
相关研究成果可为我国煤层底板破坏风险管理和煤炭资源的优化回采布置提供一定的理论支撑。
【总页数】5页(P69-73)
【作者】刘世伟;赵家鑫;孙利辉;袁乐忠;杨江华;王中海
【作者单位】河北工程大学水利水电学院;河北工程大学矿业与测绘学院;河北冀中邯峰矿业有限公司武安云驾岭矿
【正文语种】中文
【中图分类】TD327
【相关文献】
1.基于连续型小波神经网络的煤层底板破坏深度预测
2.基于数据优化的BP神经网络煤层底板破坏深度预测
3.基于脆弱性指数法的煤层底板破坏深度预测
4.煤层底板破坏深度多因素影响指标分析与深度预测
5.基于粒子群优化极限学习机的煤层底板破坏深度预测
因版权原因,仅展示原文概要,查看原文内容请购买。
基于GRA-PCA-GA-BP网络模型的铁路货运量预测分析侯维磊;刘力军;崔晶娜【摘要】科学预测铁路货运量能够为我国铁路政策的制定、铁路货运相关规划的出台提供决策支持,对促进我国铁路货运向现代物流转型具有重要意义.为保证铁路货运量预测精度,在数据样本较少且数据波动较大时,提出基于GRA PCA-GA BP网络模型进行铁路货运量预测的方法.利用灰色关联分析和主成分分析对影响铁路货运量的输入指标进行预处理,再利用遗传算法优化取得BP神经网络的权值和阀值,进而求得更为准确的铁路货运量预测值.通过实例分析验证,GRA PCA GA BP网络模型有效、可靠,具有较高的预测精度.【期刊名称】《铁道货运》【年(卷),期】2017(000)001【总页数】5页(P54-58)【关键词】铁路货运量;预测;灰色关联分析;主成分分析;遗传算法;BP神经网络【作者】侯维磊;刘力军;崔晶娜【作者单位】石家庄铁道大学经济管理学院,河北石家庄050043;河北经贸大学管理科学与工程学院,河北石家庄050061;中海油销售河北有限公司开发工程部,河北石家庄050000【正文语种】中文【中图分类】U294.1+3铁路货运量预测可以为国家或地区的交通、物流、经济等发展规划提供参考,货运量预测结果的科学、合理、有效性对于决策者的决策具有重要影响。
目前关于货运量预测的研究成果较为丰富,王治[1]将支持向量机和遗传算法结合预测铁路货运量;耿立艳等[2]利用灰色关联分析和最小二乘法支持向量机 (LSSVM)结合的方法对铁路货运量进行预测;李萍[3]在灰色关联分析的基础上采用 GA-BP 模型预测铁路货运量;王栋等[4]采用灰色关联分析和 BP 网络结合的方法进行预测铁路货运量;李瑞等[5]运用灰色关联度法对铁路货运量的关键影响因素进行研究。
这些研究成果对铁路货运量预测的科学研究具有重要意义,但均存在数据样本较少、数据波动较大、噪声较多,致使预测误差较大等问题。
Value Engineering 0引言随着社会经济的发展,个人消费贷款越来越普及,如何评估贷款人的信用是各商业银行亟需解决的问题。
个人信用评估是对可能引起信用风险的因素进行定性分析、定量计算,以测算消费者的违约概率,可通过现有的样本数据建立模型预测未来申请人的信用行为,以区分出“好”客户和“坏”客户[1](即能否还本付息),它属于多属性决策的分类问题。
目前人们已经提出多种分类方法[1-6],并取得一定的应用效果,但由于数据属性较多,属性间的自相关性等各种实际情况使得信用评估问题仍未得到有效解决。
因此研究有效的信用评估方法具有理论意义和实用价值。
近年来,以神经网络为代表的新型客户分类技术得到了广泛应用。
BP (Back Propagation )是目前应用最广泛的神经网络模型之一,它是一种按误差逆传播算法训练的多层前馈网络,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
但是,BP 神经网络有诸如收敛速度慢、不能保证收敛到全局最小点、网络的中间层及其单元数选取无理论指导以及网络学习和记忆的不稳定性等缺陷。
于是,人们提出了许多改进算法,如用具有很强的全局优化能力的遗传算法(Genetic Algorithm ,GA )优化神经网络的初始权值和阈值,以保证神经网络更精确地输出预测函数[7]。
事实上,我们需要信用评估的数据属性很多(如行为人的自然属性、社会属性、行为属性等),每个属性都包含多个维度,且变量间具有相关性,若直接对样本数据进行评估,则需要较好的硬件基础和较长的模型运行时间。
而主成分分析(Principal Component Analysis,PAC )在处理信息重叠问题上具有巨大的优势和潜力,能更好地抓住事物的主要矛盾,大大缩减信用评估问题的空间维度,使模型得到简化。
基于此,本文将PCA-GA-BP 三者结合,提出一种基于主成分分析和遗传算法优化神经网络的个人信用评估方法,即利用主成分分析在处理大数据量、消除冗余信息等方面的优势,减少BP 网络训练数据的维度;利用遗传算法来训练BP 网络的权重和阈值形成遗传算法优化的神经网络模型(GA-BP ),以克服BP 网络的不足。
1PCA-GA-BP 的基本原理1.1GA-BP 网络预测模型一般BP 网络采用3层结构:输入层的个数由输入数据的特征维数决定;输出层的个数由输出状态数确定;隐含层节点个数根据经验公式计算,即p=m+l 姨+a ,a 为1~10的常数,m 个输入节点,l 个输出节点。
BP 网络的具体结构如图1所示。
因神经网络权值及阈值的随机初始化导致网络泛化能力不强,易陷入极小值,故需寻求最优权值及阈值。
已有的研究成果表明GA 优化神经网络具有很好的可行性。
GA 应用于神经网络的一个重要方面是用来优化神经网络的权重和阈值。
采用GA 训练神经网络的权值和阈值的优点在于不使用梯度信息、搜索效率高、具有很强的鲁棒性,———————————————————————基金项目:江门市哲学社会科学项目(JM2013B05)。
作者简介:王天擎(1976-),男,湖南长沙人,副教授,主要从事智能算法的研究工作;刘小清(1985-),女,江西萍乡人,硕士,研究方向为数据分析。
商业银行的个人信用评估研究:基于PCA-GA-BP 算法A Study on Individual Credit Evaluation for Commercial Bank Based on PCA-GA-BP王天擎WANG Tian-qing ;刘小清LIU Xiao-qing(五邑大学经济管理学院,江门529020)(School of Economics and Management ,Wuyi University ,Jiangmen 529020,China )摘要:随着个人消费贷款的普及,贷款人的个人信用评估变得尤为重要。
本文选取德国和澳大利亚某商业银行的个人信贷数据为样本数据,采用主成分分析提取样本数据的主成分,通过遗传算法优化神经网络的网络结构、初始连接权值和阀值,然后将优化的神经网络算法用于个人信用评估。
与其他算法的准确率比较的结果表明,基于主成分分析—遗传算法—神经网络算法的个人信用评估准确率要高,而且模型的网络结构得到优化,运算时间也有缩短。
Abstract:This paper selects the personal credit data of a commercial bank in Germany and Australia,extracts the main component by principal component analysis,and then optimizes network structure,initial connection weights and thresholds of neural network by genetic algorithm,finally,according to this improved neural network technology,evaluates personal credit.Finally,it compares the accuracy based on this algorithm to these accuracies based on other algorithms.According to the results,the accuracy based on this algorithm is better than these accuracies based on other algorithms.关键词:商业银行;个人信用评估;主成分分析;遗传算法;BP 算法Key words:business bank ;personal credit evaluation ;PCA ;GA ;BP 中图分类号:F22;F830.5文献标识码:A 文章编号:1006-4311(2014)31-0161-03图1神经网络结构图·161·DOI:10.14018/13-1085/n.2014.31.090价值工程可以克服传统BP 算法易陷入局部极小和收敛速度慢的缺点。
GA-BP 模型通过设置相关参数和种群初始化,确定适应度函数、选择、交叉、变异等操作,当达到最大进化代数或连续几个最大适应值没有变化时,将最优个体反编码为BP 网络的连接权值和阀值。
采用此时的最优初始连接权值和阈值进行重新训练,建立最优信用评估模型预测个人信用,并输出最优预测结果。
1.2PCA 提取主成分为避免漏选对因变量有重要影响的因素,通常尽可能多地选择样本数据,而且实际中属性间或多或少地存在相关性。
当这些因素维度较高或属性的重叠性较高时,把它们作为BP 的输入,会增加模型的输入维数,使网络结构复杂,影响模型的预测性能。
个人信用评估问题属于多属性决策问题,PCA 的优势在于能够有效实现知识约减、去除属性相关性。
运用PCA 对GA-BP 的输入数据进行降维,简化GA-BP 的输入数据,在信息损失不太多的情况下,用少数几个主成分替代原始变量,以减少GA-BP 的学习任务、加速其学习进程。
因个人信用样本数据具有不同量纲,且属性也相差悬殊,故需对其进行数据标准化处理:x i *=x i -E(x i )var(x i )姨,i=1,2,…p其中,var(x i )=σii (i=1,2,…p),p 为样本数据的维数。
将样本数据归一化为均值为0、方差为1的数据而变成标准化样本。
数据预处理后进行主成分分析,具体方法参见文献[8]。
1.3PCA-GA-BP 模型构建在模型的构建过程中,首先通过PCA 法去除GA-BP 模型输入数据的属性相关性,提取主成分,然后通过这些主分量来进行GA-BP 学习与预测信用类别,最终获得结果。
具体过程如图2所示。
2实证分析本文采用德国某商业银行(下文简称德国数据)和澳大利亚某商业银行(下文简称澳大利亚数据)的个人信贷数据(部分数据)进行实证研究。
德国数据共有1000个样本,好客户样本700个、坏客户样本300个,每个样本20个属性;澳大利亚数据总共有690个样本,好客户样本383个、坏客户样本307个,每个样本14个属性。
考虑模型输入的方便性,这两个数据集的所有属性都换成代号。
按照Kaiser 原则,我们选取特征值大于1的主成分,其余舍去。
本文用PCA 提取的主成分结果见表1。
德国信用数据的8个主成分分别是:现有支票账户、信贷期限、信贷历史纪录、贷款目的、贷款金额、储蓄存款账户、分期付款金额占可支配收入比率、资产,对应的代号分别为:v1、v2、v3、v4、v5、v6、v9和v19;而澳大利亚信用数据的5个主成分代号分别是:v1、v3、v4、v5和v7。
现定义GA 的运行参数,具体数据见表2。
另外,根据经验,BP 网络的隐含层节点数取p =m+l 姨+a ,a 为1~10的常数,即德国数据、澳大利亚数据分别取[4,13],[3,12]中任意一个整数即可,本文取隐含层节点为10和9。
下面是模型运行结果。
随着遗传代数的增加,这两组数据的误差变化如图3所示。
为证明本算法的有效性,用matlab 中的SVM 工具箱、决策树工具箱运行本文数据,各模型的分类精度比较见表表1数据的PCA 提取结果数据类型主成分数信息利用率/%德国数据澳大利亚数据8588.286%85.66%表2GA 运行参数种群大小(NIND)最大遗传代数(MAXGEN)变量的二进制位数(PRECI)交叉概率(px )变异概率(pm )代沟(GGAP)5050100.70.010.95图2模型处理过程图图3数据误差变化图·162·Value Engineering 0引言21世纪以来,IT 行业随着信息化建设的快速发展而发生了巨大变化,开始逐渐规模化与集团化,广大客户对IT 企业的后续持续服务能力也更为重视。
中小IT 企业逐渐陷入困境,企业家们开始认识到在只有在激烈的市场竞争中进行转型升级才能生存并发展。
1企业转型升级的含义与内容所谓企业转型升级是指企业对自身长期的经营方向、远景目标、运营模式及其组织方式等进行的整体性转变,并对如何实现这个转变而进行的指导性与总体性策划,这是企业重新塑造其社会形象与市场竞争优势的过程,最终使企业能够达到新形态。
企业转型升级通常包含技术、市场以及人才的战略转型升级,企业的战略转型一般具有风险性、竞争性、全局性与指导性等特征。
2中小型IT 企业特征分析根据相关规定可知,中小型IT 企业指主要从事计算———————————————————————作者简介:钟伟开(1983-),男,广东广州人,华南理工大学工商管理学院2008级技术经济管理专业,技术总监,研究方向为技术经济管理。