多元统计分析方法汇总

  • 格式:doc
  • 大小:462.00 KB
  • 文档页数:23

下载文档原格式

  / 23
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元统计分析方法概述

目录

引言………………………………………………………………第四页多元线性回归方法原理简介……………………………………第四页多元线性回归案例叙述分析……………………………………第四页多元线性回归分析方法在社会的应用…………………………第八页聚类分析方法原理简介…………………………………………第八页聚类分析案例叙述分析…………………………………………第八页聚类分析方法在社会的应用……………………………………第十页主成份分析方法原理简介………………………………………第十页主成份分析案例叙述分析……………………………………第十一页主成份分析方法在社会的应用………………………………第十四页因子分析方法原理简述………………………………………第十四页因子分析案例叙述分析………………………………………第十四页因子分析方法在社会的应用…………………………………第十七页偏最小二乘回归分析方法原理简介…………………………第十八页偏最小二乘回归分析案例叙述分析…………………………第十九页偏最小二乘回归分析方法在社会的应用…………………第二十一页总结…………………………………………………………第二十一页参考文献……………………………………………………第二十二页谢辞…………………………………………………………第二十三页

摘要

本文主要概述了多元统计分析的各个方法,然后在后面介绍了多元统计分析方法在社会生活等方面的实际案例以及分析。并由案例分析找出各个统计分析方法的对应使用领域。

关键词

多元统计分方法回归分析聚类分析因子分析主成份分析偏最小二乘回归分析因素股市模型财务

Summary

The Chemometrics includes chemical experimental design and optimization (such as orthogonal design, simplex method and variance analysis), chemical pattern recognition (such as clusters, PCA, k-nearest neighbour analysis, SIMCA and ANN), multi-variance calibration (such as MLR, CLS, PCR and PLS) and spectrum analysis (Such as ITTFA, EFA and FSWEFA), signal processing (such as filtering, smoothing, derivation and convolution).

keyword

multivariate statistical analysis method regression analysis cluster analysis factor analysis principal component analysis linear least squares estimate complication equity market model finance

一、引言

多元统计分析的基本方法。多元统计分析是数理统计学30 多年来迅速发展起来的一个分支随着计算机的普及,各种统计软件不断推出,多元统计分析方法已广泛应用到教育管理的各个领域。多元统计分析是运用数理统计的方法来研究多变量问题的理论和方法,它是一元统计学的推广在许多教育问题中,教育现象涉及到的变量不是一个,而是多个变量,且这些变量间又存在一定的联系,需要处理多个变量的观测数据,如果用一元统计方法就要对多方面分别进行分析,而一次分析一个方面,同时忽视了各方面之间存在的相关性,这样会丢失很多信息,分析的结果不能客观全面地反映情况。

多元统计分析方法主要包括线性回归分析方法、判别分析方法、聚类分析方法、主成份分析方法、因子分析方法、对应分析方法、典型相关分析方法以及偏最小二乘回归分析方法等。在这里我们主要针对了最常用的回归分析方法、聚类分析方法、主成份分析方法、因子分析方法以及偏最小二乘回归分析方法结合实际案例进行分析总结。最终总结出各个方法所使用的领域。

二、多元线性回归分析方法

(一)多元线性回归分析方法原理简介

根据相关性的大小把变量分组,使得同组内的变量之间的相关性较高,但不同组的变量相关性较低各个因子间互不相关,所有变量都可以表示成公因子的线性组合。因子分析的目的就是减少变量的数目,用少数因子代替所有变量去分析整个问题。

(二)多元线性回归案例叙述分析

公路客货运输量多元线性回归预测方法探讨

1.背景

公路客、货运输量的定量预测,近几年来在我国公路运输领域大面积广泛地开展起来,并有效的促进了公路运输经营决策的科学化和现代化。

关于公路客、货运输量的定量预测方法很多,本文主要介绍多元线性回归方法在公路客货运输量预测中的具体操作。根据笔者先后参加的部、省、市的科研课题的实践,证明了多元线性回归方法是对公路客、货运输量预测的一种置信度较高的有效方法。

2.多元线性回归预测

线性回归分析法是以相关性原理为基础的.相关性原理是预测学中的基本原理之一。由于公路客、货运输量受社会经济有关因素的综合影响。所以,多元线性回归预测首先是建立公路客、货运输量与其有关影响因素之间线性关系的数学模型。然后通过对各影响因素未来值的预测推算出公路客货运输量的预测值。

3.公路客、货运输量多元线性回归预测方法的实施步骤:

影响因素的确定

影响公路客货运输量的因素很多,主要包括以下一些因素:

(1)客运量影响因素

人口增长量、客车保有量、国民生产总值、国民收入工农业总产值、基本建设投资额、城乡居民储蓄额铁路和水路客运量等。

(2)货运量影响因素

人口货车保有量(包括拖拉机),国民生产总值,国民收入、工农业总产值,基本建设投资额,主要工农业产品产量,社会商品购买力,社会商品零售总额.铁路和水运货运量等。

上述影响因素仅是对一般而言,在针对具体研究对象时会有所增减。因此,在建立模型时只须列入重要的影响因素,对于非重要因素可不列入模型中。若疏漏了某些重要的影响因素,则会造成预测结果的失真。另外,影响因素太少会造成模型的敏感性太强.反之,若将非重要影响因素列入模型,则会增加计算工作量,使模型的建立复杂化并增大随机误差。

影响因素的选择是建立预测模型首要的关键环节,可采取定性和定量相结合的方法进行.影响因素的确定可以通过专家调查法,其目的是为了充分发挥专家的聪明才智和经验。

具体做法就是通过对长期从事该地区公路运输企业和运输管理部门的领导干部、专家、工作人员和行家进行调查。可通过组织召开座谈会.也可以通过采访,填写调查表等方法进行,从中选出主要影响因素。为了避免影响因素确定的随意性,提高回归模型的精度和减少预测工作量,可通过查阅有关统计资料后,再对各影响因素进行相关度(或关联度)和共线性分析,从而再次筛选出最主要的影响因素.所谓相关度分析就是将各影响因素的时间序列与公路客货运量的时间序列做相关分析,事先确定—个相关系数,对相关系数小于的影响因素进行淘汰.关联度是灰色系统理论中反映事物发展变化过程中各因素之间的关联程度,可通过建空公路客、货运量与各影响影响因素之间关联系数矩阵,按一定的标准系数舍去关联度小的影响因素.所谓共线性是指某些影响因素之问存在着线性关系或接近于线性关系。由于公路运输经济自身的特点,影响公路客,货运输量的诸多因素之问总是存在着一定的相关性,持别是与国民经济有关的一些价值型指标。

4.建立经验线性回归方程利用最小二乘法原理寻求使误差平方和达到最小的经验线性回归方程:

y——预测的客、货运量

g——各主要影响因数

5.数据整理

对收集的历年客、货运输量和各主要影响因素的统计资料进行审核和加工整理是为了保证预测工作的质量。

资料整理主要包括下列内容:

(1)资料的补缺和推算。

(2)对不可靠资料加以核实调整.对查明原因的异常值加以修正。

(3)对时间序列中不可比的资料加以调整和规范化;对按当年价格计算的价值指标应折算成按统……。

6.多元线性回归模型的参数估计

在经验线性回归模型中,是要估计的参数,可通过数理统计理论建立模型来确定。在实际预测中,可利用多元线性回归复相关分析的计算机程序来实现对模型参数的估计值进行检验。

此项工作的目的在于判定估计值是否满意、可靠。一般检验工作须从以下几方面来进行。