计量地理学统计分析方法2回归分析
- 格式:pptx
- 大小:827.79 KB
- 文档页数:66
本试验主要是引导学生掌握利用 SPSS 软件进行回归分析的基本方法,包括一元线性回归分析,多元线性回归分析,包含虚拟变量的线性回归分析,曲线参数估计法,二值多元Logistic 回归分析。
特别是,学生应掌握在 SPSS 软件中进行多元线性回归方法和曲线参数的估计方法。
线性回归分析(Linear 过程)回归分析(Regression) 是研究一个自变量或多个自变量与一个因变量(Dependent)之间是不存在某种线性关系或非线性关系的一种统计学分析方法。
而线性回归分析(Linear Regression) 是研究一个或多个自变量(independent)与一个因变量之间是否存在某种线性关系的统计学方法。
在菜单中选择Analyze==>Regression==>liner,系统弹出线性回归对话框如下:【Dependent 框】用于选入回归分析的应变量。
【Block 按钮组】由Previous 和Next 两个按钮组成,用于将下面Independent 框中选入的自变量分组。
由于多元回归分析中自变量的选入方式有前进、后退、逐步等方法,如果对不同的自变量选入的方法不同,则用该按钮组将自变量分组选入即可。
【Independent 框】用于选入回归分析的自变量。
【Method 下拉列表】用于选择对自变量的选入方法,有Enter (强行进入法)、Stepwise (逐步法)、Remove (强制剔除法)、Backward (向后法)、Forward (向前法) 五种。
该选项对当前Independent 框中的所有变量均有效。
【Selection Variable 框】选入一个筛选变量,并利用右侧的Rules 钮建立一个选择条件,这样,只有满足该条件的记录才会进入回归分析。
【Case Labels 框】选择一个变量,他的取值将作为每条记录的标签。
最典型的情况是使用记录ID 号的变量。
【WLS>>钮】可利用该按钮进行权重最小二乘法的回归分析。
计量地理学名词解释1.统计分组:根据研究目的,按照一定的分组标志将地理数据分成若干组。
2.间隔尺度数据:是以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对量。
3.定性数据:表示地理现象或要素只有性质上的差异,而没有数量上的变化。
4.属性数据:主要用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属性特征的数据。
5.计量地理学:是把数学和电子计算机技术应用于地理学的一门综合性学科。
6.众数:众数就是一个地理观测(或调查)系列中出现频数最多的那个数。
7.中位数:将各个数据从小到大排列,居于中间位置的那个数就是中位数。
8.计量革命:20世纪50年代末期,一些地理学者开展地理学定量化研究,建立定量模式。
这种定量化研究之热潮,就是所谓的计量运动。
9.空间数据:主要用于描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存在和发展的地理位置、区域范围及空间联系的数据。
10.多样化指数:研究一个国家、地区或城市综合发展的评定指数。
11.峰度系数:测量地理数据在均值附近的集中程度。
12.计算地理学:以向量或并行处理器为基础的超级计算机为工具,对“整个”“大容量”资料所表征的地理问题实施高性能计算,探索构筑新的地理学理论应用模型。
13.集中化指数:是一个描述地理数据分布的集中化程度的指数。
14.偏度系数:测度地理数据分布的不对称性情况,刻画了以平均值为中心的偏向情况。
15.变异系数:是标准差与平均数的比值,表示地理数据的相对变化(波动)程度。
16.锡尔系数:用于对经济发展、收入分配等均衡(不均衡)状况进行定量化的描述。
17.基尼系数:就是通过两组数据的对比分析,纵、横坐标均以累计百分比表示,从而作出洛伦兹曲线,然后再计算得出的集中化指数。
18.方差:从平均概况衡量一组地理数据与平均值的离散程度。
19.洛伦兹曲线:使用累计频率曲线研究工业化的集中化程度的曲线。
20.复相关系数:表示几个要素与某一个要素之间的复相关程度的指标。
《计量地理学》实验指导§2 运用EXCEL、SPSS进行相关分析和线性、非线性回归分析回归分析是处理两个及两个以上变量间线性依存关系的统计方法。
可以通过软件EXCEL 和SPSS实现。
一、利用EXCEL软件实现回归分析以第4章习题2为例,运用EXCEL进行回归分析。
首先在菜单中选择工具==>加载宏,把“分析工具库”和“规划求解”加载上。
然后在“工具”菜单中将出现“数据分析”选项。
点击“数据分析”中的“回归”,将出现对话框如下图1所示。
图1 回归界面【输入】用以选择进行回归分析的自变量和因变量。
在“Y值输入区域”内输入B7:B11,在“X值输入区域”输入A7:A11,如果是多元线性回归,则X值的输入区就是除Y变量以外的全部解释变量“标志”;置信度水平为95%,输出结果选择在一张新的工作表中;“残差分析”,并绘制回归拟合图,点击“确定”即得到残差表。
【输出选项】用于指定输出结果要显示的内容,包括是否需要残差表及图,参差的正态分布图等。
输出结果解释图 2 回归结果显示回归结果分为三部分:(1)回归统计:包括R^2 及调整后的R^2、标准误差和观测值个数(2)方差分析:包括回归平方和、残差平方和总离差平方和以及它们的自由度、均方差和F通机量(3)回归方程的截距、自变量的系数以及它们的t统计值、95%的上下限值图3 残差与子变量之间的散点图图4 预测值与实际值散点图同样,如果在“数据分析”中点击“相关系数”,可以对多个变量进行相关系数的计算。
二、.利用SPSS软件实现回归分析在SPSS软件中,同样可以简单的实现回归分析,因为回归分析包含了线性回归与曲线拟合两部分内容,首先来看线性回归分析过程(LINEAR)(一)线性回归分析过程(LINEAR)例如,课本中数据,把降水量(P)看作因变量,把纬度(Y)看作自变量,在平面直角坐标系中作出散点图,发现它们之间呈线性相关关系,因此,可以用一元线性回归方程近似地描述它们之间的数量关系。
1、地理数据是用一定的测度方式描述和衡量地理对象的有关量化标志,是对地理问题进行定量化描述和研究的基础,是一切数学方法在地理学中应用的先决条件。
2、相关分析:分析地理要素之间的相关关系。
回归分析:拟合地理要素之间的数量关系、预测发展趋势。
方差分析:研究地理数据分布的离散程度。
时间序列分析:用于地理过程时间序列的预测与控制研究。
主成分分析:用于地理数据的降维处理及地理要素的因素分析与综合评价。
聚类分析:用于各种地理要素分类、各种地理区域划分趋势面分析:用于拟合地理要素的空间分布形态。
3、对计量地理学的评价评价一:在地理学的学科体系中,“计量地理学”担负着方法论的任务,将数学方法应用于地理问题的认识、分析和研究,有利于地理学由定性描述走向定量、定位的分析。
地理系通过“计量地理学”的教学,让本科学生了解学科发展的特点和趋势,掌握计量地理学的基础知识、常用方法,理解数学模型在实际工作中的作用和意义。
结合实际问题的分析,是学生能够正确处理数据资料,建立起适宜的数学模型,把数学方法同现实问题紧密结合,培养学生的实际动手能力,为其他课程的学习打下了良好的数理基础,也为从事实际工作准备了条件,可以说,这门课程的教学对于提高学生的素质发挥了积极作用。
评价二:计量地理学让本科学生了解学科发展的特点和趋势,掌握计量地理学基础知识、基本数学模型,着重培养学生正确处理地理数据资料,利用定量方法解决实际问题的能力。
对于提高学生的综合素质,起到了重要的作用。
4、地理数据的基本特征(简答)一、数量化、形式化与逻辑化二、不确定性三、多种时空尺度四、多维性一、数量化、形式化与逻辑化。
定量化的地理数据是建立地理数学模型的基础,其作用为:确定模型的参数、给定模型运行的初值条件;检验模型的有效性。
形式化、逻辑化与数量化,是所有地理数据的共同特征。
二、不确定性。
各种原因所导致的数据误差。
(1)地理系统的复杂性。
(2)数据误差。
三、多种时空尺度。