第11章 应用于序列和组的统计图
- 格式:ppt
- 大小:173.00 KB
- 文档页数:15
© 陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。
第11章二值选择模型11.1 二值选择模型如果被解释变量y离散,称为“离散选择模型”(discrete choice model)或“定性反应模型”(qualitative response model)。
最常见的离散选择模型是二值选择行为(binary choices)。
比如:考研或不考研;就业或待业;买房或不买房;买保险或不买保险;贷款申请被批准或拒绝;出国或不出国;回国或不回12国;战争或和平;生或死。
假设个体只有两种选择,比如1y =(考研)或0y =(不考研)。
最简单的建模方法为“线性概率模型”(Linear Probability Model ,LPM):1122(1,,)i i i K iK i i i y x x x i n βββεε'=+=+= +++x β (11.1)其中,解释变量12()i i i iK x x x '≡ x ,而参数12()K βββ'≡ β。
LPM 的优点是,计算方便,容易得到边际效应(即回归系数)。
3LPM 的缺点是,虽然y 的取值非0即1,但根据线性概率模型所作的预测值却可能出现ˆ1y>或ˆ0y <的不现实情形。
图11.1 线性概率模型4为使y 的预测值介于[0,1]之间,在给定x 的情况下,考虑y 的两点分布概率:P(1|)(,)P(0|)1(,)y F y F ==⎧⎨==-⎩x x x x ββ (11.2)函数(,)F x β称为“连接函数”(link function) ,因为它将x 与y 连接起来。
y 的取值要么为0,要么为1,故y 肯定服从两点分布。
连接函数的选择具有一定灵活性。
通过选择合适的连接函数(,)F x β(比如,某随机变量的累积分布函数),可保证ˆ01y≤≤,并将ˆy 理解为“1y =”发生的概率,因为5E(|)1P(1|)0P(0|)P(1|)y y y y =⋅=+⋅===x x x x (11.3)如果(,)F x β为标准正态的累积分布函数,则P(1|)(,)()()y F t dt φ'-∞'===Φ≡⎰x x x x βββ (11.4)()φ⋅与()Φ⋅分别为标准正态的密度与累积分布函数;此模型称为“Probit ”。
使用统计图表分析时间序列时间序列分析是一种重要的统计方法,用于研究数据随时间变化的规律。
统计图表是时间序列分析中常用的工具,它能够直观地展示数据的趋势、周期性和突变等特征。
本文将介绍几种常见的统计图表,并通过实例分析展示其应用。
首先,我们来介绍折线图。
折线图是最常见的时间序列图表之一,它通过连接各个数据点绘制出一条折线,用于展示数据随时间变化的趋势。
例如,我们可以使用折线图分析某地区的月均气温变化。
通过观察折线图,我们可以发现气温在夏季呈上升趋势,冬季呈下降趋势,同时还能发现一些周期性的变化,如每年的春夏秋冬季节变化。
其次,我们来介绍柱状图。
柱状图是一种用矩形柱子表示数据大小的图表,也常用于时间序列分析。
例如,我们可以使用柱状图分析某公司每月销售额的变化。
通过观察柱状图,我们可以发现销售额在每年的某个月份呈明显的增长或下降,这可能与季节性因素或促销活动有关。
此外,柱状图还可以用于比较不同时间段的数据,如比较不同年份的销售额。
除了折线图和柱状图,还有其他一些常见的统计图表可用于时间序列分析。
例如,散点图可以用于展示两个变量之间的关系,如某商品价格与销量的关系。
雷达图可以用于展示多个变量在不同时间点的数值大小,如某公司在不同季度的销售额、利润和市场份额等。
箱线图可以用于展示数据的分布情况,如某商品每天的销售额的最大值、最小值、中位数和离群值等。
接下来,让我们通过一个实例来展示如何使用统计图表分析时间序列。
假设我们想研究某城市的人口增长情况。
我们收集了该城市从2000年到2020年的人口数据,并使用折线图进行分析。
通过观察折线图,我们发现人口数量在这段时间内呈现出逐年增长的趋势,但增长速度在不同年份有所不同。
我们还发现,在某些年份,人口增长速度明显加快,可能与政府的人口政策、经济发展等因素有关。
除了观察趋势,我们还可以使用柱状图分析该城市的人口结构变化。
我们将人口按年龄段进行分类,并将各年龄段的人口数量用柱状图展示。