回归分析实验课 实验8
- 格式:doc
- 大小:360.50 KB
- 文档页数:16
河北工业大学经济管理学院《计量经济学》课程上机指导书(2014年春季学期)班级:学号:姓名:2014年3月上机实习指导书1——EViews的基本使用一、实验目的1.认识计量经济学软件包EViews82.掌握EViews8的基本使用3.建立工作文件并将数据输入存盘二、实验要求熟悉E Views的基本使用三、实验数据四、实验内容(一)怎样启动EViews 8?安装软件后,开始==>程序==> Eviews 8==>Eviews 8。
或者,在桌面双击"EVIEWS"图标,或者双击Eviews8工作文件,进入EVIEWS,启动“EVIEWS”软件。
(二)怎样用EViews 8开始工作进入Eviews8 窗口以后,用户必须创建一个新的工作文件或者打开一个已经存在的工作文件,才能开始工作。
1、创建一个新的工作文件在主菜单上选择File,并点击其下的New,然后选择Workfile。
Eviews将弹出Workfile Creat 窗口。
要求用户输入工作文件的workfile structure type: 如果你的数据是非日期型的截面数据或时间间隔不一致的时间序列数据选unstructured/undated,然后在data specification的Observations 中输入观测值个数;如果你的数据是日期型的选dated——regular frequency,然后在data specification中选择数据的频度,如:年度,季度,月度,周等,最后输入开始日期和结束日期:如果数据是月度数据,则按下面的形式输入(从Jan. 1950 到 Dec. 1994): 1950:01 1994:12,如果数据是季度数据,则按下面的形式输入(从1st Q. 1950到3rd Q. of 1994):1950:1 1995:3,如果数据是年度数据,则按下面的形式输入(从1950 到 1994) 1950 1994,如果数据是按周的数据,则按下面的形式输入(从2001年1月第一周到2010年1月第四周): 2001 1 2010 4;如果你的数据是平衡的面板数据选balanced panel,然后在data specification中输入起始日期(同时间序列数据)及观测对象的个数(同截面数据)。
SPSS作业8:二项Logistic回归分析为研究和预测某商品消费特点和趋势,收集到以往胡消费数据.数据项包括是否购买,性别,年龄和收入水平。
这里采用Logistic回归的方法,是否购买作为被解释变量(0/1二值变量),其余各变量为解释变量,且其中性别和收入水平为品质变量,年龄为定距变量。
变量选择采用Enter方法,性别以男为参照类,收入以低收入为参照类。
(一)基本操作:(1)选择菜单Analyz e-Regression-Binary Logistic;(2)选择是否购买作为被解释变量到Dependent框中,选其余各变量为解释变量到Covariates框中,采用Enter方法,结果如下:消费的二项Logistic分析结果(一)(强制进入策略)Categorical Variables CodingsFrequency Parameter coding (1) (2)收入低收入132 .000 .000中收入144 1.000 。
000高收入155 。
000 1。
000性别男191 。
000女240 1.000分析:上表显示了对品质变量产生虚拟变量的情况,产生的虚拟变量命名为原变量名(编码)。
可以看到,对收入生成了两个虚拟变量名为Income(1)和Income(2),分别表示是否中收入和是否高收入,两变量均为0时表示低收入;对性别生成了一个虚拟变量名为Gedder(1),表示是否女,取值为0时表示为男。
消费的二项Logistic 分析结果(二)(强制进入策略)Block 0: Beginning BlockClassification Table a,bObserved Predicted是否购买 Percentage Correct不购买购买Step 0是否购买不购买 269 0 100。
购买162。
0 Overall Percentage62。
4a 。
Constant is included in the model 。
实验设计与分析第六版课程设计一、设计背景实验设计与分析是统计学和实验设计学科的重要基础课程,旨在培养学生对实验数据进行分析和解释的能力,以及提高他们在设计和执行实验时的技能。
本课程设计旨在通过设计一个实验来巩固和运用所学的理论知识和实践技能,同时提高学生的创新思维和解决问题的能力。
二、设计目标本课程设计的主要目标如下:1.确保学生掌握实验设计和数据分析的基本理论知识和实践技能;2.培养学生的实验设计和数据分析能力,提高他们的创新思维;3.培养学生的沟通、协作和问题解决能力,以便他们能够在多学科团队中发挥重要作用。
三、设计流程1.确定研究问题:为了研究某个现象或事物,首先需要明确研究的目的并确定研究问题。
考虑到本课程的性质,我们将选择一个具体的实验进行分析。
2.建立假设:假设是实验的重要组成部分,它们提供了关于可能的结果和因果关系的推测,并指导实验的设计和数据分析。
3.确定研究设计:根据研究问题和假设确定实验的设计。
在这个阶段,需要考虑下面的问题:实验设计类型、因子水平、处理次数、重复次数等。
4.收集实验数据:使用合适的方法收集实验数据。
要求使用至少两种数据收集方法,如问卷、实验记录、测试、观察等。
5.进行数据分析:对收集到的数据进行统计分析。
推荐使用至少两种数据分析方法,如t检验、方差分析、回归分析等。
6.结果展示和分析:根据实验的结果进行数据展示,解释和讨论。
将数据分析和统计结果清晰地展示出来,并结合假设和研究问题进行解释和讨论。
7.撰写实验报告:根据实验流程和结果撰写实验报告。
要求使用科学的语言和格式,报告中应包括实验设计、数据收集、分析和结果展示等重要信息。
四、评估标准为了确保本课程设计的顺利进行和学生的有效学习,我们将使用下面的几个标准来评估学生的成绩:1.实验报告的完成情况和质量;2.学生对实验设计和数据分析的理解和应用;3.学生对实验设计和数据分析中遇到问题的解决能力;4.学生对团队合作和沟通的表现。
概率论与数理统计教程-魏宗舒-课后习题解答答案-7-8章概率论与数理统计教程-魏宗舒-课后习题解答答案-7-8章第七章假设检验7.1 设总体2(,)N ξµσ~,其中参数µ,2σ为未知,试指出下⾯统计假设中哪些是简单假设,哪些是复合假设:(1)0:0,1H µσ==;(2)0:0,1H µσ=>;(3)0:3,1H µσ<=;(4)0:03H µ<<;(5)0:0H µ=.解:(1)是简单假设,其余位复合假设 7.2 设1225,,,ξξξ取⾃正态总体(,9)N µ,其中参数µ未知,x 是⼦样均值,如对检验问题0010:,:H H µµµµ=≠取检验的拒绝域:12250{(,,,):||}c x x x x c µ=-≥,试决定常数c ,使检验的显著性⽔平为0.05解:因为(,9)N ξµ~,故9(,)25N ξµ~ 在0H 成⽴的条件下,00053(||)(||)53521()0.053cP c P c ξµξµ-≥=-≥??=-Φ=55()0.975,1.9633c cΦ==,所以c =1.176。
7.3 设⼦样1225,,,ξξξ取⾃正态总体2(,)N µσ,20σ已知,对假设检验0010:,:H H µµµµ=>,取临界域12n 0{(,,,):|}c x x x c ξ=>,(1)求此检验犯第⼀类错误概率为α时,犯第⼆类错误的概率β,并讨论它们之间的关系;(2)设0µ=0.05,20σ=0.004,α=0.05,n=9,求µ=0.65时不犯第⼆类错误的概率。
解:(1)在0H 成⽴的条件下,200(,)nN σξµ~,此时00000()P c P ξαξ=≥=10,由此式解出010c αµ-=+在1H 成⽴的条件下,20(,)nN σξµ~,此时101010()(P c P αξβξµ-=<=<=Φ=Φ=Φ由此可知,当α增加时,1αµ-减⼩,从⽽β减⼩;反之当α减少时,则β增加。
实验报告八实验课程:回归分析实验课专业:统计学年级:姓名:学号:指导教师:完成时间:得分:教师评语:学生收获与思考:实验八含定性变量的回归模型(4学时)一、实验目的1.掌握含定性变量的回归模型的建模步骤3.运用SAS计算含定性变量的各种回归模型的各参数估计及相关检验统计量二、实验理论与方法在实际问题的研究中,经常会遇到一些非数量型的变量。
如品质变量;性别;战争与和平。
我们把这些品质变量也称为定性变量,在建立回归模型的时候我们需要考虑到这些定性变量。
定性变量的回归模型分为自变量含定性变量的回归模型和因变量是定性变量的回归模型。
自变量含有定性变量的时候,我们一般引进虚拟变量,将这些定性变量数量化。
例如研究粮食产量问题,y为粮食产量,x为施肥量,另外考虑气候问题,分为正常年份和干旱年份两种情况,这个问题数量化方法就是引入一个0-1型变量D,令D i=1 表示正常年份,D i=0表示干旱年份,粮食产量的回归模型为:y i=β0+β1x i+β2D i+εi。
因变量是定性变量时,一般用logistic回归模型(分组数据的logistic回归模型,未分组数据的logistic回归模型,多类别的logistic回归模型),probit回归模型等。
三. 实验内容1.用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集xt103,建立y 对公司规模和公司类型的回归,并对所得到的模型进行解释。
2.研制一种新型玻璃,对其做耐冲实验。
用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。
3.某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其中毕业去向“1”=工作,“2”=读研,“3”=出国留学。
性别“1”=男生,“0”=女生。
用多类别的Logisitic回归分析影响毕业去向的因素。
四.实验仪器计算机和SAS软件五.实验步骤和结果分析1.用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集xt103,建立y 对公司规模和公司类型的回归,并对所得到的模型进行解释。
R检验中R方为0.8951,可以认为回归拟合效果较好。
回归方程通过F检验,说明模型是显著成立的。
由参数估计表,可以看出,全部变量都是显著的,回归方程为:21^06.8102.087.33x x y +-=其中,x2是虚拟变量,当公司类型为“互助”时,x2为0,为“股份”时,x2为1。
由方程可知,x2为1,即股份制公司的保险革新措施速度y 会更大。
股份制公司采取保险革新措施的积极性比互助型公司高,股份制公司建立在共同承担风险上,更愿意革新。
公司规模越大,采取保险革新措施的倾向越大:大规模公司保险制度的更新对公司的影响程度比小规模公司大。
SAS 程序:data xt103;input y x1 x2 ;/*引入虚拟变量,将公司类型的互助设为0,股份设为1*/ cards ; 17 151 0 26 92 0 21 175 0 30 31 0 22 104 0 0 277 0 12 210 0 19 120 0 4 290 0 16 238 0 28 164 1 15 272 1 11 295 1 38 68 1 31 85 121 224 120 166 113 305 130 124 114 246 1;run;proc reg data=xt103;model y=x1 x2;run;2.研制一种新型玻璃,对其做耐冲实验。
用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。
模型信息:模型解出的是y=0的概率。
由三个检验中,统计量的P 值都小于0.05,可以认为模型是显著的。
由Wald 检验的显著性概率及其P 值,可以看出,h 变量对方程的影响是显著的。
由极大似然估计,各个参数系数也通过检验。
因此模型有效。
二元logit 模型为)98.759.14ex p(1)98.759.14ex p()0(h h y p -+-==模型意义为,小球掉落高度为h ,则玻璃未破碎的概率为p,而y=0表示玻璃未破碎。
也就是说,该种新型的玻璃,用小球对其撞击,当小球的掉落高度为h 时,玻璃未破碎的概率就是)98.759.14ex p(1)98.759.14ex p()0(h h y p -+-==,那么,玻璃会破碎的概率就为1-p(y=0),这也可以看成是一种比例,就是大量实验中,同个高度h ,玻璃会被击破的比例。
SAS程序:data wjz;input h y ;/*引入虚拟变量,将公司类型的互助设为0,股份设为1*/ cards;1.50 01.52 01.54 01.56 01.58 11.60 01.62 01.64 01.66 01.68 11.70 01.72 01.74 01.76 11.78 01.80 11.82 01.84 01.86 11.88 11.90 01.92 11.94 01.96 11.98 12.00 1;run;proc logistic data=wjz;model y=h;run;proc logistic data=wjz;class h;model y=h/link=glogit aggregate scale=none;run;3.某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其中毕业去向“1”=工作,“2”=读研,“3”=出国留学。
性别“1”=男生,“0”=女生。
用多类别的Logisitic 回归分析影响毕业去向的因素。
专业课x1英语x2性别x3月生活费x4毕业去向y两个统计量的P值均大于0.05,说明模型拟合的较好。
检验全局零假设: BETA=0 无效假设检验结果(似然比,评分)的结果P值均小于0.01,具有显著统计学意义。
三个变量中,有两个是不显著的变量,x3,x2,剔除x3:两个统计量的P值均大于0.05,说明模型拟合的较好。
检验全局零假设: BETA=0 无效假设检验结果(似然比,评分,wald)的结果P值均小于0.01,具有显著统计学意义。
三个变量都是显著的。
以x4=“1”,即参加工作,为参照。
由模型可以看出:)0101.0122.0012.08.011-ex p()004.0038.017.0116.19-ex p(1)004.0038.017.0116.19-ex p()2(421421421x x x x x x x x x y p ++-++++++++==)0101.0122.0012.08.011-ex p()004.0038.017.0116.19-ex p(1)0101.0122.0012.08.011-ex p()3(421421421x x x x x x x x x y p ++-+++++++-==从参数估计表中,与参加工作的同学相比,读研的(y=2)的同学相比,读研的同学其专业课成绩更好(x1的P 值=0.003),而外语成绩(x2的p 值=0.356)和经济状况(x4的P 值=0.184)没有显著差异;出国留学的(y=3)学生其专业课成绩和参加工作的没有显著差异,外语成绩和经济状况则更好。
Sas 程序:data a;input x1 x2 x3 x4 y; cards ; 95 65.0 1 600 2 63 62.00 850 182 53.0 0 700 260 88.0 0 850 372 65.0 1 750 185 85.0 0 1000 3 95 95.0 0 1200 2 92 92.0 1 950 263 63.0 0 850 178 75.0 1 900 190 78.0 0 500 182 83.0 1 750 280 65.0 1 850 383 75.0 0 600 260 90.0 0 650 375 90.0 1 800 263 83.0 1 700 185 75.0 0 750 273 86.0 0 950 286 66.0 1 1500 3 93 63.0 0 1300 2 73 72.0 0 850 186 60.0 1 950 276 63.0 0 1100 1 96 86.0 0 750 271 75.0 1 1000 1 63 72.0 1 850 260 88.0 0 650 167 95.0 1 500 186 93.0 0 550 163 76.0 0 650 186 86.0 0 750 276 85.0 1 650 182 92.0 1 950 373 60.0 0 800 182 85.0 1 750 275 75.0 0 750 172 63.0 1 650 181 88.0 0 850 392 96.0 1 950 2;run;proc print;run;proc logistic;class x3;model y(ref='3')=x1 x2 x3 x4/link=glogit aggregate scale=none ;run;proc logistic;class x3;model y(ref='3')=x1 x2 x4/link=glogit aggregate scale=none ;run;proc logistic;class x3;model y(ref='1')=x1 x2 x4/link=glogit aggregate scale=none ;run;六.收获与思考七. 思考题当自变量是定性变量的时候,我们需要引进虚拟变量进行数量化,当定性变量有n个水平的时候,我们该引进多少的虚拟变量,否则会怎样?不妨试试在sas中试试会出现什么问题。
答:当定性变量有n个水平时应该引进n-1个虚拟变量。
否则最后一个虚拟变量无法用最小二乘估计计算出来。
例:X1-X3为虚拟变量。
Data a;input x1 x2 x3 x y@@;cards;1 0 0 1.26 75 1 0 0 1.35 77 1 0 0 1.40 78 1 0 0 1.58 820 1 0 1.71 65 0 1 0 1.76 66 0 1 0 1.80 68 0 1 0 1.85 700 0 1 1.22 68 0 0 1 1.35 69 0 0 1 1.46 70 0 0 1 1.44 72;proc reg data=a;model y=x1-x3 x;run;X3没有参数估计结果。