当前位置:文档之家› 第三章统计案例3.1回归分析的基本思想及其初步应用(2)学案(无答案)新人教A版选修2_3

第三章统计案例3.1回归分析的基本思想及其初步应用(2)学案(无答案)新人教A版选修2_3

第三章统计案例3.1回归分析的基本思想及其初步应用(2)学案(无答案)新人教A版选修2_3
第三章统计案例3.1回归分析的基本思想及其初步应用(2)学案(无答案)新人教A版选修2_3

3.1回归分析的基本思想及其初步应用

第2课时 残差分析

【学习目标】

1.了解残差平方和、相关指数2

R 的概念;

2.了解回归分析的基本步骤;

3.会用残差平方和与相关指数对回归模型拟合度进行评判; 【重点难点】

重点:了解残差平方和、相关指数2

R 的概念,

会用残差平方和与相关指数对回归模型拟合度进行评判。 难点:了解回归分析的基本步骤, 【学习过程】 一.课前预习

阅读课本P 82—86,记下困惑处并完成下列问题

1、`线性回归模型,e )b a e a bx y 中为模型的未知参数和(++=是y (真实值)与

a bx +之间的误差。通常e 是随机变量,称为。

2.残差

对于样本点11(,)x y ,22(,)x y ,…,(,)n n x y ,它们的随机误差i i i e y bx a =--,1i =,2,…,n ,其估计值为 i e = i i y bx a =-- ,i e 称为相应于点(,)i i

x y 的. 温馨提示:正确理解随机误差:随机误差是客观存在的,主要原因是:(1)所用的函数不恰当引起误差;(2)除了两个变量之间的影响之外,还会受到其他因素的影响;(3)由于观测方面的原因出现的误差. 3.残差图及相关指数

(1)残差图:我们可以利用图形来分析残差特征,作图时纵坐标为,横坐标可以选为,或解释变量或预报变量等,这样作出的图形称为.

(2)相关指数:计算公式是2

R =,其中残差平方和为,总偏差平方

和为.2

R 越大说明残差平方和越小,也就是说模型的拟合效果越好,2

R 表示解释变量对于

预报变量变化的,2

R 越接近于,表示回归的效果越好.

温馨提示:相关指数的计算公式中,分子是残差平方和,分母是总偏差平方和,计算时不要弄错,同时要清楚2

R 的大小与拟合效果的关系. 二.课堂学习与研讨 类型1 线性回归分析

【典例1】为研究重量x (单位:克)对弹簧长度y (单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:

(2)求相关指数2

R ,并判断模型的拟合效果; (3)进行残差分析.(

6

2

1

2275i

i x

==∑,6

1

1076.2i y i x y ==∑)

【归纳升华】一般地,求出回归直线方程后,通常可以计算处残差的平方和以及相关指数2

R

的值来对回归模型的好坏作出评判,由2

R 的计算公式知,残差平方和越小,2

R 就越大,拟合效果就越好;残差平方和越大,2

R 就越小,拟合效果就越差.

.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下表的统计资料:

试求:(1)线性回归方程 y bx

a =+ 的回归系数 a 、

b ; (2)求残差平方和; (3)求相关指数2

R

类型2线性回归模型拟合的效果 例2、关于x 与y 有如下数据:

为了对x 、y 两个变量进行统计分析,现有以下两种线性模型:5.175.6?+=x y , 177?+=x y

,试比较哪一个模型拟合的效果更好。 (分析:方法1,分别计算两个模型的残差,进行比较;方法2,分别计算两个模型的相关指数,进行比较。参考数据:

1000)

(5

1

2

=-∑=i i

y y ,①155)?(5

1

2=-∑=i i i y

y ②180)?(5

1

2=-∑=i i i

y

y

【当堂检测】

1.甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:

)

A .甲

B .乙

C .丙

D .丁

2.为了表示n 个点与相应直线在整体上的接近程度,我们常用的表示法为( )

A. 1()n

i i i y y =-∑

B. 1

()n i i i y y =-∑ C. 21

()n i i i y y =-∑ D.21

()n

i i y y =-∑

3.通过残差图我们发现在采集样本点过程中,样本点数据不准确的是(

)

A .第四个

B .第五个

C .第六个

D .第八个

5.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是 ( ) A .相关系数r 变大 B .残差平方和变大 C .相关指数R 2

变大

D .解释变量x 与预报变量y 的相关性变强 【课堂小结】

1.线性回归分析中拟合效果的评判问题:

(1)求出线性回归模型(即线性回归直线方程)、残差平方和

2

1

n

i

i e

=∑、以及相关指数2

R ,

则:①残差平方和

21

n

i

i e

=∑越小,拟合效果越好;②2

R 越大(越接近于1),拟合效果越好.

(2)对于同一个问题可以有几个不同的拟合模型,要分别求出各个模型的线性回归直线方程、残差平方和、相关指数,残差平方和小的拟合效果好,相关指数大的,拟合效果好. 【作业】

1.假定小麦基本苗数x 与成熟期有效穗y 之间存在相关关系,今测得5组数据如下:

((2)求y 与x 之间的回归直线方程,对于基本苗数56.7预报其有效穗; (3)计算各组残差,并计算残差平方和;

(4)求2

R ,并说明残差变量对有效穗的影响占百分之几.

2016-2018年高级统计师高级统计实务与案例分析试卷考试真题

2016年高级统计师高级统计实务与案例分析试卷考试真题 1.本试卷有两部分,共8道题,满分150分。其中第一部分为必答题,共6道题,满分130分;第二部分为选答题,要求选答1道题,若多答,评卷时只对前1道答题打分,满分20分。 2.在你拿到试卷的同时将得到一份专用答题卡,所有试题务必在专用答题卡上作答,在试卷或草稿纸上作答不得分。 3.用铅笔填涂答题卡首页的准考证号;答题以及需要填写姓名、准考证号码的地方用黑色签字笔书写。 4.答题时请认真阅读试题,对准题号作答。 第一部分必答题 第一题(25分) 简述当前开展“三新”(新产业、新业态、新商业模式)统计的意义。 第二题(20分) 简述国民经济核算中的基本总量指标及其平衡关系。 第三题(25分) 某地有三家工业企业A、B、C,共属于同一家集团公司,A企业为该集团公司的核心企业。2016年2月,政府统计机构没有在规定时间收到三家企业的统计报表,向三家企业分别发出要求其补报有关统计资料的催报单。A企业汇总三家企业的生产经营情况后,在催报期限内,以A企业的名义将三家企业的生产经营情况一并予以上报;B企业在催报期限内补报了本企业的统计报表,但经核查,统计报表中有多项统计指标没有填写;C企业认为A企业已经将本企业情况一并打捆上报,因此没有补报本企业的统计报表。请回答:(1)该案例中三家企业是否都存在违法行为?分别是哪些统计违法行为? (2)应当如何处罚? 第四题(20分) 阐述抽样调查中可能产生的误差,并结合实际提出控制误差的建议。 第五题(20分) 解释人口老龄化的概念,并结合表中数据分析该地区人口老龄化的状况及可能产生的影响。 第六题(20分) 根据下图简要分析我国近年经济发展的基本特征。

统计学实验报告汇总

本科生实验报告 实验课程统计学 学院名称商学院 专业名称会计学 学生姓名苑蕊 学生学号0113 指导教师刘后平 实验地点成都理工大学南校区 实验成绩 二〇一五年十月二〇一五年十月

依据上述资料编制组距变量数列,并用次数分布表列出各组的频数和频率,以及向上、向下累计的频数和频率, 并绘制直方图、折线图。 学生 实验 心得

2.已知2001-2012年我国的国内生产总值数据如表2-16所示。 学生 实验 心得 要求:(1)依据2001-2012年的国内生产总值数据,利用Excel软件绘制线图和条形图。

(2)依据2012年的国内生产总值及其构成数据,绘制环形图和圆形图。 学生 实验 心得 3.计算以下数据的指标数据 1100 1200 1200 1400 1500 1500 1700 1700 1700 1800 1800 1900 1900 2100 2100 2200 2200 2200 2300 2300 2300 2300 2400 2400 2500 2500 2500 2500 2600 2600 2600 2700 2700 2800 2800 2800 2900 2900 2900 3100 3100 3100 3100 3200 3200 3300 3300 3400 3400 3400 3500 3500 3500 3600 3600 3600 3800 3800 3800 4200

4.一家食品公司,每天大约生产袋装食品若干,按规定每袋的重量应为100g。为对产品质量进行检测,该企业质检部门采用抽样技术,每天抽取一定数量的食品,以分析每袋重量是否符合质量要求。现从某一天生产的一批食品8000袋中随机抽取了25袋(不重复抽样),测得它们的重量分别为: 学生实验心得 101 103 102 95 100 102 105 已知产品重量服从正态分布,且总体方差为100g。试估计该批产品平均重量的置信区间,置信水平为95%.

应用统计学案例——市场调查分析

市场调查分析案例 市场调查分析是市场调查的重要组成部分。通过市场调查收集到的原始资料,是处于一种零散、模糊、浅显的状态,只有经过进一步的处理和分析,才能使零散变为系统、模糊走向清晰、浅显发展为深刻,分析研究其规律性,达到正确认识社会现象目的,为准确的市场预测提供参考依据,最终为调查者正确决策提供有力的依据。 市场调查分析的原则:从全部事实出发,坚持事实求实的观点;全面分析问题,坚持一分为二的观点;必须从事物的相互联系,相互制约中分析问题; 市场调查分析方法:单变量统计量分析、单变量频数分析、多变量统计量分析、多变量频数分析、相关分析、聚类分析、判别分析、因子分析等。 案例:某市家用汽车消费情况调查分析案例 随着居民生活水平的提高,私车消费人群的职业层次正在从中高层管理人员和私营企业主向中层管理人员和一般职员转移,汽车正从少数人拥有的奢侈品转变为能够被更多普通家庭所接受的交通工具。了解该市家用汽车消费者的构成、消费者购买时对汽车的关注因素、消费者对汽车市场的满意程度等对汽车产业的发展具有重要意义。 本次调研活动中共发放问卷400份,回收有效问卷368份,根据整理资料分析如下。 一、消费者构成分析 1 、有车用户家庭月收入分析

5000元以上8.69 100.00 目前该市有车用户家庭月收入在2000?3000元间的最多;有车用户平均月收入为2914.55元,与该市民平均月收入相比,有车用户普遍属于收入较高人群。61.96%的有车用户月收入在3000元以下,属于高收入人群中的中低收入档次。因此,目前该市用户的需求一般是每辆10?15万元的经济车型。 2、有车用户家庭结构分析 表2: 有车用户家庭结构 Di nk家庭(double in come no kid ),即夫妻二人无小孩的家庭,占有车家 庭的比重大,为36.96%。其家庭收入较高,负担较轻、支付能力较强,文化层次高、观念前卫,因此Dink家庭成为有车族中最为重要的家庭结构模式。核心家庭,即夫妻二人加上小孩的家庭,比重为34.78%。核心家庭是当前社会中最普遍的家庭结构模式,因此比重较高不足为奇。联合家庭,即与父母同住的家庭, 仅有8.70%。单身族占17.39%,这部分人个人收入高,且时尚前卫,在有车用户中占据一定比重。另外已婚用户比重达到了81.5%,而未婚用户仅为18.5%。 3、有车用户职业分析 调查显示有29%勺消费者在企业工作,20%勺消费者是公务员,另外还有自由职业者、机关工作人员和教师等。目前企业单位的从业人员,包括私营业主、高级主管、白领阶层仍是最主要的汽车使用者。而自由职业者由于收入较高及其工作性质,也在有车族中占据了较 高比重。详见图1。

应用统计学案例统计调查方案设计

应用统计学案例统计调查方案设计

统计调查方案设计案例 ▲统计调查方案的内容和撰写: 一、统计调查方案的主要内容 1、确定统计调查目的和任务 2、确定调查对象和调查单位 调查对象是指依据调查的任务和目的,确定本次调查的范围及需要调查的那些现象的总体。 调查单位是指所要调查的现象总体所组成的个体,也就是调查对象中所要调查的具体单位,即我们在调查中要进行调查研究的一个个具体的承担者。 3、确定调查内容和调查表 (1)调查课题如何转化为调查内容 调查课题转化为调查内容是把已经确定了的调查课题进行概念化和具体化。 (2)调查内容如何转化为调查表 如何把调查内容设计为调查表,这一问题会在下一章中专门介绍。 4、调查方式和调查方法 5、调查项目定价与预算 6、统计数据分析方案 7、其它内容

包括确定调查时间,安排调查进度,确定提交报告的方式,调查人员的选择、培训和组织等。 二、统计调查方案的撰写 1、统计调查方案的格式 包括摘要、前言、统计调查的目的和意义、统计调查的内容和范围、调查采用方式和方法、调查进度安排和有关经费开支预算、附件等部分。 2、撰写统计调查方案应注意的问题 (1)一份完整的统计调查方案,上述1—7部分的内容均应涉及,不能有遗漏。否则就是不完整的。 (2)统计调查方案的制订必须建立在对调查课题的背景的深刻认识上。 (3)统计调查方案要尽量做到科学性与经济性的结合。 (4)统计调查方案的格式方面能够灵活,不一定要采用固定格式。 (5)统计调查方案的书面报告是非常重要的一项工作。一般来说,统计调查方案的起草与撰写应由课题的负责人来完成。三、统计调查方案的可行性研究 (一)统计调查方案的可行性研究的方法 1、逻辑分析法 逻辑分析法是指从逻辑的层面对统计调查方案进行把关,考察其是否符合逻辑和情理。

统计学实训报告

四川师范大学经济与管理学院统计分析实训报告册 课程名称统计分析软件应用实训 专业_________ 班级2015 级4班___________________ 学生姓名杨冬梅 _______________ 学号_29 __________________ 指导老师张谦 _______________________

/实训一 一、实训目的 利用Excel掌握建立数据文件、数据整理、数据描述与显示等操作。能计算各种平均指标、离散指标,会应用基本统计函数,会使用Excel描述统计工具进行统计分析。 二、实训内容、步骤、结果分析 (一)基本函数使用 1. 实训内容 (1)计算个人平均成绩,按平均分从大到小进行排序,挑选出学习成绩最好、最差的3个同学; (2)求这3门课的平均分和标准差、最大值、最小值、峰度、偏度; 表1某班学生期末成绩单 2. 实训步骤 (1)先使用AVERAG E数,计算出学号为301的平均分,然后使用填 充柄计算出其他同学的平均分。选中A1: F21,选择自定义排序,按 “平均分”降序排序,再突出显示单元格,分别筛选出排名最靠前和靠后的三 名同学,用红色字体突出显示成绩最好的三位同学,用蓝色字体显示成绩最差的 三名同学。 (2)用AVERAG E数计算出全班数学、语文、外语的平均数; 用STDEVS数计算出全班数学、语文、外语的标准差; 用MA)函数计算出全班数学、语文、外语的最大值;用MIN函数计算出全班 数学、语文、外语的最小值; 用KURT函数计算出全班数学、语文、外语的峰度系数; 用SKEV函数计算出

全班数学、语文、外语的偏度系数。 3. 实验结果分析 (1)计算出全班每位同学的平均分,降序排序后,筛选出成绩最好的三名同学为310,307,317 ;成绩最差的三名同学306,305,311。 (2)①用AVERAG E数计算出全班数学、语文、外语平均分分别为,,; ②用STDEVS数计算出全班数学、语文、外语标准差分别为11.,;; ③用MAX函数计算出全班数学、语文、外语最大值分别为98,92,96 ; ④用MAN函数计算出全班数学、语文、外语最小值分别为56,50,58 ; ⑤用KURT函数计算出全班数学、语文、外语峰度系数分别为,,,分别为平峰、尖峰、平峰分布; ⑥用SKEW E数计算出全班数学、语文、外语偏度系数分别为,,,分别为右偏、左偏、右偏分布。 (二)计算各种平均指标 1. 实训内容 (1)(算术平均数)中国股市中的10种股票在2014年9月1日收盘价如表, 求该10种股票价格当日的平均价格。 (2)(加权平均数)某公司员工工资情况如下表,计算平均工资

统计学案例

第13章时间序列分析和预测案例一 新华印刷厂1990—2004年的利润资料如下表所示: 单位:万元 年份利润年份利润年份利润 1990 1991 1992 1993 1994 54 47 54 103 170 1995 1996 1997 1998 1999 152 142 175 182 159 2000 2001 2002 2003 2004 187 213 256 273 292 (1)试用移动平均法对该时间序列进行修匀,以反映利润的长期趋势(注:分别作三项和四项移动平均)。 (2)采用最小平方法拟合直线趋势方程,并预测新华印刷厂2005年和2006年的利润。[参考答案](1) 年份利润 Y 三项移动 总和 三项移动 平均 四项移动 总和 四项移动 平均 二项移正 平均(1)(2)(3)=(2)÷3 (4) (5)=(4)÷4 (6) 1990 54 1991 47 155 51.67 258 64.5 1992 54 204 68 79 374 93.5 1993 103 327 109 106.63 479 119.75 1994 170 425 141.67 130.75 567 141.75 1995 152 464 154.67 150.75 639 159.75 1996 142 469 156.33 161.25 651 162.75 1997 175 499 166.33 163.63 658 164.5 1998 182 516 172 170.13 703 175.75 1999 159 528 176 180.5 741 185.25 2000 187 559 186.33 194.5 815 203.75 2001 213 656 218.67 218 929 232.25 2002 256 742 247.33 245.38

多元统计分析案例分析.docx

精品资料 一、对我国30个省市自治区农村居民生活水平作聚类分析 1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。现从2010年的调查资料中

2、将数据进行标准化变换:

3、用K-均值聚类法对样本进行分类如下:

分四类的情况下,最终分类结果如下: 第一类:北京、上海、浙江。 第二类:天津、、辽宁、、福建、甘肃、江苏、广东。 第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。 第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。 二、判别分析 针对以上分类结果进行判别分析。其中将新疆作作为待判样本。判别结果如下:

**. 错误分类的案例 从上可知,只有一个地区判别组和原组不同,回代率为96%。 下面对新疆进行判别: 已知判别函数系数和组质心处函数如下: 判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7 Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7 Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671 Y2=-0.62213 Y3=-0.84188 计算Y值与不同类别均值之间的距离分别为:D1=138.5182756 D2=12.11433124 D3=7.027544292 D4=2.869979346 经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。 三,因子分析: 分析数据在上表的基础上去掉两个耕地面积和农村固定资产投资两个指标。经spss软件分析结果如下:

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

管理统计学报告

《管理统计学》 综合性实验报告 题目:大学生消费情况综合分析 班级:____________姓名:____________学号:____________ 综合实验报告评分标准 评分项目比例得分 所有同学每月生活费的平均值,最大值和最小 10% 值 10% 男生、女生每月生活费的平均值,最大值和最 小值 所有同学每月生活费的茎叶图10% 频数分布表10% 方差分析部分40% 聚类分析部分10% 语言表达与排版10% 实验报告总评(用A,B,C,D和E表示) 1.通过综合性实验检验对SPSS的掌握情况,并作为期末的考核标准之一。 二、实验内容: 1.用SPSS分别计算农村学生的比例,女生比例 2.用SPSS计算出所有同学每月生活费的平均值,最大值和最小值。 3.用SPSS分别计算出男生、女生每月生活费的平均值,最大值和最小值。 4.作出所有同学每月生活费的茎叶图。 5.整理所有同学每月生活费数据,制作一个频数分布表(分成5组)。 6.从每个班中随机抽10人,这10人每月生活费可以看作本班的一个随机样本,试分析信 管1班,2班,3班,4班,工业工程1班,2班之间的每月生活费的方差是否齐性,判 断每个班同学的月均生活费是否有显著差异;分析户口所在地、性别对每月的生活费的 影响是否显著。(显著性水平为0.05)

7.以每月平均生活费、伙食费所占比例、生活费来源中家庭给予所占比例为观测变量,对 本专业学生进行聚类分析。 三、实验详细过程与结果 问题1解:采用频率分布表解答。将户口与性别放入变量中,得到户口与性别的频率统计 答:由上面得到的第二个表格得出农村学生的比例为48.8,女生的比例为37.7。 问题2解:采用频率分布表解答。在统计量选项中勾中均值、最大值和最小值。

统计学案例集

统计学教学案例集统计学精品课建设小组 2004年11月

【案例一】全国电视观众抽样调查抽样方案 一、调查目的、范围和对象 1.1 调查目的 准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据。 1.2 调查范围 全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。 1.3 调查对象 全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6个月或预计居住6个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住所的人口。 二、抽样方案设计的原则与特点 2.1 设计原则 抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性。其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小。第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。 2.2 需要考虑的具体问题、特殊要求及相应的处理方法 2.2.1 城乡区分 城市与农村的电视观众的收视习惯与爱好有很大的区别。理所当然地应分别研究,

以便于对比。最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做的样本点数量较大,调查的地域较为分散,相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。这样做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种因素,本方案采用第二种处理方式。 在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村。2.2.2 抽样方案的类型与抽样单元的确定 全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。 本抽样方案采用分层五阶抽样。各阶抽样单元确定为: 第一阶抽样:区(地级市以上城市的市辖区)、县(包括县级市等); 第二阶抽样:街道、乡、镇; 第三阶抽样:居委会、村委会; 第四阶抽样:家庭户; 第五阶抽样:个人。 为提高抽样效率,减少抽样误差, 在第一阶抽样中对区、县采用按地域及类别分层。在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。 2.2.3 自我代表层的设立 根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理。为方便起见,以下把这样的层称为自我代表层。考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理。另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理。这样自我代表层共有8个,包括以下城市与地区:

管理统计学综合训练二分析报告

管理统计学综合训练二统计分析报告(判断男生成绩与女生成绩是否有显著性差异) 专业班级:经济14-2班 指导教师: 王宏新 小组成员:宋佳玉林曼雪 潘香宇刘月 刘晓东刘子楗刘志强 时间:2016 年5月 分数:

一、训练要求与考查内容 1、训练要求:搜集某一个学期某个班级全部学生所学的全部学科的成绩,利用SPSS 软件进行处理,给出一个完整的统计分析报告。 2、考察内容:区间估计和假设检验知识单元 二、涉及的知识点回顾 (一)区间估计 1、两个总体均值差的区间估计 若随机变量)(~),(~2 2222 111σμσμ,,X X , (1)方差已知 经标准化后两个总体平均数之差服从标准正态分布,即 则两个总体平均数之差(μ1-μ2)在(1-α)置信水平下的双侧置信区间为 。 (2)方差未知(教材P 117,,不进行详细说明) ○1σ12=σ22,则两个总体平均数之差经标准化后服从自由度为(n 1+n 2-2)的t 分布; ○ 2σ12 ≠σ22,则两个总体平均数之差经标准化后近似服从自由度为v 的t 分布。 最终得到两个总体均值差的置信区间若是包含“0”,则认为两个总体之间不存在显著性差异,反之,若不包含“0”,则认为两个总体之间存在显著性差异。 2、两个总体方差比的区间估计 在总体均值μ1与μ2未知的情况下,)(~),(~2 2222 111σμσμ,,X X , 两个总体方差比服从 , 所以得到两个总体方差之比在1-α置信水平下的双侧置信区间为 ) 1,0(~) ()(2 2 2 1 2 1 2121N n n x x z σσμμ+ ---= 22 21212 21212221212 21)()()(n n z x x n n z x x σσμμσσαα ++-≤-≤+--)1,1(~//212 2 212 2 21--=n n F S S F σσ

完整word版经济统计分析案例

案例2-1 Gulf Real Estate Properties公司 Gulf Real Estate Properties有限责任公司是佛罗里达西南部的一家房地产公司。企业在广告中称自己是“真正的地产专家”。公司通过搜集有关地点、定价、售价和每套售出花费天数,对房屋的销售进行监督。如果房屋位于墨西哥湾,则称之为“看得见海湾的房屋”;如果房屋位于墨西哥湾附件的其他海湾或者高尔夫球场,则称之为“看不见海湾的房屋”。来自佛罗里达州那不勒斯的多元列表服务的样本数据,给出了最近售出的40套看得见海湾的房屋和18套看不见海湾的房屋的数据。数据见GulfProp.xls,价格以千美元计。 管理报告 1.对看得见海湾的房屋,求售价的总体均值以及售出中花费天数的总体均值的95%置信区间,并解释你的结论。 2.对看不见海湾的房屋,求售价的总体均值以及售出中花费天数的总体均值的95%置信区间,并解释你的结论。 3.假定分公司的经理要求在40000美元的边际误差下对看得见海湾的房屋售价的均值进行估计,在15000美元的边际误差下对看不见海湾的房屋售价的均值进行估计。取置信度为95%,则应选取多大的样本容量。 解答:利用Excel软件求得一些数据如图1、图2: 图1:看得见海湾

图2:看不见海湾 ?未知的情况,售价首先对看得见海湾的房间,根据题意,易知这是属于1. ?X 106454.2?X , ,出售天数的总体均值的总体均值21 :则售价的95%置信区间为SS 192.5192.5?????? 1nn ?1?392.65,515.79????454.2?2.0232.023?X ?t ?,X ?t ,454.2?????11 ??nn 4040???? 22 售出中花费天数的均值的95%置信区间为: SS 52.252.2?????? 1n 1?n ?89.30,122.70?106?2.023?t ?,X ?t ??,106?2.023?X ?????22 ??nn 4040???? 22 ?2. 未知的情况,售价的总体均值对于看不见海湾的房间,依旧是 X ?135.0203.2X ? ,售出天数的总体均值21所以售价的总体均值的95%置信区间 为: SS 43.8943.89??????

管理统计学SPSS数据管理 实验报告

数据管理 一、实验目的与要求 1.掌握计算新变量、变量取值重编码的基本操作。 2.掌握记录排序、拆分、筛选、加权以及数据汇总的操作。 3.了解数据字典的定义和使用、数据文件的重新排列、转置、合并的操作。 二、实验内容提要 1.自行练习完成课本中涉及的对CCSS案例数据的数据管理操作 2.针对SPSS自带数据Employee data.sav进行以下练习。 (1)根据变量bdate生成一个新变量“年龄” (2)根据jobcat分组计算salary的秩次 (3)根据雇员的性别变量对salary的平均值进行汇总 (4)生成新变量grade,当salary<20000时取值为d,在20000~50000范围内时取值为c,在50000~100000范围内取值为b,大于等于100000时取值为a 三、实验步骤 1、针对CCSS案例数据的数据管理操作 1.1.计算变量,输入TS3到目标变量,在数字表达式中输入3,把任意年龄段分成三个组20-30设为1组,1-40设为2组41-50设为3组。图1, 图1 1.2.对已有变量的分组合并,在“名称”文本框中输入新变量名TS3单击“更改”按钮,原来的S3->?就会变为S3->TS3,单击“旧值和新值”按钮,系统打开“重新编码到其他变量:旧值和新值”,如下图2,

图2 图3 1.3.可视离散化,选择“转换”->“可视离散化”,打开的对话框要求用户选择希望进行离散化的变量,单击继续,如下图4,

图4 单击“生成分割点”,设定分割点数量为10,宽度为5,第一个分割点位置为18,单击“应用”,如下图, 图5 结果显示如下,

统计学案例分析

统计学案例实习教学大纲(课程编号:00700397) 适用年级: 是否双语:是 否

课程类别:E:集中性实践 学时学分:课程总学时2周其中实验(上机)学时学分 2 先修课程:《统计学》《统计学案例》《市场调查与分析》 开课单位:管理学院统计系 适用专业统计学 开课学期 4 二、实践环节简介 统计学案例实习课程是统计学专业的一门技术基础课,是专业选修课程,也是统计学专业的重要实践环节课。它是在学习了统计学、市场调查与分析相关理论和方法的基础上,如何将相关理论和方法运用于实际问题的解决。拉近理论与现实的距离,使统计学专业的学生更好地掌握统计综合指标的计算和应用,抽样调查的基本理论和方法,统计预测的理论、方法及应用,并提高实践动手能力和综合分析能力。 三、实践环节教学目的与基本要求 教学目的: 1.通过课程实习,应使学生掌握统计学的基本理论,统计研究的基本方法,掌握统计综合指标的计算和应用,统计指数的编制和分析,抽样调查的基本理论和方法,掌握统计预测的理论、方法及应用。 2.通过课程实习,培养学生具备对经济运行的实际内容进行具体的计算分析,培养学生用统计方法解决实际问题的能力。 3.通过具体而全面的统计案例实习来启发学生的悟性,挖掘学生的潜能,培养学生用统计理论和统计方法解决实际问题的动手能力和创新能力,提高学生的统计素质。 基本要求: 在已学习了统计学、市场调查与分析和统计学案例等课程的前提下,要求学生既能够独立完成各项实习,又能够养成团队协作的精神,共同撰写实习报告。 四、实践环节注意事项 实习方式:学生自己动手实习。 1、以小组为单位进行实习。 2、实行开放式实习教学,增加学生选择实验项目和实验时间的自主性。 注意事项:1、实习前由教师向学生讲明课程内容、进度安排、书写实验报告要求等。 2、实习4-6人为一组, 分工、协作共同完成。 3、实习报告是本实习教学的一个重要环节, 需要学生掌握的内容可以通过实习报告反映学生对其掌握程度, 让教师了解尚存在的问题。 五、实践环节主要内容与时间安排 (一) 实习项目一大学生生活费收支状况调查 知识点:调查方案设计的基本内容,设计方法 重点:各种抽样统计调查方法的特点和应用条件 难点:大学生生活费收支状况分析 实习项目二关于逃课问题的调查 知识点:调查方案设计 重点:问卷设计 难点:对逃课问题分析。 实习项目三福州大学本科生自习情况调查 知识点:调查方案设计 重点:问卷设计

管理统计学总结

一,描述统计和推断统计的区别和联系 描述统计学研究如何取得反映客观现象的数据,并通过图表的形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。其内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据的分布特征与分析方法等。推断统计学则是研究如何根据样本数据去推断总体数量特征的方法,他是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。 描述统计学和推断统计学的划分,一方面反映了统计方法发展的前后两个阶段,同时也反映了应用统计方法探索客观事物数量规律性的不同过程。描述统计是整个统计学的基础,推断统计学则是描述统计的进一步深入。 二,统计分组的原则 完备性:所分的组能涵盖总体,从而使总体中的任何一个个体都有组可归 互斥性:各组之间的界限必须明确,从而使总体中的每个个体只能划归到其中一个组 三,统计调查有哪些方式?其特点和适用范围如何? 统计调查的方式主要包括普查、统计报表、抽样调查、重点调查和典型调查。 (1)普查是一种专门组织的一次性全面调查。重点了解重要的国情国力的一种调查方式。 (2)统计报表是按照国家有关的规定,自上而下同一布置,自下而上逐级提供统计资料的调查组织方式。 (3)抽样调查是取得数据资料的最主要的一种方式,它是按照随机原则从总体中抽取部分单位组成样本,对样本指标进行测定,根据样本指标推断总体指标的一种非全面调查。抽样调查有三个特点:第一,从总体中随机抽取样本。提高了样本的代表性。第二、利用样本指标可推断总体指标的数值。第三、抽样误差可以准确计算并事先加以控制。抽样调查有简单随机抽样、分层抽样、等距抽样和整群抽样四种组织形式。 (4)重点调查是为了了解总体的基本情况,在总体中选择个别重点单位进行调查。重点单位是指其标志总量占全部单位标志总量的绝大比重的单位。 (5)典型调查是对总体单位有初步了解的基础上,有意识的选择部分有代表性的单位进行调查。代表性单位是指那些最充分、最集中地体现总体某些共性的单位。 四,为什么要计算离散系数? 极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,都具有一定的量纲,其数值的大小除了与变量的离散程度有关外,还受两个方面的影响:(1)与原变量值本身水平高低有关,也就是说各变异指标与变量的均值大小有关,变量值绝对水平高的,离散程

应用统计学因子分析与主成分分析案例解析_SPSS操作分析

因子分析与主成分分析 一、问题概述 现希望对30个省市自治区经济发展基本情况的八项指标进行分析。具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。这是一个综合分析问题,八项指标较多,用主成分分析法进行综合。 二、数据处理与分析 1.因子分析 打开数据后,在SPSS中进行因子分析的步骤如下: 选择“分析---降维---因子分析”,在弹出的对话框里 (1)描述---系数、KMO与Bartlett的球形度检验 (2)抽取---碎石图、未旋转的因子解 (3)旋转---最大方差法、旋转解、载荷图 (4)得分---保存为变量、显示因子得分系数矩阵 (5)选项---按大小排序 点击确定得到如下各图: 图3-1 图3-2 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.620 Bartlett 的球形度检验近似卡方231.285 df 28 Sig. .000 图3-3 公因子方差

图3-6 成份矩阵a

图3-9

(2)因子模型中各统计量的意义 A)因子载荷错误!未找到引用源。:因子载荷错误!未找到引用源。为第i个变量在第j个因子上的载荷,实际上就是错误!未找到引用源。与错误!未找到引用源。的相关系数,表示变量错误!未找到引用源。依赖因子错误!未找到引用源。的程度,反应了第i个变量错误!未找到引用源。对于第j个因子错误!未找到引用源。的重要性。 B)变量错误!未找到引用源。的变量共同度:k个公因子对第i个变量方差的贡献,也称为公因子方差比,记为错误!未找到引用源。,公式为:错误!未找到引用源。=错误!未找到引用源。(j=1,2,….,k)

统计学期末复习题答案

统计学期末复习题答案 期末复习题考试题型说明:单选15道15分,多选10道20分,判断10道10分,计算6道55分,考试知识点涵盖大纲要求的每一章节。第一章总论 1.社会经济统计学的研究对象是 A.社会经济现象总体的数量特征和数量关系 B.社会经济现象的规律性及表现 C.国民经济和社会现象的规律 D.社会经济调查.整理.分析的原理原则和方式方法 2.统计研究的基本特点是A.从数量上认识总体单位的性质和规律性B.从数量上认识总体的性质和规律性C.从性质上认识总体单位的性质和规律性D.从性质上认识总体的性质和规律性 3.统计学的基本方法包括有A.调查方法、整理方法、分析方法、预测方法B.调查方法、汇总方法、预测方法、实验设计C.相对数法、平均数法、指数法、

汇总法D.实验设计、大量观察、统计描述、统计推断 3.统计总体的特点是A.大量性、同质性、差异性 B.数量性、综合性、具体性 C.数量性、社会性、工具性 D.数量性、同质性、差异性4.构成总体的个别事物称为。A.调查总体B.标志值C.品质标志D.总体单位 5.要了解某市工业企业生产设备情况,此场合的统计总体是A.该市全部工业企业 B.该市的所有企业 C.某工业企业的一台设备D.该市全部工业企业的所有生产设备6.要考察全国居民的人均住房面积,其统计总体是 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户7.总体有三个人,其工资分别为645元.655元和665元。其平均工资655元是A.指标值B.标志值C.变异度D.变量8.下列各项中属于连续变量的有。 A.产值 B.职工人数 C. 电视机台数 D.设备数量9. 一个统计总体A.只能有

应用统计学案例——统计数据的搜集与整理

某医院护士长对床旁凝血测定仪的应用研究 原作者:孙东川,王方方,金芸 单位:暨南大学 目的: 1、学会根据研究的问题,正确、科学设置对该问题进行评价的统计指标; 2、掌握统计数据的收集与整理的方法; 3、学会根据统计资料,对所研究的问题进行分析,并提供相应的分析对策报告,提高用统计方法解决实际问题的能力。 一、问题的提出 南方某医院心内科的王护士长从事本职工作多年,兢兢业业。在工作中,她认真钻研,从实践中探讨更有效的操作方法,目的是为了达到心内科的管理科学化。 2002年10月,善于思考的王护士长对床旁凝血测定仪在抗凝监测中的应用问题产生兴趣。 抗凝治疗是心脑血管和血栓栓塞性疾病防治的主要手段,抗凝不足导致抗凝治疗无效,抗凝过度又会增加严重出血的风险。 医院常规监测抗凝程度的方法是:①采集肘正中静脉血送去中心实验室检测。②用床旁凝血测定仪进行静脉血抗凝监测。③用床旁凝血测定仪进行指端末梢血抗凝监测。床旁凝血测定仪是一种监测抗凝程度的仪器,使用方便、快捷,能够短期内得到结果,据此可及时调整药物剂量。但在使用中尚存在采血方法不一的问题:既可以采用静脉血,也可使用指端末梢血。 “床旁凝血测定仪测定的数据是否与到中心实验室常规检测的数据相符?”“如果用床旁凝血测定仪,是用笔式采血器采取指端末梢血好?还是使用常规法采集肘正中静脉血?”这两个问题一直萦绕在王护士长的脑海中。 为解决问题,王护士运用应用统计知识和SPSS软件进行了以下分析: 二、指标的选取 将部分凝血活酶时间(APTT)、凝血酶原时间(PT)、国际标准化比值(INR)作为评价的指标,分别比较三种方法测定的三种值的结果,以评价三种方法的优劣。 三、数据的采集

统计学-案例分析(英文)

Executive summary With the development of globalization and information technology, outsourcing has gained great popularity all over the world. On the other hand, virtual works have more chances to find freelance works with the development of outsourcing. The reasons for outsourcing includes low operational and labor costs, tax breaks, to gain more global and local market share, to reduce risks, to move to higher segments of the value added chain, to serve for innovation as well as to focus to accelerate business transformation. Now the Brammer is encountered with a problem of management that the purchasing and management of spares for the daily operations, maintenance and repair of production and manufacturing equipment is often a complex, time and resource consuming issue for most organizations. The Brammer is considering whether they will outsource the management of spares. This research will focus on identifying a management problem of the Brammer and designing an appropriate business research strategy for success in business. What is more, the essay will choose a qualitative research methodology to investigate the organizational management problem of the Brammer.

相关主题
文本预览
相关文档 最新文档