统计学(贾俊平版)第十章答案解析
- 格式:doc
- 大小:64.04 KB
- 文档页数:12
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)整理by__kiss-ahuang第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)整理by__kiss-ahuang第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
第9章分类数据分析一、思考题1.简述列联表的构造与列联表的分布。
答:列联表是由两个以上的变量进行交叉分类的频数分布表。
列联表的分布可以从两个方面看,一个是观察值的分布,又称为条件分布,每个具体的观察值就是条件频数;一个是期望值的分布。
2.用一张报纸、一份杂志或你周围的例子构造一个列联表,说明这个调查中两个分类变量的关系,并提出进行检验的问题。
答:对三个生产厂甲、乙、丙提供的学习机的A、B、C 三种性能进行质量检验,欲了解生产厂家同学习机性能的质量差异是否有关系。
抽查了450部学习机次品,整理成为如表9-2所示的3×3列联表。
表9-2A B C 总计甲乙丙204015459065357070100200150总计75200175450根据抽查检验的数据表明:次品类型与厂家(即哪一个厂)生产是无关的(即是相互独立的)。
建立假设:H 0:次品类型与厂家生产是独立的,H 1:次品类型与厂家生产不是独立的。
次品类型生产厂可以计算各组的期望值,如表9-3所示(表中括号内的数值为期望值)。
表9-3各组的期望值计算表A B C 总计甲乙丙20(17)40(33)15(25)45(44)90(89)65(67)35(39)70(78)70(58)100200150总计75200175450所以2222(2017)(4033)(7058)9.821173358χ---=+++=…。
而自由度等于(R -1)(C -1)=(3-1)×(3-1)=4,若以0.01的显著性水平进行检验,查χ2分布表得20.01(4)13.277χ=。
由于220.019.821(4)13.277χχ=<=,故接受原假设H 0,即次品类型与厂家生产是独立的。
3.说明计算2χ统计量的步骤。
答:计算2χ统计量的步骤:(1)用观察值o f 减去期望值e f ;(2)将(o f -e f )之差平方;(3)将平方结果2)(e o f f -除以e f ;(4)将步骤(3)的结果加总,即得:22()o e ef f f χ-=∑。
统计学(贾俊平版)第十章答案第十章习题H0:三个总体均值之间没有显著差异。
H1: 三个总体均值之间有显著差异。
方差分析:单因素方差分析SUMMARY组123观测数543求和平均方差方差分析差异源SS组间组内总计答:方差分析可以看到,于P=>,所以接受原假设H0。
说明了三个总体均值之间没有显著差异。
H0:五个个总体均值之间相等。
H1: 五个总体均值之间不相等。
方差分析:单因素方差分析SUMMARY组12345观测数35456求和3750488078平均方差方差分析差异源SS组间组内总计答:方差分析可以看到,于P=H0:四台机器的装填量相等。
H1: 四台机器的装填量不相等方差分析:单因素方差分析SUMMARY 组1234观测数4654求和平均方差方差分析差异源SS组间组内总计答:方差分析可以看到,于P=H0:不同层次管理者的满意度没有差异。
H1: 不同层次管理者的满意度有差异. 方差分析:单因素方差分析SUMMARY 组列1列2列3观测数576求和平均方差方差分析差异源SS组间组内总计答:方差分析可以看到,于P= H0:3个企业生产的电池平均寿命之间没有显著差异。
H1: 3个企业生产的电池平均寿命之间有显著差异单因素方差分析V AR00002 组间组内总数多重比较因变量: V AR00002 LSD (I) V AR00001 (J) V AR00001均值差(I-J)- - -****平方和df 均方 F 显著性.000 212 14标准误显著性.000 95% 置信区间下限上限.515 - .000 - - .001 - - .515 - .001*. 均值差的显著性水平为。
答:方差分析可以看到,于P=通过SPSS分析,通过显著性对比可知道A和B以及B和C公司有差异。
H0:不同培训方式对产品组装的时间没有显著影响。
H1: 不同培训方式对产品组装的时间没有显著影响。
方差分析:单因素方差分析SUMMARY组abc观测数998求和平均方差方差分析差异源SS 组间组内总计答:方差分析可以看到,于P=行因素H0:u1=u2=u3=u4=u5H1:ui(i=1,2,3,4,5)不全相等列因素H0:u1=u2=u3 H1:ui(i=1,2,3)不全相等方差分析:无重复双因素分析SUMMARY观测数1323334353dzg555求和平均方差方差分析差异源SS行列误差总计答:根据方差分析,对于行因素,P=对于列因素,p=行因素H0:不同品种对收获量没有显著影响。
第8章思考题8.1假设检验和参数估计有什么相同点和不同点?答:参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。
而在参数假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
8.2什么是假设检验中的显著性水平?统计显著是什么意思?答:显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险。
统计显著等价拒绝H0,指求出的值落在小概率的区间上,一般是落在0.05或比0.05更小的显著水平上。
8.3什么是假设检验中的两类错误?答:假设检验的结果可能是错误的,所犯的错误有两种类型,一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用α表示,所以也称α错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用β表示,所以也称β错误或取伪错误。
8.4两类错误之间存在什么样的数量关系?答:在假设检验中,α与β是此消彼长的关系。
如果减小α错误,就会增大犯β错误的机会,若减小β错误,也会增大犯α错误的机会。
8.5解释假设检验中的P值答:P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
(它的大小取决于三个因素,一个是样本数据与原假设之间的差异,一个是样本量,再一个是被假设参数的总体分布。
)8.6显著性水平与P值有何区别答:显著性水平是原假设为真时,拒绝原假设的概率,是一个概率值,被称为抽样分布的拒绝域,大小由研究者事先确定,一般为0.05。
而P只是原假设为真时所得到的样本观察结果或更极端结果出现的概率,被称为观察到的(或实测的)显著性水平8.7假设检验依据的基本原理是什么?答:假设检验依据的基本原理是“小概率原理”,即发生概率很小的随机事件在一次试验中是几乎不可能发生的。
根据这一原理,可以作出是否拒绝原假设的决定。
第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A 14 14B 21 21C 32 32D 18 18E 15 15合计100 100 (3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (1(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
第三章节:数据的图表展示 (1)第四章节:数据的概括性度量 (15)第六章节:统计量及其抽样分布 (26)第七章节:参数估计 (28)第八章节:假设检验 (38)第九章节:列联分析 (41)第十章节:方差分析 (43)3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A .好;B .较好;C 一般;D .较差;E.差。
调查结果如下:B EC C AD C B AE D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B CBCEDBCCBC要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel 制作一张频数分布表。
用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:接收 频率E 16 D 17 C 32 B 21 A14(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 1003.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:152124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。
1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。
1.5举例说明总体、样本、参数、统计量、变量这几个概念。
1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。
1.8请举出统计应用的几个例子。
1.9请举出应用统计的几个领域。
1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。
1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。
回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。
区分指标与标志,总量指标分类、分配数列、上限不在内原则、各种平均数之间的关系、平均发展指标!计算可能考的公式有:计划完成情况相对指标、结构(比例/比较/强度/动态)相对指标、各种平均数算法、众数、中位数、四分位数、平均差、标准差、标准差系数、偏态和峰度、发展速度和增长速度、总指数(很重要)、平均指标指数、重要经济指数的编制(上证指数、工业产品产量总指数、农副产品收购价格指数)统计学(第三版课后习题答案) 贾俊平版2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下(4)帕累托图(略)。
2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。
(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。
2.72.8(1)属于数值型数据。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =(万元);M e= 。
?统计学?第四版统计学? 第四章练习题答案4.1 〔1 〕众数:M0=10; 中位数:中位数位置=n+1/2=5.5 ,Me=10 ;平均数:x=∑xni=96 = 9 .6 102(2)QL 位置=n/4=2.5, QL=4+7/2=5.5;QU 位置=3n/4=7.5,QU=12 〔3〕s =∑( xi ? x )n ?1=156.4 = 4.2 9〔4〕由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2 〔1〕从表中数据可以看出,年龄出现频数最多的是19 和23,故有个众数,即M0=19 和M0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13 个位置上的数值为23,所以中位数为Me=23 〔2〕QL 位置=n/4=6.25, QL==19;QU 位置=3n/4=18.75,QU=26.5 ∑x (3)平均数x =ni= 600/25=24,标准差s =∑( xi ? x )n ?12=1062 = 6.65 25 ? 1〔4〕偏态系数SK=1.08,峰态系数K=0.77 〔5〕分析:从众数、中位数和平均数来看,网民年龄在23-24 岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
4.3 〔1〕茎叶图如下:茎 5 6 7 叶5 678 13488 频数1 3 52∑x 〔2〕x =ni= 63/9=7, s =∑( xi ? x )n ?1=4.08 = 0.714 8〔3〕由于两种排队方式的平均数不同,所以用离散系数进展比拟。
第一种排队方式:v1=1.97/7.2=0.274;v2=0.714/7=0.102.由于v1>v2,说明第一种排队方式的离散程度大于第二种排队方式。
〔4〕选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
第十章习题10.1H0:三个总体均值之间没有显著差异。
H1:三个总体均值之间有显著差异。
答:方差分析可以看到,由于P=0。
1078>0.01,所以接受原假设H0。
说明了三个总体均值之间没有显著差异.10.2H0:五个个总体均值之间相等。
H1: 五个总体均值之间不相等。
答:方差分析可以看到,由于P=1。
02E-05〈0.01,所以拒接原假设H0。
说明了五个总体均值之间不相等。
H0:四台机器的装填量相等。
H1:四台机器的装填量不相等答:方差分析可以看到,由于P=0.00068〈0。
01,所以拒接原假设H0。
说明了四台机器装填量不相同。
10.4H0:不同层次管理者的满意度没有差异.H1:不同层次管理者的满意度有差异。
答:方差分析可以看到,由于P=0。
000849〈0.05,所以拒接原假设H0。
说明了不同层次管理者的满意度有差异。
H0:3个企业生产的电池平均寿命之间没有显著差异。
H1: 3个企业生产的电池平均寿命之间有显著差异多重比较因变量: VAR00002LSD(I)VAR00001 (J)VAR00001均值差(I-J)标准误显著性95%置信区间下限上限1。
00 2。
00 14.40000*2。
68576 。
000 8.5482 20。
2518 3。
00 1.80000 2。
68576 .515 -4。
0518 7.65182.00 1.00—14。
40000*2.68576 .000 -20.2518 -8。
54823.00—12。
60000*2.68576 .001—18。
4518—6.74823.00 1。
00 —1.80000 2.68576 。
515 —7.65184.0518 2。
00 12.60000*2。
68576 .001 6。
7482 18。
4518*. 均值差的显著性水平为 0.05。
答:方差分析可以看到,由于P=0。
00031<0.01,所以拒接原假设H0。
说明了不同3个企业生产的电池平均寿命之间有显著差异。
统计学(第五版)贾俊平课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学第五版第⼗章课后答案统计学第五版第⼗章课后答案【篇⼀:统计学(第五版)贾俊平等著——课后习题答案】/p> (1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2(1)总体是该市所有职⼯家庭的集合;样本是抽中的2000个职⼯家庭的集合。
(2)参数是该市所有职⼯家庭的年⼈均收⼊;统计量是抽中的2000个职⼯家庭的年⼈均收⼊。
1.3(1)总体是所有it从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截⾯数据。
1.4(1)总体是所有在⽹上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在⽹上购物者的⽉平均花费。
(4)参数(5)推断统计⽅法。
第⼆章数据的搜集1.什么是⼆⼿资料?使⽤⼆⼿资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别⼈调查和实验得来的,并会被我们利⽤的资料称为“⼆⼿资料”。
使⽤⼆⼿资料时需要注意:资料的原始搜集⼈、搜集资料的⽬的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算⼝径和计算⽅法,避免错⽤、误⽤、滥⽤。
在引⽤⼆⼿资料时,要注明数据来源。
2.⽐较概率抽样和⾮概率抽样的特点,举例说明什么情况下适合采⽤概率抽样,什么情况下适合采⽤⾮概率抽样。
概率抽样是指抽样时按⼀定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当⽤样本对总体⽬标量进⾏估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都⽐较⾼。
如果调查的⽬的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使⽤概率抽样。
⾮概率抽样是指抽取样本时不是依据随机原则,⽽是根据研究⽬的对数据的要求,采⽤某种⽅式从总体中抽出部分单位对其实施调查。
⾮概率抽样操作简单、实效快、成本低,⽽且对于抽样中的专业技术要求不是很⾼。
它适合探索性的研究,调查结果⽤于发现问题,为更深⼊的数量分析提供准备。
⾮概率抽样也适合市场调查中的概念测试。
附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (1(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
第十章习题
10.1
H0:三个总体均值之间没有显著差异。
H1: 三个总体均值之间有显著差异。
答:方差分析可以看到,由于P=0.1078>0.01,所以接受原假设H0。
说明了三个总体均值之间没有显著差异。
10.2
H0:五个个总体均值之间相等。
H1: 五个总体均值之间不相等。
答:方差分析可以看到,由于P=1.02E-05<0.01,所以拒接原假设H0。
说明了五个总体均值之间不相等。
10.3
H0:四台机器的装填量相等。
H1: 四台机器的装填量不相等
答:方差分析可以看到,由于P=0.00068<0.01,所以拒接原假设H0。
说明了四台机器装填
10.4
H0:不同层次管理者的满意度没有差异。
H1: 不同层次管理者的满意度有差异.
答:方差分析可以看到,由于P=0.000849<0.05,所以拒接原假设H0。
说明了不同层次管理者的满意度有差异。
10.5
H0:3个企业生产的电池平均寿命之间没有显著差异。
H1: 3个企业生产的电池平均寿命之间有显著差异
单因素方差分析
平方和df 均方 F 显著性组间615.600 2 307.800 17.068 .000 组内216.400 12 18.033
总数832.000 14
答:方差分析可以看到,由于P=0.00031<0.01,所以拒接原假设H0。
说明了不同3个企业生产的电池平均寿命之间有显著差异。
通过SPSS分析(1,2,3代表A,B,C公司),通过显著性对比可知道A和B以及B和C 公司有差异。
10.6
H0:不同培训方式对产品组装的时间没有显著影响。
H1: 不同培训方式对产品组装的时间没有显著影响。
答:方差分析可以看到,由于P=0.00196<0.05,所以拒接原假设H0。
说明了不同培训方式对产品组装的时间没有显著影响。
10.8
行因素(供应商)H0:u1=u2=u3=u4=u5
H1:u i(i=1,2,3,4,5)不全相等
列因素(车速)H0:u1=u2=u3
H1:u i(i=1,2,3)不全相等
答:根据方差分析,
对于行因素,P=0.000236<0.01,所以拒绝原假设。
说明不同供应商生产的轮胎对磨损程度有显著影响。
对于列因素,p=2.39E-06<0.01,所以拒绝原假设,说明不同车速对磨损程度有显著影响。
10.9
行因素(品种)H0:不同品种对收获量没有显著影响。
H1: 不同品种对收获量有显著影响。
列因素(施肥方案)H0:不同施肥方案对收获量没有显著影响。
H1: 不同施肥方案对收获量有显著影响。
答:根据方差分析,
对于行因素,P=0.002107<0.05,所以拒绝原假设。
说明不同品种对收获量有显著影响。
对于列因素,p=0.0026<0.05,所以拒绝原假设,说明不同施肥方案对收获量有显著影响。
10.10
行因素(销售地区)H0:不同销售地区对销售量没有显著影响。
H1: 不同销售地区对销售量有显著影响。
列因素(包装方法)H0:不同包装方法对销售量没有显著影响。
H1: 不同包装方法对销售量有显著影响。
方差分析:无重复双因素分析
SUMMAR
观测数求和平均方差
Y
A1 3 150 50 525
A2 3 140 46.66667 33.33333
A3 3 150 50 225
B1 3 130 43.33333 58.33333
B2 3 190 63.33333 158.3333
B3 3 120 40 100
方差分析
差异源SS df MS F P-value F crit 行22.22222 2 11.11111 0.072727 0.931056 6.944272 列955.5556 2 477.7778 3.127273 0.152155 6.944272 误差611.1111 4 152.7778
总计1588.889 8
答:根据方差分析,
对于行因素,P=0.931056>0.05,所以接受原假设。
说明不同销售地区对销售量没有显著影响。
对于列因素,p=0.152155>0.05,所以接受原假设,不同包装方法对销售量没有显著影响。
10.11
H0:竞争者对销售额无显著影响
H1:竞争者对销售额有显著影响
H0:位置对销售额无显著影响
H1:位置对销售额有显著影响
H0:竞争者和位置对销售额无显著交互影响
H1:竞争者和位置对销售额有显著交互影响
主体间效应的检验
因变量: 销售额
源III 型平方
和
df 均方 F Sig. 校正模型3317.889a11 301.626 11.919 .000
截距
44802.77
8 1
44802.77
8
1770.472 .000
超市位置1736.222 2 868.111 34.305 .000
竞争者1078.333 3 359.444 14.204 .000
超市位置* 竞
争者
503.333 6 83.889 3.315 .016
误差607.333 24 25.306
总计
48728.00
36
校正的总计3925.222 35
a. R 方= .845(调整R 方= .774)
答:用SPSS进行分析得出:
1:因为SIG小于0.01,所以拒绝原假设,竞争者对销售额有显著影响。
2:因为SIG小于0.01,所以拒绝原假设,超市位置对销售额有显著影响。
3:因为SIG大于0.01,所以接受原假设,超市位置和竞争者对销售额无显著的交互影响。
10.12
H0:广告方案对销售额无显著影响
H1:广告方案对销售额有显著影响
H0:广告媒体对销售额无显著影响
H1:广告媒体对销售额有显著影响
H0:广告方案和广告媒体对销售额无显著交互影响
H1:广告方案和广告媒体对销售额有显著交互影响
主体间效应的检验
因变量: 销售额
源III 型平方和df 均方 F Sig.
校正模型448.000a 5 89.600 5.600 .029 截距3072.000 1 3072.000 192.000 .000 广告方案344.000 2 172.000 10.750 .010 媒体48.000 1 48.000 3.000 .134 广告方案* 媒体56.000 2 28.000 1.750 .252
误差96.000 6 16.000
总计3616.000 12
校正的总计544.000 11
a. R 方= .824(调整R 方= .676)
答:用SPSS进行分析得出:
1:因为SIG小于0.05,所以拒绝原假设,广告方案对销售额有显著影响。
2:因为SIG大于0.05,所以接受原假设,广告媒体对销售额没有显著影响。
3:因为SIG大于0.05,所以接受原假设,广告方案和广告媒体对销售额没有显著的交互影响。