统计学第五版课后练答案(4-6章)
- 格式:doc
- 大小:562.50 KB
- 文档页数:10
统计学第四章课后题及答案解析统计学第四章课后题及答案解析以下是为大家整理的统计学第四章课后题及答案解析的相关范文,本文关键词为统计学,第四章,课后,答案,解析,第四章,练习题,单项选择,,您可以从右上方搜索框检索更多相关文章,如果您觉得有用,请继续关注我们并推荐给您的好友,您可以在综合文库中查看更多范文。
第四章练习题一、单项选择题1.由反映总体单位某一数量特征的标志值汇总得到的指标是()A.总体单位总量b.质量指标c.总体标志总量D.相对指标2.各部分所占比重之和等于1或100%的相对数()A.比例相对数b.比较相对数c.结构相对数D.动态相对数3.某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为()A.104.76%b.95.45%c.200%D.4.76%4.某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14.5%,则产品成本计划完成程度()A.14.5%b.95%c.5%D.114.5%5.在一个特定总体内,下列说法正确的是()A.只存在一个单位总量,但可以同时存在多个标志总量b.可以存在多个单位总量,但必须只有一个标志总量c.只能存在一个单位总量和一个标志总量D.可以存在多个单位总量和多个标志总量6.计算平均指标的基本要求是所要计算的平均指标的总体单位应是()A.大量的b.同质的c.有差异的D.不同总体的7.几何平均数的计算适用于求()A.平均速度和平均比率b.平均增长水平c.平均发展水平D.序时平均数8.一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是()A.3b.13c.7.1D.79.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是()A.方差b.极差c.标准差D.变异系数10.用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是()A.两个总体的标准差应相等b.两个总体的平均数应相等c.两个总体的单位数应相等D.两个总体的离差之和应相等11.已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应采用()A.简单算术平均数b.加权算术平均数c.加权调和平均数D.几何平均数12.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。
第六章课后题解答1. 与参数检验相比,非参数检验有哪些优缺点?主要适用于那些场合?答:(1)非参数检验不需要严格假设条件,因而比参数检验有更广泛的适用面;非参数检验几乎可以处理包括定类数据和定序数据在内的所有类型的数据,而参数检验通常只能用于定量数据的分析;在参数检验和非参数检验都可以使用的情况下,非参数检验的功效(power)要低于参数检验方法。
(2)参数检验中的假设条件不满足;检验中涉及的数据为定类或定序数据;所涉及的问题中并不包含参数;对各种资料的初步分析。
2. 使用“学生调查.sav”文件中的数据检验:(1)能否认为总体中学生的学习兴趣呈均匀分布?(2)能否认为总体中学生的身高服从正态分布?χ拟合优度检验,计算出的2χ统计量的值为2.000,自由答:(1)利用2度为4,相应的p值(渐近显著性)为0.736。
由于0.736大于0.05,所以在5%的显著性水平下不能拒绝原假设,也就是说根据样本数据不能认为总体数据是非均匀的。
表2.1(2)利用单样本K-S检验法,计算出的D统计量的值为0.899,相应的pmax值(渐近显著性)为0.394。
由于0.394大于0.05,所以在5%的显著性水平下不能拒绝原假设,也就是说根据样本数据不能认为总体数据是非正态的。
表2.23. 某企业生产一种钢管,规定长度的中位数是l0米。
现随机地从正在生产的生产线上选取10根进行测量,结果为:9.8,10.1,9.7,9.9,9.8,10.0,9.7,10.0,9.9,9.8。
问该企业的生产过程是否需要调整。
答:单样本中位数的符号检验法检验钢管长度的中位数是否为50,各个数值与中位数比较的结果,有7个值小于10,1个值大于10,2个等于10。
样本量较少,输出双侧检验的p值(精确显著性)为0.070。
显然,这里我们的结论是不能拒绝原假设。
表3.14. 从上海证券交易所的上市公司随机抽取10家,观察其2008年年终财务报告公布前后三日的平均股价(如表6-15),试用参数和非参数方法检验:我国上市公司年报对股价是否有显著性影响?表6-15 10家公司年终财务报告公布前后三日的平均股价序号 1 2 3 4 5 6 7 8 9 10 年报公布前15 21 18 13 35 10 17 23 14 25年报公布后17 18 25 16 40 8 21 31 22 25答:表4.1是Wilcoxon符号秩检验的计算结果。
一、选择题1、在用样本的估计量估计总体参数时,评价估计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为(B)A、无偏性B、有效性C、一致性D、充分性2、根据一个具体的样本求出的总体均值95%的置信区间(D)A、以95%的概率包含总体均值B、有5%的可能性包含总体均值C、绝对包含总体均值D、绝对包含总体均值或绝对不包含总体均值3、估计量的无偏性是指(B)A、样本估计量的值恰好等于待估的总体参数B、所有可能样本估计值的期望值等于待估总体参数C、估计量与总体参数之间的误差最小D、样本量足够大时估计量等于总体参数4、下面的陈述中正确的是(C)A、95%的置信区间将以95%的概率包含总体参数B、当样本量不变时,置信水平越大得到的置信区间就越窄C、当置信水平不变时,样本量越大得到的置信区间就越窄D、当置信水平不变时,样本量越大得到的置信区间就越宽5、总体均值的置信区间等于样本均值加减估计误差,其中的估计误差等于所求置信水平的临界值乘以(A)A、样本均值的标准误差B、样本标准差C、样本方差D、总体标准差6、95%的置信水平是指(B)A、总体参数落在一个特定的样本所构造的区间内的概率为95%B、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为95%C、总体参数落在一个特定的样本所构造的区间内的概率为5%D、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为5%7、一个估计量的有效性是指(D)A、该估计量的期望值等于被估计的总体参数B、该估计量的一个具体数值等于被估计的总体参数C、该估计量的方差比其他估计量大D、该估计量的方差比其他估计量小8、一个估计量的一致性是指(C)A、该估计量的期望指等于被估计的总体参数B、该估计量的方差比其他估计量小C、随着样本量的增大该估计量的值越来越接近被估计的总体参数D、该估计量的方差比其他估计量大9、支出下面的说法哪一个是正确的(A)A、一个大样本给出的估计量比一个小样本给出的估计量更接近总体参数B、一个小样本给出的估计量比一个大样本给出的估计量更接近总体参数C、一个大样本给出的总体参数的估计区间一定包含总体参数D、一个小样本给出的总体参数的估计区间一定不包含总体参数10、用样本估计量的值直接作为总体参数的估计值,这一估计方法称为(A)A、点估计B、区间估计C、无偏估计D、有效估计11、将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例称为(C)A、置信区间B、显著性水平C、置信水平D、临界值12、在总体均值和总体比例的区间估计中,估计误差由(C)A、置信水平确定B、统计量的抽样标准差确定C、置信水平和统计量的抽样标准差确定D、统计量的抽样方差确定13、在置信水平不变的条件下,要缩小置信区间,则(A)A、需要增加样本量B、需要减少样本量C、需要保持样本量不变D、需要改变统计量的抽样标准差14、估计一个正态总体的方差使用的分布是(C)A、正态分布B、t分布C、卡方分布D、F分布15、当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是(B)A、正态分布B、t分布C、卡方分布D、F分布16、当正态总体的方差未知,在大样本条件下,估计总体均值使用的分布是(A)A、正态分布B、t分布C、卡方分布D、F分布17、在其他条件不变的条件下,要使估计时所需的样本量小,则应该(A)A、提高置信水平B、降低置信水平C、使置信水平不变D、使置信水平等于118、使用t分布估计一个总体均值时,要求(D)A、总体为正态分布且方差已知B、总体为非正态分布C、总体为非正态分布但方差已知D、正态总体方差未知,且为小样本19、在大样本条件下,总体均值在(1-)置信水平下的置信区间可以些为(C)A、B、C、D、20、正态总体方差已知时,在小样本条件下,总体均值在置信水平下的置信区间可以写为(C)A、B、C、D、21、正态总体方差未知时,在小样本条件下,总体均值在置信水平下的置信区间可以写为(B)A、B、C、D、22、指出下面的说法哪一个是正确的(A)A、样本量越大,样本均值的抽样标准差就越小B、样本量越大,样本均值的抽样标准差就越大C、样本量越小,样本均值的抽样标准差就越小D、样本均值的抽样标准差与样本量无关23、抽取一个样本量为100的随机样本,其均值为,标准差。
大学统计学第五版习题答案大学统计学第五版习题答案统计学作为一门重要的学科,对于各个领域的研究和实践都具有重要的意义。
在大学学习统计学时,习题是巩固知识、提高能力的重要途径。
大学统计学第五版是一本经典的教材,其中的习题涵盖了各个知识点,对于学生来说是一次很好的训练机会。
下面将给出一些大学统计学第五版习题的答案,希望对学生们的学习有所帮助。
第一章:统计学导论1. 样本容量的确定答案:样本容量的确定需要考虑到以下几个因素:总体大小、总体方差、置信水平和允许的误差范围。
一般来说,总体大小越大,样本容量越小;总体方差越大,样本容量越大;置信水平越高,样本容量越大;允许的误差范围越小,样本容量越大。
第二章:统计学数据的描述1. 描述性统计的应用答案:描述性统计是对数据进行整理、总结和分析的方法。
它可以帮助我们了解数据的特征、趋势和分布情况。
在实际应用中,描述性统计可以用于制定市场调研报告、分析销售数据、评估产品质量等方面。
第三章:概率1. 概率的计算答案:概率的计算可以通过频率法和几何法来进行。
频率法是通过实验或观察来估计事件发生的可能性,即事件发生的次数除以总次数。
几何法是通过对样本空间和事件发生的区域进行几何分析来计算概率。
第四章:离散型随机变量和概率分布1. 二项分布的应用答案:二项分布是离散型随机变量的一种常见分布。
它适用于只有两个可能结果的实验,如抛硬币、生男生女等。
在实际应用中,二项分布可以用于预测产品合格率、判断市场需求等方面。
第五章:连续型随机变量和概率分布1. 正态分布的性质答案:正态分布是连续型随机变量的一种常见分布。
它具有对称性、钟形曲线和均值和标准差唯一确定等性质。
正态分布在实际应用中非常广泛,例如用于身高体重的统计、质量控制等方面。
第六章:抽样分布和点估计1. 置信区间的计算答案:置信区间是用于估计总体参数的范围。
计算置信区间时需要考虑样本容量、样本均值、样本标准差和置信水平等因素。
第四章统计数据的概括性度量欧阳歌谷(2021.02.01)4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.00754.2 随机抽取单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:4.3 某银行为缩短顾客到银行办理业务等待的时间。
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1。
2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据.它也是有类别的,但这些类别是有序的.(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值.统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1。
4解释分类数据,顺序数据和数值型数据答案同1。
31。
5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1。
6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量.经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数"连续型变量,取之连续不断,不能一一列举,比如“温度”。
欢迎阅读一、选择题1、在用样本的估计量估计总体参数时,评价估计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为(B)A、无偏性B、有效性C、一致性D、充分性2、根据一个具体的样本求出的总体均值95%的置信区间(D)A、以95%的概率包含总体均值B、有5%的可能性包含总体均值C、绝对包含总体均值D3ABCD4A、95%BCD5乘以(AABCD6、95%ABCD7ABC、该估计量的方差比其他估计量大D、该估计量的方差比其他估计量小8、一个估计量的一致性是指(C)A、该估计量的期望指等于被估计的总体参数B、该估计量的方差比其他估计量小C、随着样本量的增大该估计量的值越来越接近被估计的总体参数D、该估计量的方差比其他估计量大9、支出下面的说法哪一个是正确的(A)A、一个大样本给出的估计量比一个小样本给出的估计量更接近总体参数B、一个小样本给出的估计量比一个大样本给出的估计量更接近总体参数C 、一个大样本给出的总体参数的估计区间一定包含总体参数D 、一个小样本给出的总体参数的估计区间一定不包含总体参数10、用样本估计量的值直接作为总体参数的估计值,这一估计方法称为(A )A 、点估计B 、区间估计C 、无偏估计D 、有效估计11、将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例称为(C )A 、置信区间B 、显着性水平C 、置信水平D 、临界值12、在总体均值和总体比例的区间估计中,估计误差由(C )A 、置信水平确定B 、统计量的抽样标准差确定CD 13A C 14A C 15A C 16A C 17A C 18、使用A B C D 19A 、nt x α2±n 2αC 、n s z x 2α± D 、n s z x 22α±20、正态总体方差已知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(C )A 、n z x 22σα±B 、n s t x 2α±C 、n z x σα2±D 、n t x σα2±21、正态总体方差未知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(B )A 、n s z x 2α±B 、ns t x 2α±C 、n z x σα2±D 、n s z x 22α±22、指出下面的说法哪一个是正确的(A )AB C D 23的置A 、81±C 、81±24均值μ的A 、33±C 、33±25、μ的95%A 、40±C 、40±26、有18A 、%11C 、%1127、在对A 、078.064.0± B 、028.064.0±C 、035.064.0±D 、045.064.0±28、税务管理官员认为,大多数企业都有偷税漏税行为。
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括和分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象和实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
一、选择题1、在用样本的估计量估计总体参数时,评价估计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为(B)A、无偏性B、有效性C、一致性D、充分性2、根据一个具体的样本求出的总体均值95%的置信区间(D)A、以95%的概率包含总体均值B、有5%的可能性包含总体均值C、绝对包含总体均值D、绝对包含总体均值或绝对不包含总体均值3、估计量的无偏性是指(B)A、样本估计量的值恰好等于待估的总体参数B、所有可能样本估计值的期望值等于待估总体参数C、估计量与总体参数之间的误差最小D、样本量足够大时估计量等于总体参数4、下面的陈述中正确的是(C)A、95%的置信区间将以95%的概率包含总体参数B、当样本量不变时,置信水平越大得到的置信区间就越窄C、当置信水平不变时,样本量越大得到的置信区间就越窄D、当置信水平不变时,样本量越大得到的置信区间就越宽5、总体均值的置信区间等于样本均值加减估计误差,其中的估计误差等于所求置信水平的临界值乘以(A)A、样本均值的标准误差B、样本标准差C、样本方差D、总体标准差6、95%的置信水平是指(B)A、总体参数落在一个特定的样本所构造的区间内的概率为95%B、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为95%C、总体参数落在一个特定的样本所构造的区间内的概率为5%D、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为5%7、一个估计量的有效性是指(D)A、该估计量的期望值等于被估计的总体参数B、该估计量的一个具体数值等于被估计的总体参数C、该估计量的方差比其他估计量大D、该估计量的方差比其他估计量小8、一个估计量的一致性是指(C)A、该估计量的期望指等于被估计的总体参数B、该估计量的方差比其他估计量小C、随着样本量的增大该估计量的值越来越接近被估计的总体参数D、该估计量的方差比其他估计量大9、支出下面的说法哪一个是正确的(A)A、一个大样本给出的估计量比一个小样本给出的估计量更接近总体参数B、一个小样本给出的估计量比一个大样本给出的估计量更接近总体参数C 、一个大样本给出的总体参数的估计区间一定包含总体参数D 、一个小样本给出的总体参数的估计区间一定不包含总体参数10、用样本估计量的值直接作为总体参数的估计值,这一估计方法称为(A )A 、点估计B 、区间估计C 、无偏估计D 、有效估计11、将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例称为(C )A 、置信区间B 、显著性水平C 、置信水平D 、临界值12、在总体均值和总体比例的区间估计中,估计误差由(C )A 、置信水平确定B 、统计量的抽样标准差确定C 、置信水平和统计量的抽样标准差确定D 、统计量的抽样方差确定13、在置信水平不变的条件下,要缩小置信区间,则(A )A 、需要增加样本量B 、需要减少样本量C 、需要保持样本量不变D 、需要改变统计量的抽样标准差14、估计一个正态总体的方差使用的分布是(C )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布15、当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是(B )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布16、当正态总体的方差未知,在大样本条件下,估计总体均值使用的分布是(A )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布17、在其他条件不变的条件下,要使估计时所需的样本量小,则应该(A )A 、提高置信水平B 、降低置信水平C 、使置信水平不变D 、使置信水平等于118、使用t 分布估计一个总体均值时,要求(D )A 、总体为正态分布且方差已知B 、总体为非正态分布C 、总体为非正态分布但方差已知D 、正态总体方差未知,且为小样本19、在大样本条件下,总体均值在(1-α)置信水平下的置信区间可以些为(C )A 、n t x σα2±B 、n s t x 2α±C 、n s z x 2α±D 、n s z x 22α±20、正态总体方差已知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(C )A 、n z x 22σα±B 、n s t x 2α±C 、n z x σα2±D 、n t x σα2±21、正态总体方差未知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(B )A 、n s z x 2α±B 、n s t x 2α±C 、n z x σα2±D 、n s z x 22α±22、指出下面的说法哪一个是正确的(A )A 、样本量越大,样本均值的抽样标准差就越小B 、样本量越大,样本均值的抽样标准差就越大C 、样本量越小,样本均值的抽样标准差就越小D 、样本均值的抽样标准差与样本量无关23、抽取一个样本量为100的随机样本,其均值为81=x ,标准差12=s 。
第四章统计数据的概括性度量欧阳引擎(2021.01.01)4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.00754.2 随机抽取单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:4.3 某银行为缩短顾客到银行办理业务等待的时间。
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing0MeanMedianMode10Std. DeviationPercentiles255075单位:周岁19152925242321382218302019191623272234244120311723要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。
Q1位置=25/4=,因此Q1=19,Q3位置=3×25/4=,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+×2=。
(3)计算平均数和标准差;Mean=;Std. Deviation=(4)计算偏态系数和峰态系数:Skewness=;Kurtosis=(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=、呈右偏分布。
如需看清楚分布形态,需要进行分组。
1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。
得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。
第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8要求:(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) Stem-and-Leaf PlotFrequency Stem & LeafExtremes (=<6 . 6787 . 1347 . 88Stem width:Each leaf: 1 case(s)(2)计算第二种排队时间的平均数和标准差。
Mean7Std. DeviationVariance(3)比较两种排队方式等待时间的离散程度。
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种试说明理由。
选择第二种,均值小,离散程度小。
4.4 某百货公司6月份各天的销售额数据如下:单位:万元257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295要求:(1)计算该百货公司日销售额的平均数和中位数。
(2)按定义公式计算四分位数。
(3)计算日销售额的标准差。
解:Statistics百货公司每天的销售额(万元)30Missing0MeanMedianStd. DeviationPercentiles255075的产品多。
(1)计算120家企业利润额的平均数和标准差。
(2)计算分布的偏态系数和峰态系数。
解:Statistics120Missing0MeanStd. DeviationSkewnessStd. Error of SkewnessKurtosisStd. Error of Kurtosis100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁的少年儿童作为样本。
请回答下面的问题,并解释其原因。
(1)两位调查人员所得到的样本的平均身高是否相同如果不同,哪组样本的平均身高较大(2)两位调查人员所得到的样本的标准差是否相同如果不同,哪组样本的标准差较大(3)两位调查人员得到这l 100名少年儿童身高的最高者或最低者的机会是否相同如果不同,哪位调查研究人员的机会较大解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大的更接近于总体平均身高。
(2)不一定相同,样本量少的标准差大的可能性大。
(3)机会不相同,样本量大的得到最高者和最低者的身高的机会大。
4.8 一项关于大学生体重状况的研究发现.男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。
请回答下面的问题:(1)是男生的体重差异大还是女生的体重差异大为什么女生,因为标准差一样,而均值男生大,所以,离散系数是男生的小,离散程度是男生的小。
(2)以磅为单位(1ks=2.2lb),求体重的平均数和标准差。
都是各乘以,男生的平均体重为60kg×=132.6磅,标准差为5kg×=11.05磅;女生的平均体重为50kg ×=110.5磅,标准差为5kg×=11.05磅。
(3)粗略地估计一下,男生中有百分之几的人体重在55kg一65kg之间计算标准分数:Z1=x xs-=55605-=-1;Z2=x xs-=65605-=1,根据经验规则,男生大约有68%的人体重在55kg一65kg之间。
(4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间计算标准分数:Z1=x xs-=40505-=-2;Z2=x xs-=60505-=2,根据经验规则,女生大约有95%的人体重在40kg一60kg之间。
4.9 一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该应试者哪一项测试更为理想解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。
Z A=x xs-=11510015-=1;Z B=x xs-=42540050-=因此,A项测试结果理想。
4.10 一条产品生产线平均每天的产量为3 700件,标准差为50件。
如果某一天的产量低于或高于平均产量,并落人士2个标准差的范围之外,就认为该生产线“失去控制”。
下面是一周各天的产量,该(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量为什么均值不相等,用离散系数衡量身高差异。
(2)4.12 一种产品需要人工组装,现有三种可供选择的组装方法。
为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。
下面是15个工人分别用三种方法在相同的时间内组装的产品数量:要求:(1)你准备采用什么方法来评价组装方法的优劣 均值不相等,用离散系数衡量身高差异。
(2)如果让你选择一种方法,你会作出怎样的选择试说明理由。
解:对比均值和离散系数的方法,选择均值大,离散程度小的。
方法A 方法B 方法C 平均 平均 平均 标准差 标准差 标准差离散系数: V A =,V B = ,V C =均值A 方法最大,同时A 的离散系数也最小,因此选择A 方法。
4.13 在金融证券领域,一项投资的预期收益率的变化通常用该项投资的风险来衡量。
预期收益率的变化越小,投资风险越低;预期收益率的变化越大,投资风险就越高。
下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。
在股票市场上,高收益率往往伴随着高风险。
但投资于哪类股票,往往与投资者的类型有一定关系。
(1)你认为该用什么样的统计量来反映投资的风险 标准差或者离散系数。
(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票 选择离散系数小的股票,则选择商业股票。
(3)如果进行股票投资,你会选择商业类股票还是高科技类股票 考虑高收益,则选择高科技股票;考虑风险,则选择商业股票。
第五章 概率与概率分布略P(AB)=P(A)+P(B)-P(A+B)=50%+60%-85%=35%因为()()P AB P AB P(AB)=1/3++;()()P B (A(B+B))=P(AB)P AB =1/3P =+()()P A (A(B+B))=P(AB)P AB =1/3-1/9=2/9P =+()()P AB P AB P(AB)P(AB)=1+++Q ;()()P A|B P AB /()1/6P B ==Q ; ()P AB 1/6*1/31/18∴==()()P A (A(B+B))=P(AB)P AB P =+;()P AB 1/31/185/18=-=同理()()P B (B(A+A))=P(AB)P AB P =+;()P AB =518/()()11/185/185/18P A|B P AB /()7/1211/3P B ---===-Q(1)()P(A)P B 0.8*0.70.56==;(2)()P A+B (A)+P(B)-P(AB)=0.8+0.7-0.8*0.7=0.94P = (3)()P A+B (A)+P(B)-2P(AB)=0.8+0.7-2*0.8*0.7=0.38P = ()()(A P B|A 96%*75%=0.72P B P ==) ()()1/2P A|B P AB /()2/334P B ===/ 贝叶斯公式:()()()()k k k P A )P(B|A 10%*20%P A |B 3.63%P A P B|A 10%*20%50%*50%40%*70%===++∑()()()()k k k P A )P(B|A 50%*50%P A |B 45.45%P A P B|A 10%*20%50%*50%40%*70%===++∑()()()()k k k P A )P(B|A 40%*70%P A |B 50.9%P A P B|A 10%*20%50%*50%40%*70%===++∑贝叶斯公式:()()()()k k k P A )P(B|A 30%*0.1P A |B 0.249P A P B|A 30%*0.127%*0.0525%*0.218%*0.15===+++∑()()()()k k k P A )P(B|A 27%*0.05P A |B 0.112P A P B|A 30%*0.127%*0.0525%*0.218%*0.15===+++∑P(x=0)=; P(x=1)=; P(x=2)=(1) P(x=1)=; P(x=10)=; P(x=100)= (2)Ex=1*+10*+100*=(1) 231378x dx θθ=⎰,2θ∴= (2) 3213 1.58x Ex dx ==⎰;21340.158x Dx dx ==⎰ (5,0.25)x B :,学生凭猜测至少答对4道的概率为:(4)(5)P x P x =+==441550550.250.750.250.75C C +=164P(x=k)=λ^k×e^(-λ)/k!①P(x=k+1)=λ^(k+1)×e^(-λ)/(k+1)!② ②/①得 P(x=k+1)/P(x=k)=λ/(k+1) 令P(x=k+1)/P(x=k)>1, 则λ>k+1, k<λ-1 令P(x=k+1)/P(x=k)<1, 则λ<k+1, k>λ-1若λ<2, 则P(x=k)随着k 增大而减小, ∴k=1时最大若λ>2, 则P(x=1)<……<P(x=[λ-1])<P(x=[λ-1]+1)>P(x=[λ-1]+2)>……, ∴k=[λ-1]+1=[λ]是最大 综上, λ<2时,k=1;λ>2时,k=[λ](写成分段的形式,[]是取整符号) (1) (2)(1) (2)第六章 统计量及其抽样分布调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。