实用统计学第五章
- 格式:doc
- 大小:216.51 KB
- 文档页数:13
题目:表示均数抽样误差大小的统计指标是?()
选项A:标准误
选项B:方差
选项C:标准差
选项D:变异系数
答案:标准误
题目: C )
选项A:总体标准差
选项B:样本均数的标准差
选项C:总体均数
选项D:总体均数的离散程度
答案:样本均数的标准差
题目:抽样研究中,s为定值,若逐渐增大样本含量,则样本()选项A:标准误增大
选项B:标准误不改变
选项C:标准误减小
选项D:标准误的变化与样本含量无关
答案:标准误减小
题目:均数标准误越大,则表示此次抽样得到的样本均数()
选项A:抽样误差越大
选项B:可靠程度越大
选项C:系统误差越大
选项D:测量误差越大
答案:抽样误差越大
题目:在总体中抽样得到的样本率与总体率不同的原因()
选项A:抽样误差
选项B:均数不同
选项C:测量误差
选项D:总体的本质差异
答案:抽样误差
题目:要减小抽样误差,最切实可行的方法是()
选项A:控制个体变异
选项B:提高仪器精度
选项C:适当增加观察例数
选项D:严格挑选观察对象
答案:适当增加观察例数
题目:已知某地36岁以上的正常成年男性的收缩压总体均数是120mmHg,标准差为11mmHg,后者反映的是?()
选项A:抽样误差
选项B:测量误差
选项C:系统误差
选项D:个体变异
答案:个体变异
题目:在控制了系统误差和测量误差后,从某地30岁正常成年女性总体中随机抽样30名,
样本均数与总体均数有差别,产生差别的原因是?()
选项A:抽样误差
选项B:个体变异。
下列关于相对比计算的叙述正确的是()。
选择一项:a. 相对比公式中的甲乙指标一定要是绝对数b. 要求两指标必须性质相同,否则无法比较c. 对公式中的甲乙指标无明确限制,相对比的用途可以很广d. 甲乙指标一定要选用相对数题目2正确获得0.80分中的0.80分标记题目题干关于相对数,下列哪一个说法是错误的()选择一项:a. 常用相对数包括:相对比,率与构成比b. 计算相对数时要求分母要足够大c. 率与构成比虽然意义不同,但性质相近,经常可以混用d. 相对数是两个有联系的指标之比题目3正确获得0.80分中的0.80分标记题目题干关于构成比指标,描述正确的是( )。
选择一项:a. 构成比是说明某现象发生的频率或强度的指标b. 构成比的分母是可能发生某现象的观察单位总数c. 以m/n表示构成比,可得出m与n的倍数关系或m是n的几分之几d. 其表示事物内部各部分的比重大小题目4正确获得0.80分中的0.80分标记题目题干某县流脑发病率动态分析显示:以2012年的21.37/10万为基期水平,2013年流脑发病率为5.22/10万,2015年的定基发展速度是( )。
选择一项:a. 79.04%b. 90.47%c. 24.43%d. 27.00%题目5正确获得0.80分中的0.80分标记题目题干为调查某地区某病的发病情况,随机选取男200人、女100人作为调查对象,测得其感染阳为是()。
选择一项:a. 16.7%b. 无法计算c. 35%d. 18.3%题目6正确获得0.80分中的0.80分标记题目题干对两地的结核病死亡率比较时作率的标准化,其目的是()。
选择一项:a. 为了能更好地反映人群实际死亡水平b. 消除两地人口年龄构成不同的影响c. 消除各年龄组死亡率不同的影响d. 消除两地总人数不同的影响题目7正确获得0.80分中的0.80分标记题目题干某日门诊各科疾病分类资料可以作为()。
选择一项:a. 计算死亡率的基础b. 计算构成比的基础c. 计算病死率的基础d. 计算发病率的基础题目8正确获得0.80分中的0.80分标记题目题干对于率的标准化法的理解,不正确的是()。
统计学第五章课后习题答案一、选择题1:B 、C 【解析】所谓概率抽样,就是要求对总体的每次观察(每一次抽取)都是随机试验,并且有总体相同的分布。
2:D3:A 【解析】221226'42z n n α==∆⎛⎫ ⎪⎝⎭4:B 【解析】一致性是指随着样本容量不断增大,样本统计量接近总体参数的可能性就越来越大。
或者,对于任意给定的偏差控制水平,两者间偏差高于此控制水平的可能性越来越小,接近于0。
5:AC二、计算题 1: x =425 s n 21-=72.049 s 14=8.488s =n s =15488.8=2.1448 ∆=ns n t )1(2-α=2,1448⨯2.1916=4.70 所求μ的置信区间为425-4.701<μ<425+4.70即(420.30,429.70) 2: x =1209 s n 21-=0.005 s 15 =0.0707x s =n s =160707.0=0.017671 )116(05.0-t =2.131)1(2-=∆∂n t n s =2.131×0.017671=0.04所求μ的置信区间为12.09-0.04<μ<12.09+0.04即(12.05,12.13)3:n=600,p=0.1.np=60≥5,可以认为频数n 充分大,∂=0.05.z 2α=z 25.00=1.96 ∆=1.96600.90.10⨯=0.024,因此所求一次投掷中一只概率的置信区间是0.1-0.024<ρ<0.1+0.024,即(0.076,0.124)4: N 16,p ,np 75,,n 0.05====可认为频数充分大,,2z α=0.025 1.96z =0.2431∆== 因此,所求零件长度不合格的置信区间为0.4375—0.2431<ρ<0.4375+0.2431,即(0.19,0.68)5:114820ni i y ==∑, 1114820494(30n i i y y n μ=====∑分钟) 6. n=80 ,p=0.1,np=8≥5,可以认为n 充分大,ɑ≥0.05,96.1025.02==z z α 0657.096.1809.01.0==∆⨯因此,无上网经历的学生所占比率的置信区间为0.1—0.0657<ρ<0.1+0.0657,即(0.0343,0.1657)。
5.4经计算可得:4.6445.49.965x ⎛⎫ ⎪= ⎪ ⎪⎝⎭, 2.8794 10.0100 -1.809110.0100 199.7884 -5.6400-1.8091 -5.6400 3.6277S ⎛⎫ ⎪= ⎪ ⎪⎝⎭10.5862 -0.0221 0.2580-0.0221 0.0061 -0.00160.2580 -0.0016 0.4018S -⎛⎫ ⎪= ⎪ ⎪⎝⎭S 的特征值和特征向量分别为()()()1122331.3014 ,0.81750.02490.57544.5316,0.5737 0.053 0.8173200.4625,e 0.0508 0.9983 0.0291T TTe e λλλ==--==--==- 由所有(123,,u u u )组成u 的90%置信椭圆为()112323,1734.640.5862 -0.0221 0.2580319204.64,45.4,9.965-0.0221 0.0061 -0.001645.4(0.1)170.2580 -0.0016 0.40189.965u u u u u F u -⎛⎫⎛⎫⨯⎪ ⎪----≤ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭由于3,17(0.1) 2.44F =,故有()1123234.640.5862 -0.0221 0.2580204.64,45.4,9.965-0.0221 0.0061 -0.001645.4 8.18120.2580 -0.0016 0.40189.965u u u u u u -⎛⎫⎛⎫⎪ ⎪----≤ ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭其三个主轴的长度分别为:1,2,3,(1)3192()2 1.3014 2.44 24.8071()2017(1)3192()2 4.5316 2.4446.2911()2017(1)3192()2200.4625 2.44307.8849()2017p n p p n p p n p p n F n n p p n F n n p p n F n n p λαλαλα----⨯=⨯⨯=-⨯-⨯=⨯⨯=-⨯-⨯=⨯⨯=-⨯(b )排汗量X1的Q-Q 图:钠含量X2的Q-Q图:钾含量的Q-Q图:X1和X2的散点图:X1和X3的散点图:X2和X3的散点图:由排汗量X1、钠含量X2、钾含量X3数据的Q-Q都接近于直线,而且各对观察值的散点图都近似的接近于椭圆,因此可以认为多元正态假定是合理的。
地大《统计学》第五章假设检验课堂笔记◆主要知识点掌握程度假设检验是统计推断的组成部分,本章讨论的主要内容是:对总体的未知参数作出某种假设,然后抽取样本,构造适当的统计量,对假设的正确性进行判断的一套程序。
学习本章时,重点理解假设检验的基本思想和基本原理,掌握假设检验的步骤,并利用这些方法对未知参数的假设进行检验。
本章例题较多大家看懂后要多做练习,掌握巩固。
◆知识点整理一、假设检验的一般问题参数估计:用样本假设检验:对u提出假设,用检验假设是否成立.(一)什么是假设检验(了解)假设检验是对我们所关心的,却又是未知的总体参数先做出假设,然后抽取样本,利用样本提供的信息对假设的正确性进行判断的过程。
它是进行经济管理和决策的有利工具。
(二)假设检验步骤(掌握)1、提出原假设和替换假设;2、确定统计量;3、规定显著性水平;4、计算检验统计量的值;5、进行决策。
(三)假设检验中的小概率原理(理解)所谓小概率原理,是指发生概率很小的随机事件在一次试验中是几乎不可能发生的。
根据这一原理,我们可以作出是否接受原假设的决定。
(四)假设检验中的两类错误(理解)假设检验是根据样本提供的信息进行判断的,也就是由部分来推断整体,因而假设检验不可能绝对正确,它也可能犯错误。
所犯的错误有两种类型:1.弃真错误,又称错误。
2.取伪错误,又称错误。
二、假设检验方法(一)假设检验不同类型(掌握)1. 双侧假设检验2、单侧假设检验(二)均值检验(掌握)1.总体方差已知【例 5.3】某机床厂加工一种零件,根据检验知道,该厂加工零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,总体标准差为0.025mm。
今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0.076mm。
试问新机床加工零件的椭圆度总体均值与以前有无显著差别?解:按照假设检验的五个步骤进行第一步:建立假设第二步:选统计量第三步:规定水平.令=0.05(已知)第四步:计算检验统计量第五步:决策【例5.4】某纺织厂生产人造纤维,已知其平均拉力强度为1.56公斤,标准差为0.22公斤。
第五章差异分析第一节差异分析的概念和作用一.什么是差异分析差异分析就是研究不同个体或不同条件下的数值差异大小。
在经济分析中,常用来分析个人收的差异、投资风险、经营风险、财务风险、稳定性等。
二.差异分析的作用(一)说明平均数的代表性平均数作为总体某一数据代表数值,其代表性取决于总体各单位数据值的差异程度。
总体各单位数据值的差异程度。
总体各单位数据值的差异大,说明该总体的平均数的代表差;总体各单位数据值差异小,则说明该平均数的代表性好。
例如,某车间两个小组工人的月工资资料如下:(单位:元)甲组:800 900 1000 1100 1200乙组:900 950 1000 1050 1100这两个小组工人的月平均工资都是1000元,但各组工人工资的差异程度不同:甲组工人工资每人相差100元,乙组只相差50元。
因而,这两具小组工人的平均工资所具有的代表性也不同:甲组各工人工资额的差异较大,其平均数的代表性就差;乙组各工人工资额的差异较小,其平均数的代表性就强。
(二)反映均衡性、稳定性差异分析可以反映均衡性、稳定性,差异愈小,说明事物的稳定性和均衡性越好;差异越大,说明事物的稳定性和均衡性越差。
因此运用差异分析可以考察经济发展的稳定性、生产的稳定性、个人收入水平的均衡性等。
如对某一新品种种子作试验,除确定这一品种作物所达到的平均亩产水平外,还要研究它在生产中的稳定程度。
如果这一品种在不同试验田的亩产比较接近,差异程度较小,说明该品种产量具有稳定性,标志着该品种为优良品种,可以推广种植。
否则推广价值将受到不利影响。
(三)反映经济风险风险就是收益的不稳定性,如果收益差异大,就说明收益不稳定,也就是风险大;如果收益差异小,说明收益稳定,就是风险小。
差异分析常用来分析投资风险、经营风险等。
(四)衡量估计误差大小估计误差包括以样本估计总体的误差和预测值与实际值的误差,估计误差的大小分析,就是用差异分析指标来衡量的。
估计值与实际值差异越大,估计的准67确性越差。
第五章差异分析第一节差异分析的概念和作用一.什么是差异分析差异分析就是研究不同个体或不同条件下的数值差异大小。
在经济分析中,常用来分析个人收的差异、投资风险、经营风险、财务风险、稳定性等。
二.差异分析的作用(一)说明平均数的代表性平均数作为总体某一数据代表数值,其代表性取决于总体各单位数据值的差异程度。
总体各单位数据值的差异程度。
总体各单位数据值的差异大,说明该总体的平均数的代表差;总体各单位数据值差异小,则说明该平均数的代表性好。
例如,某车间两个小组工人的月工资资料如下:(单位:元)甲组:800 900 1000 1100 1200乙组:900 950 1000 1050 1100这两个小组工人的月平均工资都是1000元,但各组工人工资的差异程度不同:甲组工人工资每人相差100元,乙组只相差50元。
因而,这两具小组工人的平均工资所具有的代表性也不同:甲组各工人工资额的差异较大,其平均数的代表性就差;乙组各工人工资额的差异较小,其平均数的代表性就强。
(二)反映均衡性、稳定性差异分析可以反映均衡性、稳定性,差异愈小,说明事物的稳定性和均衡性越好;差异越大,说明事物的稳定性和均衡性越差。
因此运用差异分析可以考察经济发展的稳定性、生产的稳定性、个人收入水平的均衡性等。
如对某一新品种种子作试验,除确定这一品种作物所达到的平均亩产水平外,还要研究它在生产中的稳定程度。
如果这一品种在不同试验田的亩产比较接近,差异程度较小,说明该品种产量具有稳定性,标志着该品种为优良品种,可以推广种植。
否则推广价值将受到不利影响。
(三)反映经济风险风险就是收益的不稳定性,如果收益差异大,就说明收益不稳定,也就是风险大;如果收益差异小,说明收益稳定,就是风险小。
差异分析常用来分析投资风险、经营风险等。
(四)衡量估计误差大小估计误差包括以样本估计总体的误差和预测值与实际值的误差,估计误差的大小分析,就是用差异分析指标来衡量的。
估计值与实际值差异越大,估计的准67确性越差。
第二节差异分析的方法常用的差异分析方法有:全距、平均差、标准差、标准离差率等,最常用的是标准差和标准离差率。
以下分别加以介绍一、全距(一)全距的概念和计算全距又称极差,它是数据最大值和最小值之差,用以说明数据变动范围的大小。
全距=最大值-最小值[例5-1]某车间有两个生产小组,都是七名工人,各人日产产品件数如下:甲组:20、40、60、70、80、100、120乙组:67、68、69、70、71、72、73甲组日产量全距=120-20=100(件)乙组日产量全距=73-67=6(件)从计算可以看出,甲组工人日产量差异大于乙组工人日产量。
全距愈小,反映数据愈集中,差异也就愈小;全距愈大,反映变量值愈分散,则差异愈大。
对于根据组距数列求全距,可以用最高组的上限与最低组的下限之差,求全距的近似值。
(二)全距的特点全距的优点在于计算方便,意义明确。
它是差异分析的最简便方法。
在实际工作中,全距可用于工业产品质量的检查和控制。
在通常的生产条件下,产品质量性能指标如强度、硬度、浓度、尺寸等的差距总是在一定的范围内波动,如果差距超过了一定范围,就说明生产可能出现了问题,必须采取措施。
但全距这个指标很粗略,它只考虑数据的两个极端数值的差异,而不管中间数据值的差异情况,因而不介于全面反映数据值的差异程度。
二、平均差(一)平均差的概念和计算平均差是各数据值与其平均数的差异绝对值的平均数,又称平均离差。
表示平均差异水平。
计算平均差时,由于掌握的资料不同,平均差的计算分为两种情况:1.根据原始数据计算在根据原始数据计算时,采用简单平均法。
其方法为:6869AD=nx x ∑-[例5-2]以[例5-1]所举的甲、乙两组式人日产量为例。
说明平均差的计算方法。
计算见表5-1。
表 5-1AD 甲=71.257180=(件) AD乙=71.1712=(件) 这就是说,在甲、乙两组工人平均日产量相等(都等于70件)的情况下,甲组的平均差明显大于乙组,说明甲组工人日产量水平差异大于乙组。
2.根据分组资料计算在数据经过分组后,形成分布数列,就应采取加权平均法,其方法为:AD=∑∑-ff x x[例5-3]某车间200个工人按日产量分组编成分布数列,计算平均差见表5-2。
70422008400===∑∑fxf x (公斤) AD=∑-ff x x =6.62001320=(公斤)表5-2计算结果表明,200个工人各自日产量与平均日产量平均差异为6.6公斤。
(二)平均差的特点平均差是根据全部数据值计算出来的,所以对全部数据值的差异有充分的代表性。
但平均差计算由于采用取离差绝对值的方法来达到防止正负离差抵消,因而不适合数学方法的应用,所以在统计分析中较少使用。
三、标准差(一)标准差的概念和计算标准差是各个数据值与其平均数的离差平方的平均数的平方根,又称均方差,通常用σ表示。
标准差的平方即方差。
标准差实际上是平均差的另一种算法。
标准差是测定数据差异大小最常用的指标。
其计算方法根据资料的不同也有两种:1.根据原始资料计算根据原始资料计算时,采用简单平均法,计算方法为: nx x 2∑-=)(σ[例5-4]仍以[例5-1]甲、乙两组工人日产量资料为例,计算标准差如表715-3。
9.1872500==甲σ(件) 2728==乙σ(件) 这就是说,在甲、乙两组工人平均日产量的条件下,每人日产量与其平均数的平均差异,甲组为18.9件,乙组为2件,甲组的差异大于乙组。
表5-32.根据分组资料计算根据分组资料即分布数列计算标准差时,采用加权平均法,计算方法为: ∑∑-=ffx x 2)(σ[例5-5]仍以[例5-3]资料,计算标准差。
如表5-4。
728.720012200)(2==-=∑∑fx x σ(公斤)和计算平均数一样,标准差也可以以频率计算,即: ∑∑∑∑-=-=ffx x fx x 22)()(σ仍以本例数据计算如下: 20030169200909200704920010289⨯+⨯+⨯+⨯=σ =%15169%459%3549%5289⨯+⨯+⨯+⨯=8.7(公斤)以频率计算的方法常用于以概率计算标准差的场合。
(二)标准差的特点标准差与平均差一样,考虑到总体所有数据值的差异,但它计算比较复杂。
能准确反映差异情况,标准差的计算方法符合数学原理,所以应用最广。
但它计算比较复杂。
四、标准离差率(一)标准离差率的概念和计算由于标准差(或平均差)反映的是平均绝对离差,而绝对数在不同条件下往往是不可比的。
因此,差异大小的比较,在同等条件下用标准差(或平均差)的大小比较就可以了,如前面的甲、乙两组工人日产量差异的比较,因为两组平均日产量水平都是70件,标准差(或平均差)较大的组差异就大。
但在不同条件下,即不同总体的平均水平不相等的条件下,仅用标准差(或平均差)比较差异大小就是靠不住的。
例如标准差为10,相对于100的平均水平来说差异率为10%,而相对于01000的平均水平来说差异率仅为1%,显然对后者来讲差异小,对前都来讲差异大。
因此,在平均水平不同的条件下,比较差异要看相对差异率的高低。
标准离差率就是反映相对差异水平的相对数,它是标准差与平均数的相对比率,也称标准差系数或离散系数。
适用于不同平均水平条件下的差异分析。
73标准离差率的计算方法就是:xV σσ=[例5-6]有两个不同班组的各5名工人,某日加班费数额如下:甲组: 60、65、70、75、80 乙组: 2、5、7、9、12计算得: 70=甲x 元 07.7=甲σ元7=乙x 元 41.3=乙σ元若根据甲σ>乙σ而断言甲组差异大于乙组是不妥的,因为这两组的平均水平相差悬殊,应计算其标准离差率来比较。
%1.107007.7==甲σV %7.48741.3==乙σV计算结果表明,并非甲组差异大于乙组,而是乙组大于甲组,因为乙组相对差异大。
(二)标准离差率的特点标准离差率是相对数,可用于任何条件下的差异比较和研究,所以它是最主要的差异分析指标。
第三节差异分析的应用一、个体差异分析个体差异分析用来分析如职工工资的差异、个人收入差异、工人完成工作量的差异,学生学习成绩差异等。
个体差异分析的标准差计算方法为:标准差=个体数平均值)(个体值∑-2标准差(或标准离差率)越大,说明个体差异越大,或者说越不均衡。
前面所举的例子,都是个体差异分析,在此就不再另举例了。
二、均衡性、稳定性分析74在社会经济分析中,均衡性、稳定性分析常用来分析企业生产的均衡性、销售或业务量的均衡性。
经济发展的稳定性、市场价格的波动大小等问题。
现举二例说明:[例5-7]某商贸企业,为了消除季节波动对经营的不利影响,本年度采取了一些营销手段试图改善,现有两年的销售资料如表5-5,试分析本年比上年销售均衡性是否有所改善。
表5-5单位:万元上年月平均销售额=(40+50+30+35+50+30+32+35+35+50+40+38)÷12 =38.75(万元) 月销售额标准差=1275.383875.385075.3840222)()()(-+-+-=7.21(万元)本年月平均销售=(45+53+35+40+52+35+35+40+40+52+45+40)÷12=42.67(万元)月销售额标准差=1267.424067.425367.4245222)()()(-+-+-=6.43(万元)由于本年月平均销售额大于上年,而标准差还小于上年,所以本年销售均衡性比上年有改善,改善的程度为:上年标准离差率=%61.1875.3821.7= 本年标准离差率=%07.1567.4243.6=标准离差率即不均衡率降低了3.54%个百分点。
[例5-8]某农产品市场价格在本年5月下与上年同期4周内变动情况如表5-6,试分析哪年份价格较稳定。
(每周上市量基本相同)表5-675上年平均价格=2.141.12.15.10.1=+++(元/公斤)上年标准差=42.11.12.12.12.15.12.10.12222)()()()(-+-+-+-=19.0(元/公斤) 本年平均价格=175.14.12.13.11.1=+++(元/公斤)本年标准=4175.10.1175.12.1175.13.1175.11.12222)()()()(-+-+-+-=11.0(元/公斤)由于两年平均价格不同,需计算标准离差率比较:上年标准离差率=%83.152.119.0= 本年标准离差率=%36.9175.111.0=可见,本年价格较稳定,价格差异率降低了6.47个百分点。
二、 风险分析风险就是不稳定性,如果未来收益差异大,就说明收益不稳定,也就是风险大;如果未来收益差异小,说明收益稳定,就是风险小。