统计学第六章课后题及答案解析
- 格式:docx
- 大小:39.75 KB
- 文档页数:9
第六章课后题解答1.与参数检验相比,非参数检验有哪些优缺点?主要适用于那些场合?答:(1)非参数检验不需要严格假设条件,因而比参数检验有更广泛的适用面;非参数检验几乎可以处理包括定类数据和定序数据在内的所有类型的数据,而参数检验通常只能用于定量数据的分析;在参数检验和非参数检验都可以使用的情况下,非参数检验的功效(power)要低于参数检验方法。
(2)参数检验中的假设条件不满足;检验中涉及的数据为定类或定序数据;所涉及的问题中并不包含参数;对各种资料的初步分析。
2.使用“学生调查.sav”文件中的数据检验:(1)能否认为总体中学生的学习兴趣呈均匀分布?(2)能否认为总体中学生的身高服从正态分布?答:(1)利用2拟合优度检验,计算出的2统计量的值为2.000,自由度为4,相应的p值(渐近显著性)为0.736。
由于0.736大于0.05,所以在5% 的显著性水平下不能拒绝原假设,也就是说根据样本数据不能认为总体数据是非均匀的。
乱0伞单疋(0.0%)貝有型于5的期峑a单」T:晨小7.0(2)利用单样本K-S检验法,计算出的D max统计量的值为0.899,相应的p值(渐近显著性)为0.394。
由于0.394大于0.05,所以在5%的显著性水平下不能拒绝原假设,也就是说根据样本数据不能认为总体数据是非正态的。
单样進Kolmogor ov-Smirnov 攪腌亂检验分芜为正悲分布乱根据救摇计算得到*表2.23.某企业生产一种钢管,规定长度的中位数是10米。
现随机地从正在生产的生产线上选取10根进行测量,结果为:9.8,10.1,9.7,9.9, 9.8,10.0, 9.7, 10.0,9.9, 9.8。
问该企业的生产过程是否需要调整。
答:单样本中位数的符号检验法检验钢管长度的中位数是否为50,各个数值与中位数比较的结果,有7个值小于10, 1个值大于10, 2个等于10。
样本量较少,输出双侧检验的p值(精确显著性)为0.070。
第六章相关与回归分析习题一、填空题1.现象之间的相关关系按相关的程度分为、和;按相关的形式分为和;按影响因素的多少分为和。
2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量,这种相关称为正相关;当一个现象的数量由小变大,另一个现象的数量,这种相关称为负相关。
3.相关系数的取值范围是。
4.完全相关即是关系,其相关系数为。
5.相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。
6.直线相关系数等于零,说明两变量之间;直线相关系数等1,说明两变量之间;直线相关系数等于—1,说明两变量之间。
7.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为。
8.回归方程y=a+bx中的参数a是,b是。
在统计中估计待定参数的常用方法是。
9. 分析要确定哪个是自变量哪个是因变量,在这点上它与不同。
10.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通过化成来解决。
11.用来说明回归方程代表性大小的统计分析指标是。
二、单项选择题1.下面的函数关系是( )A销售人员测验成绩与销售额大小的关系B圆周的长度决定于它的半径C家庭的收入和消费的关系D数学成绩与统计学成绩的关系2.相关系数r的取值范围( )A -∞<r<+∞B -1≤r≤+1C -1<r<+1D 0≤r≤+13.年劳动生产率z(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元B减少70元C增加80元D减少80元4.假设要证明两变量之间线性相关程度是高的,则计算出的相关系数应接近于( )A+1 B 0 C 0.5 D [1]5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关B正相关还是负相关C完全相关还是不完全相关D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程y =a+b x。
第六章抽样调查一、单项选择1、在抽样调查中,必须遵循(B )抽取样本A、随意原则B、随机原则C、可比原则D、对等原则2、抽样调查的主要目的在于(C )A、计算和控制抽样误差B、了解全及总体单位的情况C、用样本指标推断总体指标D、对调查单位作深入的研究3、在抽样调查中,无法避免的误差是(D )A、登记误差B、计算误差C、记录误差D、抽样误差4、样本指标和总体指标(B )A、前者是个确定值,后者是个随机变量B、前者是个随机变量,后者是个确定值C、两者均是确定值D、两者均是随机变量5、抽样平均误差反映了样本指标与总体指标之间的(B )A、可能误差范围B、平均误差程度C、实际误差D、实际误差的绝对值6、抽样平均误差是(C )A、全部样本指标的平均数B、全部样本指标的平均差C、全部样本指标的标准差D、全部样本指标的标志变异系数7、在其他条件保持不变的情况下,抽样平均误差(A )A、随着总体标志变动程度的增加而加大B、随着总体标志变动度的增加而减少C、随着总体标志变动度的减少而加大D、不随总体标志变动度的改变而改变8、在其他条件保持不变的情况下,抽样平均误差(B )A、随着抽样数目的增加而加大B、随着抽样数目的增加而减少C、随着抽样数目的减少而减少D、不会随着抽样数目的改变而改变9、在同等条件下,重复抽样和不重复抽样相比较,其抽样平均误差(B )A、前者小于后者B、前者大于后者C、两者相等D、无法确定哪一个大10、从2000名学生中按不重复抽样方法抽取了100名进行调查,其中有女生45名,则样本成数的抽样平均误差为( B )A、0.24%B、4.85%C、4.97%D、以上都不对11、抽样极限误差反映了样本指标与总体指标之间的(D )A、抽样误差的平均数B、抽样误差的标准差C、抽样误差的可靠程度D、抽样误差的可能范围12、若总体平均数X=50,在一次抽样调查中测得x=48,则以下说法正确的是( C )A、抽样极限误差为2 B、抽样平均误差为2C、抽样实际误差为2D、以上都不对13、计算必要抽样数目时,若总体方差已知,应当从几个可供选择的样本方差中挑选出数值( C )A、最小的B、任意的C、最大的D、适中的14、在简单重复随机抽样条件下,欲使误差范围缩小一半,其他要求不变,则样本容量必须( B )A、增加2倍B、增加3倍C、减少2倍D、减少3倍二、多项选择1、从一个全及总体可以抽取一系列样本,因此(BCE)A、总体指标是个随机变量B、抽样指标是个随机变量C、抽样指标的数值不是唯一的D、抽样指标总是小于总体指标E、抽样指标可能大于、等于或小于总体指标2、抽样平均误差是(ABD)A、反映样本指标与总体指标的平均误差程度B、样本指标的标准差C、总体指标的标准差D、衡量抽样指标对于全及指标代表程度的尺度E、样本指标的平均数3、采用类型抽样的组织形式(ACE)A、需要对总体各单位进行分组B、组内是进行全面调查C、抽样误差较其它几种组织形式要小D、最符合随机原则E、适用于总体各单位标志值差异较大的总体4、在其它条件不变的情况下,抽样极限误差的大小和推断的可靠程度的关系是(CD)A、允许误差范围越大,推断的可靠程度越低B、允许误差范围越小,推断的可靠程度越高C、扩大极限误差的范围,可以提高推断的可靠程度D、缩小极限误差的范围,只能降低推断的可靠程度E、扩大或缩小极限误差范围与推断的可靠程度无关5、影响样本容量大小的因素有(ACDE)A、总体标准差的大小B、样本各单位标志差异程度的大小C、抽样估计的可靠程度D、允许误差的大小E、抽样的方法和组织形式三、计算1、某工厂有1500名职工,从中随机抽取50名职工作为样本,调查其工资水平,调查结果如下表:②以95.45%的可靠性估计该厂职工的月平均工资和工资总额的区间。
概率论与数理统计第六章课后习题及参考答案1.已知总体X ~),(2σμN ,其中2σ已知,而μ未知,设1X ,2X ,3X 是取自总体X 的样本.试问下面哪些是统计量?(1)321X X X ++;(2)μ31-X ;(3)222σ+X ;(4)21σμ++X ;(5)},,max{321X X X ;(6)σ221++X X ;(7)∑=3122i i X σ;(8)2μ-X .解:(1)(3)(4)(5)(6)(7)是,(2)(8)不是.2.求下列各组样本值的平均值和样本差.(1)18,20,19,22,20,21,19,19,20,21;(2)54,67,68,78,70,66,67,70.解:(1)9.19)21201919212022192018(101101101=+++++++++==∑=i i x x ;43.1)(9110122=-=∑=i i x x s .(2)5.67)7067667078686754(1018181=+++++++==∑=i i x x ;018.292)(718122=-=∑=i i x x s .3.(1)设总体X ~)1,0(N ,则2X ~)1(2χ.(2)设随机变量F ~),(21n n F ,则F1~),(12n n F .(3)设总体X ~),(2σμN ,则X ~),(2n N σμ,22)1(S n σ-~)1(2-n χ,nS X /μ-~)1(-n t .(4)设总体X ~)10(2χ,Y ~)15(2χ,且X 与Y 相互独立,则=+)(Y X E 25,=+)(Y X D 50.4.设随机变量X 与Y 都服从标准正态分布,则(C )A .Y X +服从正态分布B .22Y X +服从2χ分布C .2X 与2Y 均服从2χ分布D .22YX 服从F 分布5.在总体X ~)3.6,52(2N 中随机抽取一容量为36的样本,求样本平均值X 落在8.50到8.53之间的概率.解:因为X ~)3.6,52(2N ,即52=μ,223.6=σ,因为36=n ,22205.1363.6==n σ,所以X ~)05.1,52(2N .由此可得)8.538.50(≤≤X P 05.1528.50()05.1528.53(-Φ--Φ=8302.0)1429.1()7143.1(=-Φ-Φ=.6.设总体X ~)1,0(N ,1X ,2X ,…,10X 为总体的一个样本,求:(1))99.15(1012>∑=i i X P ;(2)写出1X ,2X ,…,10X 的联合概率密度函数;(3)写出X 的概率密度.解:(1)由题可知∑==1012i i X X ~)10(2χ,查2χ分布表有99.15)10(210.0=χ,可得10.0=α,即10.0)99.15(1012=>∑=i i X P .(2)1X ,2X ,…,10X 相互独立,则联合概率密度函数为}exp{321}21exp{21),,,(1012510121021∑∏==-=-=i i i i x x x x x f ππ .(3)X Y =~)1.0,0(N ,所以有2251.02)0(e 5e1.021)(y y y f -⋅--==ππ.7.设总体X ~)1,0(N ,1X ,2X ,…,5X 为总体的一个样本.确定常数c ,使25242321)(XX X X X c Y +++=~)3(t .解:因为i X ~)1,0(N ,5,,2,1 =i ,所以21X X +~)2,0(N ,)(2121X X +~)1,0(N ,252423X X X ++~)3(2χ,因为25242321252423212632XX X X X X X X X X +++=+++~)3(t ,所以有23=c .8.设1X ,2X ,3X ,4X 是来自正态总体)4,0(N 的样本.已知243221)43()2(X X b X X a Y -+-=为服从自由度为2的2χ分布,求a ,b 的值.解:由题可知i X ~)4,0(N ,4,3,2,1=i ,故有0)2(21=-X X E ,20)2(21=-X X D ,所以212X X -~)20,0(N .同理4343X X -~)100,0(N .而20)2(221X X -~)1(2χ,100)43(221X X -~)1(2χ,故有100)43(20)2(243221X X X X -+-~)2(2χ,比较可知201=a ,1001=b .9.设总体X ~)3.0,(2μN ,1X ,2X ,…,n X 为总体的一个样本,X 是样本均值,问样本容量n 至少应取多大,才能使95.0)1.0(≥<-μX P .解:易知X ~)3.0,(2nN μ,由题意有95.013(2/3.01.0/3.0()1.0(≥-Φ=<-=<-nnnX P X P μμ,即应有975.0)3(≥Φn,查正态分布表知975.0)96.1(=Φ,所以取96.13≥n,即5744.34≥n ,取35=n .10.设总体X ~)16,(μN ,1X ,2X ,…,10X 为总体的一个样本,2S 为样本方差,已知1.0)(2=>αS P ,求α的值.解:由抽样分布定理知22)1(σS n -~)1(2-n χ,因为10=n ,故有2249S ~)9(2χ,得1.0)169169()(22=>=>ααS P S P ,查2χ分布表得684.14)9(21.0=χ,即684.14169=α,解得105.26=α.11.设(1X ,2X ,…,1+n X )为来自总体X ~),(2σμN 的一个样本,记∑==n i i n X n X 11,∑=--=n i in X X n S 122(11,求证:nn n S X X n n T -⋅+=+11~)1(-n t .证:由题可知n X ~),(2nN σμ,n n X X -+1~)11(,0(2σn N +,标准化得σnX X nn 111+-+~)1,0(N .又因为∑=-=-ni inX XS n 1222)(1)1(σσ~)1(2-n χ,从而有nn nnn S XX n n n S n n X X -+=--+-++122111)1(11σσ~)1(-n t ,即nnn S X X n n T -⋅+=+11~)1(-n t .。
管理统计学(李金林版教材)课后习题答案~~~第六章基础习题1. 解释总体分布、样本分布和抽样分布的含义。
答:总体分布:整体取值的概率分布规律,即随机变量X 服从的分布;样本分布:从总体中按照一定的抽样规则抽取的部分个体的分布,若从总体中简单随机抽取容量为n 的样本,则样本分布为(X 1,X 2,...,X n );抽样分布:样本统计量的分布。
2. 简述卡方分布、t 分布、F 分布及正态分布之间的关系,它们的概率密度曲线各有什么特征?答:若随机变量X 服从N(μ,σ2),则Z =X−μσ服从N(0,1);若随机变量X 服从N(0,1),则Y =∑(X i )2n i=1服从自由度为n 的χ2分布;若随机变量X~N(0,1),随机变量Y~χ2(n),且X 与Y 相互独立,则称随机变量T =√Y n⁄服从自由度为n 的t 分布;若随机变量X~χ2(n),若随机变量Y~χ2(m),且X 与Y 相互独立,则称随机变量F n,m =X n ⁄Y m ⁄服从第一自由度为n ,第二自由度为m 的F 分布,记为F n,m ~F(n,m)。
χ2分布的概率密度曲线分布在第一象限内,随着自由度n 的增大,曲线向正无穷方向延伸,并越来越低阔,越来越趋近于正态分布的曲线形态。
t 分布的概率密度曲线以0为中心,左右对称,随着自由度n 的增大,t 分布的概率密度曲线逐渐接近标准正态分布的概率密度曲线。
F 分布的概率密度曲线分布在第一象限内,当第一个自由度不变,第二个自由度增大时,曲线越来越向右聚拢,当两个自由度都增加时,F 分布概率密度曲线逐渐接近正态分布的概率密度曲线。
3. 解释中心极限定理的含义。
从均值为μ,方差为σ2的任意一个总体中抽取样本容量为n 的随机样本,则当n 充分大时,样本均值x̅的抽样分布近似服从均值为μ,方差为σ2n ⁄的正态分布,即x̅~N(μ, σ2n ⁄)。
4. 某公司有20名销售员,以下是他们每个人的销售量:3,2,2,3,4,3,2,5,3,2,7,3,4,5,3,3,2,3,3,4。
一、选择题1、在用样本的估计量估计总体参数时,评价估计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为(B)A、无偏性B、有效性C、一致性D、充分性2、根据一个具体的样本求出的总体均值95%的置信区间(D)A、以95%的概率包含总体均值B、有5%的可能性包含总体均值C、绝对包含总体均值D、绝对包含总体均值或绝对不包含总体均值3、估计量的无偏性是指(B)A、样本估计量的值恰好等于待估的总体参数B、所有可能样本估计值的期望值等于待估总体参数C、估计量与总体参数之间的误差最小D、样本量足够大时估计量等于总体参数4、下面的陈述中正确的是(C)A、95%的置信区间将以95%的概率包含总体参数B、当样本量不变时,置信水平越大得到的置信区间就越窄C、当置信水平不变时,样本量越大得到的置信区间就越窄D、当置信水平不变时,样本量越大得到的置信区间就越宽5、总体均值的置信区间等于样本均值加减估计误差,其中的估计误差等于所求置信水平的临界值乘以(A)A、样本均值的标准误差B、样本标准差C、样本方差D、总体标准差6、95%的置信水平是指(B)A、总体参数落在一个特定的样本所构造的区间内的概率为95%B、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为95%C、总体参数落在一个特定的样本所构造的区间内的概率为5%D、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为5%7、一个估计量的有效性是指(D)A、该估计量的期望值等于被估计的总体参数B、该估计量的一个具体数值等于被估计的总体参数C、该估计量的方差比其他估计量大D、该估计量的方差比其他估计量小8、一个估计量的一致性是指(C)A、该估计量的期望指等于被估计的总体参数B、该估计量的方差比其他估计量小C、随着样本量的增大该估计量的值越来越接近被估计的总体参数D、该估计量的方差比其他估计量大9、支出下面的说法哪一个是正确的(A)A、一个大样本给出的估计量比一个小样本给出的估计量更接近总体参数B、一个小样本给出的估计量比一个大样本给出的估计量更接近总体参数C 、一个大样本给出的总体参数的估计区间一定包含总体参数D 、一个小样本给出的总体参数的估计区间一定不包含总体参数10、用样本估计量的值直接作为总体参数的估计值,这一估计方法称为(A )A 、点估计B 、区间估计C 、无偏估计D 、有效估计11、将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例称为(C )A 、置信区间B 、显著性水平C 、置信水平D 、临界值12、在总体均值和总体比例的区间估计中,估计误差由(C )A 、置信水平确定B 、统计量的抽样标准差确定C 、置信水平和统计量的抽样标准差确定D 、统计量的抽样方差确定13、在置信水平不变的条件下,要缩小置信区间,则(A )A 、需要增加样本量B 、需要减少样本量C 、需要保持样本量不变D 、需要改变统计量的抽样标准差14、估计一个正态总体的方差使用的分布是(C )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布15、当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是(B )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布16、当正态总体的方差未知,在大样本条件下,估计总体均值使用的分布是(A )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布17、在其他条件不变的条件下,要使估计时所需的样本量小,则应该(A )A 、提高置信水平B 、降低置信水平C 、使置信水平不变D 、使置信水平等于118、使用t 分布估计一个总体均值时,要求(D )A 、总体为正态分布且方差已知B 、总体为非正态分布C 、总体为非正态分布但方差已知D 、正态总体方差未知,且为小样本19、在大样本条件下,总体均值在(1-α)置信水平下的置信区间可以些为(C )A 、n t x σα2±B 、ns t x 2α± C 、n s z x 2α± D 、n s z x 22α±20、正态总体方差已知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(C )A 、n z x 22σα± B 、n s t x 2α±C 、n z x σα2±D 、n t x σα2±21、正态总体方差未知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(B )A 、n s z x 2α±B 、ns t x 2α±C 、n z x σα2±D 、n s z x 22α±22、指出下面的说法哪一个是正确的(A )A 、样本量越大,样本均值的抽样标准差就越小B 、样本量越大,样本均值的抽样标准差就越大C 、样本量越小,样本均值的抽样标准差就越小D 、样本均值的抽样标准差与样本量无关23、抽取一个样本量为100的随机样本,其均值为81=x ,标准差12=s 。
2015年《统计学》第六章变异指标习题及满分答案(一)填空题1.平均指标说明分布数列中变量值的(集中趋势),而标志变异指标则说明变量值的(离中趋势)。
2.标志变动度与平均数的代表性成(反比)。
3.全距是总体中单位标志值的(最大值)与(最小值)之差。
4.全距受(极端值)的影响最大。
5.是非标志的平均数为(P ),标准差为(PQ的平方根)。
7.标准差系数是(标准差)与(平均数)之比,其计算公式为(σ/ x)。
(二)单项选择题1.标志变异指标中易受极端变量值影响的指标有(A)。
A、全距B、标准差C、平均差D、平均差系数2.标准差与平均差的主要区别是(C)。
A、计算条件不同B、计算结果不同C、数学处理方法不同 D、意义不同3.标志变异指标中的平均差是(D)。
A、各标志值对其算术平均数的平均离差B、各变量值离差的平均数C、各变量值对其算术平均数离差的绝对值的绝对值D、各标志值对其算术平均数离差绝对值的平均数 4.平均差的主要缺点是(C)。
A、与标准差相比计算复杂B、易受极端变量值的影响C、不符合代数方法的演算D、计算结果比标准差数值大5.用是非标志计算平均数,其计算结果为(D)。
A、p+qB、p-qC、1-pD、p6.计算平均差时对每个离差取绝对值是因为(C)。
A、离差有正有负B、计算方便C、各变量值与其算术平均数离差之和为零D、便于数学推导7.标准差是其各变量值对其算数平均数的( B )。
A、离差平均数的平方根B、离差平方平均数的平方根C、离差平方的平均数D、离差平均数平方的平方根8.计算离散系数是为了比较( B )。
A、不同分布数列的相对集中程度B、不同水平的数列的标志变动度的大小C、相同水平的数列的标志变动度的大小D、两个数列平均数的绝对离差 9.变量的方差等于( A )。
A、变量平方的平均数减变量平均数的平方B、变量平均数的平方减变量平方的平均数C、变量平方平均数减变量平均数平方的开方 D.变量平均数的平方减变量平方平均数的开方10.两组工人加工同样的零件,甲组工人每人加工的零件分别为:25、26、28、29、32;乙组工人每人加工的零件分别为:22、25、27、30、36。
1、某地区种植小麦4000亩,随机抽取200亩进行实割实测,测得结果如下:平均亩产量为300公斤,抽样总体的标准差为6公斤。
试在94.45%的概率保证下,估计小麦的平均亩产量和总产量的可能范围。
Z=2,x=300 6=6,
3、对某种产品的质量进行抽样调查,抽取200件检验,发现有6件废品,试在95.45%的概率保证下估计这种产品的合格率。
4、为了了解某地区职工家庭的收入情况,随机抽取300户进行调查,调查结果如下:
根据以上资料,在99.73的概率保证下,推算该地区职工家庭平均收入的可能范围。
5、某灯泡长对某种灯泡进行抽样检验测定其平均寿命,抽查了50只灯泡,测得平均寿命为3600小时,标准差为10小时。
要求:(1)在68.27%的概率保证下推算这批灯泡的平均寿命。
(2)如果要使抽样极限误差缩小为原来的一
半,概率仍为68.27%,应抽取多少只灯
泡才能满足要求?
6、某制鞋厂生产的一批旅游鞋,按1%的比例进行抽样调查,总共抽查500双,结果如下:
在95.45%的概率保证下,试求:
(1)这批旅游鞋的平均耐穿时间的可能范围
(2)如果耐穿时间在350天以上才算合格,求这批旅游鞋合格率的可能范围。
7、某地种植农作物6000亩,按照随机抽样,调查了300亩。
调查结果如下:平均亩产量为650公斤,
标准差为15公斤,概率为0.9545。
根据上述资料,试求:
(1)利用点估计,推算农作物的总产量
(2)全部农作物的平均亩产量
(3)利用区间估计,求这6000亩农作物的总产量的可能范围。
第六章假设检验一、单项选择题二、多项选择题三、判断题四、填空题1、原假设(零假设)备择假设(对立假设)2、双侧检验Z Z =xn︱Z︱<︱︱(或1-α)23、左单侧检验Z <-(或α)4、右单侧检验Z Z =xnZ >(或α)5、t t =︱t︱>︱︱(或α)sx2n6、弃真错误(或第一类错误)存伪错误(或第二类错误)7、越大越小8、临界值五、简答题(略)六、计算题1、已知:σx = 12 n = 400 x= 21 建立假设H0:X≤20H1:X>20右单侧检验,当α= 0.05时,Z0.05 = 1.645 构造统计量ZxZ =1.667>Z0.05 = 1.645,所以拒绝原假设,说明总体平均数会超过20。
2、已知:P0 = 2% n = 500 p = 建立假设H0:P ≥ 2%H1:P <2%左单侧检验,当α= 0.05时,Z0.05 = -1.645 构造统计量Z-1.597∣Z∣=1.597<∣Z0.05∣= 1.645,所以接受原假设,说明该产品不合格率没有明显降低。
3、已知:σx = 2.5 cm n = 100 X0 =12 cm x= 11.3 cm 建立假设H0:X≥12H1:X<12左单侧检验,当α= 0.01时,Z0.01 = -2.33 构造统计量Zx-2.8 2.5 ∣Z∣= 2.8>∣Z0.01∣= 2.33,所以拒绝原假设,说明所伐木头违反规定。
4、已知:P0 = 40% n = 60 p = 建立假设H0:P ≥ 40%H1:P <40% 21= 35% 60左单侧检验,当α= 0.05时,Z0.05 = -1.645 构造统计量Z-0.791∣Z∣= 0.791<∣Z0.05∣= 1.645,所以接受原假设,说明学生的近视率没有明显降低。
5、已知:X0 =5600 kg/cm2 σx = 280 kg/cm2 n = 100 x= 5570 kg/cm2 建立假设H0:X= 5600 H1:X≠5600双侧检验,当α= 0.05时,∣Z0.025∣= 1.96 构造统计量Z∣Z∣∣Z∣=1.07<∣Z0.025∣= 1.96,所以接受原假设,说明这批车轴符合要求。
第六章一、单项选择题1.下面的函数关系是( )A现代化水平与劳动生产率 B圆周的长度决定于它的半径C家庭的收入和消费的关系 D亩产量与施肥量2.相关系数r的取值范围( )A -∞< r <+∞B -1≤r≤+1C -1< r < +1D 0≤r≤+13.年劳动生产率x(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元 B减少70元 C增加80元 D减少80元4.若要证明两变量之间线性相关程度高,则计算出的相关系数应接近于( )A +1B -1C 0.5D 15.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关 B正相关还是负相关C完全相关还是不完全相关 D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程ŷ=a+bx。
经计算,方程为ŷ=200—0.8x,该方程参数的计算( )A a值是明显不对的B b值是明显不对的C a值和b值都是不对的D a值和b值都是正确的7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( )A 8B 0.32C 2D 12.58.进行相关分析,要求相关的两个变量( )A都是随机的 B都不是随机的C一个是随机的,一个不是随机的 D随机或不随机都可以9.下列关系中,属于正相关关系的有( )A合理限度内,施肥量和平均单产量之间的关系B产品产量与单位产品成本之间的关系C商品的流通费用与销售利润之间的关系D流通费用率与商品销售量之间的关系10.相关分析是研究( )A变量之间的数量关系 B变量之间的变动关系C变量之间的相互关系的密切程度 D变量之间的因果关系11.在回归直线y c=a+bx,b<0,则x与y之间的相关系数 ( )A r=0B r=lC 0< r<1D -1<r <012.当相关系数r=0时,表明( )A现象之间完全无关 B相关程度较小C现象之间完全相关 D无直线相关关系13.下列现象的相关密切程度最高的是( )A某商店的职工人数与商品销售额之间的相关系数0.87B流通费用水平与利润率之间的相关系数为-0.94C商品销售额与利润率之间的相关系数为0.51D商品销售额与流通费用水平的相关系数为-0.8114.估计标准误差是反映( )A平均数代表性的指标 B相关关系的指标C回归直线方程的代表性指标 D序时平均数代表性指标二、多项选择题1.下列哪些现象之间的关系为相关关系( )A家庭收入与消费支出关系 B圆的面积与它的半径关系C广告支出与商品销售额关系D商品价格一定,商品销售与额商品销售量关系2.相关系数表明两个变量之间的( )A因果关系 C变异程度 D相关方向 E相关的密切程度3.对于一元线性回归分析来说( )A两变量之间必须明确哪个是自变量,哪个是因变量B回归方程是据以利用自变量的给定值来估计和预测因变量的平均可能值C可能存在着y依x和x依y的两个回归方程D回归系数只有正号4.可用来判断现象线性相关方向的指标有( )A相关系数 B回归系数 C回归方程参数a D估计标准误5.单位成本(元)依产量(千件)变化的回归方程为y c=78- 2x,这表示( ) A产量为1000件时,单位成本76元B产量为1000件时,单位成本78元C产量每增加1000件时,单位成本下降2元D产量每增加1000件时,单位成本下降78元6.估计标准误的作用是表明( )A样本的变异程度 B回归方程的代表性C估计值与实际值的平均误差 D样本指标的代表性7.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属于( ) A完全相关 B单相关 C负相关 D复相关8.在直线相关和回归分析中( )A据同一资料,相关系数只能计算一个B据同一资料,相关系数可以计算两个C据同一资料,回归方程只能配合一个D据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个9.相关系数r的数值( )A可为正值 B可为负值 C可大于1 D可等于-110.从变量之间相互关系的表现形式看,相关关系可分为( )A正相关 B负相关 C直线相关 D曲线相关11.确定直线回归方程必须满足的条件是( )A现象间确实存在数量上的相互依存关系B相关系数r必须等于1C y与x必须同方向变化D现象间存在着较密切的直线相关关系12.当两个现象完全相关时,下列统计指标值可能为( )A r=1B r=0C r=-1D S y=013.在直线回归分析中,确定直线回归方程的两个变量必须是( )A一个自变量,一个因变量 B均为随机变量C对等关系 D一个是随机变量,一个是可控制变量14.配合直线回归方程是为了( )A确定两个变量之间的变动关系 B用因变量推算自变量C用自变量推算因变量 D两个变量都是随机的15.在直线回归方程中( )A在两个变量中须确定自变量和因变量 B一个回归方程只能作一种推算C要求自变量是给定的,而因变量是随机的。
D要求两个变量都是随机变量16.相关系数与回归系数( )A回归系数大于零则相关系数大于零B回归系数小于零则相关系数小于零C回归系数大于零则相关系数小于零D回归系数小于零则相关系数大于零三、判断题1.相关关系和函数关系都属于完全确定性的依存关系。
( )2.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。
( ) 3.假定变量x与y的相关系数是0.8,变量m与n的相关系数为-0.9,则x与y的相关密切程度高。
( )4.当直线相关系数r=0时,说明变量之间不存在任何相关关系。
( )5.相关系数r有正负、有大小,因而它反映的是两现象之间具体的数量变动关系。
( ) 6.回归系数b的符号与相关系数r的符号,可以相同也可以不相同。
( )74 ⠊4阁 耀444伀r越大,则估计标准误差 S y值越大,从而直线回归方程的精确性越低。
( ) 9.工人的技术水平提高,使得劳动生产率提高。
这种关系是一种不完全的正相关关系( )10.回归分析和相关分析一样所分析的两个变量都一定是随机变量( )11.相关的两个变量,只能算出一个相关系数( )12.一种回归直线只能作一种推算,不能反过来进行另一种推算( )四、简答题1.什么是相关关系?它和函数关系有什么不同?2.简述相关分析和回归分析关系。
3.直线回归方程中y=a+bx,参数a、b是怎样求得的?它们代表什么意义?4.构造直线回归模型应具备哪些条件?5.什么是估计标准误差?其作用如何?6.应用相关与回归分析应注意哪些问题?五、计算题1.有14个同类企业的生产性固定资产年平均价值和工业总产值资料如下:企业编号生产性固定资产价值(万元)工业总产值(万元)1 2 3 4 5 6 7 2.82.83.02.93.43.94.06.76.97.27.38.48.89.18 91011121314 4.84.95.25.45.56.27.09.810.611.711.112.812.112.4合计61.8 134.9 (1)计算两变量的相关系数并说明两变量之间的相关方向。
(2)建立直线回归方程,并说明其参数的经济意义。
(3)估计生产性固定资产(自变量)为10万元时,估计总产值(因变量)的可能值。
2.某公司对10户家庭进行调查,获得一下资料:某种商品的月需求量和价格调查表家庭号需求量(kg)价格(元)家庭号需求量(kg)价格(元)1 1.0 5.0 6 2.5 2.62 3.5 2.0 7 2.0 2.83 3.0 2.0 8 1.5 3.04 2.7 2.3 9 1.2 3.35 2.4 2.5 10 1.2 3.5要求:(1)计算相关系数,分析该商品价格与需求量之间上的相关性。
(2)建立回归模型,并说明其参数的经济意义。
(3)计算估计标准误差。
(4)假定价格下降至1.5元时,以95.45%的可靠程度估计该商品的需求量。
3、为研究产品销售额与销售利润之间的关系,某公司对所属6家企业进行调查。
设产品销售额x(万元),销售利润y(万元),调查资料经初步整理和计算,结果如下:∑x=225,∑y=13,∑2x=9823,∑2y=36.7,∑xy=593。
要求:(1)计算产品销售额与销售利润之间相关系数。
(2)写出配合销售利润对销售额的直线回归方程。
第六章 相关与回归分析一、单项选择1. B2. B3. A4. D5. B6. C7. C8. A9. A 10.C 11. D 12. D 13. B 14. C 二、多项选择1.AC2. DE3.ABC4.AB5. AC6. BC7. BC8. AD9.ABD 10. CD 11.AD 12.AC 13.AD 14. AC 15. ABC 16.AB 三、判断1. ×2. √3. ×4. ×5. ×6. ×7. ×8. ×9. √ 10. × 11. √ 12. √ 四、简答1.相关关系是一种不完全确定的随机关系,在相关关系的情况下,自变量的每一个数值都可能有若干个因变量的数值与之对应。
因此,相关关系是一种不完全的依存关系。
相关关系与函数关系的不同表现在:(1)相关关系的两变量的关系值是不确定的,当给出自变量的数值后,因变量可能会围绕其平均数出现若干个数值与之对应;而函数关系的两变量的关系值是完全确定的,即当给出自变量的数值后,因变量只有一个唯一确定的数值与之对应。
(2)函数关系变量之间的依存关系可用方程y=f (x )表现出来,而相关关系则不能,它需要借助函数关系的数学表达式,才能表现出现象之间的数量关系。
2.就一般意义而言,相关分析包括回归和相关两方面的内容,因为它们都是研究变量之间相互关系的。
但就具体的方法所解决的问题而言,回归和相关又有明显的区别,二者的区别主要表现在以下几方面:(1)进行相关分析时不必事先确定两个变量中哪个是自变量哪个是因变量,而进行回归分析时,则必须事先确定自变量和因变量。
(2)相关分析中的两个变量都是随机变量,而回归分析中的两变量只有因变量是随机的,自变量是可以控制的量。
(3)计算相关系数的两变量是对等的,改变两者的位置并不影响相关系数的数值,而回归分析中,对于一种没有明显因果关系的两变量,可以求得两个回归方程,一个为Y 倚X 的回归方程,另一个为X 倚Y 的回归方程。
(4)相关分析只能分析两变量的相关程度和方向,而回归分析要比相关分析更深入,更具体,它要分析因变量是如何随着自变量的变化而发生变化的。
二者的联系主要表现在:回归分析和相关分析是相互补充的 ,密切联系的。