统计学课后答案第六章
- 格式:docx
- 大小:16.24 KB
- 文档页数:13
统计学(第五版)课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
第六章课后题解答1.与参数检验相比,非参数检验有哪些优缺点?主要适用于那些场合?答:(1)非参数检验不需要严格假设条件,因而比参数检验有更广泛的适用面;非参数检验几乎可以处理包括定类数据和定序数据在内的所有类型的数据,而参数检验通常只能用于定量数据的分析;在参数检验和非参数检验都可以使用的情况下,非参数检验的功效(power)要低于参数检验方法。
(2)参数检验中的假设条件不满足;检验中涉及的数据为定类或定序数据;所涉及的问题中并不包含参数;对各种资料的初步分析。
2.使用“学生调查.sav”文件中的数据检验:(1)能否认为总体中学生的学习兴趣呈均匀分布?(2)能否认为总体中学生的身高服从正态分布?答:(1)利用2拟合优度检验,计算出的2统计量的值为2.000,自由度为4,相应的p值(渐近显著性)为0.736。
由于0.736大于0.05,所以在5% 的显著性水平下不能拒绝原假设,也就是说根据样本数据不能认为总体数据是非均匀的。
乱0伞单疋(0.0%)貝有型于5的期峑a单」T:晨小7.0(2)利用单样本K-S检验法,计算出的D max统计量的值为0.899,相应的p值(渐近显著性)为0.394。
由于0.394大于0.05,所以在5%的显著性水平下不能拒绝原假设,也就是说根据样本数据不能认为总体数据是非正态的。
单样進Kolmogor ov-Smirnov 攪腌亂检验分芜为正悲分布乱根据救摇计算得到*表2.23.某企业生产一种钢管,规定长度的中位数是10米。
现随机地从正在生产的生产线上选取10根进行测量,结果为:9.8,10.1,9.7,9.9, 9.8,10.0, 9.7, 10.0,9.9, 9.8。
问该企业的生产过程是否需要调整。
答:单样本中位数的符号检验法检验钢管长度的中位数是否为50,各个数值与中位数比较的结果,有7个值小于10, 1个值大于10, 2个等于10。
样本量较少,输出双侧检验的p值(精确显著性)为0.070。
第六章 抽样分布与参数估计习题答案一、单选1.B ;2.D ;3.D ;4.C ;5.A ;6.B ;7.C ;8.D ;9.A ;10.A 二、多选1.ADE ;2.ACDE ;3.ABCD ;4.ADE ;5.BCE6.ACD ;7.ACDE ;8.ACE ;9.BCE ;10.ABD 三、计算分析题1、解:n=10,小样本,由EXCEL 计算有:11.6498==S x ; (1)方差已知,由10596.14982⨯±=±nz x σα得,(494.9,501.1)(2)方差未知,由1011.62622.2498)1(2⨯±=-±nS n t x α得,(493.63,502.37)2、n=500为大样本,p=80/500=16%,则置信区间为 016.096.1%16500)16.01(16.096.1%16)1(2⨯±=-⨯±=-±n p p z p α=(14.4%,17.6%) 3、nx σσ=,由于大国抽取的样本容量大,则抽样平均误差小。
4、(1)3.10100103===nS x σ(小时);=-=-=100)95.01(95.0)1(n p p p σ 2.18%(2)=⨯±=±3.10211202x z x σα(1099.4,1140.6) ⨯±=±2%952p z p σα2.18%=(90.64,99.36)5、为简化起见,按照重复抽样形式计算 (1)∑∑=ff s Si22=22.292; 472.010072.4===nS x σ(2)93.0691472.096.1100691002±=⨯±=±nSz x α=(690.07,691.93) 6、由于总体标准差已知,则用标准状态分布统计量估计nz x σα2=∆(1)10160170102022=-===∆αασz nz x则58.12=αz ,有%29.94)58.1(=F α=1-94.29%=5.71%,则概率%58.88%71.5%29.941=-=-=α (2)=⇒⨯=⇒⨯=∆n n nz x 2096.142σα97(个)(3)=⇒⨯=⇒⨯=∆n nnz x 2096.122σα385(个)允许误差缩小一半,样本容量则为原来的4倍。
第六章一、单项选择题1.下面的函数关系是( )A现代化水平与劳动生产率 B圆周的长度决定于它的半径C家庭的收入和消费的关系 D亩产量与施肥量2.相关系数r的取值范围( )A -∞< r <+∞B -1≤r≤+1C -1< r < +1D 0≤r≤+13.年劳动生产率x(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元 B减少70元 C增加80元 D减少80元4.若要证明两变量之间线性相关程度高,则计算出的相关系数应接近于( )A +1B -1C 0.5D 15.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )A线性相关还是非线性相关 B正相关还是负相关C完全相关还是不完全相关 D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线性回归方程ŷ=a+bx。
经计算,方程为ŷ=200—0.8x,该方程参数的计算( )A a值是明显不对的B b值是明显不对的C a值和b值都是不对的D a值和b值都是正确的7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( )A 8B 0.32C 2D 12.58.进行相关分析,要求相关的两个变量( )A都是随机的 B都不是随机的C一个是随机的,一个不是随机的 D随机或不随机都可以9.下列关系中,属于正相关关系的有( )A合理限度内,施肥量和平均单产量之间的关系B产品产量与单位产品成本之间的关系C商品的流通费用与销售利润之间的关系D流通费用率与商品销售量之间的关系10.相关分析是研究( )A变量之间的数量关系 B变量之间的变动关系C变量之间的相互关系的密切程度 D变量之间的因果关系11.在回归直线y c=a+bx,b<0,则x与y之间的相关系数 ( )A r=0B r=lC 0< r<1D -1<r <012.当相关系数r=0时,表明( )A现象之间完全无关 B相关程度较小C现象之间完全相关 D无直线相关关系13.下列现象的相关密切程度最高的是( )A某商店的职工人数与商品销售额之间的相关系数0.87B流通费用水平与利润率之间的相关系数为-0.94C商品销售额与利润率之间的相关系数为0.51D商品销售额与流通费用水平的相关系数为-0.8114.估计标准误差是反映( )A平均数代表性的指标 B相关关系的指标C回归直线方程的代表性指标 D序时平均数代表性指标二、多项选择题1.下列哪些现象之间的关系为相关关系( )A家庭收入与消费支出关系 B圆的面积与它的半径关系C广告支出与商品销售额关系D商品价格一定,商品销售与额商品销售量关系2.相关系数表明两个变量之间的( )A因果关系 C变异程度 D相关方向 E相关的密切程度3.对于一元线性回归分析来说( )A两变量之间必须明确哪个是自变量,哪个是因变量B回归方程是据以利用自变量的给定值来估计和预测因变量的平均可能值C可能存在着y依x和x依y的两个回归方程D回归系数只有正号4.可用来判断现象线性相关方向的指标有( )A相关系数 B回归系数 C回归方程参数a D估计标准误5.单位成本(元)依产量(千件)变化的回归方程为y c=78- 2x,这表示( ) A产量为1000件时,单位成本76元B产量为1000件时,单位成本78元C产量每增加1000件时,单位成本下降2元D产量每增加1000件时,单位成本下降78元6.估计标准误的作用是表明( )A样本的变异程度 B回归方程的代表性C估计值与实际值的平均误差 D样本指标的代表性7.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属于( ) A完全相关 B单相关 C负相关 D复相关8.在直线相关和回归分析中( )A据同一资料,相关系数只能计算一个B据同一资料,相关系数可以计算两个C据同一资料,回归方程只能配合一个D据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个9.相关系数r的数值( )A可为正值 B可为负值 C可大于1 D可等于-110.从变量之间相互关系的表现形式看,相关关系可分为( )A正相关 B负相关 C直线相关 D曲线相关11.确定直线回归方程必须满足的条件是( )A现象间确实存在数量上的相互依存关系B相关系数r必须等于1C y与x必须同方向变化D现象间存在着较密切的直线相关关系12.当两个现象完全相关时,下列统计指标值可能为( )A r=1B r=0C r=-1D S y=013.在直线回归分析中,确定直线回归方程的两个变量必须是( )A一个自变量,一个因变量 B均为随机变量C对等关系 D一个是随机变量,一个是可控制变量14.配合直线回归方程是为了( )A确定两个变量之间的变动关系 B用因变量推算自变量C用自变量推算因变量 D两个变量都是随机的15.在直线回归方程中( )A在两个变量中须确定自变量和因变量 B一个回归方程只能作一种推算C要求自变量是给定的,而因变量是随机的。
概率论与数理统计第六章课后习题及参考答案1.已知总体X ~),(2σμN ,其中2σ已知,而μ未知,设1X ,2X ,3X 是取自总体X 的样本.试问下面哪些是统计量?(1)321X X X ++;(2)μ31-X ;(3)222σ+X ;(4)21σμ++X ;(5)},,max{321X X X ;(6)σ221++X X ;(7)∑=3122i i X σ;(8)2μ-X .解:(1)(3)(4)(5)(6)(7)是,(2)(8)不是.2.求下列各组样本值的平均值和样本差.(1)18,20,19,22,20,21,19,19,20,21;(2)54,67,68,78,70,66,67,70.解:(1)9.19)21201919212022192018(101101101=+++++++++==∑=i i x x ;43.1)(9110122=-=∑=i i x x s .(2)5.67)7067667078686754(1018181=+++++++==∑=i i x x ;018.292)(718122=-=∑=i i x x s .3.(1)设总体X ~)1,0(N ,则2X ~)1(2χ.(2)设随机变量F ~),(21n n F ,则F1~),(12n n F .(3)设总体X ~),(2σμN ,则X ~),(2n N σμ,22)1(S n σ-~)1(2-n χ,nS X /μ-~)1(-n t .(4)设总体X ~)10(2χ,Y ~)15(2χ,且X 与Y 相互独立,则=+)(Y X E 25,=+)(Y X D 50.4.设随机变量X 与Y 都服从标准正态分布,则(C )A .Y X +服从正态分布B .22Y X +服从2χ分布C .2X 与2Y 均服从2χ分布D .22YX 服从F 分布5.在总体X ~)3.6,52(2N 中随机抽取一容量为36的样本,求样本平均值X 落在8.50到8.53之间的概率.解:因为X ~)3.6,52(2N ,即52=μ,223.6=σ,因为36=n ,22205.1363.6==n σ,所以X ~)05.1,52(2N .由此可得)8.538.50(≤≤X P 05.1528.50()05.1528.53(-Φ--Φ=8302.0)1429.1()7143.1(=-Φ-Φ=.6.设总体X ~)1,0(N ,1X ,2X ,…,10X 为总体的一个样本,求:(1))99.15(1012>∑=i i X P ;(2)写出1X ,2X ,…,10X 的联合概率密度函数;(3)写出X 的概率密度.解:(1)由题可知∑==1012i i X X ~)10(2χ,查2χ分布表有99.15)10(210.0=χ,可得10.0=α,即10.0)99.15(1012=>∑=i i X P .(2)1X ,2X ,…,10X 相互独立,则联合概率密度函数为}exp{321}21exp{21),,,(1012510121021∑∏==-=-=i i i i x x x x x f ππ .(3)X Y =~)1.0,0(N ,所以有2251.02)0(e 5e1.021)(y y y f -⋅--==ππ.7.设总体X ~)1,0(N ,1X ,2X ,…,5X 为总体的一个样本.确定常数c ,使25242321)(XX X X X c Y +++=~)3(t .解:因为i X ~)1,0(N ,5,,2,1 =i ,所以21X X +~)2,0(N ,)(2121X X +~)1,0(N ,252423X X X ++~)3(2χ,因为25242321252423212632XX X X X X X X X X +++=+++~)3(t ,所以有23=c .8.设1X ,2X ,3X ,4X 是来自正态总体)4,0(N 的样本.已知243221)43()2(X X b X X a Y -+-=为服从自由度为2的2χ分布,求a ,b 的值.解:由题可知i X ~)4,0(N ,4,3,2,1=i ,故有0)2(21=-X X E ,20)2(21=-X X D ,所以212X X -~)20,0(N .同理4343X X -~)100,0(N .而20)2(221X X -~)1(2χ,100)43(221X X -~)1(2χ,故有100)43(20)2(243221X X X X -+-~)2(2χ,比较可知201=a ,1001=b .9.设总体X ~)3.0,(2μN ,1X ,2X ,…,n X 为总体的一个样本,X 是样本均值,问样本容量n 至少应取多大,才能使95.0)1.0(≥<-μX P .解:易知X ~)3.0,(2nN μ,由题意有95.013(2/3.01.0/3.0()1.0(≥-Φ=<-=<-nnnX P X P μμ,即应有975.0)3(≥Φn,查正态分布表知975.0)96.1(=Φ,所以取96.13≥n,即5744.34≥n ,取35=n .10.设总体X ~)16,(μN ,1X ,2X ,…,10X 为总体的一个样本,2S 为样本方差,已知1.0)(2=>αS P ,求α的值.解:由抽样分布定理知22)1(σS n -~)1(2-n χ,因为10=n ,故有2249S ~)9(2χ,得1.0)169169()(22=>=>ααS P S P ,查2χ分布表得684.14)9(21.0=χ,即684.14169=α,解得105.26=α.11.设(1X ,2X ,…,1+n X )为来自总体X ~),(2σμN 的一个样本,记∑==n i i n X n X 11,∑=--=n i in X X n S 122(11,求证:nn n S X X n n T -⋅+=+11~)1(-n t .证:由题可知n X ~),(2nN σμ,n n X X -+1~)11(,0(2σn N +,标准化得σnX X nn 111+-+~)1,0(N .又因为∑=-=-ni inX XS n 1222)(1)1(σσ~)1(2-n χ,从而有nn nnn S XX n n n S n n X X -+=--+-++122111)1(11σσ~)1(-n t ,即nnn S X X n n T -⋅+=+11~)1(-n t .。
《统计学》课后答案(第二版,贾俊平版)附录答案第6章-9章方差分析第6章方差分析6.1 0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P ),不能拒绝原假设。
6.2 579.48234.1501.0=>=F F (或01.000001.0=<=-αvalue P ),拒绝原假设。
6.3 4170.50984.1001.0=>=F F (或01.0000685.0=<=-αvalue P ),拒绝原假设。
6.4 6823.37557.1105.0=>=F F (或05.0000849.0=<=-αvalue P ),拒绝原假设。
6.5 8853.30684.1705.0=>=F F (或05.00003.0=<=-αvalue P ),拒绝原假设。
85.54.14304.44=>=-=-LSD x x B A ,拒绝原假设;85.58.16.424.44=<=-=-LSD x x C A ,不能拒绝原假设;85.56.126.4230=>=-=-LSD x x C B ,拒绝原假设。
6.6554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P ),不能拒绝原假设。
第7章相关与回归分析7.1 (1)散点图(略),产量与生产费用之间正的线性相关关系。
(2)920232.0=r 。
(3)检验统计量2281.24222.142=>=αt t ,拒绝原假设,相关系数显著。
7.2 (1)散点图(略)。
(2)8621.0=r 。
7.3 (1)0?β表示当0=x 时y 的期望值。
(2)1?β表示x 每变动一个单位y 平均下降0.5个单位。
(3)7)(=y E 。
7.4 (1)%902=R 。
(2)1=e s 。
7.5 (1)散点图(略)。
管理统计学(李金林版教材)课后习题答案~~~第六章基础习题1. 解释总体分布、样本分布和抽样分布的含义。
答:总体分布:整体取值的概率分布规律,即随机变量X 服从的分布;样本分布:从总体中按照一定的抽样规则抽取的部分个体的分布,若从总体中简单随机抽取容量为n 的样本,则样本分布为(X 1,X 2,...,X n );抽样分布:样本统计量的分布。
2. 简述卡方分布、t 分布、F 分布及正态分布之间的关系,它们的概率密度曲线各有什么特征?答:若随机变量X 服从N(μ,σ2),则Z =X−μσ服从N(0,1);若随机变量X 服从N(0,1),则Y =∑(X i )2n i=1服从自由度为n 的χ2分布;若随机变量X~N(0,1),随机变量Y~χ2(n),且X 与Y 相互独立,则称随机变量T =√Y n⁄服从自由度为n 的t 分布;若随机变量X~χ2(n),若随机变量Y~χ2(m),且X 与Y 相互独立,则称随机变量F n,m =X n ⁄Y m ⁄服从第一自由度为n ,第二自由度为m 的F 分布,记为F n,m ~F(n,m)。
χ2分布的概率密度曲线分布在第一象限内,随着自由度n 的增大,曲线向正无穷方向延伸,并越来越低阔,越来越趋近于正态分布的曲线形态。
t 分布的概率密度曲线以0为中心,左右对称,随着自由度n 的增大,t 分布的概率密度曲线逐渐接近标准正态分布的概率密度曲线。
F 分布的概率密度曲线分布在第一象限内,当第一个自由度不变,第二个自由度增大时,曲线越来越向右聚拢,当两个自由度都增加时,F 分布概率密度曲线逐渐接近正态分布的概率密度曲线。
3. 解释中心极限定理的含义。
从均值为μ,方差为σ2的任意一个总体中抽取样本容量为n 的随机样本,则当n 充分大时,样本均值x̅的抽样分布近似服从均值为μ,方差为σ2n ⁄的正态分布,即x̅~N(μ, σ2n ⁄)。
4. 某公司有20名销售员,以下是他们每个人的销售量:3,2,2,3,4,3,2,5,3,2,7,3,4,5,3,3,2,3,3,4。
统计学(第五版)贾俊平课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
一、选择题1、在用样本的估计量估计总体参数时,评价估计量的标准之一是使它与总体参数的离差越小越好。
这种评价标准称为(B)A、无偏性B、有效性C、一致性D、充分性2、根据一个具体的样本求出的总体均值95%的置信区间(D)A、以95%的概率包含总体均值B、有5%的可能性包含总体均值C、绝对包含总体均值D、绝对包含总体均值或绝对不包含总体均值3、估计量的无偏性是指(B)A、样本估计量的值恰好等于待估的总体参数B、所有可能样本估计值的期望值等于待估总体参数C、估计量与总体参数之间的误差最小D、样本量足够大时估计量等于总体参数4、下面的陈述中正确的是(C)A、95%的置信区间将以95%的概率包含总体参数B、当样本量不变时,置信水平越大得到的置信区间就越窄C、当置信水平不变时,样本量越大得到的置信区间就越窄D、当置信水平不变时,样本量越大得到的置信区间就越宽5、总体均值的置信区间等于样本均值加减估计误差,其中的估计误差等于所求置信水平的临界值乘以(A)A、样本均值的标准误差B、样本标准差C、样本方差D、总体标准差6、95%的置信水平是指(B)A、总体参数落在一个特定的样本所构造的区间内的概率为95%B、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为95%C、总体参数落在一个特定的样本所构造的区间内的概率为5%D、用同样的方法构造的总体参数的多个区间中,包含总体参数的区间的比例为5%7、一个估计量的有效性是指(D)A、该估计量的期望值等于被估计的总体参数B、该估计量的一个具体数值等于被估计的总体参数C、该估计量的方差比其他估计量大D、该估计量的方差比其他估计量小8、一个估计量的一致性是指(C)A、该估计量的期望指等于被估计的总体参数B、该估计量的方差比其他估计量小C、随着样本量的增大该估计量的值越来越接近被估计的总体参数D、该估计量的方差比其他估计量大9、支出下面的说法哪一个是正确的(A)A、一个大样本给出的估计量比一个小样本给出的估计量更接近总体参数B、一个小样本给出的估计量比一个大样本给出的估计量更接近总体参数C 、一个大样本给出的总体参数的估计区间一定包含总体参数D 、一个小样本给出的总体参数的估计区间一定不包含总体参数10、用样本估计量的值直接作为总体参数的估计值,这一估计方法称为(A )A 、点估计B 、区间估计C 、无偏估计D 、有效估计11、将构造置信区间的步骤重复多次,其中包含总体参数真值的次数所占的比例称为(C )A 、置信区间B 、显著性水平C 、置信水平D 、临界值12、在总体均值和总体比例的区间估计中,估计误差由(C )A 、置信水平确定B 、统计量的抽样标准差确定C 、置信水平和统计量的抽样标准差确定D 、统计量的抽样方差确定13、在置信水平不变的条件下,要缩小置信区间,则(A )A 、需要增加样本量B 、需要减少样本量C 、需要保持样本量不变D 、需要改变统计量的抽样标准差14、估计一个正态总体的方差使用的分布是(C )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布15、当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是(B )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布16、当正态总体的方差未知,在大样本条件下,估计总体均值使用的分布是(A )A 、正态分布B 、t 分布C 、卡方分布D 、F 分布17、在其他条件不变的条件下,要使估计时所需的样本量小,则应该(A )A 、提高置信水平B 、降低置信水平C 、使置信水平不变D 、使置信水平等于118、使用t 分布估计一个总体均值时,要求(D )A 、总体为正态分布且方差已知B 、总体为非正态分布C 、总体为非正态分布但方差已知D 、正态总体方差未知,且为小样本19、在大样本条件下,总体均值在(1-α)置信水平下的置信区间可以些为(C )A 、n t x σα2±B 、ns t x 2α± C 、n s z x 2α± D 、n s z x 22α±20、正态总体方差已知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(C )A 、n z x 22σα± B 、n s t x 2α±C 、n z x σα2±D 、n t x σα2±21、正态总体方差未知时,在小样本条件下,总体均值在α-1置信水平下的置信区间可以写为(B )A 、n s z x 2α±B 、ns t x 2α±C 、n z x σα2±D 、n s z x 22α±22、指出下面的说法哪一个是正确的(A )A 、样本量越大,样本均值的抽样标准差就越小B 、样本量越大,样本均值的抽样标准差就越大C 、样本量越小,样本均值的抽样标准差就越小D 、样本均值的抽样标准差与样本量无关23、抽取一个样本量为100的随机样本,其均值为81=x ,标准差12=s 。
第六章抽样调查1.当研究目的一旦确定,全及总体也就相应确定,而从全及总体中抽取的抽样总体则是不确定的。
(V )2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
( X )3.在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。
(X )4.我们可以任取某一次抽样所得的抽样误差,来作为衡量抽样指标对于全及指标的代表性程度。
(X )5.由于没有遵守随机原则而造成的误差,通常称为随机误差。
(X )6.抽样平均误差是表明抽样估计的准确度,抽样极限误差则是表明抽样估计准确程度的范围;两者既有区别,又有联系。
( V )7.抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差。
( V )8.所有可能的样本平均数的平均数等于总体平均数。
(V )9.按有关标志排队,随机起点的等距抽样可能产生系统性误差。
( V )10.抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。
(X )11.重复抽样时,其他条件不变,允许误差扩大一倍,则抽样数目为原来的2倍。
(X)12.扩大或缩小抽样误差范围的倍数叫概率度,其代表符号是V。
(V)13.重复抽样时若其它条件一定,而抽样单位数目增加3倍,则抽样平均误差为原来的2倍。
(X)14.由于抽样调查存在抽样误差,所以抽样调查资料的准确性要比全面调查资料的准确性差。
(X)15.在保证概率度和总体方差一定的条件下允许误差大小与抽样数目多少成正比。
(X)16.扩大或缩小了以后的抽样误差范围叫抽样极限误差。
(X)17.如果总体平均数落在区间(960,1040)内的概率为0.9545,则抽样平均误差等于30。
(X)18.抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
(V )19.扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。
统计学课后答案第六章【篇一:统计学第五版课后练答案(4-6章)】txt>4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:statisticsmean median mode std. deviation percentiles25 50 75 missing10 0 9.60 10.00 10 4.169 6.25 10.00单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 4120 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄1(2)根据定义公式计算四分位数。
mean=24.00;std. deviation=6.652 (4)计算偏态系数和峰态系数:skewness=1.080;kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
21、确定组数:lg?2?5?1?1k?1?lg(2)lg2lgn()1.398?5.64k=6 ,取0.30103网络用户的年龄 (binned)分组后的直方图:3客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。
为比较哪种排队方式使顾客等待的时间更短.两种排队方式各随机抽取9名顾客。
得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟。
第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.47.8 7.8 要求:(1)画出第二种排队方式等待时间的茎叶图。
第二种排队方式的等待时间(单位:分钟) stem-and-leaf plotfrequency stem leaf1.00 extremes (=5.5) 3.00 6 . 678 3.00 7 . 1342.00 7 . 88 stem width:1.00each leaf: 1 case(s)(2)计算第二种排队时间的平均数和标准差。
mean 7 std. deviation 0.714143 variance 0.51(3)比较两种排队方式等待时间的离散程度。
第二种排队方式的离散程度小。
(4)如果让你选择一种排队方式,你会选择哪—种?试说明理由。
选择第二种,均值小,离散程度小。
4.4 某百货公司6月份各天的销售额数据如下:单位:万元257 276 297 252 238 310 240 236 271 292 261 281 301 274 267 280 272 284 268 303 273 263 322 249要求:(1)计算该百货公司日销售额的平均数和中位数。
(2)按定义公式计算四分位数。
(3)计算日销售额的标准差。
解:statistics百货公司每天的销售额(万元)265 291 269 278 258 2954mean median std. deviation percentilesmissing30 0274.1000 272.5000 21.1747225 50 75260.2500 272.5000乙的低成本的产品多。
(1)计算120家企业利润额的平均数和标准差。
(2)计算分布的偏态系数和峰态系数。
解:statisticsmean std. deviation skewnessstd. error of skewness kurtosisstd. error of kurtosismissing120 0426.6667 116.484450.208 0.221 -0.6255【篇二:统计学(第六版)贾俊平——_课后习题答案】1(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
1.3(1)总体是所有it从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。
4. 自填式、面方式、电话式调查个有什么利弊?自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。
缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。
面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。
缺点:成本比较高,对调查过程的质量控制有一定难度。
对于敏感问题,被访者会有压力。
电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。
5.请举出(或设计)几个实验数据的例子。
不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。
6.你认为应当如何控制调查中的回答误差?对于理解误差,要注意表述中的措辞,学习一定的心里学知识。
对于记忆误差,尽量缩短所涉及问题的时间范围。
对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。
7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。
对于随机误差,可以通过增加样本容量来控制。
对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。
无回答出现后,分析武回答产生的原因,采取补救措施。
比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高回收率。
第三章数据的图表搜集一、思考题3.1数据的预处理包括哪些内容?答:审核、筛选、排序等。
3.2分类数据和顺序数据的整理和显示方法各有哪些?答:分类数据在整理时候先列出所分的类别,计算各组的频数、频率,得到频数分布表,如果是两个或两个以上变量可以制作交叉表。
对于分类数据可以绘制条形图、帕累托图、饼图、环形图等。
根据不同的资料或者目的选择不同的图。
对于顺序数据,可以计算各种的频数、频率,以及累计频数、累计频率。
可根据需要绘制条形图、饼图、环形图等。
3.3数值型数据的分组方法有哪些?简述组距分组的步骤。
答:单变量值分组和组距分组。
其中组距分组:第一步,确定组数,组数多少由数据的多少和特点等决定,一般5~15组;第二步,确定各组组距,宜取5或10的倍数;第三步,根据分组整理出频数分布表,注意遵循“不重不漏”和“上限不在内”的原则。
3.4直方图和条形图有何区别?答:1,条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度与宽度都有意义;2直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。
3.5绘制线图应注意问题?答:时间在横轴,观测值绘在纵轴。
一般是长宽比例10:7的长方形,纵轴下端一般从0开始,数据与0距离过大的话用折断符号折断。
3.6饼图和环形图的不同?答:饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
3.7茎叶图比直方图的优势,他们各自的应用场合?答:茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。
在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。
3.8鉴别图标优劣的准则?答:p65明确有答案,我就不写了。
3.9制作统计表应注意的问题?答:1,合理安排统计表结构;2表头一般包括表号,总标题和表中数据的单位等内容;3表中的上下两条横线一般用粗线,中间的其他用细线,两端开口,数字右对齐,不要有空白格;4在使用统计表时,必要时可在下方加注释,注明数据来源。
二、练习题 3.1答:(1)表中数据属于顺序数据。
(2)用excel制作一张频数分布表。
(3)绘制一张条形图,反映评价等级的分布。
(4)绘制评价等级的帕累托图。
92 118 120 11295 142 136 146127 135 117 113104 125 108 1263.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 105 117 97 要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:k?1?2、确定组距:124 119 108 88129 114 105 123116 115 110 115100 87 107 119103 103 137 138lg?40?lg(n)1.60206?1??1??6.32,取k=6 lg(2)lg20.301033、分组频数表(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。