统计学第二章统计量及其分布习题及答案
- 格式:doc
- 大小:108.00 KB
- 文档页数:2
第一章 随机事件及其概率练习: 1. 判断正误(1)必然事件在一次试验中一定发生,小概率事件在一次试验中一定不发生。
(B )(2)事件的发生与否取决于它所包含的全部样本点是否同时出现。
(B )(3)事件的对立与互不相容是等价的。
(B ) (4)若()0,P A = 则A =∅。
(B )(5)()0.4,()0.5,()0.2P A P B P AB ===若则。
(B ) (6)A,B,C 三个事件至少发生两个可表示为AB BC AC ⋃⋃(A ) (7)考察有两个孩子的家庭孩子的性别,{()Ω=两个男孩(,两个女孩),(一个男孩,}一个女孩),则P{}1=3两个女孩。
(B )(8)若P(A)P(B)≤,则⊂A B 。
(B ) (9)n 个事件若满足,,()()()i j i j i j P A A P A P A ∀=,则n 个事件相互独立。
(B )(10)只有当A B ⊂时,有P(B-A)=P(B)-P(A)。
(A ) 2. 选择题(1)设A, B 两事件满足P(AB)=0,则©A. A 与B 互斥B. AB 是不可能事件C. AB 未必是不可能事件D. P(A)=0 或 P(B)=0 (2)设A, B 为两事件,则P(A-B)等于(C)A. P(A)-P(B)B. P(A)-P(B)+P(AB)C. P(A)-P(AB)D. P(A)+P(B)-P(AB) (3)以A 表示事件“甲种产品畅销,乙种产品滞销”,则其对立事件A 为(D)A. “甲种产品滞销,乙种产品畅销”B. “甲乙两种产品均畅销”C. “甲种产品滞销”D. “甲种产品滞销或乙种产品畅销”(4)若A, B 为两随机事件,且B A ⊂,则下列式子正确的是(A) A. P(A ∪B)=P(A) B. P(AB)=P(A) C. P(B|A)=P(B) D. P(B-A)=P(B)-P(A) (5)设(),(),()P A B a P A b P B c ⋃===,则()P AB 等于(B)A. ()a c c + B . 1a c +-C.a b c +- D. (1)b c -(6)假设事件A 和B 满足P(B|A)=1, 则(B)A. A 是必然事件 B . (|)0P B A = C. A B ⊃ D. A B ⊂ (7)设0<P(A)<1,0<P(B)<1, (|)(|)1P A B P A B += 则(D)A. 事件A, B 互不相容B. 事件A 和B 互相对立C. 事件A, B 互不独立 D . 事件A, B 互相独立8.,,.,,.D ,,.,,.,,1419.(),(),(),(),()37514131433.,.,.,.,37351535105A B A AB A B B AB A B C AB A B D AB A B P B A P B A P AB P A P B A B C φφφφ≠=≠====对于任意两个事件必有(C )若则一定独立;若则一定独立;若则有可能独立;若则一定不独立;已知则的值分别为:(D)三解答题1.(),(),(),(),(),(),().P A p P B q P AB r P A B P AB P A B P AB ===设求下列事件的概率:解:由德摩根律有____()()1()1;P A B P AB P AB r ⋃==-=-()()()();P AB P B AB P B P AB q r =-=-=-()()()()(1)()1;P A B P A P B P AB p q q r r p ⋃=+-=-+--=+-________()()1[()()()]1().P AB P A B P A P B P AB p q r =⋃=-+-=-+-2.甲乙两人独立地对同一目标射击一次,命中率分别是0.6和0.5,现已知目标被命中,求它是甲射击命中的概率。
统计学(第五版)课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
一、单项选择题1.相关关系是指( )A .变量间的非独立关系 B. 变量间的因果关系C .变量间的函数关系 D.变量间不确定的依存关系2.进行相关分析时,假定相关的两个变量( )A .都是随机变量 B.都不是随机变量C.一个是随机变量,一个不是随机变量D.随机或不随机都可以3.下列各回归方程中,哪一个必定是错误的( )A .8.02.030ˆ=+=XY ii r X Y B. 91.05.175ˆ=+-=XY i i r X Y C .78.01.25ˆ=-=XY ii r X Y D. 96.05.312ˆ-=--=XY i i r X Y 4.产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为:X Y 5.1356ˆ-=,这说明: A .产量每增加一台,单位产品成本增加356元B .产量每增加一台,单位产品成本减少1.5元C .产量每增加一台,单位产品成本平均增加356元D .产量每增加一台,单位产品成本平均减少1.5元5.在总体回归直线X Y E 10)(ββ+=中,1β表示:A .当 X 增加一个单位时,Y 增加1β个单位B .当X 增加一个单位时,Y 平均增加1β个单位C .当Y 增加一个单位时,X 增加1β个单位D .当Y 增加一个单位时,X 平均增加1β个单位6.对回归模型110μββ++=i i X Y 进行统计检验时,通常假定i μ服从:A .),0(2i N σ B.t(n-2) C. ),0(2σN D.t(n)7.以Y 表示实际观测值,Yˆ表示回归估计值,则普通最小二乘法估计参数的准则是使:A .0)ˆ(=-∑i i Y Y B. 0)ˆ(2=-∑ii Y Y C. )ˆ(i i Y Y -∑最小 D. 2)ˆ(ii Y Y -∑最小 8.设Y 表示实际观测值,Yˆ表示OLS 回归估计值,则下列哪项成立:A .Y Y=ˆ B.Y Y =ˆ C.Y Y =ˆ D.Y Y =ˆ 9.用普通最小二乘法估计经典线性模型i i i X Y μββ++=10,则样本回归直线通过点:A .(X ,Y ) B.)ˆ,(YX C.)ˆ,(Y X D.),(Y X 10.以Y 表示实际值,Yˆ表示回归值,则普通最小二乘法估计得到的样本回归线ii X Y 10ˆˆˆββ+=满足: A .0)ˆ(=-∑ii Y Y B.0)(=-∑Y Y i C.0)ˆ(2=-∑i i Y Y D.0)(2=-∑Y Y i11.对于线性回归模型i i i X Y μββ++=10,要使普通最小二乘估计量具备线性特性,则模型必须满足:A .0)(=i E μ B.2)(σμ=i ar V (常数)C.0),(=j i ov C μμ D .X i 为非随机变量,与i μ不相关12.用一组有30个观测值的样本估计模型i i i X Y μββ++=10后,在0.05的显著性水平下对1β的显著性作t 检验,则1β显著地不等于0的条件是统计量t 大于:A .t 0.05(30) B.t 0.025(30) C.t 0.05(28) D.t 0.025(28)13.下列样本模型中,哪一个模型通常是无效的:A .C i (消费)=500+0.8I i (收入)B .i D Q (商品需求)=10+0.8I i (收入)+0.9P i (价格)C .i S Q (商品供给)=20+0.75P i (价格)D .Y i (产出量)=0.65)()(4.06.0劳动资本i i L K14.如图: i X 10ββ+图中“ ” 所指的距离是:A .Y Y i - B.i i Y Y ˆ- C.Y Y i-ˆ D.Y Y i -ˆ 15.判定系数r 2是指:A .剩余变差占总变差的比重 B.总变差占回归变差的比重C .回归变差占总变差的比重 D.回归变差占剩余变差的比重16.已知某一直线回归方程的判定系数为0.64,则解释变量与被解释变量间的线性相关系数为:A .0.64 B.0.8 C.0.4 D.0.3217.下列哪个为常数弹性模型:A .i i i X Y μββ++=ln ln ln 10 B. i i i X Y μββ++=10ln lnC .i i i X Y μββ++=ln 10 D. i ii X Y μββ++=)1(10 18.模型i i i X Y μββ++=ln ln ln 10中,1β的实际含义是:A .X 关于Y 的弹性 B.Y 关于X 的弹性C .X 关于Y 的边际倾向 D.Y 关于X 的边际倾向19.模型i i i X Y μββ++=ln 10中,Y 关于X 的弹性为:A .iX 1β B.i X 1β C.i Y 1β D.i Y 1β 20.相关系数r 的取值范围是:A .1≤r B.1-≥r C.11-≤≤r D.11≤≤-r21.判定系数的取值范围是:A .12-≤r B.12≥r C.102≤≤r D.112≤≤-r22.某一特定的X 水平上,总体Y 分布的离散度越大,即2σ越大,则:A .预测区间越宽,精度越低 B.预测区间越宽,预测误差越小C .预测区间越窄,精度越高 D.预测区间越窄,预测误差越大23.用一组有30个观测值的样本估计模型i i i i X X Y μβββ+++=22110后,在0.05的显著性水平上对1β的显著性作t 检验,则1β显著地不等于0的条件是统计量t 大于等于:A .t 0.05(30) B.t 0.025(28) C.t 0.025(27) D.F 0.025(1,28)二、多项选择题1.指出下列哪些现象是相关关系A .家庭消费支出与收入 B.商品销售额与销售量、销售价格C .物价水平与商品需求量 D.小麦亩产量与施肥量E .学习成绩总分与各门课程成绩分数2.以带“∧”表示估计值,μ表示随机误差项,如果Y 与X 为线性相关关系,则下列哪些是正确的:A .t t X Y βα+= B.t t t X Y μβα++=C .t t t X Y μβα++=ˆˆ D.t t t X Y μβα++=ˆˆˆ E.tt X Y βαˆˆˆ+= 3.以带“∧”表示估计值,μ表示随机误差项,e 表示残差。
思考与练习参考答案第1章绪论一、选择题1. 研究中的基本单位是指( D)。
A.样本 B. 全部对象C.影响因素D. 个体E. 总体2. 从总体中抽取样本的目的是( B )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指( B )。
A.参与个体数 B. 描述总体特征的统计指标C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。
A.白细胞计数B.住院天数C.门急诊就诊人数D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。
A.受测量精密度限制B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小二、名称解释(答案略)1. 变量与随机变量2. 同质与变异3. 总体与样本4. 参数与统计量5. 误差6. 随机事件7. 频率与概率三、思考题1. 生物统计学与其他统计学有什么区别和联系?答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。
而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。
2. 某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。
因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。
样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。
即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。
因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。
第一章:统计量及其分布19.设母体ξ服从正态分布N(),,2σμξ和2n S 分别为子样均值和子样方差,又设()21,~σμξN n +且与n ξξξ,,,21 独立, 试求统计量111+--+n n S nn ξξ的抽样分布. 解: 因为ξξ-+1n 服从⎪⎭⎫⎝⎛+21,0σn n N 分布. 所以()1,0~121N nn n σξξ+-+ 而()1~222-n nS nχσ且2n S 与ξξ-+1n 独立,, 所以()1~1111--÷+--+n t S n n n n S nnn σξξ分布. 即111+--+n n S nn εε服从()1-n t 分布. 20.(),,,1,,n i i i =ηξ是取自二元正态分布N()ρσσμμ222121,,,的子样,设()∑∑∑===-===n i i i ni n i i n S n n 12111,1,1ξξηηξξξ2,()2121∑=-=n i i n S ηηη和 ()()()()∑∑∑===----=ni i ni ii ni ir 12211ηηξξηηξξ试求统计量()122221--+---n S rS S S ηξηξμμηξ的分布.解: 由于().21μμηξ-=-E ()()=-+=-ηξηξηξ,c o v 2D D D nn nn2122212σσρσσ-+.所以()()n 212221212σρσσσμμηξ-+---服从()1,0N 分布 .()()()()()()()[]211212121222122ηξηξηηξξηηξξ---=----+-=-+∑∑∑∑====i ini i i ni i ni i ni S rS S S ni i ηξ-是正态变量,类似于一维正态变量的情况,可证ηξηξS rS S S 222-+与ηξ-相互独立.()()1~22221222122--+-+n S rS S S n χσρσσσηξηξ, 所以 统计量()122221--+---n S rS S S ηξηξμμηξ()()()()1)2(222122212221222121--+-+-+---=n S rS S S n nσρσσσσρσσσμμηξηξηξ服从()1-n t 分布.第二章:估计量1. 设n ξξ,,1 是来自二点分布的一个子样,试求成功概率p 的矩法估计量.解: p E =ξ ξ=∴pˆ 3. 对容量为n 的子样,求密度函数()()⎪⎩⎪⎨⎧<<-=其它,00,2;2ax x a a a x f 中参数a 的矩法估计3. 对容量为n 的子样,求密度函数 ()()⎪⎩⎪⎨⎧<<-=其它,00,2;2ax x a a a x f 中参数a 的矩法估计量. 解: ()322adx x a ax E a=-=⎰ξ 令ξ=3a 得ξ3ˆ=a . 4. 在密度函数 ()()10,1<<+=x x a x f a中参数a 的极大似然估计量是什么? 矩法估计量是什么? 解: (1) ()()()∏∏==+=+=ni i ni nni x x L 111ααααα ()i i x ∀<<1∴()().ln 1ln ln 1⎪⎪⎭⎫⎝⎛⋅++=∏=n i i x n L ααα令()0ln 1ln 1=++=∂∂∑=i ni x nL ααα, 得 ∑=--=ni iL xn1ln 1ˆα。
目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。
1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。
1.5举例说明总体、样本、参数、统计量、变量这几个概念。
1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。
1.8请举出统计应用的几个例子。
1.9请举出应用统计的几个领域。
1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。
1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。
回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。
第一章绪论一、填空1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。
2、由一组频数2,5,6,7得到的一组频率依次是0。
1 、0.25 、0。
3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变.3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。
4、如果各组相应的累积频率依次为0。
2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。
5、中位数eM可反映总体的集中趋势,四分位差DQ.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是5。
5,众数为 5 。
6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。
四、计算题1、某班的经济学成绩如下表所示:43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。
(3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么?(4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布?(3)上四分位数和下四分位数所在区间?要求:(1)分别计算成年组和青少年组身高的平均数、标准差和标准差系数。
(2)说明成年组和青少年组平均身高的代表性哪个大?为什么?要求:试比较哪个单位的职工工资差异程度小.8、一家公司在招收职员时,首先要通过两项能力测试.在A 项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
统计学习题与答案(完整)_2第⼀部分计量资料的统计描述、最佳选择题1、描述⼀组偏态分布资料的变异度,以()指标较好°A、全距B、标准差C、变异系数D、四分位数间距E、⽅差2.⽤均数和标准差可以全⾯描述资料的特征。
A.正偏态分布B.负偏态分布C.正态分布D .对称分布E.对数正态分布3.各观察值均加(或减)同⼀数后(A .均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对4.⽐较⾝⾼和体重两组数据变异度⼤⼩宜采⽤A.变异系数B.⽅差C.极差标准差 E .四分位数间距5.偏态分布宜⽤()描述其分布的集中趋势A.算术均数B.标准差C.中位数四分位数间距 E .⽅差6.各观察值同乘以⼀个不等于0的常数后,()不变°A.算术均数B.标准差C.⼏何均数D.中位数 E .变异系数7.()分布的资料,均数等于中位数°A.对数正态B.正偏态C.负偏态 D .偏态E. 正态&对数正态分布是⼀种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布问X变量属何种分布A.正态B.近似正态C.左偏态D.右偏态 E .对称9.最⼩组段⽆下限或最⼤组段⽆上限的频数分布资料,可⽤()描述其集中趋势°B.标准差C.中位数D.四分位数间距 E .⼏何均数10 .⾎清学滴度资料最常⽤来表⽰其平均⽔平的指标是 ()°学习参考A.算术平均数 B .中位数 C .⼏何均数 D .变异系数 E .标准差⼆、简答题1、对于⼀组近似正态分布的资料 ,除样本含量n ⼣⼘,还可计算挽,S 和X ' Z ⼭,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的某单位1999年正常成年⼥⼦⾎清联系和区别°3、说明频数分布表的⽤途°4、变异系数的⽤途是什么?⽢油三酯(mmol/L)测量结果组段频数5、试述正态分布的⾯积分布规律°0.6~ 10.7~ 3 三、计算分析题0.8~91、根据1999年某地某单位的体检资料,116名正常0.9~ 13成年⼥⼦的⾎清⽢油三酯 (mmol/L )测量结果如右表,1.0~ 19请据此资料:1.1~ 25(1)描述集中趋势应选择何指标?并计算之° 1.2~ 18(2)描述离散趋势应选择何指标并计算之°1.3~ 13(3)求该地正常成年⼥⼦⾎清⽢油三酯的 95%参考值范围°1.4~ 9(4)试估计该地正常成年⼥⼦⾎清⽢油三酯在0.8mmol/L1.5~ 5以下者及1.5mmol/L 以下者各占正常⼥⼦总⼈数的百分⽐°合计1162、某些微丝蚴⾎症者 42例治疗后7年⽤间接荧⽕抗体试验得抗体滴度如下 °求平均抗体滴度3、测得某地300名正常⼈尿汞值,其频数表如下。
统计习题部分 (1)第1章导论 (2)第2章数据的搜集 (3)第3章数据的整理与显示 (4)第4章数据的概括性度量 (5)第5章概率与概率分布............................................................ 错误!未定义书签。
第6章统计量及其抽样分布 (7)第7章参数估计 (8)第8章假设检验 (9)第9章分类数据分析.............................................................. 错误!未定义书签。
第10章方差分析................................................................. 错误!未定义书签。
第11章一元线性回归 (10)第12章多元线性回归 (12)第13章时间序列分析和预测 (15)第14章指数 (17)答案部分 (21)第1章导论 (21)第2章数据的搜集 (21)第3章数据的图表展示 (21)第4章数据的概括性度量 (22)第5章概率与概率分布............................................................ 错误!未定义书签。
第6章统计量及其抽样分布 (23)第7章参数估计 (23)第8章假设检验 (24)第9章分类数据分析.............................................................. 错误!未定义书签。
第10章方差分析................................................................. 错误!未定义书签。
第11章一元线性回归 (25)第12章多元线性回归 (26)第13章时间序列分析和预测 (27)第14章指数 (28)习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
《统计学》练习题(2)答案1.要检验全国多个地区贫困人口的比例是否一样,适合采用的检验方法是(C)。
A.正态分布检验B.t分布检验C.2拟合优度检验D.2独立性检验2.一个社会学者随机抽取3000个家庭,想研究文化程度的高低与离婚率的高低是否有关,适合采用的检验方法是(D)。
A.正态分布检验B.t分布检验C.2拟合优度检验D.2独立性检验3.2拟合优度检验主要用于判断(B)。
A.各类别的观察频数是否相等B.各类别的观察频数与期望频数是否一致C.各类别的期望频数是否相等D.各类别的期望频数是否等于观察频数4.2独立性检验主要用于判断(A)。
A.两个分类变量是否独立B.两个分类变量各类别的观察频数是否相等C.一个分类变量各类别的观察频数与期望频数是否相等D.一个分类变量是否独立5.对于两个分类变量的多个类别总共抽取200个样本。
其中某个单元格所在行的合计频数为80,所在列的合计频数为60。
该单元格的期望频数为(A)。
A.24B.25C.26D.276.对于两个分类变量的多个类别总共抽取1000个样本。
其中某个单元格所在行的合计频数为.200,所在列的合计频数为100。
该单元格的期望频数为(B)。
A.10B.20C.30D.407.2拟合优度检验的原假设是(C)。
A.各类别的期望频数无显著差异B.各类别的观察频数无显著差异C.各类别的观察频数与期望频数无显著差异D.各类别的观察频数与期望频数有显著差异8.2独立性检验的原假设是(C)。
A.两个变量的期望频数相等B.两个变量的期望频数不相等C.两个变量独立D.两个变量不独立9.在使用2检验时,如果仅有两个单元格,单元格的最小期望频数不应小于(A)。
A.5B.10C.15D.2010.在使用2检验时,如果单元格在两个以上时,期望频数小于5的单元格不能超过总格数的(D)。
A.5﹪B.10﹪C.15﹪D.20﹪11.系数的取值范围是(B)。
A.0<<1B.0≤≤1C.>0D.<012.2独立性检验主要用于研究(A)。
、中位数可反映总体的趋势,四分位差可反映总体的7、以下数字特征不刻画分散程度的是A、极差B、离散系数C、中位数D、标准差8、已知总体平均数为200,离散系数为0.05,则总体方差为A、 B、10 C、100 D、0.19、两个总体的平均数不相等,标准差相等,则A、平均数大,代表性大B、平均数小,代表性大C、两个总体的平均数代表性相同D、无法判断10、某单位的生产小组工人工资资料如下:90元、100元、110元、120元、128元、148元、200元,计算结果均值为元,标准差为A、σ=33B、σ=34C、σ=34.23D、σ=3511、已知方差为 100 ,算术平均数为 4 ,则标准差系数为A、10B、2.5C、25D、无法计算12、有甲乙两组数列,若A、1<21>2,则乙数列平均数的代表性高B、1<21>2,则乙数列平均数的代表性低C、1=21>2,则甲数列平均数的代表性高D、1=21<2,则甲数列平均数的代表性低13、某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为26.2岁,则该城市男性青年结婚的年龄分布为A、右偏B、左偏C、对称D、不能作出结论14、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋势宜采用A、众数B、中位数C、四分位数D、均值15、如果你的业务是提供足球运动鞋的号码,哪一种平均指标对你更有用?A、算术平均数B、几何平均数C、中位数D、众数三、判断1、已知分组数据的各组组限为:10~15,15~20,20~25,取值为15的这个样本被分在第一组。
()2、将收集到得的数据分组,组数越多,丧失的信息越多。
()3、离散变量既可编制单项式变量数列,也可编制组距式变量数列。
)4、从一个总体可以抽取多个样本,所以统计量的数值不是唯一确定的。
()5、在给定资料中众数只有一个。
统计量及其分布习题知识点精析与应用一、填空题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、简单随机抽样样本均值X 的方差取决于 和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 倍。
2、设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。
(注:20.99(17)33.4χ=, 20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=)3、若(5)X t ,则2X 服从_______分布。
4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 。
,二、选择题(将正确答案的序号填在括号内,共5小题,每小题2分,共10分)1、中心极限定理可保证在大量观察下A 样本平均数趋近于总体平均数的趋势B 样本方差趋近于总体方差的趋势C 样本平均数分布趋近于正态分布的趋势D 样本比例趋近于总体比例的趋势2、设随机变量()(1)X t n n >,则21/Y X =服从21/Y X = 。
A 正态分布B 卡方分布C t 分布D F 分布3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm ,,标准差为0.4cm 。
至少以 的概率可确信4岁男孩平均身高在93.8cm 到96.2cm 之间。
A 68.27%B 90%C 95.45%D 99.73%4、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( )A 、样本容量为10B 、抽样误差为2C 、样本平均每袋重量是统计量D 、498是估计值5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从A (100/,25)N nB NC (100,25/)N nD (100,N 三、判断题1、所有可能样本平均数的方差等于总体方差。
第2章统计数据的描述●9.某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值:(见Excel练习题2.9)x=xn∑=822330=274.1(万元)或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。
在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:M e=2722732+=272.5(万元)由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而:Q L=261+2732724-=261.25(万元)同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:Q U=291-2732724-=290.75(万元)。
(2)未分组数据的标准差计算公式为:s =302 1()1iix xn=--∑利用上公式代入数据计算是个较为复杂的工作。
手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。
(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。
统计学课后习题答案+模拟题库2套选择题来源:南京财经大学考试通的日志统计学期末考试所有选择题,拥有它,你期末分数碉堡了来源:孙晨凯统计学课后习题答案+模拟题库2套选择题第一章统计学及其基本概念----(孙晨凯整理)一、单项选择题1. 推断统计学研究()。
(知识点:1.2 答案:D)A.统计数据收集的方法 B.数据加工处理的方法C.统计数据显示的方法 D.如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。
(知识点:1.3 答案:D)A.数理统计学派 B.政治算术学派 C.社会统计学派 D.国势学派3. 下列数据中哪个是定比尺度衡量的数据()。
(知识点:1.4 答案:B)A.性别 B.年龄 C.籍贯 D.民族4. 统计对现象总体数量特征的认识是()。
(知识点:1.6 答案:C)A.从定性到定量 B.从定量到定性 C.从个体到总体 D.从总体到个体5. 调查10个企业职工的工资水平情况,则统计总体是()。
(知识点:1.6 答案:C)A.10个企业B.10个企业职工的全部工资C.10个企业的全部职工D.10个企业每个职工的工资6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().(知识点:1.6 答案:A)A. 样本B. 总体单位C. 个体D. 全及总体7. 三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。
(知识点:1.7 答案:D)A. 指标B. 标志C. 变量D. 标志值8. 以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。
(知识点:1.7 答案:A)A. 品质标志B. 数量标志C. 质量指标D. 数量指标9. ()表示事物的质的特征,是不能以数值表示的。
(知识点:1.7 答案:A)A. 品质标志B. 数量标志C. 质量指标D. 数量指标10. 在出勤率、废品量、劳动生产率、商品流通费用额和人均粮食生产量五个指标中,属于数量指标的有几个()。
统计学(贾俊平第八版)课后思考题及答案第一章:统计学基本概念和方法思考题1:什么是统计学?统计学的研究对象是什么?统计学是从观察数据的现象和规律出发,运用数理统计方法进行概括、分析和推断的科学。
统计学研究的对象是数据的概括和整体行为特征,即基本统计量和统计分布。
答案:统计学是一门应用数学的学科,其研究范围包括数据的收集、整理、描述、分析和推断等方面。
统计学通过运用数理统计方法,帮助我们从观察到的数据中发现其中的规律和趋势,从而对现象和问题作出合理的判断和推断。
统计学的研究对象主要包括两个方面。
一方面,统计学关注数据的概括和整体行为特征,例如对数据集的中心趋势(平均数、中位数)和离散程度(标准差、方差)进行描述和分析,这些统计量可以帮助我们对数据进行概括和比较。
另一方面,统计学研究数据的统计分布,即数据的分布形状和特征,例如正态分布、偏态分布等,这些分布有助于我们根据数据的特点进行进一步的推断和推测。
第二章:统计学的数据描述思考题2:试举例说明数据分为哪些类型?数据分为定性数据和定量数据两种类型。
答案:数据可以分为定性数据和定量数据两种类型。
定性数据是指不能用数字表示的数据,其特征主要是描述性的,例如性别、喜好等。
定性数据通常采用文字或符号进行记录和表达。
定量数据是指可以用数字表示的数据,其特征主要是数量性的,例如身高、体重等。
定量数据可以进行数学运算和统计分析。
举例来说,一个学生调查问卷中的“性别”以及“对某个电影的评价(好、中、差)”是属于定性数据;而问卷中的“年龄”和“观看该电影的次数”则是属于定量数据。
第三章:概率与概率分布思考题3:什么是概率?请以一个例子来解释。
概率是指某个事件发生的可能性。
它在统计学中用于描述随机现象的规律性和不确定性。
答案:概率是描述某个事件发生的可能性的数值。
概率可以从0到1之间的任何一个数值,其中0表示不可能发生,1表示肯定会发生。
举个例子来说明,假设有一个标准的骰子,每个面上有1到6的数字。
第二章 统计量及其分布 习题
一、填空题
1、简单随机抽样样本均值X 的方差取决于 和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的 倍。
2、设1217,,,X X X L 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则
a =____________。
(注:20.99(17)33.4χ=, 20.995(17)35.7χ=, 20.99(16)32.0χ=, 20.995(16)34.2χ=)
3、若(5)X t :,则2X 服从_______分布。
4、已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。
5、中心极限定理是说:如果总体存在有限的方差,那么,随着 的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于 。
,
二、选择题
1、中心极限定理可保证在大量观察下
A 样本平均数趋近于总体平均数的趋势
B 样本方差趋近于总体方差的趋势
C 样本平均数分布趋近于正态分布的趋势
D 样本比例趋近于总体比例的趋势
2、设随机变量()(1)X t n n >:,则21/Y X =服从2
1/Y X = 。
A 正态分布
B 卡方分布
C t 分布
D F 分布
3、根据抽样测定100名4岁男孩身体发育情况的资料,平均身高为95cm ,,标准差为0.4cm 。
至少以 的概率可确信4岁男孩平均身高在93.8cm 到96.2cm 之间。
A %
B 90%
C %
D %
4、某品牌袋装糖果重量的标准是(500±5)克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是( )
A 、样本容量为10
B 、抽样误差为2
C 、样本平均每袋重量是统计量
D 、498是估计值
5、设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从
A (100/,25)N n
B N
C (100,25/)N n
D (100,N
三、判断题
1、所有可能样本平均数的方差等于总体方差。
( )
2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
( )
3、设),0(~2σN X ,则对任何实数,a b 均有:22~(,)aX b N a b a σ++.( )
4、样本方差就是样本的二阶中心距。
( )
5、设随机变量X 与Y 满足X N(0,1), Y 2()n χ, 则/X 服从自由度为n 的t 分布。
四、计算题
1、从正态总体2(52,6.3)N 中随机抽取容量为36的样本,要求:
(1)求样本均值x 的分布;
(2)求x 落在区间(,)内的概率;
(3)若要以99%的概率保证|52|2x -<,试问样本量至少应取多少
2、设随机变量(,)X F n n :,计算(1)P X <
3、根据自由度为4的t 分布的密度函数,求出该密度函数的峰值,以及该分布期望与方差。
参考答案:
一、填空题
1、样本量,总体方差,4
2、32
3、F(1,5)
4、
5、样本量,正态分布
二、选择题
1、C
2、D
3、 B
4、 B
5、C
三、判断题
1、F
2、F
3、T
4、F
5、F
四、计算题
1、(1)2(52,6.3/36)(52,1.1025)N N =(2) (3)67
2、
3、峰值3/8, 期望0,方差2.。