当前位置：文档之家› 统计学课件第五章统计资料的推断

统计学课件第五章统计资料的推断

第五章+统计学教案(假设检验)

第五章+统计学教案（假设检验）参数估计和假设检验是统计推断的两个组成部分，它们分别从不同的角度利用样本信息对总体参数进行推断。前者讨论的是在一定的总体分布形式下，借助样本构造的统计量，对总体未知参数作出估计的问题；后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证，从而作出真假判断。通俗地、简单地说，前者是利用样本信息估计总体参数将落在什么范围里；而后者则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。通过本章学习，要求学生在充分理解有关抽样分布理论的基础上，理解掌握假设检验的有关基本概念；明确在假设检验中可能犯的两种错误，以及这两种错误之间的联系；熟练掌握总体均值和总体成数的检验方法，主要是 Z 检验和 t 检验；对于非参数的检验，也应有所了解，包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验一、假设检验的有关基本概念；二、总体平均数与总体成数的检验；三、非参数检验；一、假设检验的基本思路与有关概念；二、两类错误的理解及其关系；一、假设检验概述假设检验：利用统计方法检验一个事先所作出的假设的真伪，这一假设称为统计假设，对这一假设所作出的检验就是假设检验。基本思路：首先，对总体参数作出某种假设，并假定它是成立的。然后，根据样本得到的信息（统计量），考虑接受这个假设后是否会导致不合理的结果，如果合理就接受这个假设，不合理就拒绝这个假设。所谓合理性，就是看是否在一次的观察中出现了小概率事件。小概率原理：就是指概率很小的事件，在一次试验中实际上是几乎不可能出现。这种事件可以称其为“实际不可能事件”。二、假设检验的基本概念

作业与参考标准答案ch第三部分计数资料统计描述和统计推断

————————————————————————————————作者：————————————————————————————————日期：

《医学统计学》【教材】倪宗瓒主编.医学统计学.北京;高等教育出版社.2004. 【作业】教材附录二【习题解答】第三单元计数资料的统计描述和统计推断分析计算题 3.1 解： (1) 100%= ?同年该年龄组死亡人数年龄组死亡人数构成比某年某年龄组死亡总数 %39.1%1001802 25 ~0=?= 岁组死亡人数构成比余类推； 10000010= ?同年该年龄组死亡人数死亡率万某年某年龄组平均人口数 010000010 3.3610?=25 ～岁组死亡率= 万万745000 余类推；岁组死亡率各年龄组死亡率相对比~0= 04.1336 .380 .43~30== 岁组相对比余类推。各年龄组死亡人数构成比、死亡率和相对比计算结果见表3.1.1。表3.1.1 某地某年循环系统疾病死亡资料年龄组 /岁平均人口数循环系统死亡人数死亡人数构成比 /% 死亡率 (1/10万) 相对比 (各年龄组死亡率/0～组死亡率)

0～ 745000 25 1.39 3.36 — 30～ 538760 236 13.10 43.80 13.04 40～ 400105 520 28.86 129.97 38.68 50～ 186537 648 35.96 347.38 103.39 60～ 52750 373 20.70 707.11 210.45 合计 1923152 1802 100.00 93.70 — (2) 死亡人数构成比是指某年龄组死亡人数与各年龄组死亡人口总数之比，说明总死亡人数中各年龄组死亡人数所占的比重；死亡率是指某年实际死亡数与该年可能发生死亡人数（本题即为该年平均人口数）之比，用以说明死亡发生的频率或强度；相对比用以说明各年龄组死亡率是0～岁组死亡率的几倍或几分之几。 3.2解：因为甲、乙两医院某传染病的类型构成明显不同，且疾病类型对该病的治疗效果有影响，故应进行标准化，再比较两医院的治愈率。根据本题资料，以两医院合计病人数为标准人口，采用直接标准化法。表3.2.1 直接法计算甲、乙两医院某传染病标准化治愈率/% 类型标准病人数 N i 甲医院乙医院原治愈率/% p i 预期治愈人数 N i p i 原治愈率/% p i 预期治愈人数 N i p i 普通型 552 59.9 331 65.2 360 重型 552 39.9 220 44.9 248 暴发型 252 19.8 50 25.4 64 合计 1356 48.4 601( i i N p ∑) 45.4 672( i i N p ∑) 甲医院某传染病标准化治愈率：601 100%44.3%1356p '=?=甲乙医院某传染病标准化治愈率：672100%49.6%1356p '=?=乙可以看出，经标准化后乙医院的该传染病的治愈率高于甲医院。

看医统学习题(计数资料)

《医学统计学习题》计数资料 5、有资料如下表：甲、乙两个医院某传染病各型治愈率病型患者数治愈率（％）甲乙甲乙普通型300 100 60.0 65.0 重型100 300 40.0 45.0 暴发型100 100 20.0 25.0 合计500 500 48.0 45.0 由于各型疾病的人数在两个医院的内部构成不同，从内部看，乙医院各型治愈率都高于甲医院，但根据栏的结果恰好相反，纠正这种矛盾现象的统计方法是： A、重新计算，多保留几位小数 B、对率进行标准化 C、对各医院分别求平均治愈率 D、增大样本含量，重新计算 6、5个样本率作比较，χ2＞χ20.01，4，则在α＝0.05检验水准下，可认为： A、各总体率不全等 B、各总体率均不等 C、各样本率均不等 D、各样本率不全等 7、两个独立小样本计量资料比较的假设检验，首先应考虑： A、用t检验 B、用Wilcoxon秩和检验 C、t检验或Wilcoxon秩和检验均可 D、资料符合t检验还是Wilcoxon秩和检验条件 13．对三行四列表资料作 2检验，自由度等于 A. 1 B. 2 C. 3 D. 6 E. 12 14. 根据下述资料，则病情病人数治愈数治愈率（%）病人数治愈数治愈率（%）轻型40 36 90 60 54 90 重型60 42 70 40 28 70 合计100 78 78 100 82 82 A. 乙疗法优于甲疗法 B. 甲疗法优于乙疗法 C. 甲疗法与乙疗法疗效相等 D. 此资料甲、乙疗法不能比较 E. 以上都不对15．在实际工作中，同质是指（）。 A．被研究指标的非实验影响因素均相同。B．研究对象的测量指标无误差。 C．被研究指标的主要影响因素相同。D．研究对象之间无个体差异。E．以上都对。答案 5、有资料如下表：甲、乙两个医院某传染病各型治愈率病型患者数治愈率（％）甲乙甲乙

统计学抽样与抽样分布练习题

第6章抽样与抽样分布练习题 6.1 从均值为200、标准差为50的总体中，抽取100=n 的简单随机样本，用样本均值x 估计总体均值。（1） x 的数学期望是多少？（2） x 的标准差是多少？（3） x 的抽样分布是什么？（4）样本方差2 s 的抽样分布是什么？ 6.2 假定总体共有1000个单位，均值32=μ，标准差5=σ。从中抽取一个样本量为30的简单随机样本用于获得总体信息。（1）x 的数学期望是多少？（2）x 的标准差是多少？ 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本，样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ，标准差10=σ。从该总体中抽取一个样本量为25的随机样本，其均值为25x ；同样，抽取一个样本量为100的随机样本，样本均值为100x 。（1）描述25x 的抽样分布。（2）描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本，求样本均值的抽样标准差：（1）重复抽样。（2）不重复抽样，总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中，抽取一个样本量为100的简单随机样本。（1）p 的数学期望是多少? （2）p 的标准差是多少? （3）p 的分布是什么？ 6.7 假定总体比例为55.0=π，从该总体中分别抽取样本量为100、200、500和1000的样本。

（1）分别计算样本比例的标准差p σ。（2）当样本量增大时，样本比例的标准差有何变化？ 6.8 假定顾客在超市一次性购物的平均消费是85元，标准差是9元。从中随机抽取40个顾客，每个顾客消费金额大于87元的概率是多少？ 6.9 在校大学生每月的平均支出是448元，标准差是21元。随机抽取49名学生，样本均值在441～446之间的概率是多少？ 6.10 假设一个总体共有8个数值：54，55，59，63，64，68，69，70。从该总体中按重复抽样方式抽取2=n 的随机样本。（1）计算出总体的均值和标准差。（2）一共有多少个可能的样本？（3）抽出所有可能的样本，并计算出每个样本的均值。（4）画出样本均值的抽样分布的直方图，说明样本均值分布的特征。（5）计算所有样本均值的平均数和标准差，并与总体的均值和标准差进行比较，得到的结论是什么？ 6.11 从均值为5.4=μ，方差为25.82=σ的总体中，抽取50个由5=n 个观测值组成的随机样本，结果见Book6.11。（1）计算每一个样本的均值。（2）构造50个样本均值的相对频数分布，以此代表样本均值x 的抽样分布。（3）计算50个样本均值的平均值和标准差x σ。 6.12 来自一个样本的50个观察值见Book6.12。（1）用组距为10构建频数分布表，并画出直方图。（2）这组数据大概是什么分布？

统计学第五章抽样推断课后答案

第五章抽样推断一、单项选择题 1 2 3 4 5 6 7 8 9 10 C B A D B D C B A C 11 12 13 14 15 16 17 18 19 20 A D C A D C A C B D 二、多项选择题 1 2 3 4 5 ABCE ABDE BCE ABCE ABDE 6 7 8 9 10 ACE ADE ACD ABE CDE 11 12 13 14 15 BDE CD BC ABCD ABCDE 16 17 18 19 20 AD AC BCE ABDE ACE 三、判断题 1 2 3 4 5 6 7 8 9 10 × × × √ √ × √ √ × × 四、填空题 1、变量属性 2、正反 3、重复抽样不重复抽样 4、抽样总体样本 5、大于 N n - 1 N n 6、标准差 7、样本总体抽样平均误差抽样平均误差 △x = Z x σ 8、合适的样本估计量一定的概率保证程度允许的极限误差范围 9、随机抽样统计分组 10、增大增大降低 11、大数定律中心极限定理 12、样本容量不小（不小于30个单位） 13、大 0.5

14、缩小 3 3 （即0.5774）扩大 1.1180 15、估计量（或统计量）参数五、简答题（略）六、计算题 1、已知条件：P = 0.5 ，n = 100 且重复抽样求：p ≤0.45的概率解： Z = 1100 ) 5.01(5.05.045.0)1(=-?-= --n P P P p 则F (Z = 1) = 0.6827 所以p ≤0.45的概率为： 2 6827 .01-= 0.15865 2、解 E (x 1) = E （0.5X 1 + 0.3X 2 + 0.2X 3） = 0.5 E (X ) + 0.3 E (X ) + 0.2E (X ) = E (X ) = X E (x 2) = E （0.5X 1 + 0.25X 2 + 0.25X 3） = 0.5 E (X ) + 0.25 E (X ) + 0.25E (X ) = E (X ) = X E (x 3) = E （0.4X 1 + 0.3X 2 + 0.3X 3） = 0.4 E (X ) + 0.3 E (X ) + 0.3E (X ) = E (X ) = X 所以x 1、x 2、x 3都是X 的无偏估计量。 D (x 1) = D （0.5X 1 + 0.3X 2 + 0.2X 3） = 0.25 D (X ) + 0.09 D (X ) + 0.04D (X ) = 0.38 D (x 2) = D （0.5X 1 + 0.25X 2 + 0.25X 3）

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布（重复抽样）的均值和标准差 ⑵描述x的抽样分布的形状。你的回答依赖于样本容量吗？ ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64，为大样本，μ=20，σ=16， ⑴在重复抽样情况下，x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16；⑵x>23；⑶x>25；⑷.x落在16和22之间；⑸x<14。解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值：30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么？ ⑵ 你认为x 至多偏离μ多么远？ ⑶ 为了回答b 你必须要知道μ吗？请解释。解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0，1，2，…，97，98，99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本，并对于每一个样本计算x 。对于每一个样本容量，构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化？存在什么相似性？这里30,10,5,2====n n n n 和50=n 。解:趋向正态 6. 美国汽车联合会（AAA ）是一个拥有90个俱乐部的非营利联盟，它对其成员提供旅行、

统计学答案解析最新版本

统计学课本课后作业题（全）题目：第1章：P11 6，7 第2章：P52 练习题3、9、10、11 第3章：P116思考题12、14 练习题16、25 第4章：P114 思考题6，练习题2、4、6、13 第5章：P179 思考题4、练习题3、4、6、11 第6章：P209 思考题4、练习题1、3、6 第7章：P246思考题1、练习题1、7 第8章：P287 思考题4、10 练习题2、3 第一章 6．．一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此，他们开始检查供货商的集装箱，有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆，每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求： (1)描述总体；最近的一个集装箱内的全部油漆； (2)描述研究变量；装满的油漆罐的质量； (3)描述样本；最近的一个集装箱内的50罐油漆； (4)描述推断。50罐油漆的质量应为4.536×50＝226.8 kg。 7．“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分，选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中，两个品牌不做外观标记)，请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求：答：(1)总体：市场上的“可口可乐”与“百事可乐” (2)研究变量：更好口味的品牌名称； (3)样本：1000名消费者品尝的两个品牌 (4)推断：两个品牌中哪个口味更好。第二章 3.某百货公司连续40天的商品销售额如下（单位：万元）：

统计学习题第五章_抽样与抽样估计答案

一、填空题 1、在实际工作中，人们通常把 n≥30 的样本称为大样本，而把 n<30 的样本称为小样本。 2、在抽样估计中，常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下，抽样总体是唯一确定的，而样本则有许多个。 4、在抽样调查中，登记性误差和系统性误差都可以尽量避免，而抽样误差则是不可避免的，但可以计算并加以控制。 5、在抽样估计中，抽样估计量是指用于估计总体参数的样本指标（统计量），评价估计量优劣的标准有无偏性、有效性和一致性。二、选择题单选题： 1、在其它条件不变的情况下，要使抽样平均误差为原来的1/3，则样本单位数必须（（2））（1）增加到原来的3倍（2）增加到原来的9倍（3）增加到原来的6倍（4）也是原来的1/3 2、在总体内部情况复杂，且各单位之间差异程度大，单位数又多的情况下，宜采用（（3））（1）简单随机抽样（2）等距抽样（3）分层抽样（4）整群抽样 3、某厂产品质量检查，确定按5%的比率抽取，按连续生产时间顺序每20小时抽1 小时的全部产进行检验，这种方式是（（4））（1）简单随机抽样（2）等距抽样（3）分层抽样（4）整群抽样 4、其它条件一定，抽样推断的把握程度提高，抽样推断的准确性就会（（2））（1）提高（2）降低（3）不变（4）不一定降低 5、在城市电话网的100次通话中，通话持续平均时间为3分钟，均方差为分钟，则概率为时，通话平均持续时间的抽样极限误差为（（2））（1）（2）（3）（4）

6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同，现在各自用重复抽样方法抽取本国人口的1%计算平均年龄，则平均年龄抽样平均误差（（3））（1）两者相等（2）前者比后者大（3）前者比后者小（4）不能确定大小多选题： 1、降低抽样误差，可以通过下列那些途径（（2）（4）（5））（1）降低总体方差（2）增加样本容量。（3）减少样本容量（4）改重复抽样为不重复抽样（5）改简单随机抽样为类型抽样 2、抽样推断中的抽样误差（（1）（5））（1）是不可避免要产生的（2）是可以通过改进调查方法来消除的（3）只有调查后才能计算（4）即不能减少，也不能消除（5）其大小是可以控制的 3、抽样极限误差（（1）（2）（4））（1）是所有可能的样本指标与总体指标之间的误差范围（2）也叫允许误差（3）与所做估计的概率保证程度成反比（4）通常用来表示抽样结果的精确度 4、影响样本容量的因素有（（1）（2）（3）（4）（5））（1）总体方差（2）所要求的概率保证程度（3）抽样方法（4）抽样的组织形式（5）允许误差法范围的大小 5、不重复抽样的抽样平均误差（（2）（4））（1）总是大于重复抽样的抽样平均误差

统计学第五章课后题及答案解析

第五章练习题一、单项选择题 1．抽样推断的目的在于（） A．对样本进行全面调查B．了解样本的基本情况 C．了解总体的基本情况D．推断总体指标2．在重复抽样条件下纯随机抽样的平均误差取决于（） A．样本单位数B．总体方差 C．抽样比例D．样本单位数和总体方差 3．根据重复抽样的资料，一年级优秀生比重为10%，二年级为20%，若抽样人数相等时，优秀生比重的抽样误差（） A．一年级较大B．二年级较大 C．误差相同D．无法判断 4．用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将（）A．高估误差B．低估误差 C．恰好相等D．高估或低估 5．在其他条件不变的情况下，如果允许误差缩小为原来的1/2 ，则样本容量（） A．扩大到原来的2倍B．扩大到原来的4倍 C．缩小到原来的1/4D ．缩小到原来的1/2 6．当总体单位不很多且差异较小时宜采用（） A．整群抽样B．纯随机抽样 C．分层抽样D．等距抽样 7．在分层抽样中影响抽样平均误差的方差是（） A．层间方差B．层内方差 C．总方差D．允许误差二、多项选择题 1．抽样推断的特点有（） A ．建立在随机抽样原则基础上 B．深入研究复杂的专门问题 C ．用样本指标来推断总体指标 D．抽样误差可以事先计算 E ．抽样误差可以事先控制 2．影响抽样误差的因素有（） A ．样本容量的大小B．是有限总体还是无限总体 C ．总体单位的标志变动度D．抽样方法 E ．抽样组织方式 3．抽样方法根据取样的方式不同分为（） A ．重复抽样 B ．等距抽样 C ．整群抽样 D ．分层抽样 E ．不重复抽样 4．抽样推断的优良标准是（） A ．无偏性 B ．同质性 C ．一致性 D ．随机性 E ．有效性 5．影响必要样本容量的主要因素有（） A ．总体方差的大小B．抽样方法

统计学答案第八章抽样与抽样分布

第八章抽样与抽样分布一、名词解释 1、统计抽样：按照随机原则从被研究现象的总体中，抽取一部分单位进行观察，然后根据观察的结果运用数理统计的原理，来估计总体综合指标或者对总体综合指标的某种假设进行检验。 2、重复抽样：是从总体中每抽出一个样本单位后，把结果记录下来，随即将该单位放回到总体中去，使它和其余的单位在下一次抽选中具有同等被抽中的机会，再抽取第二个单位，直至抽取n个单位为止。 3、不重复抽样：一个单位被抽中后不再放回总体，然后再从所剩下的单位中抽取第二个单位，直到抽出n个单位为止，这样的抽样方法不可能使一个总体单位被重复抽中，所以称为不重复抽样。 4、简单随机抽样：在从总体中随机抽取n个单位作为样本时，要使得每一个总体的单位都有相同的机会（概率）被抽中。 5、分层抽样：在抽样之前先将总体的单位划分为若干层（类），然后从各个层中抽取一定数量的单位组成一个样本，这样的抽样方式称为分层抽样，也称为分类抽样。 6、系统抽样：在抽样中先将总体各单位按某种顺序排列，并按某种规则确定一个随机起点，然后，每隔一定的间隔抽取一个单位，直至抽取n个单位形成一个样本。这样的抽样方式称为系统抽样，也称等距抽样或机械抽样。 7、整群抽样：调查时，先将总体划分成若干群，然后再以群作为调查单位从中抽取部分群，进而对抽中的各个群中所包含的所有个体单位进行调查或观察，这样的抽样方式称为整群抽样。 8、总体分布：总体是我们关心的若干个元素的集合,总体中每个元素的取值是不同的，这些观察值所形成的相对频数分布就是总体分布。 9、样本分布：是指一个样本中各观察值所形成的相对频数分布。 10.抽样分布：某个样本统计量的抽样分布，从理论上说就是在重复选取容量为n的样本时，由该统计量的所有可能取值形成的相对频数分布。 11、比率：是指总体（或样本）中具有某种属性的单位与全部单位总数之比。 12、样本比率的抽样分布：在重复选取容量为n的样本时，由样本比率的所有可能取值形成的相对频数分布称为样本比率的抽样分布。二、判断题 1、× 2、√ 3、× 4、× 5、√ 6、× 7、√ 8、√ 9、× 10、√ 三、选择题 1、A 2、A 3、B 4、B 5、C 6、D 7、D 8、D 9、C 10、D 11、C 12、B 13、C 14、C 15、A 16、D 17、A 18、B 19、C 20、B 21、B 22、B 23、B 24、A 25、A 四、简答题 1、简述统计抽样的基本特点。

统计学第五章习题

第五章思考与练习 1. 要求：（1）计算样本平均数和样本标准差，并推算抽样平均误差；（2）以95.45%的概率保证，估计该厂工人的月平均工资和工资总额的区间。 2.从某餐厅连续三个星期抽查49名顾客，调查顾客的平均消费额，得样本平均消费额为 25.5元。要求：（1）假设总体标准差为10.5元，求抽样平均误差。（2）以95%的概率保证，抽样极限误差是多少？（3）估计总体消费额的置信区间。 3.某加油站想了解司机在该加油站加油的习惯，一周内随机抽取了100名司机，得出如下结果：平均加油量等于13.5升，样本标准差为3.2升，有19人购买无铅汽油，试问：（1）以0.05的显著性水平，是否有证据说明平均加油量为12升。（2）以0.05的显著性水平，是否有证据说明购买无铅汽油的司机少于20。 4 设干燥时间总体服从正态分布，现在要求置信度为95%时估计这种漆的平均干燥时间。（1）根据经验知总体标准差为0.6小时：（2）总体标准差未知。 5.采用简单随机重置抽样从2000件产品中抽查200件产品，其中合格产品190件，要求：（1）计算该产品的合格率及其抽样平均误差；（2）以95.45%的概率，对产品合格率和产品合格数量进行区间估计；（3）如果合格品率的极限误差为2.31%，其概率保证程度是多少？

6.某电子产品的使用寿命在3000小时以下为次品，现在从5000件产品中抽取100件测得要求：（1）分别按重置抽样和不重置抽样计算该产品平均寿命的抽样平均误差；（2）分别按重置抽样和不重置抽样计算该产品次品率的抽样平均误差；（3）以90%的概率保证，对该产品的平均使用寿命进行区间估计；（4）以90%的概率保证，对该产品的次品率进行区间估计。 7.某医院欲估计一名医生花在每个病人身上的平均时间，根据以往经验看病时间的标准差为6分钟。若要求置信度为95%，允许误差范围为2分钟。试问随机抽样中需要多大的样本？ 8.某公司新推出一种营养型豆奶，为了解该豆奶的受欢迎程度，并使置信度为95%，估计误差不超过5%，下列情况下，你建议样本容量为多少？（1）初步估计60%的顾客喜欢此豆奶（2）没有任何顾客资料 9.为调查某地区人口综合素质，在该地区150 000户家庭中以不重置抽样方式随机抽取30 要求：（1）试以95.45%的概率保证程度，推断该地区的人口总数（2）若要求人口总数的极限误差不超过3300人，应至少抽取多少户作为样本？ 10.某电视台为了了解某电视节目的收视率，随机抽取500户居民作为样本。从调查结果来看，有160户收看该节目。以95%的概率保证推断：（1）该电视节目的收视率（2）如果收视率的极限误差缩小为原来的1/2,则样本容量应为原来的多少户？ 11.从某县的100个村中，抽取10个村进行各村的全面调查，算得每户平均饲养家畜35头，各村平均的方差为16，要求：（1）以90%的概率估计全县平均每户饲养家畜的头数（2）若极限误差为2412头，则计算其概率保证程度。

统计学第5-6章正态分布、统计量及其抽样分布

第5-6章统计量及其抽样分布正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时，这个变量一般服从正态分布或近似服从正态分布。概率密度曲线图例如：某个地区同年龄组儿童的发育特征：身高、体重、肺活量等某一条件下产品的质量如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。记做 2 (,)X N μσ，读作：随机变量X 服从均值为μ，方差为2 σ的正态分布其中， μ-∞<<∞，是随机变量X 的均值，0σ>是是随机变量X 的标准差

5.1.2正态密度函数f(x)的一些特点： ()0 f x≥,即整个概率密度曲线都在x轴的上方。曲线 () f x相对于xμ =对称，并在xμ = 处达到最大值， 1 () 2 fμ πσ = 。 1 μ＜ 2 μ＜ 3 μ 曲线的陡缓程度由 σ 决定：σ越大，曲线越平缓；σ越小，曲线越陡峭当 x 趋于无穷时，曲线以x轴为其渐近线。标准正态分布当 0,1 μσ == 时，

2 2 1 () 2x f x e π- = ， x -∞<<∞ 称 (0,1) N 为标准正态分布。标准正态分布的概率密度函数： ()x ? 标准正态分布的分布函数： ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布设 2 (,) X Nμσ ,则 (0,1) X Z N μ σ - = 变量 2 11 (,) X Nμσ与变量2 22 (,) Y Nμσ相互独立,则有 22 1212 +(+,+) X Y Nμμσσ 5.1.3 正态分布表：可以查的正态分布的概率值()1() x x Φ-=-Φ 例：设 (0,1) X N，求以下概率

统计学习题答案_第4章__抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 ⑴ 给出x 的抽样分布（重复抽样）的均值和标准差 ⑵ 描述x 的抽样分布的形状。你的回答依赖于样本容量吗？ ⑶ 计算标准正态z 统计量对应于5.15=x 的值。 ⑷ 计算标准正态z 统计量对应于23=x 的值。解: 已知 n=64，为大样本，μ=20，σ=16， ⑴在重复抽样情况下，x 的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x <16； ⑵x >23； ⑶x >25； ⑷.x 落在16和22之间； ⑸x <14。解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。试求下列概率的近似值：解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么？ ⑵ 你认为x 至多偏离μ多么远？ ⑶ 为了回答b 你必须要知道μ吗？请解释。解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0，1，2，…，97，98，99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本，并对于每一个样本计算x 。对于每一个样本容量，构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化？存在什么相似性？这里30,10,5,2====n n n n 和50=n 。解:趋向正态 6. 美国汽车联合会（AAA ）是一个拥有90个俱乐部的非营利联盟，它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1999年5月，AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元（《旅行新闻》Travel News ，1999年5月11日）。假设这个花费的标准差是15美元，并且AAA 所报道的平均每日消费是总体均值。又假设选取49个4口之家，并对其在1999年6月期间的旅行费用进行记录。 ⑴ 描述x （样本家庭平均每日餐饮和住宿的消费）的抽样分布。特别说明x 服从怎样

计数资料的统计学分析 (1)

[模拟] 计数资料的统计学分析 A型题题干在前，选项在后。有A、B、C、D、E五个备选答案其中只有一个为最佳答案。第1题：计数资料又称如下哪一种资料 A.数量资料 B.抽样资料 C.普查资料 D.调查资料 E.定性资料参考答案：E 答案解析：第2题：计数资料是指将观察单位按下列哪一种分组计数所得的资料 A.数量 B.体重 C.含量 D.属性或类型或品质 E.放射性计数参考答案：D 答案解析：第3题：计数资料的初步分析常常要用下列哪些相对数 A.频数 B.频数和频率指标 C.率、构成比和相对比 D.构成指标和相对比 E.比和构成比参考答案：C 答案解析：第4题：频率指标，它说明某现象发生的如下哪一种

B.强度 C.比重大小 D.例数 E.各组的单位数参考答案：B 答案解析：第5题：构成指标，它说明一事内部各组成部分所占的如下哪一种大小 A.比重 B.强度 C.频数 D.频率 E.例数参考答案：A 答案解析：第6题：对480人进行老年性白内障普查，分60岁一、70岁一和80岁一三个年龄组受检人数分别为300、150和30人，白内障例数分别为150、90和24人。回答70岁一年龄组的患病率(％)是多少 A.5 B.50 C.60 D.80 E.20 参考答案：C 答案解析：第7题：对1000人进行老年性白内障普查，分50岁一和60岁一两个年龄组，受检人数分别为480人和520人，白内障例数分别为120人和280人。回答患者50岁一年龄构成比(％)是多少 A.53.9 B.12 C.30 D.28

参考答案：C 答案解析：第8题：在计数资料计算相对数时，应注意如下哪些问题 A.分母不宜过大 B.可比性 C.随机性 D.分母不宜过小 E.分母宜中参考答案：D 答案解析：第9题：在计数资料进行相对数间比较时，应注意如下哪些问题 A.分母不宜太小 B.可比性 C.可用频率指标代替构成指标 D.随机性和正态分布 E.其可比性和遵循随机抽样参考答案：E 答案解析：第10题： X2检验是要计算检验统计量X2值、X2值是反应如下哪种情况 A.实际频数大于理论频数 B.理论频数大于实际频数 C.实际频率和理论频率的吻合程度 D.实际频数和理论频数的吻合程度 E.实际频率大于理论频率参考答案：D 答案解析：第11题： X2值愈大，则X2值的概率P值如下哪种情况

统计学第5-6章正态分布统计量其抽样分布

第5-6章统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时，这个变量一般服从正态分布或近似服从正态分布。概率密度曲线图例如：某个地区同年龄组儿童的发育特征：身高、体重、肺活量等某一条件下产品的质量如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。记做 2 (,)X N μσ:，读作：随机变量X 服从均值为μ，方差为2 σ的正态分布其中， μ-∞<<∞，是随机变量X 的均值，0σ>是是随机变量X 的标准差 5.1.2正态密度函数f(x)的一些特点： ()0f x ≥,即整个概率密度曲线都在x 轴的上方。曲线 ()f x 相对于x μ=对称，并在 x μ=处达到最大值，

1 () 2 fμ πσ = 。 1 μ＜ 2 μ＜ 3 μ 曲线的陡缓程度由 σ 决定：σ越大，曲线越平缓；σ越小，曲线越陡峭当 x 趋于无穷时，曲线以x轴为其渐近线。标准正态分布当 0,1 μσ == 时， 2 2 1 () 2 x f x e π - = ， x -∞<<∞ 称 (0,1) N 为标准正态分布。

标准正态分布的概率密度函数： ()x ? 标准正态分布的分布函数： ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表：可以查的正态分布的概率值()1() x x Φ-=-Φ 例：设 (0,1) X N :，求以下概率（1） ( 1.5) P X< (2) (2) P X> (3) (13) P X -<≤

统计学第五章：抽样推断

第五章：抽样推断二、单项选择题１、对总体的数量特征进行抽样估计的前提是抽样必须遵循（ B ）。 A.大量性 B.随机性 C.可靠性 D.准确性２、一般认为大样本的样本单位数至少要大于（A ）。 A.30 B.50 C.100 D.200 3、抽样平均误差是指（ D ）。 A.抽中样本的样本指标与总体指标的实际误差 B.抽中样本的样本指标与总体指标的误差范围 C.所有可能样本的抽样误差的算术平均数 D.所有可能样本的样本指标的标准差 4、在其它条件相同的情况下，重复抽样的抽样误差（A）不重复抽样的抽样误差。 A.大于 B.小于 C.总是等于 D.通常小于或等于 5、在其它条件不变的情况下，要使抽样误差减少1/3 ，样本单位数必须增加（D ）。 A. 1/3 B. 1.25倍 C. 3倍 D. 9倍 6、从产品生产线上每隔10分钟抽取一件产品进行质量检验。推断全天产品的合格率时，其抽样平均误差常常是按（C ）的误差公式近似计算的。 A.简单随机抽样 B.整群抽样 C.等距抽样 D.类型抽样 7、通常使样本单位在总体中分布最不均匀的抽样组织方式是（B ）。 A.简单随机抽样 B.整群抽样 C.分层抽样 D.等距抽样 9、抽样平均误差和极限误差的关系是（D） A抽样平均误差大于极限误差B抽样平均误差等于极限误差 C抽样平均误差小于极限误差 D抽样平均误差大于、等于、小于极限误差都可能 10、抽样平均误差的实质是（D） A、总体标准差 B、样本标准差 C、抽样误差的标准差 D、全部可能样本平均数的标准差三、多项选择题１、抽样调查与其它非全面调查相区别的主要特点有（ACD ）。 A、按随机原则抽取样本单位 B、调查资料时效性强 C、可以计算抽样误差 D、以概率论和数理统计学为理论基础２、影响抽样平均误差大小的因素有（ABCD ）。 A、总体各单位标志值的差异程度 B、抽样数目 C、样本各单位标志值的差异程度 D、抽样组织方式 E、抽样推断的把握程度３、影响必要的抽样数目的因素有（BCDE ）。 A、总体各单位标志值的差异程度 B、样本各单位标志值的差异程度 C、抽样方法和抽样组织方式 D、抽样推断的把握程度 E、允许误差４、计算抽样平均误差时，由于总体方差是未知的，通常有下列代替方法（ACE ）。 A、大样本条件下，用样本方差代替 B、小样本条件下，用样本方差代替 C、用以前同类调查的总体方差代替 D、有多个参考数值时，应取其平均数代替

第三单元计数资料的统计描述和统计推断(第一部分)

第三单元计数资料的统计描述和统计推断【习题】分析计算题 3.1 某地某年循环系统疾病死亡资料如表18。表18 某地某年循环系统疾病死亡资料年龄组/岁平均人口数循环系统死亡人数死亡人数构成比 /% 死亡率 (1/10万) 相对比 (各年龄组死亡率 /0～组死亡率) 0～745000 25 30～538760 236 40～400105 520 50～186537 648 60～52750 373 合计1923152 1802 (1) 请根据以上数据计算各年龄组死亡人数构成比、死亡率和相对比。 (2) 分析讨论各指标的含义。 3.2 请就表19资料比较甲、乙两个医院某传染病的治愈率/%。表19 甲、乙两院某传染病治愈率(%)的比较类型甲医院乙医院病人数治愈数治愈率/% 病人数治愈数治愈率/% 普通型414 248 59.9 138 90 65.2 重型138 55 39.9 414 186 44.9 暴发型126 25 19.8 126 32 25.4 合计678 328 48.4 678 308 45.4 3.3 传统疗法治疗某病，其病死率为30%，治愈率为70%。今用某种新药治疗该病10人，结果有1人死亡。问该新药的治疗效果是否优于传统疗法（单侧）。

3.4 甲、乙两地各抽样调查1万名妇女，结果甲地卵巢癌患病人数100人，乙地卵巢癌患病人数80人，请问甲乙两地妇女的卵巢癌患病率是否不同。 3.5 对甲地一个由40名新生儿组成的随机样本进行某病的基因检测，结果阳性2例。据此资料，估计该地此病的基因总体携带率的95%可信区间。 3.6 已知一般人群中慢性气管炎患病率为9.7%，现调查了300名吸烟者，发现其中有63人患有慢性气管炎，试推断吸烟人群慢性气管炎患病率是否高于一般人群。 3.7 研究者取4mL某饮料进行细菌培养，得细菌数60个，试估计平均每1mL 饮料中细菌数的均值和标准差，并估计平均每1mL饮料中细菌数的95%可信区间。 3.8 分别从两种饮料中各取10mL样品进行细菌培养，甲饮料培养细菌440个，乙饮料培养细菌300个，问两种饮料中细菌数有无差别。 3.9 若某地区1998年新生儿腭裂发生率为2.15‰ ，1999年在此地区抽样调查1000名新生儿，发现腭裂1例，问此地区1999年腭裂发生率是否比1998年低。 3.10 对某地区居民饮用水进行卫生学检测中，随机抽查1mL水样，经培养获大肠杆菌菌落2个，试估计该地区水中平均每毫升所含大肠杆菌菌落的95%可信区间。 3.11 将80例均为初治的乳腺癌患者随机分配到甲乙两种治疗方案中，每组各40例，甲方案31例有效，乙方案14例有效，问两种治疗方案的有效率有无差别？ 3.12 为了解某中药治疗原发性高血压的疗效，将44名高血压患者随机分为两组。实验组用该药加辅助治疗，对照组用安慰剂加辅助治疗，观察结果如表20，问该药治疗原发性高血压是否有效？表20 两种疗法治疗原发性高血压的疗效分组例数有效有效率/% 实验组23 21 91.30 对照组21 5 23.81

统计学第五章练习题

第五章统计推断一、填空题 5.1.1 设样本n X X X ,,,21 来自总体)69.1,(μN ，则检验假设35:=μo H 时，使用的检验量是。 5.1.2 设n X X X ,,,21 是来自总体X 的一个样本，又设μ=)(X E ，2)(σ=X D ，则总体均值μ的无偏估计为；总体方差σ2的无偏估计为。 5.1.3 若检验统计量的观测值落在拒绝域内，则应。 5.1.4 设∑==n i i X n X 1 1为来自正态总体),(2 σμN 的样本均值，μ未知，欲检验假设 2 2:σσ=o H ，需要使用的检验统计量为。 5.1.5 其他条件不变时，置信度越高，则置信区间就越。 ☆5.1.6 检验两个正态总体均值的假设21:μμ=o H ，（已知2 221σσ=）时，使用的检验量为，拒绝域为。二、单项选择题（在每小题的3个备选答案中选出1个正确答案，并将其字母填在题干后面的括号内。） 5.2.1 对总体参数进行抽样估计的首要前提是必须（） A ．事先对总体进行初步分析 B ．按随机原则抽取样本 C ．保证调查数据的准确性、及时性 5.2.2 若其它条件相同，则下列诸检验的P 值中拒绝原假设理由最充分的是（） A ．2% B ．10% C ．25% 5.2.3 某校有学生8000人，随即抽查100人，其中有20人对学生管理有意见，则该校学生中对学校后勤管理有意见的人数的点估计值为（） A ．20% B ．20 C ．1600 5.2.4 如果总体服从正态分布，但总体均值和方差未知，样本量为n ，则用于构造总体方差置信区间的随机变量的分布是（） A ．()0,1N B ．),(2 σμN C ．χ2(n-1) 5.2.5 其他条件相同时，要使抽样误差减少1/4，样本量必须增加（） A ．1/4 B ．4倍 C ．7/9 5.2.6 影响区间估计质量的因素不包括（） A. 置信度 B. 总体参数 C. 样本量 5.2.7 某企业最近几批产品的优质品率分别为88％，85％，91％，为了对下一批产品的优质品率进行抽样检验，确定必要的抽样数目时，P 应选（）

文档之家

统计学课件第五章 统计资料的推断