统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所
第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验
3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念
第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5
1 估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性 B.有效性 C.一致性 D.充分性 3 根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4 无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 6 当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 7 当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 8 一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数
第6章 抽样与抽样分布 练习题 6.1 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估计总体均值。 (1) x 的数学期望是多少? (2) x 的标准差是多少? (3) x 的抽样分布是什么? (4) 样本方差2 s 的抽样分布是什么? 6.2 假定总体共有1000个单位,均值32=μ,标准差5=σ。从中抽取一个样本量为30的简单随机样本用于获得总体信息。 (1)x 的数学期望是多少? (2)x 的标准差是多少? 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ,标准差10=σ。从该总体中抽取一个样本量为25的随机样本,其均值为25x ;同样,抽取一个样本量为100的随机样本,样本均值为100x 。 (1)描述25x 的抽样分布。 (2)描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 (2)不重复抽样,总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中,抽取一个样本量为100的简单随机样本。 (1)p 的数学期望是多少? (2)p 的标准差是多少? (3)p 的分布是什么? 6.7 假定总体比例为55.0=π,从该总体中分别抽取样本量为100、200、500和1000的样本。
(1) 分别计算样本比例的标准差p σ。 (2) 当样本量增大时,样本比例的标准差有何变化? 6.8 假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾 客,每个顾客消费金额大于87元的概率是多少? 6.9 在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本均值 在441~446之间的概率是多少? 6.10 假设一个总体共有8个数值:54,55,59,63,64,68,69,70。从该总体中按重复 抽样方式抽取2=n 的随机样本。 (1) 计算出总体的均值和标准差。 (2) 一共有多少个可能的样本? (3) 抽出所有可能的样本,并计算出每个样本的均值。 (4) 画出样本均值的抽样分布的直方图,说明样本均值分布的特征。 (5) 计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得 到的结论是什么? 6.11 从均值为5.4=μ,方差为25.82=σ的总体中,抽取50个由5=n 个观测值组成的 随机样本,结果见Book6.11。 (1) 计算每一个样本的均值。 (2) 构造50个样本均值的相对频数分布,以此代表样本均值x 的抽样分布。 (3) 计算50个样本均值的平均值和标准差x σ。 6.12 来自一个样本的50个观察值见Book6.12。 (1) 用组距为10构建频数分布表,并画出直方图。 (2) 这组数据大概是什么分布?
统计学原理课后习题答案 第五章 抽样及参数估计 1.①由题意可知本题属于:纯随机重复抽样下的总体比例区间估计。 已知:n=1000,828 82.8%1000 p = =,(Z)195.45%F α=-= ,查表得/2=2Z α 由于不知总体标准差,用样本的标准差代替: p 82.8%282.8% 2.4%Z α±=±? =± 即:80.4%P 85.2%≤≤ 所以该城市拥有彩电家庭比例的置信区间为80.4%—85.2%。 ②由题意可知本题属于:重复抽样时比例的必要抽样数目。 已知: 82.8%p =,5%p ?= ,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替: 222 2 (1P) 382.8%(1-82.8%)5130.05 p z P n -??= =≈? 2.由题意可知本题属于:纯随机重复抽样下的总体平均数的抽样极限误差 已知:n=100,=3x ,=0.8σ ,(Z)195%F α=-= ,查表得/2=1.96Z α /2 = 1.960.16Z α?=?= 分钟 3.(1) 已知:n=150,123 82%150 p = =,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替: p 82%382%9.41%Z α±=±? =± 即:72.59%P 91.41%≤≤ (2)已知:n=150,=2x ,=0.75σ ,(Z)199.73%F α=-= ,查表得/2=3Z α
/2 0.75 2320.2x Z αμ=±=±?=± 分钟 即:1.8 2.2μ≤≤ 4. 已知: 200σ=,30z ?= ,(Z)195%F α=-= ,查表得/2=1.96Z α 则:22 222 2 1.9620017130 z z n σ?==≈? 户 (1)如上图 (2)40名职工的平均考核成绩为3070 40 76.75xf x f = = =∑ 样本的方差为2 2 ()4777.5 s 122.54x x f f -= = =∑∑ (Z)195%F α=-= ,查表得到/2 1.96Z α= /2 76.75 1.911.07 676.75 3.43s x Z α±=±?=± 即在95%的概率保证度下,该企业工人的平均考核成绩在73.32到80.18直接。 (3)已知:n=40,36 90%40 p = =,(Z)195%F α=-= ,查表得/2=1.96Z α 由于不知总体标准差,用样本的标准差代替:
统计学复习笔记 第七章 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=
统计学习题答案第4章抽样与抽样分布
第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =
解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、
简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公
顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差
《统计学》 第六章 抽样与参数估计 1、某市劳动和社会保障局想调查下岗职工中女性所占的比重,随机抽取300个下岗职工,发现其中195个为女性职工。试以95.45%的概率保证程度,估计该市下岗职工中女性比重的区间范围。 解: 已知n=300,概率保证程度95.45%,Z 0.0455/2 =2 P=300195=65% 区间范围P n )1(2 p p -Z ±α=0.65300 ) 65.01(65.02-±=0.65±0.055 该市下岗职工中女性比重的区间范围为59.5%~70.5之间 2、某灯管厂生产10万只日光灯管,现采用简单随机重复抽样方式抽取1‰灯管进行质量检验,测试结果如下表所示: 耐用时间(小时) 灯管数(只) 800以下 10 800-900 15 900-1000 35 1000-1100 25 1100以上 15 合计 100 根据上述资料: (1)试计算抽样总体灯管的平均耐用时间 (2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。 (3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按95%的概率保证程度下,估计10万只灯管的合格率区间范围。 (4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验? 解: 耐用时间(小时) 灯管数(只)f 组中值x xf f x x 2)(- 800以下 10 750 7500 484000 800-900 15 850 12750 216000 900-1000 35 950 33250 14000 1000-1100 25 1050 26250 160000 1100以上 15 1150 17250 486000
第九章抽样与抽样估计 一、单项选择题 1、抽样极限误差是指抽样指标和总体指标之间(D)。 A.抽样误差的平均数B.抽样误差的标准差 C.抽样误差的可靠程度D.抽样误差的最大可能范围 2、样本平均数和总体平均数(B)。解析:样本平均数是以总体平均数为中心,在其范围内变动(P213) A.前者是一个确定值,B.前者是随机变量, 后者是随机变量后者是一个确定值 C.两者都是随机变量D.两者都是确定值 3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%, 95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。A.144B.105C.76D.109 4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。 A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3 5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。 A.增加9倍B.增加8倍 C.为原来的2.25倍D.增加2.25倍 6、抽样误差是指(C)。解析:这题考的是抽样误差的定义(P213) A.在抽查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7、在一定的抽样平均误差条件下(A)。
A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8、抽样平均误差是(B)。解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差 C.抽样指标的标准差D.抽样误差的平均差 9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式(D)。 A.简单随机抽样B.类型抽样 C.等距抽样D.整群抽样 10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》 或抽签的方式来抽取样本的抽样组织形式,被称为(B)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差相 比,(A)。 A.前着小于后者B.前者大于后者 C.两者相等D.无法判断 13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其 他条件不变),必要的样本容量将会(C)。
统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差 、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=
第八章抽样与抽样分布 一、名词解释 1、统计抽样:按照随机原则从被研究现象的总体中,抽取一部分单位进行观察,然后根据 观察的结果运用数理统计的原理,来估计总体综合指标或者对总体综合指标的某种假设进行 检验。 2、重复抽样:是从总体中每抽出一个样本单位后,把结果记录下来,随即将该单位放回到 总体中去,使它和其余的单位在下一次抽选中具有同等被抽中的机会,再抽取第二个单位,直至抽取n个单位为止。 3、不重复抽样:一个单位被抽中后不再放回总体,然后再从所剩下的单位中抽取第二个单位,直到抽出n个单位为止,这样的抽样方法不可能使一个总体单位被重复抽中,所以称为 不重复抽样。 4、简单随机抽样:在从总体中随机抽取n个单位作为样本时,要使得每一个总体的单位都 有相同的机会(概率)被抽中。 5、分层抽样:在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数 量的单位组成一个样本,这样的抽样方式称为分层抽样,也称为分类抽样。 6、系统抽样:在抽样中先将总体各单位按某种顺序排列,并按某种规则确定一个随机起点, 然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。这样的抽样方式称 为系统抽样,也称等距抽样或机械抽样。 7、整群抽样:调查时,先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群, 进而对抽中的各个群中所包含的所有个体单位进行调查或观察,这样的抽样方式称为整群抽样。 8、总体分布:总体是我们关心的若干个元素的集合,总体中每个元素的取值是不同的,这些 观察值所形成的相对频数分布就是总体分布。 9、样本分布:是指一个样本中各观察值所形成的相对频数分布。 10.抽样分布:某个样本统计量的抽样分布,从理论上说就是在重复选取容量为n的样本时, 由该统计量的所有可能取值形成的相对频数分布。 11、比率:是指总体(或样本)中具有某种属性的单位与全部单位总数之比。 12、样本比率的抽样分布:在重复选取容量为n的样本时,由样本比率的所有可能取值形成 的相对频数分布称为样本比率的抽样分布。 二、判断题 1、× 2、√ 3、× 4、× 5、√ 6、× 7、√ 8、√ 9、× 10、√ 三、选择题 1、A 2、A 3、B 4、B 5、C 6、D 7、D 8、D 9、C 10、D 11、C 12、B 13、C 14、C 15、A 16、D 17、A 18、B 19、C 20、B 21、B 22、B 23、B 24、A 25、A 四、简答题 1、简述统计抽样的基本特点。
第6章 统计量及其抽样分布一、思考题 1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设12n X X X ,, …,是从总体X 中抽取的容量为n 的一个样本,如果由此 样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。 (2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。 (3)统计量是样本的一个函数。由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。 2.判断下列样本函数哪些是统计量?哪些不是统计量? 1121021210310410()/10 min() T X X X T X X X T X T X μ μσ =+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。
3.什么是次序统计量? 答:设12n X X X ,, …,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本 12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序 (1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。 4.什么是充分统计量? 答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 5.什么是自由度? 答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。 6.简述2 χ分布、t 分布、F 分布及正态分布之间的关系。答:(1)随机变量X 1,X 2,… X n 相互独立,且都服从标准正态分布,则它们的平方和21 n i i X =∑服从自由度为n 的2 χ分布。(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的2 χ分布,且X 与Y 独立,
第四章 抽样分布与参数估计 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成 了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = = (2)在95%的置信水平下,求边际误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?x z ασ=?0.025x z σ=?=×= (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: (),x x x x -?+?=()120 4.2,120 4.2-+=(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ???:或2,s x N n μ?? ??? : 置信区间为: 22x z x z αα?-+ ? (1)构建μ的90%的置信区间。 2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(,) (2)构建μ的95%的置信区间。 2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(,) (3)构建μ的99%的置信区间。 2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(,) 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取 36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 解:
统计学(第四版)贾俊平第五章参数估计练习题答案 5.1(答案精确到小数点后两位) (1)已知:n=49,15σ=, 样本均值的标准误差X σ==(2)已知:置信水平:2 195%, 1.96 Z α α-==, 估计误差E=2 15 1.96 4.207 Z α== (3)已知120,X =置信水平:2 195%, 1.96Z αα-==,E=4.20 置信区间为()2 120 4.20115.80,124.20X Z α±=±= 5.2(答案精确到小数点后两位) (1)置信区间为2 8900 1.96(8646.97,9153.03)X Z α±=±= (2)置信区间为2 8900 1.96(8815.48,8984.52)X Z α±=±= (3)置信区间为2 8900 1.65(8760.55,9039.45)X Z α±=±= (4)置信区间为2 8900 2.58(8681.95,9118.05)X Z α±=±= 5.3 (1) 表5.3—1置信水平90%上网时间置信区间报告 上网时间
(2) (3)
5.4(答案精确到小数点后两位) (1)已知N=500,n=50,132n = A. 传统方法:32 0.6450 p == 比例置信区间为0.64(0.51,0.77)p Z ±=±= B. 现代方法:322 0.63504 p +==+ 比例置信区间为0.63(0.50,0.76)p Z ±=±= (2)已知0.8p =0.1≤ 得到:16n ≥ 5.5 (1)
5.6已知22 12121214,7,53.2,43.4,96.8,102.0n n X X s s ======, (1)置信水平195%α-=, 12μμ-置信区间为()(()122 1.86,17.74X X t v α -±= (2)置信水平199%α-=, 12μμ-置信区间为()(()122 0.19,19.41X X t v α -±= 5.7
统计学
STATISTICS (第三版 第三版)
第 7 章 参数估计
统计学
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
第 7 章 参数估计
§7.1 参数估计的一般问题 §7.2 一个总体参数的区间估计 §7.3 样本量的确定
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
学习目标
1. 估计量与估计值的概念 2. 点估计与区间估计的区别 3. 评价估计量优良性的标准 4. 一个总体参数的区间估计方法 5. 样本量的确定方法
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
§7.1 参数估计的一般 问题
7.1.1 估计量与估计值 7.1.2 点估计与区间估计 7.1.3 评价估计量的标准
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
估计量与估计值
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
统计学
STATISTICS (第三版 第三版)
估计量与估计值
(estimator & estimated value)
1. 估计量:用于估计总体参数的随机变量 – 如样本均值,样本比例, 样本方差等 – 例如: 样本均值就是总体均值μ 的一个估计量
? 表示 2. 参数用θ 表示,估计量用 θ
3. 估计值:估计参数时 计算出来的统计量的
具体值
– 如果样本均值 ?x =80,则80就是μ的估计值
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院
第5-6章 统计量及其抽样分布 正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等 某一条件下产品的质量 如果随机变量X 的概率密度为 22 ()21 (),2x f x e x μσπσ --=-∞<<∞ 则称X 服从正态分布。 记做 2 (,)X N μσ,读作:随机变量X 服从均值为μ,方差为2 σ的正态分布 其中, μ-∞<<∞,是随机变量X 的均值,0σ>是是随机变量X 的 标准差
5.1.2正态密度函数f(x)的一些特点: ()0 f x≥,即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定:σ越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以x轴为其渐近线。 标准正态分布 当 0,1 μσ == 时,
2 2 1 () 2x f x e π- = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ ,则 (0,1) X Z N μ σ - = 变量 2 11 (,) X Nμσ与变量2 22 (,) Y Nμσ相互独立,则有 22 1212 +(+,+) X Y Nμμσσ 5.1.3 正态分布表:可以查的正态分布的概率值()1() x x Φ-=-Φ 例:设 (0,1) X N,求以下概率
第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示
第4章 抽样与抽样分布——练习题(全免) 1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 ⑴ 给出x 的抽样分布(重复抽样)的均值和标准差 ⑵ 描述x 的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z 统计量对应于5.15=x 的值。 ⑷ 计算标准正态z 统计量对应于23=x 的值。 解: 已知 n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x 的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。试求下列概率的近似值: 解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、 金融、保险以及与汽车相关的各项服务。1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 ⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x 服从怎样
第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。
概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。 11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。