第五章 抽样分布
- 格式:doc
- 大小:81.00 KB
- 文档页数:3
第五章抽样与抽样分布一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。
)1.抽样推断的主要目的是( )。
A.用统计量来推算总体参数B.对调查单位作深入研究C.计算和控制抽样误差D.广泛运用数学方法[答案] A[解析] 抽样调查是指从总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法,因此,抽样推断的主要目的是用已知的统计量来推算未知的总体参数。
2.抽样调查中,无法消除的误差是( )。
A.抽样误差B.责任心误差C.登记误差D.系统性误差[答案] A[解析] 抽样误差是指在遵循了随机原则的条件下,不包括登记误差和系统性误差在内的,用样本指标代表总体指标而产生的不可避免的误差。
3.在其他条件相同的情况下,重复抽样的抽样平均误差和不重复抽样相比,( )。
A.前者一定小于后者B.前者一定大于后者C.两者相等D.前者可能大于,也可能小于后者[答案] B[解析] 以抽样平均数的抽样平均误差为例进行说明:在重复抽样条件下,抽样平均数的平均误差的计算公式:;在不重复抽样条件下,抽样平均数的平均误差的计算公式:。
因为,故。
4.拟分别对甲、乙两个地区大学毕业生在试用期的工薪收入进行抽样调查。
据估计甲地区大学毕业生试用期月工薪的方差要比乙区高出一倍。
在样本量和抽样方法相同的情况下,甲区的抽样误差要比乙区高( )。
A.41.4% B.42.4% C.46.8% D.48.8%[答案] A[解析] 假设乙地区的大学毕业生试用期月工薪的方差为σ2,甲地区的大学毕业生试用期月工薪的方差为2σ2,则:,那么,在样本量和抽样方法相同的,情况下,甲区的抽样误差要比乙区高=41.4%。
5.对某天生产的2000件电子元件的耐用时间进行全面检测,又抽取5%进行抽样复测,资料如表5-1所示。
表5-1耐用时间(小时) 全面检测(支) 抽样复测(支)3000以下3000~4000 4000~5000 50600990230505000以上总计36020018100规定耐用时间在3000小时以下为不合格品,则该电子元件合格率的抽样平均误差为( )。
统计学中的抽样分布基本理论统计学是一门广泛应用于各个领域的学科。
在许多领域都需要数据支撑决策,统计学是收集、分析和解释数据的科学。
而抽样分布的基本理论则是统计学中最为基础且至关重要的概念之一。
什么是抽样分布?抽样分布指的是在总体中选取一定数量样本的情况下,样本所呈现的分布情况。
这个分布被称为抽样分布。
抽样分布正是在原本无法得出准确结果时,在对样本进行检测和分析加以处理得出的模拟分布情况。
抽样分布的定义我们假设样本是从一个总体中随机抽取的,这个总体具有一个概率分布,并且每个样本都独立地从该概率分布中抽取。
根据中心极限定理,当样本数量足够大时,样本均值的分布将会近似正态分布,均值为总体均值,标准差为总体标准差除以样本量的平方根。
这个近似于正态分布的抽样分布称为样本均值的抽样分布。
抽样分布中的t分布因为在实际应用中,样本的真实总体均值和总体标准差都是为了推断或预测总体特征,而在抽样时这些特征是不确定的,所以会有一定误差。
这时我们便需要用到其它类型的抽样分布。
t分布就是这样一种抽样分布方式,它在样本量较小时,比正态分布更适用。
它类似于正态分布,但在小样本情况下,会有更宽的尾部和更高的峰值。
t分布具有参数自由度 (df) ,其在自由度越大时,越接近于正态分布。
当自由度大于30时,两者基本一致。
了解抽样分布形式和方法对于进行更高质量的统计分析意义重大。
在统计中,我们总是使用概率论和数理统计中的一些基本思想来尽可能减少污染。
特别是在数据采集的实际工作中,数据样本的选取是统计分析的重要基础之一,样本均值的分布越正常,那么就可以推断出样本中的点集越正常。
抽样分布是推断总体、检验总体分布、总体均值、总体比率、总体标准差等经典统计问题的基础。
统计学原理-《统计学》第五章统计量及其抽样分布试题1、智商的得分服从均值为100,标准差为16的正态分布。
从总体中抽取一个容量为n的样本,样本均值的标准差为2,样本容量为____________。
2、样本均值与总体均值之间的差被称作____________。
3、从均值为50,标准差为5的无限总体中抽取容量为30的样本,则抽样分布的超过51的概率为____________。
4、某校大学生中,外国留学生占10%。
随机从该校学生中抽取100名学生,则样本中外国留学生比例的标准差为____________。
5、假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( )。
A.服从非正态分布B.近似正态分布C.服从均匀分布D.服从x²分布6、从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差( )。
A.保持不变B.增加C.减小D.无法确定7、总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为( )。
A.50,8B.50,1C.50,4D.8,88、某厂家生产的灯泡寿命的均值为60小时,标准差为4小时。
如果从中随机抽取30只灯泡进行检测,则样本均值( )。
A.抽样分布的标准差为4小时B.抽样分布近似等同于总体分布C.抽样分布的中位数为60小时D.抽样分布近似等同于正态分布,均值为60小时9、假设某学校学生的年龄分布是右偏的,均值为23岁,标准差为3岁。
如果随机抽取100名学生,下列关于样本均值抽样分布描述不正确的是( )。
A.抽样分布的标准差等于3B.抽样分布近似服从正态分布C.抽样分布的均值近似为23D.抽样分布为非正态分布10、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的数学期望是( )。
A.150B.200C.100D.25011、从均值为200,标准差为50的总体中抽取容量为100的简单随机样本,样本均值的标准差是( )。
第五章抽样调查及参数估计5.1 抽样与抽样分布5.2 参数估计的基本方法5.3 总体均值的区间估计5.4 总体比例的区间估计5.5 样本容量的确定一、简答题1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计?2.什么是抽样误差,影响抽样误差的主要因素有哪些?3.简述概率抽样的五种方式二、填空题1.抽样推断是在随机抽样的基础上,利用样本资料计算样本指标,并据以推算总体数量特征的一种统计分析方法。
2.从全部总体单位中随机抽选样本单位的方法有两种,即重复抽样和不重复抽样。
3.常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等四种。
4.影响抽样误差大小的因素有总体各单位标志值的差异程度、抽样单位数的多少、抽样方法和抽样调查的组织形式。
5.总体参数区间估计必须具备估计值、概率保证程度或概率度、抽样极限误差等三个要素。
6.从总体单位数为N的总体中抽取容量为n的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。
7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。
8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。
三、选择题1.抽样调查需要遵守的基本原则是( B )。
A.准确性原则 B.随机性原则 C.代表性原则 D.可靠性原则2.抽样调查的主要目的是( A )。
A.用样本指标推断总体指标 B.用总体指标推断样本指标C.弥补普查资料的不足 D.节约经费开支3.抽样平均误差反映了样本指标与总体指标之间的( B )。
A.实际误差 B.实际误差的平均数C.可能的误差范围 D.实际的误差范围4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。
A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。
概率论抽样分布说明在概率论中,抽样分布是指从总体中选取样本并计算样本统计量的分布。
通过研究抽样分布,可以推断总体的性质和参数。
在这篇文档中,我们将介绍概率论抽样分布的基本概念、特性以及常用的分布类型。
抽样分布的定义抽样分布是由于从总体中抽取样本导致的统计量的分布。
在统计学中,统计量是从样本数据中计算得出的数值,如样本均值、样本方差等。
通过从总体中不断抽取样本并计算统计量的值,可以得到抽样分布。
抽样分布的特性抽样分布具有以下特性:1.中心极限定理:当样本容量足够大时,抽样平均值的抽样分布近似呈正态分布。
2.抽样分布的均值等于总体均值:样本均值的期望值等于总体均值。
3.抽样分布的方差等于总体方差除以样本容量:样本均值的方差等于总体方差除以样本容量。
常见的抽样分布类型在概率论中,常用的抽样分布类型包括:1.正态分布:也称为高斯分布,是最常用的抽样分布。
当样本容量足够大时,均值的抽样分布近似呈正态分布。
2.t分布:用于小样本(样本容量较小)情况下对总体均值的推断。
相对于正态分布,t分布有更宽的尾部。
3.卡方分布:用于推断总体方差时的抽样分布。
卡方分布的形态由自由度决定。
4.F分布:用于比较两个总体方差是否相等的抽样分布。
F分布的形态由两个样本的自由度决定。
抽样分布的应用抽样分布广泛应用于统计学和概率论中的推断与检验问题。
通过从总体中抽取样本并计算统计量的分布,可以进行以下应用:1.参数估计:通过抽样分布,我们可以估计总体参数的取值,如总体均值、总体方差等。
2.假设检验:通过比较样本统计量与抽样分布的临界值,我们可以判断总体参数是否满足某个假设。
3.置信区间估计:通过计算抽样分布的分位数,我们可以得到总体参数的置信区间,从而评估参数的精确性。
总结抽样分布是概率论中的重要概念,用于推断总体的性质和参数。
具备了中心极限定理、均值和方差的性质等特点,常见的抽样分布类型包括正态分布、t分布、卡方分布和F分布。
通过抽样分布,我们可以进行参数估计、假设检验和置信区间估计等应用。
统计学中的抽样分布和抽样误差统计学是一门研究数据收集、处理和分析的学科,而在进行统计分析时,抽样是一项重要的技术。
抽样分布和抽样误差是统计学中关键的概念,本文将具体介绍它们的定义、特点和应用。
一、抽样分布在统计学中,抽样分布指的是从总体中抽取样本的过程中得到的样本统计量的概率分布。
样本统计量可以是样本均值、样本方差等。
抽样分布是由大量不同的样本所形成的,它们具有一定的数学特性。
抽样分布的特点有:1. 抽样分布的中心趋向于总体参数。
当样本容量足够大时,抽样分布的中心会接近总体参数的真值。
2. 抽样分布的形状可能与总体分布相同,也可能近似于正态分布。
中心极限定理是解释抽样分布接近正态分布的重要定理。
3. 样本容量越大,抽样分布的方差越小。
样本容量增大,抽样误差减小。
抽样分布在实际应用中具有重要价值。
通过了解抽样分布的性质,我们可以进行假设检验、构建置信区间以及进行参数估计等统计推断。
二、抽样误差抽样误差是指由于从总体中抽取样本而导致的估计值与总体参数值之间的差异。
它是统计推断中常见的误差来源,也是统计分析中需要控制的重要因素。
抽样误差的大小受到多个因素的影响,包括样本容量、总体变异性以及抽样方法等。
通常情况下,样本容量越大,抽样误差越小,因为更大的样本容量能够更好地代表总体。
为了降低抽样误差,我们可以采取以下策略:1. 增加样本容量。
增大样本容量可以减小抽样误差,提高估计值的准确性。
2. 采用随机抽样方法。
随机抽样可以降低抽样误差,确保样本的代表性。
3. 控制变异性。
尽量减少总体的变异性,可以减小抽样误差。
抽样误差的存在对于统计推断的可靠性有着重要的影响。
在进行数据分析和解释时,我们需要正确理解抽样误差的概念,并将其考虑在内。
总结:统计学中的抽样分布和抽样误差是进行统计推断不可或缺的概念。
抽样分布是样本统计量的概率分布,具有一定的数学特性,可以用于进行假设检验和置信区间估计。
抽样误差是由于从总体中抽取样本而导致的估计值与总体参数值之间的差异,它的大小受到多个因素的影响。
第五章 样本及抽样分布从本章开始, 我们将讲述数理统计的基本内容. 数理统计作为一门学科诞生于19世纪末20世纪初, 是具有广泛应用的一个数学分支, 它以概率论为基础, 根据试验或观察得到的数据, 来研究随机现象, 以便对研究对象的客观规律性作出合理的估计和判断.由于大量随机现象必然呈现出它的规律性, 故理论上只要对随机现象进行足够多次观察, 则研究对象的规律性就一定能清楚地呈现出来, 但实际上人们常常无法对所研究的对象的全体(或总体) 进行观察, 而只能抽取其中的部分(或样本) 进行观察或试验以获得有限的数据.数理统计的任务包括: 怎样有效地收集、整理有限的数据资料; 怎样对所得的数据资料进行分析、研究, 从而对研究对象的性质、特点, 作出合理的推断, 此即所谓的统计推断问题, 本课程主要讲述统计推断的基本内容.第一节 数理统计的基本概念内容分布图示★ 引言 ★ 总体与总体分布 ★ 样本与样本分布 ★ 例1★ 例2 ★ 例3 ★ 例4★ 统计推断问题简述★ 分组数据统计表和频率直方图 ★ 例5 ★ 经验分布函数 ★ 例6★ 统计量 ★ 样本的数字特征★ 例7 ★ 例8 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题5-1 ★ 返回内容要点:一、总体与总体分布总体是具有一定共性的研究对象的全体, 其大小与范围随具体研究与考察的目的而确定. 例如, 考察某大学一年级新生的体重情况, 则该校一年级全体新生就构成了待研究的总体. 总体确定后, 我们称总体的每一个可观察值为个体. 如前述总体(一年级新生) 中的每一个个体即为每个新生的体重. 总体中所包含的个体的个数称为总体的容量. 容量为有限的称为有限总体, 容量为无限的称为无限总体.数理统计中所关心的并非每个个体的所有性质, 而仅仅是它的某一项或某几项数量指标. 如前述总体(一年级新生)中, 我们关心的是个体的体重, 进而也可考察该总体中每个个体的身高和数学高考成绩等数量指标.总体中的每一个个体是随机试验的一个观察值, 故它是某一随机变量X 的值,于是, 一个总体对应于一个随机变量X , 对总体的研究就相当于对一个随机变量X 的研究, X 的分布就称为总体的分布函数, 今后将不区分总体与相应的随机变量, 并引入如下定义:定义 统计学中称随机变量(或向量)X 为总体, 并把随机变量(或向量)的分布称为总体分布.注(i) 有时个体的特性很难用数量指标直接描述, 但总可以将其数量化,如检验某学校全体学生的血型, 试验的结果有O 型、A 型、B 型、AB 型4种, 若分别以1,2,3,4依次记这4种血型,则试验的结果就可以用数量来表示了;(ii) 总体的分布一般来说是未知的, 有时即使知道其分布的类型(如正态分布、二项分布等),但不知这些分布中所含的参数等(如p ,,2σμ等).数理统计的任务就是根据总体中部分个体的数据资料对总体的未知分布进行统计推断.二、样本与样本分布由于作为统计研究对象的总体分布一般来说是未知的,为推断总体分布及其各种特征,一般方法是按一定规则从总体中抽取若干个体进行观察,通过观察可得到关于总体X 的一组数值),,,(21n x x x Λ,其中每一i x 是从总体中抽取的某一个体的数量指标i X 的观察值.上述抽取过程为抽样,所抽取的部分个体称为样本.样本中所含个体数目称为样本的容量.为对总体进行合理的统计推断,我们还需在相同的条件下进行多次重复的、独立的抽样观察,故样本是一个随机变量(或向量).容量为n 的样本可视为n 维随机向量),,,(21n X X X Λ,一旦具体取定一组样本,便得到样本的一次具体的观察值),,,(21n x x x Λ,称其为样本值.全体样本值组成的集合称为样本空间.为了使抽取的样本能很好地反映总体的信息, 必须考虑抽样方法,最常用的一种抽样方法称为简单随机抽样, 它要求抽取的样本满足下面两个条件:1. 代表性: n X X X ,,,21Λ与所考察的总体具有相同的分布;2. 独立性: n X X X ,,,21Λ是相互独立的随机变量.由简单随机抽样得到的样本称为简单随机样本, 它可用与总体独立同分布的n 个相互独立的随机变量n X X X ,,,21Λ表示. 显然, 简单随机样本是一种非常理想化的样本, 在实际应用中要获得严格意义下的简单随机样本并不容易.对有限总体, 若采用有放回抽样就能得到简单随机样本,但有放回抽样使用起来不方便, 故实际操作中通常采用的是无放回抽样, 当所考察的总体很大时, 无放回抽样与有放回抽样的区别很小, 此时可近似把无放回抽所得到的样本看成是一个简单随机样本. 对无限总体, 因抽取一个个体不影响它的分布, 故采用无放回抽样即可得到的一个简单随机样本.注: 今后假定所考虑的样本均为简单随机样本, 简称为样本.设总体X 的分布函数为)(x F ,则简单随机样本),,,(21n X X X Λ的联合分布函数为∏==ni i n x F x x x F 121)(),,,(Λ并称其为样本分布.特别地, 若总体X 为连续型随机变量,其概率密度为)(x f ,则样本的概率密度为∏==ni i n x f x x x f 121)(),,,(Λ分别称)(x f 与),,,(21n x x x f Λ为总体密度与样本密度.若总体X 为离散型随机变量,其概率分布为}{)(i i x X P x p ==, x 取遍X 所有可能取值, 则样本的概率分布为,)(},,,{),,,(12121∏======ni i n n x p x X x X x X p x x x p ΛΛ分别称)(i x p 与),,,(21n x x x p Λ为离散总体密度与离散样本密度.三、统计推断问题简述总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言). 我们称通过总体X 的一个样本n X X X ,,,21Λ对总体X 的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体↙ ↖推断(个体)样本 → 样本值抽样在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.为对总体进行统计推断, 还需借助样本构造一些合适的统计量, 即样本的函数, 下面将对相关统计量进行深入的讨论.四、分组数据统计表和频数直方图 通过观察或试验得到的样本值,一般是杂乱无章的,需要进行整理才能从总体上呈现其统计规律性. 分组数据统计表或频率直方图是两种常用整理方法. 1. 分组数据表:若样本值较多时,可将其分成若干组,分组的区间长度一般取成相等, 称区间的长度为组距. 分组的组数应与样本容量相适应. 分组太少,则难以反映出分布的特征,若分组太多,则由于样本取值的随机性而使分布显得杂乱. 因此,分组时,确定分组数(或组距)应以突出分布的特征并冲淡样本的随机波动性为原则. 区间所含的样本值个数陈为该区间的组频数. 组频数与总的样本容量之比称为组频率.2. 频数直方图:频率直方图能直观地表示出频数的分布,其步骤如下: 设n x x x ,,,21Λ是样本的n 个观察值.(i) 求出n x x x ,,,21Λ中的最小者)1(x 和最大者)(n x ;(ii) 选取常数a (略小于)1(x )和b (略大于)(n x ),并将区间],[b a 等分成m 个小区间(一般取m 使nm 在101左右): mab t m i t t t i i -=∆=∆+,,,2,1),,[Λ, 一般情况下,小区间不包括右端点.(iii) 求出组频数i n ,组频率i i f nn ∆=,以及),,2,1(,n i tfh i i Λ=∆=(iv) 在),[t t t i i ∆+上以i h 为高,t ∆为宽作小矩形,其面积恰为i f ,所有小矩形合在一起就构成了频率直方图五、经验分布函数样本的直方图可以形象地描述总体的概率分布的大致形态,而经验分布函数则可以用来描述总体分布函数的大致形状。
抽样及抽样分布引言在统计学中,抽样是从总体中选择一局部个体进行研究的过程。
通过抽样可以获得总体的估计值,从而对总体进行推断。
抽样是统计学的根底,也是进行统计推断的前提。
本文将介绍抽样的根本概念和方法,以及抽样分布的概念和特性。
抽样方法进行抽样时,需要选择适宜的抽样方法。
常见的抽样方法包括简单随机抽样、系统抽样、分层抽样和群组抽样等。
简单随机抽样简单随机抽样是最根本的抽样方法,每个个体被随机地选入样本,且每个个体被选入样本的概率相等。
这种方法可以确保样本具有代表性。
系统抽样系统抽样是按照一定的规那么从总体中选取样本,例如每隔一定间隔选取一个个体。
这种方法简单实用,但需要注意规那么的选择是否会引入偏差。
分层抽样分层抽样是将总体分成假设干层,然后从每层中随机选取个体组成样本。
这种方法可以保证每个层次都有足够的代表性。
群组抽样群组抽样是将总体划分为假设干群组,然后随机选取假设干群组作为样本。
这种方法适用于总体中包含多个群组,但群组内个体相似的情况。
抽样分布抽样分布是指抽样统计量的分布。
统计量可以是样本均值、样本方差、样本相关系数等。
样本均值的抽样分布假设总体服从正态分布,样本均值的抽样分布也会服从正态分布。
根据中心极限定理,当样本容量足够大时,样本均值的抽样分布将变得更加接近正态分布。
样本方差的抽样分布样本方差的抽样分布是以总体方差为参数的分布,通常服从卡方分布。
样本容量的大小将影响样本方差的抽样分布形状。
样本相关系数的抽样分布样本相关系数的抽样分布通常是以总体相关系数为参数的分布。
样本容量的增加会使样本相关系数的抽样分布趋向于正态分布。
抽样误差与置信区间抽样误差是指样本统计量与总体参数之间的差异。
抽样误差的大小会受到样本容量和抽样方法的影响。
为了评估抽样结果的可靠性,可以构建置信区间。
置信区间是总体参数的一个区间估计,表示总体参数落在该区间的概率。
置信区间的宽度与置信水平、样本容量以及总体标准差等相关。
第四章抽样与抽样分布
例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果:
例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求:
1)随机抽取一人,收入超过18430元的概率?
2)抽取一个10人样本,平均收入超过18430元的概率?
例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少?
例4:一架电梯极限负重1000公斤,一般可容纳13人。
假定电梯的所有乘客平均体重70公斤,标准差12公斤。
那么一个13个人的随机样本总重量超过极限负重的概率是多少?
例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。
设生育态度X:赞成为1,否则为0。
求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、
1、0、1、1、1,求样本均值、样本中赞成比例。
解:1)计算见下表
2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7
例6:学校选人大代表,结果有60%的选民投了我院院长而当选。
假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。
那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。
例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少?
四、样本方差的抽样分布
设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布:
2χ=2222312(
)(
)(
).....(
)i x x x x μ
μ
μ
μ
σ
σ
σ
σ
----++++=
2
2
1
1
()
k
i
i x μσ=-∑
分子分母同乘n-1,进一步整理得2
χ=2
2
(1)n s σ-~2χ(n-1)
练习题:
1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为?
2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为?
3、某企业声明企业人均收入为5500元,标准差为550元。
如果随机抽取16位员工,则平均收入落在5400-5600元的概率是?
4、样本量为10的样本均值方差为12,则总体的方差为?
5、总体均值为3.1,标准差为0.8,从该总体中随机抽取容量为36的样本,样本
均值落在2-3.3之间的概率是?
6、某类球员的平均年薪为150万元,标准差为80万元,如果随机抽取100名球员,计算他们的平均年薪,超过100万元的概率为:()
A 0.2375 B近似等于0 C近似等于1 D 0.7357
7、正态总体均值为17,标准差为10,从总体中抽取一个容量为25的随机样本,样本均值的抽样分布为()
A N(17,4)
B N(10,2)
C N(17,2)
D N(10,1)
8、假设总体比例为0.4,采用重复抽样方法从中抽取一个容量为100的简单随机样本,则样本比例的分布为?
9、假设总体服从卡方分布,从该总体中抽取容量为100的样本,则样本均值的抽样分布()
A服从卡方分布B近似正态分布C二项分布 D F分布。