几个抽样分布的性质及其应用
- 格式:doc
- 大小:617.50 KB
- 文档页数:13
几个抽样分布的性质及其应用重庆师范大学涉外商贸学院数学与应用数学(师范)2008级阮国勇指导老师陈勇摘要在概率论中,我们是在随机变量的分布是假设已知的前提下去研究的;而数理统计中,随机变量的分布是未知或不完全知道。
我们通过对随机变量进行重复独立观察得到许多观察值,并对观察值的数据进行分析,从而对所研究的随机变量的分布做出推断。
本文介绍三种重要的抽样分布及其性质,并给出了抽样分布在参数估计、假设检验、分布拟合检验的简单应用。
χ分布;t分布;F分布关键词抽样分布;2Abstract In the theory of probability, we are in the distribution of random variable is assumed known base on the research, however,in the mathematical statistics, random variable distribution is unknown or incompletely known. we base on the random variables are independent observations are repeated many observed value, and the observation data analysis, to study the distribution of random variable to make inference. This paper introduces three kinds of important sampling distribution and its properties, and gives the sampling distribution in parameter estimation, hypothesis testing, fitting of distribution of the simple application.Key words sampling distribution, 2χdistribution, t distribution, F distribution第 1 页共 13 页目录1 引言 (4)2 几个有关概念2.1 总体、个体 (4)2.2 简单随机抽样 (4)2.3 统计量 (5)2.3.1 统计量的定义 (5)2.3.2 常用统计量 (5)2.4 自由度 (5)2.5 抽样分布 (6)3 常用抽样分布及其性质χ分布 (6)3.1 2χ分布的定义 (6)3.1.1 2χ分布的性质 (6)3.1.2 23.2 t分布 (7)3.2.1 t分布的定义 (7)3.2.2 t分布的性质 (7)3.3 F分布 (7)3.3.1 F分布的定义 (7)3.3.2 F分布的性质 (7)4 几个常用抽样分布的应用χ分布的应用 (8)4.1 2χ分布在参数估计中的应用 (8)4.1.1 2χ分布在假设检验中的应用 (8)4.1.2 2χ分布在分布拟合检验中的应用 (8)4.1.3 24.2 t分布的应用 (9)4.2.1 t分布在参数估计中的应用 (9)4.2.2 t分布在假设检验中的应用 (9)4.3 F分布的应用 (10)4.3.1 F分布在参数估计中的应用 (10)4.3.2 F分布在假设检验中的应用 (11)5 总结 (11)6 致谢 (12)7 参考文献 (13)1 引言数理统计中的统计估计与推断需要我们进行抽样估计,样本是统计估计和推断的依据,然而,在处理具体的理论与应用问题时,却很少直接利用样本,而利用他们经过适当处理导出来的量,这个量即统计量,统计量的分布称为抽样分布,三大分布都是在正态分布产生的,他们是正态总体统计估计和校验的基础。
抽样分布与理论分布一、抽样分布总体分布:总体中所有个体关于某个变量的取值所形成的分布。
样本分布:样本中所有个体关于某个变量大的取值所形成的分布。
抽样分布:样品统计量的概率分布,由样本统计量的所有可能取值和相应的概率组成。
即从容量为N 的总体中抽取容量为n 的样本最多可抽取m 个样本,m 个样本统计值形成的频率分布,即为抽样分布。
样本平均数的抽样分布:设变量X 是一个研究总体,具有平均数μ和方差σ2。
那么可以从中抽取样本而得到样本平均数x ,样本平均数是一个随机变量,其概率分布叫做样本平均数的抽样分布。
由样本平均数x 所构成的总体称为样本平均数的抽样总体。
它具有参数μx 和σ2x ,其中μx 为样本平均数抽样总体的平均数,σ2x 为样本平均数抽样总体的方差,σx 为样本平均数的标准差,简称标准误。
统计学上可以证明x 总体的两个参数 μx 和σ2x 与X 总体的两个参数μ和σ2有如下关系:μx = μ σ2x = σ2 /n由中心极限定理可以证明,无论总体是什么分布,如果总体的平均值μ和σ2都存在,当样本足够大时(n>30),样本平均值x 分布总是趋近于N (μ,n2)分布。
但在实际工作中,总体标准差σ往往是未知的,此时可用样本标准差S 估计σ。
于是,以nS估计σx ,记为X S ,称为样本标准误或均数标准误。
样本平均数差数的抽样分布:二、正态分布2.1 正态分布的定义:若连续型随机变量X 的概率密度函数是⎪⎭⎫ ⎝⎛--=σμπσx ex f 22121)( (-∞<x <+∞)则称随机变量X 服从平均数为μ、方差为σ2的正态分布,记作X~N (μ,σ2)。
相应的随机变量X 概率分布函数为 F (x )=⎰∞-x dx x f )(它反映了随机变量X 取值落在区间(-∞,x )的概率。
2.2 标准正态分布当正态分布的参数μ=0,σ2=1时,称随机变量X 服从标准正态分布,记作X~N (0,1)。
抽样分布样本统计量的分布及其应用在统计学中,抽样是一种数据分析的方法,它通过对总体中的一部分个体进行观察和测量来推断总体的特征。
而抽样分布是指抽取相同样本量的多个样本后得到的统计量的分布。
样本统计量是对样本数据进行计算得到的统计指标,它可以用来估计总体参数,并进行假设检验。
1. 抽样分布的基本概念抽样分布具有一些基本性质,首先是无偏性。
当样本容量趋向于总体容量时,样本统计量的期望值会无限接近总体参数的真实值。
其次是有效性,即样本统计量的方差趋近于零,它可以用来估计总体参数的精确度。
最后是一致性,样本统计量在样本容量逐渐增大时趋近于总体参数。
2. 抽样分布的常见形式常见的抽样分布有正态分布、t分布和卡方分布。
其中正态分布应用最为广泛,它在中心极限定理的作用下,当样本容量足够大时,样本均值的抽样分布近似服从正态分布。
而t分布则适用于当总体标准差未知、样本容量较小的情况下,它的形状比正态分布要略扁平一些。
卡方分布则主要用于样本方差的估计与检验。
3. 抽样分布的应用抽样分布的应用非常广泛,常用于以下几个方面:3.1 参数估计通过抽样分布,我们可以利用样本统计量对总体参数进行估计。
例如,可以利用样本均值估计总体均值,利用样本标准差估计总体标准差。
通过计算置信区间,我们可以得到对总体参数的范围估计。
3.2 假设检验假设检验是统计学中非常重要的一项工具,用于判断样本数据是否支持某个假设。
基于抽样分布,我们可以计算统计量的P值,进而判断样本数据与假设的一致性。
常用的假设检验有均值检验、方差检验、比例检验等。
3.3 质量控制在生产过程中,质量控制是非常关键的。
通过对样本数据进行分析,可以判断生产过程是否正常。
例如,可以通过控制图分析样本均值的变化情况,以判断过程是否处于控制状态。
3.4 统计决策在实际决策中,我们往往需要依据样本数据来进行判断。
抽样分布提供了一种基于统计的决策依据。
例如,在市场调研中,我们可以通过对样本数据进行分析,对市场潜力进行预测,从而指导营销策略的制定。
抽样与抽样分布抽样是统计学中一种重要的数据收集方法,通过从总体中选择一部分样本来代表整体,可以更方便、更经济地进行数据分析和推断。
而抽样分布则是与抽样密切相关的概念,指的是样本统计量的概率分布。
本文将从抽样的定义和目的、抽样方法和抽样分布的性质等方面进行探讨。
一、抽样的定义和目的抽样是统计学中利用一定的方法和技术从总体中选取一部分个体作为样本,以了解总体特征或者对总体进行推断的过程。
抽样的目的在于通过对样本的观测和研究来推断总体的特征,而无需对整个总体进行调查。
抽样可以减少调查或实验的成本、节约时间,并且在一定程度上能够保证结果的可靠性和精确度。
二、抽样方法1. 简单随机抽样:简单随机抽样是指从总体中随机选择样本,使每一个样本都有相同的概率被选中。
简单随机抽样通常需要使用随机数表、随机数发生器或者抽签等方法来实现。
2. 系统抽样:系统抽样是按照一定的规则和系统性地从总体中选择样本,例如每隔一个固定的间隔选取一个样本。
系统抽样的优点在于操作简单,但是如果总体中存在某种周期性或者规律性的分布,可能会导致抽样结果的偏差。
3. 整群抽样:整群抽样是将总体根据某些特征进行分类,然后从每个分类中随机选择一定数量的群体作为样本。
整群抽样适用于总体中存在明显的群体结构的情况,可以提高样本的代表性。
4. 分层抽样:分层抽样是按照某种特征将总体分为若干层,然后从每一层中随机选择一定数量的样本。
分层抽样可以更好地体现总体的结构和差异,提高样本的代表性和准确性。
三、抽样分布的性质抽样分布是样本统计量的概率分布,其具有以下几个重要性质:1. 无偏性:如果样本统计量的期望值等于总体参数的真值,那么称该统计量是无偏的。
即样本统计量是对总体参数的无偏估计。
无偏性是抽样分布的重要性质,保证了样本统计量的可靠性和准确性。
2. 一致性:当样本数量趋向无穷大时,样本统计量的值趋向于总体参数的真值。
即样本统计量在大样本情况下能够接近总体参数,具有一致性。
一、统计量和抽样分布的概念介绍1.1 统计量的定义讲解统计量的概念,即根据样本数据所定义的量,用来描述样本的某些特征。
例如,样本均值、样本方差等。
1.2 抽样分布的定义解释抽样分布是指在一定的抽样方法下,统计量的概率分布。
例如,正态分布、t分布等。
二、统计量的估计方法2.1 点估计介绍点估计的概念,即用一个具体的数值来估计总体参数。
例如,用样本均值来估计总体均值。
2.2 区间估计讲解区间估计的方法,即根据样本数据,给出总体参数估计的一个区间,该区间以一定的概率包含总体参数。
例如,置信区间。
三、抽样分布的性质及应用3.1 抽样分布的性质讲解抽样分布的一些基本性质,如独立性、对称性、无偏性等。
3.2 抽样分布的应用介绍抽样分布在实际问题中的应用,如利用抽样分布来判断总体均值的假设检验问题。
四、假设检验的基本概念和方法4.1 假设检验的定义解释假设检验是一种统计推断方法,通过观察样本数据,对总体参数的某个假设进行判断。
4.2 假设检验的方法讲解常见的假设检验方法,如单样本t检验、双样本t检验、卡方检验等。
4.3 假设检验的判断准则介绍假设检验的判断准则,如P值、显著性水平等,并解释其含义和作用。
六、正态分布及其应用6.1 正态分布的定义与性质详细介绍正态分布的概念、概率密度函数、累积分布函数以及其性质,如对称性、钟形曲线等。
6.2 标准正态分布解释标准正态分布的概念,即均值为0,标准差为1的正态分布。
讲解标准正态分布表的使用方法。
6.3 正态分布的应用介绍正态分布在实际问题中的应用,如利用正态分布来分析和估计总体均值、方差等参数。
七、t 分布及其应用7.1 t 分布的定义与性质讲解t 分布的概念、概率密度函数、累积分布函数以及其性质。
解释t 分布与正态分布的关系。
7.2 t 分布的自由度介绍t 分布的自由度概念,即样本量。
讲解自由度对t 分布形状的影响。
7.3 t 分布的应用介绍t 分布在实际问题中的应用,如利用t 分布进行小样本推断、假设检验等。
关于对统计推断中抽样分布的总结及判别统计推断是统计学中非常重要的一个概念,它主要是利用样本数据对总体参数进行推断,从而得出总体的性质。
而在统计推断中,抽样分布就是一个非常关键的概念。
抽样分布是指在统计推断中利用样本数据得到总体参数的分布。
了解抽样分布的性质和判别方法对于进行统计推断具有重要意义。
在本文中,我们将对抽样分布进行总结和判别,帮助大家更好地理解和应用统计推断的相关概念。
一、抽样分布的概念和性质1. 抽样分布的定义抽样分布是指在统计推断中利用样本数据对总体参数进行推断时得到的参数估计量的分布。
在进行统计推断时,我们通常无法获取整个总体的数据,而是通过抽样来获得部分样本数据,然后利用这些样本数据进行总体参数的估计。
而抽样分布就是描述这些参数估计量在不同样本中的分布情况。
(1)中心极限定理:中心极限定理是抽样分布的重要性质之一。
它指出,当样本容量足够大时,样本均值的抽样分布近似服从正态分布。
这意味着在进行统计推断时,我们可以利用正态分布的性质对样本均值进行推断,从而得出总体参数的估计。
(2)样本容量对抽样分布的影响:样本容量的大小对抽样分布具有重要影响。
通常情况下,样本容量越大,抽样分布越接近正态分布。
在进行统计推断时,我们通常会考虑样本容量的大小对结果的影响。
(3)抽样方式对抽样分布的影响:不同的抽样方式会对抽样分布产生影响。
简单随机抽样、分层抽样、整群抽样等不同的抽样方式会导致不同的抽样分布,因此在进行抽样时需要考虑抽样方式对结果的影响。
二、抽样分布的判别方法(1)利用直方图进行判别:直方图是描述抽样分布的一种常用方法。
通过绘制样本数据的直方图,我们可以直观地了解样本数据的分布情况,从而对抽样分布进行初步的判别。
2. 判别方法的选择在进行抽样分布的判别时,我们需要根据具体情况选择合适的方法。
不同的判别方法适用于不同的情况,因此在实际应用中需要根据实际情况选择合适的方法对抽样分布进行判别。
几个抽样分布的性质及其应用重庆师范大学涉外商贸学院数学与应用数学(师范)2008级阮国勇指导老师陈勇摘要在概率论中,我们是在随机变量的分布是假设已知的前提下去研究的;而数理统计中,随机变量的分布是未知或不完全知道。
我们通过对随机变量进行重复独立观察得到许多观察值,并对观察值的数据进行分析,从而对所研究的随机变量的分布做出推断。
本文介绍三种重要的抽样分布及其性质,并给出了抽样分布在参数估计、假设检验、分布拟合检验的简单应用。
χ分布;t分布;F分布关键词抽样分布;2Abstract In the theory of probability, we are in the distribution of random variable is assumed known base on the research, however,in the mathematical statistics, random variable distribution is unknown or incompletely known. we base on the random variables are independent observations are repeated many observed value, and the observation data analysis, to study the distribution of random variable to make inference. This paper introduces three kinds of important sampling distribution and its properties, and gives the sampling distribution in parameter estimation, hypothesis testing, fitting of distribution of the simple application.Key words sampling distribution, 2χdistribution, t distribution, F distribution第 1 页共 13 页目录1 引言 (4)2 几个有关概念2.1 总体、个体 (4)2.2 简单随机抽样 (4)2.3 统计量 (5)2.3.1 统计量的定义 (5)2.3.2 常用统计量 (5)2.4 自由度 (5)2.5 抽样分布 (6)3 常用抽样分布及其性质χ分布 (6)3.1 2χ分布的定义 (6)3.1.1 2χ分布的性质 (6)3.1.2 23.2 t分布 (7)3.2.1 t分布的定义 (7)3.2.2 t分布的性质 (7)3.3 F分布 (7)3.3.1 F分布的定义 (7)3.3.2 F分布的性质 (7)4 几个常用抽样分布的应用χ分布的应用 (8)4.1 2χ分布在参数估计中的应用 (8)4.1.1 2χ分布在假设检验中的应用 (8)4.1.2 2χ分布在分布拟合检验中的应用 (8)4.1.3 24.2 t分布的应用 (9)4.2.1 t分布在参数估计中的应用 (9)4.2.2 t分布在假设检验中的应用 (9)4.3 F分布的应用 (10)4.3.1 F分布在参数估计中的应用 (10)4.3.2 F分布在假设检验中的应用 (11)5 总结 (11)6 致谢 (12)7 参考文献 (13)1 引言数理统计中的统计估计与推断需要我们进行抽样估计,样本是统计估计和推断的依据,然而,在处理具体的理论与应用问题时,却很少直接利用样本,而利用他们经过适当处理导出来的量,这个量即统计量,统计量的分布称为抽样分布,三大分布都是在正态分布产生的,他们是正态总体统计估计和校验的基础。
我们研究抽样分布问题中会遇到这些问题:总体的分布类型已知,但总体中的一个或多个参数未知;总体的分布类型只知其形式,但不知总体中的参数;总体的分布类型完全未知,总体中的参数也未知。
本文对于这些问题我们用三大抽样分布有关知识去解决。
2 几个有关概念2.1 总体、个体在数理统计学中,我们把试验的全部可能的观察值称为总体;而把每一个可能观察值称为个体。
总体所含个体的数量称为容量,容量为有限的称为有限容量,容量为无限的称为无限容量。
例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究重庆师范大学涉外商贸学院男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。
2.2 简单随机样本设(n X X X ,,,21 )是来自总体X 的容量为n 的样本,若n X X X ,,,21 相互独立且与总体X 具有相同的概率分布,我们称(n X X X ,,,21 )为总体X 的一个简单随机样本。
获取简单随机样本的方法称为简单随机抽样。
具体的说,所谓简单随机抽样是指在抽样试验中,每个个体被抽到的机会是均等的,并且每次抽取后,总体的成分保持不变。
2.3 统计量2.3.1 统计量定义设(n X X X ,,,21 )是来自总体X 的一个样本,g (n X X X ,,,21 )是n X X X ,,,21 的函数,若g 为实值函数,且g 中不含任何未知参数,则称g (n X X X ,,,21 )是一个统计量。
2.3.2 常用统计量设(n X X X ,,,21 )是来自总体X 的一个样本,(n x x x ,,,21 )是相应的样本观察值。
定义:∑==ni iXnX 11为样本均值∑=--=ni i X X n S 122)(11为样本方差。
2S S =为样本标准差∑==ni k i k X n A 11,k =1,2,3……为样本的k 阶原点矩∑=-=n i k i k X X n B 1)(1,k =1,2,3……为样本值的k 阶中心矩它们的观察值分别为:∑==ni i x n x 11;2s =∑=-n i i x x n 12)(1;2s s =;∑==n i ki k x n a 11;∑=-=n i k i k x x n b 1)(1;k =1,2,3…;统计量是我们对总体的分布函数或数字特征进行统计推断的最重要的基本概念,统计量的分布称为抽样分布。
然而要求出一个统计量的精确分布是十分困难的。
而在实际问题中,大多总体都服从正态分布,本节介绍来自正态总体的几个常用统计量的分布。
2.4 自由度在统计推断中,我们把一群数据或观测值可以独立自由变动的数目称为自由度,用符号n 表示。
例如有5个测量值为8,12,6,10,14,其平均数为10,现将其中四个数任意变动,如8变成5,12变成7,6变成10,14变成16,均数仍为10,那么10还能随意变动吗?显然不能,这时它因其它四个数的变化而成为定值12。
所以说均数一定时,上述观测值的标准差只有4个数可以独立自由地变化,有一个数因其他数的变化而被固定下来不能任意地变动。
2.5 抽样分布抽样分布是样本及统计量的分布。
具体的说,从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n 的所有可能的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布。
统计量是样本的函数,它是一个随机变量。
统计量的分布称为抽样分布。
常用的抽样分布除了正态分布,还有t 分布、2χ分布、F 分布等。
3 常用抽样分布及其性质在数理统计中,本文讲解三大抽样分布:t 分布、2χ分布和F 分布。
以下就这三个分布一一介绍:3.1 2χ分布3.1.1 2χ分布 定义设(n X X X ,,,21 )是来自总体),(N ~X 10 的一个样本,则称统计量:∑==ni i X 122χ所服从的分布是自由度为n (n 指上式中所含独立变量的个数)的2χ分布。
记作:)n (~22χχ3.1.2 2χ分布的性质 性质1:2χ分布的可加性:设)(~1221n χχ,)(~2222n χχ,且21χ与22χ相互独立,则:21χ+~22χ)(212n n +χ 性质2:若)(~22n χχ,则:n E =χ)(2,n D 2)(2=χ,性质3:设(n X X X ,,,21 )为来自总体),(~2σμN X 的一个样本,μ,2σ为已知常数,则:统计量)(~22n χχ (当μ=0时也成立)样本均值X 与样本方差2S 相互独立,则统计量:)1(~)1(222--n Sn χσ。
3.2 t 分布3.2.1 t 分布的定义设)1,0(~N X ,)(~2n Y χ,且X 与Y 相互独立,则称随机变量:nY Xt =所服从的分布是自由度为n 的t 分布,记为)(~n t t ,t 分布又称为学生氏(Student )分布。
3.2.2 t 分布的性质性质1:t 分布图像关于x =0对称;性质2:t 分布图像在x =0达最大值; 性质3:t 分布图像以x 轴为水平渐近线; 性质4:当∞→n 时,t 分布)1,0(N →,3.3 F 分布3.3.1 F 分布定义设,)(~12n U χ)(~22n V χ,且U 与V 相互独立,则称随机变量21n V n U F =所服从的分布是自由度为),(21n n 的F 分布,记作:),(~21n n F F , 其中:1n 为第一自由度,2n 为第二自由度。
3.3.2 F 分布的性质性质1:密度曲线不对称;性质2:若)(~),(~2222n x Ym x X σσ,且X 与Y 独立,则:),(~n m F F nY m X=;性质3:若),(~n m F F ,则),(~1m n F F; 性质4:设(m X X X ,,,21 )是来自总体),(~211σμN X 的一个样本,(),,,21n Y Y Y 是来自总体),(~222σμN Y 的一个样本,且它们是相互独立,则)1,1(~22212122--σσ=n m F S S F4 几个常用抽样分布的应用在数理统计中,抽样分布具有广泛的应用,抽样分布在参数估计、假设检验、分布拟合检验、方差分析和回归分析中的应用,以下简介抽样分布在参数估计、假设检验、分布拟合检验中的简单应用:4.1 2χ分布的简单应用4.1.1 2χ分布在参数估计中的应用 设总体2~(,)x N μσ,则统计量()2221σχS n -=服从自由度为1-n 的2χ分布,即()()1~12222--=n S n χσχ可得到总体方差2σ的置信水平为 α-1 的置信区间为 ()()()()⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⋅--⋅--11112212222n S n n S n ααχχ, 4.1.2 2χ分布在参数假设检验中的应用我们知道,设总体2~(,)x N μσ,关于2σ假设检验问题:0H :202σσ=,221:σσ≠H 。