数理统计的基本概念80651
- 格式:ppt
- 大小:740.00 KB
- 文档页数:2
数理统计的基本概念6 数理统计的基本概念基本要求1 理解总体、样本(品)、样本容量、简单随机样本的概念。
能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。
2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。
3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。
4 理解样本均值、样本方差及样本矩的概念。
了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。
了解正态总体的某些常用抽样分布。
疑难解答1、采用抽样的方法推断总体,对样本应当有怎样的要求?答:为了对总体X的分布进行研究,逐个研究每个个体是不现实的。
采用抽样推断总体,其出发点是利用局部认识整体,因此抽出的样本要具有代表性。
即要求每个个体被抽取的机会均等,并且抽取一个个体后总体成分不变。
首先要求抽样具有“随机性”,第一次抽取的样品X1的可能取值应与总体的可能取值是完全一样的,且去取个个值的概率相同。
因此,X1是一个随机变量,并且是与X同分布的随机变量。
其次,应具有“独立性”,第一次抽样不改变总体成分,第二次抽取的样品X2可能的值也与X完全一样,且取值的概率也是相同的,因此X2也是与X同分布的一个随机变量且与X1是相互独立的,同样道理,X3,X4,…,X n都是与X同分布的随机变量,并且X1,X2,…,X n是一组相互独立的随机变量,故要求X1,X2,…,X n 是简单随机样本。
2、什么是简单随机样本?在实践中如何获得简单随机样本?答:设X1,X2,…,X n是来自总体X的容量为n的样本,如果它满足以下两个条件,则称它为简单随机样本:(1)X1,X2,…,X n与总体X具有相同的分布(2)X1,X2,…,X n相互独立由简单随机样本的定义知,用简单随机样本研究总体,可以更好地用概率论中独立条件下的一系列结论,正是这些结论为概率统计提供了必要的理论基础。
一般说来,对总体进行独立重复观测,便可以获得简单随机样本。
6数理统计的基本概念6.1 基本要求1 理解总体、样本(品)、样本容量、简单随机样本的概念。
能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。
2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。
3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。
4 理解样本均值、样本方差及样本矩的概念。
了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。
了解正态总体的某些常用抽样分布。
6.2 内容提要6.2.1 总体和样本1 总体和个体研究对象的某项特征指标值的全体称为总体(或母体),组成总体的每个元素称为个体。
总体是一个随机变量,常用X,Y等来表示。
2 样本从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。
3 简单随机样本设X1,X2,…,X n是来自总体X的容量为n 的样本,如果这n个随机变量X1,X2,…,X n相互独立且每个样品X i与总体X具有相同的分布,则称X1,X2,…,X n为总体X的简单随机样本。
4 样本的联合分布*该部分内容考研不作要求。
149150若总体X 具有分布函数F (x ),则样本(X 1,X 2,…,X n )的联合分布函数为∏==ni i n x F x x x F 121)(),,,(若总体X 为连续型随机变量,其概率密度函数为f (x ),则样本的联合概率密度为∏==ni in x f x x x f 121)(),,,( (6.1)若总体X 为离散型随机变量,其分布律为P {X =a i }=p i (i =1,2,…n),则样本的联合分布为∏======ni i i n n x X P x X x X x X P 12211}{},,,{ (6.2)其中),,,(21n x x x 为),,,(21n X X X 的任一组可能的观察值。
6.2.2 样本分布1 频率分布设样本值(x 1,x 2,…,x n )中不同的数值是x 1*,x 2*,…,x l *,记相应的频数分别为n 1,n 2,…,n l ,其中x 1*< x 2*<…< x l *且n n li i =∑=1。
第四节数理统计的基本概念数理统计是以概率论为理论基础的应用非常广泛的一个数学分支。
它是运用概率论的的知识,研究如何从试验资料出发,对随机变量的概率分布或某些特征(如数字特征)作出推断的一门学科。
数理统计的这种通过从局部观察去推断整体的方法具有普遍的意义,因此应用数理统计的方法,可以研究大量的自然现象和社会现象的规律性。
目前已应用于教育科学、工程技术、管理科学、自然科学以及社会科学等领域。
例如,教育科学中的教学质量的评估、预测以及试卷质量的评价、工业生产中的产品质量的控制与抽样检查、气象党的天气预报、地震学中的地震预报、医学中的疾病分析、药品疗效检验、农业生产中的产品估计与种子优选、人口学中的优生学和人口控制等等都渗透了数理统计的方法。
4.1总体与样本1.总体与个体在数理统计中,把研究对象的全体称为总体。
而把总体中的每一个对象称为个体。
例如,某厂生产一批电子元件共5000只,每只元件使用的寿命是一个随机变量X,故总体是指5000只电子元件的使用寿命,而个体则是每一只电子元件的使用寿命。
又如研究某市中学生身高时,该市中学生身高的全体就是总体,而个体就是每个学生的身高。
一般来说,对总体的研究,就是对相应的随机变量X的研究,因此,今后我们将总体与随机变量X等同起来,用随机变量X表示总体。
2.样本与样本值在数理统计学中,总是通过观测或试验以取得信息。
为了进行观测或试验,可以从客观存在的总体中按机会均等的原则随机地抽取一些个体,然后对这些个体进行观测或测试某一指标X的数值。
这样按机会均等的原则选取一些个体进行观测或测试的过程称为随机抽样。
用随机抽样的方法从总体X中随机抽取一个个体,就是对总体进行一次试验或观察,其结果是个随机变量,并且与总体X 有相同的分布。
在相同的条件下,对总体X 进行n 次重复的、独立的试或观察,即从总体中随机地抽取n 个个体,将n 次试验或观察得到的结果按次序记为n X X X ,,,21 ,它们都是随机变量,并且由于各次试验或观察是在相同的条件下进行的,所以有理由认为n X X X ,,,21 相互独立,并且都与总体X 具有相同的分布。
第一章 数理统计的基本概念数理统计与概率论一样,也是研究随机现象统计规律性的一门数学学科.概率论主要研究在已知随机变量服从某种分布的情况下,讨论随机变量的性质、数字特征、随机变量序列的极限等.但是,对实际问题中的一个随机变量来说,如何判断它服从某种分布,如果知道它服从某种分布,又该如何确定其中的参数,这些问题概率论都没有涉及,它们都是数理统计研究的内容.并且这些问题的研究都直接或间接建立在试验的基础上.数理统计学就是利用概率论的理论,对要研究的随机现象进行多次独立重复的观察或试验,研究如何合理地获得数据,如何对所获得的数据进行整理、分析,如何对关心的问题进行估计或推断的一门数学学科.数理统计由基本原理和应用方法两大内容组成.本章介绍数理统计的基本概念和抽样分布.§1.1 基本概念一、总体与样本用数理统计研究某个问题时,把研究对象的全体称为总体(或母体),而把每一个研究对象称为个体.例如,一批灯泡的全体就组成一个总体,其中每一个灯泡是一个个体.再例如,一群人(一个班或一个年级)的全体就组成一个总体,其中每一个人是一个个体.在数理统计中,我们关心的并不是组成总体的各个个体本身,而是与它们的性能相联系的某个数量指标或者多个数量指标.例如,在研究一批灯泡组成的总体时,可能关心的是灯泡的使用寿命这个数量指标.再例如,在研究一群组成的总体时,可能关心的是人的身高和体重等多个数量指标.因此,总体可以认为是研究对象的全体的一个或多个数量指标.在研究一批灯泡组成的总体时,可能关心的是灯泡的使用寿命的分布情况.由于任何一个灯泡的寿命事先是不能确定的.而每一个灯泡都确实对应着一个寿命值,所以我们可认为灯泡寿命是一个随机变量.也就是说,我们把总体与一个随机变量(如灯泡寿命)联系起来.因此,对总体的研究就转化为对表示总体的随机变量的统计规律的研究,所以,今后我们说到总体,指的是一个具有确定概率分布的随机变量(但它的分布又是未知的或至少分布的某些参数是未知的),而每个个体则是随机变量可能取的每一个数值.为了推断出这批灯泡的使用寿命的分布(或这批灯泡的次品率),最精确的办法就是把每个灯泡的使用寿命都测试出来.然而,寿命试验是破坏性试验,即使是非破坏性试验,考虑到试验要花费时间、人力和钱,我们只能从总体中抽取一部分(个个体)进行试验(称这个个体为容量是的样本),试验结果可得一组数值,其中是第i 个个体的试验结果,我们要根据这组数值对总体n n n ),,,(21n x x x L i x ξ进行推断,这样对试验的抽取方式就有一定的要求.首先,要求抽取必须是随机的,即每次每个个体被抽到的机会是等可能的,这样被抽到的个体才具有代表性,即每每次抽取的都具有总体的特征.其次,抽取必须是独立的、即每次抽取互不影响.也就是每次抽取后不能改变总的成分,这就要求.如果试验是非破坏性的,那么抽取时应该是有放回的;如果试验是破坏性的,那么总体应该是无限的.或是很大的.满足以上两个条件的抽取方式称为简单随机抽样.用简单随机抽样方法对—次抽取个个体的试验结果而言是一组数值,但是它又随着每次抽样的不同而变化,因此,实际上是维随机变量n ),,,(21n x x x L n ),,,(21n x x x L ),,,(21n ξξξL 的一次观察值.即在抽样试验之前,将要抽取的样本可以认为是维维随机变量n ),,,(21n ξξξL n ξξξ,,,21L .又因抽样具有代表性和独立性,所以是相互独立同分布随机变量,每个都与总体ξ同分布的.我们称),,,(21n ξξξL 为总体ξ的容量为的简单随机样本,简称为样本.抽样试验后的结果称为样本n ),,,(21n x x x L ),,,(21n ξξξL 的观察值.由所有样本值组成的集合ℵ称为样本空间.),,,(21n ξξξL 设总体ξ的分布函数,则)(x F ξ的联合分布函数为的样本,1x ),,,(),,(22112n n n x x x P x x F =ξ<ξ<ξ<L L .∏∏===<=ni i ni i ix F x P 11)()(ξ),,,(21n ξξξL )(x ϕξ为连续型随机变量,且有密度函数为.则其样本如果总体为n 维连续型随机变量,且联合密度函数为:∏==ni i n x x x x 121)(),,,(ϕϕL .i i p a P ==)(ξL ,2,1=i ξ为离散型随机变量,且分布律为,,则其样本如果总体),,,(21n ξξξL 为维离散型随机变量,且联合概率函数为:n ∏======ni i n n x P x x x P 12211)(),,,(ξξξξL ,其中,.L ,,21a a x i =n i ,,2,1L = 例1 设总体,求样本),(~2σμξN ),,,(21n ξξξL 的联合密度函数.),,,(21n ξξξL 解: 样本的联合密度函数为∏=−−=ni x i e12)(2221σμσπ∏==ni i n x x x x 121)(),,,(ϕϕL∑⎟⎠⎞⎜⎝⎛==−−ni i x n e122)(2121μσσπ. 例2 设总体),(~p N B ξ,即,,.求总体k N kk N p p C k P −−==)1()(ξN k ,,1,0L =),,,(21n ξξξL 10<<p ξ的联合分布律.的样本),,,(21n ξξξL 的联合分布律为解: 样本∏===ni i x P 1)(ξ),,,(2211n n x x x P ===ξξξL. ∏=−∑−∑===ni x N x nN x i ni ini iC p p111)1(∏=−−=ni x N x x Niii p p C 1)1(二、统计量从总体中抽出样本的观测值后,只是得到了一组静态的数据.对于这些数据要进行处理,才能解决我们所关心的问题.有时候我们可能只想估计出总体的期望或者方差,有时候我们可能想了解总体的分布,对于不同的问题,必须对数据进行不同的处理,这就需要构造样本的不同函数.样本的函数常称为统计量.),,,(21n T ξξξL n ξξξ,,,21L n ξξξ,,,21L ξ定义: 设为取自总体的一个样本,样本的函数,且不含未知参数,则称),,,(21n T ξξξL 为统计量.如果是样本),,,(21n x x x L ),,,(21n x x x T L ),,,(21n ξξξL 的一个观测值(观察值),则称是统计量),,,(21n T ξξξL 的一个观测值(观察值).例3 设总体,),(~2σμξN μ未知,为已知,2σ),,,(21n ξξξL ξ为的一个样本,则∑=n i i 121ξσ是统计量.而∑不是统计量.=−ni i12)(μξn ξξξ,,,21L 根据统计量的定义,它是随机变量的函数,因此统计量也是一个随机变量,它也有概率分布.统计量的分布称为抽样分布.但要注意,尽管一个统计量不合任何未知参数,但它的分布却可能含有未知参数.例4 设621,,,ξξξL 是来自),0(θ上的均匀分布的样本,0>θ未知.指出下列样本函数中哪些是统计量,哪些不是?为什么?66211ξξξ+++=L T θξ−=62T 163EX T −=ξ},,,max{6214ξξξL =T ,,,.解:和是,和不是.因为和中不含总体中的未知参数1T 4T 2T 1T 4T 3T θ,而和中含有未知参数2T 3T θ.常用统计量n ξξξ,,,21L ξ设为取自总体的一个样本,∑==+++=ni i n n n 1211)(1ξξξξξL (1)样本均值:;[]∑∑==−=−=−++−=n i i n i i n n n n S 1221222121)(1)()(1ξξξξξξξξL (2)样本方差:;∑∑==−−−=−−=n i i n i i n n n n S 122122*111)(11ξξξξ(3)修正样本方差:;∑=−=ni i n S 12)(1ξξ; (4)样本标准差:∑=−−=ni i n S 12*)(11ξξ(5)修正样本标准差:; ∑===n i ki kk n A 11ξξL ,2,1=k (6)样本k 阶原点矩: , ;∑=−=n i ki k n B 1(1ξξL ,3,2=k (7)样本k 阶中心矩: .,若是样本),,,(21n x x x L ),,,(21n ξξξL 的一组观测值,则∑=−=n i i x x n s 12)(1∑=−=n i i x x n s 122(1∑=−−=n i i x x n s 122*(11∑==n i i x n x 11、、、、∑=−−=n i i x x n s 12*)(11∑===n i k i kk x n x a 11∑=−=n i k i k x x n b 1)(1、、 分别是样本均值、样本方差、修正样本方差、样本标准差、修正样本标准差、样本k 阶原点矩、样本k 阶中心矩的.例5 从—批机器零件毛坯中随机招取8件,测得其重量(单位:kg)为230,243,185,240, 228,196,246,200.求样本均值、样本方差和样本二阶原点矩的观测值.221)200246196228240185243230(8111=+++++++==∑=n i i x n x 解:;[]25.495)221200()221243()221230(81)(1222122=−++−+−=−=∑=L n i i x x n s ;25.49336)200243230(811222122=+++==∑=L n i i x n x 。
数理统计的基本概念
1. 总体和样本:总体是研究对象的全体,样本是从总体中选取的一部分。
2. 参数和统计量:参数是总体的性质,统计量是样本的函数,用来估计总体的参数。
3. 随机变量和概率分布:随机变量是取值不确定的变量,概率分布是描述随机变量取值可能性的函数。
4. 分布特征:包括均值、方差、标准差、偏度和峰度等。
5. 假设检验:用样本的统计量推断总体参数的方法。
6. 置信区间:用来估计总体参数的区间,表示参数真值有一定概率落在该区间之内。
7. 方差分析:用来比较多组数据的差异来源和大小的方法。
8. 回归分析:用来研究自变量和因变量之间关系的方法。
第六章数理统计的基本概念一、教学要求1理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。
2. 了解一J分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。
3. 掌握正态总体的某些常用统计量的分布。
4 .了解最大次序统计量和最小次序统计量的分布。
本章重点:统计量的概念及其分布。
二、主要内容1. 总体与个体我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。
在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。
设x为总体的某个数值指标,常称这个总体为总体X。
X的分布函数称为总体分布函数。
当X为离散型随机变量时,称X的概率函数为总体概率函数。
当X为连续型随机变量时,称X的密度函数为总体密度函数。
当X服从正态分布'--时,称总体X为正态总体。
正态总体有以下三种类型:(1)“未知,但b已知;(2)丁未知,但-已知;(3)宀和’均未知。
2. 简单随机样本数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。
要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据兀、门宀-,这一过程称为抽样。
由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为J-" " ' ■■,n维随机向量(:「…J -)称为样本。
n称为样本容量。
(「匕…二)称为样本观测值。
如果样本满足(1)二:相互独立;(2)'-'-…■"服从相同的分布,即总体分布;则称'L)为简单随机样本。
简称样本。
设总体X的概率函数(密度函数)为「儿,贝U样本(二匚…凡)的联合概率函数(联合密度函数为)(i ) 样本均值: (2) 样本方差: Ri-L/3j-l Hi-1(3) 它们的观察值分别为:1 ”Ki-1Q = -2(^ -无『=-£x i -样本标准差:4炉=上丈可-尹这些观察值仍分别称为样本均值、样本方差和样本标准差。
数理统计的基本概念重点:总体,样本,统计量,三个重要抽样分布 难点:抽样分布.数理统计是运用概率论的知识,研究如何有效地对带有随机性影响的数据进行收集、整理、分析和推断的学科,由于随机性现象广泛存在于工、农业生产、工程技术、自然科学和社会科学等领域中,因此数理统计有着最广泛的应用。
一、总体和样本数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。
例如研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体。
在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X 。
在上例中,X 即指该批灯泡的寿命。
对不同的个体,X 的取值一般是不同的。
例如在试验中观察若干个个体就会得到X 的一种数值但在试验或观察之前,无法确定会得到一组什么样的数值,所以X 是一个随机变量或随机向量,而X 的分布也就完全描述了我们所关心的指标,即总体的分布。
为方便起见,以后我们将X 的可能取值的全体组成的集合称为总体,或直接称X 为总体,X 的分布也就是总体的分布。
总体分布一般是全部或部分未知的,为了研究总体X 的分布规律,从总体中随机地抽出若干个个体进行观察或实验,称为随机抽样观察,从总体中抽出的若干个个体称为样本,一般记为),,,(21n X X X 或n X X X ,,,21 ,n 称为样本容量。
而一次具体的观察结果),,,(21n x x x 是完全确定的一组数值,称为样本观测值,它随着每次抽样观察而改变。
因此,容量为n 的样本),,,(21n X X X 是n 维随机向量,而具体的观测值),,,(21n x x x 是随机变量),,,(21n X X X 的一个样本观测值。
随机抽样的目的是为了对总体X 的分布进行各种分析推断,所以要求抽取的样本能很好地反映总体的特性,为此我们要求随机抽取的样本),,,(21n X X X 满足:(1)具有代表性。