当前位置:文档之家› 数理统计的基本概念汇总

数理统计的基本概念汇总

数理统计的基本概念汇总
数理统计的基本概念汇总

6数理统计的基本概念

6.1 基本要求

1 理解总体、样本(品)、样本容量、简单随机样本的概念。能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。

2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。

3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。

4 理解样本均值、样本方差及样本矩的概念。了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。了解正态总体的某些常用抽样分布。

6.2 内容提要

6.2.1 总体和样本

1 总体和个体研究对象的某项特征指标值的全体称为总体(或母体),组成总体的每个元素称为个体。总体是一个随机变量,常用X,Y等来表示。

2 样本从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。

3 简单随机样本设X1,X2,…,X n是来自总体X的容量为n 的样本,如果这n个随机变量X1,X2,…,X n相互独立且每个样品X i与总体X具有相同的分布,则称X1,X2,…,X n为总体X的简单随机样本。

4 样本的联合分布

*该部分内容考研不作要求。

149

150

若总体X 具有分布函数F (x ),则样本(X 1,X 2,…,X n )的联合分布函数为

∏==n

i i n x F x x x F 1

21)

(),,,(

若总体X 为连续型随机变量,其概率密度函数为f (x ),则样本的联合概率密度为

∏==

n

i i

n x f x x x f 1

21)

(),,,( (6.1)

若总体X 为离散型随机变量,其分布律为P {X =a i }=p i (i =1,2,…n),则样本的联合分布为

∏======n

i i i n n x X P x X x X x X P 1

2211}

{},,,{ (6.2)

其中),,,(21n x x x 为),,,(21n X X X 的任一组可能的观察值。 6.2.2 样本分布

1 频率分布

设样本值(x 1,x 2,…,x n )中不同的数值是x 1*,x 2*,…,x l *,记相应的频数分别为n 1,n 2,…,n l ,其中

x 1*

< x 2*

<…< x l *且

n n l

i i =∑=1

则样本的频数分布及频率分布可由表6-1给出。

151

2 经验分布函数

定义 设(X 1,X 2,…,X n )为总体X 的一个样本,其样本值为(x 1,x 2,…,x n ),则称函数

)

(}

,,,{)(21+∞<<-∞=

x n

x x x x F x n n 的个数中小于或等于

为样本值(x 1,x 2,…,x n )的经验分布函数。

则经验分布函数

??

?

????≥-=<≤++<=+.1)1,,2,1(,,,,0)(**1*1*

1l i i i

n x x l i x x x n n n x x x F (6.3)

6.2.3 几个重要分布及临界值

1.2

χ分布 设X 1,X 2,…,X n 是相互独立的随机变量,且X i ~N (0,1) (i =1,2,…,n ),则称随机变量

∑==+++=n

i i n

X X X X 1

2222

21

2

χ

152

服从自由度为n 的2χ分布,简记为2χ~2χ(n )。

2 2χ分布的性质:

(1)设2χ~2χ(n ),则n E =2χ, n D 22=χ

(2)设)(~121n Y χ,)(~222n Y χ,且Y 1,Y 2相互独立,则有

)(~21221n n Y Y ++χ

3.t 分布 设)1,0(~N X ,)(~2n Y χ,且X ,Y 相互独立,

则称随机变量

n Y X T /=

服从自由度为n 的t 分布,或称学生氏(Student )分布,简记为T ~t (n )。

4.t 分布的性质 (1) )2(2

))((,0))((>-=

=n n n

n t D n t E (2) 2

221

)(lim x n e

x f -

→=

π

;这里f (x )为t 分布的概率密度函数。

5.F 分布 设)(~2m X χ,)(~2

n Y χ,且X ,Y 相互独立,

则称随机变量

n Y m X F //=

所服从的分布是自由度为m ,n 的F 分布,简记为F ~F (m ,n )。

6.F 分布的性质 (1) 若),,(~n m F X 则

(2) )4()

4()2()

422(),2(22

2>---+=>-=n n n m n m n DX n n n EX (2) 若F ~F (m ,n ),则),(~1

m n F F

153

7.临界值

(1) 标准正态分布的临界值 设X ~N (0,1),对给定的正数α

)10(<<α,若存在实数αz 满足

α

π

α

α==

>?∞

+-

z t dt e

z X P 2

2

21

}{

则称点αz 为标准正态分布X 的α临界值 (或称上α分位点或分位数)。

由α

α-=Φ1)(z ,

若已知α)5.00(≤≤α,可通过反查标准正态分布表,求出α临界值αz 。当5.0>α时,表中无法查出,此时查表αα=Φ-)(1z ,再由αα--=1z z 可求得临界值αz 。

(2)2χ分布的临界值 设)(~

22n χχ,概率密度为f (x )。对给定

的数α(0<α<1),若存在实数)(2

n αχ满足

α

χχαχα==>?+∞

dx x f n P n )

(2

22

)()}({

则称数)(2n αχ为2

χ分布的α临界值。已知n ,α,通过查2

χ分布

表可求得

)(2n αχ。当n >45时,可利用近似公式:

,)12(21

)(22

-+≈

n z n ααχ

这里αz 是标准正态分布的临界值。 (3) t 分布的临界值 设T ~t (n ),概率密度为f (x )。对给定的α(0

<α<1)。若存在实数)(n t α满足

α

αα==>?∞

+)

()()}({n t

x f n t T P

则称点)(n t α为t 分布的α临界值。已知n ,α,通过查t 分布表可求

得)(n t α。

注:1) 类似标准正态分布临界值的性质,对t 分布亦有:

)()(1n t n t αα--=;

154

2) 当n >45时,可用正态分布近似 ααz n t ≈)(。

(4) F 分布的临界值 设F ~F (m , n ),概率密度为f (x )。对给定的α(0<α<1),若存在实数αF (m ,n )满足

α

αα==>?+∞

dx x f n m F F P n m F

)

,()()},({

则称数αF (m ,n )为F 分布的α临界值。注意公式

=

-),(1n m F α)

,(1

m n F α

6.2.4 统计量及样本矩

1.统计量 设(X 1,X 2,…,X n )为总体X 的一个样本,?(X 1,X 2,…,X n )是X 1,X 2,…,X n 的函数,若?是连续函数且不含末知参数,则称?(X 1,X 2,…,X n )是一个统计量。

2.几个常用的统计量——样本矩 (1)样本均值 ∑==n

i i X n X 1

1。

(2)样本方差

21

2

)(11X X n S i n i --=∑=。 (3)样本标准差 21

)(11X X n S i n

i --=∑=。 (4)样本k 阶原点矩 ,2,1,11==∑=k X n A n i k

i k 。

(5)样本k 阶中心矩 ,2,1,)(11

=-=∑=k X X n B k i n

i k 。

3 样本矩与总体矩的关系

由样本的独立性及与总体同分布这一特性出发,运用数字特征的

运算法则,可得:若总体X 的期望、方差存在,即μ=EX ,

2

σ=DX ,

155

又(X 1,X 2,…,X n )是取自总体X 的一个样本,则

μ=X E ,n

X D 2

σ=

;2

2σ=ES ,2

21σn

n EB -=

。 (6.4) 上述结论无论总体服从什么样的分布都正确,故它是计算任意总体,特别是非正态总体的样本均值X 和样本方差2

S 的期望、方差的常用结论。

6.2.5 正态总体样本均值和样本方差的分布

1. 设总体X ~N (2

,σμ),(n X X ,,1 )为样本,为样本均值,

2S 为样本方差

(1) X ~),

(2

n

N σμ,或

n

X /σμ

-~N (0,1); (6.5)

(2)

)(~)(22

1

2

n X

n

i i

χσ

μ∑=- (6.6)

(3)

)1(~))1(~)1(22

12

2

2

2

----∑

=n X X n S n n

i i

χσ

χσ

(或

, (6.7)

(4) 样本均值X 与样本方差2

S 相互独立;

(5)

n

S X /μ

-~)1(-n t (6.8)

2.设(1,,1n X X )是取自总体X 的一个样本,(2,,1n Y Y )是取

自总体Y 的一个样本,且这两个样本相互独立,即假定1,,1n X X ,

2,,1n Y Y 是n 1+n 2个相互独立的随机变量。

若总体X ~N (2

11,σμ),Y ~N (2

22,σμ),则有

156

1)

2

22

1

21

21)

()(n n Y X σ

σ

μμ+

---~N (0,1); (6.9)

2)2

2

222121//σσS S ~F (n 1-1,n 2-1); (6.10) 3)当22

221σσσ==时,有

2

12111)()(n n S Y X W +?

---μμ~t (n 1+n 2-2); (6.11)

其中∑=--=11212

1

)(11n i i X X n S ,∑=--=21

222

2)(11n i i Y Y n S ,2)1()1(212

2

22112

-+-+-=

n n S n S n S W

。 6.3 典型例题分析

已知总体,求样本的联合分布

例1.设(X 1,X 2,…,X n )是取自总体X 的一个样本。试在下列三种情况下,分别写出样本(X 1,X 2,…,X n )的联合分布律或联合概率密度。

(1)X ~B (1,p );(2)X 服从参数为λ的指数分布;(3)X 服从(0,θ)(θ>0)上的均匀分布。

分析: 解此类题先写出总体X 的分布律(或概率密度);再由X i 与X 有相同的分布以及X i 之间的相互独立性,由式(6.1),(6.2)即可写出样本(X 1,X 2,…,X n )的联合分布律或联合概率密度。

解:(1) 因为总体分布律为1,0)

1(}{1=-==-k p p k X P k

k

157

于是1,0,)1(}{1=-==-i k k i i k p p k X P i i 样本),,,(21n X X X 的联合分布律为:

n

i k p p

k X P k X P k X P k X k X k X P i k n k n n n n n

i i

n

i i

,,2,1,1,0)

1(}{}{}{}

,,,{1

1

22112211 ==-==??=?=====∑∑

==-

(2) 因为总体概率密度函数为:???≤>=-0,

00

,)(x x e x f x λλ

所以,每一个样本i X 的概率密度为:

n i x x e x f i i x i i ,,2,1;0,

00

,)( =???≤>=-λλ

故样本),,,(21n X X X 的联合概率密度为:

n

i x x e x f x f x f x x x f i i x n

n n n

i i ,,2,1;

0,00,)()()(),,,(12121 =??

???≤>=???=∑=-λλ (3)因为总体概率密度函数为:?????<<=其它,

00,1

)(θ

θx x f

所以样本X i 的概率密度为

158

?????<<=其它,

00,1

)(θθi i x x f

故,样本),,,(21n X X X 的联合概率密度为:

n i x x f x x x f i n n

i i n ,,2,1;,

00,)(),,,(121 =??

?<<==-=∏其它θ

θ

例2.设X ~N (2,σμ),(X 1,X 2,X 3)为来自总体X 的一个样本。试求样本(X 1,X 2,X 3)的联合概率密度和样本均值X 的概率密度函数。

解: 由于+∞<<∞-=

--

x e

x f x ,21)(22)(σμσ

π

3

,2,1;,)

2(1),(3

1

2

)(213

3,21=+∞<<∞-=

∑=--

i x e

x x x f i x i i μσσπ

又因为)3

,

(~2

σμN X ,所以,X 的概率密度函数为:

+∞<<∞-=

--

x e

x g x ,23)(22)(3σμσ

π

注: 此题用到结论:若),(~2

σμN X ,则),

(~2

n

N X σμ。这一结

果有十分广泛的应用。

159

例3.设总体服从泊松分布)(~λπX ,),,,(21n X X X 是来自总体的简单随机样本

(1) 计算)()(),(2S E X D X E 和;

(2) 若容量为10的一组样本观察值为(1,2,4,3,3,4,

5,6,4,8),试计算样本均值,样本方差和经验分布函数。

解: (1)解法一 由(6.4)式,因为

)(~λπX ,于是

λ

==)()(X D X E ,故

n

X D X E λ

λ=

=)(,,

λ=2

ES 解法二 λλπ==i i i DX EX X 所以因为),(~

故 λλ=?=??

? ??=??????=∑∑==n n EX n X n E X E n i i n i i 1

1)(111

n

DX n X n D X D n i i n i i λ=??? ??=??????=∑∑==1211)(1

??

? ??--=??????--=∑∑==n i i n i i X n X E n X X E n S E 122122

11)(11)(

??

????--=∑=)()(11212X nE X E n n i i

160

λλλλλ=+-+-=??????+-+-=∑=)()([1

1])([])([1122122n n n n X E X D n EX DX n n i i i

(2)410110

1

==∑=i i x x ,

4]10[91)(91210121012

2

=-=-=∑∑==i i i i i i x x x x s

又X 的频率分布表为

所以,经验分布函数为

??????

??????

?≥<≤<≤<≤<≤<≤<≤<=8

18610965108541074

310

4321022110110)(10x x x x x x x x x F

161

注: (1)解法一直接运用样本矩与总体矩之间的关系,即(6.4)式求得; 解法二运用样本与总体同分布的特性及数字特征的运算法则求得。 (2)写经验分布函数,可先列出频率分布表,这样不至遗漏或出错。

例4 设总体的概率密度为X

,,0;1|||,|)(?

??<=其它x x x f

),,,(5021X X X 为样本。试求:

(1)X 数学期望与方差,22,B S 的数学期望;(2)

{}

02.0||>X P 。

解: 计算总体X 的数学期望和方差 故(1)1001)(,02

=

=

=n

X D X E σ,

100

491,212222=-==

=σσn n EB ES 。 (2)因为)1001,0(~

N X ?→?

,所以 {}{}

8414

.0)2.0(222.0101102.0||102.0||=Φ-=???

?

??????≤-≈≤-=>X P X P X P

注:当总体的期望和方差不能直接写出时,要先求总体的期望和方差,再求2

1||)

()(;0||1

1

22

2

2

1

1

=

=

-===?==?

?--dx x x EX X E DX dx x x EX σμ

162

样本均值X 、样本方差2

S 及样本二阶中心矩2B 的期望和方差。另外,要注意

2S 与2B 之间的差异。由于22σ=ES ,即2S 是总体方差的无偏估计,而

221σn

n EB -=

不是总体方差2

σ的无偏估计,因此,一般都是以2S 作为方差2

σ的估计量。但

22

21lim

lim σσ=-=∞→∞

→n

n EB n n ,故当样本容量很大时,

2S 和2B 两者相差很小,此时亦可用2B 来估计总体方差2

σ。因此,有时把2

B 称为大样本方差,而2

S 有的书上也称为样本修正方差。

本题(2)的解答用到了中心极限定理。由中心极限定理可得,不论总体服从什么分布,只要知道总体的数学期望μ=EX ,方差2σ=DX ,则样本均

X 的渐近分布就为正态分布),

(2

n

N σμ。即

)(),

(2

~

∞→?→?n n

N X σμ

由此可知

)1,0(~

N n X ?→?-σμ

求样本均值落在某个区间内的概率,就可以利用上述结论近似计算,这是很重要的结论。

*例 5 设),,,(4321X X X X 是来自正态总体)2,0(~2N X 的简单样

本,且

,

)43()2(243221X X b X X a -+-=η则当

163

)(

,)(

==b a 时,统计量η服从χ2-分布,其自由度为( )。

解:

解法1 ,)]43([)]2([243221X X b X X a -+-=η令

),43(),2(432211X X b X X a -=-=ηη则2221ηηη+=

欲使)2(~

2χη,就必须使)1,0(~),1,0(~21N N ηη,由于

44321====DX DX DX DX 04321====EX EX EX EX

于是021==ηηE E

a a aDX aDX X X a D D 20)444(4))2((21211=?+=+=-=η

b b b D X b D X X X b D D 100

)41649(169))43((4

3432=?+?=+=-=η

令1,121==ηηD D ,则 100

1

,201==

b a ,此时2),2(~2=n 自由度χη。

解法2 由于)4,3,2,1()2,0(~2=i N X i 且相互独立,则

100

)43(,0)43(20

)2(,0)2(43432121=-=-=-=-X X D X X E X X D X X E

从而

)100,0(~43),20,0(~24321N X X N X X --

所以

164

)1,0(~100

43),

1,0(~20

24

32

1N X X N X X --

为使

,)2(~)143(

)12(

224

3221χηb

X X a

X X -+-=

必须使

,)1,0(~143),

1,0(~1

24

321N b

X X N a

X X --

同上面两个服从正态分布的随机变量比较可知

1001,201==b a 即 100

1,201==

b a 。 注:本题虽用了两种不同的解法,但目的相同且明确,即由-2

χ分布的定义并

由η构成的特点,应选择恰当的a,b 使η恰为两个标准正态分布的平方和。

*例6 设921,,,X X X 是来自正态总体X ),(~2σμN 的一个简单随机样本,

)(3

1

),(6198726211X X X Y X X X Y ++=+++=

∑=-=9

7

222

)(21i i Y X S ,S

Y Y T )

(221-=

证明:统计量T 服从自由度为2的t -分布.。

证明: 由于),,(~),

,(~22

σμσμN X N X i 从而

),3

,

(~),6

,

(~2

22

1σμσμN Y N Y

165

所以

),3,

(~2

2σμ--N Y

故 )2

,

0(~),3

6

,0(~2

212

2

21σσσN Y Y N Y Y -+

-即

于是

)1,0(~22

212

1N Y Y Y Y σ

σ)

(-=

-

又因为

)2(~222

2

χσ

S ,且独立,与,与独立与212122,S Y Y Y S Y 所以

独立。与221S Y Y -从而σ)(221Y Y -与222σS 独立。于是由t 分布的定义知

)2(~2

)2()(2)

(22

2

2121t S Y Y S

Y Y T σσ-=-=

注: 本题的关键是熟练掌握t 分布的定义及正态总体下样本均值、样本方差的分布:

n

X /σμ

-~N (0,1),

)1(~)1(22

2

--n S n χσ

例7.已知X ~)(n t 。证明2

X ~F (1,n )。 证明: 因为 )(~n t X , 即 n

Y Y X 21

=

, 其中 )(~),1,0(~2

21n Y N Y χ,又n

Y Y

X 22

12

=, 而 )(~),1(~22221n Y Y χχ

166

故由F -分布的定义知: ),1(~2n F X

注: 本题解答看似简单,但本章所学的三个分布都涉及到。因而了解证明过程中每一步的来龙去脉,对于熟悉、掌握有关随机变量及其分布是一项基础性训练。

例8.设(X 1,X 2,…,X n )是来自正态总体N (0,1)的样本。试

求统计量21

21)(1

)(1∑∑+==-+n m i i m i i X m n X m (m

解 因为)1,0(~N X i 所以

),0(~1

m N X

m

i i

∑=, 故

)1,0(~1

1

N X m

m

i i

∑=

同理

)1,0(~1

1

N X

m n n

m i i

∑+=-

于是 )2(~)(1)(1221

2

1χ∑∑+==-+n m i i m i i X m n X m

例9.设(X 1,…,X 5)是来自正态总体N (2,0σ)的一个样本。试证:

(1)当2

3

=k 时,252423221)(X X X X X k +++?~F (1,3); (2)当23=k 时,25

24232

1X X X X X k +++?~t (3)。

解 (1)

167

5

,4,3),1,0(~),

1,0(~2),,0(~2

12=+i N X N X X N X i

i σ

σ

σ所以因为

于是)3(~)

(),

1(~)2(22

5

3

22

21χσχσ

∑=+i i

X X X

由F -分布的定义,即得:)3,1(~)(23

2

5

2423221F X X X X X +++? (2) 据(1)的分析,

),

1,0(~22

1N X X σ

+因为)3(~)

(22

5

3

χσ∑=i i

X

由t -分布的定义即得结论。

注: 本题仍是关于F -分布和t -分布的基础训练题。

例10 设721,,,X X X 为总体)5.0,0(~2

N X 的一个样本,求

?

?????>∑=4712i i X P 。 解: 因为

所以)1,0(~25.0),5.0,0(~2

N X X N X i i i = )7(~427

1

2χ∑=i i

X

于是 {}

16)7(16442712712>=?

??

???>=??????>∑∑==χP X P X P i i i i ,

168

由-2χ分布临界值的定义,查表可知013.16)7(2

025.0=χ,故

025.04712≈?

??

???>∑=i i X P 。 注: 本题由于出现了随机变量的平方和,故在寻找

∑=7

1

2

i i

X

的分布时自然

想到-2

χ

分布。但-2χ分布中的i X 均服从N (0,1),所以只要将此处的i

X 标准化即可。由临界值的定义αχχ

α=≥})({2

2

n P ,一般查表是已知α,找

临界值2

αχ,而此处则相反,是已知临界值2

αχ找α,故得到的是近似值。

*例11 从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间(1.4,5.4)内的概率不小于0.95,问样本容量n 至少应取多少?

解 : 设正态总体为X ,则)6,4.3(~N X ,从而由(6.5)式得

)

1,0(6

4.3~N n

X ?→?-

所以

数理统计的基本概念知识点

10 06 数理统计的基本概念 知识网络图 正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→???? ?????????????? 主要内容 一、样本 我们把从总体中抽取的部分样品n x x x ,,,21Λ称为样本。样本中所含的样品数称为样本容量,一般用n 表示。在一般情况下,总是把样本看成是n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,n x x x ,,,21Λ表示n 个随机变量(样本);在具体的一次抽取之后,n x x x ,,,21Λ表示n 个具体的数值(样本值)。我们称之为样本的两重性。 二、.统计量 1.定义:称不含未知参数的样本的函数),,,(21n X X X f Λ为统计量 2.常用统计量 样本均值 .11 ∑==n i i x n x 样本方差 ∑=--=n i i x x n S 122.)(11 样本标准差 .)(111 2∑=--=n i i x x n S 样本k 阶原点矩 ∑===n i k i k k x n A 1 .,2,1,1Λ 样本k 阶中心矩

∑==-=n i k i k k x x n B 1 .,3,2,)(1Λ μ=)(X E ,n X D 2 )(σ=, 22)(σ=S E ,221)(σn n B E -=, 其中∑=-=n i i X X n B 1 22)(1,为二阶中心矩。 三、抽样分布 1.常用统计量分布 (1)设n X X X ,,,21Λ是相互独立的随机变量,且均服从与标准正态分布)1,0(N ,则222212n n X X X X Λ++=,服从自由度为n 的-2χ分布,记为()n 2~χχ. (2)设()()n Y N X 2~,1,0~χ,且X 与Y 相互独立,则.n Y X T =服从自由度为n 的-t 分 布,记为()n t T ~. (3)设X 与Y 相互独立,分别服从自由度为1n 和2n 的-2χ分布,则1 22 1n n Y X n Y n X F ?==。服从自由度为()21,n n 的-F 分布,记为()21,~n n F F 2.正态总体场合 设n X X X ,,,21Λ是从正态总体()2,σμN 中抽取的一个样本,记 ()2 1211,1∑∑==-==n i i n n i i X X n S X n X ,则 (1);,~2??? ? ??n N X σμ (2)X 与2 n S 相互独立. (3)()()1~1222 --n S n χσ;或()1~)(2212 --∑=n X X n i i χσ

统计学中的基本概念

1、2 统计学得几个基本概念 1、2、1 总体与总体单位 1、总体 (1)总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体; 在统计研究过程当中,统计研究得目得与任务居于支配与主导得地位,有什么样得研究目得就应该有什么样得统计总体与之相适应。例如:要研究我们学院教师得工资情况,那么全体教师就就是研究得总体,其中得每一位教师就就是总体单位;如果要了解某班50个学生得学习情况,则总体就就是该班得50名学生,每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 (2)总体得分类: 总体根据总体单位就是否可以计量分为有限总体与无限总体: ★有限总体:指所包含得单位数就是有限得总体。 如一个企业得全体职工、一个国家得全部人口等都就是有限总体; ★无限总体:指所包含得单位数目就是无限得,或准确度量它得单位数就是不经济或没有必要得,这样得总体称为无限总体。 如企业生产中连续生产得大量产品,江河湖海中生长得鱼得尾数等等。 划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体得特征: ★大量性:就是指构成总体得单位数要足够得多,总体应由大量得单位所构成。大量性就是对统计总体得基本要求。 个别单位得现象或表现有很大得偶然性,而大量单位得现象综合

则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多,才能准确地反应我们要研究得总体得特征,达到我们得研究目得。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性就是构成统计总体得前提条件。 ★变异性:即构成总体得各个单位除了至少在某一方面具有共同性质外,在其她方面具有一定得差异。差异性就是统计研究得主要内容。 如以一个班级得所有学生作为一个总体,则“专业”就是该总体得同质性,而“性别”、“籍贯”等则就是个体之间得变异性;以我院全体教师为一个总体,则“工作单位”就是其同质性,而“学历”、“月工资”等则就是它得变异性。 需要特别说明得三个问题: ★变异就是客观存在得,没有变异得事物就是不存在得; ★变异对于统计非常重要,没有变异就没有统计。这就是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位得资料就可以推断总体情况了; ★变异性与同质性之间相互联系、相互补充,就是辩证统一得关系。用同质性否定变异性或用变异性否定同质性都就是错误得。 2、总体单位 就是构成总体得每一个个体。 【思维动起来】 对2015年10月份某市小学生得近视情况进行调查: 统计总体就是什么?总体单位就是什么? 总体得同质性就是什么?变异性就是什么? 3、总体与总体单位得关系 在统计研究中,确定统计总体与总体单位就是十分重要得,它决定于统计研究目得与认识对象得性质。在一次特定范围、目得得统计研究中,统计总体与总体单位就是不容混淆得,二者得含义就是确切得,

统计学中的基本概念

1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么?总体单位是什么? 总体的同质性是什么?变异性是什么? 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

第六章数理统计学的基本概念

第六章数理统计的基本概念 一、教学要求 1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。 2.了解分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。 3.掌握正态总体的某些常用统计量的分布。 4.了解最大次序统计量和最小次序统计量的分布。 本章重点:统计量的概念及其分布。 二、主要内容 1.总体与个体 我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体密度函数。当X服从 正态分布时,称总体X为正态总体。正态总体有以下三种类型: (1)未知,但已知; (2)未知,但已知; (3)和均未知。 2.简单随机样本 数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据,这一过程称为抽样。由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。n称为样本容量。()称为样本观测值。 如果样本()满足 (1)相互独立; (2) 服从相同的分布,即总体分布; 则称()为简单随机样本。简称样本。 设总体X的概率函数(密度函数)为,则样本()的联合概率函数(联合密度函数为)

3. 统计量 完全由样本确定的量,是样本的函数。即:设是来自总体X 的一个样本,是一个n元函数,如果中不含任何总体的未知参数,则称为一个统计量,经过抽样后得到一组样本观测值,则称为统计量观测值或统计量值。 4. 常用统计量 (1)样本均值: (2)样本方差: (3)样本标准差: 它们的观察值分别为: 这些观察值仍分别称为样本均值、样本方差和样本标准差。 (4)样本(k阶)原点矩 1 1 ,1,2, n k k i i A X k n= == ∑L (5)样本(k阶)中心矩 1 1 (),2,3, n k k i i B X X k n= =-= ∑L 其中样本二阶中心矩2 1 1 (), n k i i B X X n= =- ∑又称为未修正样本方差。 (6)顺序统计量 将样本中的各个分量由小到大的重排成 (1)(2)()n X X X ≤≤≤ L 则称 (1)(2)() ,, n X X X L为样本顺序统计量, ()(1) n X X -为样本的极差。 (7)样本相关系数: 11 22 11 ()()()() 11 ()() n n i i i i i i xy n n x y i i i i x x y y x x y y r S S x x y y n n == == ---- == -- ∑∑ ∑∑ 其中:,x y分别为数据, i i x y的样本均值,, x y S S分别为样本a标准差。5、直方图与箱线图 (1)直方图 先将所有采集的数据进行整理,得到顺序统计量,找出其中的最小值 (1) x,最 大值 ()n x,即所有的数据都落在区间 (1)() , n x x ?? ??上,现取区间(1)() , n x k x k ?? -+ ??(其

数理统计的基本概念

6 数理统计的基本概念 基本要求 1 理解总体、样本(品)、样本容量、简单随机样本的概念。能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。 2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。 3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。 4 理解样本均值、样本方差及样本矩的概念。了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。了解正态总体的某些常用抽样分布。 疑难解答 1、采用抽样的方法推断总体,对样本应当有怎样的要求? 答:为了对总体X的分布进行研究,逐个研究每个个体是不现实的。采用抽样推断总体,其出发点是利用局部认识整体,因此抽出的样本要具有代表性。即要求每个个体被抽取的机会均等,并且抽取一个个体后总体成分不变。首先要求抽样具有“随机性”,第一次抽取的样品X1的可能取值应与总体的可能取值是完全一样的,且去取个个值的概率相同。因此,X1是一个随机变量,并且是与X同分布的随机变量。其次,应具有“独立性”,第一次抽样不改变总体成分,第二次抽取的样品X2可能的值也与X完全一样,且取值的概率也是相同的,因此X2也是与X同分布的一个随机变量且与X1是相互独立的,同样道理,X3,X4,…,X n都是与X同分布的随机变量,并且X1,X2,…,X n是一组相互独立的随机变量,故要求X1,X2,…,X n是简单随机样本。 2、什么是简单随机样本?在实践中如何获得简单随机样本? 答:设X1,X2,…,X n是来自总体X的容量为n的样本,如果它满足以下两个条件,则称它为简单随机样本: (1)X1,X2,…,X n与总体X具有相同的分布 (2)X1,X2,…,X n相互独立 由简单随机样本的定义知,用简单随机样本研究总体,可以更好地用概率论中独立条件下的一系列结论,正是这些结论为概率统计提供了必要的理论基础。 一般说来,对总体进行独立重复观测,便可以获得简单随机样本。 具体来说,当抽取样本容量n相对于总体数N很小时(一般) ≤ n),则连续抽 N 10 1 取n个个体,就近似地看做一个简单随机样本。这是因为抽取的个数很小时,可认为对总体不影响或影响很小。 如果采取有放回抽样,则不必要求n相对很小。 3、什么叫大样本和小样本?它们之间的区别是否是一样本容量的大小来区分的? 答:在样本容量固定的条件下,进行的统计推断、分析问题称为小样本问题,而在样本容量趋于无穷的条件下,进行的统计推断、分析问题称为大样本问题。 然而,众多统计推断与分析问题与统计量或样本的函数的分布相关联。能否得到有关统计量或样本的函数的分布常成为解决问题的关键。所以,大、小样本的区分常与这一分布 *该部分内容考研不作要求。

统计学基本概念

基本概念 1、统计的含义:统计工作、统计资料、统计学 2、社会经济统计学的特点:数量性、社会性、综合性 3、统计工作的职能:统计信息职能、统计咨询职能、统计监督职能 4、统计工作过程:统计调查、统计整理、统计分析 5、统计调查的质量要求:准确性、全面性、及时性、有效性 6、专门调查的方法:普查、重点调查、典型调查、抽样调查 7、统计调查的方法:直接观察法、报告法、采访法、通讯法、实验调查法、网上调查法 8、次数分布的主要类型:钟型分布、U型分布、J型分布 9、统计表的结构,从组成要素看,由总标题、横行与纵栏标题、指标数值等三部分组成 10、统计表的结构,从容上看,由主词、宾词两部分构成 11、统计分析方法:综合指标、动态数列、统计指数、相关回归、抽样推断 12、综合指标从它的作用和方法特点的角度可概括为三类:总量指标、相对指标、平均指标 13、相对指标的种类:计划完成相对指标、结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标 14、平均指标的种类:算术平均数、调和平均数、几何平均数、众数、中位数 15、测定标志变动度的主要方法:全距、四分位差、平均差、标准差、离散系数

16、动态数列按构成其指标数值的性质不同分为:绝对数动态数列、相对数动态数列、平均数动态数列 17、动态数列的水平分析指标:发展水平、平均发展水平、增长量、平均增长量 18、动态数列的速度分析指标:发展速度、增长速度、平均发展速度、平均增长速度 19、测定长期趋势常用的主要方法:间隔扩大法、移动平均法、最小平方法 20、指数按其反映指标性质不同分为:数量指标指数和质量指标指数 21、指数按其表现形式不同分为:综合指数、平均指数、平均指标对比指数 22、相关关系按其方向不同分为:正相关和负相关 23、相关关系按其涉及因素多少分为:单相关和复相关 24、相关关系按其形式不同分为:直线相关和曲线相关 25、抽样调查的组织形式:简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样 26、总体参数的抽样估计方法为点估计和区间估计。 统计分析 1.某市某“五年计划”规定计划期最末一年甲产品产量应达到75万吨,假定每天产量相等,实际生产情况如下表所示(单位:万吨)。试计算该市甲产品产量五年计划完成程度和提前完成计划的时间。 第一年第二年第三年56 58 62 第四年一季二季三季四季16 17 18 18

《概率论与数理统计》习题 第五章 数理统计的基本概念

第五章 数理统计的基本概念 一. 填空题 1. 设X 1, X 2, …, X n 为来自总体N(0, σ2 ), 且随机变量)1(~) (22 1 χ∑==n i i X C Y , 则常数 C=___. 解. ∑=n i i X 1 ~ N(0, n σ2 ), )1,0(~1 N n X n i i σ ∑= 所以 2 1,1σ σ n c n c = = . 2. 设X 1, X 2, X 3, X 4来自正态总体N(0, 22)的样本, 且2 43221)43()2(X X b X X a Y -+-=, 则a = ______, b = ______时, Y 服从χ2分布, 自由度为______. 解. X 1-2X 2~N(0, 20), 3X 3-4X 4~N(0, 100) )1,0(~2022 1N X X -, )1,0(~1004343N X X - 20 1 ,20 1 = = a a ; 100 1,100 1 = = b b . Y 为自由度2的χ2分布. 3. 设X 1, X 2, …, X n 来自总体χ2(n)的分布, 则._____)(______,)(==X D X E 解. 因为X 1, X 2, …, X n 来自总体χ2(n), 所以 E(X i ) = n, D(X i ) = 2n (i = 1, 2, …, n) ,)(n X E = 22) ()(2 2 1=?= =∑=n n n n X D X D n i i 二. 单项选择题 1. 设X 1, X 2, …, X n 为来自总体N(0, σ2 )的样本, 则样本二阶原点矩∑==n i i X n A 1 2 21的方差为 (A) σ2 (B) n 2 σ (C) n 42σ (D) n 4 σ 解. X 1, X 2, …, X n 来自总体N(0, σ2), 所以

第6章数理统计的基本概念习题及答案

. 第六章 数理统计的基本概念 一.填空题 1.若n ξξξ,,,21Λ是取自正态总体),(2σμN 的样本, 则∑==n i i n 11ξξ服从分布 )n ,(N 2 σμ . 2.样本),,,(n X X X Λ21来自总体),(~2 σμN X 则~)(22 1n S n σ - )(1χ2-n ; ~)(n S n X μ- _)(1-n t __。其中X 为样本均值,∑=--=n i n X X n S 122 11)(。 3.设4321X X X X ,,,是来自正态总体).(220N 的简单随机样本, +-=221)2(X X a X 243)43(X X b -,则当=a 20 1=a 时,=b 1001=b 时,统计量X 服从2 X 分布,其自由度为 2 . 4. 设随机变量ξ与η相互独立, 且都服从正态分布(0,9)N , 而129(,,,) x x x L 和 129(,,,)y y y L 是分别来自总体ξ和η的简单随机样本, 则统计量 ~U = (9)t . 5. 设~(0,16),~(0,9),,X N Y N X Y 相互独立, 129,,,X X X L 与1216 ,,,Y Y Y L 分别 为X 与Y 的一个简单随机样本, 则22 2 129222 1216 X X X Y Y Y ++++++L L 服从的分布为 (9,16).F 6. 设随机变量~(0,1)X N , 随机变量2~()Y n χ, 且随机变量X 与Y 相互独立, 令T =, 则2~T F (1,n ) 分布. 解:由T =, 得22 X T Y n =. 因为随机变量~(0,1)X N , 所以22~(1).X χ

第6章 数理统计的基本概念1内容框图

第6章 数理统计的基本概念 6.1 内容框图 6.2 基本要求 (1) 理解总体、样本及统计量的概念,并熟练掌握常用统计量的公式. (2) 掌握矩法估计和极大似然估计的求法,以及估计无偏性、有效性的判断. (3) 掌握三大抽样分布定义,并记住其概率密度的形状. (4) 理解并掌握有关正态总体统计量分布的几个结论,如定理6.4~6.9及定理6.11. 6.3 内容概要 1) 总体与样本 在数理统计中,我们把作为统计研究对象的随机变量称为总体,记为 ξ,η,… 。对总体进行 n 次试验后所得到的结果,称为样本,记为(n X X X ,,,21Λ),(n Y Y Y ,,,21Λ),……,其中,试验次数 n 称为样本容量。样本(n X X X ,,,21Λ)中的每一个 i X 都是随机变量。样本所取的一组具体的数值,称为样本观测值,记为

(n x x x ,,,21Λ) 。 具有性质: (1)独立性,即 n X X X ,,,21Λ 相互独立。 (2)同分布性,即每一个 i X 都与总体 ξ 服从相同的分布。 称为简单随机样本 。 如果总体 ξ 是离散型随机变量,概率分布为 }{k P =ξ,那么样本(n X X X ,,,21Λ)的联合概率分布为∏∏====== ===n i i n i i i n n x P x X P x X x X x X P 1 1 2211}{}{},,,{ξΛ。 如果总体 ξ 是连续型随机变量,概率密度为 )(x ?,那么样本(n X X X ,,,21Λ)的联合概率密度为 ∏∏==== n i i n i i X n x x x x x i 1 1 21)()(),,,(*?? ?Λ 。 如果总体 ξ 的分布函数为 )(x F ,那么样本(n X X X ,,,21Λ)的联合分布函数为 ∏∏====n i i n i i X n x F x F x x x F i 1 1 21)()(),,,(*Λ 。 2)用样本估计总体的分布 数理统计的一个主要任务,就是要用样本估计总体的分布。 参数估计又可以分为两种,一种是点估计,另一种是区间估计。 3) 矩法估计 求矩法估计的步骤为: (1)计算总体分布的矩),,,()(21m k k f E θθθξΛ=,m k ,,2,1Λ=,计算到m 阶矩 为止(m 是总体分布中未知参数的个数)。 (2)列方程 ?????????======∧ ∧∧ m m m m m m X E f X E f X E f )()?,,?,?()()?,,?,?()?,,?,?(2122212211ξθθθξθθθξθθθΛΛ ΛΛΛ 从方程中解出m θθθ?,,?,?21Λ,它们就是未知参数m θθθ,,,21Λ的矩法估计。

统计学中的基本概念

统计学的几个基本概念 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么总体单位是什么 总体的同质性是什么变异性是什么 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

统计学中的基本概念

1、2统计学得几个基本概念 1. 2. 1总体与总体单位 1、总体 ⑴总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体; 在统计硏究过程当中,统计研究得目得与任务居于支配与主导得地位, 有什么样得硏究目得就应该有什么样得统计总体与之相适应。例如:要硏究 我们学院教师得工资情况,那么全体教师就就是研究得总体,其中得每一位 教师就就是总体单位;如果要了解某班50个学生得学习情况,则总体就就是该班得50名学生,每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 ⑵总体得分类: 总体根据总体单位就是否可以计量分为有限总体与无限总体:★有限总体:指所包含得单位数就是有限得总体。 如一个企业得全体职工、一个国家得全部人口等都就是有限总体; ★无限总体:指所包含得单位数目就是无限得,或准确度量它得单位数就是不经济或没有必受寻这样得总体称为无限总体。 如企业生产中连续生产得大量产品,江河湖海中生长得鱼得尾数 划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进 行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位 进行非全面调查,据以推断总体。 ⑶总体得特征: ★大量性:就是指构成总体得单位数要足够得多,总体应由大量得单位所构成。大量性就是对统计总体得基本要求。 个别单位得现象或表现有很大得偶然性,而大量单位得现象综合则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多,才能准确地反应我们要研究得总体得特征,达到我们得研究目得。

数理统计的基本概念汇总

6数理统计的基本概念 6.1 基本要求 1 理解总体、样本(品)、样本容量、简单随机样本的概念。能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。 2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。 3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。 4 理解样本均值、样本方差及样本矩的概念。了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。了解正态总体的某些常用抽样分布。 6.2 内容提要 6.2.1 总体和样本 1 总体和个体研究对象的某项特征指标值的全体称为总体(或母体),组成总体的每个元素称为个体。总体是一个随机变量,常用X,Y等来表示。 2 样本从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。 3 简单随机样本设X1,X2,…,X n是来自总体X的容量为n 的样本,如果这n个随机变量X1,X2,…,X n相互独立且每个样品X i与总体X具有相同的分布,则称X1,X2,…,X n为总体X的简单随机样本。 4 样本的联合分布 *该部分内容考研不作要求。 149

150 若总体X 具有分布函数F (x ),则样本(X 1,X 2,…,X n )的联合分布函数为 ∏==n i i n x F x x x F 1 21) (),,,( 若总体X 为连续型随机变量,其概率密度函数为f (x ),则样本的联合概率密度为 ∏== n i i n x f x x x f 1 21) (),,,( (6.1) 若总体X 为离散型随机变量,其分布律为P {X =a i }=p i (i =1,2,…n),则样本的联合分布为 ∏======n i i i n n x X P x X x X x X P 1 2211} {},,,{ (6.2) 其中),,,(21n x x x 为),,,(21n X X X 的任一组可能的观察值。 6.2.2 样本分布 1 频率分布 设样本值(x 1,x 2,…,x n )中不同的数值是x 1*,x 2*,…,x l *,记相应的频数分别为n 1,n 2,…,n l ,其中 x 1* < x 2* <…< x l *且 n n l i i =∑=1 。 则样本的频数分布及频率分布可由表6-1给出。

统计学中的基本概念

变异 ?同质~性质相同。是指基本条件相同 变异~同质事物之间的差异。是指不同的个体在相同的条件下,对外界环境因素的反应不同 ?总体Population:根据研究目的所确定的同质观察单位的全体; ?个体Individual:是构成总体的最基本观察单位; ?根据随机化原则有总体中随机抽取部分个体组成总体的过程 ?样本Sample:是从总体中按照一定的目的随机抽取的一部分个体。为什么要抽样? ?样本含量Sample Size:样本中包含的个体个数。 抽样原则 一个样本应具有: “代表性(representative)” “随机性(randomization)” “可靠性(reliability)” 如果进行两个或多个样本之间的比较,要求:每二个样本之间应具有:可比性(comparable) 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 误差(error) ?系统误差(system error) ?由于固定的原因(常见实验条件),影响资料的准确性。可以克服。 ?随机测量误差(random measurement error) ?由于偶然的因素造成同一对象多次测量结果的差异。可控制但不可 消除。 应采取措施,尽最大可能在一定的允许范围内 抽样误差(sampling error) 抽样的原因造成统计量与总体参数或不同样本统计量之间的差异。 原因:①个体变异②抽样 抽样误差,对它要用统计方法进行正确分析 概率 ?概率有古典概率与统计概率之分, ?医学上常用的是统计概率f/N ?必然事件,概率为1 ?不可能事件,概率为0 ?小概率事件,P≤0.05 或P≤0.01 ?常把P≤0.05 作为事物差别有统计学意义的界限,

《应用数理统计》吴翊李永乐第一章数理统计的基本概念课后习题

第一章 数理统计的基本概念 课后习题参考答案 设对总体X 得到一个容量为10的子样值:,,,,,,,,,,试分别计算子样均值X - 和子样方差 2S 的值。 解:12,n X X X 为总体X 的样本, 根据 121 ()n X X X X n = +++ 求得X =; 根据2 21 1()n i i S X X n ==-∑ 求得2 S =。 设总体X 的分布函数为()x F ,密度函数为()x f ,n X X X ,,,21 为X 的子样,求最大顺序统计量()n X 与最小顺序统计量()1X 的分布函数与密度函数。 解: 将总体X 中的样本按照从小到大的顺序排列成()()()n X X X ≤≤≤ 21 ()()()()()()[]n n n n x F x x P x x P x x P x x P x F =<<<=<= 21 ()()[]()()x f x nF x F x f n n n 1' -== ()()()()() ()[]()[]()[]()[] n n n x F x x P x x P x x P x x P x x P x x P x x P x F --=<-<-<--=≥≥≥-=<=1111111212111 ()()[]()[] ()x f x F n x F x f n 1 111'--== 设总体X 服从正态分布N(12,4),今抽取容量为5的子样521,,,X X X ,试问: (1)子样的平均值X 大于13的概率为多少 (2)子样的极小值(最小顺序统计量)小于10的概率为多少 (3) 子样的极大值(最大顺序统计量)大于15的概率为多少 解:

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

统计学中的基本概念

. 1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们

设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中;.. . 才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的;

概率论与数理统计知识点总结(详细)

《概率论与数理统计》 第一章概率论的基本概念 (2) §2.样本空间、随机事件 (2) §4等可能概型(古典概型) (3) §5.条件概率 (4) §6.独立性 (4) 第二章随机变量及其分布 (5) §1随机变量 (5) §2离散性随机变量及其分布律 (5) §3随机变量的分布函数 (6) §4连续性随机变量及其概率密度 (6) §5随机变量的函数的分布 (7) 第三章多维随机变量 (7) §1二维随机变量 (7) §2边缘分布 (8) §3条件分布 (8) §4相互独立的随机变量 (9) §5两个随机变量的函数的分布 (9) 第四章随机变量的数字特征 (10) §1.数学期望 (10) §2方差 (11)

§3协方差及相关系数 (11) 第五章 大数定律与中心极限定理 (13) §1. 大数定律 ...................................................................................... 13 §2中心极限定理 . (13) 第一章 概率论的基本概念 §2.样本空间、随机事件 1.事件间的关系 B A ?则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生 B }x x x { ∈∈=?或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ?发生 B }x x x { ∈∈=?且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ?发生 B }x x x { ?∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生 φ=?B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的 且S =?B A φ=?B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件 2.运算规则 交换律A B B A A B B A ?=??=? 结合律)()( )()(C B A C B A C B A C B A ?=???=??

相关主题
文本预览
相关文档 最新文档