当前位置:文档之家› 数理统计的基本概念

数理统计的基本概念

数理统计的基本概念
数理统计的基本概念

第6章 数理统计的基本概念

6.1 内容框图

6.2 基本要求

(1) 理解总体、样本及统计量的概念,并熟练掌握常用统计量的公式.

(2) 掌握矩法估计和极大似然估计的求法,以及估计无偏性、有效性的判断. (3) 掌握三大抽样分布定义,并记住其概率密度的形状.

(4) 理解并掌握有关正态总体统计量分布的几个结论,如定理6.4~6.9及定理6.11.

6.3 内容概要

1) 总体与样本

在数理统计中,我们把作为统计研究对象的随机变量称为总体,记为 ξ,η,… 。对总体进行 n 次试验后所得到的结果,称为样本,记为(n X X X ,,,21 ),(n Y Y Y ,,,21 ),……,其中,试验次数 n 称为样本容量。样本(n X X X ,,,21 )中的每一个 i X 都是随机变量。样本所取的一组具体的数值,称为样本观测值,记为

总体与样本

统计量 点估计

矩阵估计

常用统计量定义

统计量的分布

正态总体统计量的分布

极大似然估计

点估计的评价 三大抽样分布

(n x x x ,,,21 ) 。

具有性质:

(1)独立性,即 n X X X ,,,21 相互独立。

(2)同分布性,即每一个 i X 都与总体 ξ 服从相同的分布。 称为简单随机样本 。

如果总体 ξ 是离散型随机变量,概率分布为 }{k P =ξ,那么样本(n X X X ,,,21 )的联合概率分布为∏∏======

===n

i i n

i i i

n n x P x X

P x X x X x X P 1

1

2211}{}{},,,{ξ 。

如果总体 ξ 是连续型随机变量,概率密度为 )(x ?,那么样本(n X X X ,,,21 )的联合概率密度为 ∏∏====

n

i i n

i i X n x x x x x i

1

1

21)()(),,,(*??

? 。

如果总体 ξ 的分布函数为 )(x F ,那么样本(n X X X ,,,21 )的联合分布函数为

∏∏====n

i i n i i X n x F x F x x x F i 1

1

21)()(),,,(* 。

2)用样本估计总体的分布

数理统计的一个主要任务,就是要用样本估计总体的分布。

参数估计又可以分为两种,一种是点估计,另一种是区间估计。

3) 矩法估计

求矩法估计的步骤为:

(1)计算总体分布的矩),,,()(21m k k

f E θθθξ =,m k ,,2,1 =,计算到m 阶矩

为止(m 是总体分布中未知参数的个数)。

(2)列方程

?????????======∧

∧∧

m m m m m m X

E f X E f X E f )()?,,?,?()()?,,?,?()?,,?,?(2122212211ξθθθξθθθξθθθ

从方程中解出m

θθθ?,,?,?21 ,它们就是未知参数m θθθ,,,21 的矩法估计。

4) 极大似然估计

求极大似然估计的步骤为:

(1)写出似然函数L 的表达式。

如果总体ξ是离散型随机变量,概率分布为 }{k P =ξ,那么 ∏===

n

i i

x P L 1

}{ξ;

如果总体ξ是连续型随机变量,概率密度为 )(x ?,那么 ∏==

n

i i

x L 1

)(?。

(2)在m θθθ,,,21 的取值范围Θ内,求出使得似然函数L 达到最大的参数估计值

m θθθ?,,?,?21 ,它们就是未知参数的极大似然估计。

通常的做法是,先取对数 L ln (因为当 L ln 达到最大时,L 也达到最大)。 然后令 L ln 关于m θθθ,,,21 的偏导数等于0,得到方程组

???

????

=??=??0ln 0ln 1

m

L

L

θθ

由此可见,如果上面这个方程组在 Θ 内有唯一解 m

θθθ?,,?,?21 ,所以,按照极大似然估计的定义,m

θθθ?,,?,?21 就是未知参数 m θθθ,,,21 的极大似然估计。

5) 衡量点估计好坏的标准

定理 设总体 ξ 的数学期望 ξE 和方差 ξD 都存在,(n X X X ,...,,21)是 ξ 的样本,X 是样本均值,2

S 是样本方差,则有

(1)ξE X E = ; (2)n D X D ξ=

; (3)ξD n

n S E 1)(2

-=

衡量点估计的好坏标准:

(1) 无偏性

定义6.1 设θ

?是参数θ的估计,如果有 θθ=?E ,则称θ?是θ的无偏估计。 (2) 有效性

定义6.2 设1?θ ,2?θ都是参数θ的无偏估计,如果有 )?()?(2

1θθD D ≤ ,则称 1?θ 比

2?θ 有效。

(3)相合性(一致性)

定义6.3 设θ

?是参数θ的估计,n 是样本容量,如果任何0>ε,都有 1}?{lim =<-∞

→εθθ

P n , 则称θ?是θ的相合估计(一致估计)。

可以证明,矩法估计都是相合估计。除了极个别的例外,极大似然估计也都是相合估计。

6) 数理统计中几个常用的分布

2

χ 分布

定义6.4 若有n X X X ,...,,21相互独立,i X ~)1,0(N ,n i ,,2,1 =,则称

∑=n

i i

X

1

2所服从的分布为自由度是 n 的 2

χ 分布,记为 )(2

n χ 。

2χ 分布的概率密度为

?

??

????≤>Γ=--0

00

)2

(21

)(2122x x e x n x x n n

?

2

χ 分布的图象见图6-2 。

定理 如果有 ξ~)(2m χ,η~)(2n χ,

相互独立,则 ηξ+~)(2

n m +χ。即2

χ分布具有可加性。

图6-2 2

χ布的概率密度

t 分布

定义 若有ξ~)1,0(N ,η~)(2

n χ,相互独立,则称

n

ηξ

所服从的分布为自由度是 n 的 t 分布,记为 )(n t 。

t 分布的概率密度为

212

)1()

2

()21

(

)(+-+Γ+Γ=

n n x n n n x π? 。

t 分布的图象见图6-3 。

F 分布

定义 若有 ξ~)(2m χ,η~)(2

n χ,相互独立,则称

n

m

ηξ 所服从的分布为自由度是 ),(n m 的 F 分布,记为 ),(n m F 。

F 分布的概率密度为

????

?

????≤>+ΓΓ+Γ=+-0

00

)()2()2

()2()(2

1222x x n mx x n m n m n m x n

m m n m ?

F 分布概率密度的图象见图6-4 。

定理 如果 F ~),(n m F ,则必有

F

1

~),(m n F 。

三大抽样分布

三大抽样分布的严格定义见定义6.4, 6.5,6.6,构造性定义可简示如下:

()()()22

20,1...0,1~N N n χ++

()

()()20,1~/N t n n n

χ

()()()22

/~,/m m F m n n n

χχ

其中F 代表分布F 对应的随机变量.

7) 正态总体统计量的分布

定理 设(n X X X ,,,21 )是总体ξ~),(2

σμN 的样本,X 是样本均值,则有

X ~),

(2

n

N σμ ,即有

n X σ

μ

-~)1,0(N 。

定理 设(n X X X ,,,21 )是总体 ξ~),(2

σμN 的样本,X 是样本均值,2

S 是

样本方差,则有 (1)X 与2

S 相互独立 ; (2)

2

2

σ

nS ~)1(2

-n χ 。

定理 设(n X X X ,,,21 )是总体 ξ~),(2

σμN 的样本,X 是样本均值,*S 是修正样本标准差,则有

n S X *

μ

-~)1(-n t 。

定理 设 (m X X X ,,,21 )是总体 ξ~),(2

11σμN 的样本,(n Y Y Y ,,,21 )是总体 η~),(2

22σμN 的样本,两个样本相互独立,X ,Y 是 ξ,η 的样本均值,则有

n

m

Y X 22

21

21)

()(σ

σ

μμ+

---~)1,0(N 。

定理 设 (m X X X ,,,21 )是总体 ξ~),(2

11σμN 的样本,(n Y Y Y ,,,21 )是总体 η~),(2

22σμN 的样本,其中 21σσ= ,两个样本相互独立,X ,Y 是 ξ,η 的

样本均值,2

x S ,2

y S 是 ξ,η 的样本方差,则有

n

m S Y X w

1

1)

()(21+---μμ~)2(-+n m t ,其中,2

22-++=

n m nS mS S y

x w 。

总体,ξη为正态分布,()1,...,m X X 与()1,...,n Y Y 分别为其样本时,几个重要结论及关系:

6.4 自测题六

一、 判断题(正确用“+”,错误用“-”)

1. 无论总体ξ服从什么分布,只要总体的期望和方差存在,当样本容量很大时,样本均值X 都近似服从正态分布.( )

2. 参数θ的矩法估计一定是θ的无偏估计.( )

3. 从一批零件中有放回地取5个,结果发现前2个是次品,后3个为正品,则这批零件的次品率p 的矩法估计值为

2

5

.( ) X

的标准化()~0,1T n N μσ

-

()()*2

22

1~1n S n χσ

--

()*

~1X n t n S

μ

-- t 分布定义

()*22

1*22

2

/~1,1/x Y S F m n S σσ-- F 分布定义

X Y -的标准化服从N (0,1)

()()

()

1

2~211

W

X Y t m n S m n

μ

μ---+-+T 分布定义

4. 设总体ξ服从参数为λ普阿松分布,()12,,...,n X X X 为取自总体的样本,则参数λ的极大似然估计是无偏的.( )

5. 设ξ()2~,N μσ,则2

ξμσ-?? ?

??

服从2

χ分布.( ) 6. 设总体ξ()2~,N

μσ,()12,X X 为取自总体的样本,则

()12~1,1||

X F X μ

μ--.( )

7. 设()12,,...,n X X X 为取自总体ξ()2

~,N

μσ的样本,X 为样本均值,*

S

为样本修正标

准差,则()2

*

~1,X n F n S μ??

- ???

.( ) 8. 设总体ξ()2

~,N

μσ,X 和*2S 分别为其样本的均值与修正方差,则对任意常数

α,()2

*?1aX a S μ

=+-都是μ的无偏估计.( ) 9. 设总体ξ()~0,1N ,X 为样本()12,,...,n X X X 的均值,则

()

()2

12

~1,1X F X n .( )

10. 设总体ξ服从参数为λ的指数分布,X 为样本均值,则λ的矩法估计和极大似然估计都是

1

X

.( )

二、 选择题

1. 设()12,,...,n X X X 是总体ξ的样本,ξ()2

~,N μσ,其中2

,μσ

均未知,下列表达式中只

有( )是统计量.

(A )11n i i X n μ=-∑ (B )

11

n

i

i X

σ

=∑

(C )2

11n i i X n =∑ (D )()2

2

1

1n

i

i X

μσ

=-∑

2. 设()12,,...,n X X X 是取自总体ξ(

)2

~0,N σ的样本,可以作为2

σ

的无偏估计的统计量

是( ).

(A )2

11n i i X n =∑ (B )2111n i i X n =-∑ (C )11n i i X n =∑ (D )1

11n

i i X n =-∑

3. 设总体ξ()2

~,N

μσ,()12

,X X 是其样本,下列4个μ的无偏估计中,最有效的是( ).

(A )112?0.20.8X X μ

=+ (B) 212?0.40.6X X μ=+ (C) 312?0.70.3X X μ

=+ (D) 412?0.90.1X X μ=+ 4. 设随机变量1X 和2X 都服从标准正态分布,则( ).

(A) 2212X X +服从2

χ分布 (B )22

12X X -服从2

χ分布 (C )2212/X X 服从F 分布 (D )21X 和22X 都服从2

χ分布

5. 设总体ξ(

)2

~0,N σ,()1

2

3

4

,,,X X X X 为ξ的样本,则下式中服从t(2)分布的统计量是

( ). (A )

122

2

34

X X X X ++ (B )

122

2

34

2X X X X ++

(C )

()

122

2

34

2X X X X ++ (D)

()122

2

34

2X X X X ++

6. 设随机变量ξ()2

1

1

~,N

μσ,()2

2

2

~,N ημσ,且ξ与η相互独立,而()12,,...,m

X X X ,

()12,,...,n Y Y Y 分别为ξ和η的样本,则有( ).

(A) ()2

2121

2

~,X Y N μμσσ-++ (B) 22

12

12~,X Y N m n σσμμ??--+ ???

(C) 2212

12~,X Y N m n σσμμ??--- ??? (D) 221212~,X Y N m n σσμμ??--+ ? ???

7. 设()12345,,,,X X X X X 为取自正态总体()04N ,的样本,则服从()23F ,分布的统计量是( ). (A )

()

()22122

2

2

345

23X X X X X +++ (B )

()()22212322

45

23X X X X X +++

(C )

()

()

22122

2

2

1

23

32X X X X X +++ (D )

()

()

22

122

2

2

345

32X X X X X +++

8. 设

()

12,,...,m X X X ,

()

12,,...,n Y Y Y 为分别取自相互独立的正态总体

ξ()211~,N μσ,()212~,N ημσ的样本,2

2*

,,x x X S S 和2

2*,,y y Y S S 分别为总体ξ,η的样本

均值,样本方差和修正样本方差,则下列四个选项中不正确的是( ).

(A) 22

,,,x y

X Y S S 相互独立 (B )

()1

*

~1x

X m t m S μ-- (C) ()*2

1*2

2

/~1,1/x y S F m n S σσ-- (D)

()()()1

2

~211

w

X Y t m n S m n

μμ---+-+其中22

2

x y

w

mS nS S m n +=

+-

9. 设()x Φ为标准正态分布的分布函数,0<p <1.下述关于临界值的四个选项,正确的是( ).

(A )11p p u u -+= (B) ()

p u p Φ= (C)

()()22

1p p n n χχ-=- (D) ()()

11

,,p p F m n F m n -=

10. 设()1216,,...,X X X 为取自正态总体ξ()2

~,N

μσ的样本,X 为样本均值,若有

()

16

2

21

0.95i i P X X ασ=??

-≥=????

∑,则α等于( ).

(A)

()20.9516χ (B) ()20.9515χ (C) ()20.0515χ (D) ()20.0516χ

三、 填空题

1. 设总体ξ服从参数为λ的普阿松分布,把对总体进行的n 次观测结果记为

()12,,...,n X X X ,()12,,...,n X X X 可以称为样本必须满足的两个条件是_______________和

______________

()

12,,...,n X X X 的联合概率分布为

_______________,1P X n ??

>

=????

_______________. 2. 设()129,,...,X X X 为取自均匀分布U (2,4)的样本,X 为样本均值,2

S 为样本方差,则max

()

129,,...,X X X 的分布函数为___________,E X =_____________;

DX =______________;2ES =______________.

3. 设总体ξ 概率密度为

1

x

θθ

+ 1x ≥

()x ?=

0 x <1

其中,θ>1为未知参数,()12,,...,n X X X 是ξ的样本,这时θ的矩法估计为 _______________;θ的极大似然估计为________________ . 4. 设总体ξ 服从对数正态分布,概率密度为

()22

ln 1

exp 22x x μσπσ??--?????? 0x >

()x ?=

0 0x ≤

其中,,μσ>0是未知参数,()12,,...,n X X X 是ξ的样本,这时μ的极大似然估计为 _______;σ的极大似然估计为_________ ;当σ=1时,μ的矩法估计为_____________. 5. 已知总体ξ 的概率密度为

()

22x e

θ-- 0x ≥

()x ?=

0 0x <

其中,θ是未知参数,()12,,...,n X X X 是ξ的样本,

这时θ的矩法估计为______________ ;θ的极大似然估计为 ________________.

6. 设()12,,...,n X X X 是总体ξ的样本,ξ~(),4N μ,样本均值1

1n

i i X X n ==∑.当

n ≥______________时,才能使2||0.1E X μ-≤ 7. 设总体ξ()21

1

~,N

μσ,()22

2

~,N ημσ,()12,,...,m X X X 是ξ的样本,()

12,,...,n

Y Y Y 是η的样本,两组样本相互独立,11

11,m n

i j i j X X Y Y m n ====∑∑,则

()

D X Y -=_______________.

8. 设()126,,...,X X X 是来自总体ξ的样本,ξ~N (0,1),随机变量

()()22

123456Y X X X X X X =+++++,当常数 c=_____时,cY 服从2χ分布,其自由度

是____ .

9. 已知总体ξ()

21~0,N σ,()123,,X X X 为ξ的样本,则1

232

||

X X X -~_____________

10. 设总体ξ服从正态分布N (0,4),()121

5,,...,X X X 为ξ的样本,则()

22

110

22

1115...2...X X Y X X ++=++服从____________分布,其自由度是_____________.

6.5 自测题六答案

一、 1. +;2. -;3. +;4. +;5. +;6. -;7. -;8. -;9. -;10. +

二、 1. C;2. A;3. B;4. D;5. A;6. B;7. D;8. D;9. B;10. C 三、 1. ()~i X P λ(i =1,2,…,n ), 12,,...,n X X X 相互独立1

!i

x

n

i i

e x λλ-

=∏,()11n n e

λ

λ--+;

2. 0 2x <

()max F x = 9

22x -??

???

24x ≤<, 3,127,827;

1 4x ≥

3. 1

X X +,

1

ln n

i

i n

X

=∑;4. 11ln ln n

i i X X n ==∑,()

2

1

1ln ln n i i X X

n =-∑,1

ln 2

X -

; 5. 1

2

X -,()min 1i X i n ≤≤;6. 40;7. 2212m n σσ+;8. 13,2;9. t(1); 10. F,(10,5)

6.6 典型例题

例1 设总体 ξ~),(2

σμN ,0,>σμ 是未知参数,),,,(21n X X X 是 ξ 的样本,求σμ,的矩法估计。

解 先求总体分布的矩,得到 μξ=E ,2

2

2

2

)()(μσξξξ+=+=E D E 。

再列方程 ???

??==+==∧

)

2()(??)1(?2222X E X E ξμσ

ξμ

从(1)得 X =μ

?,代入(2)可得 221

2

2

2

2

1)(?S X X n X X n i i =-=-=∑=σ , 开方后得 S S ±=±=2?σ

,由于 0>σ ,舍去不符合题意的负根,最后得到 μ 和σ的矩法估计 ???==S X σ

μ?? 。在推导中,我们顺便也求得了 2

σ 的矩法估计 22?S =σ

例2 设总体ξ服从 ],0[θ 上的均匀分布,概率密度为

??

?≤≤=其他

01)(θθ

?x x

0>θ 是未知参数,),,,(21n X X X 是 ξ 的样本,求 θ 的矩法估计。

解 先求总体分布的矩 2)(0

θθ?ξθ

===

??

-dx x dx x x E 。

再列方程 X E ==∧

ξθ

2? 。解此方程,得到θ的矩法估计 X 2?=θ 。

例3 设总体 ξ 服从0-1分布,概率分布为 k

k

p p k P --==1)

1(}{ξ , 1,0=k ,

10<

解 先求似然函数

∑-∑

=-=====-

=-=∏∏n

i i

n

i i

i

i

x n x n

i x x n i i p p

p p x P L 1

1

)

1()

1(}{1

11

ξ ,

再取对数 )1(ln )(ln ln 1

1

p x n p x

L n

i i n

i i

--+=

∑∑== ,

求导,列方程

0)(11

1ln 1

1=---=∑∑==n

i i n i i x n p x p dp L d 。 从方程中可解得 ∑==n

i i x n p 1

1 ,它使 L ln 达到最大,所以p 的极大似然估计为

X X n p

n

i i ==∑=1

1? 。 # 例4 设总体ξ~),(2

σμN ,0,>σμ是未知参数。),,,(21n X X X 是ξ的样本。求σμ,的极大似然估计。

解 先求似然函数

∑=

===--

=--

=∏

∏n

i i i x n

n

n

i x n i i e

e

x L 1

2

2

2

2)(212

1

2)(1

)

2(121)(μσσ

μσ

πσ

π? ,

再取对数 ∑=--

--=n

i i

x

n n L 1

22

)(21

ln )2(ln 2ln μσσπ ,

求导,列方程

???????=-+-=??=-=---=??∑∑∑===)

2(0)(1ln )

1(0)(1)(22ln 1231

212n

i i n i i n i i x n L n x x L μσσσ

μσμσμ

从(1)解得 x x n n i i ==∑=11μ ,代入(2)可解得 2

1

22)(1s x x n n i i =-=∑=σ ,

开方后得 s s ±=±=2σ,由于 0>σ ,舍去不符合题意的负根,得到 s =σ。 它们使 L ln 达到最大,所以,μ 和 σ的极大似然估计为 ??

?==S

X σμ

?? 。 s =σ 使 L 达到最大,也就是 22s =σ 使 L 达到最大,所以,顺便还可以推导

出 2

σ 的极大似然估计为 2

2?S =σ。 #

例5 设总体ξ服从 ],0[θ 上的均匀分布,概率密度为

??

?≤≤=其他

01)(θθ

?x x

0>θ是未知参数,),,,(21n X X X 是ξ的样本,求 θ 的极大似然估计。

解 先求似然函数:

∏==n

i i x L 1)(????

???

?=≤≤=∏=其他

)

,,2,1(011

n i x i n i θθ

???

????≤≤≤=其他

0max min 01θ

θi i

i i

n x x

当 0≠L 时,对 L 取对数,得到 θθln )1

ln(ln n L n

-== 。对它求导后,列出

的方程

0ln =-=θ

θn

d L d 显然无解,这说明当 0≠L 时,不存在导数为0的点。 但是,不存在导数为0的点,不等于说 L 没有最大值。从 n L θ

1

= 可以看出,θ的

值越小,L 的值越大。但是,θ不能无限制地小下去,此式成立的条件是 i i

x max ≥θ ,

在其它情况下有 0=L ,所以,只有当 i i

x max =θ 时,似然函数L 才能取到最大值。因

此,根据极大似然估计的定义,θ的极大似然估计是 i

i

X max ?=θ。

例6 设总体 ξ~),(2

σμN ,前面我们已求得 μ 的估计 X =μ

?,2σ 的估计22?S =σ

,问 X =μ? 和 22?S =σ 是不是μ和2σ无偏估计? 解 由上面定理6.1可知,μξμ

===E X E E ? ,所以 X =μ? 是μ的无偏估计。 而 22

2

211)()?(σσξσ

≠-=-==n

n D n n S E E ,所以 22?S =σ

不是 2σ 的无偏估计。

但是,只要对它稍作修正,用修正样本方差 212

2

1

)(11*S n n X X n S n i i

-=--=∑=代替2S 作为2σ的估计,由于22

222

11)(1)1(

)*(σσ=--=-=-=n

n n n S E n n S n n E S E ,所以2

*S 是2

σ的无偏估计。

例7 设总体ξ~),(2

σμN ,),(21X X 是ξ的一个样本,证明2113

1

32?X X +=μ

2122

1

21?X X +=μ

都是μ的无偏估计。并比较哪一个估计更有效。 解 因为 μξξξμ

==+=+=E E E EX EX E 31

323132?211 , μξξξμ

==+=+=E E E EX EX E 2

1

212121?212 , 所以 1?μ

,2?μ 都是 μ 的无偏估计。 因为 221195

9591949194?σξξξμ

==+=+=D D D DX DX D , 22122

1

2141414141?σξξξμ

==+=+=D D D DX DX D , 而 2

29521σσ<,即 12??μμ

D D < ,所以 2?μ 比 1?μ 更有效。

数理统计的基本概念知识点

10 06 数理统计的基本概念 知识网络图 正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→???? ?????????????? 主要内容 一、样本 我们把从总体中抽取的部分样品n x x x ,,,21Λ称为样本。样本中所含的样品数称为样本容量,一般用n 表示。在一般情况下,总是把样本看成是n 个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,n x x x ,,,21Λ表示n 个随机变量(样本);在具体的一次抽取之后,n x x x ,,,21Λ表示n 个具体的数值(样本值)。我们称之为样本的两重性。 二、.统计量 1.定义:称不含未知参数的样本的函数),,,(21n X X X f Λ为统计量 2.常用统计量 样本均值 .11 ∑==n i i x n x 样本方差 ∑=--=n i i x x n S 122.)(11 样本标准差 .)(111 2∑=--=n i i x x n S 样本k 阶原点矩 ∑===n i k i k k x n A 1 .,2,1,1Λ 样本k 阶中心矩

∑==-=n i k i k k x x n B 1 .,3,2,)(1Λ μ=)(X E ,n X D 2 )(σ=, 22)(σ=S E ,221)(σn n B E -=, 其中∑=-=n i i X X n B 1 22)(1,为二阶中心矩。 三、抽样分布 1.常用统计量分布 (1)设n X X X ,,,21Λ是相互独立的随机变量,且均服从与标准正态分布)1,0(N ,则222212n n X X X X Λ++=,服从自由度为n 的-2χ分布,记为()n 2~χχ. (2)设()()n Y N X 2~,1,0~χ,且X 与Y 相互独立,则.n Y X T =服从自由度为n 的-t 分 布,记为()n t T ~. (3)设X 与Y 相互独立,分别服从自由度为1n 和2n 的-2χ分布,则1 22 1n n Y X n Y n X F ?==。服从自由度为()21,n n 的-F 分布,记为()21,~n n F F 2.正态总体场合 设n X X X ,,,21Λ是从正态总体()2,σμN 中抽取的一个样本,记 ()2 1211,1∑∑==-==n i i n n i i X X n S X n X ,则 (1);,~2??? ? ??n N X σμ (2)X 与2 n S 相互独立. (3)()()1~1222 --n S n χσ;或()1~)(2212 --∑=n X X n i i χσ

统计学中的基本概念

1、2 统计学得几个基本概念 1、2、1 总体与总体单位 1、总体 (1)总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体; 在统计研究过程当中,统计研究得目得与任务居于支配与主导得地位,有什么样得研究目得就应该有什么样得统计总体与之相适应。例如:要研究我们学院教师得工资情况,那么全体教师就就是研究得总体,其中得每一位教师就就是总体单位;如果要了解某班50个学生得学习情况,则总体就就是该班得50名学生,每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 (2)总体得分类: 总体根据总体单位就是否可以计量分为有限总体与无限总体: ★有限总体:指所包含得单位数就是有限得总体。 如一个企业得全体职工、一个国家得全部人口等都就是有限总体; ★无限总体:指所包含得单位数目就是无限得,或准确度量它得单位数就是不经济或没有必要得,这样得总体称为无限总体。 如企业生产中连续生产得大量产品,江河湖海中生长得鱼得尾数等等。 划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体得特征: ★大量性:就是指构成总体得单位数要足够得多,总体应由大量得单位所构成。大量性就是对统计总体得基本要求。 个别单位得现象或表现有很大得偶然性,而大量单位得现象综合

则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多,才能准确地反应我们要研究得总体得特征,达到我们得研究目得。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性就是构成统计总体得前提条件。 ★变异性:即构成总体得各个单位除了至少在某一方面具有共同性质外,在其她方面具有一定得差异。差异性就是统计研究得主要内容。 如以一个班级得所有学生作为一个总体,则“专业”就是该总体得同质性,而“性别”、“籍贯”等则就是个体之间得变异性;以我院全体教师为一个总体,则“工作单位”就是其同质性,而“学历”、“月工资”等则就是它得变异性。 需要特别说明得三个问题: ★变异就是客观存在得,没有变异得事物就是不存在得; ★变异对于统计非常重要,没有变异就没有统计。这就是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位得资料就可以推断总体情况了; ★变异性与同质性之间相互联系、相互补充,就是辩证统一得关系。用同质性否定变异性或用变异性否定同质性都就是错误得。 2、总体单位 就是构成总体得每一个个体。 【思维动起来】 对2015年10月份某市小学生得近视情况进行调查: 统计总体就是什么?总体单位就是什么? 总体得同质性就是什么?变异性就是什么? 3、总体与总体单位得关系 在统计研究中,确定统计总体与总体单位就是十分重要得,它决定于统计研究目得与认识对象得性质。在一次特定范围、目得得统计研究中,统计总体与总体单位就是不容混淆得,二者得含义就是确切得,

统计学中的基本概念

1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么?总体单位是什么? 总体的同质性是什么?变异性是什么? 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

第六章数理统计学的基本概念

第六章数理统计的基本概念 一、教学要求 1.理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。 2.了解分布、t分布和F分布的定义和性质,了解分位数的概念并会查表计算。 3.掌握正态总体的某些常用统计量的分布。 4.了解最大次序统计量和最小次序统计量的分布。 本章重点:统计量的概念及其分布。 二、主要内容 1.总体与个体 我们把研究对象的全体称为总体(或母体),把组成总体的每个成员称为个体。在实际问题中,通常研究对象的某个或某几个数值指标,因而常把总体的数值指标称为总体。设x为总体的某个数值指标,常称这个总体为总体X。X的分布函数称为总体分布函数。当X为离散型随机变量时,称X的概率函数为总体概率函数。当X为连续型随机变量时,称X的密度函数为总体密度函数。当X服从 正态分布时,称总体X为正态总体。正态总体有以下三种类型: (1)未知,但已知; (2)未知,但已知; (3)和均未知。 2.简单随机样本 数理统计方法实质上是由局部来推断整体的方法,即通过一些个体的特征来推断总体的特征。要作统计推断,首先要依照一定的规则抽取n个个体,然后对这些个体进行测试或观察得到一组数据,这一过程称为抽样。由于抽样前无法知道得到的数据值,因而站在抽样前的立场上,设有可能得到的值为,n维随机向量()称为样本。n称为样本容量。()称为样本观测值。 如果样本()满足 (1)相互独立; (2) 服从相同的分布,即总体分布; 则称()为简单随机样本。简称样本。 设总体X的概率函数(密度函数)为,则样本()的联合概率函数(联合密度函数为)

3. 统计量 完全由样本确定的量,是样本的函数。即:设是来自总体X 的一个样本,是一个n元函数,如果中不含任何总体的未知参数,则称为一个统计量,经过抽样后得到一组样本观测值,则称为统计量观测值或统计量值。 4. 常用统计量 (1)样本均值: (2)样本方差: (3)样本标准差: 它们的观察值分别为: 这些观察值仍分别称为样本均值、样本方差和样本标准差。 (4)样本(k阶)原点矩 1 1 ,1,2, n k k i i A X k n= == ∑L (5)样本(k阶)中心矩 1 1 (),2,3, n k k i i B X X k n= =-= ∑L 其中样本二阶中心矩2 1 1 (), n k i i B X X n= =- ∑又称为未修正样本方差。 (6)顺序统计量 将样本中的各个分量由小到大的重排成 (1)(2)()n X X X ≤≤≤ L 则称 (1)(2)() ,, n X X X L为样本顺序统计量, ()(1) n X X -为样本的极差。 (7)样本相关系数: 11 22 11 ()()()() 11 ()() n n i i i i i i xy n n x y i i i i x x y y x x y y r S S x x y y n n == == ---- == -- ∑∑ ∑∑ 其中:,x y分别为数据, i i x y的样本均值,, x y S S分别为样本a标准差。5、直方图与箱线图 (1)直方图 先将所有采集的数据进行整理,得到顺序统计量,找出其中的最小值 (1) x,最 大值 ()n x,即所有的数据都落在区间 (1)() , n x x ?? ??上,现取区间(1)() , n x k x k ?? -+ ??(其

数理统计的基本概念

6 数理统计的基本概念 基本要求 1 理解总体、样本(品)、样本容量、简单随机样本的概念。能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。 2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。 3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。 4 理解样本均值、样本方差及样本矩的概念。了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。了解正态总体的某些常用抽样分布。 疑难解答 1、采用抽样的方法推断总体,对样本应当有怎样的要求? 答:为了对总体X的分布进行研究,逐个研究每个个体是不现实的。采用抽样推断总体,其出发点是利用局部认识整体,因此抽出的样本要具有代表性。即要求每个个体被抽取的机会均等,并且抽取一个个体后总体成分不变。首先要求抽样具有“随机性”,第一次抽取的样品X1的可能取值应与总体的可能取值是完全一样的,且去取个个值的概率相同。因此,X1是一个随机变量,并且是与X同分布的随机变量。其次,应具有“独立性”,第一次抽样不改变总体成分,第二次抽取的样品X2可能的值也与X完全一样,且取值的概率也是相同的,因此X2也是与X同分布的一个随机变量且与X1是相互独立的,同样道理,X3,X4,…,X n都是与X同分布的随机变量,并且X1,X2,…,X n是一组相互独立的随机变量,故要求X1,X2,…,X n是简单随机样本。 2、什么是简单随机样本?在实践中如何获得简单随机样本? 答:设X1,X2,…,X n是来自总体X的容量为n的样本,如果它满足以下两个条件,则称它为简单随机样本: (1)X1,X2,…,X n与总体X具有相同的分布 (2)X1,X2,…,X n相互独立 由简单随机样本的定义知,用简单随机样本研究总体,可以更好地用概率论中独立条件下的一系列结论,正是这些结论为概率统计提供了必要的理论基础。 一般说来,对总体进行独立重复观测,便可以获得简单随机样本。 具体来说,当抽取样本容量n相对于总体数N很小时(一般) ≤ n),则连续抽 N 10 1 取n个个体,就近似地看做一个简单随机样本。这是因为抽取的个数很小时,可认为对总体不影响或影响很小。 如果采取有放回抽样,则不必要求n相对很小。 3、什么叫大样本和小样本?它们之间的区别是否是一样本容量的大小来区分的? 答:在样本容量固定的条件下,进行的统计推断、分析问题称为小样本问题,而在样本容量趋于无穷的条件下,进行的统计推断、分析问题称为大样本问题。 然而,众多统计推断与分析问题与统计量或样本的函数的分布相关联。能否得到有关统计量或样本的函数的分布常成为解决问题的关键。所以,大、小样本的区分常与这一分布 *该部分内容考研不作要求。

统计学基本概念

基本概念 1、统计的含义:统计工作、统计资料、统计学 2、社会经济统计学的特点:数量性、社会性、综合性 3、统计工作的职能:统计信息职能、统计咨询职能、统计监督职能 4、统计工作过程:统计调查、统计整理、统计分析 5、统计调查的质量要求:准确性、全面性、及时性、有效性 6、专门调查的方法:普查、重点调查、典型调查、抽样调查 7、统计调查的方法:直接观察法、报告法、采访法、通讯法、实验调查法、网上调查法 8、次数分布的主要类型:钟型分布、U型分布、J型分布 9、统计表的结构,从组成要素看,由总标题、横行与纵栏标题、指标数值等三部分组成 10、统计表的结构,从容上看,由主词、宾词两部分构成 11、统计分析方法:综合指标、动态数列、统计指数、相关回归、抽样推断 12、综合指标从它的作用和方法特点的角度可概括为三类:总量指标、相对指标、平均指标 13、相对指标的种类:计划完成相对指标、结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标 14、平均指标的种类:算术平均数、调和平均数、几何平均数、众数、中位数 15、测定标志变动度的主要方法:全距、四分位差、平均差、标准差、离散系数

16、动态数列按构成其指标数值的性质不同分为:绝对数动态数列、相对数动态数列、平均数动态数列 17、动态数列的水平分析指标:发展水平、平均发展水平、增长量、平均增长量 18、动态数列的速度分析指标:发展速度、增长速度、平均发展速度、平均增长速度 19、测定长期趋势常用的主要方法:间隔扩大法、移动平均法、最小平方法 20、指数按其反映指标性质不同分为:数量指标指数和质量指标指数 21、指数按其表现形式不同分为:综合指数、平均指数、平均指标对比指数 22、相关关系按其方向不同分为:正相关和负相关 23、相关关系按其涉及因素多少分为:单相关和复相关 24、相关关系按其形式不同分为:直线相关和曲线相关 25、抽样调查的组织形式:简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样 26、总体参数的抽样估计方法为点估计和区间估计。 统计分析 1.某市某“五年计划”规定计划期最末一年甲产品产量应达到75万吨,假定每天产量相等,实际生产情况如下表所示(单位:万吨)。试计算该市甲产品产量五年计划完成程度和提前完成计划的时间。 第一年第二年第三年56 58 62 第四年一季二季三季四季16 17 18 18

《概率论与数理统计》习题 第五章 数理统计的基本概念

第五章 数理统计的基本概念 一. 填空题 1. 设X 1, X 2, …, X n 为来自总体N(0, σ2 ), 且随机变量)1(~) (22 1 χ∑==n i i X C Y , 则常数 C=___. 解. ∑=n i i X 1 ~ N(0, n σ2 ), )1,0(~1 N n X n i i σ ∑= 所以 2 1,1σ σ n c n c = = . 2. 设X 1, X 2, X 3, X 4来自正态总体N(0, 22)的样本, 且2 43221)43()2(X X b X X a Y -+-=, 则a = ______, b = ______时, Y 服从χ2分布, 自由度为______. 解. X 1-2X 2~N(0, 20), 3X 3-4X 4~N(0, 100) )1,0(~2022 1N X X -, )1,0(~1004343N X X - 20 1 ,20 1 = = a a ; 100 1,100 1 = = b b . Y 为自由度2的χ2分布. 3. 设X 1, X 2, …, X n 来自总体χ2(n)的分布, 则._____)(______,)(==X D X E 解. 因为X 1, X 2, …, X n 来自总体χ2(n), 所以 E(X i ) = n, D(X i ) = 2n (i = 1, 2, …, n) ,)(n X E = 22) ()(2 2 1=?= =∑=n n n n X D X D n i i 二. 单项选择题 1. 设X 1, X 2, …, X n 为来自总体N(0, σ2 )的样本, 则样本二阶原点矩∑==n i i X n A 1 2 21的方差为 (A) σ2 (B) n 2 σ (C) n 42σ (D) n 4 σ 解. X 1, X 2, …, X n 来自总体N(0, σ2), 所以

第6章数理统计的基本概念习题及答案

. 第六章 数理统计的基本概念 一.填空题 1.若n ξξξ,,,21Λ是取自正态总体),(2σμN 的样本, 则∑==n i i n 11ξξ服从分布 )n ,(N 2 σμ . 2.样本),,,(n X X X Λ21来自总体),(~2 σμN X 则~)(22 1n S n σ - )(1χ2-n ; ~)(n S n X μ- _)(1-n t __。其中X 为样本均值,∑=--=n i n X X n S 122 11)(。 3.设4321X X X X ,,,是来自正态总体).(220N 的简单随机样本, +-=221)2(X X a X 243)43(X X b -,则当=a 20 1=a 时,=b 1001=b 时,统计量X 服从2 X 分布,其自由度为 2 . 4. 设随机变量ξ与η相互独立, 且都服从正态分布(0,9)N , 而129(,,,) x x x L 和 129(,,,)y y y L 是分别来自总体ξ和η的简单随机样本, 则统计量 ~U = (9)t . 5. 设~(0,16),~(0,9),,X N Y N X Y 相互独立, 129,,,X X X L 与1216 ,,,Y Y Y L 分别 为X 与Y 的一个简单随机样本, 则22 2 129222 1216 X X X Y Y Y ++++++L L 服从的分布为 (9,16).F 6. 设随机变量~(0,1)X N , 随机变量2~()Y n χ, 且随机变量X 与Y 相互独立, 令T =, 则2~T F (1,n ) 分布. 解:由T =, 得22 X T Y n =. 因为随机变量~(0,1)X N , 所以22~(1).X χ

第6章 数理统计的基本概念1内容框图

第6章 数理统计的基本概念 6.1 内容框图 6.2 基本要求 (1) 理解总体、样本及统计量的概念,并熟练掌握常用统计量的公式. (2) 掌握矩法估计和极大似然估计的求法,以及估计无偏性、有效性的判断. (3) 掌握三大抽样分布定义,并记住其概率密度的形状. (4) 理解并掌握有关正态总体统计量分布的几个结论,如定理6.4~6.9及定理6.11. 6.3 内容概要 1) 总体与样本 在数理统计中,我们把作为统计研究对象的随机变量称为总体,记为 ξ,η,… 。对总体进行 n 次试验后所得到的结果,称为样本,记为(n X X X ,,,21Λ),(n Y Y Y ,,,21Λ),……,其中,试验次数 n 称为样本容量。样本(n X X X ,,,21Λ)中的每一个 i X 都是随机变量。样本所取的一组具体的数值,称为样本观测值,记为

(n x x x ,,,21Λ) 。 具有性质: (1)独立性,即 n X X X ,,,21Λ 相互独立。 (2)同分布性,即每一个 i X 都与总体 ξ 服从相同的分布。 称为简单随机样本 。 如果总体 ξ 是离散型随机变量,概率分布为 }{k P =ξ,那么样本(n X X X ,,,21Λ)的联合概率分布为∏∏====== ===n i i n i i i n n x P x X P x X x X x X P 1 1 2211}{}{},,,{ξΛ。 如果总体 ξ 是连续型随机变量,概率密度为 )(x ?,那么样本(n X X X ,,,21Λ)的联合概率密度为 ∏∏==== n i i n i i X n x x x x x i 1 1 21)()(),,,(*?? ?Λ 。 如果总体 ξ 的分布函数为 )(x F ,那么样本(n X X X ,,,21Λ)的联合分布函数为 ∏∏====n i i n i i X n x F x F x x x F i 1 1 21)()(),,,(*Λ 。 2)用样本估计总体的分布 数理统计的一个主要任务,就是要用样本估计总体的分布。 参数估计又可以分为两种,一种是点估计,另一种是区间估计。 3) 矩法估计 求矩法估计的步骤为: (1)计算总体分布的矩),,,()(21m k k f E θθθξΛ=,m k ,,2,1Λ=,计算到m 阶矩 为止(m 是总体分布中未知参数的个数)。 (2)列方程 ?????????======∧ ∧∧ m m m m m m X E f X E f X E f )()?,,?,?()()?,,?,?()?,,?,?(2122212211ξθθθξθθθξθθθΛΛ ΛΛΛ 从方程中解出m θθθ?,,?,?21Λ,它们就是未知参数m θθθ,,,21Λ的矩法估计。

统计学中的基本概念

统计学的几个基本概念 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。 划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中

才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。 如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的; ★变异对于统计非常重要,没有变异就没有统计。这是因为,如果总体单位之间不存在变异,我们只需要了解一个总体单位的资料就可以推断总体情况了; ★变异性和同质性之间相互联系、相互补充,是辩证统一的关系。用同质性否定变异性或用变异性否定同质性都是错误的。 2.总体单位 是构成总体的每一个个体。 【思维动起来】 对2015年10月份某市小学生的近视情况进行调查: 统计总体是什么总体单位是什么 总体的同质性是什么变异性是什么 3.总体和总体单位的关系 在统计研究中,确定统计总体和总体单位是十分重要的,它决定于统计研究目的和认识对象的性质。在一次特定范围、目的的统计研究中,统计总体与总体单位是不容混淆的,二者的含义是确切的,是包含与被包含的关系,但是随着统计研究任务、目的及范围的变化,统计总体和总体单位可以相互转化。

统计学中的基本概念

1、2统计学得几个基本概念 1. 2. 1总体与总体单位 1、总体 ⑴总体得概念:总体就是指客观存在得、具有某种共同性质得许多个别事物组成得整体; 在统计硏究过程当中,统计研究得目得与任务居于支配与主导得地位, 有什么样得硏究目得就应该有什么样得统计总体与之相适应。例如:要硏究 我们学院教师得工资情况,那么全体教师就就是研究得总体,其中得每一位 教师就就是总体单位;如果要了解某班50个学生得学习情况,则总体就就是该班得50名学生,每一名学生就是总体单位。根据我们研究目得得不同,我们要选取得研究对象也就就是研究总体相应地要发生变化。 ⑵总体得分类: 总体根据总体单位就是否可以计量分为有限总体与无限总体:★有限总体:指所包含得单位数就是有限得总体。 如一个企业得全体职工、一个国家得全部人口等都就是有限总体; ★无限总体:指所包含得单位数目就是无限得,或准确度量它得单位数就是不经济或没有必受寻这样得总体称为无限总体。 如企业生产中连续生产得大量产品,江河湖海中生长得鱼得尾数 划分有限总体与无限总体对于统计工作得意义就在于可以帮助我们设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进 行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位 进行非全面调查,据以推断总体。 ⑶总体得特征: ★大量性:就是指构成总体得单位数要足够得多,总体应由大量得单位所构成。大量性就是对统计总体得基本要求。 个别单位得现象或表现有很大得偶然性,而大量单位得现象综合则相对稳定。因此,现象得规律性只能在大量个别单位得汇总综合中才能表现出来。只有数量足够得多,才能准确地反应我们要研究得总体得特征,达到我们得研究目得。

数理统计的基本概念汇总

6数理统计的基本概念 6.1 基本要求 1 理解总体、样本(品)、样本容量、简单随机样本的概念。能在总体分布给定情况下,正确无误地写出样本的联合分布,这是本章的难点。 2*了解样本的频率分布、经验分布函数的定义,了解频率直方图的作法。 3 了解χ2分布、t分布和F分布的概念及性质,了解临界值的概念并会查表计算。 4 理解样本均值、样本方差及样本矩的概念。了解样本矩的性质,能借助计算器快速完成样本均值、样本方差观察值的计算。了解正态总体的某些常用抽样分布。 6.2 内容提要 6.2.1 总体和样本 1 总体和个体研究对象的某项特征指标值的全体称为总体(或母体),组成总体的每个元素称为个体。总体是一个随机变量,常用X,Y等来表示。 2 样本从总体中随机抽出n个个体称为容量为n的样本,其中每个个体称为样品,它们都是随机变量。 3 简单随机样本设X1,X2,…,X n是来自总体X的容量为n 的样本,如果这n个随机变量X1,X2,…,X n相互独立且每个样品X i与总体X具有相同的分布,则称X1,X2,…,X n为总体X的简单随机样本。 4 样本的联合分布 *该部分内容考研不作要求。 149

150 若总体X 具有分布函数F (x ),则样本(X 1,X 2,…,X n )的联合分布函数为 ∏==n i i n x F x x x F 1 21) (),,,( 若总体X 为连续型随机变量,其概率密度函数为f (x ),则样本的联合概率密度为 ∏== n i i n x f x x x f 1 21) (),,,( (6.1) 若总体X 为离散型随机变量,其分布律为P {X =a i }=p i (i =1,2,…n),则样本的联合分布为 ∏======n i i i n n x X P x X x X x X P 1 2211} {},,,{ (6.2) 其中),,,(21n x x x 为),,,(21n X X X 的任一组可能的观察值。 6.2.2 样本分布 1 频率分布 设样本值(x 1,x 2,…,x n )中不同的数值是x 1*,x 2*,…,x l *,记相应的频数分别为n 1,n 2,…,n l ,其中 x 1* < x 2* <…< x l *且 n n l i i =∑=1 。 则样本的频数分布及频率分布可由表6-1给出。

统计学中的基本概念

变异 ?同质~性质相同。是指基本条件相同 变异~同质事物之间的差异。是指不同的个体在相同的条件下,对外界环境因素的反应不同 ?总体Population:根据研究目的所确定的同质观察单位的全体; ?个体Individual:是构成总体的最基本观察单位; ?根据随机化原则有总体中随机抽取部分个体组成总体的过程 ?样本Sample:是从总体中按照一定的目的随机抽取的一部分个体。为什么要抽样? ?样本含量Sample Size:样本中包含的个体个数。 抽样原则 一个样本应具有: “代表性(representative)” “随机性(randomization)” “可靠性(reliability)” 如果进行两个或多个样本之间的比较,要求:每二个样本之间应具有:可比性(comparable) 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 误差(error) ?系统误差(system error) ?由于固定的原因(常见实验条件),影响资料的准确性。可以克服。 ?随机测量误差(random measurement error) ?由于偶然的因素造成同一对象多次测量结果的差异。可控制但不可 消除。 应采取措施,尽最大可能在一定的允许范围内 抽样误差(sampling error) 抽样的原因造成统计量与总体参数或不同样本统计量之间的差异。 原因:①个体变异②抽样 抽样误差,对它要用统计方法进行正确分析 概率 ?概率有古典概率与统计概率之分, ?医学上常用的是统计概率f/N ?必然事件,概率为1 ?不可能事件,概率为0 ?小概率事件,P≤0.05 或P≤0.01 ?常把P≤0.05 作为事物差别有统计学意义的界限,

《应用数理统计》吴翊李永乐第一章数理统计的基本概念课后习题

第一章 数理统计的基本概念 课后习题参考答案 设对总体X 得到一个容量为10的子样值:,,,,,,,,,,试分别计算子样均值X - 和子样方差 2S 的值。 解:12,n X X X 为总体X 的样本, 根据 121 ()n X X X X n = +++ 求得X =; 根据2 21 1()n i i S X X n ==-∑ 求得2 S =。 设总体X 的分布函数为()x F ,密度函数为()x f ,n X X X ,,,21 为X 的子样,求最大顺序统计量()n X 与最小顺序统计量()1X 的分布函数与密度函数。 解: 将总体X 中的样本按照从小到大的顺序排列成()()()n X X X ≤≤≤ 21 ()()()()()()[]n n n n x F x x P x x P x x P x x P x F =<<<=<= 21 ()()[]()()x f x nF x F x f n n n 1' -== ()()()()() ()[]()[]()[]()[] n n n x F x x P x x P x x P x x P x x P x x P x x P x F --=<-<-<--=≥≥≥-=<=1111111212111 ()()[]()[] ()x f x F n x F x f n 1 111'--== 设总体X 服从正态分布N(12,4),今抽取容量为5的子样521,,,X X X ,试问: (1)子样的平均值X 大于13的概率为多少 (2)子样的极小值(最小顺序统计量)小于10的概率为多少 (3) 子样的极大值(最大顺序统计量)大于15的概率为多少 解:

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

统计学中的基本概念

. 1.2 统计学的几个基本概念 1.2.1 总体和总体单位 1.总体 (1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体; 在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。例如:要研究我们学院教师的工资情况,那么全体教师就是研究的总体,其中的每一位教师就是总体单位;如果要了解某班50个学生的学习情况,则总体就是该班的50名学生,每一名学生是总体单位。根据我们研究目的的不同,我们要选取的研究对象也就是研究总体相应地要发生变化。 (2)总体的分类: 总体根据总体单位是否可以计量分为有限总体和无限总体: ★有限总体:指所包含的单位数是有限的总体。 如一个企业的全体职工、一个国家的全部人口等都是有限总体; ★无限总体:指所包含的单位数目是无限的,或准确度量它的单位数是不经济或没有必要的,这样的总体称为无限总体。 如企业生产中连续生产的大量产品,江河湖海中生长的鱼的尾数等等。划分有限总体和无限总体对于统计工作的意义就在于可以帮助我们

设计统计调查方法。很显然,对于有限总体,可以进行全面调查,也可以进行非全面调查,但对于无限总体不能进行全面调查,只能抽取一部分单位进行非全面调查,据以推断总体。 (3)总体的特征: ★大量性:是指构成总体的单位数要足够的多,总体应由大量的单位所构成。大量性是对统计总体的基本要求。 个别单位的现象或表现有很大的偶然性,而大量单位的现象综合则相对稳定。因此,现象的规律性只能在大量个别单位的汇总综合中;.. . 才能表现出来。只有数量足够的多,才能准确地反应我们要研究的总体的特征,达到我们的研究目的。 ★同质性:指总体中各单位至少在某一个方面性质相同,使它们可以结合起来构成总体。同质性是构成统计总体的前提条件。 ★变异性:即构成总体的各个单位除了至少在某一方面具有共同性质外,在其他方面具有一定的差异。差异性是统计研究的主要内容。如以一个班级的所有学生作为一个总体,则“专业”是该总体的同质性,而“性别”、“籍贯”等则是个体之间的变异性;以我院全体教师为一个总体,则“工作单位”是其同质性,而“学历”、“月工资”等则是它的变异性。 需要特别说明的三个问题: ★变异是客观存在的,没有变异的事物是不存在的;

概率论与数理统计知识点总结(详细)

《概率论与数理统计》 第一章概率论的基本概念 (2) §2.样本空间、随机事件 (2) §4等可能概型(古典概型) (3) §5.条件概率 (4) §6.独立性 (4) 第二章随机变量及其分布 (5) §1随机变量 (5) §2离散性随机变量及其分布律 (5) §3随机变量的分布函数 (6) §4连续性随机变量及其概率密度 (6) §5随机变量的函数的分布 (7) 第三章多维随机变量 (7) §1二维随机变量 (7) §2边缘分布 (8) §3条件分布 (8) §4相互独立的随机变量 (9) §5两个随机变量的函数的分布 (9) 第四章随机变量的数字特征 (10) §1.数学期望 (10) §2方差 (11)

§3协方差及相关系数 (11) 第五章 大数定律与中心极限定理 (13) §1. 大数定律 ...................................................................................... 13 §2中心极限定理 . (13) 第一章 概率论的基本概念 §2.样本空间、随机事件 1.事件间的关系 B A ?则称事件B 包含事件A ,指事件A 发生必然导致事件B 发生 B }x x x { ∈∈=?或A B A 称为事件A 与事件B 的和事件,指当且仅当A ,B 中至少有一个发生时,事件B A ?发生 B }x x x { ∈∈=?且A B A 称为事件A 与事件B 的积事件,指当A ,B 同时发生时,事件B A ?发生 B }x x x { ?∈=且—A B A 称为事件A 与事件B 的差事件,指当且仅当A 发生、B 不发生时,事件B A —发生 φ=?B A ,则称事件A 与B 是互不相容的,或互斥的,指事件A 与事件B 不能同时发生,基本事件是两两互不相容的 且S =?B A φ=?B A ,则称事件A 与事件B 互为逆事件,又称事件A 与事件B 互为对立事件 2.运算规则 交换律A B B A A B B A ?=??=? 结合律)()( )()(C B A C B A C B A C B A ?=???=??

相关主题
文本预览
相关文档 最新文档