- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X
例: 已知 X N ( , 2 ) ,求概率 P{a x b} .
例: 已知 X N ( , 2 ) ,可求得
P( X ) 2(1) 1 0.683
P( 2 X 2 ) 2(2) 1 0.954 P( 3 X 3 ) 2(3) 1 0.997
一、频率与概率
(Frequency and Probability)
频率: 设在相同条件下,独立重复进行n次试验,事件A 出现m次,则事件A出现的频率为
f n ( A) m n
。
概率:刻画随机事件A发生的可能性大小的,介于0与1 之间的数, 用P(A) 表示 。例如,抛一枚银币,出现正面的概
而实际当中一个随机现象所服从的分布往往是未知的, 或者虽然知道是什么分布,但分布中的参数是未知的,这就 是统计学所要解决的首要问题. 统计学的主要内容是统计推断,即用样本推断总体.它 包括参数估计和假设检验两大部分.
八、统计量(statistic)
统计量 : 样本( X 1 , X 2 ,, X n ) 的函数 g ( X 1 , X 2 ,, X n )
医学统计学
(Medical Statistics)
第 2讲
概率论与统计基础
西南交通大学峨眉校区基础课部数学教研室
本讲结构
一、频率与概率 二、随机变量 三、随机变量的分布 四、正态分布 五、随机变量的数字特征 六、中心极限定理 七、总体与样本 八、统计量 九、统计量的分布 十、常用的几种分布密度图形与分位点
且不含未知参数.
统计量是一个随机变量, 它也服从某种分布 .
1 n (1) X X i n i 1
n 1 (2) S 2 Xi X n 1 i 1
样本均值
2
样本方差
1 n (3) S Xi X n 1 i 1
2
样本标准差
九、统计量的分布
(Ⅰ) 一个正态总体
(2) ( X Y ) ( 1 2 )
2
n
(3) (n 1) S12
2
~ N (0,1)
m
2 (m 1) S2
2
2
~ 2 (n m 2)
(4)
( X Y ) ( 1 2 ) 1 1 (n 1) S (m 1) S n m nm2
则
S12 S
2 2
12 22
~ F (n 1, m 1)
设 X 1 , X 2 , , X n 与 Y1 , Y2 , , Ym 分别是来自正态总体
X ~ N ( 1 , 2 ) , Y ~ N ( 2 , 2 ) 的相互独立的简单随机样本.
则:
2 2 (1) X Y ~ N ( 1 2 , ) n m
1 率为 2
.
频率与概率间的关系: 1. 频率总是围绕概率上下波动 ; 2. n越大,频率波动幅度越小,频率越接近概率 ; 3. 概率不是频率的极限。
Certain
1
必然事件 随机事件 不可能事件
P = 1 0 < P < 1 P = 0
0.5
Impossible
0
P ≤ 0.05或P ≤ 0.01称为小概率事件, 统计学上认为不 大可能发生。在假设H0下,如果小概率事件居然发生了,则 我们有理由怀疑H0的正确性 .
1 1.5
3
6
0
x
特别,当 0, 1时,N (0,1) 称为标准正态 分布,其概率密度为:
1 f ( x) e 2
而分布函数为
( x)
x
x2 2
1 f (t )dt 2
x
e dt
N (0,1)
t2 2
定理: 若 X N ( , 2 ) , 则
X ~ N ( 1 , 12 ) , Y ~ N ( 2 , 22 ) 的相互独立的简单随机样本.
n 1 令 X Xi n i1 n 1 2 S12 ( X X ) i n 1 i1
1 m Y Yj m j 1
m 1 2 S 22 ( Y Y ) j m 1 j 1
二、随机变量
(Random Variable)
随机事件
数量化 数值化
随机变量
例如:随机抛一粒骰子,设变量X表示掷得的点数, 则X可以取 1,2,3,4,5,6 等不同值,故X是一个变量. 又由于 在一次实验中X到底取何值是完全随机的, 故称X为随机 变量.
随机变量的取值可以是有限个,可以是可数无穷多 个,也可以是不可数无穷多个。由随机变量的取值情况 将其分类:
分布名称 distribution 二项分布
Binomial distribution
分布记号
X ~ B(n, p)
均值 mean
方差 variance
np(1 p)
说明
n次独立重复实验,事件 在每次出现的概率为p 二项分布的极限分布, 其中λ=np 又叫巴斯卡分布,重复 实验直到出现k次成 功,X表示实验的次数
2 1 2 2
~ t (n m 2)
十、常用的几种分布密度图形与分位点
标准正态分布 (U分布)
0.4 0.3 0.2 0.1
-2
-1
1
2
2 (n ) 分布
0.4
n=2
0.3
n=3
0.2 0.1
n=5 n = 10 n = 15
5
10
15
20
25
t分布
0.4 0.3 0.2 0.1
二、连续型随机变量
可以在一个区间内连续取值,它在任一点的概率都等于0, 即: P{ X a} 0
概率分布规律由概率密度函数 f (x) 描述.
概率密度函数性质: (1) (2)
f ( x) 0
f ( x)dx 1
b a
(归一性)
(3) P{a X b} f ( x)dx F (b) F (a) 分布函数: F ( x) f ( x)dx
np
泊松分布
Poisson distribution
X ~ P ( )
k p
k (1 p ) p2
负二项分布
Negative binomial distribution
缺
X ~ N ( , 2 )
正态分布
Normal distribution
2
最重要的分布
六、中心极限定理
X1 , X 2 ,, X n 独立同分布,且 EX i , DX 2 i
离散型随机变量(discrete random variable):
X 的取值为有限个或可数无穷多.
连续型随机变量(continuous random variable):
X的取值为不可数无穷多(某一区间内的
任何数值).
注:存在着既不是离散型也不是连续型的随机变量 .
三、随机变量的分布
一、离散型随机变量
n= 1 n=20
-3
-2
-1
1
2
3
t 分布的图形(红色的是标准正态分布)
F分布
0.8 0.6 0.4 0.2
1
2
3ne-tailed probability
双尾概率 two-tailed probability
分位点,临界值 critical value
x
四、正态分布
(Normal distribution)
1 e X N ( , ) ,其概率密度为: f ( x) 2
2
( x )2 2 2
其中 x R , 0为常数,其图象为
f ( x)
1 2
0
x
其中 为形状参数:
f ( x)
1 2
设总体 X ~ N ( , 2 ) ,样本为(
2 (1) X ~ N ( , ) n
X (3) ~ T (n 1) S n
),则
~ N (0,1)
(2)
X
n
(n 1) S 2 2 (4) ~ (n 1) 2
( II ) 两个正态总体
设 X 1 , X 2 , , X n 与 Y1 , Y2 , , Ym 分别是来自正态总体
概率分布规律用分布律(也称概率分布)描述:
X
P( X xi )
x1
p1
x2
p2
i i
xn
pn
归一性:
p( x ) p
i 1 i 1
1
例1: 掷3枚硬币, 用X表示出现正面的次数, 写出X的分布律. 例2:某射击手连续向一目标射击,每次击中的概率为0.8 ,直 到击中为止, 求射击次数的概率分布 .
样本 (sample) —— 从总体中抽取的部分个体.
称随机变量 X 1 , X 2 , , X n 为容量为n的一个样本. 称 ( x , x , , x ) 为总体 X 的一个容量为n的样本观测 1 2 n 值,或称样本的一个实现 .
概率论与统计学的联系与研究对象
概率论是研究随机现象数量规律的数学分支,研究随机 现象首先要知道它的概率分布,在概率论的许多问题中,概 率分布通常是已知的.
可以看出,在一次试 验里, X 几乎总是落在区 间 ( 3 , 3 )之中。 我们把这一性质称为正态