生物统计学教案
第二章概率和概率分布
教学时间:2学时
教学方法:课堂板书讲授
教学目的:重点掌握离散型概率分布和连续型概率分布,掌握概率、总体特征数的定义和一般运算,了解概率分布与频率分布的关系
讲授难点:离散型概率分布和连续型概率分布
2.1 概率的基本概念(45分钟)
2.1.1问题的提出
从同一总体中抽取样本,各次所得到的样本不会完全相同。用不同样本去推断同一总体将得出不同的结论。这些结论不可能都是正确的。用某个样本去推断总体时,错误的可能性有多大?置信度有多高?这是对总体推断时所必须回答的问题。为回答这个问题,就要对总体分布有所了解。总体分布是建立在概率这二概念基础之上的。
自然现象,一般可分为确定性现象和非确定性现象。非确定性现象或称为随机现象。随机现象不存在简单的因果关系。支配这些现象出现的因素很多,各因素所起的作用不一样,作用的程度也不一样,很难遇到两个不同个体接受相同的配合方式,因此从每一个个体所观察到的结果都不一样。
研究偶然现象本身规律性的科学称为概率论」于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性的科学就是统计学。
2.1.2事件及事件间的关系(自已复习)
2.1.3 概率的统计定义(重点)
设某随机试验共进行k次,成功了(事件A)I次,则称l/k是k次随机试验中成功的频率。我们会发现,随着k的增大,频率l/k将围绕某一确定的常数p做平均幅度越来越小的变动,最终稳定于p,p即为事件A的概率。
表2- 1不同样本含量的抽样试验
抽样号
k=20
l l/k
k=200
l l/k
k=2000
l l/k
110.050320.1604030.202
240.200310.1554140.207
310.050380.1904090.205
440.200490.2453820.191
550.250400.2004160.208
670.350370.1854130.207
760.300400.2003880.194
820.100290.1454230.212
940.200470.2354100.205
1040.200530.2653950.193
本例的l/k最后似乎稳定在0.200处,称0.200为事件A的概率,记为:
P(A)= 0.200
它的含义是随机试验中的每一个个体成功的可能性为0.200。概率的概念是,事件在试验结果中出现可能性大小的定量计量。概率有以下性质
(1)任何事件(A)的概率均满足0W P (A)<
1
(2)必然事件(W)的概率为1 P (W)= 1
(3)不可能事件(V)的概率为0 P (V)= 0
2.1.4 概率的古典定义
条件:1、随机试验的全部可能的结果(基本事件数)是有限的
2、各基本事件间是互不相容且等可能的
定义:P (A)= m / n
其中,m为事件A中所包含的基本事件数,n为基本事件总数缺点:在没给出概率的定义之前已经利用了概率的概念。
2.1.5 概率的一般运算(重点)
1 ?加法法则:
P (A U B) = P (A) + P (B) - P (A H B)
若A 、B 为互不相容事件,则
P (A U B )= P (A ) + P (B )
若有限个事件两两互不相容,则
P ( A l U A 2U-U A n )= P (A l )+ P ( A 2)+…+ P ( A n ) 事件A 与事件A 的概率存在以下关系
P ( A ) = 1- P (A )
2 ?条件概率:
在已知事件B 发生的条件下,事件A 发生的概率,称为事件A 发生的条件概率,记 为 P (A I B )。相对于条件概率,把没有附加条件的概率称为无条件概率。
(例2.2)
P (A I B )= P (AB ) / P (B )
3.概率乘法法则: 两事件交的概率,等于其中一事件(其概率必须不为 0)的 概率乘以另一事件在已知前一事件发生条件下的条件概率。
P (AB )= P (B ) P (A I B )
或
P (AB )= P (A ) P ( B I A )
4 .独立事件:若事件A 的发生并不影响事件B 发生的概率,即
P (B I A )= P (B )或 P (A I B )= P (A )
则称A 和B 为相互独立事件。
对于独立事件,概率乘法公式为
P (AB )= P (A ) P (B )
5.贝叶斯定理:认事件B 且只能与A i , A 2,……,A k 之一同时发生,那么, 在事件B 已发生的条件下,A i 发生的概率
' p(A j )p(B | A j )
j 勻
举例(例2.3) 2.2
概率分布(25分钟)
P (A i | B)二
P (A 」p(B |AJ
k
2.2.1 随机变量
随机变量:随机试验中被测定的量,常以大写的拉丁字母表示。
观测值:随机变量所取得的值,常以带下标的小写字母表示。
离散型随机变量:随机变量可能取得的值为有限个或可数无穷
个孤立的数值。
连续型随机变量:随机变量可能取得的值为某一区间内的任何数值。
222 离散型概率分布(重点)
概率函数:将随机变量X所取得值x的概率P (X = x)写成x的函数p(x),这样的函数称为随机变量X的概率函数
p(x) = P (X = x)
概率函数应满足:
p(x)_O ' p(x)=1
x
概率分布:将X的一切可能值x i ,x2,…,X n,…,以及取得这些值的概率p(x i),
P(X2)…,p(x n),…,排列起来,即构成离散型随机变量的概率分布。可用概率分布表和概率分布图表示
分布函数:随机变量小于等于某一可能值(x o)的概率,记为F (x o)
F x o;=二p (x i P - x o
X i —Xo
223 连续型概率分布(重点)
密度函数:随机变量X的值落在区间(x, x +△ x)内的概率为P (x △ x),当4x—0时,[P (x f(x)= lim P(x X x x) -■x J0 / ■. x 图2-2连续型分布曲线 概率P (a b P a X 岂b 二f (x)dx a -x0 F(x°)=P(X E xo)=j*f(x)dx, F (—比)=0, F L )=1分布函数:随机变量取得小于x o的值的概率,记为F (x o) 对于任意两点a和b P a X - b i; = F b - F a 2.2.4 概率分布与频率分布的关系统计量:由样本数据计算出来的各种量,通常以小写拉丁字母表示参数:总体恒定的量,通常以小写的希腊字母表示 分布曲线:概率密度的图形y = f (x),称为分布曲线 2.3 总体特征数(20分钟) 2.3.1 随机变量的数学期望和方差(重点) 总体特征数:描述概率分布特征的数字称为总体特征数。随机变量的数学期望(总体平均数)和方差是两个主要的特征数。 数学期望:可由频数资料的样本平均数,推导出总体平均数。 k _ 二f i X i k f i x 二」丄X i —」-EX 八pxx n i 二n x 方差:同样,从频数资料得到的样本方差 2 k f i 2 s2: X i - 乂 n - 1 i =1 用(T 2表示总体方差,则总体方差 貯2=送P(X)(X_A)2= E[(X_A)21 x - 或者 匚2 = E X 2一E X 2 总体标准差定义为 p x x __「E X - 1 2 仿照离散型随机变量,连续型随机变量的数学期望定义为: [=E X = xf x dx —oO 连续型随机变量的方差定义为: 匚2二 E X -丄;;2= . :x 「丄「f x dx 2.3.2 数学期望和方差的计算 数学期望的运算法则如下,其中c为常数 E c = E cX 二E X c = E cX A 二c cE X E X c cE X A 一 2 X ) X var(X)=E(X var(cX)= 2 c var ( var ( X+ c)=var(X var ( cX+ A)= 2 c var (总体方差记为var(X),总体方差的运算法则如下: