正态分布及其应用(1)
- 格式:ppt
- 大小:468.50 KB
- 文档页数:31
正态分布及其应用安徽财经大学统计与应用数学学院 吴礼斌一. 随机变量及其分布(Random variable and Distribution )定义1.1 设E 是随机试验,它的样本空间为Ω={ω|ω为基本事件},对每一个样本点即基本事件ω∈Ω,都对应一个实数X(ω),对于任意实数x ,集合{ω| X (ω) ≤x }有确定的概率.则称X(ω)为随机变量,简记为X 。
随机变量按其取值情况可以分为两类:离散型与非离散型,常见非离散的连续型。
定义1.2 设X 为离散型随机变量,它的所有可能取值为x 1,x 2,…,x k ,…,(有限个或可列无限个),X 取值为x k 的概率记为).,3,2,1(,}{L ===k p x X P k k (2.1)称(2.1)式为随机变量X 的概率分布或分布律(Law of distribution),简称(2.1)式为X 的分布。
定义1.3 设X 是随机变量,任意给定实数x ,记事件}{x X ≤的概率为}{)(x X P x F ≤= (2.4.1)则F(x)为实值函数,称F(x)为X 的分布函数(distribution function )。
随机变量X 的分布函数)(x F 具有如下性质:(1)单调非降性;(2)规范性;(3)右连续性。
定义1.4设随机变量X 的其分布函数为F(x),若存在非负可积函数f(x),使得对于任意实数x, 有∫∞−=≤=xdt t f x X P x F )(}{)( (3.1)则称X 为连续型随机变量,称f(x)为X 的概率密度函数(Density function and nature ),简称概率函数或密度函数,记为X ~f(x),读作X 服从以f(x)为概率密度函数的随机变量。
X 的概率密度函数f(x)具有两条基本性质:(1)非负性;(2)完备性。
二、正态分布(Normal distribution)1.一般正态分布定义2.1 如果连续型随机变量X 的密度函数为),(,21)(22)(21+∞<<−∞=−−x ex f x µσσπ (2.1)其中)0(,>σσµ为常数,则称X 服从参数为µ和2σ的(一般)正态分布或高斯分布(Normal distribution or Gauss distribution ),记作),(~2σµN X 。
正态分布的理论原理及应用正态分布(Normal Distribution),又称高斯分布(Gaussian Distribution),是概率统计学中最重要的概率分布之一,也是最常见的连续概率分布之一、正态分布在理论研究和实际应用中都起到了重要的作用。
1.中心极限定理:中心极限定理是正态分布理论的基础,它指出,独立同分布的随机变量的和的极限分布依近似于正态分布。
这意味着,对于大量独立随机变量的和,即使这些变量的分布不同,其总体分布也会接近于正态分布。
2.正态分布的概率密度函数:正态分布的概率密度函数由两个参数决定,即均值(μ)和标准差(σ)。
其概率密度函数可以表示为:f(x)=(1/(σ*√(2π)))*e^(-((x-μ)^2/(2σ^2)))3.正态分布的特性:-均值μ是分布的中心,标准差σ决定了分布的离散程度。
-68%的观测值在均值左右一个标准差范围内,95%的观测值在均值左右两个标准差范围内,99.7%的观测值在均值左右三个标准差范围内。
1.统计分析:正态分布广泛应用于统计分析中。
很多统计模型都需要基于正态分布的假设。
例如,参数估计、假设检验、方差分析等都需要基于正态分布进行推断。
2.质量控制:质量控制中常常使用正态分布。
通过收集样本数据,计算平均值和标准差,可以对产品的质量进行控制和评估。
例如,正态分布常用于确定产品的上下公差。
3.自然科学:正态分布在自然科学中也有应用。
例如,生物学中研究身高、体重等指标时可以使用正态分布。
物理学中粒子运动的速度和位置分布也可以近似为正态分布。
4.金融与经济学:金融市场和经济领域中,许多变量的分布近似为正态分布。
例如,股票收益率、利率、汇率等可以建模为正态分布。
这使得研究人员能够使用正态分布的属性来做出预测和决策。
5.归一化处理:正态分布是进行归一化处理的常用工具之一、通过将数据转化为标准正态分布,可以对不同数据进行比较和分析。
二、正态分布的应用(一)综述生活中各样各类的问题都可以用正态分布来解决或体现。
它主要包含这些方面:1. 估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。
2. 制定参考值范围:(1)正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
(2)百分位数法常用于偏态分布的指标。
3. 质量控制:为了控制实验中的测量(或实验)误差,常以作为上、下警戒值,以作为上、下控制值。
这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
4. 正态分布是许多统计方法的理论基础。
检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。
许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
(二)估计正态分布资料的频数分布例1.10 某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=172.70cm,标准差s=4.01cm,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+-1.96s、X+-2.58s范围18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。
本例,μ、σ未知但样本含量n较大,按式(3.1)用样本均数X和标准差S分别代替μ和σ,求得u值,u=(168-172.70)/4.01=-1.17。
查附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到0.07,两者相交处为0.1210=12.10%。
该地18岁男大学生身高在168cm以下者,约占总数12.10%。
其它计算结果见表3。
表3 100名18岁男大学生身高的实际分布与理论分布分布x+-s 身高范围(cm)实际分布人数实际分布百分数(%)理论分布(%)X+-1s 168.69~176.71 67 67.00 68.27 X +-1.96s 164.84~180.56 95 95.00 95.00 X+-2.58s 162.35~183.05 99 99.00 99.00 三)制定医学参考值范围某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。