正态分布和线性回归
- 格式:docx
- 大小:125.95 KB
- 文档页数:9
线性回归的前提条件线性回归的前提假设条件是:(1)自变量与因变量是否呈直线关系。
(2)因变量是否符合正态分布。
(3)因变量数值之间是否独立。
(4)方差是否齐性。
其实如果正规地来说,应该是看残差(residual)是否正态、独立以及方差齐。
所谓残差,就是因变量的真实值与估计值之间的差值。
回归分析是一类统计方法,包括本次介绍的线性回归以及后面将要介绍的logistic回归、Cox回归等,该类方法内容十分丰富,在医学应用中也极为广泛。
回归分析主要是通过建立回归方程来说明某一个事物随另一个(或多个)事物的变化而变动的规律。
相关分析研究的是两个或多个变量相互依存变动的规律,见统计分析之相关,而回归分析则是探索某变量(因变量)如何依赖于其他变量(自变量)的变化而变动的规律,是单方依存,而不是相互依存。
回归分析主要根据因变量的类型而划分不同方法,线性回归其因变量必须是定量变量,后面介绍的logistic回归、Cox回归等因变量则属于其他类型。
线性回归可以说是回归家族中最为经典的方法,同时也是相对简单、容易理解的方法。
本系列主要介绍线性回归的应用,具体内容包括:(1)线性回归的单因素分析;(2)线性回归的多因素分析;一、线性回归简介线性回归是研究因变量(dependent variable)与自变量(independent variable)相依关系的技术。
因变量又称应变量(response variable),是随机变量,具有一个随机分布,依赖于一个或多个自变量。
自变量有时也被称为解释变量(explanatory variable)或预测变量(predictor variable),是非随机的,不依赖于其他变量。
线性回归中的因变量必须是定量变量,自变量可以是定量变量,也可以是分类变量。
例如研究体重对高血压的影响,体重是自变量,高血压受体重的影响,是因变量。
线性回归大致可分为三类:当因变量有一个,自变量也只有一个时,称之为简单线性回归(simple linear regression);当因变量有一个,自变量有多个时,称之为多重线性回归(multiple linear regression);当因变量有多个,自变量有多个时,称之为多元回归(multi-variate regression)。
正态分布、线性回归一、 知识梳理1.正态分布的重要性正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。
一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。
2.正态曲线及其性质正态分布函数:22()2()x f x μσ--=,x ∈(-∞,+∞)3.标准正态曲线标准正态曲线N (0,1)是一种特殊的正态分布曲线,00()1()x x Φ-=-Φ,以及标准正态总体在任一区间(a ,b)内取值概率)()(a b P Φ-Φ=。
4.一般正态分布与标准正态分布的转化由于一般的正态总体),(2σμN 其图像不一定关于y 轴对称,对于任一正态总体),(2σμN ,其取值小于x 的概率)()(σμ-Φ=x x F 。
只要会用它求正态总体),(2σμN 在某个特定区间的概率即可。
5.“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。
这种认识便是进行推断的出发点。
关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。
课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。
进行假设检验一般分三步:第一步,提出统计假设。
课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布),(2σμN ; 第二步,确定一次试验中的取值a 是否落入范围(μ-3σ,μ+3σ); 第三步,作出推断。
如果a ∈(μ-3σ,μ+3σ),接受统计假设;如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设。
6.相关关系研究两个变量间的相关关系是学习本节的目的。
第十一章(理) 第四节 正态分布、线性回归1.111222则有 ( )A .μ1<μ2,σ1<σ2B .μ1<μ2,σ1>σ2C .μ1>μ2,σ1<σ2D .μ1>μ2,σ1>σ2解析:μ反映正态分布的平均水平,x =μ是正态曲线的对称轴,由图知μ1<μ2,σ 反映正态分布的离散程度,σ越大,曲线越“矮胖”,表明越分散,σ越小,曲线越 “高瘦”,表明越集中,由图知σ1<σ2. 答案:A2.已知随机变量ξ服从正态分布N (3,σ2),则P (ξ<3)= ( ) A.15 B.14C.13D.12解析:根据正态分布的知识可知此正态分布图象的对称轴为x =3,而P (ξ<3)表示对 称轴左边图象的面积,对称轴左右两边图象面积相等,整个图象的面积为1. 答案:D3.设随机变量ξ服从正态分布N (2,9),若P (ξ>c +1)=P (ξ<c -1),则c = ( ) A .1 B .2 C .3 D .4解析:由题意得随机变量ξ相应的正态密度曲线关于直线x =2对称,又P (ξ>c +1) =P (ξ<c -1),因此(c +1)+(c -1)2=2,c =2.答案:B4.设随机变量ξ服从标准正态分布N (0,1),已知Φ(-1.96)=0.025,则P (|ξ|<1.96)=( ) A .0.025 B .0.050 C .0.950 D .0.975 解析:P (|ξ|<1.96)=Φ(1.96)-Φ(-1.96) =1-2Φ(-1.96)=0.950. 答案:C5.已知随机变量ξ服从正态分布N (2,σ2),P (ξ≤4)=0.84,则P (ξ≤0)= ( ) A .0.16 B .0.32C .0.68D .0.84解析:根据正态分布曲线的对称性,得P (ξ≤0)=1-P (ξ≤4)=1-0.84=0.16. 答案:A6.对有线性相关关系的两个变量建立的回归直线方程y =a +bx 中,回归系数b ( ) A .可以小于0 B .大于0 C .能等于0 D .只能小于0解析:因为b =0时,r =0,这时不具有线性相关关系,但b 能大于0也能小于0. 答案:A7.以下是两个变量x 和y 的一组数据:则这两个变量间的回归直线方程为 ( ) A.y ^=x 2 B.y ^=x C.y ^=9x -15 D.y ^=15x -9 解析:根据数据可得x =4.5,y =25.5, ∑i =1n x 2i =204,∑i =1nx i y i =1 296.b =1221niii nii x ynx y xnx ==--∑∑=1 296-8×4.5×25.5204-8×4.52=9,a =y -b x =25.5-9×4.5=-15. ∴y ^=9x -15. 答案:C8.已知回归直线方程y ^=4.4x +838.19,则可估计x 与y 的增长速度之比约为________. 解析:x 与y 的增长速度之比即为回归直线方程的斜率的倒数14.4=1044=522.答案:5229.某肉食鸡养殖小区某种病的发病鸡只数呈上升趋势,统计近4个月这种病的新发病鸡只数的线性回归分析如下表所示:该养殖小区这种病的新发病鸡总只数约为________.解析:由上表可得:y ^=94.7x +1 924.7,当x 分别取9,10,11,12时,得估计值分别 为:2 777,2 871.7,2 966.4,3 061.1,则总只数约为2 777+2 871.7+2 966.4+3 061.1≈11 676. 答案:11 67610.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的 生产能耗y (吨标准煤)的几组对照数据:(1)请根据上表提供的数据,求出y 关于x 的回归直线方程y ^=bx +a ;(2)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(1)求出的回归 直线方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解:(1)∑i =14x i y i =3×2.5+4×3+5×4+6×4.5=66.5,x —=3+4+5+64=4.5, y —=2.5+3+4+4.54=3.5,∑i =14x 2i =32+42+52+62=86,b =66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7,a =y —-b x —=3.5-0.7×4.5=0.35. 故回归直线方程为y ^=0.7x +0.35.(2)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,故耗能减少了90-70.35=19.65(吨).。
线性回归分析及其在经济预测中的应用线性回归分析是一种常用的统计方法,用于研究自变量与因变量之间的关系。
它假设自变量与因变量之间存在线性关系,并通过拟合一条直线来描述这种关系。
线性回归分析在经济学领域有着广泛的应用,可以用于预测经济指标、分析经济政策的效果等。
首先,线性回归分析可以用于预测经济指标。
经济指标是评估经济状况和发展趋势的重要依据,例如国内生产总值(GDP)、消费者物价指数(CPI)等。
通过收集历史数据,我们可以建立一个线性回归模型,将过去的自变量与因变量进行拟合,然后利用这个模型来预测未来的因变量。
例如,我们可以利用过去几年的GDP增长率和其他相关因素,来预测未来一年的GDP增长率。
这样的预测对政府决策、企业投资等具有重要的指导作用。
其次,线性回归分析可以用于分析经济政策的效果。
在经济学中,政府的经济政策往往会对经济指标产生影响,例如降低利率可以刺激投资,提高税收可以增加政府财政收入等。
通过线性回归分析,我们可以将政策变量与经济指标进行拟合,从而判断政策对经济的影响程度。
例如,我们可以将货币供应量与通货膨胀率进行回归分析,来评估货币政策对通胀的影响。
这样的分析有助于政府制定更有效的经济政策,提高经济运行的稳定性和可持续性。
除了经济预测和政策分析,线性回归分析还可以用于经济学理论的验证和发展。
经济学理论通常会提出一些假设和关系,例如供给与需求之间的关系、劳动力市场的决定因素等。
通过线性回归分析,我们可以将理论中的变量与实际数据进行拟合,从而验证理论的有效性。
如果理论与实际数据拟合较好,那么就可以认为该理论在一定程度上解释了经济现象。
如果理论与实际数据拟合较差,那么就需要对理论进行修正或者寻找其他解释。
这样的研究有助于推动经济学理论的发展,提高其解释和预测能力。
然而,线性回归分析也存在一些限制和局限性。
首先,线性回归分析假设自变量与因变量之间存在线性关系,但实际情况往往更为复杂。
如果变量之间存在非线性关系,那么线性回归模型的拟合效果可能较差。
线性回归模型在社会科学中的应用在社会科学领域,线性回归模型是一种经济、心理学、社会学等学科中常用的统计分析工具。
线性回归模型能够提供变量之间的关联性和预测能力,对于研究人类行为和社会现象具有重要的应用。
下面将介绍线性回归模型在社会科学中的应用,并探讨其局限性和改进方向。
一、经济领域中的线性回归模型应用在经济学中,线性回归模型被广泛运用于经济现象的解释和预测。
例如,通过构建家庭收入与教育水平的线性回归模型,可以分析收入与教育之间的关系。
该模型可以帮助政府了解教育资源的投入效果,制定有针对性的教育政策。
此外,线性回归模型还可以用于研究物价与供求关系、经济增长与人口因素之间的关系等。
二、心理学中的线性回归模型应用心理学家常常使用线性回归模型来探索人类行为和心理现象之间的关系。
例如,通过构建社会支持与幸福感的线性回归模型,可以了解社会支持对个体幸福感的影响程度。
此外,线性回归模型还可以用于研究人格特征与工作表现之间的关系、家庭环境对儿童心理发展的影响等。
三、社会学中的线性回归模型应用社会学研究中,线性回归模型被广泛应用于社会现象的解释和预测。
例如,通过构建收入与社会阶层的线性回归模型,可以研究社会阶层对个体经济状况的影响。
此外,线性回归模型还可以用于研究种族、性别对职业选择和收入差距的影响等。
尽管线性回归模型在社会科学中具有广泛的应用,但也存在一些局限性。
首先,线性回归模型假设自变量和因变量之间的关系是线性的,但实际情况往往更为复杂。
其次,线性回归模型对数据的要求较高,需要满足一系列假设条件,如自变量和误差项之间应独立、误差项应服从正态分布等。
此外,线性回归模型容易受到离群值(outliers)的影响,进而导致模型拟合效果不佳。
为了克服线性回归模型的局限性,研究者们提出了一系列改进方法。
例如,非线性回归模型可以用于处理自变量与因变量之间的非线性关系。
加权最小二乘法和岭回归等方法可用于处理数据不满足线性回归模型的假设条件的情况。
高二数学期末复习之一概率与统计第一部分.复习目标:1. 了解典型分布列:0~1分布,二项分布,几何分布。
2. 了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。
3. 在实际中经常用期望来比较两个类似事件的水平,当水平相近时,再用方差比较两个类似事件的稳定程度。
4. 了解正态分布的意义,能借助正态曲线的图像理解正态曲线的性质。
5. 了解标准正态分布的意义和性质,掌握正态总体),(2σμN 转化为标准正态总体N (0,1)的公式)()(σμ-Φ=x x F 及其应用。
6. 通过生产过程的质量控制图,了解假设检验的基本思想。
第二部分.内容小结: (Ⅰ)基础知识详析㈠随机事件和统计的知识结构:㈡随机事件和统计的内容提要 1.主要内容是离散型随机变量的分布列、期望与方差,抽样方法,总体分布的估计,正态分布和线性回归。
2.随机变量的概率分布(1)离散型随机变量的分布列:两条基本性质①,2,1(0=≥i p i ...); ②P 1+P 2+ (1)(2)连续型随机变量概率分布:由频率分布直方图,估计总体分布密度曲线y=f(x);总体分布密度函数的两条基本性质: ①f(x) ≥0(x ∈R);②由曲线y=f(x)与x 轴围成面积为1。
3.随机变量的数学期望和方差 (1)离散型随机变量的数学期望:++=2211p x p x E ε…;反映随机变量取值的平均水平。
(2)离散型随机变量的方差:+-+-=222121)()(p E x p E x D εεε…+-+n n p E x 2)(ε…;反映随机变量取值的稳定与波动,集中与离散的程度。
(3)基本性质:b aE b a E +=+εε)(;εεD a b a D 2)(=+。
4.三种抽样方法。
5.二项分布和正态分布(1)记ε是n 次独立重复试验某事件发生的次数,则ε~B (n ,p );其概率,2,1,0,1()(=-==-k p q q p C k P kn k k n n …),n 。
线性回归分析范文线性回归是一种常用的统计分析方法,用于研究变量之间的线性关系。
它可以揭示自变量和因变量之间的数量关系,通过建立一个最佳拟合的线性模型来预测因变量的值。
线性回归广泛应用于经济、金融、社会科学和自然科学等领域。
线性回归模型的基本形式如下:Y=β0+β1X1+β2X2+…+βnXn+ε其中,Y是因变量,X1、X2、…、Xn是自变量,β0、β1、β2、…、βn是回归系数,ε是随机误差项。
线性回归的前提假设包括:1.线性关系假设:自变量和因变量之间是线性关系;2.同方差性假设:随机误差项ε在所有自变量取值下具有相同的方差;3.独立性假设:随机误差项ε之间是独立的;4.正态性假设:随机误差项ε服从正态分布。
线性回归的核心任务是通过最小化残差平方和来求解最佳的回归系数。
残差是预测值与实际观测值之间的差异。
最小二乘法是线性回归中常用的方法,它的目标是使残差平方和最小化,通过求解偏导数来得到最佳回归系数的估计。
线性回归模型的拟合程度可以通过判定系数R²来评估,其取值范围在0到1之间。
R²的值越接近1,说明模型越能解释因变量的变异性;反之,R²的值越接近0,说明模型的解释能力越弱。
线性回归模型的应用包括:1.预测与预测:根据自变量的取值,可以使用线性回归模型来预测因变量的值。
例如,在经济学中,可以根据经济指标,如GDP和失业率,来预测未来的经济增长率。
2.因果推断:线性回归模型可以用于研究自变量对因变量的影响程度。
通过估计回归系数,可以分析自变量的影响方向和强度。
例如,在医学研究中,可以通过线性回归分析来确定吸烟对呼吸道疾病的影响。
3.变量选择:线性回归可以用于识别对因变量影响最大的自变量。
通过分析回归系数的显著性,可以确定哪些自变量对因变量具有重要的解释能力。
这对于解释和理解研究问题非常有价值。
然而,线性回归也存在一些限制:1.假设限制:线性回归模型对回归系数的假设比较严格,要求线性关系、同方差性和独立性。
专题:正态分布和线性回归一、基础知识回顾1( x)21. 正态分布:若总体密度曲线就是或近似地是函数 f ( x)e 22的图象2, x,其中:π是圆周率; e 是自然对数的底; x 是随机变量的取值 ,为正态分布的平均值; 是正态分布的标准差.这个总体是无限容量的抽样总体,其分布叫做正态分布.正态分布由参数 , 唯一确定,记作 ~ N ( , 2 ) ,E( )= ,D( )=2 .2. 函数 f(x) 图象被称为正态曲线 .(1) 从形态上看,正态分布是一条单峰、对称呈钟形的曲线,其对称轴为 x=μ,并在 x=μ时.... ..........取最大值 。
(2) 从 x=μ点开始,曲线向正负两个方向递减延伸,不断逼近x 轴,但永不与 x....轴相交,因此说曲线在正负两个方向都是以 x 轴为渐近线的 ,(3) 当μ的值一定时 , σ越大,曲线越“矮胖”,总体分布越分散;σ越小,曲线越“高”.总体分布越集中.3. 把 ~ N (0,1) 即μ =0, σ=1 称为标准正态分布,这样的正态总体称为标准正态总体 , 其密度函1 1 x2 数为 f ( x)e22,x ∈(- ∞,+∞) ,相应的曲线称为标准 正态曲线.4. 利用标准正态分布表可求得标准正态总体在某一区间内取值的概率 .(1) 对于标准正态总体 N (0,1) , ( x 0 ) 是总体取值小于 x 0 的概率,即: ( x 0 ) P(xx 0 ) ,其中 x 0 0 ,其值可以通过 “标准正态分布表” 查得,也就是图中阴影部分的面积,它表示总体取值小于 x 0 的概率.(2) 标准正态曲线关于 y 轴对称。
因为当 x 0 0 时, ( x 0 ) P(xx 0 ) ;而当 x 0 0 时,根据正态曲线的性质可得: ( x 0 ) 1( x 0 ) ,并且可以求得在任一区间(x 1 , x 2 ) 内取值的概率: P(x 1 x x 2 ) ( x 2 )( x 1 ) , 显然Φ(0)=0.5.5. 对于任一正态总体 ~ N ( ,2) , 都可以通过使之标准化 ~ N (0,1) , 那么 ,P(x )=P( <x)= (x) ,求得其在某一区间内取值的概率 .例如:~ N(1,4), 那么 , 设 =1, 则~ N (0,1) , 有 P( <3)=P( <1)= (1)=0.8413.26. Φ(1)=0.8413 、Φ (2)=0.9772 、Φ(3)=0.9987二、例题1x2(1) f ( x)2,(- ∞<x<+∞e21( x 1) 2(2) f ( x)8,(- ∞< x<+∞e22(3)f ( x) 2 e2( x 1)2,(- ∞<x<+∞22. 正态总体的函数表示式是 f (x)2e 2( x 1)2,(- ∞< x<+∞) (1)求 f (x)的最大值;2(2)利用指数函数性质说明其单调区间,以及曲线的对称轴.3. 利用标准正态分布表 ( Φ(1)=0.8413 、Φ(2)=0.9772 、Φ(3)=0.9987) 求标准正态总体在下面区间取值的概率.(1)(0,1);(2)(1,3);(3)(-1 ,2).4.利用标准正态分布表 (( Φ (1)=0.8413 、Φ (1.84)=0.9671) ,求正态总体在下面区间取值的概率.(1)在 N(1,4) 下,求 F(3)(2)在 N ( , 2 )下,求P(μ-1.84σ<X<μ+1.84σ)*5 . 对于正态总体 N ( , 2 ) 取值的概率:(1) ( μ - σ,μ +σ):(2) ( μ -2 σ,μ +2σ):(3) ( μ -3 σ,μ +3σ):取值的概率分别为 68.3%、95.4%、99.7%。
因此我们时常只在区间 ( μ-3 σ,μ +3σ ) 内研究正态总体分布情况,而忽略其中很小的一部分 , 这一部分情况发生为小概率事件。
6.下列关于正态曲线性质的叙述正确的是(1)曲线关于直线 x=μ对称 , 这个曲线只在 x 轴上方;(2)曲线关于直线 x=σ对称 , 这个曲线只有当 x∈(-3 σ, 3σ) 时才在 x 轴上方;(3)曲线关于 y 轴对称,因为曲线对应的正态密度函数是一个偶函数;(4)曲线在 x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低;(5)曲线的对称轴由μ确定,曲线的形状由σ确定;(6) σ越大,曲线越“矮胖”,总体分布越分散;σ越小,曲线越“高”.总体分布越集中.()(A) 只有( 1)( 4)( 5)( 6)(B)只有 (2)( 4)( 5)(C) 只有 (3)( 4 )( 5)( 6)(D)只有( 1)( 5)( 6)7.把一个正态曲线 a 沿着横轴方向向右移动 2 个单位 , 得到一个新的曲线 b, 下列说法不正确的是(A) 曲线 b 仍然是正态曲线(B)曲线a和曲线b的最高点的纵坐标相等(C)以曲线 a 为概率密度曲线的总体的方差比以曲线 b 为概率密度曲线的总体的方差大 2(D)以曲线 a 为概率密度曲线的总体的期望比以曲线 b 为概率密度曲线的总体的期望小 28. 在正态总体N (0 , 1) 中, 数值落在 (- ∞,-1) ∪(1,+ ∞) 里的概率为9(A )0.097 (B )0.046 (C)0.03 (D)0.0039. 设随机变量ζ~ N(2,4), 则 D( ) 等于(A)1 (B)2 (C)0.5 2(D)410. 设随机变量ζ~N ( μ, σ2 ), 且 P(ζ≤C)=P(ζ>C), 则 C 等于 ( )(A)0 (B) μ (C)- μ (D)σx 211. 正态总体的概率密度函数为 f ( x)1e 8 , x,, 则总体的平均数和标准差分别8是(A)0 和 8 (B)0 和 4 (C)0 和 2 (D)0和 212. 填空题(1) 若随机变量ζ~ N(1,0.25), 则 2ζ的概率密度函数为 . (2) 期望为 2, 方差为 2 的正态分布的密度函数是 .(3) 已知正态总体落在区间 (0.2,+ ∞) 的概率是 0.5 ,则相应的正态曲线 f(x) 在 x=时, 达 到最高点 .(4) 已知ζ~N(0,1),P( ζ≤1.96)= Ф(1.96)=0.9750, 则Ф(-1.96)= .(5) 某种零件的尺寸服从正态分布 N(0,4), 则不属于区间 (-4,4) 这个尺寸范围的零件约占总数 的.(6) 某次抽样调查结果表明 , 考生的成绩 ( 百分制 ) 近似服从正态分布 , 平均成绩为 72 分,96 分以上 的考生占考生总数的 2.3%,则考生成绩在 60 至 84 分之间的概率为 . Φ(1)=0.8413 、Φ (2)=0.977 、Φ(3)=0.9987参考答案 :1(1)0,1(2)1,2(3)-1,0.5;2.(1)x=-1时f max ( x)1 ,(2)对称轴为2x=-1.3.(1)0.3413(2)0.1574(3)0.81854. (1)F(3)=0.8413(2) P( μ-1.84 σ<X<μ+1.84σ)=0.9342;6.A;7.C;8.D;9.A;10.B;11.C;12.(1)1 ( x2) 2 f (x)e44f ( x)2 e 2( x 1) 2;(2);(3)0.2;(4)0.025;(5)4.56%;(6)=12;P=0.6826.F(96)= (9672) 1 0.0230.9770(2) , 12 ,F(84)- F(60)=( 84 72 ) (60 72)(1)( 1) 2 (1) 1 0.68261212正态分布和线性回归高考要求1. 了解正态分布的意义及主要性质2. 了解线性回归的方法和简单应用知识点归纳1.正态分布密度函数:1 (x ) 2f ( x)2 ,(σ> 0,- ∞<x <∞)e 22其中π是圆周率; e 是自然对数的底; x 是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差 . 正态分布一般记为 N ( ,2)2.正态分布 N ( ,2) )是由均值μ和标准差σ唯一决定的分布例 1、下面给出三个正态总体的函数表示式,请找出其均值μ和标准差σ.1 x 2(1) f ( x),(- ∞<x <+∞e22 ( x 1) 21(2) f ( x)8,(- ∞< x <+∞2 e2 解: (1)0,1(2)1,23.正态曲线的性质 :正态分布由参数μ、σ唯一确定,如果随机变量2~N(μ,σ ) ,根据定义有:μ =E ,σ=D 。
正态曲线具有以下性质:(1)曲线在 x 轴的上方,与 x 轴不相交。
(2)曲线关于直线 x μ对称。
=(3)曲线在 xμ时位于最高点。
=(4)当 xμ时,曲线上升;当 x μ时,曲线下降。
并且当曲线向左、右两边无限延伸<>(5)当μ一定时,曲线的形状由σ确定。
σ越大,曲线越“矮胖” ,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比教学4.标准正态曲线 : 当μ =0、σ=l 时,正态总体称为标准正态总体,其相应的函数表示式是1x2f (x) e 2,(- ∞<x<+∞)2其相应的曲线称为标准正态曲线标准正态总体 N(0,1)在正态总体的研究中占有重要的地位任何正态分布的概率问题均可转化成标准正态分布的概率问题5.标准正态总体的概率问题 :y-x 2标准正态分布曲线12f x =e2x x对于标准正态总体 N(0,1),( x0 ) 是总体取值小于 x0的概率,即( x0 ) P(x x0 ) ,其中 x00 ,图中阴影部分的面积表示为概率 P( x x0 )只要有标准正态分布表即可查表解决.从图中不难发现 : 当 x00 时,(x0 ) 1( x0 ) ;而当 x00 时,Φ( 0)=0.5例 2 设 X ~ N ( , 2 ),且总体密度曲线的函数表达式为:1 x 22x1e4,x ∈ R 。
f ( x)2(1)求μ,σ;(2)求 P(| x 1 | 2) 的值。
分析:根据表示正态曲线函数的结构特征,对照已知函数求出μ和σ。
利用一般正态总体N ( , 2 ) 与标准正态总体 N (0,1)概率间的关系,将一般正态总体划归为标准正态总体来解 决。
22 x 1( x 1) 21 x12 ) 2解:(1)由于 f (x)4e 2(2 e2,2根据一般正态分布的函数表达形式,可知μ =1,2 ,故 X ~N (1,2)。
(2) P(| x 1 |2) P(12 x 1 2)F (12) F(12)(2 1) ( 2 1)2 2(1)( 1) 2 (1) 1 2 0.8413 10.6826 。