10.7离散型随机变量及其分布列
- 格式:ppt
- 大小:1.08 MB
- 文档页数:27
常见的离散型随机变量的分布列、均值与方差【知识要点】一、离散型随机变量及其分布列 1、随机变量如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量。
长用希腊字母ηξ,来表示。
若ξ是随机变量,b a +=ξη,其中b a ,是常数,则η也是随机变量。
2、离散型随机变量如果对于随机变量可能取的值,可以一一列出,这样的随机变量叫做离散型随机变量。
3、离散型随机变量的分布列(1)若离散型随机变量X 可能取的不同值为n i x x x x ,,,,,⋅⋅⋅⋅⋅⋅21,X 取每一个值)21(n i x i ,,,⋅⋅⋅=的概率i i p x X P ==)(,以表格的形式表示如下:此表称为离散型随机变量X 的分布列,简称X 的分布列。
有时为了表达简单,也用等式i i p xX P ==)(,n i ,,,⋅⋅⋅=21,表示X 的分布列。
(2)性质:①n i p i ,,,,⋅⋅⋅=≥210;②11=∑=ni i p ;③在某个范围内取值的概率等于这个范围内每个随机变量值的概率的总和。
4、常见离散型随机变量 (1)两点分布若随机变量X 的分布列是则这样的分布列称为两点分布列。
如果随机变量X 的分布列为两点分布列,就称X 服从两点分布(也称伯努利分布),而称)1(==x P p 为成功概率。
其EX=p ,DX=p(1-p). (2)超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件{X=k}发生的概率为m k C C C X P nNkn MN k M ,,,,,⋅⋅⋅=⋅==--210)k (,其中}min{n M m ,=,且*∈≤≤N N M n N M N n 、、,,,称分布列为超几何分布列。
如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布。
记作:1)1()(---•==N nN N M N nM DX N nM EX n M N H X ,,其,,—。
离散型随机变量及其分布列1.随机变量的有关概念(1)随机变量:随着试验结果不同而①变化的变量,常用字母x,Yg,n,...表示.(2)离散型随机变量:所有取值可以②一一列出的随机变量.2.离散型随机变量分布列的概念及性质(1)概念:若离散型随机变量X可能取的不同值为X],x2,…些,...,x n,X取每一个值X i(i=1,2,...,n)的概率P(X=x i)=p i以表格的形式表示如下:Xx1x2…x i…x nPp1p2.p i.p n则此表称为离散型随机变量X的概率分布列,简称为X的分布列,有时也用等式卩以=即=卩」=1,2,...』表示X的分布列.(2)分布列的性质(i)P i③>0,i=1,2,3,.,n;n,(ii)》耳1.i13.常见的离散型随机变量的概率分布(1)两点分布X01P④1-Pp若随机变量X的分布列具有上表的形式,则称X服从两点分布,并称卩二⑤P(x=1)为成功概率.(2)超几何分布在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=,k=0,1,2,...,m,其中m=min{M,n},且n<N,M<N,n,M,N G N*.若随机变量X的分布列具有上表的形式,则称随机变量X服从超几何分布.⑦c M c N-M⑧q M^N-M一C N一-CN C m C n-mMN-MC n二项分布1.条件概率(1)定义对于任何两个事件A和B,在已知事件A发生的条件下,事件B发生的概率叫做①条件概率,用符号②P(BIA)来表示,其公式为P(BIA)=③巴也P⑷(P(A)>0).在古典概型中,若用n(A)表示事件A中基本事件的个数,则P(BIA)=丛也.n(A)(2)性质(i)④O W P(BIA於1;(ii)如果B和C是两个互斥事件,那么P(B U CIA)=⑤P(BIA)+P(CIA).2.相互独立事件(1)对于事件A、B,若A的发生与B的发生互不影响,则称⑥A、B是相互独立事件.⑵若A与B相互独立,则P(BIA)=⑦P(B),P(AB)=P(BIA)・P(A)=⑧P(A)P(B).⑶若A与B相互独立,则⑨A与P,⑩万与Bj A^B_也都相互独立.⑷若P(AB)=P(A)P(B),则:A与B相互独立.3•独立重复试验与二项分布(1)独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中事件发生的概率都是一样的(2)在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,则P(X=k)=⑭心p k(1-p)n-k(k=0,1,2,...,n),此时称随机变量X服从二项分布,记为峪X〜B(n,p),并称p为成功概率.离散型随机变量的均值与方差、正态分布1.离散型随机变量的均值与方差若离散型随机变量X的分布列为Xx1x2.xi.x nPp1p2.p i.p n⑴均值:称EX=©x1p1+x2p2+.+x i p i+.+x n p n为随机变量X的均值或数学期望,它反映了离散型随机变量取值的②平均水平.(2)称DX=I(x.-EX)2p.为随机变量X的方差,它刻画了随机变量X与其均值i1 EX的平均程度,其算术平方根畑为随机变量X的标准差.平均数的性质(1)若一组数据X],x2,...,x n的平均数为无,则aX],ax2,...,ax n的平均数为a x.(2)若一组数据X],x2,...,x n的平均数为无,则aX]+b,ax2+b,...,ax n+b的平均数为a 无+b.(3)若M个数的平均数是X,N个数的平均数是Y,则这(M+N)个数的平均数是MXNY,若两组数据xx2,...,x n和y1,y2,.,y n的平均数分别是x和歹,则MN12n12nX i+y i,x2+y2,...,x n+y n的平均数是无+歹.2.均值与方差的性质(1)E(aX+b)=®aEX+b(a,b为实数).(2)D(aX+b)=®a2DX(a,b为实数).(3)E(k)=k(k为常数).(4)E(X1+X2)=E(X1)+E(X2).(5)D(X)=E(X2)-(E(X))2.(5)D(X)=E(X2)-(E(X))2.(6)若X1,X2相互独立,则E(X1X2)=E(X1)^E(X2).(7)D(k)=0(k为常数).(8)若给定一组数据X],x2,...,x n,其方差为S2,则aX],ax2,...,ax n的方差为a2s2.(9)若给定一组数据X],x2,...,x n,其方差为s2,则aX]+b,ax2+b,...,ax n+b的方差为a2s2,特别地,当a=1时,有X]+b,x2+b,...,x n+b的方差为s2,这说明将一组数据的每一个数据都加上一个相同的常数,方差是不变的,即不影响数据的波动性.(10)方差的一个简化公式是s2=i[(%2+%2+.+%2)-n%2]=%2-无2,此公式只要把方差公式展开进行重组即可证明.3.两点分布与二项分布的均值、方差X X服从两点分布X~B(n,P)EX⑥p(p为成功概率)⑦npDX⑧P(1-P)⑨np(l-p)4.正态曲线的特点(1)曲线位于X轴⑩上方,与x轴不相交;(2)曲线是单峰的,它关于直线H x=y对称;(3)曲线在I二x=u处达到峰值i;:-4:;a^2n——(4)曲线与X轴之间的面积为卜1;⑸当O—定时,曲线的位置由卩确定,曲线随着卩的变化而沿X轴平移;⑹当卩一定时,曲线的形状由O确定Q越小,曲线越"-高瘦”,表示总体的分布越集中越大,曲线越“⑯矮胖”,表示总体的分布越⑰分散.用样本估计总体1.常用统计图表(1)频率分布表的画法:第一步:求①极差,决定组数和组距,组距二②极差;组数—第二步:③分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图.横轴表示样本数据,纵轴表示④频率,每个小矩形的面积表示样本落在该组-组距—内的⑤频率.(3)茎叶图的画法:第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将各个数据的茎按⑥大小次序排成一列;数字定义与求法特征盘一组数据中出现次数最多的数特点通常用于描述出现把一组数据按⑦大小顺序排誥列,处在⑧最中间位置的一个数据(或最中间两个数据的平均数)中位数是样本数据所占频率的等分线,它不受少数极端值的影响平均數如果有n个数据X],x2,...,x n,那么这n个数的平均数x=⑨一1(x1+x2+.+X n)平均数和每一个数据都有关,可以反映样本数据全体的信息,但平均数受数据中极端值的影响较大,故平均数在估计总体时可靠性降低第三步:将各个数据的叶依次写在其茎的右(左)侧.2.样本的数字特征(1)众数、中位数、平均数(2)标准差、方差(i)标准差:s=@_j1[(%1-T)2+(%2-T)2+…+(q-无)2].(ii)方差:标准差的平方S2叫做方差.S2=d1[(X匚无)2+(x2-无)2+...+(x n-无)2],其中X i(i=l,2,3,...,n)是⑫样本数据,n n是样本容量,无是I样本平均数.变量间的相关关系、统计案例l.两个变量的线性相关(1)正相关在散点图中,点散布在从①左下角到②右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.nI x.y.-nry=i=1''I %2-nx 21=11(1)回归分析是对具有⑧相关关系的两个变量进行统计分析的一种常用n —I 叫儿-n%⑶相关系数:r=(2)负相关在散点图中,点散布在从③左上角到④右下角的区域,对于两个变量的这种相关关系,我们将它称为负相关.(3) 线性相关关系、回归直线如果散点图中点的分布从整体上看大致在⑤一条直线附近,那么就称这 两个变量之间具有线性相关关系,这条直线叫做回归直线.(5)回归方程方程y =b x+a 是具有线性相关关系的两个变量的一组数据A A(x 1,y 1),(x 2,y 2),^,(x n ,y n )的回归方程,其中a ,b 是待定参数.A I (叫立)(y厂刃b =I (%.-X )2i=10=⑦y-bx .2.回归分析方法.(2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),^,(x n ,y n ),x=-I x.,y=ni=11Iy.f ⑨(无,刃为样本点的中心.ni=11 Jn2n 2(I x^-nx 2)(I y?-ny 2)i=1L i=1L当r>0时,表明两个变量⑩正相关; 当r<0时,表明两个变量r 负相关.r 的绝对值越接近于1,表明两个变量的线性相关性;越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常Irl 大于或等于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的濮不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的儿频数表,称为列联表.一般地,假设有两个分类变量X和Y,它们的可能取值分别为{X],X2}和{y],y2},其样本频数列联表(称为2x2列联表)为总计y1y2X1a b a+bc d c+dX2总计a+c b+d a+b+c+d则可构造一个随机变量K2=V:W"c)2,其中n=~(ab')(cd)(ac)(bd)~a+b+c+d(3)独立性检验利用独立性假设、随机变量::K2来确定是否有一定的把握认为“两个分类变量一.有关系”的方法称为两个分类变量的独立性检验。
课题:离散型随机变量及分布列一、教学内容分析本节课是普通高中新课程标准实验教科书《数学》(选修2-3)中第二章《随机变量及其分布》第一节“离散型随机变量及其分布列”的第二课时.引入随机变量的目的是研究随机现象发生的统计规律,及所有随机事件发生的概率.离散型随机变量的分布列完全描述了由这个随机变量所刻画的随机现象.对随机变量的概率分布的研究,实现了随机现象数学化的转化.学生在第一课时已经学习了“离散型随机变量”,对离散型随机变量的概念有了一定的认识.了解到建立从随机试验结果到随机变量的映射的目的是将实际问题数量化,便于用数学工具更好地研究问题,进一步体会数学建模的思想. 教师的重要作用就在于培养学生“数学地”观察事物,对现象或问题“数学地”思考,进而合理地量化和转化,把问题“数学化”,用数学的思想方法加以解决.本节课要研究随机变量所表示的随机事件的概率分布情况,即建立“离散型随机变量的分布列”这一数学模型. 离散型随机变量和其对应的概率之间是一种函数关系,因此可以类比函数来研究. 教师引导学生用数学的思维分析问题,用数学的思想方法解决问题. 通过类比函数的表示方法,首先对三个具体实例进行表示,获得对“离散型随机变量的分布列”模型的初步认识,再从这些具体实例中抽象概括出离散型随机变量的分布列的一般定义并进一步探索性质. 在概念得出的过程中,可以培养学生的抽象概括能力. 在此基础上学习两点分布等特殊的分布列,理解分布列对于刻画随机现象的重要性,能够应用分布列解决实际问题.在实际问题的解决中,可以培养学生的数学建模能力.因此,本节课的教学重点:理解离散型随机变量的分布列的概念,理解分布列对于刻画随机现象的重要性,理解两点分布的模型及其应用.二、教学目标设置1.通过具体实例,理解离散型随机变量分布列的概念,理解分布列对于刻画随机现象的重要性;类比函数的几种表示法学习离散型随机变量的表示方法;探索离散型随机变量的性质.2.通过学生的自主探究,进一步体会数学抽象、数学建模的思想,培养学生抽象概括能力.3.通过类比、推广、特殊化等一系列思维活动,体会统计思想,学会用统计思想分析和处理随机现象的基本方法. 在解决实际问题的过程中,同学们加深对有关数学概念本质的理解,认识数学知识与实际的联系,并学会用数学解决一些实际问题.4.通过创设情境调动学生参与课堂的热情,激发学生学习数学的情感.经历数学建模的过程并从中获得成功的体验,锻炼克服困难的意志,建立学习数学的自信心.三、学生学情分析(一)学生程度我所授课的对象是天津市实验中学的学生.学生的水平相对较高,基础知识掌握得较好,学生的理解能力比较强.虽然已经经历了概率的学习,但是对随机变量的学习还处于初期阶段,一些数学方法和数学思想的掌握还有待进一步加强.(二)知识层面1.学生已经学习过概率的知识并掌握了计数原理;2.掌握了离散型随机变量的定义.(三)能力层面1.具有一定的数学抽象的能力;2.具有一定的数学建模的基础.根据以上三个方面的分析,在学生已有的认知基础的条件下,学生可以自主利用古典概型计算概率的公式完成求基本事件的概率.在具体操作过程中,需要老师的引导和帮助.教学难点:理解离散型随机变量分布列的概念,理解分布列对于刻画随机现象的重要性.四、教学策略分析1.《高中数学课程标准》倡导自主探索、动手实践、合作交流等学习方式.根据本节课的教学内容和学生自主学习能力相对比较强的特点,以问题串驱动整个课堂的进行,采用启发、引导、探究相结合的教学方法.2.本节教学内容的脉络是:复习旧知,引入新课——研究实例,抽象概括——探索性质,辨析概念——数学建模,两点分布——实际应用,解决问题——课堂小结,反思提升.首先对上节课已经学习的随机变量的概念加以回顾,并进一步提出后续问题,即“我们更关心随机事件发生的可能性有多大,即随机变量取不同值的概率分布情况是怎样的”,以开门见山的方式提出问题,引发学生的思考.然后对于如何解决这个问题,以三道实际问题“掷骰子”、“掷硬币”、“摸次品”为背景,启发学生寻求解决问题的方法.类比函数的表示方法,研究离散型随机变量分布列的表示方法,进而抽象概括随机变量分布列的概念;探索离散型随机变量的性质,并辨析概念;通过举例,掌握两点分布的分布列模型及其应用;在解决实际问题的过程中,使学生加深对有关数学概念本质的理解,认识数学知识与实际的联系.利用离散型随机变量思想描述和分析某些随机现象,通过类比、推广、特殊化等一系列思维活动,体会统计思想,学会用统计思想分析和处理随机现象的基本方法.3.在探索两点分布和解决实际问题的过程中,通过小组合作交流,同桌协作探究的方式,借助图形计算器等信息技术手段,为学生的数学探究与数学思维提供支持完成调动学生学习的积极性和主动性,培养学生的探究精神及协作意识,使学生真正体会数学抽象、数学建模思想,并能体验成功的喜悦.五教学过程分析教学环节创设情境——概念形成——概念深化——知识应用——总结反思—达标检测附:板书设计。