高中数学全套讲义 必修3 概率与统计 基础学生版
- 格式:docx
- 大小:626.36 KB
- 文档页数:14
1.定义:条件概率揭示了P(A),P(AB),P()三者之间“知二求一”的关系一般地,设A ,B 为两个随机事件,且P(A)>0,我们称P()=为在事件A 发生的条件下,事件B 发生的条件概率,简称条件概率.2. 条件概率的定义设A 、B 是两个事件,且P(B)>0,则称()(|)()P AB P A B P B为在事件B 发生的条件下,事件A 的条件概率.若事件B 已发生, 则为使 A 也发生 , 试验结果必须是既在 B 中又在A 中的样本点 , 即此点必属于AB. 由于我们已经知道B 已发生, 故B 变成了新的样本空间 , 于是有了以上公式3. 条件概率的计算 1) 用定义计算:2)从加入条件后可用缩减样本空间法1.定义:由条件概率的定义,对任意两个事件A 与B ,若P(A)>0,则()()()P AB P A P B A =,我们称上式为概率的乘法公式.2.性质:设P(A)>0,则,)()()|(B P AB P B A P =P (B )>0一般地条件概率与无条件概率 之间的大小无确定关系若,条件概率 无条件概率(1)()1P A Ω=(2)如果B 与C是两个互斥事件,则()()()()P B C A P B A P C A ⋃=+ (3)设B 和B 互为对立事件,则()()1P B A P B A =-1.全概率公式 一般地,设12,,n A A A 是一组两两互斥的事件,12n A A A ⋃⋃⋃=Ω,且()0i P A >,1,2,,i n =,则对任意的事件B ⊆Ω,有()()()1niii P B P A P B A ==∑我们称上面的公式为全概率公式,全概率公式是概率论中最基本的公式之一由条件概率的定义:若已知P(B), P(A|B)时, 可以反求P(AB)定理若P(B)>0,则P(AB)=P(B)P(A|B) (2)若P(A)>0,则P(AB)=P(A)P(B|A) (3)全概率公式全概率就是表示达到某个目的有多种方式(或者造成某种结果有多种原因),求达到目的的概率是多少(或者造成这种结果的概率是多少).2. 贝叶斯公式 设12,,n A A A 是一组两两互斥的事件,12n A A A ⋃⋃⋃=Ω,且()0i P A >,1,2,,i n =,则对任意的事件B ⊆Ω,()0P B >,有()i P A B =()()()i i P A P B A P B =()()()()1i i nkkk P A P B A P A P B A =∑,1,2,,i n =全概率公式、贝叶斯公式它们是加法公式和乘法公式的综合运用,同学们可通过进一步的练习去掌握它们.值得一提的是,后来的学者依据贝叶斯公式的思想发展了一整套统计推断方法,叫作“贝叶斯统计”.可见贝叶斯公式的影响.全概率公式. 全概率公式的基本思想是把一个未知的复杂事件分解为若干个已知的简单事件再求解,而这些简单事件组成一个 互不相容事件组 ,使得某个未知事件A 与这组互不相容事件中至少个同时发生 ,故在应眉此全慨率公式时,关键是要找到一个合适的S 的一个划分.例题1.《易经》是中国传统文化中的精髓,下图是易经后天八卦图(含乾、坤、巽、震、坎、离、艮、兑八卦),每一卦由三根线组成( 表示一根阳线, 表示一根阴线),从八卦中任取两卦,记事件 A = “两卦的六根线中恰有两根阳线”, B = “有一卦恰有一根阳线”,则 P(A|B)= ( ),A. 15B. 16C. 17D. 314【答案】 B【解析】由八卦图可知,八卦中全为阳线和全为阴线的卦各有一个, 两阴一阳和两阳一阴的卦各有三个,而事件A 所包含的情况可分为两种, 即第一种是取到的两卦中一个为两阳一阴,另一个为全阴; 第二种是两卦中均为一阳两阴;而事件 A ∩B 中只包含后者, 即: P(A ∩B)=C 32C 82=328,事件 B 的概率 P(B)=1−C 52C 82=914 ,所以 P(A|B)=328914=16故答案为:B例题2.已知某种产品的合格率是 90% ,合格品中的一级品率是 20% .则这种产品的一级品率为( ) A. 18% B. 19% C. 20% D. 21% 【答案】 A【解析】设事件A 为合格品,事件B 为一级品,则 P(A)=90%,P(B|A)=20% 所以 P(B)=P(A)P(B|A)=90%×20%=18% 故答案为:A例题3.某种电子元件用满3000小时不坏的概率为 34 ,用满8 000小时不坏的概率为 12 ,现有一只此种电子元件,已经用满3000小时不坏,还能用满8000小时的概率是()A.34B.23C.12D.13【答案】 B【解析】记事件A“用满3000小时不坏”,P(A)=34记事件B“用满8000小时不坏,P(B)=12∵B⊂A,∴P(AB)=P(B)=1 2则P(B|A)=P(AB)P(A)=1234=12×43=23故答案为:B例题4.某校将进行篮球定点投篮测试,规则为:每人至多投3次,先在M处投一次三分球,投进得3分,未投进不得分,以后均在N处投两分球,每投进一次得2分,未投进不得分.测试者累计得分高于3分即通过测试,并终止投篮.甲、乙两位同学为了通过测试,进行了五轮投篮训练,每人每轮在M处和N处各投10次,根据他们每轮两分球和三分球的命中次数情况分别得到如图表:若以每人五轮投篮训练命中频率的平均值作为其测试时每次投篮命中的概率.(1)求甲同学通过测试的概率;(2)在甲、乙两位同学均通过测试的条件下,求甲得分比乙得分高的概率.【答案】(1)解:甲同学两分球投篮命中的概率为510+410+310+610+7105=0.5,甲同学三分球投篮命中的概率为110+0+110+210+1105=0.1,设甲同学累计得分为X,则P(X≥4)=P(X=4)+P(X=5)=0.9×0.5×0.5+0.1×0.5+0.1×0.5×0.5=0.3,所以,甲同学通过测试的概率为0.3(2)解:乙同学两分球投篮命中率为210+410+310+510+6105=0.4,乙同学三分球投篮命中率为110+210+310+110+3105=0.2 .设乙同学累计得分为Y,则P(Y=4)=0.8×0.4×0.4=0.128,P(Y=5)=0.2×0.4+0.2×0.6×0.4=0.128,设“甲得分比乙得分高”为事件A,“甲、乙两位同学均通过了测试”为事件B,则P(AB)=P(X=5)⋅P(Y=4)=0.075×0.128=0.0096,P(B)=[P(X=4)+P(X=5)]⋅[P(Y=4)+P(Y=5)]=0.0768,由条件概率公式可得P(A|B)=P(AB)P(B)=0.00960.0768=18【解析】(1)分别求出甲同学两分球投篮命中的概率和甲同学三分球投篮命中的概率,设甲同学累计得分为X,则P(X≥4)=P(X=4)+P(X=5),由此能求出甲同学通过测试的概率;(2)乙同学两分球投篮命中的概率为0.4,三分球投篮命中的概率为0.2,设乙同学累计得分为Y,求出P(Y=4)=0.128,P(Y=5)=0.128,设“甲得分比乙得到高”为事件A,“甲、乙两位同学均通过了测试”为事件B,则P(AB)=P(X=5)•P(X=4),P(B)=[P(X=4)+P(X=5)]•[P(Y=4)+P(Y=5)],由条件概率得:P(A|B)=P(AB)P(B)=0.00960.0768=18。
统计1:简单随机抽样(1)总体和样本①在统计学中, 把研究对象的全体叫做总体.②把每个研究对象叫做个体.③把总体中个体的总数叫做总体容量.④为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.(2)简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法③使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
(4)抽签法:①给调查对象群体中的每一个对象编号;②准备抽签的工具,实施抽签;③对样本中的每一个个体进行测量或调查(5)随机数表法:2:系统抽样(1)系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
3:分层抽样(1)分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
第二章统计一、随机抽样三种常用抽样方法:1.简单随机抽样:设一个总体的个数为N。
如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。
实现简单随机抽样,常用抽签法和随机数表法。
(1)抽签法制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行均匀搅拌;抽签:抽签时,每次从中抽出1个号签,连续抽取n次;成样:对应号签就得到一个容量为n的样本。
抽签法简便易行,当总体的个体数不多时,适宜采用这种方法。
(2)随机数表法编号:对总体进行编号,保证位数一致;数数:当随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下等等。
在读数过程中,得到一串数字号码,在去掉其中不合要求和与前面重复的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码。
成样:对应号签就得到一个容量为n的样本。
结论:①用简单随机抽样,从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时任一个体被抽到的概率为1/N;在整个抽样过程中各个个体被抽到的概率为n/N;②基于此,简单随机抽样体现了抽样的客观性与公平性;③简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样。
2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。
系统抽样的步骤可概括为:(1)将总体中的个体编号。
采用随机的方式将总体中的个体编号;(2)将整个的编号进行分段。
为将整个的编号进行分段,要确定分段的间隔k .当N/n 是整数时,k=n/N ;当N/n 不是整数时,通过从总体中剔除一些个体使剩下的个体数N ´能被n 整除,这时k=N ’/n ;(3)确定起始的个体编号。
目录
概率与统计 (2)
模块一:统计 (2)
考点1:抽样方法 (2)
考点2:样本数字特征 (3)
模块二:线性回归分析 (7)
考点3:线性回归 (8)
模块三:概率 (10)
考点4:古典概型 (10)
考点5:几何概型 (11)
课后作业: (12)
概率与统计
模块一:统计
考点1:抽样方法
例1.(1)(2019春•龙潭区校级月考)完成下列两项调查:①从某社区70户高收入家庭、335户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.这两项调查宜采用的抽样方法依次是()
A.①简单随机抽样,②系统抽样B.①分层抽样,②简单随机抽样
C.①系统抽样,②分层抽样D.①②都用分层抽样
(2)(2019春•浉河区校级月考)为了了解学生学习的情况,某校采用分层抽样的方法从高一1200人、高二1000人、高三n人中,抽取90人进行问卷调查.已知高一被抽取的人数为36,那么高三被抽取的人数为()
A.20B.24C.30D.32
(3)(2019春•信州区校级月考)某班有40位同学,座位号记为01,02,⋯,40,用下面的随机数表选取5组数作为参加青年志愿者活动的5位同学的座位号
4954 4454 8217 3793 2378 8735 2096
4384 2634 9164 5724 5506 8877 0474
4767 2176 3350 2583 9212 0767 5086
选取方法是从随机数表第一行的第11列和第12列数字开始,由左到右依次选取两个数字,则选出来的第5个志愿者的座位号是()
A.09B.20C.37D.38
(4)(2019春•香洲区校级月考)一个总体中有600个个体,随机编号为001,002,⋯,600,利用系统抽样方法抽取容量为25的一个样本,总体分组后在第一组随机抽得的编号为006,则在编号为049与120之间抽得的编号为()
A.056,080,104B.054,078,102C.054,079,104D.056,081,106
考点2:样本数字特征
例2.(1)(2019春•博望区校级月考)踢建子是中国民间传统的运动项目之一,起源于汉朝,至今已有两千多年的历史,是一项简便易行的健身活动.某单位组织踢毽子比賽,把20人平均分成甲、乙两组,并把毎人在1分钟内踢毽子的数目用茎叶图记录如下(其中中间的数字表示十位数,两侧的数字表示个位数).则下列判断正确的是()
A.甲组中位数大,乙组方差大B.甲组方差大,乙组极差大
C.甲组平均数大,乙组方差大D.甲组极差大,乙组中位数大
(2)(2019春•南陵县校级月考)从某地区年龄在25~55岁的人员中,随机抽出100人,了解他们对今年两会的热点问题的看法,绘制出频率分布直方图如图所示,则下列说法正确的是()
A.抽出的100人中,年龄在40~45岁的人数大约为20
B.抽出的100人中,年龄在35~45岁的人数大约为30
C.抽出的100人中,年龄在40~50岁的人数大约为40
D.抽出的100人中,年龄在35~50岁的人数大约为50
(3)(2019春•天元区校级月考)在一次200千米的汽车拉力赛中,50名参赛选手的成绩全部介于13分钟到18分钟之间,将比赛成绩分为五组:第一组[13,14),第二组[14,15), ,第五组[17,18],其频率分布直方图如图所示,若成绩在[13,15)之间的选手可获奖,则这50名选手中获奖的人数为()
A.39B.35C.15D.11
(3)(2019春•洮北区校级月考)从某地区随机抽取100名高中男生,将他们的体重(单位:)
kg数据绘制成频率分布直方图(如图).若要从体重在[60,70),[70,80),[80,90]三组内的男生中,用分层抽样的方法选取12人参加一项活动,再从这12人中选两人当正、副队长,则这两人体重不在同一组内的概率为()
A.1
3
B.
1
4
C.
2
5
D.
2
3
(4)(2019春•和平区校级月考)在某次数学测验后,将参加考试的500名学生的数学成绩制成频率分布直方图(如图),则在该次测验中成绩不低于100分的学生数是()
A .210
B .205
C .200
D .195
(5)(2019春•叶集区校级月考)已知数据1x ,22019x x ⋯的平均数是100,则121x +,221x +,201921x ⋯+的平均数是( )
A .100
B .2019
C .200
D .201
(6)(2019春•袁州区校级月考)甲乙两名同学6次考试的成绩统计如图,甲乙两组数据的
平均数分别为x 甲,x 乙,方差分别为2σ甲,2σ乙则( )
A .x x >乙甲,22
σσ<乙甲
B .x x >乙甲,22
σσ>乙甲
C .x x <乙甲,22
σσ<乙甲 D .x x <乙甲,22
σσ>乙甲
(7)(2019春•江城区校级月考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为
[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是 .
模块二:线性回归分析
1.两个变量之间的关系:函数关系与相关关系.
相关关系:变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.
2.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关; 反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.
3.散点图:将样本中的n 个数据点()(12)i i x y i n ,,
,,描在平面直角坐标系中. 散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.
散点图可以判断两个变量之间有没有相关关系.
4.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性.
回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 5.最小二乘法:
记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中,a b 叫做回归系数.
ˆy
是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i y
a bx =+. 设x Y ,
的一组观察值为()i i x y ,,12i n =,,,,且回归直线方程为ˆy a bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆi i y y -刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.
我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点.
记2
1()n
i i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和
为最小”的方法,叫做最小二乘法.
可以得到ˆˆa
b ,的计算公式为1
1
2
22
1
1
()()
()()n
n
i
i i
i
i i n
n
i
i
i i x
x y y x y
nxy
b x
x x
n x ====---==
--∑∑∑∑,ˆˆa
y bx =-,其中11n i i x x n ==∑,1
1n
i i y y n ==∑.由此得到的直线ˆˆy a bx =+就称为回归直线,其中ˆa
,b 分别为a ,b 的估计值.
由ˆˆa
y bx =-知,回归直线一定过平均值点,即一定过()x y ,. 考点3:线性回归
例3.(1)(2009海南3)对变量x ,y 有观测数据()(1210)i i x y i =,,,,,得散点图1;对变量u ,v 有观测数据()i i u v ,(1210)i =,,,,得散点图2.由这两个散点图可以判断( )。