概率统计复习专题
- 格式:doc
- 大小:935.50 KB
- 文档页数:12
总复习一、填空题(每题3分)1、已知事件A 与B 独立,且5.0)(=A P ,7.0)(=B P ,则=)(AUB P2、设X 服从正态分布)3.2(2N ,且21C) X (=≤P ,则=C 3、设每次试验中成功的概率为P )1(<<P o ,则在二次重复独立试验中,至少失败一次的概率为 。
4、评价估计量优劣的三条标准是无偏性,一致性和 性。
5、已知随机变量X 服从),(2σμN ,则X 的概率密度函数为6、设X 1,…,X n 是总体X 的一个样本,且X 的期望μ=EX 和方差2σ=DX 均未知,则2σ的无偏估计是=∧2σ7、设X 服从二项分布),(p n B ,则)(X E =8、若X 与Y 独立,且6)(=X D ,3)(=Y D ,则)2(Y X D -=9、设X 服从),(2σμN ,则≤≥-)3(σμX P10、一口袋中装有8只球,在这6只球上分别标有-1,1,1,1,1,3,,3,3这样的数字,现从这只口袋中任取一球,用随机变量X 表示取得的球上标明的数字,求:(1)X 的概率分布律;(2)X 的概率分布函数;(3))34(-X E .11.袋中有4个乒乓球, 其中3个是黄球, 1个是白球. 今有两人依次随机地从袋中各取一球, 取后不放回, 则第2个人取得黄球的概率是 . 12、对事件,A B 和C ,已知1()()()5P A P B P C ,()()0P AB P BC ,1()8P AC ,则,A B ,C 中至少有一个发生的概率是_________.13、已知随机变量X 在区间[ 5,15 ]上服从均匀分布,则EX= .14、中心极限定理告诉我们,若随机变量X 服从参数为1000,0.06的二项分布,则X 也近似服从参数为___ __和______的正态分布.15、设(X 1,X 2,...,X n )是取自正态总体N (μ,σ2)的简单随机样本,统计量∑==n i i X n T 121,则T 的数学期望ET=16、设X 表示独立射击目标10次所击中目标的次数,每次击中的概率为0.3,则X 2的数学期望E(X 2)= .17、设随机变量X 服从正态分布N(2,0.22),已知标准正态分布函数值 Φ(2.5)=0.9938,则P{2<X<2.5}=___ .18、设随机变量X 和Y 满足DX =25, DY =9, ρXY =0.4, 则D (X-Y) =19 、设总体X 的概率密度为,,020)(⎩⎨⎧<<=其它x Ax x f 则A=20、若随机变量X 服从参数为1=λ的分布,则大数定律告诉我们:∑=ni i X n 11依概率收敛于21 ,设总体X 服从),(2σμN 分布,X 1,…,X n 是X 的一个样本,则统计量n / X σμ- 服从分布;)(1_1222X XS nni i-=∑=οο 服从 分布;212)(1μο-∑=ni iX服从 分布二,单选1 .若随机变量X 具有性质)()(X D X E =,则X 服从 分布 a 、正态 b 、二项 c 、泊松 d 、均匀2、若)()(1)(B P A P B A P -=+,则A 与B a 、互不相容 b 、独立c 、为对立事件d 、为任意事件3、设随机变量X 服从)2,1(2N ,12-=X Y ,则Y 服从 分布 a 、)4,2(2N b 、)4,1(2N c 、)4,1(N d 、)4,2(N4、设A 与B 为两个随机事件,若0)(=AB P ,则下列命题正确的是 a 、A 、B 互不相容 b 、AB 未必是不可能事件 c 、A ,B 独立 d 、0)(=A P 或0)(=B P5、从总体X 中抽取样本X ,X 2,若X 服从)1,(θN 分布,则θ的估计量中,最有效的是a 、217671X X + b 、212121X X + c 、215451X X + d 、216561X X +6、“A 、B 、C 三事件恰有一个发生”可表为 a 、C U B U A b 、C B Ac 、ABCd 、C B A C B A C B U U A7、5.0)(=A P ,8.0)(=B P ,9.0)(=AUB P ,则B A 与的关系是 a 、互不相容 b 、独立 c 、B A ⊃ d 、A B ⊃8、设随机变量X 服从分布, 则2)] X [E() X (=D a 、均匀 b 、标准正态 c 、二项 d 、泊松9、设),(y x F 是随机变量Y), X (的分布函数,则下列式子 成立。
概率论与数理统计复习第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果. 随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B . 运算规则 交换律 结合律 分配律 德•摩根律B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率.(1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+…2.性质(1) P(Φ) = 0 , 注意: A 为不可能事件 P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) .(4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) . 对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=nk j i k j i nj i j i ni i n A A A P A A P A P A A A P 11121…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0) 3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则 当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P∑=1当P(A)>0, P(B i )>0时,有贝叶斯公式P (B i |A)=()()()()()()∑==ni i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件.(1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .(2)若A 与B ,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kkii i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2). (3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为: (1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX kk P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0) 三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数). 2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(xx dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布 (1)X ~U (a,b) 区间(a,b)上的均匀分布⎩⎨⎧=-0)(1a b x f其它b x a << . (2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (θ>0). (3)X~N (μ,σ2)参数为μ,σ的正态分布222)(21)(σμσπ--=x ex f -∞<x<∞, σ>0. 特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数⎰=Φ∞--xt dt e x 2221)(π, Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(zα)=1-α , z 1- α= -z α.四.随机变量X 的函数Y= g (X)的分布 1.若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律. 2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法: (1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为()()()()⎩⎨⎧'=0y h y h f y f X Y其它βα<<y其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布 一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) . (4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质(1)非负性 0≤p i j ≤1 .(2)归一性∑∑=i jij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y ,有F(x,y)=⎰⎰∞-∞-yxdudv v u f ),(则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度. 2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-d x d y y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y) 关于X 的边缘分布律 P{X= x i }=∑∞=1j ij p = p i·( i =1,2,…) 归一性11=∑∞=∙i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p·j( j =1,2,…) 归一性11=∑∞=∙j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义 若对一切实数x,y ,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j= p i ··p ·j( i ,j =1,2,…)对一切x i ,y j成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X(x)f Y(y)对(X,Y)所有可能取值(x,y)都成立.六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称 P{X=x i |Y=y j }为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称,}{},{jj i j j i p p y Y P y Y x X P ∙=====P{Y=y j |X=x i }为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量 连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X)∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2}[]∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) 函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) .二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2D(X) . 2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X)1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p)2.X~ b (n,p) (0<p<1) n p n p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/12 5.X 服从参数为θ的指数分布 θ θ2 6.X~ N (μ,σ2) μ σ2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E {[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l}第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i i XX n S 12211 样本标准差S样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==n i ki k X X n B 1)(1( k=1,2,…),}{},{∙=====i j i i j i p p x X P y Y x X P二.抽样分布 即统计量的分布 1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n .特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2/n) .2.χ2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2).③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点. 3. t 分布(1)定义 若X~N (0,1),Y~ χ2(n),且X,Y 相互独立,则t=nY X~t(n)自由度为n 的t 分布. (2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2 )时, nS X μ-~ t (n-1) .③两个正态总体相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1 X S 12Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2Y S22则212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w(3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点.注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意:.).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p (x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,Xn的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧kθθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由 似然方程组0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量.文 - 汉语汉字 编辑词条文,wen ,从玄从爻。
概率统计复习知识点汇总第一章1.概率的性质、加法公式、乘法公式及其相互之间的性质和运算。
复习例题1)已知P(A)=0.3,P(B)=0.5,P(A ∪B)=0.8,那么P(B A )=______,P(B A ⋂)=______. 2)已知P(A)=0.5 ,P(B)=0.6 ,P(AB)=0.4求下列概率:(1)P(BA) (2)P(A |B )3)设P (A )=0.5,P (A B )=0.4,则P (B|A )=___________.4)已知事件A ,B 相互独立,且P (A )>0,P(B)>0,则下列等式成立的是( ) A .P(A B)=P(A)+P(B) B .P(A B)=1-P (A )P (B ) C .P(A B)=P(A)P(B)D .P(A B)=15)设A 与B 互为对立事件,且P (A )>0,P (B )>0,则下列各式中错误..的是( ) A .0)|(=B A P B .P (B |A )=0C .P (AB )=0D .P (A ∪B )=12.古典概型、全概率公式、贝叶斯公式的相关计算 1)将一颗骰子掷三次,求掷出的点数都不同的概率2)若1,2,3,4,5号运动员随机排成一排,则1号运动员站在正中间的概率为_______________.3)从1、2、3、4、5这5个数中,任取其三,构成一个三位数。
试求下列事件的概率:(1)三位数是奇数; (2)三位数为5的倍数; (3)三位数为3的倍数; (4)三位数小于350。
解 设A 表示事件“三位数是奇数”, B 表示事件“三位数为5的倍数”,C 表示事件“三位数为3的倍数”,D 表示事件“三位数小于350”。
基本事件总数为 35A V =Ω,(1)6.060363)(,3352424==⨯=⨯=A A A P A V A ;(2)2.060121)(,1352424==⨯=⨯=A A B P A V B ;(3)4.06024!34)(,!3435==⨯=⨯=A A P V C ;(4) 55.060332)(,235131324131324==⋅+⨯=⋅+⨯=A A A A D P A A A V D4)甲、乙、丙三组工人加工同样的零件,它们出现废品的概率:甲组是0.01,乙组是0.02,丙组是0.03,它们加工完的零件放在同一个盒子里,其中甲组加工的零件是乙组加工的2倍,丙组加工的是乙组加工的一半,从盒中任取一个零件是废品,求它不是乙组加工的概率。
高考文科复习专题——概率知识点梳理1.随机抽样1简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少.2系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.3分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成.2.常用的统计图表1频率分布直方图①小长方形的面积=组距×错误!=频率;②各小长方形的面积之和等于1;③小长方形的高=错误!,所有小长方形的高的和为错误!.2茎叶图在样本数据较少时,用茎叶图表示数据的效果较好.3.用样本的数字特征估计总体的数字特征1众数、中位数、平均数12n标准差:s=错误!.4.变量的相关性与最小二乘法1相关关系的概念、正相关和负相关、相关系数.2最小二乘法:对于给定的一组样本数据x1,y1,x2,y2,…,x n,y n,通过求Q=错误!y i -a-bx i2最小时,得到线性回归方程错误!=错误!x+错误!的方法叫做最小二乘法.5.独立性检验对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是:则K2=错误!其中n1.袋中共有6个除了颜色外完全相同的球,其中有1个红球,2个白球和3个黑球,从袋中任取两球,两球颜色为一白一黑的概率.2.一支田径运动队有男运动员56人,女运动员42人;现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人;3.某学校高一、高二、高三年级的学生人数之比为334::,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.4.袋中有五张卡片,其中红色卡片三张,标号分别为1,2,3;蓝色卡片两张,标号分别为1,2.Ⅰ从以上五张卡片中任取两张,求这两张卡片颜色不同且标号之和小于4的概率;Ⅱ现袋中再放入一张标号为0的绿色卡片,从这六张卡片中任取两张,求这两张卡片颜色不同且标号之和小于4的概率.5.乒乓球比赛规则规定:一局比赛,双方比分在10平前,一方连续发球2次后,对方再连续发球2次,依次轮换;每次发球,胜方得1分,负方得0分;设在甲、乙的比赛中,每次发球,发球方得1分的概率为0.6,各次发球的胜负结果相互独立;甲、乙的一局比赛中,甲先发球;Ⅰ求开始第4次发球时,甲、乙的比分为1比2的概率;Ⅱ求开始第5次发球时,甲得分领先的概率.6.甲、乙两人轮流投篮,每人每次投一球,约定甲先投且先投中者获胜,一直每人都已投球3次时投篮结束,设甲每次投篮投中的概率为13,乙每次投篮投中的概率为12,且各次投篮互不影响.Ⅰ求乙获胜的概率;Ⅱ求投篮结束时乙只投了2个球的概率.7.某地区有小学21所,中学14所,大学7所,现采取分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查;I求应从小学、中学、大学中分别抽取的学校数目;II若从抽取的6所学校中随机抽取2所学校做进一步数据分析,1列出所有可能的抽取结果;2求抽取的2所学校均为小学的概率;8.若某产品的直径长与标准值的差的绝对值不超过...1mm 时,则视为合格品,否则视为不合格品;在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品;计算这50件不合格品的直径长与标准值的差单位:mm, 将所得数据分组,得到如下频率分布表:Ⅰ将上面表格中缺少的数据填完整;Ⅱ估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间1,3内的概率;Ⅲ现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品;据此估算这批产品中的合格品的件数.9.2012·辽宁电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.1根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关2,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:10.甲、乙两位运动员在,记甲、乙两人的平均得分分别为错误!甲,错误!乙,则下列判断正确的是甲>错误!乙;甲比乙成绩稳定甲>错误!乙;乙比甲成绩稳定甲<错误!乙;甲比乙成绩稳定甲<错误!乙;乙比甲成绩稳定11. 15年广东文科某城市100户居民的月平均用电量单位:度,以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.()1求直方图中x的值;()2求月平均用电量的众数和中位数;()3在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户。
概率与统计知识点及专练(一)统计基础知识:1. 随机抽样:(1).简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.(2).系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).(3).分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.2. 普通的众数、平均数、中位数及方差: (1).众数:一组数据中,出现次数最多的数(2).平均数:常规平均数:12nx x x x n ++⋅⋅⋅+=(3).中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数(4).方差:2222121[()()()]n s x x x x x x n =-+-+⋅⋅⋅+-(5).标准差:s3 .频率直方分布图中的频率:(1).频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数; 频数=总数*频率(2).频率之和等于1:121n f f f ++⋅⋅⋅+=;即面积之和为1: 121n S S S ++⋅⋅⋅+=4. 频率直方分布图下的众数、平均数、中位数及方差: (1).众数:最高小矩形底边的中点(2).平均数:112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+(3).中位数:从左到右或者从右到左累加,面积等于0.5时x 的值(4).方差:22221122()()()nn s x x f x x f x x f =-+-+⋅⋅⋅+-5.线性回归直线方程:(1).公式:ˆˆˆy bx a=+其中:1122211()()ˆ()n ni i i ii in ni ii ix x y y x y nxybx x x nx====---∑∑==--∑∑(展开)ˆˆa y bx=-(2).线性回归直线方程必过样本中心(,) x y(3).ˆ0:b>正相关;ˆ0:b<负相关(4).线性回归直线方程:ˆˆˆy bx a=+的斜率ˆb中,两个公式中分子、分母对应也相等;中间可以推导得到6. 回归分析:(1).残差:ˆˆi i ie y y=-(残差=真实值—预报值)分析:ˆie越小越好(2).残差平方和:2 1ˆ() ni iiy y =-∑分析:①意义:越小越好;②计算:222211221ˆˆˆˆ()()()() ni i n niy y y y y y y y =-=-+-+⋅⋅⋅+-∑(3).拟合度(相关指数):2 2121ˆ()1()ni iiniiy y Ry y==-∑=--∑分析:①.(]20,1R∈的常数;②.越大拟合度越高(4).相关系数:()()n ni i i ix x y y x y nx y r---⋅∑∑==分析:①.[1,1]r∈-的常数;②.0:r>正相关;0:r<负相关③.[0,0.25]r∈;相关性很弱;(0.25,0.75)r∈;相关性一般;[0.75,1]r∈;相关性很强7. 独立性检验:(1).2×2列联表(卡方图): (2).独立性检验公式①.22()()()()()n ad bc k a b c d a c b d -=++++②.上界P 对照表:(3).独立性检验步骤:①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++ ②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k③.下结论:0k k ≥即认为有P 的没把握、有1-P 以上的有把握认为两个量相关;0k k <:即认为没有1-P 以上的把握认为两个量是相关关系。
高一数学复习专题练习专题5 概率与统计一、选择题1.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是( )A .40B .50C .120D .150【答案】 C【解析】 由于样本容量即样本的个数,故抽取的样本的个数为40×3=120. 2.从6个篮球、2个排球中任选3个球,则下列事件中,是必然事件的是( ) A.3个都是篮球 B.至少有1个是排球 C.3个都是排球D.至少有1个是篮球【答案】 D【解析】 从6个篮球、2个排球中任选3个球,A ,B 是随机事件,C 是不可能事件,D 是必然事件,故选D.3.一个射手进行射击,记事件E 1:“脱靶”,E 2:“中靶”,E 3:“中靶环数大于4”,E 4:“中靶环数不小于5”,则在上述事件中,互斥而不对立的事件共有( ) A .1对 B .2对 C .3对D .4对【答案】 B【解析】 E 1与E 3,E 1与E 4均为互斥而不对立的事件.4.袋中装有白球和黑球各3个,从中任取2个,则至多有一个黑球的概率是( ) A.15 B.45 C.13 D.12【答案】 B【解析】 把白球编号为1,3,5,黑球编号为2,4,6.从中任取2个,基本事件为12,13,14,15,16,23,24,25,26,34,35,36,45,46,56,共15个.其中至多一个黑球的事件有12个.由古典概型公式得P =1215=45.学-科网5.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分),现将高一两个班参赛学生的成绩进行整理后分成五组:第一组[50,60),第二组[60,70),第三组[70,80),第四组[80,90),第五组[90,100],其中第一、三、四、五小组的频率分别为0.30,0.15,0.10,0.05,而第二小组的频数是40,则参赛的人数以及成绩优秀的概率分别是( ) A.50,0.15 B.50,0.75 C.100,0.15D.100,0.75【答案】 C【解析】 由已知得第二小组的频率是1-0.30-0.15-0.10-0.05=0.40,频数为40,设共有参赛学生x 人,则x ×0.4=40,∴x =100. 成绩优秀的概率为0.15,故选C.6.如图所示,现有一迷失方向的小青蛙在3处,它每跳动一次可以等可能地进入相邻的任意一格(若它在5处,跳动一次,只能进入3处,若在3处,则跳动一次可以等机会地进入1,2,4,5处),则它在第三次跳动后,首次进入5处的概率是( )A.12B.14C.316D.16【答案】 C7.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本方差为( ) A.65 B.65C. 2D.2 【答案】 D【解析】 ∵样本的平均数为1, 即15×(a +0+1+2+3)=1,∴a =-1. ∴样本方差s 2=15×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.8.已知集合A ={-5,-3,-1,0,2,4},在平面直角坐标系中,点(x ,y )的坐标满足x ∈A ,y ∈A ,且x ≠y ,则点(x ,y )不在x 轴上的概率( ) A.13B.12C.56D.14【答案】 C【解析】 因为x ∈A ,y ∈A ,且x ≠y ,所以x 有6种可能,y 有5种可能,所以试验的所有结果有6×5=30(种),且每种结果的出现是等可能的.设事件A 为“点(x ,y )不在x 轴上”,那么y ≠0,有5种可能,x 有5种可能,事件A 包含基本事件个数为5×5=25种.因此所求事件的概率为P (A )=2530=56.9.为了调查某厂2 000名工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[10,15),[15,20),[20,25),[25,30),[30,35],频率分布直方图如图所示.工厂规定从生产低于20件产品的工人中随机地选取2位工人进行培训,则这2位工人不在同一组的概率是( )A.110B.715C.815D.1315【答案】 C【解析】 根据频率分布直方图,可知产品件数在[10,15),[15,20)内的人数分别为5×0.02×20=2,5×0.04×20=4.设生产产品件数在[10,15)内的2人分别是A ,B ,生产产品件数在[15,20)内的4人分别为C ,D ,E ,F ,则从生产低于20件产品的工人中随机地选取2位工人的结果有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(A ,F ),(B ,C ),(B ,D ),(B ,E ),(B ,F ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F ),共15种.2位工人不在同一组的结果有(A ,C ),(A ,D ),(A ,E ),(A ,F ),(B ,C ),(B ,D ),(B ,E ),(B ,F ),共8种.故选取的2位工人不在同一组的概率为815.二、填空题(本大题共4小题,每小题5分,共20分)10.某企业共有职工150人,其中高级职称15人,中级职称45人,低级职称90人,现采用分层抽样来抽取30人,则抽取的高级职称的人数为________.【答案】 3【解析】 由题意得抽样比为30150=15,所以抽取的高级职称的人数为15×15=3.11.一批产品共有100件,其中5件是次品,95件是合格品,从这批产品中任意抽5件,记A 为“恰有1件次品”,B 为“至少有2件次品”,C 为“至少有1件次品”,D 为“至多有1件次品”.现给出下列结论:①A +B =C ;②B +D 是必然事件;③A +C =B ;④A +D =C .其中正确的结论为________.(写出序号即可) 【答案】 ①②【解析】 由互斥、对立事件的概念得A +B =C ,故③错;A +D 表示“至多有1件次品”,所以④错. 12.为了了解《中华人民共和国道路交通安全法》在学生中的普及情况,调查部门对某校6名学生进行问卷调查,6人得分情况如下:5,6,7,8,9,10.把这6名学生的得分看成一个总体.如果用简单随机抽样方法从这6名学生中抽取2名,他们的得分组成一个样本,则该样本平均数与总体平均数之差的绝对值不超过0.5的概率为________. 【答案】715三、解答题13.(12分)一个包装箱内有6件产品,其中4件正品,2件次品.现随机抽出两件产品. (1)求恰好有一件次品的概率; (2)求都是正品的概率; (3)求抽到次品的概率.解 将6件产品编号,abcd (正品),ef (次品),从6件产品中选2件,其包含的基本事件为ab ,ac ,ad ,ae ,af ,bc ,bd ,be ,bf ,cd ,ce ,cf ,de ,df ,ef ,共15种.(1)设恰好有一件次品为事件A ,事件A 包含的基本事件为ae ,af ,be ,bf ,ce ,cf ,de ,df ,共有8种, 则P (A )=815.(2)设都是正品为事件B ,事件B 包含的基本事件数为6,则P (B )=615=25.(3)设抽到次品为事件C ,事件C 与事件B 是对立事件,则P (C )=1-P (B )=1-25=35.14.已知关于x 的一元二次方程x 2-2(a -2)x -b 2+16=0.若a ,b 是一枚骰子掷两次所得到的点数,求方程有两正根的概率;解 a ,b 是一枚骰子掷两次所得到的点数,总的基本事件(a ,b )共有36个. 设事件A 表示“方程有两正根”,则∆≥0,a -2>0,16-b 2>0,即a -2 2+b 2≥16,a >2,-4<b <4,则事件A 包含的基本事件有(6,1),(6,2),(6,3),(5,3),共4个,故方程有两正根的概率为P (A )=436=19.15.(12分)先后2次抛掷一枚骰子,将得到的点数分别记为a ,b . (1)求直线ax +by +5=0与圆x 2+y 2=1相切的概率;(2)将a ,b,5的值分别作为三条线段的长,求这三条线段能围成等腰三角形的概率.解 先后2次抛掷一枚骰子,将得到的点数分别记为a ,b 包含的基本事件:(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),…,(6,5),(6,6),共36个. (1)∵直线ax +by +5=0与圆x 2+y 2=1相切,∴5a 2+b2=1,整理得a 2+b 2=25. 由于a ,b ∈{1,2,3,4,5,6},∴满足条件的情况只有a =3,b =4或a =4,b =3两种情况. ∴直线ax +by +5=0与圆x 2+y 2=1相切的概率是236=118.(2)∵三角形的一条边长为5,三条线段围成等腰三角形,∴当a =1时,b =5,共1个基本事件; 当a =2时,b =5,共1个基本事件; 当a =3时,b =3,5,共2个基本事件; 当a =4时,b =4,5,共2个基本事件; 当a =5时,b =1,2,3,4,5,6,共6个基本事件; 当a =6时,b =5,6,共2个基本事件;∴满足条件的基本事件共有1+1+2+2+6+2=14(个). ∴三条线段能围成等腰三角形的概率为1436=718.学-科网16.(12分)有7位歌手(1至7号)参加一场歌唱比赛,由500名大众评委现场投票决定歌手名次,根据年龄将大众评委分为五组,各组的人数如下:组别 A B C D E人数5010015015050(1)为了调查大众评委对7位歌手的支持情况,现用分层抽样方法从各组中抽取若干评委,其中从B组中抽取了6人.请将其余各组抽取的人数填入下表.组别 A B C D E人数5010015015050抽取人数 6(2)在(1)中,若A,B两组被抽到的评委中各有2人支持1号歌手,现从这两组被抽到的评委中分别任选1人,求这2人都支持1号歌手的概率.解 (1)由题设知,分层抽样的抽取比例为6%,所以各组抽取的人数如下表:组别 A B C D E50[来人数50100150150源:Z*xx*]抽取人数3699 3(2)记从A组抽到的3个评委为a1,a2,a3,其中a1,a2支持1号歌手;从B组抽到的6个评委为b1,b2,b3,b4,b5,b6,其中b1,b2支持1号歌手.从{a1,a2,a3}和{b1,b2,b3,b4,b5,b6}中各抽取1人的所有结果为:由以上树状图知所有结果共18种,其中2人都支持1号歌手的有a1b1,a1b2,a2b1,a2b2,共4种,故所求概率P=418=29.。
概率统计公式大全复习重点在学习概率统计这门学科时,掌握各种公式是至关重要的。
这些公式不仅是解决问题的工具,更是理解概率统计概念的关键。
本文将为您梳理概率统计中的重点公式,帮助您更好地复习和掌握这部分知识。
一、随机事件与概率1、古典概型概率公式如果一个随机试验所包含的基本事件总数为 n,事件 A 所包含的基本事件数为 m,则事件 A 发生的概率为:P(A) = m / n2、几何概型概率公式设样本空间为几何区域Ω,事件 A 对应的区域为ω,则事件 A 发生的概率为:P(A) =ω 的测度/Ω 的测度3、条件概率公式设 A、B 是两个事件,且 P(B) > 0,则在事件 B 发生的条件下,事件 A 发生的条件概率为:P(A|B) = P(AB) / P(B)4、乘法公式P(AB) = P(A|B)P(B) 或 P(AB) = P(B|A)P(A)5、全概率公式设 B₁, B₂,, Bₙ 是样本空间Ω 的一个划分,且 P(Bᵢ) > 0(i = 1, 2,, n),A 是Ω 中的任意一个事件,则有:P(A) =∑ P(Bᵢ)P(A|Bᵢ)(i从 1 到 n)6、贝叶斯公式设 B₁, B₂,, Bₙ 是样本空间Ω 的一个划分,且 P(Bᵢ) > 0(i = 1, 2,, n),A 是Ω 中的任意一个事件,在事件 A 已经发生的条件下,事件 Bᵢ发生的概率为:P(Bᵢ|A) = P(Bᵢ)P(A|Bᵢ) /∑ P(Bₙ)P(A|Bₙ) (i从 1 到 n,k 从 1 到 n)二、随机变量及其分布1、离散型随机变量的概率分布设离散型随机变量 X 的可能取值为 x₁, x₂,, xₙ,对应的概率为p₁, p₂,, pₙ,则概率分布为:P(X = xᵢ) = pᵢ(i = 1, 2,, n),且∑pᵢ= 12、二项分布如果随机变量 X 服从参数为 n 和 p 的二项分布,记为 X ~ B(n, p),则概率质量函数为:P(X = k) = C(n, k) p^k (1 p)^(n k) (k = 0, 1, 2,, n)3、泊松分布如果随机变量 X 服从参数为λ 的泊松分布,记为 X ~P(λ),则概率质量函数为:P(X = k) =(e^(λ) λ^k) / k! (k = 0, 1, 2,)4、连续型随机变量的概率密度函数设连续型随机变量 X 的概率密度函数为 f(x),则分布函数为:F(x)=∫∞, x f(t) dt5、正态分布如果随机变量 X 服从参数为μ 和σ² 的正态分布,记为 X ~N(μ, σ²),则概率密度函数为:f(x) =(1 /(σ√(2π))) e^((x μ)² /(2σ²))三、随机变量的数字特征1、数学期望离散型随机变量 X 的数学期望为:E(X) =∑ xᵢ pᵢ(i 从 1 到 n)连续型随机变量 X 的数学期望为:E(X) =∫∞,+∞ x f(x) dx2、方差离散型随机变量 X 的方差为:D(X) =∑ (xᵢ E(X))² pᵢ(i 从 1 到n)连续型随机变量 X 的方差为:D(X) =∫∞,+∞ (x E(X))² f(x) dx3、标准差随机变量 X 的标准差为:σ(X) =√D(X)4、协方差设随机变量 X 和 Y,其协方差为:Cov(X, Y) = E((X E(X))(Y E(Y)))5、相关系数随机变量 X 和 Y 的相关系数为:ρ(X, Y) = Cov(X, Y) /(σ(X)σ(Y))四、大数定律和中心极限定理1、大数定律当 n 足够大时,样本均值X依概率收敛于总体均值μ,即:P(|Xμ| >ε) → 0 (n → ∞)2、中心极限定理设随机变量 X₁, X₂,, Xₙ 相互独立,且具有相同的分布和有限的数学期望μ 和方差σ²。
专题训练16统计与概率一、选择题(每小题3分,共24分) 1.下列调查工作需采用的普查方式的是()(A )环保部门对淮河某段水域的水污染情况的调查. (B )电视台对正在播出的电视节目收视率的调查. (C )质检部门对各家生产的电池使用寿命的调查. (D )企业在给职工做工作服前进行的尺寸大小的调查.2.筹建中的安徽芜湖核电站芭茅山厂址位于长江南岸繁昌县狄港镇,距离繁昌县县城约17km ,距离芜湖市区约35km ,距离无为县城约18km ,距离巢湖市区约50km ,距离 铜陵市区约36km ,距离合肥市区约99km .以上这组数据17、35、18、50、36、99 的中位数为( )4.在一个暗箱里放有Q 个除颜色外其它完全相同的球,这Q 个球中红球只有3个.每次将球搅拌均匀后,任意摸出一个球记下颜色再放回暗箱.通过大量重复摸球实验后发 现,摸到红球的频率稳定在25%,那么可以推算出Q 大约是()(A ) 18.(B ) 50.3 .下列事件中,必然事件是()(A )中秋节晚上能看到月亮.(C )早晨的太阳从东方升起.(C ) 35.(D ) 35.5.(B )今天考试小明能得满分. (D )明天气温会升高. (A) 12. (B) 9. (C ) 4. (D ) 3.5.小明随机地在如图所示的正三角形及其内部区域投针,则针扎到其内切圆(阴影)区域的概率为()1v 3 <33超(A ) — .(B ) -兀.(C ) ――^ .(D ) ----- .2 6 9几6.将50个个体编成组号为①④的四个组,如下表:组号 ① ②③ ④统计图,在一片果园中,有不同种类的果树,为了反映某种果树的种10 .有长为2、4、6、8、10的五根木棍,从中任意抽取三根,能构成三角形的概率是 11 .某校学生会调查60名同学体育爱好项目的统计图如图所示,根据图中信息,喜欢各12 .某地湖水在一年中各个月的最高温度和最低温度统计图如图所示.由图可知,全年湖频数 14 1113(A) 24.(B) 0.24.(C) 12.(D) 0.12.7.甲、乙两位同学在一次用频率去估计概率的实验中统计了某一结果出现的频率,绘出 的统计图如图所示,则符合这一结果的实验可能是 (A )掷一枚正六面体的骰子,出现1点的概率. (B) 一个袋子中有2个白球和1个红球从中8. 二、 9. 任取一个球,则取到红球的概率. (C )抛一枚硬币,出现正面的概率.(D )任意写一个整数,它能被2整除的概率.在—2, — 1, 0, 1, 2中任取一个数 2 (C) 5填空题(每小题3分,共18分) 反映某种股票涨跌情况,应选用40% 30% 20% 10%200 400 600 次数 … .2 + x .................... ....恰好使分式___有意义的概率是()4(D) 5(E) 1.统计图;学校统计各年级的总人数应选值面积占整个果园的面积百分比,应选用统计图.那么第③组的频率为(频率(第11题)(第12题) (第13项体育项目的人数极差.水的最低温度是___________ ,温差最大的月份是 __________ .13.如图,数轴上两点A B,在线段AB上任取一点,则点C到表示1的点的距离不大于2的概率是___________ .14.为备站2008年奥运会,教练要判断刘翔100米跨栏成绩是否稳定,对他10次训练成绩进行统计分析,则教练需了解刘翔这10次成绩的.三、解答题(每小题6分,共24分)15.请将表示下列事件的序号按其发生概率的大小标在下图中.A.掷一枚均匀的硬币,正面朝上.B.在分别标有1〜9连续自然数的九张卡片中,随机抽出两张,和大于17.C任意找到两个负数,它们的乘积为正数.D.在某次有奖销售活动中,共准备了1000个抽奖号码,其中设一等将10个,二等将40个,三等将50个,顾I I I I I I I I I I I客摸一次中奖. 0 116.某校学生会生活部长王敏同学随机调查部分同学对食堂伙食的评价,准备绘制成统计图表,现已完成其中的一部分,请你运用统计知识将其他空缺部分逐一补上.食堂伙食意见统计表食堂伙食意见条形统计图食堂伙食意见扇形统计图17.下表是某校九(1)班20名学生某次数学测验的成绩统计表.成绩/分60708090100■人数/人151y(1)若这20名学生的平均成绩为82分,求1和y的值;(2)在(1)的条件下,求这20名学生本次测验成绩的众数与中位数.18.某校有A、B两个餐厅,甲、乙、丙三名学生各自随机选择其中的一个餐厅用餐.画树形图或列表求下列事件发生的概率.(1)甲、乙、丙三名学生在同一个餐厅用餐;(2)甲、乙、丙三名学生中至少有一人在B餐厅用餐.四、解答题(每小题7分,共14分)19.“十•一”七天长假期间,很多同学都和父母一起旅游,下图是班长小明将本班同学出游2天、3天、4天的数据绘制成扇形统计图的一部分:(1)若问一位出游的同学十一期间旅游几天,那么最有可能的回答是 ______ 天;............ ,一」,,3 …… 一、」…八, (2)小明说旅游4天的人数是2天的;,请你通过这一信息,并通过计算将扇形统计4图补充完整.20.在背面图案一样的四张卡片的正面标有数字1、2、3、4,将正面朝上洗匀后抽取一张数字为m,把此卡片放回洗匀后以同样的方式再次抽取一张卡片数字为n .若把m、n作为点的横、纵坐标,求点(m , n)在函数y 2x的图象上的概率.五、解答题(每小题10分,共20分)21 .张明、王成两位同学的10次数学单元自我检测成绩分别如下图所示:(3)根据图表信息,请你对这两位同学各提一条不超过20个字的学习建议.张明同学王成同学1 1 S -1 5 6 7 3 1 W %号 成结/7T sT5 77 m 号(1)完成下表:(2)如果将90分以上(含90分)的成绩视为优秀,则获得优秀次数较多的同学22. A、B、C三个工程队共修建一段长240km的公路,图中分别反映了每个工程队的工程比例及每月完成公路的进度.(1)根据图中的信息,求出每个工程队的工程量;(2)若B队9个月的工程量与A队6个月的工程量相同,求a的的值;(3)在(2)的条件下,同时开工,完成全部工程需要几个月时间.参考答案一、选择题1. D2. D3. C4. A5. C6. B7. B8. C 二、填空题29.折线,条形,扇形10. 0.3 11. 25名12. 22℃, 9月份13. 3 14.方差 三、解答题15 . P (A )=0.5, P (B )=0, P (C )=1, P (D )=0.1,图略.16 .一般:20,好:(10+20+120);(1—50%)X 50% = 50,条形、扇形统计图略. 17 . (1) X + J = 12, 8 X + 9 J = 103,解得了 = 5, J = 7; (2) 90 分,80 分. 18 .树形图或列表如图所示:(1) P (甲、乙、丙三名学生在同一餐厅用餐)=1.47 (2) P (甲、乙、丙三名学生中至少有一人在B 餐厅用餐)=-. 8四、解答题19. (1) 3; (2)人数是2天的百分比为20%,人数是4天的百分比为15%,图略. 20. 点(m , n )共有16种情况,而在函数J = 2X 图象上的点有(1, 2) (2, 4)两种,丙 ABABABAB甲 A A A A B B B B 乙 A A BB A A B B 丙 A B AB A B AB-8所以点(m , n )在函数J = 2X图象上的概率为0.125.五、解答题21. (1)平均成绩均为80分,张明的方差为60分2,王成的中位数为85分,众数为90分;(2)王成;(3)王成的学习要持之以恒,保持稳定;张明的学习还须加油,提高优秀率(答案不唯一,只有你的建议合理即可).22. (1) A 工程队的工程量为:35% x 240 = 84, C 工程队的工程量为:45%x 240 = 108 ,B 工程队的工程量为:20% x 240 = 48.(2) 4x 9 = 6a , a = 6.答:三个工程队同时开工需要14个月完成全部工程. (3) T 二 14,手二 12,T = 13.5 .。
2023年中考数学考前30天迅速提分复习方案(上海地区专用)专题1.6统计与概率三大考点与真题训练考点一:数据的收集与整理一、单选题1.(2023·上海·模拟预测)某校有4000名学生,随机抽取了400名学生进行体重调查,下列说法正确的是( )A.总体是该校4000名学生的体重B.个体是每一个学生C.样本是抽取的400名学生D.样本容量是400名学生【答案】A【分析】我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象,从而找出总体、个体,再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.【详解】解:A.总体是该校4000名学生的体重,说法正确,故A符合题意;B.个体是每一个学生的体重,原来的说法错误,故B不符合题意;C.样本是抽取的400名学生的体重,说法错误,故C不符合题意;D.样本容量是400,说法错误,故D不符合题意.故选:A.【点睛】本题主要考查了总体、个体、样本、样本容量,解题的关键是正确记忆各自的概念.总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.2.(2022·上海徐汇·统考二模)在知识竞赛中,成绩分为A,B,C,D四个等级,相应等级的得分依次记为100分,90分,80分,70分.将九年级二班参赛选手的成绩整理并绘制成如下的统计图,九年级二班参赛选手成绩的众数和中位数分别是()A.100和90B.100和80C.80和90D.80和80.【答案】B【分析】根据中位数和众数的定义求解即可.【详解】解:由统计图可知,A级的占比最多,即得分为100分的人数最多,∴二班参赛选手的成绩的众数为100;∵中位数是一组数据中处在最中间或处在最中间的两个数据的平均数,∴由扇形统计图可知处在最中间的成绩为80分或处在最中间的两个数据分别为80分,80分,∴中位数即为80,故选B.【点睛】本题主要考查了求中位数和众数,熟知二者的定义是解题的关键.3.(2020·上海虹口·统考二模)如图为某队员射击10次的成绩统计图,该队员射击成绩的众数与中位数分别是()A.8,7B.7,6.5C.7,7D.8,7.5【答案】D【分析】先根据折线图将这10个数据从小到大排列,再根据众数和中位数的概念求解可得.【详解】解:由折线图知,这10个数据分别为3、4、6、7、7、8、8、8、9、10,+=7.5,所以这组数据的众数为8,中位数为782故选:D.【点睛】本题主要考查众数和中位数,将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数;一组数据中出现次数最多的数据叫做众数.4.(2021·上海·上海市实验学校校考二模)为了了解某校九年级300名学生的体重情况,从中抽取50名学生的体重进行分析,在这项调查中,样本是指()A.300名学生B.300名学生的体重C.被抽取的50名学生D.被抽取的50名学生的体重【答案】D【分析】根据总体、个体、样本、样本容量的定义判断即可.【详解】解:为了解某校九年级300名学生的体重情况,从中随机抽取50名学生的体重进行分析,在这项调查中,样本是被抽取的50名学生的体重.故选:D.【点睛】本题考查了总体、个体、样本、样本容量,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.二、填空题5.(2021·上海青浦·统考二模)为了解某区2400名初中教师中接种新冠疫苗的教师人数,随机调查了其中200名教师,结果有150人接种了疫苗,那么估计该区接种新冠疫苗的初中教师人数约有_______人.【详解】解:估计该区接种新冠疫苗的初中教师人数约有2400×150=1800(人),200故答案为:1800.【点睛】本题考查用样本估计总体.理解用样本估计总体的含义和掌握其公式是解答本题的关键.6.(2021·上海金山·二模)为了了解某校初三学生在体育测试中报名球类的情况,随机调查了40名学生的报名情况,得到如下数据.根据此信息,估计该校480名初三学生报名足球的学生人数约为_____人.7.(2021·上海嘉估计某个鱼塘里的鱼的数量,养殖工人网住了50条鱼,在每条鱼的尾巴上做个记号后,又将鱼放回鱼塘.等鱼游散后再随机撒网,网住60条鱼,发现其中有2条鱼的尾巴上有记号.设该鱼塘里有x条鱼,依据题意,可以列出方程:_____.8.(2021·上海静安·统考二模)为了了解学生用于阅读课外书籍的时间的情况,某校在300名九年级学生中随机对40名学生每周阅读课外书籍所用的时间进行统计.根据调查结果画出频率分布直方图,如图所示(每个小组可包括最小值,不包括最大值),由此可以估计该校九年级学生阅读课外书籍用的时间在6小时及以上的人数约为________.【答案】120【分析】根据直方图分析出课外阅读时间在6小时及以上的人数的频率,然后利用频率乘总人数即可求解.【详解】由图中可知,课外阅读时间在6小时及以上的人数的频率为0.25+0.15=0.4,∴所有学生中,课外阅读时间在6小时及以上的人数300×0.4=120人,故答案为:120.【点睛】本题考查频率分布直方图,理解频率分布直方图的意义是解题关键.9.(2021·上海闵行·统考二模)为了解全区104000个小学生家庭是否有校内课后服务需求,随机调查了4000个小学生家庭,结果发现有2800个小学生家庭有校内课后服务需求,那么估计该区约有________个小学生家庭有校内课后服务需求.【答案】72800【分析】先求出样本中学生参加校内课后服务所占的百分比,再用样本估算总体.【详解】280010400072800´=(人).4000故答案为:72800.【点睛】考查了用校本估算总体,解题关键先计算出样本中所占的百分比,再用样本的数据去估算总体情况.10.(2021·上海松江·统考二模)一次数学测试后,某班40名学生按成绩分成5组,第1、2、3、4组的频数分别为6、7、10、13,则第5组的频率为 _____.11.(2022·上海杨浦·统考二模)为了了解全区近4800名初三学生数学学习状况,从中随机抽取500名学生的测试成绩作为样本,将他们的成绩整理后分组情况如下:(每组)数据可含最低值,不含最高值根据上表信息,由此样本请你估计全区此次成绩在70~80分的人数大约是_______.【答案】1920【分析】根据题意和表格中的数据,可以先计算出80~90和90~100的学生人数,然后即可计算出70~80的学生人数,再计算出全区此次成绩在70~80分的人数即可.【详解】解:由题意可得,80~90的学生有:500×0.18=90(人),90~100学生有:500×0.04=20(人),∴样本中70~80的学生有:500-12-18-160-90-20=200(人),=1920,∴估计全区此次成绩在70~80分的人数大约是4800×200500故答案为:1920.【点睛】本题考查频数分布表、用样本估计总体,解答本题的关键是明确题意,求出样本中70~80分的人数.12.(2021·上海·上海市实验学校校考二模)某校200名学生一次数学测试的分数均大于75且小于150,分数段的频数分布情况如下:70~90有15人,90~105有42人,105~12 0有58人,135~150有35人(其中每个分数段可包括最小值,不包括最大值),那么测试分数在120~135分数段的频率是______________.三、解答题13.(2023·上海·模拟预测)小聪、小明参加了100米跑的5期集训,每期集训结束时进行测试.根据他们集训时间、测试成绩绘制成如下两个统计图.根据图中信息,解答下列问题:(1)这5期的集训共有多少天?(2)哪一期小聪的成绩比他上一期的成绩进步最多?进步了多少秒?(3)根据统计数据,结合体育运动的实际,从集训时间和测试成绩这两方面,简要说说你的想法.【答案】(1)55天(2)第3期小聪的成绩比他上一期的成绩进步最多,进步了0.2秒(3)个人测试成绩与很多因素有关,如集训时间不是越长越好,集训时间过长,可能会造成劳累,导致成绩下降;集训的时间为10天或14天时,成绩最好等.(言之有理即可)【分析】(1)根据图中的信息可知这5期的集训各有多少天,求出它们的和即可;(2)由折线统计图可得第3期小聪的成绩比他上一期的成绩进步最多,进步时间可由折线统计图计算;(3)根据图中的信心和题意,说明自己的观点即可,本题答案不唯一,只要合理即可.【详解】(1)∵4710142055++++=(天).∴这5期的集训共有55天.(2)由折线统计图可得第3期小聪的成绩比他上一期的成绩进步最多,进步了11.7211.520.2-=(秒),∴第3期小聪的成绩比他上一期的成绩进步最多,进步了0.2秒.(3)个人测试成绩与很多因素有关,如集训时间不是越长越好,集训时间过长,可能会造成劳累,导致成绩下降;集训的时间为10天或14天时,成绩最好等.(言之有理即可)【点睛】本题考查条形统计图、折线统计图、算术平均数,解答本题的关键是明确题意,利用数形结合的思想解答.14.(2021·上海徐汇·统考二模)问题:某水果批发公司用每千克2元的价格购进1000箱橘子,每箱橘子重10千克.由于购进的橘子有损耗,所以真正可以出售的橘子不到100 00千克.如果该公司希望这批橘子销售能获得5000元利润,应该把销售价格定为多少元?思路:为了解决这个问题,首先要估计这10000千克橘子中除去损耗后剩下多少橘子可以销售,因此需要估计损耗的橘子是多少千克.方案:为此,公司采用抽样调查来估计这批橘子的损耗情况.公司设计如下两种抽样方案:①从仓库中最方便处打开若干箱子逐个检查;②把这批橘子每箱从1~1000编号,用电脑随机选择若干号码,打开相应的箱子进行逐个检查.解决:(1)公司设计的两个抽样方案,从统计意义的角度考虑,你认为哪个方案比较合适?并说明理由;(2)该公司用合理的方式抽取了20箱橘子进行逐个检查,并在表中记录了每个被抽到的箱子里橘子的损耗情况.:被抽到的箱子里橘子的损耗情况表根据如表信息,请你估计这批橘子的损耗率;(3)根据以上信息,请你帮该公司确定这批橘子的销售价格,尽可能达到该公司的盈利目标(精确到0.01元/千克).【答案】(1)从统计意义的角度考虑,方案②比较合适,因为此时每箱橘子都有被抽到的可能,选取的样本具有代表性,属于简单随机抽样,所以方案②比较合适;(2)8.36%;(3)2.73元/千克【分析】(1)根据抽样调查时选取的样本必须具有代表性即可求解;(2)计算出抽取的20箱橘子的平均损耗率即可;(3)设该公司确定这批橘子的销售价格为x元/千克,根据利润=售价﹣进价列出方程即可.【详解】解:(1)从统计意义的角度考虑,方案②比较合适,因为此时每箱橘子都有被抽到的可能,选取的样本具有代表性,属于简单随机抽样,所以方案②比较合适;(2)(8.57+8.15)÷(10×20)×100%=8.36%.即估计这批橘子的损耗率为8.36%;(3)10000×(1﹣8.36%)x﹣2×10000=5000,解得,x≈2.73.答:该公司可确定这批橘子的销售价格约为2.73元/千克,能够尽可能达到该公司的盈利目标.【点睛】本题是一道利用统计知识解答实际问题的重点考题,主要考查利用统计图表处理数据的能力和利用样本估计总体的思想.从统计表中获取有用信息是解题的关键.15.(2022·上海青浦·统考二模)为了解某区3200名学生放学后在校体育运动的情况,调研组选择了有600名学生的W校,抽取40名学生进行调查,调查情况具体如下表:图表1:感兴趣的运动项目(1)此次调查的总体是__________,样本容量是__________.(2)若从9年级某学习加强班进行抽样调查,则这样的调查________(“合适”,“不合适”),原因是样本不是________样本;(3)根据图表1,估计该校对篮球感兴趣的学生的总人数为_____;(4)根据图表2,若从左至右依次是第一、二、三、四、五组,则中位数落在第___组.(5)若要从对篮球感兴趣的同学中选拔出一支篮球队来,现在有以下两名学生的投篮数据,记录的是每10次投篮命中的个数.甲同学:10、5、7、9、4;乙同学:7、8、7、6、7.若想要选择更稳定的同学,你会选择计算这两组数据的________,因为这个量可以代表数据的________.请计算出你所填写的统计量,并且根据计算的结果,选择合适的队员.【答案】(1)某区3200名学生放学后在校体育运动的情况,40(2)不合适;随机抽样(3)240(4)三(5)方差;离散程度;选择乙【分析】(1)根据总体及样本容量的相关概念可直接进行求解;(2)由题意可直接求解;【点睛】本题主要考查平均数、众数、中位数、方差及频数直方图;熟练掌握平均数、众数、中位数、方差及频数直方图是解题的关键.考点二:数据分析一、单选题1.(2022·上海松江·校考三模)小丽连续7次的数学考试成绩分数是:93、85、88、89、90、87、90.关于这组数据,下列说法正确的是( )A.中位数是88B.众数是90C.平均数是89D.方差是87【答案】B【分析】根据方差、众数、平均数、中位数的含义和求法,逐一判断即可.【详解】解:将数据重新排列为85、87、88、89、90、9093,、则这组数的中位数为89,众数为90,平均数为18587888990909388.97´++++++»(),所以说法正确的是B.故选:B.【点睛】本题考查了众数、中位数、平均数以及方差,解题的关键是牢记概念及公式.2.(2022·上海普陀·统考二模)某公司有9个子公司,某年各子公司所创年利润的情况如下表所示.根据表中的信息,下列统计量中,较为适宜表示该年各子公司所创年利润的平均水平的是( )A.方差B.众数C.平均数D.中位数【答案】D【分析】先分别求出平均数和中位数,再进行分析即可得.3.(2022·上海杨浦·统考二模)在一次引体向上的测试中,如果小明等5位同学引体向上的次数分别为:6、8、9、8、9,那么关于这组数据的说法,正确的是()A.平均数是8.5B.中位数是9C.众数是8.5D.方差是1.24.(2022·上海黄浦·统考二模)下列各统计量中,表示一组数据波动程度的量是()A.方差B.众数C.平均数D.频数【答案】A【分析】根据方差、众数、平均数、频数的意义即可求解.【详解】解:方差是表示一组数据波动程度的量,众数、平均数是表示一组数据集中趋势的量,频数是表示数据出现的次数,故选A.【点睛】本题考查了方差、众数、平均数、频数的意义,掌握以上知识是解题的关键.5.(2021·上海青浦·统考二模)某校为了解学生在“慈善募捐”活动中的捐款情况,进行了抽样调查,结果如表所示.那么该样本中学生捐款金额的中位数和众数分别是( )A.20元,50元B.35元,50元C.50元,50元D.20元,20元【答案】A【解析】根据中位数和众数的定义求解即可.【详解】解:∵本组数据从小到大排列共50个,且最中间的两个数据是20和20,∴这组数据的中位数为:2020202+=;∵捐款50元的人数最多,∴这组数据的众数是50.故选:A【点睛】本题考查中位数和众数的知识点,充分利用中位数和众数的定义是解题的关键.6.(2021·上海金山·二模)某人统计九年级一个班35人的身高时,算出平均数与中位数都是158厘米,但后来发现其中一位同学的身高记录错误,将160厘米写成了166厘米,经重新计算后,正确的中位数是a 厘米,那么中位数a 应( )A.大于158B.小于158C.等于158D.无法判断【答案】C【分析】根据中位数的定义得出最中间的数还是158厘米,从而选出正确答案.【详解】解:∵原来的中位数158厘米,将160厘米写成166厘米,最中间的数还是158厘米,∴a =158,故选:C.【点睛】本题考查了中位数,将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.7.(2021·上海·统考二模)某校对进校学生进行体温检测,在某一时段测得6名学生的体温分别为36.8℃,36.9℃,36.5℃,36.6℃,36.9℃,36.5℃,那么这6名学生体温的平均数与中位数分别是()A.36.7℃,36.7℃B.36.6℃,36.8℃C.36.8℃,36.7℃D.36.7℃,36.8℃8.(2021·上海普陀·统考二模)已知两组数据:x1、x2、x3、x4、x5和x1+2、x2+2、x3+2、x4+2、x5+2,下列有关这两组数据的说法中,正确的是( )A.平均数相等B.中位数相等C.众数相等D.方差相等【答案】D【分析】根据平均数、中位数、众数和方差的意义求解即可.【详解】解:因为新数据是在原数据的基础上每个加2,∴这两组数据的平均数、中位数和众数都改变,而波动幅度不变,即方差不改变,故选:D.【点睛】本题主要考查方差,解题的关键是掌握方差的意义:方差是反映一组数据的波动大小的一个量.方差越大,则平均值的离散程度越大,稳定性也越小;反之,则它与其平均值的离散程度越小,稳定性越好.9.(2021·上海闵行·统考二模)如果一组数据为,0,1,0,0,那么下列说法不正1-确的是()A.这组数据的方差是0B.这组数据的众数是0C.这组数据的中位数是0D.这组数据的平均数是010.(2022·上海·上海市娄山中学校考二模)某射击选手10次射击成绩统计结果如下表,这10A.8、8B.8、8.5C.8、9D.8、10【点睛】本题考查了众数和中位数的知识,一组数据中出现次数最多的数据叫做众数;将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.二、填空题11.(2021·上海宝山·统考三模)如果一组数a,2,4,0,5的中位数是4,那么a可以是_______(只需写出一个满足要求的数).【答案】4【分析】由于一共5个数,4一定排在第3个才能是中位数,所以a可以在第4个或第5个,从而确定a的取值即可.【详解】解:∵这组数据有5个数,且中位数是4,∴4必须在5个数从小到大排列的正中间,即这组数据的重新排列是0,2,4,a,5或0,2,4,5,a,∴a≥4或a≥5,故答案是4(答案不唯一).【点睛】本题考查了中位数的意义.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数),叫做这组数据的中位数.12.(2021·上海浦东新·统考模拟预测)某商店4月份销售的鞋子部分情况如表:根据这组数据可知,这个月销售36到41码鞋子尺寸的众数是_____.【答案】39.【分析】根据表格中的数据,正确使用众数的定义即可.【详解】根据表格中数据,可以知道36到41码的鞋子的销售量,其中尺寸为39码的鞋子销售量最大,故众数为39.故答案为:39.【点睛】本题考查统计表的理解和众数的定义,正确理解统计表并掌握众数概念是解题关键.13.(2021·上海普陀·统考二模)为了唤起公众的节水意识,从1993年起,联合国将每年的3月22日定为“世界水日”.某居委会表彰了社区内100户节约用水的家庭,5月份这100户家庭节约用水的情况如表所示,那么5月份这100户家庭节水量的平均数是_____吨.【答案】5.5【分析】根据加权平均数的定义列式计算即可.【详解】解:5月份这100户家庭节水量的平均数是5626287.210100´+´+´=5.5(吨),故答案为:5.5.【点睛】本题主要考查了加权平均数,解题的关键是掌握加权平均数的定义.14.(2023·上海·模拟预测)已知第一组数据:12,14,16,18的方差为21s ;第二组数据:32,34,36,38的方差22s ;第三组数据:2020,2019,2018,2017的方差为23s ,则21s ,22s ,23s 的大小关系是21s _______22s ________23s (填“>”,“=”或“<”)【答案】 = >【分析】根据方差是反映数据波动情况的量进行判断即可.【详解】解:Q 第一组和第二组数据都是间隔为2的偶数,\两组数据波动情况相同,即:2212s s =,Q 第三组数据是相差为1的整数,\方差最小,即:222123s s s =>,故答案为:=,>.【点睛】考查了方差的知识,解题时可以直接根据波动情况判断,也可以利用方差公式计算后确定答案,难度不大.考点三:概率一、填空题1.(2022·上海松江·统考二模)甲乙两人做“石头、剪刀、布”游戏,能在一个回合中分出胜负的概率是____________.【答案】23【分析】直接用列表法求出所有可能的情况,然后根据基本概率公式即可得出答案.【详解】分别用、、A B C 表示石头、剪刀、布,则在一个回合下的所有情况列表如下:一共有9种等可能结果,其中获胜的情况有6种,故获胜的概率6293P ==.【点睛】本题考查了基本概率的求法,解题的关键是熟练掌握求概率的方法,包括列表法和树状图法.2.(2022·上海金山·统考二模)一个布袋中有8个红球和16个黑球,这两种球除了颜色以外没有任何其他区别,从布袋中任取1个球是黑球的概率是______.3.(2022·上海黄浦·统考二模)一副52张的扑克牌(无大王、小王),从中任意抽出一张,抽到红桃K 的概率是________.4.(2022·上海闵行·统考二模)一个布袋中有三个完全相同的小球,把它们分别标号为1、2、3,从布袋中任取一个球记下数字作为点P 的横坐标x ,不放回小球,然后再从布袋中取出一个球记下数字作为点P 的纵坐标y ,那么点(),P x y 落在直线1y x =+上的概率是_________.共有6种等可能的结果,其中,点(),P x y 落在直线1y x =+上的结果有2种,∴点(),P x y 落在直线1y x =+上的概率=2163=.故答案为:13.【点睛】此题考查的是用列表法或树状图法求概率与不等式的性质.注意树状图法与列表法可以不重复不遗漏的列出所有可能的结果,列表法适合于两步完成的事件;树状图法适合两步或两步以上完成的事件;注意概率=所求情况数与总情况数之比,还需要注意实验是不放回实验.5.(2023·上海·模拟预测)一个袋子里装有10个材质均匀,大小相同,颜色不同的球,每个球上面都标有0到9中任意一个数字.现从中任意摸取一个球,摸取到数字是合数的球的概率是___________.【答案】25##0.4数与总情况数之比.6.(2023·上海·模拟预测)从2π这三个数中任选一个数,选出的这个数是有理数的概率为________________.7.(2023·上海·模拟预测)在不透明的盒子中装有5个黑色棋子和15个白色棋子,每个棋子除颜色外都相同,任意摸出一个棋子,摸到黑色棋子的概率是_____.8.(2022·上海虹口·统考二模)如果从1、2、3、4、5、6、7、8、9、10这10个数中任取一个数,那么取到的数恰好是素数的概率是______.9.(2022·上海奉贤·统考二模)有一枚材质均匀的正方体骰子,它的六个面上分别有1点、2点、…6点的标记,掷一次骰子,向上的一面出现的点数是2的倍数的概率是_____ _______.##0.5【答案】1210.(2022·上海·上海市进才中学校考一模)将 1、2、3 三个数字分别作为横坐标和纵坐标,随机生成的点的坐标如下表.如果每个点出现的可能性相等,那么从中任意取一点,则这个点在函数y=x图象上的概率是__________.【真题训练】一、单选题1.(2022·上海·统考中考真题)我们在外卖平台点单时会有点餐用的钱和外卖费6元,我们计算了点单的总额和不计算外卖费的总额的数据,则两种情况计算出的数据一样的是()A.平均数B.中位数C.众数D.方差【答案】D【分析】根据平均数,中位数,众数和方差的特点,这组数据都加上6得到一组新的数据,方差不变,平均数,中位数改变,众数改变,即可得出答案.【详解】解:将这组数据都加上6得到一组新的数据,则新数据的平均数改变,众数改变,中位数改变,但是方差不变;故选:D.【点睛】本题主要考查平均数、中位数、众数、方差的意义.理解求解一组数据的平均数,众数,中位数,方差时的内在规律,掌握“新数据与原数据之间在这四个统计量上的内在规律”是解本题的关键.2.(2021·上海·统考中考真题)商店准备一种包装袋来包装大米,经市场调查以后,做出如下统计图,请问选择什么样的包装最合适()A.2kg/包B.3kg/包C.4kg/包D.5kg/包【答案】A【分析】选择人数最多的包装是最合适的.【详解】由图可知,选择1.5kg/包-2.5kg/包的范围内的人数最多,∴选择在1.5kg/包-2.5kg/包的范围内的包装最合适.故选:A.【点睛】本题较简单,从图中找到选择人数最多的包装的范围,再逐项分析即可.3.(2020·上海·统考中考真题)我们经常将调查、收集得来的数据用各类统计图进行整理与表示.下列统计图中,能凸显由数据所表现出来的部分与整体的关系的是( ) A.条形图B.扇形图C.折线图D.频数分布直方图【答案】B【分析】根据统计图的特点判定即可.【详解】解:统计图中,能凸显由数据所表现出来的部分与整体的关系的是扇形图.故选:B.【点睛】本题考查了统计图的特点,条件统计图能反映各部分的具体数值,扇形统计图能。
总复习 一.填空题1、A 、B 是两个随机事件,已知0.3)B (p ,5.0)A (p ==,则(1) 若B A ,互斥,则=)B -A (p 0.5 ; (2) 若B A ,独立,则=)B A (p 0.65 ; (3) 若2.0)(=⋅B A p ,则=)B A (p 3/7 .2、 A 、B 是两个随机事件,已知0.125P(AB)0.5,)B (p ,52.0)A (p ===,则=)B -A (p 0.125 ;=)B A (p 0.875 ;=)B A (p 0.25 .3、袋子中有大小相同的红球7只,黑球3只,(1)从中不放回地任取2只,则第一、二次取到球颜色不同的概率为:7/15 。
(2)若有放回地任取2只,则第一、二次取到球颜色不同的概率为: 21/50 。
(3)若第一次取一只球后再追加一只与其颜色相同的球一并放入袋中再取第二只球,则第一、二次取到球颜色不同的概率为: 21/55 .4、袋子中有大小相同的5只白球, 4只红球, 3只黑球, 在其中任取2只。
(1)4只中恰有2只白球1只红球1只黑球的概率为:412131425C C C C . (2) 4只中至少有2只红球的概率为:4124814381C C C C +-. (3 4只中没有白球的概率为:41247C C5、10把钥匙中有板有3把能打开门,今任取2把,能将门打开的概率为:112237372210108(1)15C C C C C C +=-或 6、设离散型随机变量X 的概率分布P{X=0}=0.2,P{X=1}=0.3,P{X=2}=0.5, 则P{X ≤1.5}= 0.5 . 7.设随机变量X~U(0,1),则2-3X的概率密度函数为:112()(3Y y f y ⎧-<<⎪=⎨⎪⎩参考教材P61例2)其他8、设随机变量X 的分布函数为01(1)(),{1}00xx x e F x P X x -≥⎧-+=≤=⎨<⎩则1(1)12F e -=-.9、设X~N(1,2),Y~N(0,3),Z~N(2,1),且X,Y ,Z 独立,则 P{0≤2X+3Y-Z ≤6}=0.3413(提示:2X+3Y-Z~N(0,36))10、设随机变量X 服从泊松分布}8{}7{),(===X P X p λπ,则{}=XE 811、设随机变量X 服从B (2,0. 8)的二项分布,则{}==2X p 0.64 , Y 服从B (8,0. 8)的二项分布, 且X 与Y 相互独立,则}1{≥+Y X P =1- 0.210,=+)(Y X E 8 。
概率统计综合复习一一、填空:1.已知()0.3,()0.5,(/)0.2P A P B P A B ===,则()P A B ⋃= _ ___。
2.设某批产品有4%是废品,而合格品中的75%是一等品,则任取一件产品是一等品的概率是 。
3.设1231()()()3P A P A P A ===,且三事件123,,A A A 相互独立,则三事件中至少发生一个的概率为 ,三事件中恰好发生一个的概率为 。
4.袋中装有1个黑球和2个白球,从中任取2个,则取得的黑球数X 的分布函数()F x = ,()E X = 。
5.设X (4,0.5),b Y 在区间[0,2] 上服从均匀分布,已知X 与Y 相互独立,则(3)D X Y -= _ _。
6.设2(2,)X N σ ,且{0}0.2P X ≤=,那么{24}P X <<= _ ___。
7.设随机变量X 服从参数为2的泊松分布,用切比雪夫不等式估计:{24}P X -≥≤ 。
8.设一批产品的某一指标2(,)X N μσ ,从中随机抽取容量为25的样本,测得样本方差的观测值2100s =,则总体方差2σ的95%的置信区间为 。
二、单项选择:1.甲、乙二人射击,A 、B 分别表示甲、乙击中目标,则AB 表示( )。
A.两人都没击中B.至少一人没击中C.两人都击中D.至少一人击中2.设,A B 为两个随机事件,且,则下列式子正确的是( )A.()()P A B P A ⋃=B.()()P AB P A =C.(/)()P B A P B =D.()()()P B A P B P A -=- 3.设123,(,4)X X X N μμ,是来自总体的样本,未知参数的下列无偏估计量中最有效的是 ( ).A.123111424X X X ++ B. 131122X X + C. 123122555X X X ++ D. 123111333X X X ++ 4.设某种电子管的寿命X ,方差为()D X a =,则10个电子管的平均寿命X 的方差()D X 是( ) A .a B. 10a C. 0.1a D. 0.2a5.在假设检验问题中,犯第一类错误是指( )A .原假设0H 成立,经检验接受0HB .原假设0H 成立,经检验拒绝0HC .原假设0H 不成立,经检验接受0HD .原假设0H 不成立,经检验拒绝0H 三、设一批混合麦种中一、二、三、四等品分别占60%、20%、15%、5%,,四个等级的发芽率依次为,0.98,0.95,0.9,0.85 求:1.这批麦种的发芽率;2.若取一粒能发芽,它是二等品的概率是多少?四、已知随机变量X 的概率密度函数为,01()0,cx x f x ⎧≤<=⎨⎩其它,求:1.常数c ; 2.{0.40.7}P X <≤; 3.方差()D X五、设二维随机变量(,)X Y 的联合密度函数(2)2,0,0(,)0x y e x y f x y -+⎧>>=⎨⎩,其它 ,1.求,X Y 的边缘密度函数;2.判断,X Y 是否相互独立、是否不相关;3.求概率{1}P X Y +≤六、设总体X 的密度函数为(1),01()0,x x f x θθ⎧+<<=⎨⎩其它,其中0θ>是未知参数,12,,,n X X X 是从该总体中抽取的一个样本,12,,,n x x x 是其样本观测值,试求参数θ 的最大似然估计量。
第一章随机事件和概率(1)排列组合公式)!(!nmmP nm-=从m个人中挑出n个人进行排列的可能数。
)!(!!nmnmC nm-=从m个人中挑出n个人进行组合的可能数。
(2)加法和乘法原理加法原理(两种方法均能完成此事):m+n某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。
乘法原理(两个步骤分别不能完成这件事):m×n某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。
(3)一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题(4)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。
试验的可能结果称为随机事件。
(5)基本事件、样本空间和事件在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:①每进行一次试验,必须发生且只能发生这一组中的一个事件;②任何事件,都是由这一组中的部分事件组成的。
这样一组事件中的每一个事件称为基本事件,用ω来表示。
基本事件的全体,称为试验的样本空间,用Ω表示。
一个事件就是由Ω中的部分点(基本事件ω)组成的集合。
通常用大写字母A,B,C,…表示事件,它们是Ω的子集。
Ω为必然事件,Ø为不可能事件。
不可能事件(Ø)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。
(6)事件的关系与运算①关系:如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):BA⊂如果同时有BA⊂,AB⊃,则称事件A与事件B等价,或称A等于B:A=B。
A、B中至少有一个发生的事件:A B,或者A+B。
属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者BA,它表示A发生而B不发生的事件。
《概率论与数理统计》总复习资料概率论部分1.古典概型中计算概率用到的基本的计数方法。
例1:袋中有4个白球,5个黑球,6个红球,从中任意取出9个球,求取出的9个球中有1个白球、3个黑球、5个红球的概率.解:设B ={取出的9个球中有1个白球、3个黑球、5个红球}样本空间的样本点总数:915C n ==5005事件B 包含的样本点:563514C C C r ==240,则P (B )=240/5005=0.048例2:在0~9十个整数中任取四个,能排成一个四位偶数的概率是多少?解:考虑次序.基本事件总数为:410A =5040,设B ={能排成一个四位偶数}。
若允许千位数为0,此时个位数可在0、2、4、6、8这五个数字中任选其一,共有5种选法;其余三位数则在余下的九个数字中任选,有39A 种选法;从而共有539A =2520个。
其中,千位数为0的“四位偶数”有多少个?此时个位数只能在2、4、6、8这四个数字中任选其一,有4种选法;十位数与百位数在余下的八个数字中任选两个,有28A 种选法;从而共有428A =224个。
因此410283945)(A A A B P -==2296/5040=0.4562.概率的基本性质、条件概率、加法、乘法公式的应用;掌握事件独立性的概念及性质。
例1:事件A 与B 相互独立,且P (A )=0.5,P (B )=0.6,求:P (AB ),P (A -B ),P (A B )解:P (AB )=P (A )P (B )=0.3,P (A -B )=P (A )-P (AB )=0.2,P (A B )=P (A )+P (B )-P (AB )=0.8例2:若P (A )=0.4,P (B )=0.7,P (AB )=0.3,求:P (A -B ),P (A B ),)|(B A P ,)|(B A P ,)|(B A P 解:P (A -B )=0.1,P (A B )=0.8,)|(B A P =)()(B P AB P =3/7,)|(B A P =)()()()()(B P AB P B P B P B A P -==4/7,|(B A P =)(1)()()(B P B A P B P B A P -==2/33.准确地选择和运用全概率公式与贝叶斯公式。
概率统计【重点知识回顾】概率(1)事件与基本事件::S S S ⎧⎪⎧⎨⎨⎪⎩⎩随机事件在条件下,可能发生也可能不发生的事件事件不可能事件:在条件下,一定不会发生的事件确定事件必然事件:在条件下,一定会发生的事件基本事件:试验中不能再分的最简单的“单位”随机事件;一次试验等可能的产生一个基本事件;任意两个基本事件都是互斥的;试验中的任意事件都可以用基本事件或其和的形式来表示.(2)频率与概率:随机事件的频率是指此事件发生的次数与试验总次数的比值.频率往往在概率附近摆动,且随着试验次数的不断增加而变化,摆动幅度会越来越小.随机事件的概率是一个常数,不随具体的实验次数的变化而变化.(3)互斥事件与对立事件:(4)古典概型与几何概型:古典概型:具有“等可能发生的有限个基本事件”的概率模型.几何概型:每个事件发生的概率只与构成事件区域的长度(面积或体积)成比例. 两种概型中每个基本事件出现的可能性都是相等的,但古典概型问题中所有可能出现的基本事件只有有限个,而几何概型问题中所有可能出现的基本事件有无限个. (5)古典概型与几何概型的概率计算公式: 古典概型的概率计算公式:()A P A =包含的基本事件的个数基本事件的总数.几何概型的概率计算公式:()A P A =构成事件的区域长度(面积或体积)试验全部结果构成的区域长度(面积或体积).两种概型概率的求法都是“求比例”,但具体公式中的分子、分母不同. (6)概率基本性质与公式①事件A 的概率()P A 的范围为:0()1P A ≤≤.②互斥事件A 与B 的概率加法公式:()()()P A B P A P B =+ . ③对立事件A 与B 的概率加法公式:()()1P A P B +=.(7) 如果事件A 在一次试验中发生的概率是p ,则它在n 次独立重复试验中恰好发生k 次的概率是p n (k) = Cp k (1―p)n ―k . 实际上,它就是二项式[(1―p)+p]n 的展开式的第k+1项. (8)独立重复试验与二项分布①.一般地,在相同条件下重复做的n 次试验称为n 次独立重复试验.注意这里强调了三点:(1)相同条件;(2)多次重复;(3)各次之间相互独立;②.二项分布的概念:一般地,在n 次独立重复试验中,设事件A 发生的次数为X ,在每次试验中事件A 发生的概率为p ,那么在n 次独立重复试验中,事件A 恰好发生k 次的概率为()(1)(012)k k n kn P X k C p p k n -==-= ,,,,,.此时称随机变量X 服从二项分布,记作~()X B n p ,,并称p 为成功概率.统计(1)三种抽样方法①简单随机抽样简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取.简单随机抽样的特点:被抽取样本的总体个数有限.从总体中逐个进行抽取,使抽样便于在实践中操作.它是不放回抽取,这使其具有广泛应用性.每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性.实施抽样的方法:抽签法:方法简单,易于理解.随机数表法:要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性.②系统抽样系统抽样适用于总体中的个体数较多的情况. 系统抽样与简单随机抽样之间存在着密切联系,即在将总体中的个体均分后的每一段中进行抽样时,采用的是简单随机抽样.系统抽样的操作步骤:第一步,利用随机的方式将总体中的个体编号;第二步,将总体的编号分段,要确定分段间隔k ,当Nn(N为总体中的个体数,n 为样本容量)是整数时,N k n =;当Nn不是整数时,通过从总体中剔除一些个体使剩下的个体个数N能被n 整除,这时N k n'=;第三步,在第一段用简单随机抽样确定起始个体编号,再按事先确定的规则抽取样本.通常是将加上间隔k 得到第2个编号()l k +,将()l k +加上k ,得到第3个编号(2)l k +,这样继续下去,直到获取整个样本. ③分层抽样当总体由明显差别的几部分组成时,为了使抽样更好地反映总体情况,将总体中各个个体按某种特征分成若干个互不重叠的部分,每一部分叫层;在各层中按层在总体中所占比例进行简单随机抽样.分层抽样的过程可分为四步:第一步,确定样本容量与总体个数的比;第二步,计算出各层需抽取的个体数;第三步,采用简单随机抽样或系统抽样在各层中抽取个体;第四步,将各层中抽取的个体合在一起,就是所要抽取的样本. (2)用样本估计总体样本分布反映了样本在各个范围内取值的概率,我们常常使用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分布,然后用样本的频率分布去估计总体分布,总体一定时,样本容量越大,这种估计也就越精确. ①用样本频率分布估计总体频率分布时,通常要对给定一组数据进行列表、作图处理.作频率分布表与频率分布直方图时要注意方法步骤.画样本频率分布直方图的步骤:求全距→决定组距与组数→分组→列频率分布表→画频率分布直方图. ②茎叶图刻画数据有两个优点:一是所有的信息都可以从图中得到;二是茎叶图便于记录和表示,但数据位数较多时不够方便.③平均数反映了样本数据的平均水平,而标准差反映了样本数据相对平均数的波动程度,其计算公式为s . 有时也用标准差的平方———方差来代替标准差,两者实质上是一样的.(3)两个变量之间的关系变量与变量之间的关系,除了确定性的函数关系外,还存在大量因变量的取值带有一定随机性的相关关系.在本章中,我们学习了一元线性相关关系,通过建立回归直线方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解.分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘估计求出回归直线方程.通常我们使用散点图,首先把样本数据表示的点在直角坐标系中作出,形成散点图.然后从散点图上,我们可以分析出两个变量是否存在相关关系:如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,其对应的方程叫做回归直线方程.在本节要经常与数据打交道,计算量大,因此同学们要学会应用科学计算器. (4)求回归直线方程的步骤:第一步:先把数据制成表,从表中计算出211n ni i i i i x y x ==∑∑,;第二步:计算回归系数的a ,b ,公式为1112211()()()n n ni i i i i i i n ni i i i n x y x y b n x x a =====⎧-⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑∑∑∑,第三步:写出回归直线方程 y bx a =+. (4)独立性检验①22⨯列联表:列出的两个分类变量X 和Y ,它们的取值分别为12{,}x x 和12{,}y y 的样本频数表称为22⨯列联表1构造随机变量22()()()())n ad bc K a b c d a c b d -=++++(其中n a b c d =+++)得到2K 的观察值k 常与以下几个临界值加以比较: 如果2.706k >,就有0090的把握因为两分类变量X 和Y 是有关系; 如果3.841k > 就有0095的把握因为两分类变量X 和Y 是有关系; 如果6.635k >就有0099的把握因为两分类变量X 和Y 是有关系;如果低于 2.706k ≤,就认为没有充分的证据说明变量X 和Y 是有关系.【典型例题】考点:概率【内容解读】概率试题主要考查基本概念和基本公式,对等可能性事件的概率、互斥事件的概率、独立事件的概率、事件在n 次独立重复试验中恰发生k 次的概率、离散型随机变量分布列和数学期望等内容都进行了考查。
掌握古典概型和几何概型的概率求法。
例1、在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随意投一点,则落入E 中的概率为 。
例2某公交公司对某线路客源情况统计显示,公交车从每个停靠点出发后,车上的乘客人数及频率如下表:(I )从每个停靠点出发后,乘客人数不超过24人的概率约是多少?(II )全线途经10个停靠点,若有2个以上(含2个)停靠点出发后,车上乘客人数超过18人的概率大于0.9,公交公司就要考虑在该线路增加一个班次,请问该线路需要增加班次吗?考点四:统计【内容解读】理解简单随机抽样、系统抽样、分层抽样的概念,了解它们各自的特点及步骤.会用三种抽样方法从总体中抽取样本.会用样本频率分布估计总体分布.会用样本数字特征估计总体数字特征.会利用散点图和线性回归方程,分析变量间的相关关系;掌握独立性检验的步骤与方法。
例3(1)(2009湖南卷文) 一个总体分为A ,B 两层,用分层抽样方法从总体中抽取一个容量为10的样本.已知B 层中每个个体被抽到的概率都为112,则总体中的个体数为 .(2)(2009四川卷文)设矩形的长为a ,宽为b ,其比满足b ∶a =618.0215≈-,这种矩形给人以美感,称为黄金矩形。
黄金矩形常应用于工艺品设计中。
下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定例4下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生 产能耗Y(吨标准煤)的几组对照数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,崩最小二乘法求出Y 关于x 的线性回归方程Y=bx+a ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:32.5+43+54+64.5=66.5)例5、为了研究某高校大学新生学生的视力情况,随机地抽查了该校100名进校学生的视力情况,得到频率分布直方图,如图.已知前4组的频数从左到右依次是等比数列{}n a 的前四项,后6组的频数从左到右依次是等差数列{}n b 的前六项.(Ⅰ)求等比数列{}n a 的通项公式;(Ⅱ)求等差数列{}n b 的通项公式;(Ⅲ)若规定视力低于5.0的学生属于近视学生,试估计该校新生的近视率μ的大小.例6、某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(Ⅰ)求选取的2组数据恰好是相邻两个月的概率;(5分)(Ⅱ)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y 关于x 的线性回归方程 y bx a =+;(6分)(Ⅲ)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(3分)(参考公式:1122211()(),()n ni i iii i nnii i i x y nxy x x y y b a y bx xnxx x ====---===---∑∑∑∑)模拟演练3.已知事件M “三位中国选手均进入亚运会体操决赛”,事件N “三位中国选手均未进入亚运会体操决赛”,那么事件M 和N 是( ) A.等可能性事件 B.不互斥事件7 8 9 5 4 4 6 7 4 2 C.互斥但不是对立事件 D.对立事件4.若对于变量y 与x 的10组统计数据的回归模型中,相关指数95.02=R ,又知残差平方和为53.120,那么∑=-1012)(i iy y的值为( )。