总体分布的估计、总体期望和方差的
- 格式:doc
- 大小:192.50 KB
- 文档页数:5
高三数学人教版总体分布的估计知识点归纳总结知识点总结总体分布的估计是统计学中常用的手法,为此整理了总体分布的估计知识点,请大家查看。
样本估计总体,是研究统计问题的一个基本思想方法,即用样本平均数估计总体平均数(即总体期望值――描述一个总体的平均水平);用样本方差估计总体方差(方差和标准差是描述一个样本和总体的波动大小的特征数,方差或标准差越小,表示这个样本或总体的波动越小,即越稳定)。
一般地,样本容量越大,这种估计就越精确。
总体估计要掌握:(1)表(频率分布表);(2)图(频率分布直方图)。
提醒:直方图的纵轴(小矩形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小矩形的面积表示频率
其中,样本指是指从全部的调查对象提取出来进行调查的个体
个体指总体中的每一个考察的对象,
总体指考察的对象的全体,
样本容量指样本中个体的数目。
例如,为了调查全国人口的寿命,抽查了十一个省市的2500名城镇居民,这个问题中2500名城镇居民的寿命的全体是样本。
2500是样本容量。
某个人的寿命是个体。
全国人口寿命是总体。
总体分布的估计知识点的全部内容就是这些,更多精彩内容请持续关注。
五种估计参数的方法在统计学和数据分析中,参数估计是一种用于估计总体的未知参数的方法。
参数估计的目标是通过样本数据来推断总体参数的值。
下面将介绍五种常用的参数估计方法。
一、点估计点估计是最常见的参数估计方法之一。
它通过使用样本数据计算出一个单一的数值作为总体参数的估计值。
点估计的核心思想是选择一个最佳的估计量,使得该估计量在某种准则下达到最优。
常见的点估计方法有最大似然估计和矩估计。
最大似然估计(Maximum Likelihood Estimation,简称MLE)是一种常用的点估计方法。
它的核心思想是选择使得样本观测值出现的概率最大的参数值作为估计值。
最大似然估计通常基于对总体分布的假设,通过最大化似然函数来寻找最优参数估计。
矩估计(Method of Moments,简称MoM)是另一种常用的点估计方法。
它的核心思想是使用样本矩和总体矩之间的差异来估计参数值。
矩估计首先计算样本矩,然后通过解方程组来求解参数的估计值。
二、区间估计点估计只给出了一个参数的估计值,而没有给出该估计值的不确定性范围。
为了更全面地描述参数的估计结果,我们需要使用区间估计。
区间估计是指在一定的置信水平下,给出一个区间范围,该范围内包含了真实参数值的可能取值。
常见的区间估计方法有置信区间和预测区间。
置信区间是对总体参数的一个区间估计,表示我们对该参数的估计值的置信程度。
置信区间的计算依赖于样本数据的统计量和分布假设。
一般来说,置信区间的宽度与样本大小和置信水平有关,较大的样本和较高的置信水平可以得到更准确的估计。
预测区间是对未来观测值的一个区间估计,表示我们对未来观测值的可能取值范围的估计。
预测区间的计算依赖于样本数据的统计量、分布假设和预测误差的方差。
与置信区间类似,预测区间的宽度也与样本大小和置信水平有关。
三、贝叶斯估计贝叶斯估计是一种基于贝叶斯理论的参数估计方法。
它将参数看作是一个随机变量,并给出参数的后验分布。
贝叶斯估计的核心思想是根据样本数据和先验知识来更新参数的分布,从而得到参数的后验分布。
概率与统计(理科)一、高考考试内容离散型随机变量的分布列,离散型随机变量的期望和方差。
抽样方法、总体分布的估计、正态分布、线性回归。
二、考试要求:(1)了解离散型随机变量的意义,会求某些简单的离散型随机变量的分布列。
(2)了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。
(3)会用随机抽样,系统抽样,分层抽样等常用的抽样方法从总体中抽取样本。
(4)会用样本频率分布去估计总体分布。
(5)了解正态分布的意义及主要性质。
(6)了解线性回归的方法和简单应用。
三、应试策略1、正确理解有关概念。
(1)随机试验与随机事件:在一定条件下可能发生也可能不发生的事件叫随机事件;条件每实现一次,叫做一次试验;如果试验结果预先无法确定,这种试验叫做随机试验。
(2)频率与概率:对于一个事件来说概率是一个常数;频率则随着试验次数的变化而变化,试验次数越多,频率就越接近于事件的概率。
(3)互斥事件与对立事件:对立事件一定是互斥事件,但互斥事件不一定是对立事件。
(4)互斥事件与相互独立事件:不可能同时发生的事件叫互斥事件,而相互独立事件则是指两个事件是否发生与否相互之间没有影响。
2、公式的应用(1)常用公式 ①等可能事件的概率:基本事件总数中所含基本事件数A n m A P ==)( ②互斥事件的概率:)()()(B P A P B A P +=+③对立事件的概率:1)()()(____=+=+A P A P A A P④相互独立事件的概率:)()()(B P A P B A P ⋅=⋅⑤n 次独立重复试验中事件A 恰好发生k 次的概率:k n k k n n P P C k P --=)1()((2)注意事项:①每个公式都有成立的条件,若不满足条件,则这些公式将不再成立。
②对于一个概率问题,应首先弄清它的类型,不同的类型采用不同的计算方法,一般题中总有关键语说明其类型,对于复杂问题要善于进行分解,或者运用逆向思考的方法。
12.2 总体期望值和方差的估计●知识梳理 1.平均数的计算方法(1)如果有n 个数据x 1,x 2,…,x n ,那么x =n1(x 1+x 2+…+x n )叫做这n 个数据的平均数,x 读作“x 拔”.(2)当一组数据x 1,x 2,…,x n 的各个数值较大时,可将各数据同时减去一个适当的常数a ,得到x 1′=x 1-a ,x 2′=x 2-a ,…,x n ′=x n -a ,那么,x =x ' +a .(3)加权平均数:如果在n 个数据中,x 1出现f 1次,x 2出现f 2次,…,x k 出现f k 次(f 1+f 2+…+f k =n ),那么x=nf x f x f x kk +++ 2211.2.方差的计算方法(1)对于一组数据x 1,x 2,…,x n ,s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2]叫做这组数据的方差,而s 叫做标准差.(2)公式s 2=n1[(x 12+x 22+…+x n 2)-n x 2].(3)当一组数据x 1,x 2,…,x n 中的各数较大时,可以将各数据减去一个适当的常数a ,得到x 1′=x 1-a ,x 2′=x 2-a ,…,x n ′=x n -a .则s 2=n1[(x 1′2+x 2′2+…+x n ′2)-n 2x '].3.总体平均值和方差的估计人类的长期实践和理论研究都充分证明了用样本的平均数估计总体平均值,用样本方差估计总体方差是可行的,而且样本容量越大,估计就越准确.●点击双基1.描述总体离散型程度或稳定性的特征数是总体方差,以下统计量估计总体稳定性的是 A.样本均值xB.样本方差C.样本最大值D.样本最小值 解析:统计学的基本思想是用样本来估计总体.因此选B. 答案:B2.甲、乙两人在相同的条件下,射击10次,命中环数如下: 甲:8,6,9,5,10,7,4,8,9,5; 乙:7,6,5,8,6,9,6,8,7,7.根据以上数据估计两人的技术稳定性,结论是 A.甲优于乙 B.乙优于甲C.两人没区别D.两人区别不大解析:x 甲=101(8+6+…+5)=7.1,x 乙=101(7+6+…+7)=6.9.s 甲2=101[(8-7.1)2+…+(5-7.1)2]=3.69, s 乙2=101[(7-6.9)2+…+(7-6.9)2]=1.29.∴乙优于甲. 答案:B3.样本a 1,a 2,a 3,…,a 10的平均数为a ,样本b 1,b 2,b 3,…,b 10的平均数为b ,那么样本a 1,b 1,a 2,b 2,…,a 10,b 10的平均数为A.a +bB.21(a +b )C.2(a +b )D.101(a +b )解析:样本a 1,a 2,a 3,…,a 10中a i 的概率为P i ,样本b 1,b 2,b 3,…,b 10中b i 的概率为P i ′,样本a 1,b 1,a 2,b 2,a 3,b 3,…,a 10,b 10中a i 的概率为q i ,b i 的概率为q i ′,则P i =2q i ,故样本a 1,b 1,a 2,b 2,a 3,b 3,…,a 10,b 10的平均数为a 1q 1+b 1q 1′+a 2q 2+b 2q 2′+…+a 10q 10+b 10q 10′=21(a 1P 1+…+a 10P 10)+21(b 1P 1′+21b 2P 2′+…+21b 10P 10′)=21(a +b ).答案:B4.电池厂从某日生产的电池中抽取10个进行寿命测试,得到数据如下(单位:h ):30,35,25,25,30,34,26,25,29,21.则该电池的平均寿命估计为___________,方差估计为___________.解析:x =101(30+35+25+25+30+34+26+25+29+21)=101(0+5-5-5+0+4-4-5-1-9)+30=28, s 2=101[(30-28)2+(35-28)2+(25-28)2+(25-28)2+(30-28)2+(34-28)2+(26-28)2+(25-28)2+(29-28)2+(21-28)2]=101(4+49+9+9+4+36+4+9+1+49)=17.4.答案:28 17.4 ●典例剖析【例1】 x 是x 1,x 2,…,x 100的平均数,a 是x 1,x 2,…,x 40的平均数,b 是x 41,x 42,…,x 100的平均数,则下列各式正确的是A.x =1006040b a + B.x =1004060b a +C.x =a +bD.x =2b a +剖析:这100个数的平均数是a +b 还是21(a +b ),这都很容易让人误解.我们可以从概率及加权平均数的角度来思考.设P i 是x 1,x 2,…,x 100中x i 被抽到的概率,q i 是x 1,x 2,…,x 40中x i 被抽到的概率,r i 是x 41,x 42,…,x 100中x i 被抽到的概率,则P i =10040q i ,P i =10060r i .故x 1,x 2,…,x 100的平均数x =10040(x 1q 1+x 2q 2+…+x 40q 40)+10060(x 41r 41+…+x 100r 100)=10040a +10060b .答案:A评述:除上述解法外,你还有其他解法吗?特别提示除了上述方法外,我们还可以先分别求出x 1+x 2+…+x 40=40a ,x 41+x 42+…+x 100=60b ,再求x .【例2】 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环)甲 10 8 9 9 9 乙1010799如果甲、乙两人只有1人入选,则入选的应是___________.剖析:判断谁入选,首先应考虑选手的成绩是否稳定.因此分别求其方差. 甲的平均数为x 1=51(10+8+9+9+9)=9, 乙的平均数为x 2=51(10+10+7+9+9)=9,甲的方差为s 甲=(10-9)2×51+(8-9)2×51=52, 乙的方差为s 乙=(10-9)2×51×2+(7-9)2×51=56.s 乙>s 甲,说明乙的波动性大,故甲入选. 答案:甲评述:方差的大小可看出成绩的稳定性,平均数的大小可看出成绩的高低.【例3】 某班40人随机分为两组,第一组18人,第二组22人,两组学生在某次数学检测中的成绩如下表:分 组 平均成绩标准差 第一组 90 6 第二组804剖析:代入方差公式s 2=n1[(x 12+x 22+…+x n 2)-n x 2]即可求得.解:设全班的平均成绩为x ,全班成绩的方差为s 2, 则s 12=181[(x 12+x 22+…+x 182)-18×902]=36,s 22=221[(x 192+x 202+…+x 402)-22×802]=16.∴x =401(90×18+80×22)=2169=84.5,s 2=401[(x 12+x 22+…+x 182)+(x 192+x 202+…+x 402)-40·x 2]=401[18×(36+8100)+22×(16+6400)-40×41692]=401(146448+141152-10×1692) =401×1990=49.75.∴s =2199≈7.05.评述:平均成绩应为总成绩除以总人数,而总成绩可由每组成绩之和求得. 【例4】 已知c 为常数,s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2],s c 2=n1[(x 1-c )2+(x 2-c )2+…+(x n -c )2].证明:s 2≤s c 2,当且仅当c =x 时,取“=”.剖析:证明s c 2≥s 2,可证明s c 2-s 2≥0.因此应用方差公式进行变形即可. 证明:∵s 2=n1[(x 1-x )2+…+(x n -x )2]=n1[(x 12+x 22+…+x n 2)-n x 2],s c 2=n1[(x 1-c )2+(x 2-c )2+…+(x n -c )2]=n1[(x 12+x 22+…+x n 2)-2c (x 1+x 2+…+x n )+nc 2],∴s c 2-s 2=x 2-nc 2(x 1+x 2+…+x n )+c 2=x 2-2c ·x +c 2=(x -c )2≥0. ∴s c 2≥s 2,当且仅当x =c 时取“=”. 评述:作差是比较大小的常用手段.●闯关训练 夯实基础1.一组数据的方差为s 2,将这组数据中的每一个数都乘以2,所得到的一组新数据的方差是A.21s 2 B.2s 2 C.4s 2 D.s 2解析:由方差公式易求得新数据的方差为4s 2. 答案:C2.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,更正后平均分和方差分别是A.70,25B.70,50C.70,1.04D.65,25解析:易得x 没有改变,x =70, 而s 2=481[(x 12+x 22+…+502+1002+…+x 482)-48x 2]=75, s ′2=481[(x 12+x 22+…+802+702+…+x 482)-48x 2]=481[(75×48+48x 2-12500+11300)-48x 2]=75-481200=75-25=50.答案:B3.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm 2):解析:x 甲=51(9.8+9.9+10.1+10+10.2)=10,x乙=51(9.4+10.3+10.8+9.7+9.8)=10,s 甲2=51[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,s 乙2=51[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244. 所以,甲比乙稳定. 答案:甲4.为了科学地比较考试的成绩,有些选拔性考试常常会将考试分数转化为标准分,转化关系式为Z =sx x -(其中x 是某位学生的考试分数,x 是该次考试的平均分,s 是该次考试的标准差,Z 称为这位学生的标准分).转化成标准分后可能出现小数和负值,因此,又常常再将Z 分数作线性变换转化成其他分数.例如某次学生选拔考试采用的是T 分数,线性变换公式是T =40Z +60.已知在这次考试中某位考生的考试分数是85分,这次考试的平均分是70分,标准差是25,则该考生的T 分数为___________.解析:由已知Z =257085-=53,∴T =40×53+60=24+60=84.故考生成绩的T 分数为84.答案:84试分析两厂上缴利税的情况.解:甲、乙两厂上缴利税的季平均值分别为x 甲=41(70+50+80+40)=60, x乙=41(55+65+55+65)=60;甲、乙两厂上缴利税的方差为 s 甲2=41[(70-60)2+(50-60)2+(80-60)2+(40-60)2]=250, s 乙2=41[(55-60)2+(65-60)2+(55-60)2+(65-60)2]=25.经上述结果分析,两厂上缴利税的季平均值相同,但甲厂比乙厂波动大,导致它们生产出现的差异大,乙厂不同季节的缴税量比较接近平均值,生产稳定,而甲厂不稳定.培养能力 6.某校从甲、乙两名优秀选手中选拔1名参加全市中学生百米比赛,该校预先对这两名选手测试了8次,成绩如下表:解:x 甲=12.4=x 乙,s 甲2=0.12,s 乙2≈0.10,∴甲、乙两人的平均成绩相等,但乙的成绩较稳定,应派乙选手参加比赛.7.某农场为了从三种不同的西红柿品种中选取高产稳定的西红柿品种,分别在五块试验田上试种,每块试验田均为0.5公顷,产量情况如下:解:x 1=51(21.5+20.4+…+19.9)=21,x2=51(21.3+18.9+…+19.8)=21, x3=51(17.8+23.3+…+20.9)=20.5,s 1=0.756, s 2=1.104, s 3=1.901.由x 1=x 2>x 3,而s 1<s 2<s 3,说明第1种西红柿品种既高产又稳定.8.甲、乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸分别为(单位:mm ):甲:10.2 10.1 10.9 8.9 9.9 10.3 9.7 10 9.9 10.1乙:10.3 10.4 9.6 9.9 10.1 10 9.8 9.7 10.2 10分别计算上面两个样本的平均数与方差,如果图纸上的设计尺寸为10 mm ,从计算结果看,用哪台机床加工这种零件较合适?解:x 甲=101(10.2+10.1+…+10.1)=10,x乙=101(10.3+10.4+…+10)=10,s 甲2=101[(10.2-10)2+(10.1-10)2+…+(10.1-10)2]=0.03, s 乙2=101[(10.3-10)2+(10.4-10)2+…+(10-10)2]=0.06.由上述结果分析,甲台机床加工这种零件稳定,较合适.探究创新9.有一个容量为100的样本,数据的分组及各组的频数如下: [12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8. (1)列出样本的频率分布表; (2)画出频率分布直方图;(3)估计数据小于30.5的概率. 解:(1)样本的频率分布表如下:(3)数据大于等于30.5的频率是0.08,∴小于30.5的频率是0.92.∴数据小于30.5的概率约为0.92.探究:解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.注意直方图与条形图的区别.●思悟小结1.用样本估计总体,除在整体上用样本的频率分布估计总体分布外,还可以用平均值和方差对总体进行估计,即用样本平均数x 去估计总体平均数μ;用样本方差s 2去估计总体的方差σ2,进一步对总体的分布作出判断.2.进行几次实验,得到样本数据x 1,x 2,…,x n ,设c 是任意常数,k 为任意的正数,作变换y i =k1(x i -c )(i =1,2,…,n ),则有:①x =k y +c ;②s x 2=k 2s y 2.●教师下载中心 教学点睛1.期望反映数据取值的平均水平,期望越大,平均水平越高.2.方差反映数据的波动大小,方差越小,表示数据越稳定.拓展题例【例1】 如果数据a 1,a 2,…,a 6的方差是6,那么另一组数据a 1-3,a 2-3,…,a 6-3的方差是多少?解:设a 1,a 2,…,a 6的平均数为a ,则(a 1-3),(a 2-3),…,(a 6-3)的平均数为a -3,∴方差为s 2=61{[(a 1-3)-(a -3)]2+…+[(a 6-3)-(a -3)]2}=6.【例2】 已知样本方差由s 2=101∑=101i (x i -5)2求得,求∑∑=101i x i .解:依s 2=n1[(x 1-x )2+…+(x n -x )2]=n1[x 12+x 22+…+x n 2-n x 2]知,∴101∑=101i x i =5.∴∑=101i x i =50.。
概率论与数理统计:六大基本分布及其期望和方差绪论:概率论中有六大常用的基本分布,大致可分成两类:离散型(0-1分布、二项分布、泊松分布),连续型(均匀分布、指数分布、正态分布)。
补充:在进入正文之前先讲一下期望和均值的一些区别:期望和均值都具有平均的概念,但期望是指的随机变量总体的平均值,而均值则是指的从总体中抽样的样本的平均值,即前者是理想的均值,而后者则是实际观测出来的数据的均值。
例如:对于一个六面的骰子,其期望E = (1+2+3+4+5+6)/ 6 = 3.5。
然后掷5次骰子,每次掷的点数分别为1,3,5,5,1,则平均值为(1+3+5+5+1)/ 5 = 3。
可以发现两者并不相等。
方差(variance):方差是各个数据与平均数之差的平方的平均数,方差度量了随机变量与期望(也可说均值)之间的偏离程度。
标准差为方差的开根号。
协方差(Covariance):用于衡量两个变量之间的误差,而方差是协方差的特殊情况,即当两个变量相同的情况。
其公式如下:,表示含义为:E(∑(“X与其均值之差” * “Y与其均值之差”))当协方差为正时:表示两变量正相关(即同时变大变下)。
当协方差为负时:表示两变量负相关(即你变大,我变小,反之亦然)。
当协方差为0时:两变量相互独立。
相关系数:其公式如下,表示的含义为用X和Y的协方差除以X 和Y的标准差。
所以相关系数也可以看成协方差,一种剔除两个变量量纲影响,标准化后的特殊协方差。
正文:1、0-1分布已知随机变量X,其中P{X=1} = p,P{X=0} = 1-p,其中 0 < p< 1,则成X服从参数为p的0-1分布。
其中期望为E(X) = p 方差D(X) = p(1-p);2、二项分布n次独立的伯努利实验(伯努利实验是指每次实验有两种结果,每种结果概率恒定,比如抛硬币)。
其中期望E(X) = np 方差D(X) = np(1-p);3、泊松分布表示单位时间内某稀有事件发生k次的概率,其公式为其中方差和期望均为,详细了解请☞戳4、均匀分布若连续型随机变量X具有概率密度,则称X在(a,b)上服从均匀分布其中期望E(X) = (a+b)/ 2 ,方差D(X) = (b-a)^2 / 12。
概率论中的常见分布和期望与方差——概率论知识要点概率论是数学中的一个重要分支,研究随机现象的规律性。
在概率论中,常见的分布函数和概率密度函数描述了随机变量的分布规律,而期望和方差则是描述随机变量的中心位置和离散程度的重要指标。
本文将介绍概率论中的常见分布以及期望和方差的概念和计算方法。
一、离散型分布在概率论中,离散型分布描述了随机变量取有限个或可列个数值的概率分布。
以下是几个常见的离散型分布:1. 伯努利分布伯努利分布是最简单的离散型分布,描述了只有两个可能结果的随机试验,比如抛硬币的结果。
设随机变量X表示试验的结果,取值为1或0,表示成功或失败的情况。
伯努利分布的概率质量函数为:P(X=k) = p^k * (1-p)^(1-k),其中k=0或1,p为成功的概率。
2. 二项分布二项分布描述了一系列独立的伯努利试验中成功的次数。
设随机变量X表示成功的次数,取值范围为0到n,n为试验的次数,p为每次试验成功的概率。
二项分布的概率质量函数为:P(X=k) = C(n,k) * p^k * (1-p)^(n-k),其中C(n,k)为组合数。
3. 泊松分布泊松分布描述了在一定时间或空间内随机事件发生的次数。
设随机变量X表示事件发生的次数,取值范围为0到无穷大。
泊松分布的概率质量函数为:P(X=k) = (λ^k * e^(-λ)) / k!,其中λ为事件发生的平均次数。
二、连续型分布在概率论中,连续型分布描述了随机变量在某个区间内取值的概率分布。
以下是几个常见的连续型分布:1. 均匀分布均匀分布描述了随机变量在某个区间内取值的概率相等的情况。
设随机变量X 在[a, b]区间内取值,均匀分布的概率密度函数为:f(x) = 1 / (b-a),其中a≤x≤b。
2. 正态分布正态分布是概率论中最重要的分布之一,也被称为高斯分布。
正态分布的概率密度函数为:f(x) = (1 / √(2πσ^2)) * e^(-(x-μ)^2 / (2σ^2)),其中μ为均值,σ为标准差。
高中数学知识点第十二章-概率与统计 考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样. (2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为: ,,,,21i x x xξ取每一个值),2,1(1 =i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的121i 注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0 ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B(n ·p ),其中n ,p 为参数,并记p)n b(k;qp C k n k k n ⋅=-. ⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布. ②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列. 4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A A P(k)P(ξk 1k 21-== .根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-== ),3,2,1(1 ==-k p q k 于是我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中 3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0CC C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C rm=,则k 的范围可以写为k=0,1,…,n.〕 ⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a =⋅==+-.⑶超几何分布与二项分布的关系. 设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n 0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n =+-+=+==--,即η~)(b a a n B +⋅.[我们先为k 个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样.二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为n n 2211.数学期望反映了离散型随机变量取值的平均水平.2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身.②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p +q = 1)⑷二项分布:∑=⋅-⋅=-np q pk n k n k E k n k)!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率) 3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()( ===k p x P k k ξ时,则称+-++-+-=n n p E x p E x p E x D 2222121)()()(ξξξξ为ξ的方差. 显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:0=ξD 其分布列为p P ==)1(ξ ⑶两点分布:pq D =ξ 其分布列为:(p + q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)(⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =(如图阴影部分)的曲线叫ξ的密度曲线,以其作为图像的函数)(x f 叫做ξ的密度函数,由于“),(+∞-∞∈x 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f .(σμ,,R x ∈为常数,且0 σ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E . ⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近.⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-x ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤ .注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)( x Φ.比如5.00793.0)5.0(=-Φσμ则σμ-5.0必然小于0,如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通 常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a 是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).S 阴=0.5S a =0.5+S。
高中数学概率与统计问题的题型与方法篇一:高二数学概率与统计问题的题型与方法2一.复习目标:1.了解典型分布列:0~1分布,二项分布,几何分布。
2.了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。
3.在实际中经常用期望来比较两个类似事件的水平,当水平相近时,再用方差比较两个类似事件的稳定程度。
4.了解正态分布的意义,能借助正态曲线的图像理解正态曲线的性质。
5.了解标准正态分布的意义和性质,掌握正态总体N(,2)转化为标准正态总体N(0,1)的公式F(某)(某)及其应用。
6.通过生产过程的质量控制图,了解假设检验的基本思想。
7.了解相关关系、回归分析、散点图等概念,会求回归直线方程。
8.了解相关系数的计算公式及其意义,会用相关系数公式进行计算。
了解相关性检验的方法与步骤,会用相关性检验方法进行检验。
二.考试要求:⑴了解随机变量、离散型随机变量的意义,会求出某些简单的离散型随机变量的分布列。
⑵了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。
⑶会用抽机抽样,系统抽样,分层抽样等常用的抽样方法从总体中抽取样本。
⑷会用样本频率分布去估计总体分布。
⑸了解正态分布的意义及主要性质。
⑹了解假设检验的基本思想。
⑺会根据样本的特征数估计总体。
⑻了解线性回归的方法。
三.教学过程:(Ⅰ)基础知识详析㈠随机事件和统计的知识结构:㈡随机事件和统计的内容提要1.主要内容是离散型随机变量的分布列、期望与方差,抽样方法,总体分布的估计,正态分布和线性回归。
2.随机变量的概率分布(1)离散型随机变量的分布列:两条基本性质①pi0(i1,2,);②P1+P2+=1。
(2)连续型随机变量概率分布:由频率分布直方图,估计总体分布密度曲线y=f(某);总体分布密度函数的两条基本性质:①f(某)≥0(某∈R);②由曲线y=f(某)与某轴围成面积为1。
3.随机变量的数学期望和方差(1)离散型随机变量的数学期望:E某1p1某2p2;反映随机变量取值的平均水平。
概率论各种分布的期望和方差
概率论是描述和研究不确定性现象的基础学科,而概率分布是统计中最基本的概念,其中包括期望和方差。
期望是描述抽样变量数据的一个重要的描述统计量,它反映了该变量的总体分布特征。
方差,也称样本方差,是围绕其期望计算的一个重要的统计量,它能够揭示该抽样变量的变异程度。
对常见的概率分布来说,它们的期望和方差都是可以计算的。
针对均匀分布,它具有特定的概率赋值范围,同时,数学期望采用其平均值作为衡量标准即可计算出,而方差则是概率变量的期望值在两个方向上偏离之和的1/2倍。
此外,对于二项分布来说,它是表示在抽样次数已知且抽样几率未发生变化的情况下,典型抽样变量发生成功事件的次数分布,而它的期望和方差都是根据其抽样概率和抽样次数计算出的,期望是抽样概率乘以抽样次数,而方差则是期望乘以其补数,再乘以抽样次数。
此外,高斯分布是最常用、有着重要作用的概率分布之一,它具有广泛的应用场景,例如在定量分析中,用来进行参数估计或数据拟合,而它的期望和方差的计算也是基于其均值和标准差的,期望就是均值,而方差则是标准差的平方。
此外,指数分布也是一种常用的概率分布,它会用来描述随机变量的行为,主要是其它类型的连续分布之一,其期望和方差也是可以计算的,其期望直接取常数α,而方差是取α²。
综上所述,期望和方差都是无偏抽样变量分析中重要的统计量,它们是针对常见概率分布可以实行计算的重要概念,可以帮助我们更好地理解数据的分布情况,从而使其可以更加准确地进行应用和分析。
高中数学知识点第十二章-概率与统计考试内容:抽样方法.总体分布的估计. 总体期望值和方差的估计. 考试要求:(1)了解随机抽样了解分层抽样的意义,会用它们对简单实际问题进行抽样.(2)会用样本频率分布估计总体分布. (3)会用样本估计总体期望值和方差.§12. 概率与统计 知识要点一、随机变量.1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果. 它就被称为一个随机试验.2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量.设离散型随机变量ξ可能取的值为:ΛΛ,,,,21i x x xξ取每一个值),2,1(1Λ=i x 的概率i i p x P ==)(ξ,则表称为随机变量ξ的概率分布,简称ξ的分布列.有性质①Λ,2,1,01=≥i p ; ②121=++++ΛΛi p p p .注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数.3. ⑴二项分布:如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生k 次的概率是:kn k k n qp C k)P(ξ-==[其中p q n k -==1,,,1,0Λ] 于是得到随机变量ξ的概率分布如下:我们称这样的随机变量ξ服从二项分布,记作ξ~B (n ·p ),其中n ,p 为参数,并记p)n b(k;qp C kn kkn⋅=-.⑵二项分布的判断与应用.①二项分布,实际是对n 次独立重复试验.关键是看某一事件是否是进行n 次独立重复,且每次试验只有两种结果,如果不满足此两条件,随机变量就不服从二项分布.②当随机变量的总体很大且抽取的样本容量相对于总体来说又比较小,而每次抽取时又只有两种试验结果,此时可以把它看作独立重复试验,利用二项分布求其分布列.4. 几何分布:“k =ξ”表示在第k 次独立重复试验时,事件第一次发生,如果把k 次试验时事件A 发生记为k A ,事A 不发生记为q )P(A ,A k k =,那么)A A A AP(k)P(ξk 1k 21-==Λ.根据相互独立事件的概率乘法分式:))P(A A P()A )P(A P(k)P(ξk 1k 21-==Λ),3,2,1(1Λ==-k p q k 于是得到随机变量ξ的概率分布列.我们称ξ服从几何分布,并记p q p)g(k,1k -=,其中Λ3,2,1.1=-=k p q5. ⑴超几何分布:一批产品共有N 件,其中有M (M <N )件次品,今抽取)N n n(1≤≤件,则其中的次品数ξ是一离散型随机变量,分布列为)M N k n M,0k (0C C C k)P(ξnNk n MN k M -≤-≤≤≤⋅⋅==--.〔分子是从M 件次品中取k 件,从N-M 件正品中取n-k 件的取法数,如果规定m <r 时0C r m =,则k 的范围可以写为k=0,1,…,n.〕⑵超几何分布的另一种形式:一批产品由 a 件次品、b 件正品组成,今抽取n 件(1≤n ≤a+b ),则次品数ξ的分布列为n.,0,1,k CC C k)P(ξnba kn bk a Λ=⋅==+-.⑶超几何分布与二项分布的关系.设一批产品由a 件次品、b 件正品组成,不放回抽取n 件时,其中次品数ξ服从超几何分布.若放回式抽取,则其中次品数η的分布列可如下求得:把b a +个产品编号,则抽取n 次共有n b a )(+个可能结果,等可能:k)(η=含kn k k n ba C -个结果,故n ,0,1,2,k ,)ba a (1)b a a (C b)(a ba C k)P(ηkn k k n nkn k k n Λ=+-+=+==--,即η~)(b a a n B +⋅.[我们先为k个次品选定位置,共k n C 种选法;然后每个次品位置有a 种选法,每个正品位置有b 种选法] 可以证明:当产品总数很大而抽取个数不多时,k)P(ηk)P(ξ=≈=,因此二项分布可作为超几何分布的近似,无放回抽样可近似看作放回抽样. 二、数学期望与方差.1. 期望的含义:一般地,若离散型随机变量ξ的概率分布为则称ΛΛ++++=n n p x p x p x E 2211ξ为ξ的数学期望或平均数、均值.数学期望又简称期望.数学期望反映了离散型随机变量取值的平均水平. 2. ⑴随机变量b a +=ξη的数学期望:b aE b a E E +=+=ξξη)( ①当0=a 时,b b E =)(,即常数的数学期望就是这个常数本身. ②当1=a 时,b E b E +=+ξξ)(,即随机变量ξ与常数之和的期望等于ξ的期望与这个常数的和.③当0=b 时,ξξaE a E =)(,即常数与随机变量乘积的期望等于这个常数与随机变量期望的乘积.⑵单点分布:c c E =⨯=1ξ其分布列为:c P ==)1(ξ.⑶两点分布:p p q E =⨯+⨯=10ξ,其分布列为:(p + q = 1) ⑷二项分布:∑=⋅-⋅=-np q p k n k n k E k n k )!(!!ξ 其分布列为ξ~),(p n B .(P 为发生ξ的概率)⑸几何分布:pE 1=ξ 其分布列为ξ~),(p k q .(P 为发生ξ的概率)3.方差、标准差的定义:当已知随机变量ξ的分布列为),2,1()(Λ===k p x P k k ξ时,则称ΛΛ+-++-+-=n n p E x pE x p E x D 2222121)()()(ξξξξ为ξ的方差.显然0≥ξD ,故σξξσξ.D =为ξ的根方差或标准差.随机变量ξ的方差与标准差都反映了随机变量ξ取值的稳定与波动,集中与离散的程度.ξD 越小,稳定性越高,波动越小............... 4.方差的性质.⑴随机变量b a +=ξη的方差ξξηD a b a D D 2)()(=+=.(a 、b 均为常数) ⑵单点分布:=ξD 其分布列为p P ==)1(ξ⑶两点分布:pq D =ξ 其分布列为:(+ q = 1)⑷二项分布:npq D =ξ ⑸几何分布:2p q D =ξ5. 期望与方差的关系.⑴如果ξE 和ηE 都存在,则ηξηξE E E ±=±)(⑵设ξ和η是互相独立的两个随机变量,则ηξηξηξξηD D D E E E +=+⋅=)(,)( ⑶期望与方差的转化:22)(ξξξE E D -= ⑷)()()(ξξξξE E E E E -=-(因为ξE 为一常数)0=-=ξξE E .三、正态分布.(基本不列入考试范围)1.密度曲线与密度函数:对于连续型随机变量ξ,位于x 轴上方,ξ落在任一区间),[b a 内的概率等于它与x 轴.直线a x =与直线b x =所围成的曲边梯形的面积图像的函数)(x f 是必然事件,故密度曲线与x 轴所夹部分面积等于1.2. ⑴正态分布与正态曲线:如果随机变量ξ的概率密度为:222)(21)(σμσπ--=x ex f . (σμ,,R x ∈为常数,且0φσ),称ξ服从参数为σμ,的正态分布,用ξ~),(2σμN 表示.)(x f 的表达式可简记为),(2σμN ,它的密度曲线简称为正态曲线.⑵正态分布的期望与方差:若ξ~),(2σμN ,则ξ的期望与方差分别为:2,σξμξ==D E .⑶正态曲线的性质.①曲线在x 轴上方,与x 轴不相交. ②曲线关于直线μ=x 对称.③当μ=x 时曲线处于最高点,当x 向左、向右远离时,曲线不断地降低,呈现出“中间高、两边低”的钟形曲线.④当x <μ时,曲线上升;当x >μ时,曲线下降,并且当曲线向左、向右两边无限延伸时,以x 轴为渐近线,向x 轴无限的靠近. ⑤当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”.表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中.3. ⑴标准正态分布:如果随机变量ξ的概率函数为)(21)(22+∞-∞=-ππx ex x πϕ,则称ξ服从标准正态分布. 即ξ~)1,0(N 有)()(x P x ≤=ξϕ,)(1)(x x --=ϕϕ求出,而P (a <ξ≤b )的计算则是)()()(a b b a P ϕϕξ-=≤π.注意:当标准正态分布的)(x Φ的X 取0时,有5.0)(=Φx 当)(x Φ的X 取大于0的数时,有5.0)(φx Φ.比如5.00793.0)5.0(π=-Φσμ则σμ-5.0S 阴=0.5S a =0.5+S如图.⑵正态分布与标准正态分布间的关系:若ξ~),(2σμN 则ξ的分布函数通常用)(x F 表示,且有)σμx (F(x)x)P(ξ-==≤ϕ.4.⑴“3σ”原则.假设检验是就正态总体而言的,进行假设检验可归结为如下三步:①提出统计假设,统计假设里的变量服从正态分布),(2σμN .②确定一次试验中的取值a是否落入范围)3,3(σμσμ+-.③做出判断:如果)3,3(σμσμ+-∈a ,接受统计假设. 如果)3,3(σμσμ+-∉a ,由于这是小概率事件,就拒绝统计假设.⑵“3σ”原则的应用:若随机变量ξ服从正态分布),(2σμN 则 ξ落在)3,3(σμσμ+-内的概率为99.7% 亦即落在)3,3(σμσμ+-之外的概率为0.3%,此为小概率事件,如果此事件发生了,就说明此种产品不合格(即ξ不服从正态分布).。
Mister.D知识点总结:统计与概率I 统计1三大抽样 (1) 基本定义:① 总体:在统计中,所有考查对象的全体叫做全体. ② 个体:在所有考查对象中的每一个考查对象都叫做个体. ③ 样本:从总体中抽取的一部分个体叫做总体的样本. ④ 样本容量:样本中个体的数目叫做样本容量. (2) 抽样方法:① 简单随机抽样: 逐个不放回、等可能性、有限性。
=======★适用于总体较少★抽签法:整体编号(1~N )放入不透明的容器中搅拌均匀逐个抽取n 次,即可得样本容量为 n 的样本。
随机数表法:整体编号(等位数,如 001、111不能是1、111) 从0~9中随机取一行一列然后初方向随机(上、下、左、右)重复,超过范围则忽略不计直至取得以n 为样本容量的样本。
② 系统抽样:容量大•等距,等可能。
=======★适用于总体多^N用随机方法编号,若 N 无法被整除,则剔除后再分组,k。
再用简单随机抽样法来抽取一个n个体,设为I ,则编号为I , k+l , 2k+l ……(n-1) k ,抽出容量为n 的样本。
(每组编号相同)。
③ 分层抽样:总体差异明显•按所占比例抽取•等可能.=======★适用于由差异明显的几部分构成的总体★总体有几个差异明显的部分构成,经总体分成几个部分,然后按照所占比例进行抽样•抽样比为:3. 总体分布的估计: (1) 一表二图:★注:总体分布的密度曲线与横轴围成的面积为 1(2)茎叶图:样本容量抽样比=总体个数=各层样本容量 各层个体数量②频率分布直方图③频率分布折线图便于观察总体分布趋势11 m Il lift n 冲 11 11=7MIF①频率分布表——数据详实①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数•众位数等。
②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。
(1)在频率直方图中计算众数•平均数.中位数众数 在样本数据的频率分布直方图中,就是 最高矩形的中点的横坐标。
§12.2总体分布的估计、总体期望和方差的估计
(时间:45分钟满分:100分)
一、选择题(每小题7分,共35分)
1.为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm的株数大约是()
A.3 000 B.6 000
C.7 000 D.8 000
2.(2010·山东)在某项体育比赛中,七位裁判为一选手打出的分数如下:
90899095939493
去掉一个最高分和一个最低分后,所剩数据的期望值和方差分别为()
A.92,2 B.92,2.8 C.93,2 D.93,2.8
3.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图),已知从左到右各长方形高的比为2∶3∶5∶6∶3∶1,则该班学生数学成绩在(80,100)之间的学生人数是()
A.32 B.27 C.24 D.33
4.(2010·陕西)如图,样本A和B分别取自两个不同的总体,它们的样本期望值分别为x A 和x B,样本标准差分别为s A和s B,则()
A.x A>x B,s A>s B
B.x A<x B,s A>s B
C.x A>x B,s A<s B
D.x A<x B,s A<s B
5.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为:150,152,153,149,148,146,151,150,152,147.由此估计这车苹果单个重量的期望值是() A.150.2克B.149.8克
C.149.4克D.147.8克
二、填空题(每小题6分,共24分)
6.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图如图所示,现规定不低于70分为合格,则合格人数是________.
7.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等
比数列{a n},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.
8.(2010·福建)将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=_ _______.
9.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
.
三、解答题(共41分)
10.(13分)某工厂对一批产品进行了抽样检测,下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是多少?
11.(14分)某市统计局就某地居民的月收入调查了10 000人,并根据所得数据画出样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,
1 500)).
(1)求居民收入在[3 000,3 500)的频率;
(2)根据频率分布直方图算出样本数据的中位数;
(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中
按分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽取多少人?
12.(14分)在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第
一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.
(1)求第二小组的频率,并补全这个频率分布直方图; (2)求这两个班参赛的学生人数是多少?
(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由) 答案
1.C 2.B 3.D 4.B 5.B 6.600 7.160 8.60 9.甲
10.解 产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于 100克的个数是36,设样本容量为n ,则36
n =0.300,所以n =120,净重大于或等于98
克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90. 11.解 (1)月收入在[3 000,3 500)的频率为
0.000 3×(3 500-3 000)=0.15. (2)∵0.000 2×(1 500-1 000)=0.1, 0.000 4×(2 000-1 500)=0.2, 0.000 5×(2 500-2 000)=0.25, 0.1+0.2+0.25=0.55>0.5, ∴样本数据的中位数为
2 000+0.5-(0.1+0.2)
0.000 5
=2 000+400=2 400(元).
(3)居民月收入在[2 500,3 000)的频数为0.25×10 000=2 500(人),再从10 000人中用分 层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×
2 500
10 000
=25(人). 12.解 (1)∵各小组的频率之和为 1.00,第一、三、四、五小组的频率分别是
0.30,0.15,0.10,0.05.
∴第二小组的频率为:
1.00-(0.30+0.15+0.10+0.05)=0.40.
∴落在59.5~69.5的第二小组的小长方形的高=频率组距=0.40
10=0.04,则补全的频率分布
直方图如图所示.
(2)设九年级两个班参赛的学生人数为x 人. ∵第二小组的频数为40人,频率为0.40, ∴40
x
=0.40,解得x =100. 所以这两个班参赛的学生人数为100人. (3)因为0.3×100=30,0.4×100=40,
0.15×100=15,0.10×100=10,0.05×100=5,即第一、 第二、第三、第四、第五小组的频数分别为30,40,15, 10,5,所以九年级两个班参赛学生的成绩的中位数应落 在第二小组内.。