必修三第二章统计知识点总结及复习题
- 格式:doc
- 大小:56.00 KB
- 文档页数:5
【知识梳理】知识点一:抽样方法从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样简单随机抽样的概念:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.①用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N ;在整个抽样过程中各个个体被抽到的概率为nN;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等;③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.【解析】由题意可得1011910,5x y ++++=22222(10)(10)(1010)(1110)(910)25x y -+-+-+-+-=,解得12,8.||4x y x y ==-=,故选D .例3. 对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300300~400400~500500~600个 数2030804030(1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图; (3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.【思路点拨】 通过本题可掌握总体分布估计的各种方法和步骤. 【解析】(1)频率分布表如下:寿命(h ) 频 数 频 率 累积频率 100~200 20 0.10 0.10 200~300 30 0.15 0.25 300~400 80 0.40 0.65 400~500 40 0.20 0.85 500~600 30 0.15 1 合 计2001(2)频率分布直方图如下:(3)由累积频率分布图可以看出,寿命在100~400 h内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h内的概率为0.65.(4)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.【总结升华】画频率分布条形图、直方图时要注意纵、横坐标轴的意义.举一反三:【变式1】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是()(A)20 (B)30 (C)40 (D)50【答案】C;【解析】根据运算的算式:体重在〔56.5,64.5〕学生的累积频率为2×0.03+2×0.05+2×0.05+2×0.07=0.4,则体重在〔56.5,64.5〕学生的人数为0.4×100=40.【变式2】某班学生在一次数学考试中成绩分布如下表:分数段[0,80)[80,90)[90,100)人数 2 5 6)分数段[100,110)[110,120 [120,130)人数8 12 6分数段[130,140)[140,150)人数 4 2那么分数在[100,110)中的频率和分数不满110分的累积频率分别是_______、_______(精确到0.01). 【答案】0.18 0.47【解析】由频率计算方法知:总人数=45.分数在[100,110)中的频率为458=0.178≈0.18. 分数不满110分的累积频率为458652+++=4521≈0.47【变式3】为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品为13件,次品4件 (1)列出样本频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计商品为二级品或三级品的概率约是多少? 【解析】(1)样本的频率分布表为产品频数频率 一级品 5 0.17 二级品 8 0.27 三级品 13 0.43 次品40.13(2)样本频率分布的条形图为:(3)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.例4.甲、乙两小组各10名学生的英语口语测试成绩如下:(单位:分) 甲组 76 90 84 86 81 87 86 82 85 83 乙组 82 84 85 89 79 80 91 89 79 74 用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些?【思路点拨】学会用茎叶图表示数据的方法;并会进行统计推断.【解析】用茎叶图表示两小组的成绩如图:由图可知甲组成绩较集中,即甲组成绩更整齐一些.【总结升华】对各数据是二、三位数,且数据量不是很大时,用茎叶图表示较为方便,也便于进行统计推断,否则,应改用其他方法.举一反三:【变式1】甲、乙两个学习小组各有10名同学,他们在一次数学测验中成绩的茎叶图如图所示,则他们在这次测验中成绩较好的是组.【答案】甲小组类型三:变量的相关性和回归分析例5.某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:广告支出x(单位:万元) 1 2 3 4销售收入y(单位:万元)12 28 42 56(1) 画出表中数据的散点图;(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?【解析】(1)作出的散点图如下图所示(2)观测散点图可知各点大致分布在一条直线附近,由此可知散点图大致表现为线性相关.列出下表:序号 x y X 2xy 1 1 12 1 12 2 2 28 4 56 3 3 42 9 126 44 56 16 224 ∑1013830418易得569,22x y ==所以 414222156944184732255304()42i ii ii x y xyb xx ==--⨯⨯===-⨯-∑∑ 697352252a y bx =-=-⨯=- 故y 对x 的回归直线方程为73ˆ25yx =- (3)当x=9时, 73ˆ92129.45y=⨯-= 012 3 4x(万元)Y(万元)1020 30 40 50 60 .. . .08.0423.15=⨯-=-=bx y a .∴线性回归方程为:08.023.1^+=+=x a bx y .(2)当x=10时,38.1208.01023.1^=+⨯=y (万元) 即估计使用10年时维修费用是12.38万元.【变式2】一个工厂在某年里每月产品的总成本y (万元)与该月产量x (万件)之间有如下一组数据:x 1.08 1.12 1.19 1.28 1.36 1.48 y 2.25 2.37 2.40 2.55 2.64 2.75 x 1.59 1.68 1.80 1.87 1.98 2.07 y 2.92 3.03 3.14 3.26 3.36 3.50(1)画出散点图;(2)求月总成本y 与月产量x 之间的回归直线方程. 【解析】(1)画出散点图:(2)设回归直线方程a bx y+=ˆ, 利用计算a ,b ,得b ≈1.215, 974.0ˆ≈-=+=x b y a bx y,从中抽取一个容量为100的样本,较为恰当的抽样方法是( )A.简单随机抽样B.系统抽样C.分层抽样D.以上三种均可3. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( ) A .n N B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4.下列说法错误的是 ( )A .在统计里,把所需考察对象的全体叫做总体B .一组数据的平均数一定大于这组数据中的每个数据C .平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D .一组数据的方差越大,说明这组数据的波动越大5.要从已编号(160:)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A .5,10,15,20,25,30B .3,13,23,33,43,53C .1,2,3,4,5,6D .2,4,8,16,32,486. 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( ) A.0.6 h B.0.9 h C.1.0 h D.1.5 h7.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;……;第六组,成绩大于等于18秒且小于等于19秒.下图是按上述分组方法得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x ,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为( )A .0.9,35B .0.9,45C .0.1,35D .0.1,458.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图).从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是( ) A .48米B .49米C .50米D .51米9.用系统抽样法要从160名学生抽取容量为20的样本,将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为126,则第一组中抽签方法确定的号码是________.10.从一堆苹果中任取了20只,并得到它们的质量(单位:克)数据分布表如下:分组 [)90100, [)100110, [)110120, [)120130, [)130140, [)140150, 频数1231031则这堆苹果中,质量不小于...120克的苹果数约占苹果总数的 %.11.某校有学生2000人,其中高三学生500人,为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为 . 12.甲,乙两人在相同条件下练习射击,每人打5发子弹,命中环数如下甲 6 8 9 9 8乙 10 7 7 7 9则两人射击成绩的稳定程度是__________________.13.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:组别频数频率145.5~149.5 1 0.02149.5~153.5 4 0.08153.5~157.5 20 0.40157.5~161.5 15 0.30161.5~165.5 8 0.16165.5~169.5 m n合计M Nm n M N所表示的数分别是多少?(1)求出表中,,,(2)画出频率分布直方图.(3)全体女生中身高在哪组范围内的人数最多?14.从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班76 74 82 96 66 76 78 72 52 68乙班86 84 62 76 78 92 82 74 88 85画出茎叶图并分析两个班学生的数学学习情况.15.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:问:甲、乙谁的平均成绩最好?谁的各门功课发展较平衡?16.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为2150m 时的销售价格.【答案与解析】1.【答案】B 【解析】∵n40=0.125,∴n=320.故选B. 2. 【答案】C 3. 【答案】C 【解析】剔除零头 4. 【答案】B【解析】平均数不大于最大值,不小于最小值 5. 【答案】B 【解析】60106=,间隔应为10 6. 【答案】B 【解析】505.020)5.11(1025⨯++⨯+⨯=0.9.7.【答案】A【解析】由图知,成绩小于17秒的学生人数占全班总人数的频率为0.020.180.360.340.9+++=, 所以0.9x =;成绩大于等于15秒且小于17秒的的频率为0.360.340.7+=,104416461451222222=++++=)(甲s 5627313751222222=++++=)(乙s ∵ 22乙甲乙甲,s s x x >>∴ 甲的平均成绩较好,乙的各门功课发展较平衡16.【解析】(1)数据对应的散点图如图所示:(2)1095151==∑=i i x x ,1570)(251=-=∑=x x l i i xx , 308))((,2.2351=--==∑=y y x x l y i i i xy设所求回归直线方程为a bx y +=), 则1962.01570308≈==xx xyl l b 8166.115703081092.23≈⨯-=-=x b y a 故所求回归直线方程为8166.11962.0+=x y )(3)据(2),当2150x m =时,销售价格的估计值为: 2466.318166.11501962.0=+⨯=y )(万元)。
[键入文字]
高二数学必修三人教版第二章知识点:统计
数学是利用符号语言研究数量、结构、变化以及空间模型等概念的一门学科。
为大家推荐了高二数学必修三人教版第二章知识点,请大家仔细阅读,希望你喜欢。
2.1.1简单随机抽样
1.总体和样本
在统计学中, 把研究对象的全体叫做总体.
把每个研究对象叫做个体.
把总体中个体的总数叫做总体容量.
为了研究总体的有关性质,一般从总体中随机抽取一部分:
研究,我们称它为样本.其中个体的个数称为样本容量.
2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随
机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样
1。
人教版高中数学必修三第二章统计知识点总结2.1随机抽样2.1.1简单随机抽样教学目标:1.结合实际问题情景,理解随机抽样的必要性和重要性2.学会用简单随机抽样的方法从总体中抽取样本教学重点:学会用简单随机抽样的方法从总体中抽取样本1.总体和样本在统计学中 , 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量.为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样一般地,设总体中有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体中的各个个体被抽到的机会都相等就把这种抽样方法叫做简单随机抽样.特点:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
简单随机抽样常用的方法:(1)抽签法;例:请调查你所在的学校的学生做喜欢的体育活动情况。
(2)随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
例题例1 为了了解参加运动会的2000名运动员的年龄情况,从中抽取100名运动员;就这个问题,下列说法中正确的有;①2000名运动员是总体;②每个运动员是个体;③所抽取的100名运动员是一个样本;④样本容量为100;⑤这个抽样方法可采用按年龄进行分层抽样;⑥每个运动员被抽到的概率相等。
例2 下面抽取样本的方式是简单随机抽样吗?为什么?(1)从无限多个个体中抽取50个个体作为样本;(2)箱子里共有100个零件,从中选取10个零件进行检验,从中任取一个零件进行检验后,再把它放回箱子里;(3)从50个个体中,一次性抽取5个个体作为样本;(4)从某班45名同学中指定个子最高的5名同学参加学校组织的某项活动;1.从60个产品中抽取6个进行检查,则总体个数为______,样本容量为______.2.要检查一个工厂产品的合格率,从1000件产品中抽出50件进行检查,检查者在其中随意取了50件,这种抽法为____________________.3.福利彩票的中奖号码是由1~36个号码中,选出7个号码来按规则确定中奖情况,这种从36个选7个号的抽样方法是__________.4.对于简单随机抽样,个体被抽到的机会 ( )A.相等B.不相等C.不确定D.与抽样次数有关5. 抽签中确保样本代表性的关键是 ( )A.制签B.搅拌均匀C.逐一抽取D.抽取不放回6.用随机数法从100名学生(男生25人)中抽取20人进行某项活动,某男生被抽到的几率是A.1100B.125C.15D.14( )7.从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该批产品的合格率为 ( )A.36﹪B. 72﹪C.90﹪D.25﹪8.某校有40个班,每班50人,每班选项派3人参加学代会,在这个问题中样本容量是.A. 40B.50C. 120D. 150 ( )9.在简单随机抽样中,某一个个体被抽中的可能性是()A.与第几次抽样有关,第1次抽中的可能性要大些B.与第几次抽样无关,每次抽中的可能性都相等C.与第几次抽样有关,最后一次抽中的可能性大些D.与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不一样10.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法正确的是﹙﹚A.1000名学生是总体B.每个学生是个体C.100名学生的成绩是一个个体D.样本的容量是10011. 对总数为N 的一批零件抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N 为 ﹙ ﹚A. 150B.200C.100D.12012.已知总容量为160,若用随机数表法抽取一个容量为10的样本.下面对总体的编号正确的是 ( )A. 1,2,…,106B. 0,1,…,105C.00,01,…,105D. 000,001,…,10513.某地有2000人参加自学考试,为了了解他们的成绩,从中抽取一个样本,若每个考生被抽到的概率都是0.04,则这个样本的容量是_______________.14.从含有500个个体的总体中一次性地抽取25个个体,假定其中每个个体被抽到的概率相等,那么总体中的每个个体被抽取的概率等于_________.15. 要从某汽车厂生产的100辆汽车中随机抽取10 辆进行测试,请选择合适的抽样方法,写出抽样过程。
描述:例题:高中数学必修3(人教B版)知识点总结含同步练习题及答案第二章 统计 2.3 变量的相关性一、学习任务1. 能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2. 了解线性回归的方法,了解用最小二乘法研究两个变量的线性相关问题的思想方法,会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式).二、知识清单变量间的相关关系相关关系 线性相关三、知识讲解1.变量间的相关关系2.相关关系变量与变量之间的关系一类是确定性的函数关系,像正方形的边长 和面积 的关系 .另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.例如,人的身高不能确定体重,但一般说来“身高者,体也重”.我们说身高与体重这两个变量具有相关关系.函数关系与相关关系的异同点相同点:是两者均是指两个变量的关系;不同点:①函数关系是一种确定性的关系,相关关系是一种非确定性的关系.②函数关系式一种因果关系,而相关关系不一定是因果关系,其也可能是伴随关系.a S 给出下列关系:①正方形的边长与面积之间的关系;②水稻产量与施肥量之间的关系;③降雪量与交通事故的发生率之间的关系.其中具有相关关系的是______.解:②③两个变量之间的关系有两种:函数关系与相关关系.①正方形的边长和面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③降雪量与交通事故的发生率具有相关关系.下图中的两个变量是相关关系的是( )描述:3.线性相关两个变量的线性关系对具有相关关系的两个变量进行统计分析的方法叫回归分析.将样本中的个数据点(,,,)描在平面直角坐标系中,就得到了散点图.如果两个变量的散点图中的点散步在左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,我们将这种相关称为正相关.如果两个变量的散点图中的点散步的位置是从左上角到右下角的区域,即一个变量的值由小变大是,另一个变量的值由大变小,我们将这种相关称为负相关.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量具有线性相关关系.回归直线方程“最贴近”已知的数据点的直线方程称之为回归直线方程,简称回归方程,方程为,叫做回归系数.刻画了实际观察值与回归直线上相应点纵坐标之间的偏离程度,个离差构成的总离差越小越好,总离差通常是用离差的平方和来表示,即作为总离差,并使之达到最小.回归直线就是所有直线中取最小的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法.A.①② B.①③ C.②④ D.②③解:D①属于函数关系,因为每个 值对应一个 值,这是确定性的关系;②中散点图中各点分布的区域大致为从左下角到右上角,没有确定的函数关系,但是具有相关关系;③中散点图分布的区域大致在一条曲线附近,对于每个 ,其对应的 呈现出一定的规律性,因此这两个变量具有相关关系;④ 中各点的分布比较均匀,但对于每个 , 的分布没有规律,因此不属于相关关系.x y x y x y n (,)x i y i i =12⋯n =a +bx y ^b −y i y ^i y i n Q =(−a −b ∑i =1ny i x i )2Q(),得散点图2.由这两个散点图可以判断( )(,)u i v i i =12⋯10高考不提分,赔付1万元,关注快乐学了解详情。
高中数学必修 3 知识点总结第二章统计2.1.1 简单随机抽样1.简单随机抽样,也叫纯随机抽样。
就是从整体中不加任何分组、划类、排队等,完整随机地抽取检查单位。
特色是:每个样本单位被抽中的可能性同样(概率相等),样本的每个单位完整独立,相互间无必定的关系性和排挤性。
简单随机抽样是其它各样抽样形式的基础。
往常不过在整体单位之间差异程度较小和数目较少时,才采纳这类方法。
2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①整体变异状况;②同意偏差范围;③概率保证程度。
3.抽签法 :(1)给检核对象集体中的每一个对象编号;(2)准备抽签的工具,实行抽签(3)对样本中的每一个个体进行丈量或检查例:请检查你所在的学校的学生做喜爱的体育活动状况。
4.随机数表法:例:利用随机数表在所在的班级中抽取10 位同学参加某项活动。
2.1.2 系统抽样1.系统抽样(等距抽样或机械抽样):把整体的单位进行排序,再计算出抽样距离,而后依据这一固定的抽样距离抽取样本。
第一个样本采纳简单随机抽样的方法抽取。
K(抽样距离) =N(整体规模)/n (样本规模)前提条件:整体中个体的摆列对于研究的变量来说,应是随机的,即不存在某种与研究变量有关的规则散布。
能够在调查同意的条件下,从不一样的样本开始抽样,对照几次样本的特色。
假如有明显差异,说明样本在整体中的散布承某种循环性规律,且这类循环和抽样距离重合。
2.系统抽样,即等距抽样是实质中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实行也比较简单。
更为重要的是,假如有某种与检查指标有关的协助变量可供使用,整体单元按协助变量的大小次序排队的话,使用系统抽样能够大大提升估计精度。
2.1.3 分层抽样1.分层抽样(种类抽样):先将体中的全部位依据某种特色或志(性、年等)区分红若干型或次,而后再在各个型或次中采纳随机抽或系用抽的法抽取一个子本,最后,将些子本合起来组成体的本。
人教版高中数学必修三知识点梳理重点题型(常考知识点)巩固练习《统计》全章复习与巩固【学习目标】1. 理解随机抽样的必要性和重要性;会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法,会用简单随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本.2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.3.理解样本数据标准差的意义和作用,会计算数据标准差;能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.6.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系;了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.【知识网络】【要点梳理】要点一:抽样方法从调查的对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断,这就是抽样调查.调查对象的全体称为总体,被抽取的一部分称为样本.1.简单的随机抽样简单随机抽样的概念:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.①用简单随机抽样从含有N个个体的总体中抽取一个容量为n的样本时,每次抽取一个个体时,任一个体被抽到的概率为1N;在整个抽样过程中各个个体被抽到的概率为n N;②简单随机抽样的特点是:不放回抽样,逐个地进行抽取,各个个体被抽到的概率相等; ③简单随机抽样方法体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础. 简单抽样常用方法:①抽签法:先将总体中的所有个体(共有N 个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n 次,就得到一个容量为n 的样本.适用范围:总体的个体数不多.优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法. ②随机数表法:随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码.2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先制定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号,为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.②为将整个的编号分段 (即分成几个部分),要确定分段的间隔k .当Nn是整数时(N 为总体中的个体的个数,n 为样本容量),N k n =;当Nn 不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数'N 能被n 整除,这时'N k n=.③在第一段用简单随机抽样确定起始的个体编号l .④按照事先确定的规则抽取样本(通常是将l 加上间隔k ,得到第2个编号l k +,第3个编号2l k +,这样继续下去,直到获取整个样本).要点诠释:①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除再进行系统抽样.3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层.4.常用的三种抽样方法的比较:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.随机抽样、系统抽样、分层抽样都是不放回抽样. 要点二:用样本估计总体1. 统计图表包括条形图、折线图、饼图、茎叶图.2. 刻画一组数据集中趋势的统计量有平均数、中位数、众数.平均数:12...nx x x x n+++=刻画一组数据离散程度的统计量有极差、方差2s 、标准差s .方差:222212()()...()n x x x x x x s n-+-++-=.3.总体分布(1)总体:在数理统计中,通常把被研究的对象的全体叫做总体.(2)频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.(3)频率分布直方图中每个小矩形的宽度为i x ∆(分组的宽度),小矩形的面积为相应的频率i f ,高为i if x ∆.(4)频率分布折线图:在频率分布直方图中,按照分组原则,再在左、右两边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,所得到的折线称为频率折线图.(5)总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n 的样本,就是进行了n 次试验,试验所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.(6)总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.要点诠释:①总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,总体在某一区间取值的百分比就是该区间与该曲线所成的曲边梯形的面积.②总体密度曲线一般的分布规律是中间高、两边低的“山峰”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。
2016高一数学必修3知识点二:统计 1:简单随机抽样(1)总体和样本①在统计学中 , 把研究对象的全体叫做总体.②把每个研究对象叫做个体.③把总体中个体的总数叫做总体容量.④为了研究总体的有关性质,一般从总体中随机抽取一部分:,,,研究,我们称它为样本.其中个体的个数称为样本容量.(2)简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
(3)简单随机抽样常用的方法:①抽签法②随机数表法③计算机模拟法③使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
(4)抽签法: ①给调查对象群体中的每一个对象编号;②准备抽签的工具,实施抽签;③对样本中的每一个个体进行测量或调查(5)随机数表法:2:系统抽样(1)系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N (总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
(2)系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
因为它对抽样框的要求较低,实施也比较简单。
更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。
3:分层抽样(1)分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。
2019-2019高二数学必修3第二章统计知识点归纳我们要振作精神,下苦功学习。
聪明出于勤奋,天才在于积累。
小编准备了高二数学必修3第二章统计知识点,希望能帮助到大家。
一.简单随机抽样1.总体和样本在统计学中 , 把研究对象的全体叫做总体.把每个研究对象叫做个体.把总体中个体的总数叫做总体容量. 为了研究总体的有关性质,一般从总体中随机抽取一部分研究,我们称它为样本.其中个体的个数称为样本容量.2.简单随机抽样,也叫纯随机抽样。
就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。
特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其它各种抽样形式的基础。
通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。
3.简单随机抽样常用的方法:(1)抽签法; ⑵随机数表法; ⑶计算机模拟法; ⑷使用统计软件直接抽取。
在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。
4.抽签法: (1)给调查对象群体中的每一个对象编号; (2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。
5.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。
二.系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。
第一个样本采用简单随机抽样的办法抽取。
K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。
可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。
如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。
2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。
第1课时随机抽样
一、目标与要求:
理解用简单随机抽样的方法从总体中抽取样本;理解分层抽样和系统抽样的方法
二、要点知识:
1、三种抽样方法、、,其中简单随机抽样分为抽签法、随机数法。
2、三种抽样方法的区别与联系:
1)联系:简单随机抽样、系统抽样与分层抽样都是一种,抽样时每个个体被抽到的可能性是,它们都是不放回抽样。
2)区别:一般的,当总体个数较多时,常采用;当总体由差异明显的几部分组成时,常采用;一般情况下,采用。
三、课前小练:
1、要了解一批产品的质量,从中抽取200个产品进行检测,则这200个产品的质量是()A总体 B总体的一个样本 C个体 D样本容量
2、为了调查某城市自行车年检情况,在该城市主干道上采取抽取车牌个数为9的自行车检验,这种抽样方法是()
A简单随机抽样 B抽签法 C系统抽样 D分层抽样
3、要从已编号(1-50)的50部新生产赛车中随机抽取5部进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5部赛车的编号可能是()
A. 5,10,15,20,25
B. 3,13,23,33,43
C. 5,8,11,14,17
D. 4,8,12,16,20
4、某校有老师200人,男生1200人,女生1000人,现用分层抽样的方法从所有师生中抽取一个容量为n的样本;已知从女生中抽取的人数为80人,则
n=。
5、采用系统抽样的方法,从个体数为1003的总体中抽取一个容量50的样本,则在抽样过程中,被剔除的个体数为,抽样间隔为。
四、典例分析:
例1、某工厂平均每天生产某种零件大约10000件,要求产品检验员每天抽取50个零件检查其质量情况,假设一天的生产时间(8小时)中,生产机器零件的件数是均匀的,请你设计一个抽样方案。
例2、某校高一年级共有20个班,每班有50名学生。
为了了解高一学生的视力状况,从这1000人中抽取一个容量为100的样本进行检查,应该怎样抽样
例3、某校高一有500名学生,血性为O型的有200人,A型的有125人,B型的有125人,AB型的有50人,为了研究血型和色弱的关系,要从中抽取一个容量为40的样本,应如何抽取并写出AB型样本的抽样过程。
五、巩固练习:
1、某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在抽取20人进行分层抽样,各年龄段人数分别是()
A、7,4,6
B、9,5,6
C、6,4,9
D、4,5,9
2、某工厂生产A,B,C三种不同型号的产品,产品数量之比依次为2:3:5,现用分层抽样的方法抽出一个容量为n的样本,样本中A种型号产品有16件,那么此样本容量n=。
3、某中学有高一学生400人,高二学生302人,高三学生250人,现在按年级分层抽样方法从所有学生中抽取一个容量为190人的样本,应该剔除,每个年级应抽取人。
4、一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁以上的有95人。
为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本。
由于职工年龄与这项指标有关,试问:应用什么方法抽取能在500人中任意取100个吗能将100个份额均分到这三部分中吗
第2课时用样本估计总体
一、目标与要求:
理解用样本的频率分布估计总体分布的思路与方法,能熟练计算样本的数字特征从而估计总体的数字物征。
二、要点知识:
1)频率分布直方图中,纵轴表示,数据落在各个小组内的频率用表示,各小长方形的面积总和为。
用样本的频率分布估计总体分布的方法包括频率分布直方图、折线图与茎叶图。
2)连接频率分布直方图中各小长方形上端的中点,就得到频率颁折线图,随着的增加,作图时所分的也增加,组距减小,相应的频率分布折线图也就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它能够精确地反映。
3)用样本的数字特征估计总体特征,这些数字特征包括、、。
三、课前小练:
1、将100个数据分成8个组,其中有一组是9个数据,那么该组的频数是,频率是。
2、若五个数1,2,3,4,a的平均数是3,则a= ,这五个数的标准差是。
3、频率分布直方图中最高小矩形的下端中点的横坐标是()
A.中位数 B.从数 C.平均数 D.标准差
4、在统计中,样本的标准差可以近似地反映总体的()
A.平均状态 B.分布规律 C.波动大小 D.最大值和最小值
四、典例分析:
例1、如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:
(1)80---90这一组的频数、频率分别是多少
(2)估计这次环保知识竞赛的及格率(60分及以上为及格)
例2.甲、乙两名射手各打了10发子弹,各人成绩(每发子弹击中的环数)如下:甲:10, 6, 7, 10 ,8 ,9 ,9, 10 ,5, 10
乙: 8, 7, 9 ,10, 9, 8 ,7, 9 ,8, 9
试问:哪一名射手的射击技术较好
例3、对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表:
1)画出茎叶图,由茎叶图你能获得哪些信息
2) 分别求出甲、乙两名自行车赛手最大速度(m/s )数据的平均数、中位数、标准差,并
判断选谁参加比赛更合适。
五、巩固练习:
1、已知样本99,100,101,x,y 的平均数是100,方差是2,则xy=____________
2、两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2. 那么样本甲和样本乙的波动大小情况是 ( ) A .甲、乙波动大小一样 B. 甲的波动比乙的波动大 C. 乙的波动比甲的波动大 C. 甲、乙的波动大小无法比较
3、在茎叶图
9.8.7.6.5.3
8 5 4 1 09 6 2 2 18 5 4 3 22
中,样本的中位数为 ,众数为 。
4、在一次歌手大奖赛上,七位评委为歌手打出的得分如下: 去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 。
5、某校从高三学生中抽出50名学生参加数学 竞赛,由成绩得到如下的频率分布直方图:
试利用频率分布方图,求:
1)50名学生的成绩的众数与中位数;
2)这50名学生的平均成绩。
第3课时 变量间相关关系
一、目标与要求:
识别变量之间的相关关系,会应用散点图直观认识两个变量之间的线性相关关系。
二、要点知识:
1、函数关率是两个变量间的 关系,相关关系是两个变量之间的 性关系。
2、散点图中的点散布在 的区域,这样的两个变量的相关关系成负相关。
3、从散点图看,如果这些点从整体上看大致辞分布在通过散点图中心的一条直线附近,称两个变量之间具有 ,这条直线叫 。
4、通过求Q= 的最小值而得出回归直线的方法,即求回归直线使得样本数据的点到它的距离的平方和最小,这种方法叫 。
频率
5、设直线的回归方程为a bx y +=∧
,其中系数a, b 由下式确定:
⎩⎨⎧=
=b •
a 三、课前小练:
1、下列变量间不是函数关系的是( )
A .电话通话时间与通话费
B .正方形的边长的面积
C .正边形的边数和内角和
D .人的年龄与身高
2、有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程。
②平均日学习时间和平均学习成绩。
③某人每日吸烟量和其身体健康情况。
④汽车的重量的百公里耗油量。
其中两个变量成正相关的是( )
A .①③
B .①②
C .②④
D .③④
3、若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系是( ) A .不相关 B .负相关 C .正相关 D .函数关系
四、典例分析:
例、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据。
1)请画出上表数据的散点图;
2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程;
3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤
五、巩固练习:
1、房屋的销售价格y (万元)与房屋的面积x(cm 2
)的线性回归方程是8166.11962.0+=∧
x y ,
则购买150cm 2
的住房估计要 万元。
2、对某种机器购置运营年限x(xN +)与当年增加利润y 的统计分析知具备线性相关关系,回归方程x y 3.147.10-=∧
,估计该台机器使用 年最合算(存在利润便看成合算) 3、抽测10名15岁男生的身高x (单位:cm )和体重y (单位:kg )得到如下数据:
若x 与y 之间具有线性关系,则(1)求y 对x 的回归直线方程; 2)如果一个身高为164 cm ,预测他的体重。