第四节 统计案例-高考状元之路
- 格式:doc
- 大小:362.00 KB
- 文档页数:7
1999-2007年中国高考状元调查报告导言:“十年寒窗无人问,一举成名天下知”,这是对中举者的赞赏,有着“科举”之称的“高考”是目前我国最公平、最公正、最大规模的人才选拔制度,“高考”是对考生在“中学阶段”所学基础知识的理解与运用能力的综合考察与检验。
“高考状元”作为各省市高考的最高分得主,在中学阶段对已有知识的领悟与运用方面领先其他人,学习已有知识的方法比别人先进有效,是现行高考人才选拔竞争中的获胜者。
端课件外在机会如果你原来高中语文,语文试卷,计算机方法大量高中语文,语《1999-2007中国高考状元调查报告》是由中国校友会网、《大学》杂志和21世纪人才报等联合编制完成,这是中国校友会网大学评价课题组连续第2年发布高考状元调查报告。
课题组组长赵德国总编介绍说,调查报告目的在于为即将参加中、高考的考生及,为基础教育工作者、高考研究人员,为有关部门教育资源分配与决策提供参考。
文试卷,计算机,盈利性最强高中语文,语文试卷,计算机课件我研究高中语赵德国总编表示,本次调查对象为1999-2007年我国各省市(除西藏、港澳台地区外)高考状元,调查的状元包括高考考试原始分状元和加分状元,共调查到的高考状元有653人,约占1999-2007年状元总数的98%。
其中调查到其就读大学的状元有650多人,约占总数的99.54%;调查到就读专业的有620多人,约占总数的94.95%,调查到就读中学的有640多人,约占总数的98.00%。
文,语文试卷,计算机限制以及产品多样化给予消费者更多高中语文,语文试解读报告:《1999-2007中国高考状元调查报告》对我国1999-2007年高考状元的性别构成、姓氏构成,就读高校、就读专业、就读中学等状况展开调查分析。
报告显示,“状元情结”驱动高考状元之争,、清华和香港高校“三足鼎立”;报告呼吁国家、地方改革高校招生制度,联合企业等设立专业奖学金,积极引导高分考生选择就读国家急需发展的专业。
【状元之路】2015版高考数学二轮复习 统计与统计案例专题训练(含解析)一、选择题1.(2014·四川卷)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )A .总体B .个体C .样本的容量D .从总体中抽取的一个样本解析 由题目条件知5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.答案 A2.(2014·重庆卷)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .250解析 由分层抽样的特点可知703 500=n3 500+1 500,解之得n =100. 答案 A3.(2014·广东卷)为了解 1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20解析 由系统抽样的定义知,分段间隔为1 00040=25.故答案为C .答案 C4.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生人数为b ,则a ,b 的值分别为( )A .0.27,78B .0.27,83C .2.7,84D .2.7,83解析 前4组的频数成等比数列,由图知:第一组的频率是0.01,故第一组有1名学生;第二组的频率为0.03,故第二组有3名;所以第三组有9名,第四组有27名.所以后6组共87名学生,设最后一组人数为x ,则27+x 2×6=87,解得x =2,故公差d =2-275=-5,所以a =27100=0.27,倒数第二组人数为7,则b =87-2-7=78.故选A .答案 A5.对于下列表格所示的五个散点,已知求得的线性回归直线方程为y ^=0.8x -155.则实数m 的值为( A .8 B .8.2 C .8.4D .8.5解析 本题主要考查统计的相关知识,意在考查考生的运算求解能力.依题意得x -=15(196+197+200+203+204)=200,y -=15(1+3+6+7+m)=17+m 5,回归直线必经过样本中心点(x -,y -),于是有17+m5=0.8×200-155,由此解得m =8,选A .答案 A6.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:女由K 2=+b+++算得,K 2=-260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”解析 根据独立性检验的思想方法,正确选项为C . 答案 C 二、填空题7.从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为________.解析 根据系统抽样的特点,共有80个产品,抽取5个样品,则可得组距为805=16,又其中有1个为28,则与之相邻的为12和44,故所取5个依次为12,28,44,60,76,即最大的为76.答案 768.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生人数是________.解析 因为(0.002+0.006+0.012)×10×200=40,40x =2003 000,所以x =600.故在该次数学考试中成绩小于60分的学生人数是600.答案 600 9.已知某单位有40名职工,现要从中抽取5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成5组.按系统抽样方法在各组内抽取一个号码.(1)若第1组抽出的号码为2,则所有被抽出职工的号码为________;(2)分别统计这5名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,则该样本的方差为________.解析 (1)由题意知被抽出职工的号码为2,10,18,26,34. (2)由茎叶图知5名职工体重的平均数 x -=59+62+70+73+815=69,则该样本的方差s 2=15[(59-69)2+(62-69)2+(70-69)2+(73-69)2+(81-69)2]=62.答案 (1)2,10,18,26,34 (2)62 三、解答题10.(2014·课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部分评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.11.(2014·课标全国卷Ⅰ)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解 (1)(2)质量指标值的样本平均数为x -=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100. 质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.B级——能力提高组1.(2014·郑州一模)PM2.5是指大气中直径小于或等于 2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( )A.甲B.乙C.甲、乙相等D.无法确定解析从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.答案A2.(理)(2014·贵州六校联考)某校学习小组开展“学生语文成绩与外语成绩的关系”的课题研究,对该校高二年级800名学生上学期期末语文和外语成绩,按优秀和不优秀分类得结果:语文和外语都优秀的有60人,语文成绩优秀但外语不优秀的有140人,外语成绩优秀但语文不优秀的有100人.(1)能否在犯错概率不超过0.001的前提下认为该校学生的语文成绩与外语成绩有关系?(2)将上述调查所得的频率视为概率,从该校高二年级学生成绩中,有放回地随机抽取3名学生的成绩,记抽取的3个成绩中语文、外语两科成绩至少有一科优秀的个数为X,求X的分布列和期望E(X).解(1)由题意得列联表:外语不优秀因为K 2=160×640×200×600≈16.667>10.828,所以能在犯错概率不超过0.001的前提下认为该校学生的语文成绩与外语成绩有关系. (2)由已知数据,语文、外语两科成绩至少一科为优秀的频率是38.则X ~B ⎝ ⎛⎭⎪⎫3,38, P(X =k)=C k 3⎝ ⎛⎭⎪⎫38k ⎝ ⎛⎭⎪⎫583-k,k =0,1,2,3.X 的分布列为E(X)=3×38=98.2.(文)(2014·东北三校联考)某城市随机抽取一年(365天)内100天的空气质量指数API 的监测数据,结果统计如下:(250,300] 式为S =⎩⎪⎨⎪⎧0,0≤w≤100,4w -400,100<w≤300,2 000,w>300,试估计在本年度内随机抽取一天,该天经济损失S 大于200元且不超过600元的概率;(2)若本次抽取的样本数据有30天是在供暖季,其中有8天为重度污染.完成下面2×2列联表,并判断能否有95%的把握认为该市本年空气重度污染与供暖有关?附:解(1)设“在本年内随机抽取一天,该天经济损失S大于200元且不超过600元”为事件A,由200<S≤600,得150<w≤250,频数为39,所以P(A)=39100.(2)根据以上数据得到如下列联表:K2的观测值为85×15×30×70≈4.575>3.841.所以有95%的把握认为空气重度污染与供暖有关.。
理科状元高考励志故事精选高考理科状元励志故事1:佛山高考理科状元的励志故事高考放榜后,真的是几家欢喜几家愁。
在佛山二中,一个名叫吴海灏的男生在众人的欢呼声中上台接受颁奖。
很多人对于吴海灏在高考中取得的骄人成绩表示祝贺的同时,也对他的状元之路充满好奇。
考神故事吴海灏今年以663分的高分夺得禅城区区直学校理科状元。
吴海灏的班主任表示,吴海灏并非从高一开始就是尖子生,他刚入学那会儿,成绩在全年级只排100多名,在整个禅城区排名也是1000名之后。
从高二开始,他的成绩便突飞猛进了。
说到自己为何成绩突飞猛进,吴海灏笑了笑: 你们要听真正原因么?其实我从高一开始就暗恋同校的一个女生,那个女生成绩很好,为了追上她,我从高二开始便下猛功夫学习了。
为了成绩追上心仪的女生,吴海灏付出了比其他同学多倍的努力,为了学习,他连中午的午睡也放弃了,有时候来不及吃饭,就买一个面包啃啃。
终于,他的努力有了成效,到了高二下学期,他的成绩已跻身年级前几名。
高考完的第二天,吴海灏终于向心仪的女生进行了表白。
吴海灏说,并不是希望这个女生能够接受他,只是想把自己藏在内心3年的想法说出来。
高考成绩公布,吴海灏成了了禅城区理科状元,但他心仪的女生却并未考好,命运就是这么奇怪。
吴海灏感叹。
如今,吴海灏把目标瞄准浙江大学和复旦大学, 我应该会报浙江大学,因为她曾经也是以浙江大学为目标。
吴海灏表示,他将报考化学专业, 虽然这种纯理科专业现在不是很好就业,但我不能把4年的时间花在自己不喜欢的专业上。
不同于一般男生课余爱打球跑步等,吴海灏的课余爱好竟是做瑜伽。
我从小就喜欢瑜伽,高中后每天晚上熄灯后,都会在床上练一个小时的瑜伽。
吴海灏说着,随即摆了个瑜伽的动作,将腿放到了脖子后面,让在场的人不由得惊呼起来。
这有什么,这只是瑜伽的基本动作而已。
吴海灏得意地笑了笑。
成为状元之后,不等于以后的道路就会一帆风顺。
在以后的学习和生活中还要面对许多的挑战。
但是,希望,他人的成才故事能够勉励后来者。
我的高考数学错题本第0章错题本的制作专家研究近十余年来的高考状元的学习方法时发现:绝大多数高考状元都有使用“错题本”的习惯。
“错题本”为何如此受到高考状元们的青睐?来看看一位高考状元谈自己使用“错题本”的体会:状元体会:“我在高中的时候一直坚持写‘错题本’。
每次考试结束以后,不是算算分数有没有扣错然后就收起来,而是好好分析自己错的题目,其实错题才是每次考试的价值所在。
我会认真分析自己算错的原因,是知识点没有掌握好,是粗心算错,还是方法思路有问题,把错误的原因和正确的解法都总结到本子上。
复习的时候就认真翻一翻,看一看,这些知识点就能够熟练掌握好了,最后印象最深的反而是自己错过的题目。
有了‘错题本’,我就不会在复习备考的题海中迷失方向了,复习效率大为提高。
”“错题本”是对学生自身各类错误的系统汇总,翻开它,你的各种类型的错误就非常直观的呈现在你面前,一览无遗。
这样你就可以更有针对性的着手改正错误,解决问题,尽力做到“不二过”,即同一个错误不犯第二次。
问题:错题本有用吗?凡是问“错题本有用吗”的学生,要么是从没用过错题本,要么是用过错题本,但是没有感觉出来错题本的效果。
在这里,本人可以很明确地告诉大家,错题本非常有用。
如果能够利用好错题本的话,那么自己的成绩提升是很快的。
很多学生高考复习常常没有章法,平均分配时间,大量做题的同时,不会的仍然不会,出错的地方重复出错(据调查,错题当中30-50%是重复错误,好可怕!),究其原因就是没有找准自己的失误点,没有消灭死顽固的死角,导致错误一而再再而三的发生。
错题本的好处?1.认识自己的不足通过错题集,你会发现自己还存在的一些问题,可以提醒你从这些方面努力2.能够保证自己不犯同样的错误知识可以分为两类,一类是自己已经掌握的,一类是自己还没有掌握的。
已经掌握的,这一次做题会做,下一次做题还会做;而自己没有掌握的,这一次不会做,自己整理到错题本上了,反复地看了,弄懂了,那么下一次再做的时候就会了。
第一节随机抽样复习备考资讯考纲点击(一)统计1.随机抽样(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本,了解分层抽样方法和系统抽样方法.2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据平均数和标准差的意义和作用,会计算数据平均数和标准差,知道平均数和标准差是样本数据基本的数字特征.(3)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(4)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.3.变量的相关性(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).(二)统计案例了解下列一些常见的统计方法:1.独立性检验了解独立性检验(只要2×2列联表)的基本思想、方法及其初步应用.2.回归分析了解回归分析的基本思想、方法及其简单应和.(三)算法初步与框图1. 算法的含义、程序框图(1)了解算法的含义,了解算法的思想.(2)理解程序框图的三种基本逻辑结构:顺序、条件分支、循环.2.基本算法语句了解几种基本算法语句——输入语句、输出语句、赋值语句、条件语句、循环语句的含义.3.算法案例(1)了解几个古代算法案例,能利用辗转相除法及更相减损术求最大公约数.(2)用秦九韶算法求多项式的值.(3)了解进位制,会不同进位制间的相互转化,考情分析1.随机抽样主要考查学生在应用问题中构造抽样模型、识别模型、选择适当的抽样方法抽取样本.本部分在高考试题中主要以选择题或填空题的形式出现,题目多为中僳档题,重在考查抽样方法的应用.2. 用样本估计总体以考查频率分布直方图、茎叶图、平均数、方差、标准差为主,同时考查对样本估计总体的思想的理解.本节在高考题中主要是以选择题和填空题为主,属于中低档题目,新课标地区(如广东、宁夏、海南等省份)也常以频率分布直方图为工具结合现实生活出现一道应用大题,属于中档题目.3.变量间的相关关系以考查线性回归系数为主,同时可考查利用散点图判断两个变量间的相关关系.以实际生活为背景,重在考查回归方程的求法,在高考题中本部分的命题主要是以选择、填空题为主,属于中档题目.4.统计案例对独立性检验及回归分析的考查是高考的热点,预计本部分内容在高考中出选择题、填空题,常以判断命题正误的形式出现,为中低档题.5.算法与程序框图是高考的热点,每年必考,主要考查程序框图,以选择题、填空题为主,属中档题.6.基本算法语句是算法的主体内容,是计算机能够理解的程序设计语言,是计算机编程的基础,对基本算法语句的考查常以选择题和填空题的形式出现,重在考查对算法语句的理解和应用.7.算法案例命题时常以简单的小题出现,考查典型案例所体现的算法原理,如求两数最大公约数的方法,进位制的转换等.8.流程图和结构图在高考中要求较低,新课标高考大纲考试要求是了解层次}考试重点是程序框图和工序流程图.高考中对这部分的考查主要是以选择题和填空题为主,属于中、低档题.预习设计 基础备考知识梳理1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中 抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都 就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法: 和2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.(1)先将总体的N 个个体(2)确定 ,对编号进行 ,当n N 是整数时,取⋅=nN k (3)在第1段用 确定第一个个体编号).,(k l l ≤(4)按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号 ,再加k 得到第3个个体编 号 ,依次进行下去,直到获取整个样本.3.分层抽样(1)定义:在抽样时,将总体分成 的层,然后按照 ,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围: 当总体是由 组成时,往往选用分层抽样.典题热身1.要完成下列两项调查:①从某社区125户高收人家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.其中宜采用的抽样方法依次为 ( )A .①简单随机抽样法,②系统抽样法B .①分层抽样法,②简单随机抽样法C .①系钪抽样法,②分层抽样法D .①②都用分层抽样法答案:B2.有20位同学,编号从1~20,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为 ( )20,15,10,5.A 14,10,6,2.B 8,6,4,2.C 14,11,8,5.D答案:A3.某校共有学生2000名,各年级男、女生人数如下表,已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为.C24.D.A16.B1812答案:B4.为了解1200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为答案:405.防疫站对学生进行身体健康调查,采用分层抽样法抽取。
高考状元的学神之路马上又要到高考季了,大家都知道每年高考成绩一出来,高考状元就成为各路媒体关注的对象,有的高颜值的美女状元,甚至是享受着超级明星的待待遇。
的确,在中国的教育体制当中,一旦成为高考状元,就是意味着可以上清华北大,将来的人生也似乎就顺风顺水,人人羡慕。
状元的滑铁卢但是有一个北京的高考状元李泰伯,却在当年遭遇了人生的一次“滑铁卢”,他虽然是当年以703分的成绩,夺得2010年的北京市的理科冠军,却意外的被美国11所大学拒绝,成为新闻的焦点,有的媒体甚至给他贴上了“书呆子”的标签。
不过,事情的真相到底是怎么样的呢?今天就为您一点点的揭开背后的迷雾,还原事情背后的真相。
很多人不知道的是,李泰伯其实是一个高中学习成绩就十分的优异,在著名的人大附中也是名列前茅,他所就读的班级更是学霸云集的地方,每年一超高的录取率,成为北大清华都十分青睐的对象,而李泰伯就是其中的佼佼者,后来他能成为当年状元,也正是说明了这一点。
仔细看他的履历,就可以看出,李泰伯本身就是一个金光闪闪的人。
还事在高中时期,他就是人大附中志愿者团队负责人,经常组织参加各类社会公益活动。
不仅如此,他担任过学校学生会的主席、模拟联合国主席,并且还是三次获得全国数学竞赛冠军……但是这个同学们眼中的学霸,又是如何哈佛等美国11所美国名校拒绝的呢?当年的高考结束后,作为北京市状元的他,得到了无数的赞运,但是盛极而衰,随后传出被美国11所名校拒绝的消息,更是让很多人感到十分的震惊。
在高考填报志愿之前,他分别向美国的耶鲁、哈佛、普林斯顿等大学,提交了申请,但是让人备受打击的是,李泰伯全部都被拒绝了。
一时间,李泰伯成为“高分低能”“书呆子”“应试教育”失败的典型代表,有的人甚至指出,这是中国教育失败的最后的例证。
而身处舆论漩涡的李泰伯却是有苦说不出,只能是“忍气吞声”状元的解释但是眼看各路不知内情的人,对自己的误解越来越深,李泰伯只好以博文《为自己的留美申请说两句》回应大家的质疑,在文章中他如此分析自己失败的原因:申请国外名校准备的太晚:自己在高二上学期才开始准备自己的工作,而很多同龄人,可能刚刚开始上中学就在准备了SAT分数有点低:李泰伯的STA是2240分,其实已经算是很高的了,但是要申请美国顶级名校,还是有点困难的,毕竟是要和全球的申请者竞争,还是没有什么优势的。
第四节 统计案例预习设计 基础备考知识梳理 1.回归分析在具有线性相关关系的数据),(,),,(),,(2211n n y x y x y x 中,回归方程的截距和斜率的最小二乘估计分别为=---=∑∑==ax xy y x xbini i ini ˆ,)())((ˆ211其中=x =y, 称为样本点的中心,线性回归方程为2.残差分析(1)残差:对于样本点),,(,),,(),,(2211n n y x y x y x 它们的随机误差为,,,2,1,.n i a bx y e i i i =--=其估计值为-=-=i i i y i y y e ˆˆi xie n i a b ˆ.,,2,1,ˆˆ =-称为相应于点)(i i y x 的残差. (2)残差平方和(3)相关指数,)()ˆ(1212112y y i yyR in i in---=∑∑==22121((11y n y x n x i ni i yx n yx r ni ii ni -∑-∑∑=-===2R 越大,意味着残差平方和 ,即模型的拟合效果 2R 越小,残差平方和 ,即模型的拟合效果 在线性回归模型中,2R 表示解释变量对于预报变量变化的贡献率,2R 越近接于1,表示回归的效果3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出的两个分类变量的 称为列联表.假设有两个分类变量X 和y ,它们的可能取值分别为},{21x x 和},,{21y y 其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量⋅++++-=))()()(()(22d b c a d c b a bc ad n K 其中=n 为样本容量. (3)独立性检验:利用随机变量 来判断“两个分类变量 ”的方法称为独立性检验.典题热身1.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是 ( ) A .残差 B .残差的平方和 C .随机误差 D .相关指数2R 答案:B2.对于事件A 和事件B ,通过计算得到2K 的观测值≈k ,514.4下列说法正确的是A .在犯错误的概率不超过0.01的前提下认为事件A 和事件B 有关 B .在犯错的概率不超过0.05的前提下认为事件A 和事件B 有关C .在犯错的概率不超过0. Ol 的前提下认为事件A 和事件B 无关D .在犯错误的概率不超过0.05的前提下认为事件A 和事件B 无关 答案:B3.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下,其中拟合效果最好的模型是 ( )A .模型1的相关指数2R 为O.98 B .模型2的相关指数2R 为0.80 C .模型3的相关指数2R 为0.50 D .模型4的相关指数2R 为0.25 答案:A( ))0,0.(A )8.1,2.(B )5.2,3.(c )2.3,4.(D答案:C5.(2011.莱芜模拟)在一项打鼾与患心脏病的调查中,共调 查了l 671人,经过计算2K 的观测值,63.27=k 根据这一数据分析,我们有理由认为打鼾与患心脏病是答案:有关课堂设计 方法备考题型一 线性回归分析【例1】假设关于某种设备的使用年限x(年)与所支出的维修费用y (万元)有如下统计资料:已知,3.112,8.140,9051251251===∑∑∑===i i i i i it y x y x.878.0,32,4.12,9.87905.0==-≈≈r n 时(1)求⋅y x ,(2)对x ,y 进行线性相关性检验;(3)如果x 与y 具有线性相关关系,求出线性回归方程; (4)估计使用年限为10年时,维修费用约是多少?题型二 非线性回归分析【例2】下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,题型三 独立性检验【例3】 (2011.山东模拟)在调查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,分别利用图形和独立性检验的方法来判断色盲与性别是否有关.你所得到的结论在什么范围内有效?技法巧点(1)线性回归分析以散点图为基础,具有很强的直观性,有散点图作比较时,拟合效果的好坏可由直观性直接判断,没有散点图时,只需套用公式求2,R r 再作判断即可. (2)独立性检验没有直观性,必须依靠2K 的观测值k 作判断.失误防范1.r 的大小只说明是否相关并不能说明拟合效果的好坏,2R 才是判断拟合效果好坏的依据.2.独立性检验的随机变.量706.22=K 是判断是否有关系的临界值,706.22<K 应判断为没有充分证据显示X 与y 有关系,而不能作为小于90%的量化值来判断随堂反馈1.(2009.临沂模拟)在对两个变量x ,y 进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据=i y x i i },,{;,,2,1n ③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图,如果根据可靠性要求能够作出变量x ,y 线性相关的结论,则在下列操作顺序中正确的是 ( )A .①②⑤③④ B.③②④⑤① C .②④③①⑤ D.②⑤④③① 答案:D2.已知回归方程,12ˆ+=x y而试验得到一组数据(x ,y)是(2,4.9),(3,7.1),(4,9.1),则残差平方和是 ( )01.0.A 02.0.B 03.0.C 04.0.D 答案:C3.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到下表:已知.025.0)024.5(,05.0)841.3(22≈≥≈≥K P K p根据表中数据,得到.844.430202723)7102013(5022≈⨯⨯⨯⨯-⨯⨯=K 则认为选修文科与性别有关系出错的可能性为答案:5%高效作业 技能备考一、选择题1.(2011.江西高考)变量X 与y 相对应的一组数据为,10(),2,3.11(),1),3,8.11();5,13(),4,5.12(变量U 与y 相对应的一组数据为),2,5.12(),3,8.11(),4,3.11(),5,10(1).1,13(r 表示变量y 与X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则 ( )0.12<<r r A 120.r r B << 120r r C <<⋅ 12.r r D =答案:C2.(2011.深圳模拟)甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A 、B 两变量有更强的线性相关性 ( )A .甲B .乙C .丙D .丁 答案:D3.(2011.巢湖月考)下列说法:①将一组数据中的每个数都加上或减去同一个常数后,方差不变;②设有一个回归方程,53ˆx y-=变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程.ˆˆˆa x b y+=必过点);,( ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得,079.132=K 则其两个变量间有关系的可能性是90%. 其中错误的个数是( )1.A2.B3.C4.D 答案:C4.(2011.菏泽月考)下面是2×2列联表:则表中a ,b 的值分别为( ) 答案:C5.(2011.东营模拟)若变量y 与x 之间的相关系数=r ,9362.0-查表得到相关系数临界值,8013.005.0=r 则变量y 与x 之间A .不具有线性相关关系B .具有线性相关关系C .它们的线性关系还要进一步确定D .不确定 答案:B6.(2011.湖州调研)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示.根据以上数据,则A .含杂质的高低与设备改造有关B .含杂质的高低与设备改造无关C .设备是否改造决定含杂质的高低D .以上答案都不对 答案:A7.(2011.湖南高考)通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:由))()()(()(22d b c a d c b a bc ad n K ++++-=算得,8.750605060)30203040(11022≈⨯⨯⨯⨯-⨯⨯=K 附表:参照附表,得到的正确结论是 ( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误韵概率不超过O.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过O.l%的前提下,认为“爱好该项运动与性别无关” 答案:A二、填空题8.(2011.惠州模拟)对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:试根据上述数据计算=2K (保留两位小数)比较这两种手术对病人又发作心脏病的影响有没有差别,答案:1.78不能作出这两种手术对病人又发作心脏病的影响有差别的结论9.(2011.马鞍山模拟煤高校“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到,841.3,844.430202723)7102013(50222≥≈⨯⨯⨯⨯-⨯⨯=K K 因为所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 答案:5%三、解答题10.(2010.菜芜模拟)对某校学生进行心理障碍测试得到如下表:试说明在这三种心理障碍中哪一种与性别关系最大.11.(2011.潍坊模拟)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关?并说明理由.12.某研究机构为了研究人的脚的大小(码)与身高(cm)之间的关系,随机抽测了20人,得到如下数据:(1)若“身高大于175 cm”的为“高个”,“身高小于等于175 cm”的为“非高个”;“脚长大于42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”,请根据上表数据完成如下的2×2列联表;(2)根据题(1)中表格的数据,若按99%的可靠性要求,能否认为脚的大小与身高之间有关系?。