变量间的相互关系(一)、(二)
- 格式:doc
- 大小:154.00 KB
- 文档页数:6
2.3 变量间的相关关系2.3.1 变量之间的相关关系2.3.2 两个变量的线性相关整体设计教学分析变量之间的关系是人们感兴趣的问题.教科书通过思考栏目“物理成绩与数学成绩之间的关系”,引导学生考察变量之间的关系.在教师的引导下,可使学生认识到在现实世界中存在不能用函数模型描述的变量关系,从而体会研究变量之间的相关关系的重要性.随后,通过探究人体脂肪百分比和年龄之间的关系,引入描述两个变量之间关系的线性回归方程(模型).教科书在探索用多种方法确定线性回归直线的过程中,向学生展示创造性思维的过程,帮助学生理解最小二乘法的思想.通过气温与饮料销售量的例子及随后的思考,使学生了解利用线性回归方程解决实际问题的全过程,体会线性回归方程作出的预测结果的随机性,并且可能犯的错误.进一步,教师可以利用计算机模拟和多媒体技术,直观形象地展示预测结果的随机性和规律性.三维目标1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程.知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程.重点难点教学重点:通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系;利用散点图直观认识两个变量之间的线性关系;根据给出的线性回归方程的系数公式建立线性回归方程.教学难点:变量之间相关关系的理解;作散点图和理解两个变量的正相关和负相关;理解最小二乘法的思想.课时安排2课时教学过程第1课时导入新课思路1在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系.这种说法有没有根据呢?的,物理也好;数学差的,物理也差,但又不全对.)物理成绩和数学成绩是两个变量,从经验看,由于物理学习要用到比较多的数学知识和数学方法.数学成绩的高低对物理成绩的高低是有一定影响的.但决非唯一因素,还有其他因素,如是否喜欢物理,用在物理学习上的时间等等.(总结:不能通过一个人的数学成绩是多少就准确地断定他的物理成绩能达到多少.但这两个变量是有一定关系的,它们之间是一种不确定性的关系.如何通过数学成绩的结果对物理成绩进行合理估计有非常重要的现实意义.)为很好地说明上述问题,我们开始学习变量之间的相关关系和两个变量的线性相关.(教师板书课题)思路2某地区的环境条件适合天鹅栖息繁衍,有人经统计发现了一个有趣的现象,如果村庄附近栖息的天鹅多,那么这个村庄的婴儿出生率也高,天鹅少的地方婴儿的出生率低,于是,他就得出一个结论:天鹅能够带来孩子.你认为这样得到的结论可靠吗?如何证明这个结论的可靠性?推进新课新知探究提出问题(1)粮食产量与施肥量有关系吗?“名师出高徒”可以解释为教师的水平越高,学生的水平也越高.教师的水平与学生的水平有什么关系?你能举出更多的描述生活中两个变量的相关关系的成语吗?(2)两个变量间的相关关系是什么?有几种?(3)两个变量间的相关关系的判断.讨论结果:(1)粮食产量与施肥量有关系,一般是在标准范围内,施肥越多,粮食产量越高;教师的水平与学生的水平是相关的,如水滴石穿,三人行必有我师等.我们还可以举出现实生活中存在的许多相关关系的问题.例如:商品销售收入与广告支出经费之间的关系.商品销售收入与广告支出经费有着密切的联系,但商品销售收入不仅与广告支出多少有关,还与商品质量、居民收入等因素有关.粮食产量与施肥量之间的关系.在一定范围内,施肥量越大,粮食产量就越高.但是,施肥量并不是决定粮食产量的唯一因素.因为粮食产量还要受到土壤质量、降雨量、田间管理水平等因素的影响.人体内的脂肪含量与年龄之间的关系.在一定年龄段内,随着年龄的增长,人体内的脂肪含量会增加,但人体内的脂肪含量还与饮食习惯、体育锻炼等有关,可能还与个人的先天体质有关.应当说,对于上述各种问题中的两个变量之间的相关关系,我们都可以根据自己的生活、学习经验作出相应的判断,因为“经验当中有规律”.但是,不管你的经验多么丰富,如果只凭经验办事,还是很容易出错的.因此,在分析两个变量之间的相关关系时,我们需要一些有说服力的方法.在寻找变量之间相关关系的过程中,统计同样发挥着非常重要的作用.因为上面提到的这种关系,并不像匀速直线运动中时间与路程的关系那样是完全确定的,而是带有不确定性.这就需要通过收集大量的数据(有时通过调查,有时通过实验),在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系作出判断.(2)相关关系的概念:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.两个变量之间的关系分两类:①确定性的函数关系,例如我们以前学习过的一次函数、二次函数等;②带有随机性的变量间的相关关系,例如“身高者,体重也重”,我们就说身高与体重这两个变量具有相关关系.相关关系是一种非确定性关系.如商品销售收入与广告支出经费之间的关系.(还与商品质量、居民收入、生活环境等有关)(3)两个变量间的相关关系的判断:①散点图.②根据散点图中变量的对应点的离散程度,可以准确地判断两个变量是否具有相关关系.③正相关、负相关的概念.①教学散点图出示例题:在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:图来进一步分析.②散点图的概念:将各数据在平面直角坐标系中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图,如下图.从散点图我们可以看出,年龄越大,体内脂肪含量越高.图中点的趋势表明两个变量之间确实存在一定的关系,这个图支持了我们从数据表中得出的结论.(a.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.b.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系.c.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)③正相关与负相关的概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关.(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)应用示例思路1例1 下列关系中,带有随机性相关关系的是_____________.①正方形的边长与面积之间的关系②水稻产量与施肥量之间的关系③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具备相关关系.④降雪量与交通事故的发生率之间具有相关关系,因此填②④.答案:②④例2 有关法律规定,香烟盒上必须印上“吸烟有害健康”的警示语.吸烟是否一定会引起健康问题?你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?分析:学生思考,然后讨论交流,教师及时评价.解:从已经掌握的知识来看,吸烟会损害身体的健康,但是除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果.我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题.但吸烟引起健康问题的可能性大.因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.点评:在探究研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么.本题的意义在于引导学生重视对统计结果的解释,从中发现进一步研究的问题.思路2例1 有时候,一些东西吃起来口味越好,对我们的身体越有害.下表给出了不同类型的某种食品的数据.第二列表示此种食品所含热量的百分比,第三列数据表示由一些美食家以百分制给出的对此种食品口味的评价:(2)关于两个变量之间的关系,你能得出什么结论?解:(1)散点图如下:(2)基本成正相关关系,即食品所含热量越高,口味越好.例2 案例分析:一般说来,一个人的身高越高,他的右手一拃长就越长,因此,人的身高与右手一拃长之间存在着一定的关系.为了对这个问题进行调查,我们收集了北京市某中学2003年高三年级96名学生的身高与右手一拃长的数据如下表.(1)根据上表中的数据,制成散点图.你能从散点图中发现身高与右手一拃长之间的近似关系吗?(2)如果近似成线性关系,请画出一条直线来近似地表示这种线性关系.(3)如果一个学生的身高是188 cm,你能估计他的一拃大概有多长吗?解:根据上表中的数据,制成的散点图如下.从散点图上可以发现,身高与右手一拃长之间的总体趋势是成一直线,也就是说,它们之间是线性相关的.那么,怎样确定这条直线呢?同学1:选择能反映直线变化的两个点,例如(153,16),(191,23)两点确定一条直线.同学2:在图中放上一根细绳,使得上面和下面点的个数相同或基本相同.同学3:多取几组点对,确定几条直线方程.再分别算出各个直线方程斜率、截距的算术平均值,作为所求直线的斜率、截距.同学4:从左端点开始,取两条直线,如下图.再取这两条直线的“中间位置”作一条直线.同学5:先求出相同身高同学右手一拃长的平均值,画出散点图,如下图,再画出近似的直线,使得在直线两侧的点数尽可能一样多.同学6:先将所有的点分成两部分,一部分是身高在170 cm以下的,一部分是身高在170 cm 以上的;然后,每部分的点求一个“平均点”——身高的平均值作为平均身高、右手一拃的平均值作为平均右手一拃长,即(164,19),(177,21);最后,将这两点连接成一条直线.同学7:先将所有的点按从小到大的顺序进行排列,尽可能地平均分成三等份;每部分的点按照同学3的方法求一个“平均点”,最小的点为(161.3,18.2),中间的点为(170.5,20.1),最大的点为(179.2,21.3).求出这三个点的“平均点”为(170.3,19.9).我再用直尺连接最大点与最小点,然后平行地推,画出过点(170.3,19.9)的直线.同学8:取一条直线,使得在它附近的点比较多.在这里需要强调的是,身高和右手一拃长之间没有函数关系.我们得到的直线方程,只是对其变化趋势的一个近似描述.对一个给定身高的人,人们可以用这个方程来估计这个人的右手一拃长,这是十分有意义的.知能训练一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:关于加工零件的个数与加工时间,你能得出什么结论?答案:(1)散点图如下:(2)加工零件的个数与所花费的时间呈正线性相关关系.拓展提升以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(2)指出是正相关还是负相关;(3)关于销售价格y和房屋的面积x,你能得出什么结论?解:(1)数据对应的散点图如下图所示:(2)散点图中的点散分布在从左下角到右上角的区域内,所以是正相关.(3)关于销售价格y和房屋的面积x,房屋的面积越大,价格越高,它们呈正线性相关的关系. 课堂小结通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.作业习题2.3A组3、4(1).设计感想本节课学习了变量之间的相关关系和两个变量的线性相关的部分内容,通过身边的具体实例说明了两个变量的相关关系,并学会了利用散点图及其分布来说明两个变量的相关关系的种类,为下一节课作了铺垫,思路1和思路2的例题对知识进行了巩固和加强,另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育和增强学生的自信心,养成良好的学习态度和学习方法,树立时间观,培养勤奋、刻苦耐劳的精神.备课资料数学家关肇直关肇直(1919.2.13—1982.11.12),中国科学院院士,是中国数学家,生于北京.原籍广东省南海县.父亲关葆麟早年留学德国,回国后任铁道工程师多年,于1932年故世;母亲陆绍馨,是北平女子师范大学的毕业生,曾从教于北京师范大学.关葆麟去世后,母亲以微薄的收入艰难地抚育关肇直及其弟妹多人.全国解放后,关肇直尽心亲侍慈母,直至1967年去世.关肇直于1959年1月与刘翠娥结婚,他们有两个女儿.刘翠娥系中国科学院工程物理研究所研究人员.关肇直于1927年进入北京培华中学附属小学学习.1931年入英国人办的崇德中学学习.学校对英文要求十分严格,加上关肇直自小就由父母习以英文、德文,为日后掌握英文、德文、法文、西班牙文和俄文奠定了良好基础.1936年高中毕业后考入清华大学土木工程系,后于1938年转入燕京大学数学系学习.毕业后在燕京大学(后迁成都)任教.参加成都教授联谊会,担任学生进步组织的导师,积极支持抗日救国学生运动.1946年春从成都返回北平(北京),不久从燕京大学转到北京大学数学系任教.1947年通过考试成为国民政府派遣的中法交换生赴法国留学.名义上去瑞士学哲学,实际上去了巴黎大学庞加莱研究所研究数学,导师是著名数学家、一般拓朴与泛函分析的创始人弗雷歇(M.R.F rechetl),1948年参加革命团体“中国科学工作者协会”,是该会旅法分会的创办人之一.1949年10月,新中国诞生,他毅然决定放弃获得博士学位的机会.于12月回到祖国,满腔热情地参加了新中国的建设.他立即参加了组建中国科学院的工作.他和其他同志一起,协助郭沫若院长筹划建院事宜,确定科学院的方向、任务、体制等,组建科学院图书馆,担任图书管理处处长,编译局处长.1952年参加筹建中国科学院数学研究所的工作,并在数学研究所从事数学研究,历任副研究员、研究员、研究室主任、副所长、学术委员会副主任.他还是中国科学院声学研究所学术委员会委员及原子能研究所学术委员会委员.从1952年起,兼任北京师范大学、北京大学、中国人民大学和中国科技大学等校教授以及华南工学院名誉教授;并兼任过中国科学院成都分院学术顾问、该院数理科学研究室主任、中国科学院武汉数学物理研究所顾问、研究员.他还是国家科委数学学科组副组长、自动化学科组成员;曾担任北京数学会理事长,中国数学会秘书长,国际自动控制联合会理论委员会成员及《中国科学》《科学通报》《数学学报》和《系统科学与数学》等杂志的编委或主编等职.1980年,他与其他科学家一起创建中国科学院系统科学研究所,担任研究所所长.他还担任中国自动化学会副理事长、中国系统工程学会理事长.1980年当选为中国科学院数理学部委员.关肇直长期从事泛函分析、数学物理、现代控制理论等领域的研究,成绩卓著,为我国的社会主义现代化建设作出了重大贡献,1978年获全国科学大会奖,1980年获国防科委、国工办科研奖十几项,1982年获国家自然科学二等奖;关肇直参与主持的项目《尖兵一号返回型卫星和东方红一号》获1985年国家科技进步特等奖,他本人获“科技进步”奖章.关肇直从事泛函分析、数学物理和现代控制理论研究方面,取得水平很高的成果.主要成果有以下几个方面.(一)最速下降法与单调算子思想关肇直于《数学学报》第6卷第4期(1956)发表了学术论文“解非线性函数方程的最速下降法”,第一次把梯度法(又称最速下降法)由有限维空间推广到无限维空间,而且和线性问题相仿,其收敛速度是依照等比级数的.这种方法可以用来解某些非线性积分方程以及某些非线性微分方程边值问题.并在文中首先提出了单调算子的思想,比外国学者早四五年.国外关于单调算子的概念,最早见于1960年扎朗顿尼罗和闵梯(E.H.Z afantonello,G.J.M inty)的工作.单调算子是非线性泛函分析中很基本的概念之一,单调算子理论已成为泛函分析中的一个重要分支,在处理力学、物理学中的许多非线性问题中被广泛地应用.(二)激光问题的数学理论在数学物理方面,关肇直也进行了深入的研究.他在《中国科学》第14卷第7期(1956)上用法文发表了学术论文“关于…激光理论‟中积分方程的非零本征值的存在性”在论文中他利用泛函分析工具,在很弱的假设下,用极为简短的方式证明了激光理论中一般形式的具有非对称核的线性积分方程非零本征值的存在.这一结果受到国际上的重视.被国外书刊广泛引用,如M agraw H ill图书公司1972年出版的柯克朗(J.A.C ochran)著的《线性积分方程分析》一书就曾详细地引用过.(三)中子迁移理论关肇直在数学物理方面的另一个创造,就是关于中子迁移理论的研究.1963年他用希尔伯特空间与不定规度空间的算子谱理论解决了平板几何情形的中子迁移的本征函数问题,著有“关于一类本征值问题”(当时未发表).这比国外罕日布鲁克(H angelbrook)1973年的同类工作早10年.卡帕(H.G.K aper)和兹维贝尔(P.F.Z weibel)在1975年举行的国际迁移理论第四次会议上的报告(载于期刊《T ranspost T heory and S tatistical P hysiss》V ol.4,N o.3,第105—123页,1975)中,在“迁移理论中有什么创新”标题下,把罕日布鲁克的方法称为求解方程的新方法;但是,罕氏著作中所解决的问题,在关肇直的文章中是早已解决了的.关肇直于1963年完成的这篇论文直到他去世后于1984年发表在《数学物理学报》上,国外同行当得知他在60年代就作出了如此高水平的工作时都深表惊异.(四)飞行器弹性控制理论关肇直在《中国科学》1974年第4期上发表了“弹性振动的镇定问题”,首先提出了用线性算子紧扰动理论解决飞行器弹性振动的镇定问题.在这之前,美国的著名控制论专家鲁塞尔(D.L.R ussell)曾用别的方法讨论过此类问题,但他自己认为他所得的结果“当然并非完全满意”,“增益系数的增大应能改进系统的稳定性,但这样整体性结果没有得到……”他甚至认为:显然他所用的方法“带来必须小的缺陷,……,但很怀疑这里定理所表述的结果的确切化用任何别的技术来实现.”可是,与鲁塞尔的怀疑相反,关肇直用了算子紧扰动方法技巧,此方法与鲁塞方法有本质的区别,它确实摆脱了放大系数很小的限制,得出了工程意义更合理的结果.这项成果已经应用到我国的国防尖端技术设计上,成为导弹运载火箭所必不可少的一个设计理论.(五)几本主要著作1.《泛函分析讲义》1958年高等教育出版社出版了关肇直的《泛函分析讲义》.该书吸取了当时国际上几部有名的介绍泛函分析概要的书的长处,内容适中,很具特色,便于自学.这是国内第一部包括当时泛函分析各分支的较全面的专著,国内当时这类书很少;国内除此之外,迄今也仍只有一些教科书性质的出版物,还没有别的书代替它.关肇直曾使用这部著作在1956年和1957年分别为中国科学院数学研究所一批青年同志和北京大学第一届泛函分析专门化学生讲授过《泛函分析》课程,培养了一批从事泛函分析等方面的中青年骨干教师和科研人员.此书至今仍有重大参考价值.2.《拓扑空间榻论》科学出版社于1958年出版了关肇直教授的这本书.本书是为了数学分析方面的青年数学工作者的需要而写的.目的是使读者获得关于拓扑空间理论的基础知识.本书在当时是这方面较系统的也是较早的一部专著.作者是按照自己的观点来写的,书中许多定理的证明都是作者给出的,他尽可能地遵循一般实变函数论中的叙述问题的方式,因而有自己的特色.这是为了使读者感到新知识与原有知识有联系,对新的抽象概念不至感到突然,同时又帮助读者直达科学研究的前沿.根据研究概率论方面的读者反映,对他们研究极限定理一类工作颇有帮助.3.《高等数学教程》人民教育出版社于1959年出版.本书是关肇直在中国科技大学开办应用数学专业讲授高等数学课程而编写的教材,特点是:材料比较丰富,注意理论联系实际.4.《线性泛函分析入门》上海科技出版社于1979年出版.关肇直同他的学生张恭庆、冯德兴合著.著书的目的是为了满足多方面科学研究工作者的需要,因为当时线性泛函分析已成为许多从事科学技术研究的人所渴望了解和应用的一门数学学科.此书的特点是:尽可能从一些问题提炼出泛函分析中的基本概念,让读者透过叙述方法了解到研究的过程.5.《现代控制系统理论小丛书》这是由关肇直主编的,包括线性系统理论、非线性系统理论、极值控制理论、系统辨识、最优控制与随机控制理论、分布参数系统理论及其他有关内容,共分十几分册,由科学出版社从1975年开始陆续出版.这套丛书介绍了现代控制系统理论的各个部分,并着重说明这种理论怎样由工程实践的需要而产生,又怎样用来解决工程设计中的实际问题.此丛书主要是为从事控制理论研究的科学工作者和工程技术人员而撰写的.此丛书的出版,对于促进我国的控制理论和控制技术的发展起到了很好的作用.。
(完整word)两个变量的相关关系两个变量间的相关关系变量间的相互关系有两种:一类是确定性的函数关系,如正方形的边长和面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的。
例如,学生的总成绩和他的单科成绩,一般说来“总成绩高者,单科成绩也高”,我们说总成绩和单科成绩具有相关关系。
相关关系又分为两种:(1)正相关:两个变量具有相同的变化趋势。
(2)负相关:两个变量具有相反的变化趋势。
对相关关系的理解可以从下面三个角度把握:相关关系的概念:自变量取值一定时,因变量的取值带有一定的随机性,则两个变量之间的关系叫做相关关系.对相关关系的理解应当注意以下几点:其一是相关关系与函数关系不同.因为函数关系是一种非常确定的关系,而相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系。
因此,不能把相关关系等同于函数关系.相关关系与函数关系的异同点为:相同点:均是指两个变量的关系.不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系。
函数关系是自变量与函数值之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.其二是函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系。
然而,学会新词并不能使脚变大,而是涉及到第三个因素——年龄。
当儿童长大一些,他们的阅读能力会提高而且由于长大脚也变大.其三是在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用.变量之间的相关关系带有不确定性,这需要通过收集大量的数据,对数据进行统计分析,发现规律,才能作出科学的判断。
我们再来认识生活中的确定两个变量间的相关关系的两个例子:【例1】“名师出高徒”可以解释为教师的水平越高,学生的水平也越高。
数据分析答案梅长林【篇一:1.1一维数据数字特征】013学年第一学期主讲教师李晓燕课程名称数据分析课程类别专业限选课学时及学分 68;4授课班级信息101 102使用教材《数据分析方法》系(院.部) 数理系教研室(实验室) 信息和计算科学教研室数据分析总学时:68 理论38.上机28 适用专业:信息和计算科学内容:? sas软件介绍 3学时 ? 数据的描述性分析10学时 ? 线性回归分析 13学时 ? 方差分析 10学时 ? 主成分分析和典型相关分析8学时? 判别分析 8学时 ? 聚类分析 8学时 ? 学生报告 8学时教材:《数据分析方法》,梅长林、范金城编,高等教育出版社.2006. 参考资料:《实用统计方法》,梅长林编,科学出版社;《使用多元统计分析》,高惠璇编,北京大学出版社,2005;《使用统计方法和sas系统》,高惠璇编,北京大学出版社,2001;《多元统计分析》(二版),何晓群编,中国人民大学出版社,2008;《使用回归分析》(二版),何晓群编,中国人民大学出版社,2007;《统计建模和r软件》,薛毅编著,清华大学出版社,2007. 考核:期末成绩(闭卷测试+上机测试):70%。
平时成绩(平时作业+考勤+大报告):30%。
课程作业(1)作业题目在网络教学平台公布,按格式要求,以电子版方式通过平台提交。
(2)大报告:2-3人一组,每组一个选题,成员按相同的成绩计分。
收集数据,撰写小论文,做ppt讲解。
每组讲10-20分钟,提问环节。
同学打分。
课时授课计划课次序号: 01一、课题:1.1 一维数据的数字特征及相关系数二、课型:新授课三、目的要求:1.掌握数据的数字特征(均值、方差等);2.掌握几种描述性分析的sas过程和作图过程计算这些数字特征及进行描述性分析.四、教学重点:均值、方差等数字特征.教学难点:基本概念的理解.五、教学方法及手段:传统教学和上机实验相结合.六、参考资料:1.《实用统计方法》,梅长林,周家良编,科学出版社;2.《sas统计分析使用》,董大钧主编,电子工业出版社.七、作业:1.1八、授课记录:九、授课效果分析:0 绪论0.1 课程内涵数据分析(即多元统计学statistics):是以数据为依据,以统计方法为理论、计算机及软为工具,研究多变量问题、挖掘数据的统计规律的学科. 通过收集数据、整理数据、分析数据和由数据得出结论的一组概念、原则和方法。
变量之间的关系知识梳理1.概念变量:在某一变化过程中,数值发生变化的量是变量。
自变量、因变量:一般地,在一个变化过程中,如果有两个变量x和y,其中y随x 的变化而变化,我们就说x是自变量,y是因变量。
常量:在某一个变化过程中,数值始终保持不变的量是常量。
表格法:借助表格,可以表示因变量随自变量的变化而变化的情况。
表格法的基本特征是:表示两个变量之间的表格,一般第一栏表示自变量,第二栏表示因变量,从表格中可以发现因变量随自变量变化而存在一定的变化规律,从而可以利用变化趋势对结果作出预测。
关系式法:利用等式表示两个变量之间的关系。
关系式的基本特征是:(1)等式的左边是因变量,等式的右边是关于自变量的代数式;(2)等式中只含有自变量和因变量两个变量,其他的量都是常数;(3)自变量可在允许的范围内任意取值。
图像:将一个变量随着另一个变量的变化而变化的情况绘制成一条曲线,这条曲线称为两个变量之间关系的图像。
图像法:用图像来表示一个变量与另一个变量之间关系的方法,叫做图像法。
例题精讲考点1.变量、自变量、因变量、常量例1.甲、乙两城市相距300千米,在甲城市有一列火车以每小时100千米的速度向乙城市行驶,t 小时后火车与乙城市的距离为y 千米,在这个问题中, 是常量, 是自变量, 是因变量。
变式1.下列各题中,哪些量在发生变化?其中的自变量与因变量各是什么?(1)用总长为60m 的篱笆围城一个边长为l (m)、面积为S (㎡)的矩形场地; (2)正方形边长是3,若边长增加x ,则面积增加y 。
变式2.小明帮妈妈预算家庭4月份电费的开支情况,下表是小明家4月处连续8天每天早上电表显示的读数。
(1)表格中反映的变量是 ,自变量是 ,因变量是 。
(2)估计小明家4月份(按30天计)用电量是 ,若每度电0.55元,估计他家4月份应交电费 元。
考点2.表格法表示变量之间的关系例2.下表是一次秋汛期某河流在一天内涨水情况,警戒水位是25米。
关系式表示的变量间关系总结
用关系式表示的变量间关系,一种是表格法,另一种是关系式法。
什么是表格法
表格法是根据测试的目的和要求,将测量数据制成表格,然后再进行其他的处理的方法。
表格法显示了各变量间的对应关系,反映出变量之间的变化规律,是进一步处理数据的基础。
表格法具有简单、方便、易于参考比较和发现问题等优点。
但要进行深入的分析,表格法就不适宜了,因为表格法的缺点是不直观,不易看出数据变化的趋势。
变量之间的关系是相关关系。
相关关系是客观现象存在的一种非确定的相互依存关系,即自变量的每一个取值,因变量由于受随机因素影响,与其所对应的数值是非确定性的。
相关分析中的自变量和因变量没有严格的区别,可以互换。
变量相关关系:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。
变量间的这种相互关系,称为具有不确定性的相关关系。
2.3变量间的相互关系(一)、(二)问题提出1. 函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系.2. 在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?3. 这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.知识探究(一):变量之间的相关关系思考1:考察下列问题中两个变量之间的关系,想一想这些问题中两个变量之间的关系是函数关系吗?(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.思考4:函数关系与相关关系之间的区别与联系.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.函数关系是一种因果关系而相关关系不一定是因果关系,也可能是伴随关系.3. 函数关系与相关关系之间有着密切联系,在一定条件下可以互相转化.例1 在下列两个变量的关系中,哪些是相关关系?①正方形边长与面积之间的关系;②作文水平与课外阅读量之间的关系;③人的身高与年龄之间的关系;④降雪量与交通事故的发生率之间的关系.练习 1.已知下列变量,它们之间的关系是函数关系的有①,是相关关系的有②③.①已知二次函数y=ax2+bx+c,其中a、c是已知常数,取b为自变量,因变量是这个函数的判别式△=b2-4ac;②光照时间和果树亩产量;③每亩施用肥料量和粮食产量.知识探究(二):散点图【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.思考1:观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?思考2:以x 轴表示年龄,y 轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?思考3:上图叫做散点图,你能描述一下散点图的含义吗?在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.思考4:观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?思考5:在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?思考6:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域思考7:你能列举一些生活中的变量成正相关或负相关的实例吗?例2 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.50494541392723年龄28.226.327.525.921.217.89.5脂肪61605857565453年龄34.635.233.530.831.430.229.6脂肪18.421.615.312.2115房屋面积2229.224.8销售价格(万元)105135801107061m 2练习2. 今有一组试验数据如下表所示:现准备用下列函数中的一个近似地表示这些数据满足的规律,其中最接近的一个是( C )A. y =log 2xB. y =2xC. y =(x 2-1)/2D. y =2x -2问题提出1. 两个变量之间的相关关系的含义如何?成正相关和负相关的两个相关变量的散点图分别有什么特点?自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系. 正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域2. 观察人体的脂肪含量百分比和年龄的样本数据的散点图,这两个相关变量成正相关.我们需要进一步考虑的问题是,当人的年龄增加时,体内脂肪含量到底是以什么方式增加呢?对此,我们从理论上作些研究.知识探究(三):回归直线思考1:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?思考2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点? 这些点大致分布在一条直线附近.思考3:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?思考4:在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线?知识探究(四):回归方程在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具1.51.9918.01127.54.04y 6.125.14.03.0x(,)x y有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.思考1:回归直线与散点图中各点的位置应具有怎样的关系? 整体上最接近思考2:对于求回归直线方程,你有哪些想法?思考3:对一组具有线性相关关系的样本数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),设其回归方程为a bx y +=∧可以用哪些数量关系来刻画各样本点与回归直线的接近程度?.)(||2a bx y y y y y i i i i i i +=--∧∧∧其中,或可以用思考4:为了从整体上反映n 个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?思考5:根据有关数学原理分析,当 时,总体偏差 为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.回归方程中,a ,b 的几何意义分别是什么?思考6:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为多少? 20.9%练习 3.F 表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的 (1)请画出上表数据的散点图;(2)请根据上表提供的数据,崩最小二乘法求出Y 关于x 的线性回归方程Y=bx+a ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性21ˆ()ni i i Q y y==-∑2221122()()()n n y bx a y bx a y bx a =--+--++--21ˆ()n i i i Q y y==-∑1122211()(),()n n i i i i i i n n i i i i x x y y x y nx y b a y bx x x x nx ====---===---∑∑∑∑48.0577.0-=x y同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解:(1)如图(2)由对照数据,计算得:4166.5i ii X Y ==∑ 4222221345686ii X==+++=∑ 4.5X =266.54 4.5 3.566.563ˆ0.7864 4.58681b -⨯⨯-===-⨯- ; ˆˆ 3.50.7 4.50.35a Y bX =-=-⨯= 所求的回归方程为 0.70.35y x =+(3) 100x =, 1000.70.3570.35y =⨯+=吨,预测生产100吨甲产品的生产能耗比技改前降低9070.3519.65-=(吨)课堂小结1. 求样本数据的线性回归方程,可按下列步骤进行: 第一步,计算平均数;,y x第二步,求和;,∑∑==ni i ni i i x y x 121第三步,计算;)())((1221121x b y a xn x yx n yx x x y y x xb n i i ni ii ni i ni i i-=--=---=∑∑∑∑====,第四步,写出回归方程 .a bx y +=∧2. 回归方程被样本数据惟一确定,各样本点大致分布在回归直线附近.对同一个总体,不同的样本数据对应不同的回归直线,所以回归直线也具有随机性.3. 对于任意一组样本数据,利用上述公式都可以求得“回归方程”,如果这组数据不具有线性相关关系,即不存在回归直线,那么所得的“回归方程”是没有实际意义的.因此,对一组样本数据,应先作散点图,在具有线性相关关系的前提下再求回归方程.课后作业《习案》作业:二十三. 、二十四.。