研究生数理统计课程设计(大作业)
- 格式:doc
- 大小:318.00 KB
- 文档页数:8
数理统计学大作业学院航空航天工程学部专业飞行器设计班级航宇二班学号142103130228 姓名张立指导教师姜永负责教师沈阳航空航天大学2014年12月目录 (2)前言 (3)一、采集样本数据整理及SPSS统计软件的实现 (4)1.1、数据的收集方法及说明 (4)1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4)1.3、画出直方图和折线图 (6)1.4、经验分布函数和图形 (6)1.5、各种概率分布 (7)二、给出总体分布的参数估计 (12)2.1、矩估计法 (12)2.2、最大似然估计 (12)2.3、参数区间估计 (13)三、参数的假设检验 (16)3.1. 样本统计数据的t检验 (16)3.2样本统计数据的2χ检验 (17)四、非参数假设检验(2χ拟合优度检验) (18)4.1、2χ拟合优度检验 (18)五、结论 (20)参考文献 (21)数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。
随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。
由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。
了解数理统计能解决那些实际问题。
对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。
例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。
这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。
数理统计课程设计一、课程目标知识目标:1. 理解并掌握数理统计的基本概念,如平均数、中位数、众数、方差等;2. 学会运用数理统计方法分析、处理实际问题,并能正确解释统计结果;3. 掌握频数分布表、频数分布直方图、饼图等统计图表的制作方法和应用。
技能目标:1. 能够运用所学数理统计方法对数据进行整理、分析和解释,提高数据处理能力;2. 能够运用信息技术手段(如Excel、SPSS等)进行数理统计计算和图表绘制;3. 能够独立完成实际问题的数理统计研究,形成书面报告。
情感态度价值观目标:1. 培养学生对数理统计的兴趣,激发学生学习数学的热情;2. 培养学生的团队协作精神,提高合作解决问题的能力;3. 增强学生的数据分析意识,培养学生的实证思维,使其能够以数据为依据进行科学决策。
分析课程性质、学生特点和教学要求:1. 课程性质:本课程为数理统计,属于应用数学领域,具有较强的实用性和操作性;2. 学生特点:学生处于高年级阶段,已具备一定的数学基础和数据分析能力;3. 教学要求:注重理论与实践相结合,培养学生解决实际问题的能力。
二、教学内容1. 数理统计基本概念:平均数、中位数、众数、方差、标准差;2. 数据的收集与整理:问卷调查、实验数据、观测数据等;3. 频数分布表与频数分布直方图:制作方法及应用;4. 统计量度与统计图表:饼图、条形图、折线图等;5. 概率与概率分布:概率的基本性质、随机变量、概率分布;6. 统计推断:估计理论、假设检验、置信区间;7. 相关分析与回归分析:线性相关、线性回归、非线性回归;8. 数理统计在实际问题中的应用:案例分析、数据处理、报告撰写。
教学大纲安排:第一周:数理统计基本概念;第二周:数据的收集与整理;第三周:频数分布表与频数分布直方图;第四周:统计量度与统计图表;第五周:概率与概率分布;第六周:统计推断;第七周:相关分析与回归分析;第八周:数理统计在实际问题中的应用。
北京市农业经济总产值的逐步回归分析姓名:学号:摘要:农业生产和农村经济是国民经济的基础,影响农村经济总产值的因素有多种,主要包括农林牧渔业。
本文以北京市农业生产和农村经济总产值为对象,首先分析了各种因素的线性相关性,建立回归模型,再利用逐步回归法进行回归分析,得到最符合实际情况的回归模型。
以SPSS 17.0为分析工具,给出了实验结果,并用预测值验证了结论的正确性。
关键词:农业生产和农村经济,线性回归模型,逐步回归分析,SPSS1.引言农林牧渔业统计范围包括辖区内全部农林牧渔业生产单位、非农行业单位附属的农林牧渔业生产活动单位以及农户的农业生产活动。
军委系统的农林牧渔业生产(除军马外)也应包括在内,但不包括农业科学试验机构进行的农业生产。
在近几年中国经济快速增长的带动下,各地区农林牧渔业也得到了突飞猛进的发展。
以北京地区为例,2005年的农业总产值为1993年的6倍。
因此用统计方法研究分析农业总产值对指导国民经济生产,合理有效的进行产业布局,提高生产力等有着重要意义。
表1 北京市农业经济产值及各产品产量统计数据本文以北京市农生产为对象,分析了农业经济总产值与粮食产量、棉花产量、油料产量、蔬菜产量、干鲜果品产量、猪牛羊肉产量、禽蛋产量、水产品产量的关系,并建立农业经济总产值的回归模型。
表1中列出了1999年至2008年间的统计数据(数据来源于北京统计信息网)。
2.线性回归模型的建立2.1 线性回归模型的假设为了研究农业经济总产值与各种农生产量的关系,必须要建立二者之间的数学模型。
数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。
而实际生活中,影响农业经济总产值的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立农业经济总产值的数学模型往往是很难的。
但是为了便于研究,我们可以先假定一些前提条件,然后在这些条件下得到简化后的近似模型。
以下我们假定两个前提条件:1) 农产品的价格是不变的。
大作业要求前言 ............................................................ 页码一、采集样本、数据整理及SPSS 统计软件的实现 ..................... 页码 0、掌握采集样本及数据整理的方法;1、学会SPSS 统计软件安装与启动;2、利用SPSS 建立数据文件、并利用数据库导入数据;3、利用SPSS 对数据进行合并与拆分;4、利用SPSS 对数据进行描述性统计分析:给出频数、频率分布表及偏度和峰度,并画出直方图和折线图;5、写出经验分布函数并利用SPSS 画出图形;6、查找藏于文著里的已知的各种概率分布(力求全),并描述其背景,给出 其期望和方差,利用SPSS 或其他软件画出密度函数的图形;注:SPSS 软件版本为SPSS19.0 (中文版或英文版均可),从百度可以下载.二、给出总体分布的参数估计(用SPSS 软件完成) .............................................. 页码1、矩估计;2、最大似然估计;3、若总体是未知分布,应探求其参数的点估计,并写出方案;4、参数区间估计(假设总体是正态分布); .......................... 页码1)、方差2σ未知,求数学期望μ的置信区间; ........................ 页码2)、数学期望μ,2σ均未知,求方差2σ的置信区间; ......................................... 页码 (要求有步骤,有计算结果)三、 参数的假设检验(用SPSS 完成) .............................. 页码1、 样本统计数据的t 检验........................................ 页码2、 样本统计数据的-2χ检验...................................................................................... 页码 注:可先假设总体是正态情况讨论,总体若不是正态的要给出探求方案四、非参数假设检验(2χ拟合优度检验)(用SPSS 完成) .............. 页码1、2χ拟合优度检验2、当上述检验被接受或被拒绝时,请结合实际问题给出说明五、结论 ........................................................ 页码总结、评述和体会参考文献 ..........................................................................................................................................要求:1、大作业内容按上述过程要求完成,不得缺漏;2、由本人认真独立完成,不得抄袭他人;3、样本数据限在本专业范围内寻找,样本容量原则上100个以上;4、大作业格式应参考本科毕业设计格式(如,页面设置,字号小四,插图等)5、字数要求为A4纸20页左右;6、结束课程后一周内提交,上交纸质版和电子版两种;7、大作业成绩占期末总成绩30% 。
一、问题提出和问题分析今天的重庆,肩负着中央赋予的历史重任——着力打造西部地区的重要增长极、长江上游地区的经济中心、成为统筹城乡发展的试验者、在西部地区率先实现全面建设小康社会的目标。
2010年初,又一重要规划将重庆发展提升到国家战略——重庆被确定为国家五大中心城市之一,是中西部地区唯一入选的城市。
这说明,重庆未来的发展不可限量。
自1997年直辖以来,重庆市的经济社会发展极为迅猛。
全市的GDP由1997年的1360.24亿元增长至2010年的7894.2亿元,而整个社会的发展进步也有目共睹。
在重庆过去、现在和未来的发展进程中,在重庆的各种发展规划的要求下,建设必将成为山城的另一个符号。
过去十多年中的大规模、大范围的建设成就了现在的重庆,而重庆未来的发展将需要更多的建设。
作为重庆建设中最重要的一环,建筑业在重庆显然有着重要的地位。
建筑业这种专门从事土木工程、房屋建设和设备安装以及工程勘察设计工作的生产部门,为重庆的发展建设提供着众多的基础设施,满足着居住、工业、商业、办公等各种城市需求。
数据显示,在过去的数年中,重庆市建筑业的总产值占全市GDP的7%-8%,是名副其实的支柱产业。
因此建筑业的发展情况,可以从侧面反映出整个重庆社会经济的发展情况,对重庆建筑业的研究就有了很大的现实意义。
建筑企业是建筑业的主体。
众多的建筑企业的良好发展构成了建筑业的良好发展。
对于建筑企业来说,要实现企业的良好经营和发展,必须要有良好的收入来支撑。
在建筑企业收入的众多影响因素中,企业的劳动生产率无疑是值得关注的一个。
企业都在致力于提高自身的劳动生产效率,而不断提高的劳动生产率,可使得企业的生产经营行为更具效率,因而获得更多的收入,实现更好的发展。
所以,研究重庆市建筑企业劳动生产率与企业收入的关系,可从一个角度来了解重庆市建筑企业的发展情况,从而了解到了重庆建筑业的发展以至于重庆市的经济发展情况。
为了找出二者之间的关系或者规律性,本文采用2001-2010这十年中重庆建筑企业劳动生产率和企业平均收入的数据,通过数学分析,找出二者关系。
北航数理统计大作业(逐步回归)(总14页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--应用数理统计第一次大作业学号:姓名:班级: B11班2015年12月民航客运量的多元线性回归分析摘要:本文为建立以民航客运量为因变量的多元线性回归模型,选取了1996年至2013年的统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人数,城镇居民可支配收入等因素,利用统计软件SPSS对各因素进行了筛选分析,采用逐步回归法得到最优多元线性回归模型,并对模型的回归显著性、拟合度以及随机误差的正态性进行了检验,并采用2014年的数据进行检验,得到的结果达到预期,证明该模型建立是较为成功的。
关键词:多元线性回归,逐步回归法,民航客运量0.符号说明1铁路客运量X2民航航线里程X3入境过夜旅游人数X4城镇居民人均可支配收入X51.引言随着社会的进步,人民生活水平的提高,如何获得更快捷方便的交通成为人们日益关注的问题。
因为航空的安全性,快速且价格水平越来越倾向大众,越来越多的人们选择航空这种交通方式。
近年来,我国的航空客运量已经进入世界前列,为掌握航空客运的动态,合理安排班机数量。
科学地对我国民航客运量的影响因素的分析,并得出其回归方程,进而能够估计航空客运量是非常有必要的。
本文收集整理了与我国航空客运量相关的历年数据,运用SPSS软件对数据进行分析,研究1996年起至2013年我国民航客运量y(万人)与国民生产总值X1(亿元)、铁路客运量X2(万人)、民航航线里程X3(万公里)、入境过夜旅游人数X4(万人)、城镇居民人均可支配收入X5(元)的关系。
采用逐步回归法建立线性模型,选出较优的线性回归模型。
2.数据的统计与分析本文在进行统计时,查阅《中国统计摘要》,《中国统计年鉴2014》以及中国知网数据查询中的数据,收集了1996年至2013年各个自变量因素的数据,分析它们之间的联系。
For personal use only in study and research; not for commercial use————————————————————————————————概率论与数理统计大作业For personal use only in study and research; not for commercial usexxxxxxxxxxxxxxxxxxxxxxxFor personal use only in study and research; not for commercial useFor personal use only in study and research; not for commercial useFor personal use only in study and research; not for commercial useFor personal use only in study and research; not for commercial useFor personal use only in study and research; not for commercial useFor personal use only in study and research; not for commercial use2012年12月8日概率论与数理统计一点小结1.简介:概率论(probability theory):研究随机现象数量规律的数学分支。
随机现象是相对于决定性现象而言的。
在一定条件下必然发生某一结果的现象称为决定性现象。
例如在标准大气压下,纯水加热到100℃时水必然会沸腾等。
随机现象则是指在基本条件不变的情况下,一系列试验或观察会得到不同结果的现象。
每一次试验或观察前,不能肯定会出现哪种结果,呈现出偶然性。
例如,掷一硬币,可能出现正面或反面,在同一工艺条件下生产出的灯泡,其寿命长短参差不齐等等。
重庆大学硕士研究生“数理统计”课外作业学生:学号:201510****专业:动力工程专业重庆大学动力工程学院二O一五年十二月学号201510******* 姓名**** 学院****学院专业****专业成绩一元线性回归分析在风力发电中的应用摘要:能源短缺和环境恶化日益严重,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,风力发电的装机容量也越来越大。
风力机是风力发电机组重要的组成部分,实现风能向机械能的转化,机械能再通过直流发电机转发为电能,其中直流发电机输出的直流电压和风速紧密相关。
本文以课题研究中测得的实验数据为基础,对风力发电直流电输出和风速的线性相关关系进行计算分析,运用数理统计中一元线性回归分析及假设检验的相关知识,采用EXCEL软件进行辅助计算,最终得到了风力发电的直流电输出和风速的线性关系显著,对以后的课题研究具有一定的借鉴作用。
1 问题提出与分析在能源短缺和环境趋向恶化的今天,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,也越来越多地被应用到风力发电中。
风力机和发电机是风力发电机组中将风能转化为电能的重要装置,它们不仅直接关系到输出电能的质量和效率,也影响着整电量输出和风速的相关性。
风力机是风力发电机组重要的组成部分,其实现了风动能到风轮机轴机械能的转化,机械能通过直流电动机转发为电能,其中直流电动机产生的直流电压和风力紧密相关。
风力发电的设计和评价和电量输出与风速的关系密不可分,其中对于数学知识要求很高。
本文以课题研究中实验测得的数据为基础,对风力发电直流电输出和风速是否存在线性关系进行分析,运用数理统计中一元线性回归及非参数检验的相关知识,结合EXCEL软件进行辅助计算分析,最终得到了风力发电的直流电输出和风速关系,为以后科研工作和风力发电的应用具有指导意义。
综上所述,对风力发电的直流电输出和风速的研究,具有理论与实践的重要意义。
2 数据描述本文以风力发电的直流输出和风速的关系为研究对象,采用实验中观察得出的直流电输出和风速的部分数值进行计算分析,风力发电的直流电输出y(单位:MW)和风速x(单位:nmile/h)的数据如表1所示。
数理统计大作业一、100个男同学身高样本统计分析本例通过对100个男同学的身高测量,得到了男同学身高的统计样本,身高样本从小到大排列如下表所示:表1. 身高样本表1、身高样本直方图的绘制把身高区段分成了10段,每段所含的人数进行列表如下:表2. 身高样本分段表根据上表画出容量为100的身高样本直方图如下图所示:图1. 身高样本直方图由身高样本分布直方图可以看出,身高分布大致呈正态分布,以下将给出证明。
2、箱型图的绘制由100个男同学的身高统计样本可以得到,样本中位数为cm 45.1752/)5.1754.175(=+样本第第一四分位数为172.83cm 172.8)/4-(172.972.81=+ 样本第三四分位数为178.35cm 3/4178.2)-(178.478.21=⨯+ 根据以上数据画样本分布箱型图为:图2. 身高样本箱型图由箱型图可以看出,样本基本相对于中位数对称,分布范围处于165-185之间,没有离群点,符合正态分布的特征。
二、利用2χ拟合优度检验法检验样本的分布函数根据样本直方图和箱型图,试猜想总体分布符合正态分布,设样本身高为X ,则),(2σμN X -,则要检验假设⎪⎪⎭⎫⎝⎛--=2202)(exp 21)(:σμσπx X P H 150160170180190155165175185身高(cm )μ的最大似然估计为45.175=X ,2σ的最大似然估计为98.15)(100121001*2=-=∑=X X Mii上面已经把抽样得到的容量为100的样本分为10个互不相容的区间,由于2χ拟合优度检验法要求每个互不相容的事件至少有4-6个事件所以分为8个事件如下表表3.其中每个事件的概率i P 可根据标准正态分布的计算结果查表取得,样本频率即每个区间的样本数除以样本总数100得到。
则检验统计量392.1ˆ)ˆ(ˆ122=-=∑=mi i i i p n p n νχ,由于)218(ˆ22---χχ即)5(ˆ22χχ-,若05.0=α,则75.16)5(205.0=χ,由于75.16392.1<,故接受⎪⎪⎭⎫⎝⎛--=2202)(exp 21)(:σμσπx X P H即样本服从正态分布。
研究生“应用数理统计”课程课外作业学号 XXXXXXX 姓名 XXX 学院 XXXXXX年级专业 XXXXX成绩初试成绩分布的假设检验摘要:数理统计学是一门应用性很强的学科,其方法被广泛应用于现实社会的信息、经济、工程等各个领域,学习和应用数理统计方法已成为当今技术领域里的一种时尚,面对信息时代,为了处理大量的数据以及从中得出有助于决策的量化理论,必须掌握不断更新的数理统计知识,为今后的研究和应用提供新的思路和有效解决方法。
本报告主要应用数理统计的其中一种方法-假设检验,对报考重庆大学2012年机械工程学院工业工程专业的70名学生的初试成绩进行假设检验,首先假设70名学生的初试成绩服从正态分布,然后建立模型,进行模型分析并代入初始数据求解,然后进行检验,通过检验发现报考重庆大学2012年机械工程学院工业工程专业的70名学生的初试成绩服从正态分布。
关键字:假设检验初试成绩正态分布一、问题提出,问题分析。
我是2012年考入重庆大学机械工程学院工业工程专业的一名学生,进入学校几个月来,在选课时,我选了数理统计这门课,刚刚学习了假设检验,其中,书上有一道例题:检验某高校60名学生的英语成绩是否服从正态分布,检验结果是服从正态分布。
这使我想起了我当初参加的研究生考试,我发现我们的考试成绩分布在355-395之间的比较多,小于355或大于395的比较少,那么,我们参加复试的70名考生的初试成绩是否也服从正态分布呢?于是,我根据自己学到的数理统计知识进行了假设检验。
二、数据描述(用表格表达数据信息,指出数据来源或提供原始数据)幸运的是:当初公布复试结果时,我用手机把复试结果照了下来,照片上可以看出我们70名考生的初试成绩,现将其整理如下(原件请见附录):表(2.1.1)重庆大学2012年机械工程学院工业工程专业初试成绩表404 407 415 402 389 387 390 391 388 393 405 378 381 381 369 392 359 362 403 385 381 388 365 358 366 354 368 368 373 349 379 360 360 391 351 367 348 362 372 348 347 340 360 354 349 345 352 353 342 360 351 342 341 340 384 371 324 340 374 340 341 335 335 339 334 317 374 380 359 356三、模型建立:(1)提出假设条件,明确概念,引进参数;设总体X的分布函数为F(x),但未知。
人均GDP 与民用小型载客汽车拥有量的线性回归分析
摘 要:随着生产力的不断提高,人们的物质生活水平不断改善,与此同时,汽车的拥有量也不断提高。
本文研究人均GDP 与汽车拥有量之间是否有显著线性关系。
分析两者的关系有助于增加对社会的认识和政策的制定。
在人均GDP 与汽车拥有量之间的线性方程中,采用一元线性回归分析的分析方法,同时对MATLAB 在线性回归分析中的应用进行了初步的探讨。
分别介绍了常规计算法与用MATLAB 计算法进行回归分析的方法与步骤,并对模型进行了显著性检验,试验结果表明两者之间具有显著的线性相关关系。
关键字:人均GDP 汽车拥有量 一元线性回归分析 常规计算法 MATLAB 一、 数据描述
表1.1 重庆人均GDP 与民用小型载客汽车拥有量
以上数据来源于是中国统计局网以及重庆市统计局网的《重庆统计年鉴》、《中国区域经济统计年鉴》,真实可靠。
二、 模型建立
2.1 提出假设条件,明确概念,引进参数
回归函数()(|)y f x E Y X x ===是线性函数的回归分析称为线性回归,当可控制变量只有一个时,即回归函数为01()y f x x ββ==+,则
012
~(0,)
Y x N ββε
εσ=++
称为一元线性回归模型,上式称为Y 对x 的一元线性回归方程或者一元线性回归直线,0β、1β称为回归系数,常数0β、1β、2σ均未知。
2.2 模型构建
由于总体回归方程01()y f x x ββ==+中的参数0β、1β在实际中并不知道,
需要通过样本值对它们进行估计,得到估计值0ˆβ,1ˆβ,从而得到样本回归方程01
ˆˆY x ββ=+,此样本方程可用作总体回归方程()(|)y f x E Y X x ===的估计。
通常可用最小二乘法估计得到公式
1
1
2
1
01
()()
ˆ()
ˆˆn
i
i
i n
i
i x x y y x x y x βββ==--=-=-∑∑ 其中11n i i x x n ==∑,1
1n
i i y y n ==∑
2.3 模型求解与模型检验 2.
3.1模型求解
(1)设不同的人均GDP(千元)为X ,对应的民用小型载客汽车拥有量(万辆)为Y 。
做出人均GDP 与民用小型载客汽车拥有量的散点图,如图所示。
图2.1 不同人均GDP与民用小型载客汽车拥有量的散点图
该图形显示不同人均GDP与民用小型载客汽车拥有量存在线性相关系。
(2)显示不同人均GDP与民用小型载客汽车拥有量
由表得 x = 15.41,
y =33.44,
8
1
8xy i i i l x y x y ==-⋅∑= 1001.64
8
2
21
8xx i i l x x ==-∑=439.26
8
2
2
1
8yy i
i l y y ==-∑= 2976.08
1xy
xx l l β∧
=
=2.93
01y x ββ∧
∧
=-=-11.91
222
2
1E T R yy xx S S S l l
β∧=-=-=
3000.05
σ∧
=
=22.36
所以,吸光人均GDP 与民用小型载客汽车拥有量的样本回归直线方程是
Y=-11.91+2.93x 2.3.2 模型检验原理
由1xy xx l β∧=,01y x ββ∧∧
=-可知,不管Y 与X 是否有线性相关关系,只要给定一组不完全相同的数据就能得到一条样本回归直线。
显然,如果Y 与X 之间的不存在线性相关关系,那么寻求回归直线就失去了实际意义。
因此,使用样本回归直线前需要对Y 与X 之间的线性关系、样本回归直线拟合效果进行检验。
从线性回归模型可见,若1β越大,Y 随X 的变化的趋势就越明显;反之,若1β越小,Y 随X 的变化就越不明显。
特别是,当10β=时,则表明无论X 如何变化Y 的值都不受影响,因而Y 与X 之间不存在线性相关关系。
当10β≠时,则认为Y 与X 之间有线性相关关系。
三、 计算方法涉及和计算机实现
3.1 用MATLAB 实现
MATLAB 是由英文Matrix Laboratory (矩阵实验室)的缩写组成,它是由美国
Math Works 公司推出的用于数值计算和图形处理的科学计算系统环境。
MATLAB
软件具有强大的数学运算能力、方便使用的绘图功能及语言的高度集成性,因此它已经成为国际上科学与工程计算类最流行的工具软件之一。
输入源代码1,运行界面如下:
得到了人均GDP与民用小型载客汽车拥有量的散点图如下:
图4.1 不同人均GDP与民用小型载客汽车拥有量的散点图通过输入源代码2,运行界面如下:
从而得到线性回归直线:Y=-11.93+2.94x 主要的结论
比较上述两种方法可以看出,用第一种方法计算时只适量于样本数较小而且数据较简单的情况,若牵涉到较复杂的类型时,采用MATLAB 求解要简单得多,且能很快画出相应的拟合曲线,但由于目前MATLAB 在高校中还没有普及且对硬件设施的要求较高,所以也仍存在它的局限性。
四、 四 结果分析与检验
4.1 结果分析.
人均GDP 与汽车拥有量有线性相关性。
4.2 检验
取显著水平α=0.05
原假设01:0H β=, 备择假设:11:0H β≠用F 检验法: 因为
()2
11,n 2xx
F c l ασ∧
--=
=
()
2
0.951,6xx
F l σ∧=2.59
拒绝域为K 0:{β12 >c} 而β12=8.64>2.59
应拒绝0H ,也就认为人均GDP 与汽车拥有量显著的线性相关关系。
参考文献
[1] 孙莉.一元线性回归分析在实验数据处理中的应用.2002,42(3、4), 47-48. [2] 杨伍梅.MATLAB 在回归分析中的应用.高等函授学报(自然科学版),2008.10 [3] 宋明顺.回归分析中的自相关检验和建模.计量技术,1998(2),43-45. [4] 王漠然.MATLAB 与科学计算[M].北京:电子工业出版社,2003. [5] 杨虎.数理统计[M].北京:高等教育出版社,2006.。