第七章 相关与回归分析
- 格式:ppt
- 大小:533.00 KB
- 文档页数:47
第七章相关与回归分析学习内容一、变量间的相关关系二、一元线性回归三、线性回归方程拟合优度的测定学习目标1. 掌握相关系数的含义、计算方法和应用2. 掌握一元线性回归的基本原理和参数的最小二3. 掌握回归方程的显著性检验4. 利用回归方程进行预测5. 了解可化为线性回归的曲线回归6. 用Excel 进行回归分析一、变量间的相关关系1. 变量间的关系(函数关系)1)是一一对应的确定关系。
2)设有两个变量x和y,变量y 随变量x一起变化,并完全依赖于x,当变量x 取某个数值时,y依确定的关系取相应的值,则称y 是x的函数,记为y = f (x),其中x 称为自变量,y 称为因变量。
3)各观测点落在一条线上。
4)函数关系的例子–某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价)。
–圆的面积(S)与半径之间的关系可表示为S = π R2。
–企业的原材料消耗额(y)与产量x1、单位产量消耗x2、原材料价格x3间的关系可表示为y =x1 x2 x3。
单选题下面的函数关系是()A、销售人员测验成绩与销售额大小的关系B、圆周的长度决定于它的半径C、家庭的收入和消费的关系D、数学成绩与统计学成绩的关系2. 变量间的关系(相关关系)1)变量间关系不能用函数关系精确表达。
2)一个变量的取值不能由另一个变量唯一确定。
3)当变量 x 取某个值时,变量 y 的取值可能有几个。
4)各观测点分布在直线周围。
5)相关关系的例子–商品的消费量(y)与居民收入(x)之间的关系。
–商品销售额(y)与广告费支出(x)之间的关系。
–粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度 (x3)之间的关系。
–收入水平(y)与受教育程度(x)之间的关系。
–父亲身高(y)与子女身高(x)之间的关系。
3. 相关图表1)相关表:将具有相关关系的原始数据,按某一顺序平行排列在一张表上,以观察它们之间的相互关系。
2)相关图:也称为分布图或散点图,它是在平面直角坐标中把相关关系的原始数据用点描绘出来,通常以直角坐标轴的横轴代表自变量x,纵轴代表因变量y。
第七章回归与相关分析一、填空题1.现象之间的相关关系按相关的程度分为、和;按相关的形式分为和;按影响因素的多少分为和。
2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量,这种相关称为正相关;当一个现象的数量由小变大,另一个现象的数量,这种相关称为负相关。
3.相关系数的取值X围是。
4.完全相关即是关系,其相关系数为。
5.相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。
6.直线相关系数等于零,说明两变量之间;直线相关系数等1,说明两变量之间;直线相关系数等于—1,说明两变量之间。
7.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为。
8.回归方程y=a+bx中的参数a是,b是。
在统计中估计待定参数的常用方法是。
9. 分析要确定哪个是自变量哪个是因变量,在这点上它与不同。
10.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通过化成来解决。
11.用来说明回归方程代表性大小的统计分析指标是。
12.判断一条回归直线与样本观测值拟合程度好坏的指标是。
二、单项选择题1.下面的函数关系是( )A销售人员测验成绩与销售额大小的关系 B圆周的长度决定于它的半径C家庭的收入和消费的关系 D数学成绩与统计学成绩的关系2.相关系数r的取值X围( )A -∞<r<+∞B -1≤r≤+1C -1<r<+1D 0≤r≤+13.年劳动生产率z(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )A增加70元 B减少70元 C增加80元 D减少80元4.若要证明两变量之间线性相关程度是高的,则计算出的相关系数应接近于( )A+1 B 0 C 0.5 D [1]5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( ) A线性相关还是非线性相关 B正相关还是负相关C完全相关还是不完全相关 D单相关还是复相关6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建=a+b x。
第七章 相关与回归分析一、本章学习要点(一)相关分析就是研究两个或两个以上变量之间相关程度大小以及用一定函数来表达现象相互关系的方法。
现象之间的相互关系可以分为两种,一种是函数关系,一种是相关关系。
函数关系是一种完全确定性的依存关系,相关关系是一种不完全确定的依存关系。
相关关系是相关分析的研究对象,而函数关系则是相关分析的工具。
相关按其程度不同,可分为完全相关、不完全相关和不相关。
其中不完全相关关系是相关分析的主要对象;相关按方向不同,可分为正相关和负相关;相关按其形式不同,可分为线性相关和非线性相关;相关按影响因素多少不同,可分为单相关和复相关。
(二)判断现象之间是否存在相关关系及其程度,可以根据对客观现象的定性认识作出,也可以通过编制相关表、绘制相关图的方式来作出,而最精确的方式是计算相关系数。
相关系数是测定变量之间相关密切程度和相关方向的代表性指标。
相关系数用符号“γ”表示,其特点表现在:参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个;相关系数有正负号反映相关系数的方向,正号反映正相关,负号反映负相关;计算相关系数的两个变量都是随机变量。
相关系数的取值区间是[-1,+1],不同取值有不同的含义。
当1||=γ时,x 与y 的变量为完全相关,即函数关系;当1||0<<γ时,表示x 与y 存在一定的线性相关,||γ的数值越大,越接近于1,表示相关程度越高;反之,越接近于0,相关程度越低,通常判别标准是:3.0||<γ称为微弱相关,5.0||3.0<<γ称为低度相关,8.0||5.0<<γ称为显著相关,1||8.0<<γ称为高度相关;当0||=γ时,表示y 的变化与x 无关,即不相关;当0>γ时,表示x 与y 为线性正相关,当0<γ时,表示x 与y 为线性负相关。
皮尔逊积距相关系数计算的基本公式是: ∑∑∑∑∑∑∑---==])(][)([22222y y n x x n y x xy n y x xy σσσγ 斯皮尔曼等级相关系数和肯特尔等级相关系数是测量两个等级变量(定序测度)之间相关密切程度的常用指标。
统计学课后习题答案第七章相关分析与回归分析第七章相关分析与回归分析⼀、单项选择题1.相关分析是研究变量之间的A.数量关系B.变动关系C.因果关系D.相互关系的密切程度2.在相关分析中要求相关的两个变量A.都是随机变量B.⾃变量是随机变量C.都不是随机变量D.因变量是随机变量3.下列现象之间的关系哪⼀个属于相关关系?A.播种量与粮⾷收获量之间关系B.圆半径与圆周长之间关系C.圆半径与圆⾯积之间关系D.单位产品成本与总成本之间关系4.正相关的特点是A.两个变量之间的变化⽅向相反B.两个变量⼀增⼀减C.两个变量之间的变化⽅向⼀致D.两个变量⼀减⼀增5.相关关系的主要特点是两个变量之间A.存在着确定的依存关系B.存在着不完全确定的关系C.存在着严重的依存关系D.存在着严格的对应关系6.当⾃变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存A.正相关关系B.直线相关关系C.负相关关系D.曲线相关关系8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存在着A.直线相关关系B.负相关关系C.曲线相关关系D.正相关关系9.判定现象之间相关关系密切程度的最主要⽅法是A.对现象进⾏定性分析B.计算相关系数C.编制相关表D.绘制相关图10.相关分析对资料的要求是A.⾃变量不是随机的,因变量是随机的B.两个变量均不是随机的C.⾃变量是随机的,因变量不是随机的D.两个变量均为随机的11.相关系数A.既适⽤于直线相关,⼜适⽤于曲线相关B.只适⽤于直线相关C.既不适⽤于直线相关,⼜不适⽤于曲线相关D.只适⽤于曲线相关12.两个变量之间的相关关系称为A.单相关B.复相关C.不相关D.负相关13.相关系数的取值范围是A.-1≤r≤1B.-1≤r≤0C.0≤r≤114.两变量之间相关程度越强,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于115.两变量之间相关程度越弱,则相关系数A.愈趋近于1B.愈趋近于0C.愈⼤于1D.愈⼩于116.相关系数越接近于-1,表明两变量间A.没有相关关系B.有曲线相关关系C.负相关关系越强D.负相关关系越弱17.当相关系数r=0时,A.现象之间完全⽆关B.相关程度较⼩B.现象之间完全相关 D.⽆直线相关关系18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说明这两个变量之间存在A.⾼度相关B.中度相关C.低度相关D.显著相关19.从变量之间相关的⽅向看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关20.从变量之间相关的表现形式看可分为A.正相关与负相关B.直线相关和曲线相关C.单相关与复相关D.完全相关和⽆相关21.物价上涨,销售量下降,则物价与销售量之间属于A.⽆相关B.负相关C.正相关D.⽆法判断22.配合回归直线最合理的⽅法是A.随⼿画线法B.半数平均法C.最⼩平⽅法D.指数平滑法23.在回归直线⽅程y=a+bx中b表⽰A.当x增加⼀个单位时,y增加a的数量B.当y增加⼀个单位时,x增加b的数量C.当x增加⼀个单位时,y的平均增加量D.当y增加⼀个单位时, x的平均增加量24.计算估计标准误差的依据是A.因变量的数列B.因变量的总变差C.因变量的回归变差D.因变量的剩余变差25.估计标准误差是反映A.平均数代表性的指标B.相关关系程度的指标C.回归直线的代表性指标D.序时平均数代表性指标26.在回归分析中,要求对应的两个变量A.都是随机变量B.不是对等关系C.是对等关系D.都不是随机变量27.年劳动⽣产率(千元)和⼯⼈⼯资(元)之间存在回归⽅程y=10+70x,这意味着年劳动⽣产率每提⾼⼀千元时,⼯⼈⼯资平均A.增加70元B.减少70元C.增加80元D.减少80元28.设某种产品产量为1000件时,其⽣产成本为30000元,其中固定成本6000元,则总⽣产成本对产量的⼀元线性回归⽅程为:A.y=6+0.24xB.y=6000+24xC.y=24000+6xD.y=24+6000x29.⽤来反映因变量估计值代表性⾼低的指标称作A.相关系数B.回归参数C.剩余变差D.估计标准误差⼆、多项选择题1.下列现象之间属于相关关系的有A.家庭收⼊与消费⽀出之间的关系B.农作物收获量与施肥量之间的关系C.圆的⾯积与圆的半径之间的关系D.⾝⾼与体重之间的关系E.年龄与⾎压之间的关系2.直线相关分析的特点是A.相关系数有正负号B.两个变量是对等关系C.只有⼀个相关系数D.因变量是随机变量E.两个变量均是随机变量3.从变量之间相互关系的表现形式看,相关关系可分为A.正相关B.负相关C.直线相关D.曲线相关E.单相关和复相关4.如果变量x与y之间没有线性相关关系,则A.相关系数r=0B.相关系数r=1C.估计标准误差等于0D.估计标准误差等于1E.回归系数b=05.设单位产品成本(元)对产量(件)的⼀元线性回归⽅程为y=85-5.6x,则A.单位成本与产量之间存在着负相关B.单位成本与产量之间存在着正相关C.产量每增加1千件,单位成本平均增加5.6元D.产量为1千件时,单位成本为79.4元E.产量每增加1千件,单位成本平均减少5.6元6.根据变量之间相关关系的密切程度划分,可分为A.不相关B.完全相关C.不完全相关D.线性相关E.⾮线性相关7.判断现象之间有⽆相关关系的⽅法有A.对现象作定性分析B.编制相关表C.绘制相关图D.计算相关系数E.计算估计标准误差 8.当现象之间完全相关的,相关系数为A.0B.-1C.1D.0.5E.-0.5 9.相关系数r =0说明两个变量之间是A.可能完全不相关B.可能是曲线相关C.肯定不线性相关D.肯定不曲线相关E.⾼度曲线相关10.下列现象属于正相关的有A.家庭收⼊愈多,其消费⽀出也愈多B.流通费⽤率随商品销售额的增加⽽减少C.产量随⽣产⽤固定资产价值减少⽽减少D.⽣产单位产品耗⽤⼯时,随劳动⽣产率的提⾼⽽减少E.⼯⼈劳动⽣产率越⾼,则创造的产值就越多 11.直线回归分析的特点有A.存在两个回归⽅程B.回归系数有正负值C.两个变量不对等关系D.⾃变量是给定的,因变量是随机的E.利⽤⼀个回归⽅程,两个变量可以相互计算 12.直线回归⽅程中的两个变量A.都是随机变量B.都是给定的变量C.必须确定哪个是⾃变量,哪个是因变量D.⼀个是随机变量,另⼀个是给定变量E.⼀个是⾃变量,另⼀个是因变量13.从现象间相互关系的⽅向划分,相关关系可以分为A.直线相关B.曲线相关C.正相关D.负相关E.单相关 14.估计标准误差是A.说明平均数代表性的指标B.说明回归直线代表性指标C.因变量估计值可靠程度指标D.指标值愈⼩,表明估计值愈可靠E.指标值愈⼤,表明估计值愈可靠 15.下列公式哪些是计算相关系数的公式16.⽤最⼩平⽅法配合的回归直线,必须满⾜以下条件A.∑(y-y c )=最⼩值B.∑(y-y c )=0C.∑(y-y c )2=最⼩值D.∑(y-y c )2=0E.∑(y-y c )2=最⼤值 17.⽅程y c =a+bx222222)()(.)()())((...))((.y y n x x n yx xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xyyy xx xy y x ∑-∑?∑-∑∑?∑-∑=-∑?-∑--∑===--∑=σσA.这是⼀个直线回归⽅程B.这是⼀个以X为⾃变量的回归⽅程C.其中a是估计的初始值D.其中b是回归系数E.y c是估计值18.直线回归⽅程y c=a+bx中的回归系数bA.能表明两变量间的变动程度B.不能表明两变量间的变动程度C.能说明两变量间的变动⽅向D.其数值⼤⼩不受计量单位的影响E. 其数值⼤⼩受计量单位的影响19.相关系数与回归系数存在以下关系A.回归系数⼤于零则相关系数⼤于零B.回归系数⼩于零则相关系数⼩于零C.回归系数等于零则相关系数等于零D.回归系数⼤于零则相关系数⼩于零E.回归系数⼩于零则相关系数⼤于零20.配合直线回归⽅程的⽬的是为了A.确定两个变量之间的变动关系B.⽤因变量推算⾃变量C.⽤⾃变量推算因变量D.两个变量相互推算E.确定两个变量之间的相关程度21.若两个变量x和y之间的相关系数r=1,则A.观察值和理论值的离差不存在B.y的所有理论值同它的平均值⼀致C.x和y是函数关系D.x与y不相关E.x与y是完全正相关22.直线相关分析与直线回归分析的区别在于A.相关分析中两个变量都是随机的;⽽回归分析中⾃变量是给定的数值,因变量是随机的B.回归分析中两个变量都是随机的;⽽相关分析中⾃变量是给定的数值,因变量是随机的C.相关系数有正负号;⽽回归系数只能取正值D.相关分析中的两个变量是对等关系;⽽回归分析中的两个变量不是对等关系E.相关分析中根据两个变量只能计算出⼀个相关系数;⽽回归分析中根据两个变量只能计算出⼀个回归系数三、填空题1.研究现象之间相关关系称作相关分析。