第七章 相关分析
- 格式:doc
- 大小:168.94 KB
- 文档页数:4
第七章相关分析和回归分析相关分析和回归分析是统计学中常用的数据分析方法。
相关分析主要用于探索两个或多个变量之间的关系,回归分析则可以用来建立一个或多个自变量和因变量之间的数学模型。
在实际应用中,相关分析和回归分析常常被用来研究和预测变量之间的关系,为科学研究和决策提供数据支持。
首先,相关分析旨在评估两个或多个变量之间的线性关系。
它使用统计指标,如相关系数,来衡量变量之间的关联程度。
相关系数的取值范围从-1到1,0表示无关,正值表示正向关系,负值表示负向关系。
相关分析可以帮助我们了解变量之间的关系强度和方向,进而指导我们进行进一步的解释和预测。
举个例子,假设我们想研究体重和身高之间的关系。
我们可以收集一组样本数据,其中包含人们的身高和体重数据。
通过进行相关分析,我们可以计算出身高和体重之间的相关系数。
如果相关系数接近1,我们可以得出结论说身高和体重之间存在较强的正向关系,即身高越高,体重越重。
如果相关系数接近0,则两个变量之间没有明显的关系。
然而,相关分析并不能确定起因关系。
它只能告诉我们变量之间的关联程度,但不能确定其中一个变量是否导致了另一个变量的变化。
为了进一步研究因果关系,我们可以使用回归分析。
回归分析旨在建立一个或多个自变量与因变量之间的关系模型。
它通过拟合数据并计算出最佳拟合线来描述自变量和因变量之间的关系。
回归模型的核心是回归方程,它可以用来预测因变量在不同自变量变化时的取值。
举个例子,我们可以使用回归分析来建立一个体重和身高之间的关系模型。
我们可以选择身高作为自变量,体重作为因变量。
通过回归分析,我们可以得到一个回归方程,例如体重=2*身高+10。
这个回归方程告诉我们,身高每增加1个单位,体重可以预计增加2个单位。
我们可以使用这个回归方程来预测一些身高下的体重。
总结起来,相关分析和回归分析是统计学中常用的数据分析方法。
相关分析可以帮助我们了解变量之间的关联程度,而回归分析可以用于建立自变量和因变量之间的关系模型。
第七章 相关与回归分析一、本章学习要点(一)相关分析就是研究两个或两个以上变量之间相关程度大小以及用一定函数来表达现象相互关系的方法。
现象之间的相互关系可以分为两种,一种是函数关系,一种是相关关系。
函数关系是一种完全确定性的依存关系,相关关系是一种不完全确定的依存关系。
相关关系是相关分析的研究对象,而函数关系则是相关分析的工具。
相关按其程度不同,可分为完全相关、不完全相关和不相关。
其中不完全相关关系是相关分析的主要对象;相关按方向不同,可分为正相关和负相关;相关按其形式不同,可分为线性相关和非线性相关;相关按影响因素多少不同,可分为单相关和复相关。
(二)判断现象之间是否存在相关关系及其程度,可以根据对客观现象的定性认识作出,也可以通过编制相关表、绘制相关图的方式来作出,而最精确的方式是计算相关系数。
相关系数是测定变量之间相关密切程度和相关方向的代表性指标。
相关系数用符号“γ”表示,其特点表现在:参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个;相关系数有正负号反映相关系数的方向,正号反映正相关,负号反映负相关;计算相关系数的两个变量都是随机变量。
相关系数的取值区间是[-1,+1],不同取值有不同的含义。
当1||=γ时,x 与y 的变量为完全相关,即函数关系;当1||0<<γ时,表示x 与y 存在一定的线性相关,||γ的数值越大,越接近于1,表示相关程度越高;反之,越接近于0,相关程度越低,通常判别标准是:3.0||<γ称为微弱相关,5.0||3.0<<γ称为低度相关,8.0||5.0<<γ称为显著相关,1||8.0<<γ称为高度相关;当0||=γ时,表示y 的变化与x 无关,即不相关;当0>γ时,表示x 与y 为线性正相关,当0<γ时,表示x 与y 为线性负相关。
皮尔逊积距相关系数计算的基本公式是: ∑∑∑∑∑∑∑---==])(][)([22222y y n x x n y x xy n y x xy σσσγ 斯皮尔曼等级相关系数和肯特尔等级相关系数是测量两个等级变量(定序测度)之间相关密切程度的常用指标。
第七章 相关分析
一、单项选择
1、当变量x 按一定数值变化时,变量y 也近似地按固定数值变化,这表明变量x 和变量y 之间存在着 ( D ) A 、完全相关关系 B 、复相关关系 C 、直线相关关系 D 、函数关系
2、相关关系的取值范围 ( B ) A 、r -∞<<+∞ B 、11r -≤≤+ C 、11r -<<+ D 、01r ≤≤+
3、直线相关分析与直线回归分析的联系表现为 ( A ) A 、相关分析是回归分析的基础 B 、回归分析是相关分析的基础 C 、相关分析是回归分析的深入 D 、相关分析与回归分析互为条件
4、在用一个回归方程进行估计推算时 ( B ) A 、只能用因变量推算自变量 B 、只能用自变量推算因变量 C 、既可用因变量推算自变量,也可用自变量推算因变量 D 、不需要考虑因变量和自变量问题
5、如果估计标准误差0=yx S ,则表明 ( C ) A 、全部观测值和回归值都不相等 B 、回归直线代表性小
C 、全部观测值与回归值的离差之积为0
D 、全部观测值都落在回归直线上 6、判断两个变量间相关关系的密切程度时,“显著相关”通常是指 ( B ) A 、5.03.0〈≤r B 、8.05.0〈≤r C 、18.0〈≤r D 、高于0.5 7、在回归直线方程bx a y c +=中,b 表示 ( C ) A 、当x 增加一个单位时,y 增加a 的数量 B 、当y 增加一个单位时,x 增加b 的数量 C 、当x 增加一个单位时,y 的平均增加量 D 、当y 增加一个单位时,x 的平均增加量 8、配合直线回归方程对资料的要求是 ( B ) A 、因变量是给定的数值,自变量是随机变量 B 、自变量是给定的数值,因变量是随机变量 C 、自变量和因变量都是随机变量 D 、自变量和因变量都不是随机变量
二、多项选择
1、下列各种现象之间的关系属于相关关系的有 ( CDE ) A 、劳动生产率与工资水平之间的关系 B 、商品销售额与流通费用率的关系 C 、农作物收获量与施肥量的关系
D 、价格不变条件下,商品销售额与销售量之间的关系
E 、正方形的面积与它的边长之间的关系
2、相关分析的特点有 ( BCDE ) A 、两变量不是对等的
B 、两变量只能计算出一个相关系数
C 、相关系数有正负号
D 、两变量都是随机的
E 、相关系数的绝对值介于0和1之间
3、若流通费用率(%)对商品销售额(十万元)的直线回归方程为
x
y c %02.0%8-= ,这说明 ( AC )
A 、流通费用率与销售额按相反方向变动
B 、流通费用率与销售额按相同方向变动
C 、商品销售额每增加1万元,流通费用率平均下降0.02%
D 、商品销售额每增加10万元,流通费用率平均下降0.02%
E 、当商品销售额为10万元时,流通费用率为7.98%
4、如果变量x 与y 之间没有线性相关关系,则 ( CDE ) A 、估计标准误差为0=yx S B 、估计标准误差1=yx S C 、相关系数0=r D 、判定系数02=r
E 、回归系数0=b
5、下列有关估计标准误差的陈述,正确的有 ( ABDE ) A 、说明回归方程代表性大小的指标 B 、与标准差的计算原理相同
C 、估计标准误差越小,表明观测值离回归直线越远
D 、估计标准误差越大,表明回归直线的代表性越小
E 、当估计标准误差为零时,说明实际值与估计值之间没有差异
三、计算
1、某高校随机检查5位同学统计学的学习时数与成绩分数如下表:
学习时数(小时)
学习成绩(分)
40 60 70 100 130
40 60 50 70 90
要求:①计算学习时数与学习成绩之间的相关系数;②编制学习成绩对学习时数的直线回归方程。
解:
9558
.07400
2500013000310
207005400
370005310400274005)
()
()1(2
2
2
22
2
=⨯=
-⨯-⨯⨯-⨯=
---=
∑∑∑∑∑∑∑y y n x x n y
x xy n r
2、某企业某种产品产量与单位成本资料如下:
月 份 1 2 3 4 5 6 产 量(千件) 单位成本(元/件)
2 73
3 72
4 71
3 73
4 69
5 68
要求:①计算产量与单位成本之间的相关系数;②建立单位成本对产量的直线回归方程,并指出产量每增加1千件时单位成本将作如何变动?③如果产量为6千件时,单位成本为多少元?④如果单位成本为70元时,产量应为多少?
52.025000
13000
)()2(2
2==--=∑∑∑∑∑x x n y x xy n b 4.205
40052.05310=⨯-=-=∑∑n x b n y a x
y c 52.04.20+=∴∑∑∑∑∑======。
,,,
,,据:根据资料计算得以下数
148130268794262162
2
xy y x
y x n 9091
.0132
3360426
30268621
7964262114816)
()
()1(2
22
22
2
-=⨯-=
-⨯-⨯⨯-⨯=
---=
∑∑∑∑∑∑∑y y n x x n y
x xy n r 8182
.133
60)
()2(2
2
-=-=
--=
∑∑∑∑∑x x n y x xy n b 3637
.776
21)8182.1(6
426=⨯
--=
-=
∑∑
n
x b
n
y
a x
y c 8182.13637.77-=∴元。
单位成本平均下降
千件,
,表明产量每增加回归系数82.118182.1-=b
3、已知x 、y 两变量的相关系数 为 的两倍,求y 对x 的回归方程。
4、试根据下列资料编制直线回归方程
并计算相关系数r 。
y y x r σ,50,20,8.0===x
σbx a y c +=,
3.11,6.12,5.146===y x xy 。
7575.1,1.134,2.1642
2===a y x 千件时,单位成本:当产量为6)3()
/(45.6668182.13637.77件元=⨯-=c y dy
c x c +=)4(4545
.0132
60)
(2
2
-=-=
--=
∑∑∑∑∑y y n y x xy n d 7695
.356
426)4545.0(6
21=⨯--=
-=
∑
∑n
y
d n
x c )
(95.39545.3704545.07695.35千件≈=⨯-=∴c x 6
.128.0=⨯
==x
x
x
y
r
b σσ
σσ
18
206.150=⨯-=-=x b y a x
y c 6.118+=∴7573
.06
.127575
.13.11=-=-=x
a y
b x
y c 7573.07575.1+=∴6977
.09051
.512
.43
.111.1346.122.1643.116.125.1462
2
2
2
2
2
==
--⨯-=---=
y
y x
x y x xy r。