《统计学》 第七章 相关分析与回归分析(补充例题)

  • 格式:doc
  • 大小:313.50 KB
  • 文档页数:5

下载文档原格式

  / 5
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章 相关分析与回归分析

(3)当固定资产改变200万元时,总产值平均改变多少?(4)当固定资产为1300万元时,总产值为多少?

(1)协方差——用以说明两指标之间的相关方向。

2

2))((n y x xy n n

y y x x xy

∑∑∑∑-=

--=σ

035.126400100

9801

6525765915610>=⨯-⨯=

计算得到的协方差为正数,说明固定资产和总产值之间存在正相关关系。 (2)相关系数用以说明两指标之间的相关方向和相关的密切程度。

∑∑∑∑∑∑∑---=

]

)(][)([2222y y n x x n y

x xy n r

95.0)

98011086657710()6525566853910(9801

65257659156102

2

=-⨯⨯-⨯⨯-⨯=

计算得到的相关系数为0.95,表示两指标为高度正相关。

(3)

2

226525

5668539109801

6525765915610)(-⨯⨯-⨯=--=

∑∑∑∑∑x x n y x xy n b 90.014109765

12640035

42575625566853906395152576591560==--=

85.39210

6525

9.0109801=⨯-=

-=x b y a 回归直线方程为: x y 9.085.392ˆ+= (4)当固定资产改变200万元时,总产值平均改变多少?

x y ∆=∆9.0,1802009.0|200=⨯=∆=∆x y 万元

当固定资产改变200万元时,总产值平均增加180万元。

(5)当固定资产为1300万元时,总产值为多少?

85.156213009.085.392|1300=⨯+==x y 万元

当固定资产为1300万元时,总产值为1562.85万元。

例2、试根据下列资产总值和平均每昼夜原料加工量资料计算相关系数。

解:【分析】本题中“企业数”应看成资产总值和平均每昼夜原料加工量两变量的次数,在计算相关系数的过程,要进行“加权”。

相关系数

∑∑∑∑∑∑∑∑∑∑---=

]

)(][)([2

2

2

2

f y f y f f x f x f yf

xf xyf f r 84.0)

331.2842()216001174000042(33

2160017960422

2

=-⨯⨯-⨯⨯-⨯=

要求:(1)编制直线回归方程;(2)由此计算出学习时数与学习成绩之间的相关系数。 解:先列出计算表: 解:(1)bx a y c +=

2.54037053104027405)(2

22=-⨯⨯-⨯=--=∑∑∑∑∑x x n y x xy n b

4.205

40

2.55310=⨯-=

-=x b y a 回归直线方程为:

x y c 2.54.20+=

(2)

∑∑∑∑∑∑∑---=

]

)(][)([2222y y n x x n y

x xy n r 956.002

.8681.151300

)

310207005()403705(310402740522=⨯=

-⨯⨯-⨯⨯-⨯=

计算得到的相关系数为0.95,表示两指标为高度正相关。

956.09135.02===r r

说明学习时数x 与成绩得分y 之间有高度的相关关系。 例3、检查5位同学统计学的学习时间与成绩分数如下表:

要求:(1)编制直线回归方程;(2)计算估计标准误差;(3)对学习成绩的方差进行分解分析,指出总误差平方和中有多少比重可由回归方程来解释;(4)由此计算出学习时数与学习成绩之间的相关系数。

解:(1)bx a y c +=

2.54037053104027405)(2

22=-⨯⨯-⨯=--=∑∑∑∑∑x x n y x xy n b

4.205

40

2.55310=⨯-=

-=x b y a 回归直线方程为:

x y c 2.54.20+=

(2)53.63

2740

2.53104.202070022

=⨯-⨯-=---=

∑∑∑n xy b y a y

S yx

(3)总误差分解列表如下: 学习

时数x 学习成绩y c y

y y - 2)(y y - c y y - 2)(c y y - y y c - 2)(y y c -

4 6 7 10 13 40 60 50 70 90 41.2 51.6 56.8 72.4 88.0 -22 -2 12 8 28 484 4 144 64 784 -1.2 8.4 -6.8 -2.4 2.0 1.44 70.56 46.24 5.76 4.00 -20.8 -10.4 -5.2 10.4 26.0 432.64 108.16 27.04 108.16 676.00 40

310

1480

1352.00

635

==

y ∑∑∑-+-=-222

)()()(y y

y y y y c

c

1480=128+1352

9135.01480

1352

)

()(2

2

2

==

--=∑∑

y y y y r

c

计算总误差平方和中有91.35%可以由回归方程来解释,学习时数x 与成绩得分y 之间有高度的相关。如果用理论分数c y 来估计实际分数y ,平均将发生6.53分的误差,这个数字与平均成绩62分对比约占10.5%。 (4)956.09135.02===r r

说明学习时数x 与成绩得分y 之间有高度的相关关系。