回归分析与独立性检验(精)
- 格式:doc
- 大小:82.00 KB
- 文档页数:2
回归分析与独立性检验
知识要点及解析
1.函数关系与相关关系的区别?
函数关系是一种确定性关系,而相关关系是一种非确定性关系.
2.回归公式∑∑∑∑====--=
---=n
i i
n
i i
i n
i i
n
i i
i
x n x
y
x n y x x x y y
x x b
1
2
21
1
2
1
)
()
)((ˆ
3.回归分析的步骤:
4.回归直线的性质
⑴回归直线 过样本点的中心()y x , ⑵回归直线的估计值b
ˆ的意义:解释变量x 每增加一个单位,预报变量y 就增加b ˆ个单位. 5.如何衡量模型的拟合效果?
方法1:在残差图中,残差点比较均匀落在带状水平区域内,说明选用的模型比较合适;带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高
方法2:残差平方和:残差i e
ˆ的平方和越小,回归模型拟合效果越好. 方法3:相关指数R 2: ()()
∑∑==---
=n i i
n
i i i
y y
y y
R 1
2
1
2
2
ˆ1 其中
R 2表示解释变量对于预报变量变化的贡献率,相关指数R 2
越接近于1(越大),回归模型拟合效果越好。
例题1:在两个变量y 与x 的回归模型中,分别选择了4个不同的模型,它们的相关指数R 2
如
下,其中拟合效果最好的模型是( ) A .模型1的R 2
=0.98 B .模型2的R 2
=0.80 C .模型3的R 2
=0.50 D .模型4的R 2
=0.25 例题2:根据一位母亲记录儿子3~9岁身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)
的线性回归方程 93.7319.7ˆ+=x y
,若用此方程预测儿子10岁时的身高,下列有关叙述正 确的是( )
A .身高一定为145.83cm;
B .身高大于145.83cm;
C .身高小于145.83cm;
D .身高在145.83cm 左右
例题3:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的 能耗y(吨标准煤)的几组数据:
⑴求出线性回归方程a x b y
ˆˆˆ+= ⑵已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)问求出的线性回
a x
b y
ˆˆˆ+=()
1
02≤≤R
归方程预测(估计)生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
6.独立性检验的定义:利用随机变量K 2
来判断“两个分类变量有关系”的方法称为独立性检验
)
)()()(()(2
2
d b c a d c b a bc ad n K ++++-= 其中d c b a n +++=
7.独立性检验的步骤:
⑴制定判别规则:根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界α ,然后查表确定临界值k 0 ⑵利用公式计算随机变量K 2
的观测值k
⑶如果K 2
的观测值k 很大,说明“X 与Y 有关系”,观测值k 很小,说明“X 与Y 没有关系” 如果k ≥k 0 ,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α,即有α-1的把握认为“X 与Y 有关系” 例1、针对某地区的一种传染病与饮用水进行抽样调查发现:饮用干净水得病5人,不得病50 人,饮用不干净水得病9人,不得病22人。
⑴作出2×2列联表 ⑵能否有90%的把握认为该地区中得传染病与饮用水有关?
例2、为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:
已右在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为.5
⑴请将上面的列联表补充完整;
⑵是否有99.5%的把握认为喜爱打篮球与性别有关?说明你的理由;
⑶已知喜爱打篮球的10位女生中,A 1,A 2,A 3,A 4,A 5还喜欢打羽毛球,B 1,B 2,B 3还喜欢打乒乓球,C 1,C 2还喜欢踢足球,现再从喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的女生中各选出1名进行其他方面的调查,求B 1和C 1不全被选中的概率。