(完整版)回归方程和独立性检验知识点讲解

格式：doc
大小：200.01 KB
文档页数：3

下载文档原格式

/ 3

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

回归分析和独立性检验

一、回归分析

1、回归直线方程 a x b y

ˆˆˆ+= （x 叫做解释变量，y 叫做预报变量）其中∑∑==---=n

i i

i i i

x x

y y x x

)()

)((ˆ＝

∑∑==--n

i i

i x n x

x n y

x 1

（由最小二乘法得出，考试时给出此公式中的一个）

x b y a

ˆˆ-= （此式说明：回归直线过样本的中心点)(y x ，，也就是平均值点。） 2、几条结论：

（1）回归直线过样本的中心点)(y x ，。

（2）b>0时，y 与x 正相关，散点图呈上升趋势；b<0时，y 与x 负相关，散点图呈下降趋势。（3）斜率b 的含义（举例）：

如果回归方程为y=2.5x+2，说明x 增加1个单位时，y 平均增加2.5个单位；如果回归方程为y=－2.5x+2，说明x 增加1个单位时，y 平均减少2.5个单位。（4）相关系数r 表示变量的相关程度。范围：1≤r ，即 11≤≤-r

r 越大．，相关性越强．

。0>r 时，y 与x 正相关；0

R 表示模型的拟合效果。范围：]10[2

，

∈R 2R 越大．，拟合效果越好．

，（这时：残差平方和越小，残差点在带状区域内的分布比较均匀，带状区域宽度越窄，拟合精度越高）。

2R 表示解释变量x 对于预报变量y 变化的贡献率。

例如：64.02

≈R ，表明“x 解释了64%的y 变化”，或者说“y 的差异有64%是由x 引起的”。（6）线性回归模型 e a bx y ++=，其中e 叫做随机误差。（y 是由x 和e 共同确定的。）

二、独立性检验

1、原理：假设性检验（类似反证法原理）。

一般情况下：假设分类变量X 和Y 之间没有关系，通过计算2

K 值，然后查表对照相应的概率P ，发现这种假设正确的概率P 很小，从而推翻假设，最后得出X 和Y 之间有关系的可能性为(1－P), 也就是“X 和Y 有关系”。（表中的k 就是2

K 的

观测值，即

2K k =）

)

)()()(()(2

d b c a d c b a bc ad n K ++++-=

2、2⨯2列联表：（考试给出）

部分对照表（考试时会给出用到的一部分数据）：

3、范围：),0(2

+∞∈K ；性质：2K 越大．，说明变量间越有关系．．．

。

三、典型例题

（3）当7=x 时，25.535.077.0=+⨯=y 所以，估计．．

生产7吨产品时，消耗的煤约为5.25吨。例2、为了考察某药物预防疾病的效果，现对105人进行

试验调查，得到2⨯2列联表。试判断：服用药物和患病之间是否有关系？

解：105=n ，10=a ，45=b ，20=c ，30=d

305055)

20453010(1052

2⨯⨯⨯⨯-⨯⨯=

6.109>5.024 （提示：运算时尽量先约分化简，再计算）所以，有1－0.025＝9

7.5%的把握认为服用药物和患病之间有关系。

(完整版)回归方程和独立性检验知识点讲解

相关主题

文档推荐

最新文档