回归分析与独立性检验(精)

  • 格式:doc
  • 大小:82.00 KB
  • 文档页数:2

下载文档原格式

  / 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

回归分析与独立性检验

知识要点及解析

1.函数关系与相关关系的区别?

函数关系是一种确定性关系,而相关关系是一种非确定性关系.

2.回归公式∑∑∑∑====--=

---=n

i i

n

i i

i n

i i

n

i i

i

x n x

y

x n y x x x y y

x x b

1

2

21

1

2

1

)

()

)((ˆ

3.回归分析的步骤:

4.回归直线的性质

⑴回归直线 过样本点的中心()y x , ⑵回归直线的估计值b

ˆ的意义:解释变量x 每增加一个单位,预报变量y 就增加b ˆ个单位. 5.如何衡量模型的拟合效果?

方法1:在残差图中,残差点比较均匀落在带状水平区域内,说明选用的模型比较合适;带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高

方法2:残差平方和:残差i e

ˆ的平方和越小,回归模型拟合效果越好. 方法3:相关指数R 2: ()()

∑∑==---

=n i i

n

i i i

y y

y y

R 1

2

1

2

2

ˆ1 其中

R 2表示解释变量对于预报变量变化的贡献率,相关指数R 2

越接近于1(越大),回归模型拟合效果越好。

例题1:在两个变量y 与x 的回归模型中,分别选择了4个不同的模型,它们的相关指数R 2

下,其中拟合效果最好的模型是( ) A .模型1的R 2

=0.98 B .模型2的R 2

=0.80 C .模型3的R 2

=0.50 D .模型4的R 2

=0.25 例题2:根据一位母亲记录儿子3~9岁身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)

的线性回归方程 93.7319.7ˆ+=x y

,若用此方程预测儿子10岁时的身高,下列有关叙述正 确的是( )

A .身高一定为145.83cm;

B .身高大于145.83cm;

C .身高小于145.83cm;

D .身高在145.83cm 左右

例题3:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的 能耗y(吨标准煤)的几组数据:

⑴求出线性回归方程a x b y

ˆˆˆ+= ⑵已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)问求出的线性回

a x

b y

ˆˆˆ+=()

1

02≤≤R

归方程预测(估计)生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?

6.独立性检验的定义:利用随机变量K 2

来判断“两个分类变量有关系”的方法称为独立性检验

)

)()()(()(2

2

d b c a d c b a bc ad n K ++++-= 其中d c b a n +++=

7.独立性检验的步骤:

⑴制定判别规则:根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界α ,然后查表确定临界值k 0 ⑵利用公式计算随机变量K 2

的观测值k

⑶如果K 2

的观测值k 很大,说明“X 与Y 有关系”,观测值k 很小,说明“X 与Y 没有关系” 如果k ≥k 0 ,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α,即有α-1的把握认为“X 与Y 有关系” 例1、针对某地区的一种传染病与饮用水进行抽样调查发现:饮用干净水得病5人,不得病50 人,饮用不干净水得病9人,不得病22人。

⑴作出2×2列联表 ⑵能否有90%的把握认为该地区中得传染病与饮用水有关?

例2、为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:

已右在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为.5

⑴请将上面的列联表补充完整;

⑵是否有99.5%的把握认为喜爱打篮球与性别有关?说明你的理由;

⑶已知喜爱打篮球的10位女生中,A 1,A 2,A 3,A 4,A 5还喜欢打羽毛球,B 1,B 2,B 3还喜欢打乒乓球,C 1,C 2还喜欢踢足球,现再从喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的女生中各选出1名进行其他方面的调查,求B 1和C 1不全被选中的概率。