- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
探 究 身 高172 cm的 70
女 大 学 生 的 体 重 一 定 65
是 60.316 kg 吗?如 果
60 55
不 是,其 原 因 是 什 么? 50 显然,身高172cm的女 45
40
大学生的体重不一定 150 155 160 165 170 175 180
是60.316kg但一般可
图1.12
所以
n
Q α,β yi βxi yβx2nyβxα2 i1
n
n
β2xi x2 2βxi xyi y
i1
i1
n
yi y2 nyβxα2
i1
n
n xi xyi y2
nyβxα2 i1
xi x2βi1
n i1
xi x2
n
xi
i1 n
xyi
2
y
n
yi
y2.
xi x2
i1
i1
在上式,后 中两项α和 ,β无关,而前两项为非负 数,因此要Q使取最小,当 值且仅当前两项的值 均为0,即有
n
xi xyi y
β i1 n
,αyβx.
xi x2
i1
这正是我们所要推导的公式.
下面 我们 通过,进 案一 例步学 习回 归分 析 基本 思想 及其. 应用
例 1 从某大学中 8名 随 女 机 大 ,选 其 学 取 身 生高和
回归直线过样本点的中 心.
从已经学过的 ,截知 距 aˆ和 识斜 知 bˆ分 率 道别是使
n
Qα,βyi βxi α2取最小α,值 β的时 值 .
i1 n
由 Q α ,于 β y i β x i y β x y β x α 2
n
i 1
yi βxi yβx22yi βxi yβx
i1
yβxαyβxα2
65
据身高预报体重 ,因此选 60
取身高为自变量 x , 真实 体重为因变量 y .作散点
55
50
45
40
x
150 155 160 165 170 175 180
图 (图1 .1 1) :
图1.11
从图 1 .1 1中可以看出 ,
y
70
样本点呈条状分布
,身
65
60
高和体 重有比 较好的
线性相关关系
, 因此可
以用线 性回归方程 刻
55
50
45
40
x
150 155 160 165 170 175 180
画它们之间的关系
.
图1.11
根据探究中 1和 的 2,可 公以 式得到
aˆ85 .71,b 2 ˆ0.84.9
于是得到回 yˆ0归 .84方 xˆ98 程5 .71.2
所以 ,对身高 17为 c2m的女大,学 由生 回归方程可
n
n
yi βxi yβx22yi βxi yβx
i1
i1
yβxαnyβxα2,
n
注意 yi 到 β xiyβ xyβ xα i 1 n
yβxα yiβxiyβx i1
yβ xα nyiβ nxin yβ x
i 1
i 1
y β x α n y n β x n y β x 0 ,
探究 对于一组具有线性关相系关的数据
x1,y1,x2,y2,,xn,yn,
我们知道其回归方截程距的和斜率的最小
二乘估计公式分:别n 为
xi xyi y
a ˆyb ˆx 1
bˆ i1 n
, 2
xi x2
i1
其
中 x1 n ni1
xi,y
n i1
yi.
x,y称
为 样本点的
中心 .你 能 推 导 出 这公 两式 个?吗 计 算
在 现 实 ,中我 们 经 常 会 遇 到 类面似的下问 题: 肺 癌 是 严 重胁威人 类 性 命 的 一 种,疾 吸病 烟 与 患 肺 癌 有 关 系?肥吗胖 是 影 响 人 类 健 康 的 一 个 重 要 因,身 素 高 和体 重 之 间 是 否 存线在 性 相 关 关?系等 等.
为了回答这些问 ,必题须明确问题涉及象的对 (总体) 是什么,用怎样的量来描述决要的解问 题,并确定获取变量 (数值据)的方法 ,然后用恰 当的方法分析数 ,以据 得到最可靠的.结论
预报其体重为
y0.84917285.71260.316kg.
b0.84是 9 斜率的估 ,说计 明值 身x每 高增加
1个单位 ,体时重 y就增0加 .84个 9 单,这 位表明
体重与身高具性 有相 正关 的.关 线 如系 何描述
它们之间线性的 相强 关?弱 关系
在必修 3中,我们介绍了用相r关 来系 衡数 量
两个变量之间线关 性系 相的 关方.样法本相
关系数的具体计为 算公式
n
xi xyi y
r
i1
.
n
n
xi x2yi y2i1 Nhomakorabeai1
当r 0 时,表明两个变量正相关;当r 0 时, 表明两个变量负相关.r的绝对值越接近1,表 明两个变量的线性相关性越强;r越接近于0 时,表明两个变量之间几乎不存在线性相关 关系.通常,当r大于0.75时认为两个变量有很 强的线性相关关系. 在本例 ,可中以计r算 0出 .79,8这表明体重 与身高有很强关 的关 线,系 性 从相 而也表明 我们建立的回有 归意 模义 型 . 的 是
重数据 11 如 所表 .示
编 号1 2 3 4 5 6 7 8
身/高 cm 161561551771071561551570
体/重 kg4857505464614359
求根据一名女身大高学预生报的她的归体方重 , 程
并预报一名 17身 c2m 的 高女 为大学生 . 的体重
解 由于问题中要求根
70 y
以认为她的体重接60近 .31于6kg.图1.12中的样
由 本于 点所 和有 回的 归直 样线 本的 点 线 位,相 而 不 置互 只 共 说是 明散 了布 这.在 一某 点一
线的附,所 近以身高和体重的 可关 用系 下面的线
在必修模块中,我们学习过关于抽样用 、 样本估计总体、线性归 回等基本知识.本 章中,我们将在此基础上,通过对典型例案 的讨论,进一步讨论线性回归析 分方法及 其应用,并初步了解独立性检的 验基本思 想,认识统计方法在决策的 中作用.
1.2 回归分析
我们知道 ,函数关系是一种确定 性关系 , 而相关关系是一种非确 定性关系 .回归分 析 (regression analysis ) 是对具有相关关 系的两个变量进行统计 分 析的一种常用 方法 .在 《 数学 3 》 中, 我们对两个具有线 性相关关 系的变量利用回归分析 的方法 进行了研究 ,其步骤为画散 点图 ,求回归 直线方程 ,并用回归直线方程进 行预报 .