判断摄氏温度和华氏温度之间是否符合线性关系。
如符合,请通过回归分析计算出摄氏温度和华氏温度之间的线性回归方程。
本课小结
拓展链接——最小二乘法
最小二乘法是一种机器学习的优化技术,其将残差平方之和最小化作为目标
,找到最优模型来拟合已知的观测数据,使得模型所预测的数据与实际数据之间
误差的平方和最小,一般有线性最小二乘法和非线性最小二乘法两种方法。
用线性最小二乘法来解决线性回归模型存在封闭形式(closed-formsolution)
之间
差的绝对值|-y|,将这个差的绝对值作为对应的真实值(即y)和模型预测值(即
)
之间的误差,这个误差通常称为“残差”。
2而不是|-y|引作为“残差”。这样
为了计算方便,在实际中一般使用(-y)
对于给定的n组(x,y)数据,可用不同的a和b来刻画这n组数据所隐含的y=ax+b关
系。对于这些不同的参数,最佳回归模型是最小化残差平方和的均值,即要求n
1
组(x,y)数据得到的残差平均值 σ( − y)2最小。
从残差的定义可看出,残差平均值最小只与参数a和b有关,最优解即使得残
差最小所对应的a和b的值。
2.5.2回归分析中参数计算
可通过最小二乘法(leastsquare)来求解使得残差最小的a和b。
型称为回归模型。
一旦确定了回归模型,就可以进行预测等
分析工作,如从碳排放量预测气候变化程度、
从广告投人量预测商品销售量等。
2.5.1回归分析的概念
二氧化碳浓度在逐年缓慢增加,→二氧化碳浓度=a*年份+b
设时间年份为x、二氧化碳浓度为y,即y=ax+b。