8 线性回归

格式：ppt
大小：709.00 KB
文档页数：52

下载文档原格式

/ 52

【线性回归】线性回归模型中几个参数的解释

【线性回归】线性回归模型中⼏个参数的解释【线性回归】线性回归模型中⼏个参数的解释R ⽅1. 决定系数/拟合优度类似于⼀元线性回归，构造决定系数。

称为y 关于⾃变量的样本复相关系数。

其中，，有SST=SSR+SSE总离差平⽅和记为SST ，回归平⽅和记为SSR ，残差平⽅和为SSE 。

由公式可见，SSR 是由回归⽅程确定的，即是可以⽤⾃变量x 进⾏解释的波动，⽽SSE 为x 之外的未加控制的因素引起的波动。

这样，总离差平⽅和SST 中能够由⽅程解释的部分为SSR ，不能解释的部分为SSE 。

1. 意义意味着回归⽅程中能被解释的误差占总误差的⽐例。

⼀般来说越⼤，拟合效果越好，⼀般认为超过0.8的模型拟合优度⽐较⾼。

需要注意的是当样本量⼩时，很⼤（例如0.9）也不能肯定⾃变量与因变量之间关系就是线性的。

随着⾃变量的增多，必定会越来越接近于１，但这会导致模型的稳定性变差，即模型⽤来预测训练集之外的数据时，预测波动将会⾮常⼤，这个时候就会对作调整，调整R ⽅可以消除⾃变量增加造成的假象。

F 检验0、预备知识（1）假设检验为了判断与检测X 是否具备对Y 的预测能⼒，⼀般可以通过相关系数、图形等⽅法进⾏衡量，但这只是直观的判断⽅法。

通过对回归参数做假设检验可以为我们提供更严格的数量化分析⽅法。

（2）全模型与简化模型我们称之为全模型（full Model,FM ）通过对某些回归系数进⾏假设，使其取指定的值，把这些指定的值带⼊全模型中，得到的模型称为简化模型（reduced model,RM ）。

常⽤的简化⽅法将在之后介绍。

1、F 检验检验是线性模型的假设检验中最常⽤的⼀种检验，通过值的⼤⼩可以判断提出的假设是否合理，即是否接受简化模型。

1. 为检验我们的假设是否合理，即评估简化模型相对全模型拟合效果是否⼀样好，需要先建⽴对两个模型拟合效果的评价⽅法。

这⾥我们通过计算模型的残差平⽅和（）来衡量模型拟合数据时损失的信息量，也表⽰模型的拟合效果。

线性回归算法原理

线性回归算法原理
线性回归是一种预测模型，用于建立自变量（输入）与因变量（输出）之间的线性关系。

其原理基于最小二乘法，通过拟合一条最优直线来描述数据点的分布趋势。

线性回归假设自变量与因变量之间存在线性关系，可以表示为
y = β0 + β1x + ε，其中 y 是因变量，x 是自变量，β0 和β1 是
回归系数，ε 是随机误差项。

回归系数的求解过程是通过最小化残差平方和来实现的，即找到使得∑(yi - β0 - β1xi)² 最小化的β0 和β1。

求解过程主要利用了最小二乘法，该方法通过对误差的平方和进行求导，使得导数等于零得到回归系数的估计值。

对于简单线性回归来说，只有一个自变量，回归方程可以表示为y = β0 + β1x + ε。

而对于多元线性回归，有多个自变量，回归方程可以表示为y = β0 + β1x1 + β2x2 + ... + βnxn + ε。

线性回归模型在实际应用中具有广泛的适用性，特别是在预测和预测分析领域。

它可以用来解决许多实际问题，如房价预测、销售量预测、趋势分析等。

线性回归方程推导

sklearn - 线性回归(正规方程与梯度下降)一: 线性回归方程线性回归（英语：linear regression）是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。

这种函数是一个或多个称为回归系数的模型参数的线性组合。

只有一个自变量的情况称为简单回归，大于一个自变量情况的叫做多元回归在线性回归中，数据使用线性预测函数来建模，并且未知的模型参数也是通过数据来估计。

这些模型被叫做线性模型。

最常用的线性回归建模是给定X值的y的条件均值是X的仿射函数。

不太一般的情况，线性回归模型可以是一个中位数或一些其他的给定X的条件下y的条件分布的分位数作为X的线性函数表示。

像所有形式的回归分析一样，线性回归也把焦点放在给定X值的y的条件概率分布，而不是X 和y的联合概率分布（多元分析领域）。

线性回归有很多实际用途。

分为以下两大类：如果目标是预测或者映射，线性回归可以用来对观测数据集的和X的值拟合出一个预测模型。

当完成这样一个模型以后，对于一个新增的X值，在没有给定与它相配对的y的情况下，可以用这个拟合过的模型预测出一个y给定一个变量y和一些变量X1X1.,XpXp{displaystyleX_{1}}X_1.,{displaystyle X_{p}}X_pX1?X1?.,Xp?Xp?，这些变量有可能与y相关，线性回归分析可以用来量化y与Xj之间相关性的强度，评估出与y不相关的，XjXj{displaystyle X_{j}}X_jXj?Xj?并识别出哪些XjXj{displaystyle X_{j}}X_jXj?Xj?的子集包含了关于y的冗余信息。

使用sklearn线性回归模型(jupyter)这里我们以波士顿的房价数据来进行使用分析(一): 导入sklearnimport numpy as np# 线性回归,拟合方程,求解系数, 一次幂# 线性方程:直来直去,不拐弯from sklearn.linear_model import LinearRegression# 导入数据集from sklearn import datasets# 导入数据分离的方法(获取数据后,一部分数据用来让回归模型学习,另一部分用来预测)from sklearn.model_selection import train_test_split(二): 获取波士顿房价数据# 获取的数据是numpy,ndarray类型data = datasets.load_boston()# 该数据内有完整的影响房价的因素和完整的房价信息,本次实验就是将数据分为两部分, 一部分用来训练模型,另一部分用来预测,最后将预测出来的数据和已有的完整信息进行对比,判断该模型是否适用于这组房价数据data # 查看data的数据结构data.feature_names # 查看影响房价的属性名# x是属性,特征,未知数X = data['data']X.shape # 运行结果是(506, 13), 506表示样本是506个, 每个样本采集了13个属性特征;13个属性,需要构建构建了13元一次方程# y是房价的估值y = data['target']# X, y = datasets.load_boston(True) 获取到X, y的值和以上的一样(三): 使用模型进行预测X_train, X_test, y_train, y_test = train_test_split(X, y) # 将数据进行分离(默认是3:1); train_test_split(X, y)函数会随机打乱顺序display(X_train.shape, X_test.shape) # (379, 13) ; (127, 13) # 声明算法linear = LinearRegression()# 训练模型linear.fit(X_train, y_train) # X_train, y_train是之前分离出来用来训练模型的数据y_ = linear.predict(X_test).round(1) # X_test是影响房价的因素,该预测模型能根据影响房价的因素预测剩余部分的房价# 预估数据和实际数据比较print(y_)print(y_test)经过估计数据和实际数据对比,说明算法模型适用于数据(四): 自建方程预测数据与使用线性模型得到的数据对比假设波士顿的房价数据符合线性回归的特性,则我们可以通过构建线性方程来预测波士顿剩余部分的房价信息根据一次线性回归方程: f(X)=Xw+bf(X) = Xw+bf(X)=Xw+b 可推导得出: f(X)=w1x1+W2x2+.+w13x13+b f(X) = w_1x_1+W_2x_2+.+w_{13}x_{13} +bf(X)=w1?x1?+W2?x2?+.+w13?x13?+b (有13个影响房价的因素)代码如下:# 通过训练模型,可从模型中得出系数ww_ = linear.coef_# 通过训练模型,可从模型中得出截距bb_ = linear.intercept_# 自建方程def fun(w_, b_, X):return np.dot(X, w_)+b_# 调用方程得到预估的房价信息fun(w_, b_, X_test).round(1) # round(1)保留一位小数array([31.3, 13.4, 28.6, 20.5, 20.4, 19.4, 32.2, 24. , 25.8, 29.5,24.5,25.2, 31.9, 8.2, 20.9, 29.3, 22.3, 35.2, 16.4, 18.5, 30.8, 41.1,16.2, 13.7, 17.7, 23.8, 7.8, 12. , 20.5, 15.3, 29.3, 26.8, 31.8,26. , 30.4, 39.2, 25.3, 40.7, 11.6, 27.3, 16.7, 18.8, 19.5, 19.9,20.7, 22.8, 17.4, 21.6, 23.3, 30. , 25.2, 23.7, 34.2, 18.2, 33.5,16. , 28.3, 14.1, 24.2, 16.2, 16.7, 23.5, 16. , 21.4, 21.8, 28.2,25.7, 31.2, 18.8, 26.4, 28.3, 21.9, 27.5, 27.1, 27.1, 15. , 26. ,26.3, 13.2, 13.3, 26.1, 20.5, 16.8, 24.3, 36.6, 21.4, 8.3, 27.8,3.6, 19.2, 27.5, 33.6, 28.4, 34.3, 28.2, 13.3, 18. , 23.5, 30.4,32.9, 23.7, 30.5, 19.8, 19.5, 18.7, 30.9, 36.3, 8. , 18.2, 13.9,15. , 26.4, 24. , 30.2, 20. , 5.6, 21.4, 22.9, 17.6, 32.8, 22.1,32.6, 20.9, 19.3, 23.1, 21. , 21.5])# 使用sklesrn中的线性模型得到的预估房价信息linear.predict(X_test).round(1)array([31.3, 13.4, 28.6, 20.5, 20.4, 19.4, 32.2, 24. , 25.8, 29.5,24.5,25.2, 31.9, 8.2, 20.9, 29.3, 22.3, 35.2, 16.4, 18.5, 30.8, 41.1,16.2, 13.7, 17.7, 23.8, 7.8, 12. , 20.5, 15.3, 29.3, 26.8, 31.8,26. , 30.4, 39.2, 25.3, 40.7, 11.6, 27.3, 16.7, 18.8, 19.5, 19.9,20.7, 22.8, 17.4, 21.6, 23.3, 30. , 25.2, 23.7, 34.2, 18.2, 33.5,16. , 28.3, 14.1, 24.2, 16.2, 16.7, 23.5, 16. , 21.4, 21.8, 28.2,25.7, 31.2, 18.8, 26.4, 28.3, 21.9, 27.5, 27.1, 27.1, 15. , 26. ,26.3, 13.2, 13.3, 26.1, 20.5, 16.8, 24.3, 36.6, 21.4, 8.3, 27.8,3.6, 19.2, 27.5, 33.6, 28.4, 34.3, 28.2, 13.3, 18. , 23.5, 30.4,32.9, 23.7, 30.5, 19.8, 19.5, 18.7, 30.9, 36.3, 8. , 18.2, 13.9,15. , 26.4, 24. , 30.2, 20. , 5.6, 21.4, 22.9, 17.6, 32.8, 22.1,32.6, 20.9, 19.3, 23.1, 21. , 21.5])通过自建模型获取预估数据与使用模型获取预估数据进行比较,两组数据完全一致;(五): 使用线性回归,求解斜率和截距根据最小二乘法: min?w∣∣Xw?y∣∣22min_{w}||Xw-y||_2^2wmin?∣∣Xw?y∣∣22? 推到得出公式: w=(XTX)?1XTyw = (X^TX)^{-1}X^Tyw=(XTX)?1XTy 以上公式只能求出w,我们可以先求出w再计算出b;但此处我们有更简单的方法:根据线性回归方程f(x)=w1x1+w2x2+b f(x) = w_1x_1+w_2x_2+bf(x)=w1?x1?+w2?x2?+b 我们可以将方程中的b看成是w3x30w_3x_3^0w3?x30?,所以可得: f(x)=w1x11+w2x21+w3x30f(x) = w_1x_1^1+w_2x_2^1+w_3x_3^0f(x)=w1?x11?+w2?x21?+w3?x30?代码如下:import numpy as npfrom sklearn.linear_model import LinearRegressionfrom sklearn import datasetsX, y = datasets.load_boston(True)linear = LinearRegression()linear.fit(X,y)w_ = linear.coef_b_ = linear.intercept_# 向X中插入一列全是1的数据(任何数的0次方都是1)X = np.concatenate([X, np.ones(shape = (506, 1))], axis=1) # 根据最小二乘法的推导公式:w和b的值为(最后一个值是b)w = ((np.linalg.inv(X.T.dot(X))).dot(X.T)).dot(y)# 以上w的写法过于装逼,所以分解为:# A = X.T.dot(X) 求X和转置后的X的内积(公式中的XTX)# B = np.linalg.inv(A) 求A的逆矩阵(公式中的-1次方)# C = B.dot(X.T) 求以上矩阵和X的转置矩阵的内积(公式中的XT) # w = C.dot(y) 与y求内积,得出w和b运行结果:array([-1.08011358e-01, 4.64204584e-02, 2.05586264e-02, 2.68673382e+00,-1.77666112e+01, 3.80986521e+00, 6.92224640e-04, -1.47556685e+00,3.06049479e-01, -1.23345939e-02, -9.52747232e-01,9.31168327e-03,-5.24758378e-01, 3.64594884e+01])print(b_)运行结果:36.45948838509001扩展一: 最小二乘法和向量范数min?w∣∣Xw?y∣∣22min_{w}||Xw-y||_2^2wmi n?∣∣Xw?y∣∣22?右上角的2是平方右下角的2是向量2范数竖线内的表达式是向量根据最小二乘法的公式, 推导得出w=(XTX)?1XTyw = (X^TX)^{-1}X^Tyw=(XTX)?1XTy向量的1-范数(表示各个元素的绝对值的和)∣∣X∣∣1=∑i=1n∣xi∣||X||_1 = sumlimits_{i=1}^n |x_i|∣∣X∣∣1?=i=1∑n?∣xi?∣向量的2-范数(表示每个元素的平方和再开平方)∣∣X∣∣2=∑i=1nxi2||X||_2 = sqrt{suml imits_{i=1}^n x_i^2}∣∣X∣∣2?=i=1∑n?xi2?向量的无穷范数(所有向量元素绝对值中的最大值)∣∣X∣∣∞=max?1≥i≤n∣Xi∣||X||_{infty} = maxlimits_{1 geq i leq n}|X_i|∣∣X∣∣∞?=1≥i≤nmax?∣Xi?∣扩展二: 导数, 偏导数对函数f(x)=x2+3x+8f(x) = x^2+3x+8f(x)=x2+3x+8 求导得: f(x)′=2x+3f(x)' = 2x+3f(x)′=2x+3求导规则:参数求导为0参数乘变量求导为常数变量的次方求导: xyx^yxy求导为yxy?1yx^{y-1}yxy?1复合函数求导:$$(x^2-x)^2$$求导: 先将括号看成一个整体求导, 结果再乘以括号内的求导结果$$2(x^2-x)(2x-1)$$有多个变量得函数求导:对函数: f(x,y)=x2+xy+y2f(x, y) = x^2+xy+y^2f(x,y)=x2+xy+y2 求导:求导规则: 多变量函数只能针对某一个变量求导,此时将其他变量看成常数将x看成常数a: fa(y)=a2+ay+y2f_a(y) = a^2+ay+y^2fa?(y)=a2+ay+y2求导得:fa′(y)=a+2yf_a'(y) = a+2yfa′?(y)=a+2y故求导得: ?f?y(x,y)=x+2yfrac{partial f}{partial y}(x,y)=x+2y?y?f?(x,y)=x+2y实现线性回归的两种方式:正规方程梯度下降二: 正规方程(一): 损失函数最小二乘法:min?w∣∣Xw?y∣∣22minlimits_{w}||Xw-y||_2^2wmin?∣∣Xw?y∣∣22?当X和y都是常数时,按照向量2范数将上面的最小二乘法解开:f(w)=(Xw?y)2f(w)=(Xw-y)^2f(w)=(Xw?y)2将X,y替换成常数a,bf(w)=(aw?b)2f(w)=(aw-b)^2f(w)=(aw?b)2f(w)=a2w2?2abw+b2f(w)=a^2w^2 - 2abw + b^2f(w)=a2w2?2abw+b2 由于最小二乘法方程的函数值都是大雨或等于0的,所以此时得到一个开口向上的抛物线(一元二次方程)此时的f(w)f(w)f(w)就是损失函数,在此时求该函数的导数(抛物线函数顶点的导数为0)就能得到该函数的最小值,也就是最小损失f′(w)=2a2w?2ab=0f'(w)=2a^2w-2ab=0f′(w)=2a2w?2ab=0(二): 矩阵常用求导公式X的转置矩阵对X矩阵求导, 求解出来是单位矩阵dXTdX=Ifrac{dX^T}{dX} = IdXdXT?=IdXdXT=Ifrac{dX}{dX^T} = IdXTdX?=IX的转置矩阵和一个常数矩阵相乘再对X矩阵求导, 求解出来就是改常数矩阵dXTAdX=Afrac{dX^TA}{dX} = AdXdXTA?=AdAXdX=ATfrac{dAX}{dX} = A^TdXdAX?=ATdXAdX=ATfrac{dXA}{dX} = A^TdXdXA?=ATdAXdXT=Afrac{dAX}{dX^T} = AdXTdAX?=A(三): 正规方程矩阵推导过程此时X,w,y都是矩阵1: 公式化简1: 最小二乘法:f(w)=∣∣Xw?y∣∣22f(w) = ||Xw-y||_2^2f(w)=∣∣Xw?y∣∣22?2: 向量2范数:∣∣X∣∣2=∑i=1nxi2||X||_2 = sqrt{sumlimits_{i = 1}^nx_i^2}∣∣X∣∣2?=i=1∑n?xi2?3: 将向量2范数的公式带入到最小二乘法中得:f(w)=((Xw?y)2)2f(w)=(sqrt{(Xw-y)^2})^2f(w)=((Xw?y)2?)2f(w)=(Xw?y)2f(w)=(Xw-y)^2f(w)=(Xw?y)2由于X, w, y都是矩阵, 运算后还是矩阵; 矩阵得乘法是一个矩阵得行和另一个矩阵得列相乘; 所以矩阵的平方就是该矩阵乘以他本身的转置矩阵f(w)=(Xw?y)T(Xw?y)f(w)=(Xw-y)^T(Xw-y)f(w)=(Xw?y)T(Xw?y)注意: 整体转置变成每个元素都转置时,若是有乘法, 则相乘的两个矩阵要交换位置; 如下所示!f(w)=(wTXT?yT)(Xw?y)f(w)=(w^TX^T-y^T)(Xw-y)f(w)=(wTXT?yT)(Xw y)f(w)=wTXTXw?wTXTy?yTXw+yTyf(w)=w^TX^TXw-w^TX^Ty-y^TXw+y^Tyf( w)=wTXTXw?wTXTy?yTXw+yTy注意: 若想交换两个相乘的矩阵在算式中的位置,则交换之后双方都需要转置一次; 如下所示!f(w)=wTXTXw?(XTy)T(wT)T?yTXw+yTyf(w)=w^TX^TXw-(X^Ty)^T(w^T)^ T-y^TXw+y^Tyf(w)=wTXTXw?(XTy)T(wT)T?yTXw+yTyf(w)=wTXTXw?yTXw?yTXw+yTyf(w)=w^TX^TXw-y^TXw-y^TXw+y^Tyf(w)= wTXTXw?yTXw?yTXw+yTyf(w)=wTXTXw?2yTXw+yTyf(w) = w^TX^TXw - 2y^TXw + y^Ty f(w)=wTXTXw?2yTXw+yTyf(w)=wTXTXw?2yTXw+yTyf(w) = w^TX^TXw - 2y^TXw + y^Ty f(w)=wTXTXw?2yTXw+yTy这里 yTyy^TyyTy 是常数求导后为02yTXw2y^TXw2yTXw 求导:d(2yTX)wdw=(2yTX)T=2XT(yT)T=2XTyfrac{d(2y^TX)w}{dw}=(2y^TX)^ T=2X^T(y^T)^T=2X^Tydwd(2yTX)w?=(2yTX)T=2XT(yT)T=2XTy wTXTXww^TX^TXwwTXTXw求导:dwTXTXwdw=d(wTXTX)wdw+dwT(XTXw)dw=(wTXTX)T+XTXw=XT(XT)T(wT)T +XTXw=2XTXwfrac{dw^TX^TXw}{dw}=frac{d(w^TX^TX)w}{dw}+frac{dw^T(X^TXw)}{dw}=(w^TX^TX)^T+X^TXw=X^T(X^T)^T(w^T)^T+X^TXw=2X^TXwdwd wTXTXw?=dwd(wTXTX)w?+dwdwT(XTXw)?=(wTXTX)T+XTXw=XT(XT)T(wT)T+XT Xw=2XTXwf′(w)=2XTXw?2XTyf'(w) = 2X^TXw - 2X^Tyf′(w)=2XTXw?2XTy令f′(w)=0f'(w)=0f′(w)=0,则:2XTXw?2XTy=02X^TXw - 2X^Ty = 02XTXw?2XTy=0XTXw=XTyX^TXw=X^TyXTXw=XTy矩阵运算没有除法,可以用逆矩阵实现除法的效果等式两边同时乘以XTXX^TXXTX的逆矩阵(XTX)?1(X^TX)^{-1}(XTX)?1 (XTX)?1(XTX)w=(XTX)?1XTy(X^TX)^{-1}(X^TX)w=(X^TX)^{-1}X^Ty(X TX)?1(XTX)w=(XTX)?1XTyIw=(XTX)?1XTyIw=(X^TX)^{-1}X^TyIw=(XTX)?1XTy I是单位矩阵得到正规方程:w=(XTX)?1XTyw=(X^TX)^{-1}X^Tyw=(XTX)?1XTy(四): 数据挖掘实例(预测2020年淘宝双十一交易额)import numpy as npimport matplotlib.pyplot as pltfrom sklearn.linear_model import LinearRegressionX = np.arange(2009, 2020) # 年份X = X -2008 # 年份数值太大,差别不明显y = np.array([0.5, 9.36, 52, 191, 350, 571, 912, 1207, 1682, 2135, 2684]) # 09年到19年的交易额假设X和y之间是一元三次的关系(按照前几年的数据走势提出的假设)f(x)=w1x+w2x2+w3x3+bf(x)=w_1x+w_2x^2+w_3x^3+bf(x)=w1?x+w2?x2 +w3?x3+bf(x)=w0x0+w1x1+w2x2+w3x3f(x)=w_0x^0+w_1x^1+w_2x^2+w_3x^3f(x) =w0?x0+w1?x1+w2?x2+w3?x3# X_oo = np.concatenate([a,a]) # 横着级联X_train = np.c_[X**0, X**1, X**2, X**3] # 竖着级联array([[ 1, 1, 1, 1],[ 1, 2, 4, 8],[ 1, 3, 9, 27],[ 1, 4, 16, 64],[ 1, 5, 25, 125],[ 1, 6, 36, 216],[ 1, 7, 49, 343],[ 1, 8, 64, 512],[ 1, 9, 81, 729],[ 1, 10, 100, 1000],[ 1, 11, 121, 1331]], dtype=int32)linear = LinearRegression(fit_intercept=False) # 声明算法; fit_intercept=False将截距设置为0, w0就是截距linear.fit(X_train, y) # 训练w_ = linear.coef_print(linear.coef_.round(2)) # 获取系数print(linear.intercept_) # 获取截距[ 58.77 -84.06 27.95 0.13]可以得到方程:f(x)=58.77?84.06x+27.95x2+0.13x3f(x)=58.77-84.06x+27.95x^2+0 .13x^3f(x)=58.77?84.06x+27.95x2+0.13x3X_test = np.linspace(0,12,126) # 线性分割(将0,12之间分成126分)等差数列包含1和12X_test = np.c_[X_test**0, X_test**1, X_test**2, X_test**3] # 和训练数据保持一致y_ = linear.predict(X_test) # 使用模型预测plt.plot(np.linspace(0,12,126), y_, color='g') # 绘制预测方程曲线plt.scatter(np.arange(1,12), y, color='red') # 绘制每年的真实销量# 定义函数fun = lambda x : w_[0] + w_[1]*x + w_[2]*x**2 + w_[-1]*x**3 '''3294.2775757576132'''三: 梯度下降梯度下降法的基本思想可以类比为一个下山的过程。

新教材高中数学8-2一元线性回归模型及其应用8-2-1一元线性回归模型8-2-2一元线性回归模型参数

z
人数y/万
z
人数y/万
2.25
12.39
2.48
37.57
2.30
20.02
2.53
40.23
2.35
25.57
2.56
40.95
由表中数据可得 y 关于 z 的经验回归方程为
^ =-157.74+77.62z,
^
故所求的非线性经验回归方程为y =-157.74+77.62ln x.
2.40
30.26
(3)某运动员训练次数与成绩之间的数据及相应的残差数据为
x
y
30
30
33
34
35
37
37
39
e=y-y
-1.241 1
-0.365 6
0.551 4
0.468 4
x
y
39
42
44
46
46
48
50
51
1.385 4
0.177 9
0.094 9
-1.071 1
^
^
^
^
e=y-y
残差图如图所示.
由图可知,残差比较均匀地分布在横轴的两边,说明选用的模型比较合适.
变式训练1[人教B版教材例题]某人工智能公司从某年起7年的利润情况如
下表所示.
第x年
1
2
3
4
5
6
7
利润y/亿元
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)计算出y与x之间的样本相关系数(精确到0.01),并求出y关于x的经验回归
方程;
(2)根据经验回归方程,分别预测该人工智能公司第8年和第9年的利润.

线性回归模型

2.11 模型的结构稳定性检验：Chow检验
2.12正态性检验：Jarque—Bera检验
3
1 回归模型的一般描述
一、变量间的关系
1. 函数关系：变量间却定性的对应关系 2. 相关关系：变量间不确定的对应关系（1）相关关系强弱的测度——相关系数：
r
(yi y)(ixx)
(xi x)2 (yi y)2
万人消费增加0.665万元。
2004 2005
31.3 36
48.5 54.8
56.16 56.98
28
2.7 多元线性回归的显著性检验
一、经济检验二、拟合优度检验三、回归方程的显著性检验四、回归系数的显著性检验五、序列相关检验
21
2.6 多元线性回归的参数估计
一、参数估计方法
1. 基本原理： Q (yiyˆi)2min
2. 根据微分极值原理，采用矩阵形式求解
B(XTX)1XTY
一元回归的参数估计是多元回归参数估计的特例。
22
2.6 多元线性回归的参数估计
二、利用Excel进行参数估计
其操作步骤为：点击［工具］→点击［数据分析］→选择［回归］→点击［确定］→输入［值输入区域］→输入［值输入区域］→输入［置信度］→在［输出选项］选择［输出区域］或［新工作组表］或［新工作簿］→点击［确定］，即可得到输出结果
五、一元回归方程的显著性检验小结
1. 拟合优度通常要求R2 0.8，且与相关系数之间的关系 R2 r2，但通常不用相关系数判断拟合优度；
2. 对于一元回归，方程的显著性检验和回归系数的显著性检验是一致的，做一个即可。
16
3 一元线性回归的显著性检验
六、续例，给定显著性水平解：根据运行结果（1） R2 RSS0.990.8

8.2.1一元线性回归模型

E(e) 0, D(e) 2. (1)
确定儿子身高Y 吗？
e 不能，因为随机误差不可事先设定.
四、模型理解
• 当父亲身高为 xi ，对应的儿子身高 yi 不是唯一
确定的,而是有很多可能的取值，记作
yi bxi a e
它们的均值为：
E( yi ) E(bxi a e) bE(xi ) E(a) E(e) bxi a 0 bxi a.
（2）销售量与广告费用之间的关系能否用一元线性回归模
型 Y bx a e,
来刻画？
E(e) 0, D(e) 2.
（3）请说明模型中 bx a与e分别表示什么？本题中 e 的具
体含义是什么？
1 2 3 4 5 6 7 8 9 10 11 12 13 14 174 170 173 169 182 172 180 172 168 166 182 173 164 180 176 176 170 170 185 176 178 174 170 168 178 172 165 182
儿子身高父亲身高
176 176 170 170 185 176 178 174 170 168 178 172 165 182
问题1 由这组样本数据能否推断儿子的身高
与父亲的身高有关系？关系的相关程度如何？是函数关系还是线性相关关系？为什么？
（1）散点图
（2）相关系数 r 0.886
选择性必修三8.2.1 ggb文件.ggb (命令行)
问题8 • 一元线性回归模型有何作用？
当父亲身高为 xi 时可以通过
E( yi ) bxi a
了解儿子身高的总体情况，从而预测儿子的身高.
问题9
• 产生随机误差的原因有哪些？ • （1）除父亲身高外其他可能影响儿子身高

线性回归计算方法及公式

量重新构建新的方程。
若H0成立，可把Xj从回归方程中剔除，余下变
标准化偏回归系数和确定系数 • 标准化偏回归系数：
在比较各自变量对应变量相对贡献大小时，由于各自变量的单位不同，不能直接用偏回归系数的大小作比较，须用标准化偏回归系数。
bj ´ = bj (sj / sy)
确定系数：
简记为R2，即回归平方和SS回归与总离均差平方和SS总的比例。 R2 ＝ SS回归／ SS总可用来定量评价在Y的总变异中，由P个 X变量建立的线性回归方程所能解释的比例。
Logistic回归的参数估计
• Logistic回归模型的参数估计常用最大似然法，最大似然法的基本思想是先建立似然函数或对数似然函数，似然函数或对数似然函数达到极大时参数的取值，即为参数的最大似然估计值。其步骤为对对数似然函数中的待估参数分别求一阶偏导数，令其为0得一方程组，然后求解。由于似然函数的偏导数为非线性函数，参数估计需用非线性方程组的数值法求解。常用的数值法为Newton-Raphson法。不同研究的设计方案不同，其似然函数的构造略有差别，故Logistic回归有非条件 Logistic回归与条件Logistic回归两种。
• 逐步引入－剔除法（stepwise selection) 先规定两个阀值F引入和F剔除，当候选变量中最大F值＞＝F引入时，引入相应变量；已进入方程的变量最小F＜＝F剔除时，剔除相应变量。如此交替进行直到无引入和无剔除为止。（计算复杂）
多元线性回归方程的作用
• 因素分析 • 调整混杂因素的作用 • 统计预测
内容安排
多元线性回归模型与参数估计
• 设有自变量x1,x2,…,xp和因变量Y以及一份由n个个体构成的随机样本(x1i,x2i,…,xpi,,#43;B1x1+B2x2+…+Bp xp+ (模型）

SPSS数据分析教程-8-线性回归分析

为因变量或响应变量，它为随机变量； 2为随机误差。 ? 通常假设2～N(0,? 2)，且假设与X无关。
回归模型的主要问题
? 进行一元线性回归主要讨论如下问题：
(1) 利用样本数据对参数ˉ 0, ˉ 1和? 2，和进行点估计，得到经验回归方程
(2) 检验模型的拟合程度，验证Y与X之间的线性相关的确存在，而不是由于抽样的随机性导致的。
Radj
=
1?
SSE=(n ? p ? 1) SST=(n ? 1)
=
1?
n? 1 n ? p ? 1(1 ?
R2)
应用举例
? 数据文件performance.sav记录了一项企业心理学研究的数据。它调查了一个大型金融机构的雇员，记录了他们和主管的交互情况的评价和对主管的总的满意情况。我们希望该调查来了解主管的某些特征和对他们的总的满意情况的相互关系。
应用回归分析的步骤
? 步骤1：写出研究的问题和分析目标 ? 步骤2：选择潜在相关的变量 ? 步骤3：收集数据 ? 步骤4：选择合适的拟合模型 ? 步骤5：模型求解 ? 步骤6：模型验证和评价 ? 步骤7：应用模型解决研究问题
简单线性回归
? 简单线性回归的形式为：
? Y = ˉ 0 +ˉ 1 X +2 ? 其中变量X为预测变量，它是可以观测和控制的；Y
(3) 利用求得的经验回归方程，通过X对Y进行预测或控制。
简单回归方程的求解
? 我们希望根据观测值估计出简单回归方程中的待定系数ˉ 0和ˉ 1，它们使得回归方程对应的响应变量的误差达到最小，该方法即为最
小二乘法。
也就是求解ˉ 0和ˉ 1，使得 Xn S(ˉ 0; ˉ 1) = (y iቤተ መጻሕፍቲ ባይዱ? ˉ 0 ? ˉ 1X i )2

线性回归分析及应用7-8

n p 定理 8.1.1：在上述假定下，
1.Eˆ ，Var (ˆ) 2 ( X X )1，Eˆ 2 2； 2. (Gauss-Markov 定理)对c ，cˆ 是其唯一
的 BLUE；
若进一步假定误差为正态分布，则
3.对c ，cˆ 是其唯一的 MVUE；
4.ˆ
~
Np
, 2 ( X X )1
次试验中所取值的中心点处。记
n
xij
xj
i 1
n
,1 j p 1 ， x (x1,, xp1) ，
n
yi
y i1 ，则中心化后模型分量形式为： n
yi 1(xi1 x1) p1(xi, p1 xp1) ei
其中 0 xI ，写成矩阵形式为 Y En X~cI e ， Ee 0 ，Cov(e) 2In ，
Y
Xˆs
ns
2
，统计量
Cp
为J p的一个合理估计。
Cp criterion：回归协变量集的选择应使 Cp
达到最小。
Akaike Information Criterion(AIC 准则)
设 y1,, yn为一组样本，服从某个含 p个
参数的模型，参数用向量
表示，似然函
p1
数为lp (Y )，设参数的极大似然估计为 ˆ，令
rij k 1
si s j
若把协变量看成随机的，则 rij 正好是协变量
xi与x j 的样本相关系数。中心化后标准化的
好处在于： 1. R 可以分析协变量之间的相关关系； 2. 消去了单位和取值范围的差异 ( R 无量纲)。
用Z 作为设计矩阵，此时分量形式为：1in，
0I p1
。

统计学第八章线性回归分析

31
8.1.5 置信与预测区间
第八章线性回归分析
《统计学》
32
8.1.5 置信与预测区间
第八章线性回归分析
《统计学》
33
8.1.5 置信与预测区间
第八章线性回归分析
《统计学》
34
8.1.5 置信与预测区间
例8.4. 利用例8.1中的回归方程，计算车龄为48个月的二手车对数销售价格的置信水平为0.95的置信区间以及预测区间。解.
第八章线性回归分析
《统计学》
38
8.2.2.1 最小二乘估计
第八章线性回归分析
《统计学》
39
8.2.2.1 最小二乘估计
第八章线性回归分析
《统计学》
40
8.2.2.1 最小二乘估计
第八章线性回归分析
《统计学》
41
8.2.2.1 最小二乘估计
第八章线性回归分析
《统计学》
42
8.2.2 回归系数的统计推断
统计学
第八章线性回归分析
统计与管理学院
第八章线性回归分析
8.1 简单线性回归 8.2 多元线性回归 8.3 回归模型的评估 8.4 残差分析 8.5 变量选择
第八章线性回归分析
《统计学》
2
第八章线性回归分析
二手车价格预测
美一家大型丰田汽车经销商为打算购买丰田汽车的顾客提供了回收二手丰田车的选择，作为以旧换新的交易的一部分。
表: 二手丰田卡罗拉销售数据变量说明表
第八章线性回归分析
《统计学》
18
例8.1.（续）为了便于说明问题，暂时不考虑行驶里程(KM)低于500公里的数据，最终共1425个观测值。下表展示了部分数据。请根据数据建立销售价格关于车龄的回归方程，并根据回归方程预测车龄为48个月的二手丰田卡罗拉的销售价格。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

n 50
2 2
Lxx ( x x )
2
x x n
116 .8 335 .30 62.4552 50
2
3.3920 b 0.0543 Lxx 62 .4552
b0 y bx 0.1287 0.0543 2.336 0.0009552 0.001
（一）、平方和的分解
假设x、y有n对观测值，直线回归方程为对应有一个回归值。
x x1 x2 … xi
ˆ y b0 bx
每一个实测y值都
…
xn
x
y
y
y1
y2
…
yi
…
yn
ˆ y
ˆ y1
ˆ y2
…
ˆ yi
…
ˆ yn
因变量y的某一个实测值yi的变异情况
ˆ ˆ yi y yi y y i y i ˆ ( yi y )
22
23 24 25
2.4
2.3 2.3 2.2
0.13
0.14 0.10 0.13
47
48 49 50
0.7
0.6 0.5 0.5
0.04
0.05 0.04 0.03
二、直线回归方程的配置
通过散点图初步判断，x和y之间的关系具有直线相关关系，就可以用一条直线方程来描述x和y之间的关系
ˆ y b0 bx
F F
2 SU F 2 SQ
回归变异的方差显著大于剩余变异的方差，即在因变量由于由于误差或其它为受控制的因素所引起的变异，x和y关系密切。
F F
回归变异的方差没有显著大于剩余变异的方差，即在因变量y的总变异中，由于与自变量x的相关性所引起的变异没有显著大于了由于由于误差或其它为受控制的因素所引起的变异，x和y关系不密切。
y/x
x固定的条件下Y的所有取值的的平均数，称为y的总体条件平均数。
y的总体条件平均数uy/x就是唯一确定的一个数值， uy/x与x之间就体现出一种函数关系，相关关系就可以用函数关系来反映。
y / x f ( x)
统计学上称为回归方程，文字表述为变量y依变量x回归，不表述为变量y是变量x的函数，以示区别。
Lxy
ˆ y 0.001 0.0543 x
三、直线回归方程的方差分析
直线回归方程的方差分析是把因变量y的总变异分为两部分，一部分是由于与自变量x的相关性所引起的变异（由于受自变量x的制约所引起的变异）—— 回归变异；一部分是由于试验误差或其它未受控制的因素所引起的变异——剩余变异，然后计算回归变异和剩余变异的方差，再把回归变异的方差与剩余变异的方差进行差异显著性检验。
用。
很显然，具有因果关系的变量也可以用相关分析去判断，变量间的关系密切程度。
第二节一元线性回归（直线回归）
一、作散点图作初步判断
x和y有n对观测值， (x1，y1)、(x2，y2)、…、(xn，yn)，每对观测值在坐标图上就有n个观测点，如果n个观测点在坐标图上趋近一条直线，我们就可初步判断两个变量之间的关系是直线关系，才可进行直线回归，配置一条直线方程来描述他们之间关系。
三、相关分析的概念及意义对于具有平行关系的变量，无法分清自变量和因变量，不能有一个或几个变量的取值去估计另外一个变量的取值，我们只关心变量间关系的密切程度，一般可作相关分析。相关分析用一个数量性指标（相关系数）来描述具有相关关系的变量间的关系密切程度。所以相关分析只能起到判断变量间关系密切程度的作用，它不能起到有一个或几个变量的取值去估计另外一个变量的取值的作
2
回归平方和
ˆ U yi y b0 bxi b0 bx b xi x
2 2 i 1 i 1 i 1
n
n
n
2
b
2
x x
i 1 i
n
2
b Lxx b
2
2
Lxy b
bLxy
剩余平方和
Q Lyy U
第八章线性回归
第一节
一、变量之间的关系
回归与相关的基本概念
函数关系（确定性关系）：圆的周长与半径的关系： C＝2R 速度、时间与路程的关系：L＝ST x与y的函数关系： y＝a+bx 相关关系（非确定性关系）施肥量与产量的关系身高与年龄的关系
y
函数关系
x
y
y
x
相关关系：线性相关
x
相关关系：非线性相关
ˆ Q ( yi yi ) ( yi bo bxi )2 为最小
2 i1 i1
n
n
ˆ y b0 bx
ˆ y y
按最小二乘法的要求，要总偏差Q最小，要求总偏差Q对b0和b的偏导数等于0
Q 2 ( y b0 bx) 0 b0
Q 2 ( y b0 bx) x 0 b
x和y共有n对观测值，每一个实测点的xI带入直线回归方程都能计算一个相应的回归值 yi ˆ
x y x1 y1 x2 y2 … … xi yi … … xn yn
ˆ y
ˆ y1
ˆ y2
…
ˆ yi
…
ˆ yn
配置直线回归方程的原则：
回归方程的直线是一切直线中最接近实测点的直线，即要求所有观测点的
ˆ 实测y值与回归值 y 之间的总偏差最小。
︰ 371.0
x和y之间的关系 x
n
y 1
x1
y11
x2
y12
…
…
xj
y1j
…
…
xk
y1k
2
3
y21
y31
y22
y32
…
…
y2j
y2j
…
… … …
y2k
y3k
︰
i
︰
yi1
︰
yi2
︰
…
︰
yij
︰
yik
︰
n uy/x
︰
yn1 uy/x1
︰
yn2 uy/x2
…
…
︰
ynj uy/xi
…
… …
︰
ynk uy/xk
x 116 .8
y 6.39
x 2 335 .30
y 2 1.0085
xy 18.319
x 2.336 y 0.1278
Lxy ( x x )( y y )
x y 18.139 116 .8 6.39 3.3920 xy
yi这一个观测值的总变异 yi这一个观测值的回归变异
ˆ ( yi yi )
yi这一个观测值的剩余变异
所有观测值的总变异
ˆ ˆ yi y 2 ( yi y ) ( yi yi )2
i 1 i 1 n
n
n
ˆ ˆ ˆ ˆ yi y 2 yi y yi yi yi yi
ˆ Q ( y y )2 最小
2、回归方程的直线是一切直线中最接近实测点的直线
3、直线通过 ( x,
y)
例：为了解土壤有机质（OM）与全氮（N）含量之间的关系，测定了50个水稻土样的OM和全N含量，测定结果见下表：
50个土样的全N和OM含量（%）
土号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 OM(%) 4.7 4.4 4.2 4.1 4 3.9 3.9 3.8 3.6 3.5 3.5 3.3 3.3 3.2 3 2.9 2.7 全N(%) 0.26 0.23 0.27 0.24 0.22 0.22 0.2 0.21 0.18 0.2 0.19 0.17 0.16 0.16 0.15 0.14 0.16 土号 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 OM(%) 2.7 2.5 2.5 2.4 2.4 2.3 2.3 2.2 2.2 2.2 2.1 2.1 2 1.9 1.9 1.9 1.8 全N(%) 0.14 0.16 0.14 0.13 0.13 0.14 0.1 0.13 0.12 0.12 0.11 0.12 0.11 0.11 0.11 0.09 0.12 土号 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 OM(%) 1.6 1.6 1.5 1.5 1.3 1.3 1.2 1.2 1.1 1 0.9 0.9 0.7 0.6 0.5 0.5 全N(%) 0.09 0.08 0.09 0.07 0.06 0.06 0.06 0.06 0.07 0.06 0.05 0.04 0.04 0.05 0.04 0.03
因果关系：两个变量间的关系若具有原因和反应(结果)的性质。
相关关系
即能分清自变量和因变量。比如：施肥量与植物产量
平行关系：两个变量间的关系不具有原因和反应(结果)的性质。即不能分清自变量和因变量。比如：大豆籽粒中的蛋白质含量和脂肪含量。
线性相关
相关关系
非线性相关（曲线相关）
二、回归分析的概念及意义
(二)自由度的分解
总自由度
dfT n 1
回归自由度
dfU K
自变量的个数
剩余自由度 dfQ dfT dfU
(三)列方差分析表进行F检验
变异因素
回归
自由度
平方和
方差
2 U
F值
F0.05
F0.01
dfU K
U bLxy
2 SU U F 2 S SQ dfU
剩余
施肥量与植物产量之间的关系数据

8 线性回归

合集下载

【线性回归】线性回归模型中几个参数的解释

线性回归算法原理

线性回归方程推导

新教材高中数学8-2一元线性回归模型及其应用8-2-1一元线性回归模型8-2-2一元线性回归模型参数

线性回归模型

8.2.1一元线性回归模型

线性回归计算方法及公式

SPSS数据分析教程-8-线性回归分析

线性回归分析及应用7-8

统计学第八章线性回归分析

文档推荐

最新文档

8 线性回归

合集下载

【线性回归】线性回归模型中几个参数的解释

线性回归算法原理

线 性 回 归 方 程 推 导

新教材高中数学8-2一元线性回归模型及其应用8-2-1一元线性回归模型8-2-2一元线性回归模型参数

线性回归模型

8.2.1一元线性回归模型

线性回归计算方法及公式

SPSS数据分析教程-8-线性回归分析

线性回归分析及应用7-8

统计学 第八章 线性回归分析

文档推荐

最新文档

线性回归方程推导

统计学第八章线性回归分析