第七章 线性模型的扩展
- 格式:ppt
- 大小:1.25 MB
- 文档页数:56
扩展线性回归模型线性回归模型是许多数据科学家和统计学家常常使用的建模工具之一,因为其简单、易于理解和快速计算的特点。
然而,线性回归模型的限制也是显而易见的——它只能处理线性关系和恒定方差。
在许多现实世界的问题中,真实的数据通常都不是严格线性的,且存在异方差性。
因此,需要扩展线性回归模型,使其能够处理更大范围的数据集和多元关系。
一般线性模型扩展线性回归模型的一个基础是一般线性模型(GLM),它从简单的线性回归模型中演化而来。
一般线性模型通常用于数据不服从正态分布或方差不恒定的情况下进行建模。
这个模型包括多种形式,例如在广义线性模型的形式中,我们可以使用指数分布、泊松分布等非正态损失函数,同时应用到线性回归中。
广义线性模型广义线性模型(GLM)是另一种提高线性回归模型的灵活性的方法。
它使用一个广义线性函数来对响应变量进行建模。
广义线性函数由一个连接函数和一个独立于均值的方差函数组成。
连接函数将响应变量的期望值与回归器变量线性表示之间的关系来表示。
当我们使用广义线性模型时,我们可以使用很多与线性模型相似的技术来管理模型选择、正则化、交叉验证等方面。
其中最常见的链接函数是对数函数,在这种情况下,广义线性模型与泊松回归模型具有共同的形式。
多项式回归多项式回归是另一种扩展线性回归模型的方法。
它取代了传统的线性回归模型中的独立变量为线性函数的假定,换成了一个二次、三次或更高次项的多项式方程。
这样,我们可以更好地捕捉数据中的非线性关系。
通过使用多项式回归模型,我们不仅可以捕捉数据中的非线性关系,还可以控制模型的复杂度以避免过拟合。
值得注意的是,我们需要警惕多项式回归中可能出现的奇异矩阵问题。
岭回归岭回归是线性回归模型的另一种扩展形式,它通过增加L2正则化项来减少过拟合。
与线性回归不同,岭回归不仅考虑预测变量的影响,而且考虑到预测变量之间的相关性。
岭回归的功能之一是允许调整复杂性与准确性之间的权衡。
L2正则化惩罚使回归器参数偏向于较小的值,从而减少了过拟合的风险。
线性模型知识点总结一、线性模型概述线性模型是统计学中一类简单而又常用的模型。
在线性模型中,因变量和自变量之间的关系被描述为一个线性方程式。
线性模型被广泛应用于各种领域,如经济学、医学、社会科学等。
线性模型的简单和普适性使得它成为数据分析中的一种重要工具。
线性模型可以用来建立预测模型、对变量之间的关系进行建模和推断、进行变量选择和模型比较等。
在实际应用中,线性模型有多种形式,包括简单线性回归、多元线性回归、广义线性模型、岭回归、逻辑回归等。
这些模型在不同的情况下可以更好地满足数据的特点和要求。
二、线性回归模型1. 简单线性回归简单线性回归是最基本的线性模型之一,它描述了一个因变量和一个自变量之间的线性关系。
简单线性回归模型可以用如下的方程式来表示:Y = β0 + β1X + ε其中,Y是因变量,X是自变量,β0和β1分别是截距项和斜率项,ε是误差项。
简单线性回归模型基于最小二乘法估计参数,从而得到最优拟合直线,使得观测值和拟合值的离差平方和最小。
简单线性回归模型可以用来分析一个自变量对因变量的影响,比如身高和体重的关系、学习时间和考试成绩的关系等。
2. 多元线性回归多元线性回归是在简单线性回归的基础上发展而来的模型,它能够同时描述多个自变量对因变量的影响。
多元线性回归模型可以用如下的方程式来表示:Y = β0 + β1X1 + β2X2 + ... + βpXp + ε其中,X1、X2、...、Xp是p个自变量,β0、β1、β2、...、βp分别是截距项和各自变量的系数,ε是误差项。
多元线性回归模型通过估计各系数的值,可以得到各自变量对因变量的影响情况,以及各自变量之间的相关关系。
3. 岭回归岭回归是一种用来处理多重共线性问题的线性回归方法。
在多元线性回归中,如果自变量之间存在较强的相关性,会导致参数估计不准确,岭回归通过对参数加上一个惩罚项来避免过拟合,从而提高模型的稳定性和泛化能力。
岭回归模型可以用如下的方程式来表示:Y = β0 + β1X1 + β2X2 + ... + βpXp + ε - λ∑(β^2)其中,λ是岭参数,用来平衡参数估计和惩罚项之间的关系。
第七章金融工程第二版郑振龙第七章在第六章中,我们在一系列假定条件下推导得到了闻名的布莱克-舒尔斯期权定价公式,在现实生活中,这些假设条件往往是无法成立的,本章的要紧目的,确实是从多个方面逐一放松这些假设,对布莱克-舒尔斯期权定价公式进行扩展。
然而我们也将看到,在有些时候,模型在精确度方面确实获得了相当的改进,但其所带来的收益却无法补偿为达到改进而付出的成本,或是这些改进本身也存在问题,这使得布莱克-舒尔斯期权定价公式仍旧在现实中占据重要的地位。
第一节布莱克-舒尔斯期权定价模型的缺陷在实际经济生活中,布莱克-舒尔斯期权定价模型(为简便起见,我们后文都称之为BS模型)应用得专门广泛,对金融市场具有专门大的阻碍。
其三个作者中的两个更是曾经因此获得诺贝尔奖。
因此,不管是从商业上依旧从学术上来说,那个模型都专门成功。
然而理论模型和现实生活终究会有所差异,关于大多数理论模型来说,模型假设的非现实性往往成为模型要紧缺陷之所在,BS公式也不例外。
本章的要紧内容,确实是从多方面逐一放松BS模型的假设,使之更符合实际情形,从而实现对BS定价公式的修正和扩展。
BS模型最差不多的假设包括:1.没有交易成本或税收。
2.股票价格服从波动率 和无风险利率r为常数的对数正态分布。
3.所有证券差不多上高度可分的且能够自由买卖,能够连续进行证券交易。
4.不存在无风险套利机会。
在现实生活中,这些假设明显差不多上无法成立的。
本章的后面几节,将分别讨论这些假设放松之后的期权定价模型。
1. 交易成本的假设:BS模型假定交易成本为零,能够连续进行动态的套期保值,从而保证无风险组合的存在和期权定价的正确性。
但事实上交易成本总是客观存在的,这使得我们无法以我们所期望的频率进行套期保值;同时,理论上可行的价格,考虑了交易成本之后就无法实现预期的收益。
我们将在第二节中介绍一些对这一假设进行修正的模型。
2. 波动率为常数的假设:BS模型假定标的资产的波动率是一个已知的常数或者是一个确定的已知函数。
第七章多重共线性第七章多重共线性若线性模型不满⾜假定6,就称模型有多重共线性。
§7.1 多重共线性的概念⼀. 基本概念:假定6 ()1k r X k n =+<,是指模型中所有⾃变量12,,,,k x x x 1线性⽆关,也可理解为矩阵X 的列向量线性⽆关。
若不满⾜该假定,即 ()1k r X k <+,则称12,,,,k x x x 1存在完全多重共线性,12,,,,k x x x 1存在严格的线性关系,这是⼀种极端情况;若12,,,,k x x x 1之间的线性关系不是严格的,⽽是⼀种近似的线性关系,则称⾼度相关或存在不完全多重共线性。
如,01122i i i i y x x u βββ=+++ 若12,λλ?不全为零,使11220i i x x λλ+=,完全多重共线性11220i i i x x v λλ++= 不完全多重共线性完全多重共线性和不完全多重共线性统称为多重共线性。
解释变量(⾃变量)之间的线性关系可⽤拟合优度2i R 描述,2i R 表⽰i x 对其它解释变量的拟合优度,21i R = 完全 21i R ≈⾼度 20i R = ⽆⼆. 产⽣的原因:在实际经济问题中主要是不完全多重共线性。
其产⽣的主要原因是:1. 两个解释变量具有相同或相反的变化趋势;(家庭能耗与住房⾯积、⼈⼝)⽣产、需求.......2. 数据收集的范围过窄,造成解释变量之间有相同或相反变化的假象;3. 某些解释变量之间存在某种近似的线性关系;(各解释变量有相同的时间趋势)4. ⼀个变量是另⼀个变量的滞后值;供给5. 解释变量的选择不当也可能引起变量间的多重共线性。
6. 过度决定模型。
(观测值个数少于参数个数)对于正确设置的模型,多重共线性基本上是⼀种样本现象。
§7.2 多重共线性的后果⼀. 完全多重共线性当模型具有完全多重共线性时,⽆法进⾏参数的OLS 估计;设模型 Y XB U =+,若有完全多重共线性,即()1k r X k <+,则()1T r X X k <+ 1()T X X -?不存在1()T TB X X X Y ∧-?=不存在,同样 21()()Tj u jj V X X βσ∧-=也不存在,显著性检验和预测都⽆法进⾏。
线扩展函数
线扩展函数有多种不同类型的定义,以下是其中两种常见的定义方式:
1.线段延长线上的点公式。
线段延长线上的点公式也称为点的线性插值公式。
给定一条线段AB,延长线AD,外部点D到A点的距离为t*AB(0<=t<=∞),则延长线上的
点D可以表示为:
D=A+t*(B-A)。
其中,t=0表示点D在线段A上,t=1表示点D在线段BA上,t>1表
示点D在线段延长线上。
2.直线拟合法。
直线拟合法是通过最小二乘法来拟合一条直线,使得这条直线尽可能
接近给定的点集合。
假设点集合为(xi,yi),拟合的直线方程为y =
ax + b,则最小化误差平方和:
S = Σ(i=1~n)[yi - (axi + b)]^2。
通过对S求偏导,得到方程组:
a * Σxi^2 +
b * Σxi = Σxiyi。
a * Σxi +
b * n = Σyi。
解方程组,得到直线方程y = ax + b。
常见的求解直线方程的方法
有解析解法和数值解法。
以上两种定义方式适用于不同的场合,其中线段延长线上的点公式适用于已知一条线段和外部点的情况下计算延长线上的点坐标,而直线拟合法则适用于通过数据集合拟合一条直线的情况。