基于改进多元线性回归的股票价格预测模型
- 格式:pdf
- 大小:1.53 MB
- 文档页数:3
股票预测模型研究股票预测模型研究股市行情的波动和变化对于投资者来说是无时不刻不在的挑战。
为了更好地把握股市的走势和投资机会,许多投资者和研究机构致力于开发和应用股票预测模型。
本文将探讨股票预测模型的研究内容、方法和实际应用,以及面临的挑战和未来发展方向。
一、股票预测模型的研究内容股票预测模型是通过对过去的股票市场数据进行分析和建模,以预测未来股票价格的方法。
其研究内容主要包括数据采集和处理、特征工程、模型选择和评估等方面。
1. 数据采集和处理数据采集是股票预测模型的第一步,需要收集大量的股票市场数据,包括股票价格、交易量、财务数据等。
这些数据可以从证券交易所、金融数据服务提供商等渠道获取。
然后需要对这些数据进行清洗和处理,去除异常值和缺失值,以确保数据的准确性和完整性。
2. 特征工程特征工程是股票预测模型的关键环节,其目的是从原始数据中提取和构建有意义的特征,以供模型学习和预测使用。
常用的特征包括技术指标(如移动平均线、相对强弱指标等)、基本面指标(如盈利能力、偿债能力等)和市场情绪指标(如新闻情感分析、舆论热度等)等。
特征工程的质量和选择对于模型的性能和精度有着重要影响。
3. 模型选择和评估模型选择是指从众多的机器学习算法中选择适合股票预测的模型。
常用的模型包括线性回归、支持向量机、决策树、神经网络等。
在选择模型之后,需要对其进行训练和评估。
评估指标包括均方误差、准确率、收益率等,可以通过交叉验证和回测等方法得出。
二、股票预测模型的方法股票预测模型的方法多种多样,下面将介绍几种常见的方法。
1. 技术分析技术分析是通过对股票价格和交易量等图表进行分析,以找出价格的趋势和波动规律,从而预测股票价格的方法。
常见的技术分析指标包括移动平均线、相对强弱指标、随机指数等。
技术分析依赖于市场的历史数据,对于短期趋势的预测有一定的参考意义。
2. 基本面分析基本面分析是通过对股票的财务数据和市场环境等进行分析,以评估股票的价值和潜力的方法。
线性回归模型在金融预测中的应用研究一、引言随着金融市场的变幻莫测和丰富多样,为准确地预测未来的趋势以及高效地管理风险,金融领域需要处理及分析大量数据,在其中寻找规律和趋势。
数据分析已成为日益重要的趋势和研究方向。
其中,线性回归模型是在进行金融预测、风险管理和金融监管等方面使用最广泛的模型之一。
本文将从数据处理、线性回归模型的基本原理和应用、评估方法和其在金融领域中的应用等方面展开讨论。
二、数据处理金融领域涉及的数据种类、数据来源的多样性及复杂性使数据处理成为金融数据分析的重要途径。
建立线性回归模型之前首要需要解决的问题就是数据的选取和处理。
一般来说,金融数据分析中经常采用的是时间序列数据,数据的变量包括了价格、成交量、经济指标、财务指标、金融市场行情等方面。
但是数据在现实生活中存在着缺失值、异常值甚至一些难以理解和说明的情况。
因此,在进行数据处理时,需要考虑不同类型的数据和数据的缺失情况。
如果缺失的数据较多,则可能会丢失对模型非常重要的信息。
因此,研究者需要充分地了解数据,找出并消除噪音数据,使得模型能够捕捉到更加精确的现象和规律。
线性回归模型是用来建立两个变量之间线性关系的模型,其中一个变量是因变量,另一个是自变量。
该模型假设变量之间存在线性关系,并利用一些统计方法来确定自变量与因变量之间的关系程度。
在金融领域中,线性回归模型主要应用于以下几个方面:预测股票价格、判断决策对风险的影响,以及估计金融市场演变的趋势等。
在应用线性回归模型时,研究者需要考虑以下的基本原则:1. 研究自变量和因变量之间的关系,确定影响因变量的主要因素;2. 消除模型中的多重共线性问题;3. 对数据进行恰当的变换,以满足线性回归模型的基本假设要求。
四、评估方法建立模型之后,需要对模型进行评估。
在这种情况下,评估的主要任务是确定模型的精度和可靠性。
回归模型常用的评估方法包括拟合优度、均方误差、平均绝对误差等。
这些方法可以判断模型的可行性、稳定性和准确性,以便最终确定最佳的模型选择方案。
基于SVM模型的股票预测分析在金融领域中,股票预测一直是一个被广泛关注的话题。
股票市场的不确定性和波动性给投资者带来不小的风险,因此能够准确预测股票走势的模型显得尤为重要。
机器学习中的支持向量机(Support Vector Machine,简称SVM)模型是一种常用的分类器,适用于股票市场中的预测分析。
本文将介绍基于SVM模型的股票预测分析方法。
一、SVM模型的原理SVM模型是一种监督学习算法,用于分类和回归分析。
SVM通过构造最大间隔超平面,将不同类别的数据分割开来,从而实现分类的目的。
同时,SVM还能够处理高维数据和非线性数据,通过核函数将数据映射到高维空间进行分类。
其核心思想是:在n维空间中找到一个超平面,将不同类别的数据分开并使得超平面到两类数据的最近点的距离最大化。
这些最近点被称为支持向量,SVM模型的学习过程主要就是寻找到这些支持向量。
在分类任务中,对于新的样本点,通过与超平面的位置关系来判定其所属类别。
二、数据预处理在进行SVM模型的训练前,需要对原始数据进行一些预处理。
一方面,原始数据可能存在异常值、缺失值等问题。
这些问题需要通过数据清洗和预处理来进行解决;另一方面,原始数据格式可能不适合SVM模型的训练,需要进行特征选择和数据重构,以便更好地反映股票市场的特征。
常用的数据预处理方法包括标准化、归一化、主成分分析(PCA)等,可以根据具体情况选择合适的方法进行处理。
通过数据预处理,能够提高SVM模型的训练效果,从而更好地进行股票预测分析。
三、SVM模型的参数调优SVM模型的另一个重要问题是参数的选择。
SVM模型中的参数包括核函数、正则化系数和核函数参数等。
不同的参数选择对SVM模型的预测结果会产生很大的影响,因此需要进行参数的调优来提高模型的性能。
常见的参数调优方法包括交叉验证和网格搜索等。
通过交叉验证,可以分割训练集和测试集,从而评估SVM模型的性能,并确定最佳参数。
网格搜索则是通过对参数取值的组合,进行模型的训练和评估,最终选择出最佳参数组合。
基于改进GA参数优化的SVR股价预测模型孙秋韵;刘金清;刘引;吴庆祥【摘要】针对股票价格的动态性及非线性等特点,提出了基于改进遗传算法(Genetic Algorithm, GA)优化参数的支持向量回归机(Support Vector Regression, SVR)股价预测模型。
首先将选取的股票价格样本进行小波去噪处理,然后将经过改进GA优化参数的SVR模型对去噪后的数据进行预测及评价。
结果证明,改进小波-GA-SVR模型具有良好的预测效果,对股票价格的预测研究具有一定的意义。
%Aiming to the dynamics and nonlinearities of stock price, a stock price prediction model that based on support vector regression (SVR) with parameters optimized by improved genetic algorithm (GA) was proposed. First, the wavelet was used to de-noise the samples of stock price. Then the SVR model whose parameters were optimized by improved GA was utilized to predict and assess the data de-noised by wavelet. The result demonstrated that the improved wavelet-GA-SVR model has good prediction effect, and it is significant to the study of the prediction of stock price.【期刊名称】《计算机系统应用》【年(卷),期】2015(000)009【总页数】6页(P29-34)【关键词】小波去噪;遗传算法;支持向量机回归;股价预测【作者】孙秋韵;刘金清;刘引;吴庆祥【作者单位】福建师范大学光电与信息工程学院,福州 350007;福建师范大学光电与信息工程学院,福州 350007;福建师范大学光电与信息工程学院,福州350007;福建师范大学光电与信息工程学院,福州 350007【正文语种】中文股票价格的数据预测系统是一个动态、非线性的系统. 影响股票价格的因素不胜枚举, 价格波动的变化也显得异常复杂. 因此, 如何有效地进行股票价格的预测, 最大程度的规避股票风险, 成为当今国内外学者的研究方向. 目前, 常见的股票价格的预测方法有文献[1]利用K线图法分析股票市场, 能预测股票大致走势, 但这种图形分析法属于定性方法, 无法预测具体的股票价格. 文献[2]利用自回归移动平均模型等时间序列模型, 较好地解决了线性平稳的预测问题, 但对于非线性和非平稳的预测问题解决得不够理想. 由于股票价格的非线性, 价格预测的研究方向逐渐从传统时间序列分析方法向人工智能分析方法进行转变.近年来, 具有自组织、自学习和良好非线性逼近能力的神经网络被引入到股市预测的研究中[3,4], 但神经网络存在收敛速度慢和容易陷入局部极小值的缺点.而Vapnik基于结构风险最小化原则提出的支持向量机(Support Vector Machine, SVM)作为一种新型神经网络因具有全局最优解, 从而能较好地解决了这一问题[5]. 基于SVM衍生的支持向量回归机(Support Vector Regression, SVR)主要是通过空间升维后, 在高维空间中构造线性决策函数来实现线性回归[6]. SVR具有全局最优、结构简单、推广能力强等优点, 但由于此算法的核心在于用核函数代替线性方程中的线性项进行非线性回归, 直接应用于股票预测领域容易存在参数难以选择的问题.本文针对SVR存在参数难以选择的问题, 提出了一种基于改进遗传算法(genetic algorithm, GA)优化的SVR模型用于股票价格预测. 首先对股票价格时间序列进行小波去噪, 消除其中的噪声, 并充分保留原信号的有效特征; 使用改进GA对SVR模型所涉及的参数进行优化; 最后利用优化后的参数来训练SVR模型, 而得到改进小波-GA-SVR模型. 通过对比预测值与实际值, 验证了该模型的有效性. 不仅能够减少反复实验的盲目性, 还能有效的提高最优参数选取的成功率和效率, 进而提高SVR模型的预测精度.1.1小波理论简析小波分析的概念最初由Hear在20世纪初提出, 直到20世纪80年代末法国学者Mallat提出了多分辨率分析的概念, 统一了各种具体小波基的构造方法, 小波分析在信号处理、图像分析、非线性科学等领域已有重大突破, 成为20世纪最辉煌的科学成就之一[7].任意函数f(t)∈L2(R)在小波基Ψa,b (t)下进行展开, 称作函数f(t)的连续小波变换, 其表达式为:其中, a为尺度因子, b为平移量. 由表达式可以得出, 在连续变化的a, b值下, Ψa,b (t) 具有很强的关联性, 因此, 小波变换系数的信息量是冗余的, 而冗余信息不利于对信号的分析和处理, 所以对尺度和时移参数进行离散化后, 再进行小波重构. 通常使用的离散化方法是:尺度参数的离散化: , j∈Z(通常a0的值为2, 称为二进小波).时移参数的离散化(取决于尺度参数): , j,k∈Z.则函数离散化后的小波变换的表达式为:1.2 小波去噪原理根据信号中有用信号和噪声的时频特性的不同, 通过将离散化后的小波分解成j 层, 此时有用信号在时域上表现为低频信号或者较为平稳的信号. 但是由于噪声在时域分布的全局性, 需要从第一层到第j层, 每层选择一个阈值, 同时对高频系数进行量化处理. 最后对经过阈值消噪处理后的各层高频系数和小波分解后的低频系数进行小波重构, 恢复去噪后的原始信号估计值.含噪声的数据信号f(t)表示为:其中, s(t)是原始信号, e(t)是一个标准的高斯白噪声, 即e(t)~N(0,1), 是噪声级. 从含噪声的数据信号f(t)中恢复原始信号s(t), 需要以下3个步骤:1)选取合适的小波基函数, 对原始信号进行小波分解, 得到各层的小波系数. 若f(k)为信号f(t)的离散采样数据, 则信号f(t)的正交小波变换分解公式为:其中, cj,k为尺度系数, dj,k为小波系数, h、g为一对正交镜像滤波器组; j为分解层数, N为离散采样点数. 运用上式将含噪信号f(t)进行小波分解至j层, 得到相应的小波分解系数.2)对分解得到的小波系数进行阈值处理, 其阈值的处理方法有2种:软阈值法能够使估计信号实现最大均方误差最小化, 即去噪后的估计信号是原始信号的近似最优估计. 因此本文选择软阈值法进行小波去噪.3)把去噪处理后的小波系数进行小波重构, 得到去噪后的数据. 小波重构过程是分解过程的逆运算, 相应的重构公式为:将经阈值处理过的小波系数用上式重构, 得到恢复的原始信号估计值. 小波去噪流程图如图1所示:2.1 改进遗传算法遗传算法是模仿自然界“适者生存”的生物进化原理发展起来的随机全局搜索和优化方法, 根据个体在问题域中的适应度值和从自然遗传学中借鉴来的再造方法进行个体选择, 经过多代繁殖进化, 获得适应值最好的个体作为问题的全局最优解[8,9]. 然而标准遗传算法在优化参数的过程中存在收敛慢的问题, 本文提出一种改进遗传算法, 简化了标准遗传算法中变异、交叉概率需要反复试验才能得到较精确结果的步骤, 同时提高了遗传算法的收敛性. 与标准的遗传算法相比, 改进遗传算法的交叉概率与变异概率不再是一个固定值, 而是按种群的适应度进行自动调整. 改进遗传算法中交叉概率及变异概率的具体运算公式如下:其中交叉概率pc1, pc2及变异概率pm1, pm2均为给定值, f’为要交叉的两个体中较大的适应度值, f是被选择为变异个体的适应度值, fa为每代群体的平均适应度值, fmax为群体中最大的适应度值. 群体中的较优个体拥有更高的交叉概率与变异概率, 为了保证每一代的最优个体不被破坏, 采用最优精英策略, 将其直接复制到下一代中.2.2 支持向量回归机支持向量机模型是一种能够实现结构风险最小化思想的较好方法. 通过引入核函数将非线性矢量映射到高维空间, 避免了非线性拟合出现局部最优, 保证了较高的拟合精度, 得到全局最优解. 同时, 随着Vapnik将不敏感损失函数的引入, 替代了高维空间中的内积运算, 并且将该方法推广到回归问题, 提出了支持向量回归机模型. SVR模型具有较好的推广能力和非线性处理能力, 尤其在处理高维数据时, 能有效地解决“维数灾难”问题.SVR主要是通过下列4个损失函数来实现回归: Quadartic损失函数、Laplaee 损失函数、Huber损失函数及ε-不敏感损失函数. 由于ε-不敏感损失函数可以忽略真实值在某个上下范围内的误差, 其解以函数的最小化为特征, 使计算得到的对偶向量具有稀疏性, 确保全局最小解的存在和可靠泛化界的优化. 因此本文采取非线性的ε-SVR, 其构造原理[10]如下:给出一组数据点的集合, 其中xi是输入特征向量, yi是目标值, n是样本量. 非线性SVR的基本思想是透过一个非线性映像Φ, 将数据x映像到高维特征空间, 并在这个空间进行线性回归. 即:其中变量w反映了函数的复杂度, b为偏置值, φ是高维特征空间, 它是输入空间x 的非线性映像.为了能估计w和b, 所需要解决的优化问题由以下方程得出:其中C为惩罚参数, , 为松弛变量, ε为不敏感损失函数, ε的引入提高了估计的稳健性.为了求解以上问题, 通常采用对偶理论, 把其转化为凸二次规划问题. 对上式进行拉格朗日变换, 可得:其中, 拉格朗日函数相对于变量w, b, , 的导数为0.最后, 导入拉格朗日算子和优化的限制式, 式(13)的决策函数变为:其中, k(xi+x)为SVM的核函数. 只有当核函数满足Mercer条件时, 才能得到低维空间对应的非线性计算. 而常用的核函数主要有三种: 多项式核函数、Gauss径向基(RBF)核函数及多层感知机核函数. 在以上三种核函数中, RBF不需要先验知识,对任意样本能够表现出较好的泛化性能和较强的学习能力, 所以本文选择将RBF作为核函数.SVR模型中, RBF核函数引入的参数σ、惩罚因子C及ε-不敏感损失函数中的参数ε的选择及优化直接影响SVR模型的准确性, 若参数选取不当, 将会导致SVR模型的过学习或欠学习现象. 目前SVR参数选择的方法中, 主要有经验确定法和网格搜索法. 其中经验确定法要求使用者有较深厚的SVR理论基础; 而网格搜索法的计算量较大, 并且两种方法都不能对参数进行优化及保证找到全局最优解. 为此, 引入改进遗传算法对支持向量回归模型参数进行优化, 以保证股价预测模型的准确性. 2.3 改进遗传算法优化SVR模型原理改进遗传算法优化参数过程分为四个步骤: 对参数进行编码、初始化群体、计算适应度函数和遗传操作.Step1: 采用二进制编码方法对SVR参数(C, σ, ε)进行编码, 并随机产生初始种群; Step2: 计算适应度值. 适应度函数通常根据求解问题的目标函数来选取, 本文选取的适应度函数为均方误差MSE, 它是从交叉验证(cross validation, CV)机制中验证子集产生的均方误差, 在回归问题中能有效地衡量染色体优劣, 并且经过交叉验证后可以避免或减轻过拟合现象. 其公式如下:其中为真实值, 为预测值, n为训练集样本量. 该适应度值越小, 表示个体效果越优, 被选择的概率也越大.Step3: 遗传操作. 运用选择、交叉和变异算子进行遗传操作, 计算由交叉和变异生成的新个体的适应度值, 新个体与父代一起组成新一代群体.选择操作: 按照轮盘赌选择方法选择N(N为偶数)个个体, 计算群体的平均适应度值fa和最大适应度值fmax.交叉、变异操作: 将群体个体随机配对, 对每对个体, 根据公式(8)和(9)计算自适应交叉概率pc和变异概率pm, 以pc和pm为概率分别进行交叉操作及变异操作. Step4: 判断适应度值是否达到终止条件(以最大迭代次数为终止条件), 未达到终止条件, 转入Step2; 继续执行优化算法, 直到满足终止条件, 最终以进化过程中最小适应度的个体作为最优解, 把得到的最优参数(C, σ, ε)带入SVR模型进行预测. 改进GA-SVR流程图如图2所示:3.1 实验数据选取及实验环境本文选取上证A股指数为实验对象, 并选取收盘价, 开盘价, 最高价, 最低价, 成交价及成交量为预测模型的特征值. 在数据区间上, 选取2013年1月4日至2013年12月31日之间的238个交易日线数据, 其样本量大小为1428, 构成238*6矩阵, 所有数据均来源于大智慧数据库. 其中, 前180组数据样本为训练集, 后58组数据样本为测试集.在MATLAB2010b的环境下, 实现改进小波-GA-SVR模型对股票样本的回归和预测, 并使用相关系数(R2)和均方误差(MSE)作为回归模型的评价依据, 与单一的SVR 模型、GA-SVR模型、BP神经网络模型和标准小波-GA-SVR模型进行对比分析.3.2 数据的归一化及小波去噪细节为了消除指标之间的量纲影响, 对数据进行归一化处理, 使得数据较容易进行处理比较. 本文通过对数据的归一化处理, 将数据映射到[-1, 1]区间内. 经过归一化处理后的原始数据, 其各项指标均处于同一数量级, 适合进行综合对比评价.数据归一化后, 对数据样本进行小波去噪处理, 以充分保留数据的有效特征. 由于小波基类型和小波分解层数的不同会使小波去噪产生不同的效果, 所以需要确定适合本文研究对象, 即股票价格序列的小波基类型和小波分解层数.图3, 图4分别上证A股指数去噪前后图, 由图看出, 去噪后的数据较去噪前的数据平滑很多. 同时经过反复调试, 将sym4小波定为小波基类型, 并且最佳小波分解层数为三层.3.3 实验参数设置及结果在改进小波-GA-SVR的模型环境下, 通过实验平台的反复测试, 最终将各参数设置为: 进化次数为100代, 群体大小N为50, pc1=0.9, pc2=0.6, pm1=0.1,pm2=0.001, 适应度函数为进行3折CV的MSE. 实验得出的最优化参数惩罚因子C=2.2741, RBF核函数参数σ=0.9621, 不敏感损失函数ε=0.0697.图5为适应度曲线的寻优结果, 反映了逐代的平均适应度和最佳适应度的进化过程. 可以看出, 平均适应度逐渐收敛到一个较小的值, 慢慢接近最佳适应度. 这不仅说明了改进GA的收敛性较好, 也意味着种群在逐渐接近最优解, 满足目标优化控制的精度要求.3.4 模型预测与比较为了验证本文提出的改进小波-GA-SVR模型在股票价格预测中的有效性和优势, 本节从三个方面进行对比实验: (1)不经过小波去噪处理, 直接运用单一的SVR模型和GA-SVR模型对股票价格时间序列进行预测分析, 并和改进小波-GA-SVR模型进行对比验证; (2)使用BP神经网络模型对股票价格时间序列进行预测分析, 并将BP神经网络, 同改进小波-GA-SVR模型进行对比验证. (3)使用标准小波-GA-SVR 模型对股票价格时间序列进行预测分析, 并和改进小波-GA-SVR模型进行对比验证. 预测结果分别如图6~10.图6为单一的SVR模型预测结果图, 图7为GA-SVR模型预测结果图, 图8为BP神经网络模型预测结果图, 图9为小波-GA-SVR模型预测结果图, 图10为改进小波-GA-SVR模型. 我们可以从图中直观的观察出, 标准小波-GA-SVR模型和单一的SVR模型及BP神经网络模型相比, 在数据上较为平滑, 而且在预测精度上也有明显地提高. 然而, 对比以上模型, 改进小波-GA-SVR模型得到的预测结果与实际结果在数值上更加接近, 模型预测取得较优的效果.此外, 表1给出了BP神经网络模型、单一的SVR模型, GA-SVR模型、标准小波-GA-SVR及改进小波-GA-SVR的MSE及R2的结果. 通过改进遗传算法对SVR参数的优化, 改进了遗传操作中的交叉, 变异算子, 不再是需要反复试验的单一固定值, 而是按种群的适应度进行自动调整, 大大提高了收敛性, 有效避免了标准GA收敛慢的问题, 因此改进小波-GA-SVR模型较标准小波-GA-SVR模型的预测精确度更高, 误差更小. 此外, 未经过小波去噪处理的GA-SVR模型对股票样本的预测结果在性能指标上与标准小波-GA-SVR模型较为接近, 而相比之下, 标准小波-GA-SVR 模型MSE较小, 而R2相对较大, 进而说明了采用小波去噪方法的有效性, 可以进一步提高拟合度和预测精度. 而单一的SVR模型预测结果不管在均方误差MSE还是在相关系数R2上都远不如改进小波-GA-SVR模型的预测结果, 进一步表明了SVR 模型的参数选择问题对预测结果的重要影响. 此外, BP神经网络的实验结果相对不理想. 通过和多种回归模型的对比试验, 体现出了本文所建立的改进小波-GA-SVR 模型对于股票价格序列的回归预测的准确性和优势.本文选取上证A股指数2013年的238个交易日线数据为样本, 针对SVR存在参数难以选择的问题, 使用改进GA对SVR所涉及参数的动态过程进行优化, 此外, 使用小波变换对原始数据进行小波去噪处理, 从而建立了改进小波-GA-SVR股票预测模型, 并将其同单一的SVR模型, GA-SVR模型, 标准小波-GA-SVR模型及BP神经网络模型进行了预测对比. 实验结果表明, 改进小波-GA-SVR模型不仅解决了标准遗传算法收敛速度慢及SVR模型参数难以选择的问题, 还在结合小波去噪技术之后, 进一步提高了模型的稳定性及预测精度, 说明改进小波-GA-SVR模型是有效可行的. 同时, 小波去噪技术最大限度地保留了真实的信号系数, 从而进一步提高了预测结果的正确性. 本文提出的改进小波-GA-SVR模型在股价预测的理论研究中具有重要意义, 在实际应用中还有待我们进一步的完善.1 王伟钧,袁正伟,谢文吉,杨晋浩.股市K线组合的关联规则挖掘.成都大学学报(自然科学版),2009,28(3):268 –271.2 郑伟伦.上证综合指数股票价格短期预测--基于ARIMA模型的研究分析.经济研究导刊,2014,(16):136–137.3 Guresen E, Kayakutlu G, Daim TU. Using artificial neural network models in stock market index prediction. Expert Systems with Applications, 2011, 38(8): 10389–10397.4 张秋明,朱红莉.灰色神经网络在股价预测中的应用研究. Computer Engineering and Applications, 2013, 49(12).5 Cortes C, Vapnik V. Support–vector networks. Machine Learning, 1995, 20(3): 273–297.6 董美双,何欢,童晓星.基于ε-SVR的粮食产量预测模型及应用.浙江大学学报(农业与生命科学版),2009,35(4):439–443.7 Demirel H, Anbarjafari G. Image resolution enhancement by using discrete and stationary wavelet decomposition. IEEE Trans. on Image Processing, 2011, 20(5): 1458–1460.8 田建立,晁学鹏.求解0-1背包问题的混沌遗传算法.计算机应用研究,2011,28(8):2838–2839.9 Deb K, Pratap A, Agarwal S, et al. A fast and elitist multiobjective genetic algorithm: NSGA-II. IEEE Trans. on Evolutionary Computation, 2002, 6(2): 182–197.10 吴德会.基于 SVR的非线性动态系统建模方法研究.计算机应用,2007,27(9):2253–2255。
金融时间序列预测中的ARIMA模型及改进随着金融市场的日益复杂和全球化程度的不断提高,金融时间序列的预测成为了金融领域中非常重要的一个问题。
准确地预测金融时间序列可以帮助投资者制定有效的投资策略,降低风险并提高收益。
ARIMA(自回归综合移动平均)模型作为一种经典的时间序列预测模型,被广泛应用于金融市场的预测和分析中。
本文将重点介绍ARIMA模型及其改进。
1. ARIMA模型ARIMA模型是由自回归模型(AR)和移动平均模型(MA)组成的。
AR模型用于描述当前时刻的观测值与前一时刻观测值之间的线性关系,而MA模型用于描述当前时刻的观测值与随机误差项之间的线性关系。
ARIMA模型的核心理念是将时间序列数据进行平稳化处理,然后利用自回归和移动平均的方法建立模型,最后通过对模型进行参数估计和拟合来进行预测。
2. ARIMA模型的改进尽管ARIMA模型在金融时间序列预测中表现出了较好的效果,但是它仍然存在一些局限性。
首先,ARIMA模型只适用于线性时间序列数据的预测,并不能很好地捕捉到非线性的特征。
其次,ARIMA模型对于长期依赖的时间序列数据的预测效果较差。
为了克服这些问题,研究者们提出了一系列的ARIMA改进模型,如ARIMA-GARCH模型、ARIMA-EGARCH模型等。
3. ARIMA-GARCH模型ARIMA-GARCH模型是ARIMA模型与广义自回归条件异方差模型(GARCH)的结合。
GARCH模型能够对时间序列数据中的异方差进行建模,并可以较好地捕捉到金融市场中的风险特征。
ARIMA-GARCH模型在预测金融时间序列数据时,首先利用ARIMA模型对序列数据进行平稳化处理,然后使用GARCH模型对平稳化后的序列拟合,最后利用模型得到的结果进行预测。
4. ARIMA-EGARCH模型ARIMA-EGARCH模型是ARIMA模型与指数广义自回归条件异方差模型(EGARCH)的结合。
与GARCH模型不同的是,EGARCH模型不仅能够对异方差进行建模,还可以捕捉到金融时间序列中的杠杆效应。
基于RF-LSTM组合模型的股票价格预测基于RF-LSTM组合模型的股票价格预测引言:股票市场作为一个充满不确定性和波动性的地方,一直以来都是投资者和研究者关注的焦点。
准确预测股票价格对于投资者和交易者来说至关重要,因为它可以帮助他们做出明智的投资决策和制定有效的交易策略。
因此,股票价格预测成为了金融领域的一个重要课题。
在过去的几十年里,许多研究人员探索了各种各样的模型和算法来预测股票价格。
传统的时间序列分析和统计方法在一定程度上能够对股票价格进行预测,但其局限性也逐渐显现出来。
因此,研究者们开始寻找更加准确和稳定的预测方法。
近年来,深度学习在许多领域取得了巨大的成功,包括自然语言处理、图像识别和机器翻译等。
其中,循环神经网络(Recurrent Neural Network,简称RNN)已被广泛应用于时间序列预测任务。
然而,由于RNN对长期依赖关系的建模能力较弱,导致了其在股票价格预测中的表现并不理想。
为了进一步提高股票价格预测的准确度,研究者们将RNN与其他模型进行组合,形成了RF-LSTM组合模型。
RF-LSTM模型将时间序列数据输入到随机森林(Random Forest,简称RF)中进行特征提取和预测,然后再将预测结果输入到长短期记忆网络(Long Short-Term Memory,简称LSTM)中进行进一步的调整和优化。
方法:首先,RF-LSTM组合模型利用随机森林模型对股票价格特征进行提取和预测。
随机森林是一种基于集成学习的分类与回归算法,具有高度的灵活性和鲁棒性。
通过构建多个决策树,并利用投票机制进行预测,随机森林能够有效地克服过拟合和欠拟合问题。
在股票价格预测中,随机森林模型可以利用历史数据中的各种特征来进行价格预测。
其次,RF-LSTM模型将随机森林的预测结果输入到LSTM 中进行进一步的调整和优化。
LSTM是一种特殊的循环神经网络,通过使用记忆单元和门控机制,能够有效地建模和捕捉时间序列数据中的长期依赖关系。
基于CNN-LSTM模型股票价格预测研究基于CNN-LSTM模型股票价格预测研究一、引言随着金融市场的不断发展和信息技术的迅速进步,股票市场的波动性和复杂性日益增加。
对于投资者而言,准确地预测股票价格变动是一项关键任务。
然而,股票市场的价格变动受到诸多因素的影响,预测股票价格变动成为一项极具挑战性的任务。
因此,许多研究者开始探索使用机器学习和深度学习技术来进行股票价格预测。
二、相关工作回顾在过去的几十年里,许多传统的方法被应用于股票价格预测,例如时间序列分析、回归分析和神经网络等。
然而,这些方法往往依赖于先验知识和大量特征的选择,且很难捕捉到复杂的非线性关系。
近年来,基于深度学习的股票价格预测方法受到了广泛关注。
三、研究方法本研究采用了CNN-LSTM模型进行股票价格预测。
CNN (Convolutional Neural Network,卷积神经网络)是一种有效的图像处理方法,它可以提取出图像中的局部特征。
LSTM (Long Short-Term Memory,长短期记忆网络)是一种特殊的循环神经网络,用于处理具有长期依赖性的序列数据。
1. 数据预处理首先,我们对原始股票数据进行了预处理。
包括数据清洗、特征选择和标准化等步骤。
数据清洗主要是去除异常值和缺失值。
特征选择的目的是从原始数据中选择出最有效的特征,以提高模型的预测性能。
标准化是将不同范围的数据转化为统一的范围,有利于模型的收敛和训练。
2. CNN特征提取为了从股票价格数据中提取出有效的特征,我们使用了CNN来进行特征提取。
将股票数据转化为二维图像的形式,其中时间序列作为图像的横坐标,股票价格作为图像的纵坐标。
通过对图像进行卷积操作和池化操作,CNN可以提取出图像中的局部特征。
3. LSTM序列建模得到CNN提取的特征后,我们将其输入到LSTM中进行序列建模。
LSTM具有记忆单元和门控单元,可以有效地捕捉到序列数据中的长期依赖性。
通过训练LSTM模型,可以学习到序列数据中的模式和趋势,从而用于预测股票价格的未来变动。
金融投资中的股票价格预测模型股票价格预测模型在金融投资中扮演着重要角色。
投资者和分析师利用这些模型来预测未来股票价格的变动趋势,以便做出相应的投资决策。
本文将详细介绍几种常见的股票价格预测模型,并讨论它们的优缺点。
一、基于历史数据的技术分析模型技术分析是一种通过研究历史交易数据来预测股票价格变动的方法。
常用的技术分析指标包括移动平均线、相对强弱指标(RSI)、布林带等。
这些指标可以通过计算历史价格的统计数据来评估股票的价格走势。
然后,投资者可以根据这些指标的结果决定是否买入或卖出股票。
优点:技术分析模型简单易用,不需要太多的数学知识。
通过观察历史价格数据,投资者可以直观地了解市场的趋势和市场参与者的情绪。
缺点:技术分析模型无法预测股票价格的准确值,只能提供价格变动的概率。
另外,这些模型假设市场行为是可预测的,但实际上市场行为往往受到各种因素的影响,无法简单地通过历史数据进行预测。
二、基于基本面的分析模型基本面分析是通过研究公司的财务数据、行业状况、宏观经济等因素来预测股票价格变动的方法。
常用的基本面指标包括市盈率、市净率、财务报表等。
投资者可以根据这些指标来评估公司的价值,从而决定是否买入或卖出股票。
优点:基本面分析模型提供了更为全面和深入的评估。
通过研究公司的财务状况和业务前景,投资者可以更好地了解公司的内在价值,并根据公司的实际表现做出决策。
缺点:基本面分析模型依赖于大量的数据和专业的财务知识。
同时,基本面分析模型假设市场会根据公司的基本面情况进行反应,但市场行为往往受到情绪和其他非理性因素的影响。
三、基于机器学习的预测模型随着科技的进步,机器学习技术在股票价格预测中的应用日益普遍。
机器学习模型通过学习历史数据中的规律和模式来预测未来股票价格的变动。
常用的机器学习模型包括线性回归、支持向量机(SVM)、决策树和人工神经网络等。
优点:机器学习模型可以根据大量的历史数据准确地预测股票价格的变动。
基于机器学习的股票价格预测模型股票市场的价格预测一直是投资者和交易者们关注的重要问题。
准确预测股票价格的能力对于制定投资策略和风险管理至关重要。
随着机器学习技术的发展,基于机器学习的股票价格预测模型成为了一个备受关注的领域。
本文将介绍基于机器学习的股票价格预测模型的原理、方法和应用。
基于机器学习的股票价格预测模型的原理是基于历史股票价格和相关的市场数据来进行预测。
这些数据包括股票价格的历史走势、市场指数的表现、财务数据等。
机器学习模型通过分析这些数据的模式和关联,来预测未来股票价格的走势。
在建立机器学习模型之前,首先需要对数据进行预处理和特征工程。
预处理包括数据清洗、缺失值处理和异常值处理等,以保证数据的完整性和准确性。
特征工程则是从原始数据中提取有用的特征,例如技术指标、财务比率等,这些特征能够反映股票价格的潜在趋势和市场表现。
接下来,选择适合的机器学习算法来建立预测模型。
常用的机器学习算法包括线性回归、决策树、支持向量机、朴素贝叶斯和神经网络等。
根据不同的数据特点和预测目标,选择合适的算法。
对于股票价格预测来说,时间序列模型和回归模型是常用的方法。
时间序列模型是一种建立在时间序列数据上的预测模型,适用于股票价格这样具有趋势、周期和季节性的数据。
常用的时间序列模型包括ARIMA、GARCH和LSTM等。
ARIMA模型基于时间序列的自相关和移动平均性质来进行预测,GARCH模型可以捕捉股票价格波动的方差变化,LSTM模型是一种具有记忆性的循环神经网络,能够学习时间序列数据的长期依赖关系。
回归模型则是通过建立自变量和因变量之间的关系来进行预测。
通过历史股票价格和相关市场数据作为自变量,预测未来股票价格作为因变量。
线性回归模型是回归模型中最简单的一种,它假设自变量和因变量之间存在线性关系。
决策树模型则是通过构建决策树来预测股票价格,根据不同的特征进行二分划分。
支持向量机模型通过寻找最优超平面来进行分类和回归。
通过回归分析预测股票走势回归分析是一种通过对变量间相互关系的研究来预测一个变量值的方法。
在股票价格的预测中,常常利用回归分析来寻找股票价格与其他变量之间的关系,进而得到对股票价格未来走势的预测。
一般来说,回归分析主要分为简单线性回归和多元线性回归两种类型。
简单线性回归是指只有一个自变量和一个因变量之间的关系,而多元线性回归则是指有多个自变量和一个因变量之间的关系。
在预测股票价格走势时,通常会选择多元线性回归来建立模型,因为股票价格受到多种因素的影响,单一的自变量很难完整地解释股票价格的变化。
在进行回归分析之前,首先需要收集大量的数据来建立模型。
这些数据可以包括股票价格的历史数据、宏观经济指标、行业指标、公司财务指标等。
这些数据将成为回归分析的自变量,而股票价格则成为回归分析的因变量。
然后,利用统计软件或编程语言进行回归分析,得到模型的系数、拟合优度等统计结果。
最终,可以利用得到的回归模型对股票价格未来走势进行预测。
通过分析回归模型的系数,我们可以了解到每个自变量对股票价格的影响程度。
如果过去三个季度的股票价格系数为正且显著,说明股票价格具有一定的惯性效应;如果行业指标的系数为正且显著,说明行业的整体发展对股票价格有一定的支撑作用;如果宏观经济指标的系数为负且显著,说明宏观经济的下行将对股票价格产生负面影响;如果公司财务指标的系数为正且显著,说明公司的财务状况对股票价格有正向影响。
通过对模型系数的分析,我们可以更加深入地了解股票价格与其他变量之间的关系,进而对股票价格未来走势进行更加准确的预测。
我们还可以利用模型的拟合优度来评估回归模型的好坏。
拟合优度是指用回归模型中自变量的变化来解释因变量变化的程度。
一般来说,拟合优度越高,说明模型的解释能力越强,预测能力也越强。
我们可以通过拟合优度来评估回归模型对股票价格走势预测的准确度。
在进行回归分析时,还需要注意一些细节问题。
要注意自变量之间的多重共线性问题。
金融领域中的股票价格预测模型的应用方法股票市场一直以来都是金融领域中备受关注的话题,投资者和分析师们对于股票价格的预测十分重视。
为了提高投资决策的准确性和效率,金融领域广泛应用各种股票价格预测模型。
本文将介绍几种常见的股票价格预测模型及其应用方法,帮助读者们更好地理解和运用这些模型。
1. 基于时间序列的预测模型基于时间序列的预测模型是最常见和基础的股票价格预测方法之一。
它假设未来的股票价格取决于过去的价格和相关因素。
其中最著名的时间序列预测模型是ARIMA模型(差分自回归移动平均模型)和GARCH模型(广义自回归条件异方差模型)。
ARIMA模型适用于对非平稳时间序列数据的预测。
它通过对时间序列数据的差分运算,将非平稳序列转化为平稳序列,然后通过回归分析预测未来股票价格。
GARCH模型则适用于对时间序列数据中波动(方差)的建模和预测。
它能够捕捉到市场波动的特征,从而提供更准确的股票价格预测。
2. 基于机器学习的预测模型随着计算能力的提高和大数据时代的到来,基于机器学习的股票价格预测模型越来越受到关注。
机器学习模型可以通过学习历史数据中的模式和规律,从而对未来股票价格进行预测。
在金融领域中,最常用的机器学习算法包括线性回归、支持向量机和随机森林等。
线性回归是一种基本的机器学习算法,通过建立线性关系模型来预测未来股票价格。
支持向量机是一种常用于分类和回归分析的机器学习算法,它通过寻找最佳的决策边界来进行预测。
随机森林是一种集成学习算法,通过构建多个决策树并组合它们的结果来进行预测。
这些机器学习模型在预测股票价格方面具有较高的准确性和效率。
3. 基于深度学习的预测模型深度学习是一种近年来兴起的机器学习技术,它通过构建多层次的神经网络来进行特征学习和预测。
在金融领域,基于深度学习的股票价格预测模型在最近几年取得了显著的进展。
其中,长短期记忆网络(LSTM)是最常用的基于深度学习的预测模型之一。
LSTM模型能够处理时间序列数据中的长期依赖关系,这对于股票价格的预测尤为重要。
时序预测中的分段线性回归模型介绍时序数据分析是一种用来研究时间序列的变化规律和趋势的方法。
在实际生活和工作中,时序预测是非常重要的。
例如,股票价格的预测、气温的预测、销售量的预测等都需要时序预测的方法。
分段线性回归模型是一种常用的时序预测方法,它将时间序列分成若干个区间,然后在每个区间内使用线性回归模型对数据进行拟合。
本文将介绍分段线性回归模型的基本原理和应用。
1. 分段线性回归模型的基本原理分段线性回归模型是一种利用线性回归模型对时间序列进行分段拟合的方法。
假设我们有一个包含n个数据点的时间序列,我们希望找到一条直线来拟合这个时间序列。
传统的线性回归模型假设整个时间序列满足线性关系,但是在实际情况中,很多时间序列并不是完全的线性关系。
分段线性回归模型通过将时间序列分成若干个区间,然后在每个区间内使用线性回归模型来拟合数据,从而更好地捕捉时间序列的非线性特征。
2. 分段线性回归模型的应用分段线性回归模型在时序预测中有着广泛的应用。
例如,在股票价格的预测中,股票价格往往会呈现出明显的上涨和下跌的走势,这种非线性特征可以通过分段线性回归模型来更好地拟合。
又如在气温的预测中,气温随着季节的变化呈现出不同的趋势,分段线性回归模型可以更好地捕捉这种季节性变化。
总的来说,分段线性回归模型适用于任何有明显非线性特征的时间序列数据。
3. 分段线性回归模型的优缺点分段线性回归模型有着自身的优缺点。
其优点在于能够更好地捕捉时间序列的非线性特征,适用性广泛。
另外,分段线性回归模型的参数估计通常比较简单,计算速度较快。
然而,分段线性回归模型也存在一些局限性,例如需要提前确定分段点,这在实际应用中可能比较困难。
另外,分段线性回归模型在区间边界处可能存在不连续的拟合问题。
4. 分段线性回归模型的改进为了克服分段线性回归模型的局限性,研究者们提出了一些改进的方法。
例如,可以使用基于惩罚项的方法来确定分段点,这样可以避免提前确定分段点的问题。
线性回归模型的原理及应用1. 概述线性回归是机器学习中一种基本的回归方法,用于建立关于自变量和因变量之间线性关系的预测模型。
线性回归模型的原理简单清晰,应用广泛,适用于各种实际问题的解决。
本文将介绍线性回归模型的原理及其在实际应用中的具体场景。
2. 线性回归模型的原理线性回归模型基于线性关系的假设,将自变量(特征)和因变量之间的关系表示为线性方程。
其数学表示如下:$$Y = \\beta_0 + \\beta_1X_1 + \\beta_2X_2 + ... + \\beta_nX_n + \\epsilon$$ 其中,Y是因变量,X1,X2,...,X n是自变量,$\\beta_0, \\beta_1, \\beta_2, ..., \\beta_n$是回归系数,$\\epsilon$是误差项。
线性回归模型的目标是求解最优的回归系数,使得预测值与实际值之间的差异最小化。
3. 线性回归模型的应用线性回归模型在实际问题中有着广泛的应用场景,以下列举了几个常见的应用场景。
3.1 产品销量预测线性回归模型可以用于预测产品的销量。
通过收集产品的各种特征(如价格、促销活动、竞争对手的销售情况等),建立线性回归模型,可以预测产品在不同条件下的销量表现。
这样的预测模型在制定销售策略、预测产量需求等方面具有重要作用。
3.2 股票价格预测线性回归模型可以用于预测股票价格的走势。
通过收集与股票涨跌相关的因素(如宏观经济指标、公司财报数据、行业发展情况等),建立线性回归模型,可以预测股票价格的未来走势。
这样的预测模型在金融投资领域有着重要的应用价值。
3.3 房价预测线性回归模型可以用于预测房价。
通过收集与房价相关的因素(如地理位置、房屋面积、建筑年限等),建立线性回归模型,可以预测不同房屋条件下的市场价格。
这样的预测模型在房地产市场的房价评估、资产管理等方面具有重要意义。
3.4 人口增长预测线性回归模型可以用于预测人口增长趋势。
多元线性回归的案例多元线性回归是一种统计方法,用于研究多个自变量对因变量的影响程度和方向。
在实际应用中,多元线性回归可以用于解释自然和社会科学领域中的现象和问题。
以下是一些多元线性回归的案例,以说明其在不同领域中的应用。
1.金融领域:多元线性回归可以用于解释股票市场中股价的涨跌。
自变量可以包括经济指标(如GDP、CPI)、公司财报数据(如销售额、利润)和市场相关信息(如市盈率、市净率)。
通过构建模型,可以分析不同自变量对股价的影响,并预测未来的股价走势。
2.医学研究:多元线性回归可以用于分析医学数据,如研究一种药物对疾病治疗效果的影响。
自变量可以包括药物剂量、患者的年龄、性别等因素。
通过建立模型,可以评估不同因素对治疗效果的影响,并制定合理的治疗方案。
3.教育领域:多元线性回归可以用于研究教育投入和学生考试成绩之间的关系。
自变量可以包括学校的教师数量、教育经费、学生人数等因素。
通过建立模型,可以分析这些因素对学生成绩的影响,并为改善教育质量提供科学依据。
4.市场营销:多元线性回归可以用于分析消费者购买行为。
自变量可以包括产品价格、广告投入和竞争对手的行动等因素。
通过建立模型,可以了解这些因素对消费者决策的影响,制定有效的市场营销策略,提高产品销售量。
5.环境科学:多元线性回归可以用于分析环境污染的原因和影响因素。
自变量可以包括工业排放数量、交通流量、气候条件等因素。
通过建立模型,可以了解不同因素对环境污染的贡献程度,制定合理的环境保护政策。
以上仅是多元线性回归的一些应用案例,实际上,它在各个领域都有广泛的应用。
在使用多元线性回归时,需要注意数据的选择和分析方法的合理性,以准确评估自变量对因变量的影响。
同时,还可以通过模型的调整和检验,不断优化预测效果,提高研究的科学性和可靠性。
科技·经济·市场612019年第8期
经济研究基于改进多元线性回归的股票价格预测模型李俊豪(辽宁师范大学数学学院,辽宁 大连 116021)摘 要:当前股票市场价格波动剧烈,不论是专业股票投资者以及相关从业人员还是二级市场中的散户都希望找到一条行之有效的路径进行股票价格预测,这不仅能帮助投资者控制风险,也可以帮助其减少不必要的损失。本文以当前比较流行的多元线性回归法为基础,并使用因子分析将这一方法进行改进对贵州茅台(SHSE. 600519)这一支股票进行股价预测,最终通过比较预测效果,推行出适用于该股票的股价预测模型。关键词:量化投资;多元线性回归;因子分析;股价预测;数学建模
0 引言事实上,量化投资就是使用数学的方法与手段在经济现象中找到数据存在的内在联系,通过K线图的观察,可以看到当前某些股票有明显的时间序列上的线性关系,那么进而可以大胆的假设,实际上股票价本身是否与自身的各个指标之间有着较强的线性关系。本文建立了多元线性回归模型,把股价作为被解释变量,其他影响因素作为解释变量,进行模型模拟。[1]我们在对该模型进行共线性诊断时会发现,开盘价、最高价、最低价、收盘价、总手数、次日开盘价这些自变量间存在严重的多重共线性,影响了模型的预测效果。事实上,计量经济学理论给出了多种消除多重共线性有多种处理方式,本文选择使用较为简便的方式,即因子分析来消除多重共线性。在进行因子分析后,我们将多个解释变量最终分为两个因子,分别是价格因子和数量因子,以这两个因子为自变量,次日收盘价为因变量进行多元线性回归,得到的回归方程模型进行预测的结果远远优于之前的回归模型。[2]本文最终使用东方财富软件上的日K线图上的数据作为数据来源,选取贵州茅台(SHSE.600519)这只绩优的白马股作为目标股票,把2018.10.30-2019.4.17共计114个交易日作为模型建立的训练集,把2019.4.18-2019.4.30共计9个交易日作为模型检验回测期。1 多元线性回归1.1 模型建立多元线性回归使用当日开盘价、最高价、最低价、总手数,次日开盘价为自变量,次日收盘价为因变量作出多元线性方程进行求解预测。
表1 模型汇总b
模型RR 方调整 R 方标准 估计的误差更改统计量Durbin-WatsonR 方更改F 更改df1df2Sig. F 更改
1.994a.989.98812.49938.9891569.4876107.0002.092
a. 预测变量: (常量), 次日开盘价, 总手数, 当日开盘价, 收盘价, 最低价, 最高价;b. 因变量: 次日收盘价表2 系数
模型B非标准化系数标准系数tSig.容差共线性统计量标准 误差试用版VIF
1(常量)-8.0997.652-1.058.292当日开盘价-.082.236-.080-.347.729.002501.052最高价.296.348.294.852.396.0011133.479最低价.412.292.3951.413.161.001743.459收盘价-.724.304-.713-2.383.019.001852.180总手数3.722E-007.000.008.540.590.50731.974次日开盘价1.112.1671.0986.673.000.004257.667
设次日收盘价为Y,当日开盘价为X1,最高价为X2,最低价为X3,收盘价为X4,总手数为X5,次日开盘价为X6,可以得到多元回归方程为:Y=-8.099-0.082X1+0.296X2+0.412X3-0.724X4+ 3.722*10-7X5+1.112X6其中R2为0.988,说明数据的拟合程度相当好,并且根据DW检验数值显示,由于DW值在2左右,该模型不具有自相关性。1.2 模型预测将各解释变量的数值代入多元线性回归方程中有:
Y=-8.099-0.082X1+0.296X2+0.412X3-0.724X4+
3.722*10-7X5+1.112X6
次日收盘价(2019.04.18-2019.04.30)的预测值是:
942.59,948.55,961.15,962.3,981.01,973.27,956.91,956.03,967.04与观察值的绝对误差分别为:2.91,4.01,11.95,科技·经济·市场622019年第8期
经济研究12.65,11.01,20.9,11.91,15.94,9.96平均绝对误差为:11.22平均绝对误差百分比:1.18%可以看到所得到的模型的预测效果非常好,绝对误差的百分比只有1.18%,估计值几乎已经无限接近于实际观察值。2 模型改进2.1 模型建立由表2可以看到该模型具有非常强的多重共线性,VIF值远远大于10,所以本文采用因子分析法来减少多重共线性对模型的冲击,首先要进行因子分析的前提条件假设。
表3 相关矩阵当日开盘价最高价最低价收盘价总手数次日开盘价
相关当日开盘价1.000.996.998.994.330.990最高价.9961.000.997.999.276.996最低价.998.9971.000.997.628.994收盘价.994.999.9971.000.465.998总手数.330.276.628.4651.000.373次日开盘价.990.996.994.9598.3731.000
可以看到绝大多数的相关系数均超过了0.6,并且由接近70%的相关系数在0.9以上说明当前各变量之间有较强的相关性。基于这样的强相关性,可以看出当前各组数据比较适合进行因子分析,但是本文还对该组数据进行了其他相关检验保证数据的合理性。表4 KMO和Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量.812Bartlett 的球形度检验近似卡方2604.772df15Sig..000根据检验结果可以看出由表知巴特利特球度检验的检验统计量为2604.772,该观测值较大,且对应的概率P值小于给定的显著性水平,且KM0值为0.812,表明原有变量适合作因子分析。在基于该模型适合做因子分析的情况下,本文使用spss软件进行了数据的因子分析:两个因子对总变量的解释程度达到了99.762%,解释效果良好,可以形成两个因子。由此就得到了两个因子,第一个因子的方差贡献率是5.013,第二个因子的方差贡献率是0.973。从而可表5 解释的总方差
成份初始特征值提取平方和载入旋转平方和载入合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %15.01383.55383.5535.01383.55383.5534.95982.65482.6542.97316.20999.762.97316.20999.7621.02617.10899.7623.011.18199.9434.002.03199.9745.001.01899.9916.001.009100.000提取方法:主成份分析。
表6 成份矩阵a成份12当日开盘价.996-.063最高价.999-.016最低价.997-.065收盘价.999-.027总手数.192.981次日开盘价.987-.018提取方法 :主成份。a. 已提取了2个成份。
以对两个因子进行命名,因子一:价格因子,因子二:数量因子。F1=0.996X1+0.999X2+0.997X3+0.999X4+0.192X5+
0.997X6
F2=-0.063X1-0.016X2-0.065X3-0.027X4+0.981X5-
0.018X6
2.2 改进模型回测
根据下表可以看到调整后的R方为0.984,说明模型拟合程度相当好,并且significant-F值为0.000<0.05。该模型经过DW检验后,DW值为1.761在2附近,可以认为不存在自相关性。 (下转第64页)科技·经济·市场642019年第8期
经济研究中小型企业盈利过分依赖于存贷款业务收入的现状。1.5 提高发展效率中小企业进行融资后,有利于提高中小金融企业的发展效率。针对于金融机构的发展效率大多是指金融机构在未来发展中以及日常工作中的创新能力[6]。想要在日益激烈的市场竞争中占有一席之地,中小金融机构就需要不断提升自身创新能力,顺应社会经济的发展需求,有效防范市场化带来的一系列风险。中小金融机构的创新能力是对中小金融机构的有效体现。中小企业融资加剧了金融机构的市场竞争,要求中小金融机构不断进行金融创新,通过创新手段提高自身竞争力,保证正常的利润收入,增加自己的市场份额。另一方面中小企业融资为金融机构产品的创新提供基准,融资股东为提高创新能力奠定基础,有助于金融机构在日后的发展大力发展创新能力,不断引进新型技术,提高金融机构的发展效率。2 结束语 在一带一路的时代背景下,通过国家政策的扶持,在中小型企业的发展中进行融资,“一带一路”给中小企业的发展提供了一个重要的契机,同时,也给予中小型金融结构一个发展的机会。金融机构想要抓住这个机会进行自我发展,就需要不断进行改良。这不仅是对金融机构的考验,也是对融资企业的一种挑战。通过中小型金融结构的不断完善,为中小型金融机构的发展提供坚定的基础。
参考文献:[1]杨蕾, 张恒瑄, 刘静怡. “一带一路”背景下中小型外贸企业融资困境破解策略——基于北京“政保贷”案例[J]. 农村金融研究, 2018(3):25-26.[2]侯冠平. “一带一路”背景下的物流业发展与社会结构变迁——基于对城镇化和城乡收入差距影响[J]. 江苏农业科学, 2018, 46(11):288-296.[3]曾之明, 汪晨菊, 张琦. 金融发展对中国中小板上市公司融资约束的影响[J]. 财经理论与实践, 2017, 38(4):15-20.[4]雷蕾, 刘健露, 杨恺钧. “一带一路”背景下中国进出口贸易影响因素及发展潜力研究——基于包含碳生产率的引力模型分析[J]. 金融与经济, 2018(2):55-60.[5]闫贝贝, 张强强, 刘军弟,等. “一带一路”倡议背景下的中波苹果贸易及其对中国苹果产业发展和市场的影响[J]. 北方园艺, 2017(20):200-205.[6]黄凌云, 郑淑芳, 王珏. “一带一路”背景下对外投资企业的合作共赢机制研究——基于社会责任视角[J]. 管理评论, 2018, 30(2):172-182.
(上接第62页) 表7 模型汇总(改进)b模型RR 方调整R方标准估计的误差更改统计量Durbin-WatsonR方更改F 更改df1df2Sig. F 更改
1.992a.985.98414.34196.9853561.4782111.0001.761
a. 预测变量: (常量), REGR factor score 2 for analysis 1, REGR factor score 1 for analysis 1;b. 因变量: 次日收盘价。