数学建模之预测模型
- 格式:pdf
- 大小:279.22 KB
- 文档页数:23
数学建模:利用大数据进行市场预测1. 引言1.1 概述数学建模是一种利用数学模型和方法来解决实际问题的过程。
在现代经济社会中,市场预测是企业制定发展战略、进行风险评估以及决策制定的重要依据之一。
随着大数据时代的到来,大量的市场数据变得可获取,这为我们进行精确的市场预测提供了新的机遇和挑战。
1.2 文章结构本文将分为六个主要部分进行讨论。
首先,在引言部分我们将概述本文的内容,并解释数学建模与市场预测之间的关系。
接下来,第二部分将介绍数学建模的概念与方法,并探讨大数据在市场分析中的作用。
第三部分将重点讲解数据收集与处理技术,包括大数据收集与整理方法、数据预处理技术以及数据特征提取和筛选方法。
第四部分将详细介绍市场预测模型构建与评估,包括回归分析、时间序列分析以及机器学习算法在市场预测中的应用。
在第五部分,我们将通过实际案例研究和实践经验分享来进一步加深对市场预测的理解。
最后,我们将在第六部分总结全文,并提出进一步研究的方向。
1.3 目的本文旨在探讨数学建模在市场预测中的应用,特别是利用大数据进行市场预测的方法和技术。
通过详细介绍数据收集与处理技术以及常见的市场预测模型构建方法,我们希望读者能够更加全面地了解数学建模在市场预测中的实际应用,并掌握相应的方法和技巧。
同时,通过案例研究和实践经验分享,我们将展示数学建模在不同领域、不同行业中的具体运用和效果。
最终,我们希望本文能为相关领域的专业人士和研究者提供有益的参考和启发。
2. 数学建模与市场预测2.1 数学建模的概念与方法在现代市场分析中,数学建模是一种应用数学方法和技术来描述、理解和预测市场行为的方法。
通过将实际市场问题抽象为数学对象,并运用数学公式和算法来构建模型,研究人员可以利用这些模型对市场进行定量分析和预测。
数学建模的关键步骤包括问题定义、数据收集、模型选择与建立、参数估计和验证等。
数学建模有多种方法可供选择,常见的包括回归分析、时间序列分析和机器学习算法等。
关于计划生育政策调整对人口数量、结构及其影响的研究【摘要】本文着重于讨论两个问题:1、从目前中国人口现状出发,对于中国未来人口数量进行预测。
2、针对深圳市讨论单独二胎政策对未来人口数量、结构及其对教育、劳动力供给与就业、养老等方面的影响。
对于问题1从中国的实际情况和人口增长的特点出发,针对中国未来人口的老龄化、出生人口性别比以及乡村人口城镇化等,提出了 Logistic 、灰色预测、等方法进行建模预测。
首先,本文建立了 Logistic 阻滞增长模型,在最简单的假设下,依照中国人口的历史数据,运用线形最小二乘法对其进行拟合, 对 2014 至 2040 年的人口数目进行了预测, 得出在 2040 年时,中国人口有 14.32 亿。
在此模型中,由于并没有考虑人口的年龄、 出生人数男女比例等因素,只是粗略的进行了预测,所以只对中短期人口做了预测,理 论上很好,实用性不强,有一定的局限性。
然后, 为了减少人口的出生和死亡这些随机事件对预测的影响, 本文建立了 GM(1,1) 灰色预测模型,对 2014 至 2040 年的人口数目进行了预测,同时还用 2002 至 2013 年的 人口数据对模型进行了误差检验,结果表明,此模型的精度较高,适合中长期的预测, 得出 2040 年时,中国人口有 14.22 亿。
与阻滞增长模型相同,本模型也没有考虑年龄 一类的因素,只是做出了人口总数的预测,没有进一步深入。
对于问题2针对深圳市人口结构中非户籍人口比重大,流动人口多这一特点,我们采用了灰色GM(1,1)模型,通过matlab 对深圳市自2001至2010年的数据进行拟合,发现其人口变化近似呈线性增长,线性相关系数高达0.99,我们就此认定其为线性相关并给出线性方程。
同理,针对其非户籍人口,我们进行matlab 拟合发现,其为非线性相关,并得出相关函数。
并做出了拟合函数0.0419775(1)17255.816531.2t X t e ⨯+=⨯-。
【数学建模】day14-建⽴GM(1,1)预测评估模型应⽤学习建⽴GM(1,1)灰⾊预测评估模型,解决实际问题:SARS疫情对某些经济指标的影响问题⼀、问题的提出 2003 年的 SARS 疫情对中国部分⾏业的经济发展产⽣了⼀定影响,特别是对部分疫情较严重的省市的相关⾏业所造成的影响是显著的,经济影响主要分为直接经济影响和间接影响。
直接经济影响涉及商品零售业、旅游业、综合服务等⾏业。
很多⽅⾯难以进⾏定量的评估,现仅就 SARS 疫情较重的某市商品零售业、旅游业和综合服务业的影响进⾏定量的评估分析。
究竟 SARS 疫情对商品零售业、旅游业和综合服务业的影响有多⼤,已知某市从 1997 年 1 ⽉到 2003 年 12 ⽉的商品零售额、接待旅游⼈数和综合服务收⼊的统计数据如下⾯三表所⽰。
试根据这些历史数据建⽴预测评估模型,评估 2003 年 SARS 疫情给该市的商品零售业、旅游业和综合服务业所造成的影响。
⼆、模型的分析与假设模型分析: 根据所掌握的历史统计数据可以看出,在正常情况下,全年的平均值较好地反映了相关指标的变化规律。
这样,对于每⼀个经济指标,考虑从两部分着⼿建⽴预测评估模型:1. 利⽤灰⾊理论建⽴GM(1,1)模型,根据1997-2002年的平均值序列,预测2003年的平均值。
2. 通过历史数据计算每⼀个⽉的指标值与全年总值之间的关系,并将此关系拓展到2003年,进⽽预测出2003年每⼀个⽉的指标值。
进⽽与真实数据值作⽐较,从⽽得出结论。
模型假设:1. 假设所有的统计数据真实可靠。
2. 假设该市SARS疫情流⾏期间和结束之后,数据的变化只与SARS疫情的影响有关,不考虑其他随机因素的影响。
三、建⽴灰⾊预测模型GM(1,1) 由已知数据,对于1997-2002年的某项指标记为A= (a ij)6*12,计算每年的平均值作为初始数列。
记为: 并要求级⽐。
对x(0)做⼀次累加得1-AGO序列: 式中: 取x(1)的加权均值序列: 式中,α是确定参数。
数学建模——灰色预测模型灰色预测模型(Grey Forecasting Model)是一种用于预测不确定性数据的数学模型。
它适用于那些缺乏充分历史数据、不具备明显的规律性趋势或周期性的情况。
灰色预测模型基于灰色系统理论,通过分析数据的变化趋势和规律,来进行预测。
该模型在处理少量数据、缺乏趋势规律的情况下,具有一定的优势。
灰色预测模型的基本思想:灰色预测模型基于“白化(Whitening)”和“黑化(Blackening)”的思想,将不确定性数据分为“白色”和“黑色”两部分。
其中,“白色”代表已知数据,具有规律性和趋势,可以进行预测;而“黑色”代表未知数据,缺乏规律,需要进行预测。
通过建立数学模型,将“白色”和“黑色”数据进行融合,得出预测结果。
灰色预测模型的基本步骤:1.建立灰色数列:将原始数据分成“白色”和“黑色”两部分,构建灰色数列。
2.建立灰色微分方程:对“白色”数列进行微分,得到一阶或高阶微分方程。
3.求解微分方程:求解微分方程,得到预测模型的参数。
4.进行预测:利用已知的模型参数,对“黑色”数据进行预测,得出未来的趋势。
示例:用灰色预测模型预测销售量假设你是一家新开设的小型餐厅的经营者,你希望预测未来三个月的月销售量。
然而,你的餐厅刚刚开业不久,历史销售数据有限,且不具备明显的趋势。
这种情况下,你可以考虑使用灰色预测模型来预测销售量。
步骤:1.建立灰色数列:将已知的销售数据分为“白色”(已知数据)和“黑色”(未知数据)两部分。
2.建立灰色微分方程:对“白色”销售数据进行一阶微分,得到灰色微分方程。
3.求解微分方程:根据灰色微分方程的形式,求解微分方程,得到模型的参数。
4.进行预测:利用求解得到的模型参数,对“黑色”销售数据进行预测,得到未来三个月的销售量趋势。
这个例子中,灰色预测模型可以帮助你基于有限的历史销售数据,预测未来的销售趋势。
虽然该模型的精确度可能不如其他更复杂的方法,但在缺乏充足数据时,它可以提供一种有用的预测工具。
人口预测模型数学建模论文摘要人口的数量和结构是影响经济社会发展的重要因素。
从20世纪70年代后期以来,我国鼓励晚婚晚育,提倡一对夫妻生育一个孩子。
该政策实施30多年来,有效地控制了我国人口的过快增长,对经济发展和人民生活的改善做出了积极的贡献。
但另一方面,其负面影响也开始显现。
如小学招生人数、高校报名人数逐年下降,劳动人口绝对数量开始步入下降通道,人口抚养比的“拐点”时刻即将到来。
这些问题都会对我国的经济和社会健康、可持续发展等产生一系列影响。
人口问题日益受到人们的重视。
对于问题一,我们通过多个渠道收集数据,利用SAS和Matlab等软件进行计算分析,我们得到了我国上世纪50年代至今人口和经济的主要变化如下: 对于问题二,这是典型的人口模型,我们建立了4个相应的数学模型,选用了基于以往人口数据的一次线性回归,灰色、时间序列预测,逻辑斯蒂模型和基于年龄结构并生育率、死亡率随时间Leslie人口模型。
进行全方位的深刻讨论,在本文假设的条件下,符合中国人口特点,例如,老龄化进程加速、出生人口性别比持续升高等,对中国的人口未来长期发展状况进行了科学性的预测;通过权重关系,建立起了组合模型,特别地在权重问题上,采用了熵权法分配权重,思路巧妙,提高了预测的精确度;建立BP神经网络模型,无需进行模型假设,同时能利用模型自身对复杂的非线性曲线进行拟核,利用拟核函数对人口增长趋势作出了合的预测。
本文的模型具有很好的推广性,而且在其它领域发挥很好的效果。
在对中国的人口未来长期发展状况进行了科学性的预测后,我们分析得到计划生育新政策。
关键词:微分方程模型;Leslie人口模型;曲线拟合;灰色序列预测中国人口预测模型摘要本文对人口预测的数学模型进行了研究。
首先,建立一次线性回归模型,灰色序列预测模型和逻辑斯蒂模型。
考虑到三种模型均具有各自的局限性,又用加权法建立了熵权组合模型,并给出了使预测误差最小的三个预测模型的加权系数,用该模型对人口数量进行预测,得到的结果如下:单位:(万人)年份 2006 2007 2008 2009 2010 预测值 134840.9 137027.35 1377785.7 139360.4 140857.4 其中加权系数为:0.24282,0.34055,0.41663。
数学建模预测类模型近些年来,紧随科技的发展,许多科学上的技术前进了一大步。
尤其是建立数学模型,它的作用是帮助研究人员更好地描述客观实际中的现象,探究其机理,找出其发展规律,从而分析和预测未来的情况。
数学建模预测模型就是这样的一种模型。
数学建模预测模型通过建立数学模型,以定量的方式表达出待预测的系统,从而探究其结构,提出待求问题,推断出相应结果,从而根据不断变化的实际情况做出准确的预测。
它在实践中具有广泛的应用,比如,在气象研究中,它用于预测空气污染、流域水资源变化、决策决策过程等。
另外,数学建模预测模型还在经济,社会和环境等领域有着其重要作用。
数学建模预测模型的建立包括三个主要步骤:首先,要确定模型结构,即在模型里平衡哪些变量,它们又如何相互影响;其次,对模型进行解析,以确定数据的参数分配;最后,验证模型的可靠性,通过实际情况进行模拟,以确保预测结果的准确性。
在建立数学建模预测模型时,要求有序而系统地阐述,确保模型的合理性,以便从中抽取有效信息。
此外,要求设计者对各种概念、原理和方法有系统的了解,以及辨别、汇集、分析、评价有关系统的数据,这样才能保证模型的准确性和有效性。
数学建模预测模型的应用,有助于我们更好地运用它,满足特定的研究目的。
它有助于我们全面掌握和分析各种复杂的实际现象,正确判断发展趋势,知晓影响因素,从而有效地掌控和推动实践发展,造福社会。
数学建模预测模型具有特殊的优势,它除了能够作为一个预测工具外,还能够有效地表达和解释复杂实际现象,帮助我们分析和掌握客观实际发展规律,从而创造出新的研究方法和理论,这也是它影响着科学研究和实践发展的原因之一。
总之,数学建模预测模型的建立和应用具有重要的意义,是一种能够有效揭示实际现象规律,分析未来发展趋势的重要工具。
它不仅能够在实践中作为一个科学的工具,帮助我们有效的解决问题,也可以作为一个综合复杂实际现象的理论工具,发现新的规律,给我们带来新的研究视角。
第六章 预测模型(Forecast Models )本讲主要内容1. 预测和预测模型2. 时间序列预测模型3. 灰色预测模型4. 数学建模案例:SARS 疫情对某些经济指标影响问题6.1预测和预测模型6.1.1 什么是预测预测作为一种探索未来的活动早在古代已经出现,但作为一门科学的预测学,是在科学技术高度发达的当今才产生的。
“预测”是来自古希腊的术语。
我国也有两句古语:“凡事预则立,不预则废”, “人无远虑,必有近忧” 。
预测的目的在于认识自然和社会发展规律,以及在不同历史条件下各种规律的相互作用,揭示事物发展的方向和趋势,分析事物发展的途径和条件,使人们尽早地预知未来的状况和将要发生的事情,并能动地控制其发展,使其为人类和社会进步服务。
因而预测是决策的重要的前期工作。
决策是指导未来的,未来既是决策的依据,又是决策的对象,研究未来和预测未来是实现决策科学化的重要前提。
预测和决策是过程的两个方面,预测为决策提供依据,而预测的目的是为决策服务,所以不能把预测模型和决策模型截然分开,有时也把预测模型称为决策模型。
20世纪以来,预测技术所以得以长足进步,一方面,与社会需求有很大关系,另一方面通过社会实践和长期历史验证,表明事物的发展是可以预测的。
而且借助可靠的数据和科学的方法,以及预测技术人员的努力,预测结果的可靠性和准确性可以达到很高的程度,这也是预测技术迅速发展的另一个重要原因。
6.1.2 预测的方法和内容为保证预测结果的精确度,预测之前的主要工作是数据的准备,数据是预测工作的前提和重要依据,预测不能是臆造和空想,任何事物的发展都有一定的规律,认真研究预测对象并充分考察预测对象所处的环境,以系统分析的方法对过去和现在的数据进行总结,从中找出规律,便可科学地推断未来。
1.数据的收集和整理 按时态分,数据可分为历史数据和现实数据;按预测对象分,可分为内部数据和外部数据;就收集的手段分,可分为第一手数据和第二手数据。
数学建模模型常用的四大模型及对应算法原理总结四大模型对应算法原理及案例使用教程:一、优化模型线性规划线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,在线性回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。
如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
案例实操非线性规划如果目标函数或者约束条件中至少有一个是非线性函数时的最优化问题叫非线性规划问题,是求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。
建立非线性规划模型首先要选定适当的目标变量和决策变量,并建立起目标变量与决策变量之间的函数关系,即目标函数。
然后将各种限制条件加以抽象,得出决策变量应满足的一些等式或不等式,即约束条件。
整数规划整数规划分为两类:一类为纯整数规划,记为PIP,它要求问题中的全部变量都取整数;另一类是混合整数规划,记之为MIP,它的某些变量只能取整数,而其他变量则为连续变量。
整数规划的特殊情况是0-1规划,其变量只取0或者1。
多目标规划求解多目标规划的方法大体上有以下几种:一种是化多为少的方法,即把多目标化为比较容易求解的单目标,如主要目标法、线性加权法、理想点法等;另一种叫分层序列法,即把目标按其重要性给出一个序列,每次都在前一目标最优解集内求下一个目标最优解,直到求出共同的最优解。
目标规划目标规划是一种用来进行含有单目标和多目标的决策分析的数学规划方法,是线性规划的特殊类型。
目标规划的一般模型如下:设xj是目标规划的决策变量,共有m个约束条件是刚性约束,可能是等式约束,也可能是不等式约束。
设有l个柔性目标约束条件,其目标规划约束的偏差为d+, d-。
设有q个优先级别,分别为P1, P2, …, Pq。
在同一个优先级Pk中,有不同的权重,分别记为[插图], [插图](j=1,2, …, l)。
数学建模常用模型与算法一、常用模型☐(一)、评价模型:☐AHP(层次分析法)(确定权重)、模糊评价、聚类分析、因子分析、主成份分析、回归分析、神经网络、多指标综合评价、熵值法(确定权重)等☐(二)、预测模型:☐指数平滑法、灰色预测法、回归模型、神经网络预测、时间序列模型、马尔科夫预测、差分微分方程☐(三)、统计模型:☐方差分析、均值比较的假设检验☐(四)、方程模型:☐常微分方程、差分方程、偏微分方程、以及各种方程的求解(数值解和解析解)☐(五)运筹优化类:☐线性规划、非线性规划、目标规划、整数规划、图论模型(最短路、最大流、遍历问题等)、排队论、对策论、以及各种模型的算法☐(六)其他模型:☐随机模拟模型、等二、十大算法1、蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必用的方法)2、数据拟合、参数估计、插值等数据处理算法(比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用Matlab作为工具)3、线性规划、整数规划、多元规划、二次规划等规划类问题(建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo软件实现)4、图论算法(这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备)5、动态规划、回溯搜索、分治算法、分支定界等计算机算法(这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中)6、最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法(这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用)7、网格算法和穷举法(网格算法和穷举法都是暴力搜索最优点的算法,在很多竞赛题中有应用,当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具)8、一些连续离散化方法(很多问题都是实际来的,数据可以是连续的,而计算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的)9、数值分析算法(如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用)10、图象处理算法(赛题中有一类问题与图形有关,即使与图形无关,论文中也应该要不乏图片的,这些图形如何展示以及如何处理就是需要解决的问题,通常使用Matlab进行处理)。
数学模型的分类按模型的数学方法分:几何模型、图论模型、微分方程模型、概率模型、最优控制模型、规划论模型、马氏链模型等按模型的特征分:静态模型和动态模型,确定性模型和随机模型,离散模型和连续性模型,线性模型和非线性模型等按模型的应用领域分:人口模型、交通模型、经济模型、生态模型、资源模型、环境模型等。
按建模的目的分:预测模型、优化模型、决策模型、控制模型等一般研究数学建模论文的时候,是按照建模的目的去分类的,并且是算法往往也和建模的目的对应按对模型结构的了解程度分:有白箱模型、灰箱模型、黑箱模型等比赛尽量避免使用,黑箱模型、灰箱模型,以及一些主观性模型。
按比赛命题方向分:国赛一般是离散模型和连续模型各一个,2016美赛六个题目(离散、连续、运筹学/复杂网络、大数据、环境科学、政策)数学建模十大算法1、蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,比较好用的算法)2、数据拟合、参数估计、插值等数据处理算法(比赛常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用Matlab作为工具)3、线性规划、整数规划、多元规划、二次规划等规划类问题(建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo软件实现)4、图论算法(这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备)5、动态规划、回溯搜索、分治算法、分支定界等计算机算法(这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中)6、最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法(这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用)7、网格算法和穷举法(当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具)8、一些连续离散化方法(很多问题都是从实际来的,数据可以是连续的,而计算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的)9、数值分析算法(如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用)10、图象处理算法(赛题中有一类问题与图形有关,即使与图形无关,论文中也应该要不乏图片的这些图形如何展示,以及如何处理就是需要解决的问题,通常使用Matlab进行处理)算法简介1、灰色预测模型(必掌握)解决预测类型题目。
摘 要中国是一个人口大国,人口问题与我国的经济发展等方面息息相关。
随着我国人口数量的不断变化,人口的老龄化问题也日益突显,政策的调整不可或缺。
从当初实行计划生育政策到逐步放开生育政策再到全面实行二孩政策,我国人口发展呈现了一些新特点。
本文旨在通过多种预测方法对“全面二孩政策”下的人口数量及其结构进行预测,筛选出了经济发展的指标,并分人口结构对经济发展的影响,结论如下:针对问题一,本文参考中国国家统计局等官方资料的数据统计出各年人口总数、自然增长率等数据,建立了logistic 模型,得出人口总数的变化公式,然后建立GM(1,1)预测模型,预测2016年的人口总数,再利用SPSS 进行回归、曲线估计,得出最为符合的方程式,再利用MATLAB 函数拟合工具箱对所得数据进行拟合。
预测出2017-2030年间人口先增后减,在2021年达到峰值。
针对问题二,通过建立BP 神经网络模型,利用GM(1,1)灰色预测处理人口结构数据得到训练及测试数据集,将数据BP 神经网络算法进行多次训练,最终得到具有相当精度的稳定预测结果。
提取相当数量的经济指标并对其进行主成分分析降维处理,之后对主要经济指标及人口结构指标进行多元回归分析得到2020-2030年人口结构对经济发展的影响。
针对问题三,关键词:灰色预测 BP 神经网络 Leslie 人口结构预测模型问题假设1.将我国看做一个封闭系统,没有人口的迁入和迁出2.人口增长只与人口基数、生育率、死亡率等有关3.没有大规模战争及瘟疫等传染性疾病4.假设短期内没有外来物种对人类生存造成影响5.假设所有数据均为准确数据6.假设2050年前医疗水平和科学技术不会对人类的死亡率、出生率造成影响模型符号说明: r : 人口自然增长率 x :总人口数0x :初始年份的人口数量t :时间)()0(k x :灰色预测的原始序列 )(ˆ)0(k x:灰色预测的原始数列预测值 ij x :第i 个指标的第j 个数据i d :第i 岁的死亡率i b :第i 岁的生育率问题一 模型建立首先,我们建立了logistics 模型,具体如下)0(x x rxdtdx == 其次,建立GM(1,1)预测模型GM(1,1)是一阶微分方程模型,其形式为:u ax dtdx=+ 离散形式:u k x a k x =+++∆))1(())1(()1()1(预测公式:a u e a u x k xka ˆˆˆˆ)1()1(ˆˆ)1()1(+⎥⎦⎤⎢⎣⎡-=+- 由导数可知:tt x t t x dt dx t ∆-∆+=→∆)()(lim0 当t ∆很小并且取很小的1单位时,则近似的有:txt x t x ∆∆=-+)()1( 写成离散形式:))1(()()1()1(+∆=-+=∆∆k x k x k x tx由于tx ∆∆)1(涉及到累加列)1(x 的两个时刻的数值,因此,)()1(i x 取前后两个时刻的平均代替更为合理,即将)()(i x i 替换为)]()1([21)1().,...,3,2()],1()([21).,...,3,2()],1()([21)1()1()1()()()()()(k x k x k x n i i x i x x n i i x i x i i i i i ++=+=-+==-+))1(()()1()1(+∆=-+=∆∆k x k x k x txu k x a k x =+++∆))1(())1(()1()1()]()1([21)1()1()1()1(k x k x k x ++=+整理可得 u k x k x a k x+++-=+))]1()((21[)1()1()1()0(表示为矩阵形式:⎥⎦⎤⎢⎣⎡⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎣⎡⋯-+-⋯+-+-=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⋯u a n x n x x x x x n x x x 111)]1()([21)]2()3([21)]1()2([21)()3()2()1()1()1()1()1()1()0()0()0( 不妨令T n x x xy ))(),3(),2(()0()0()0(,⋯=令⎥⎦⎤⎢⎣⎡=⎥⎥⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎢⎢⎣⎡⋯-+-⋯+-+-=u a U n x n x x x x x B ,111)]1()([21)]2()3([21)]1()2([21)1()1()1()1()1()1( 则y B B B ua U BU Y T T 1)(ˆˆˆ-=⎥⎦⎤⎢⎣⎡==,模型求解1.对logistics 模型进行求解 得到总人口变化公式:rte x x 0= (0x 为初始年份人口数,21≥t )2.利用GM (1,1)模型,根据1996-2015年中国总人口数据,对2016年总人口数进行预测。
第六章 预测模型(Forecast Models )本讲主要内容1. 预测和预测模型2. 时间序列预测模型3. 灰色预测模型4. 数学建模案例:SARS 疫情对某些经济指标影响问题6.1预测和预测模型6.1.1 什么是预测预测作为一种探索未来的活动早在古代已经出现,但作为一门科学的预测学,是在科学技术高度发达的当今才产生的。
“预测”是来自古希腊的术语。
我国也有两句古语:“凡事预则立,不预则废”, “人无远虑,必有近忧” 。
预测的目的在于认识自然和社会发展规律,以及在不同历史条件下各种规律的相互作用,揭示事物发展的方向和趋势,分析事物发展的途径和条件,使人们尽早地预知未来的状况和将要发生的事情,并能动地控制其发展,使其为人类和社会进步服务。
因而预测是决策的重要的前期工作。
决策是指导未来的,未来既是决策的依据,又是决策的对象,研究未来和预测未来是实现决策科学化的重要前提。
预测和决策是过程的两个方面,预测为决策提供依据,而预测的目的是为决策服务,所以不能把预测模型和决策模型截然分开,有时也把预测模型称为决策模型。
20世纪以来,预测技术所以得以长足进步,一方面,与社会需求有很大关系,另一方面通过社会实践和长期历史验证,表明事物的发展是可以预测的。
而且借助可靠的数据和科学的方法,以及预测技术人员的努力,预测结果的可靠性和准确性可以达到很高的程度,这也是预测技术迅速发展的另一个重要原因。
6.1.2 预测的方法和内容为保证预测结果的精确度,预测之前的主要工作是数据的准备,数据是预测工作的前提和重要依据,预测不能是臆造和空想,任何事物的发展都有一定的规律,认真研究预测对象并充分考察预测对象所处的环境,以系统分析的方法对过去和现在的数据进行总结,从中找出规律,便可科学地推断未来。
1.数据的收集和整理 按时态分,数据可分为历史数据和现实数据;按预测对象分,可分为内部数据和外部数据;就收集的手段分,可分为第一手数据和第二手数据。
第一手数据,包括以各种形式初次收集的数据。
收集第一手数据的途径包括:抽样调查,连续调查,或全面调查。
在预测的定性方法中常常需要第一手数据,但获取第一手数据的费用较高,时间较【产品销量预测问题】假设商店某种产品的销售量如下表6-1。
表6-1 某产品销量资料年份2002 2003 2004 2005 2006 2007 2008 2009 2010销售量(万件)10 18 25 30.5 35 38 40 39.5 38试预测2011年的销售量,并且要求在90%的概率保证下,给出预测的置信区间。
长,所以定量方法常采用第二手数据。
第二手数据多为已经公布和发表的资料,易于获取,代价低,数据精度也有一定的保证。
其缺点是数据可能不能直接适用于预测情况。
因此,常常需要对已公布的数据进行修正和处理,使其适应于预测需要。
无论是第一手数据还是第二手数据,都可能是混乱的、无序的、彼此间孤立的。
预测人员都应将原始数据按“单元”或“类别”整理和集中,以便使其成为内容上完整、有序、系统,形式上简明统一的数据。
2.数据的分析和处理建模不仅需要大量的数据,同时数据必须可靠,并适合建模的要求。
这些数据虽然是历史的客观写照,但有可能是失真的数据。
对于失真的数据,以及不符合建模的数据,必须通过分析,加以适当处理。
处理的原则是准确、及时、适用、经济、一致,处理方法有判别法、剔除法、平均值法、差分法等等。
有些模型只能处理平稳数据,如果原始数据为非平稳数据,则需釆取差分处理。
在预测过程中,由于预测对象不同,预测内容不同,以及预测期限不同,所需的数据内涵及数量也不同。
经济预测的数据主要包括:(1)国民经济总产值及各部类的分配情况;(2)各行业的生产规模和生产能力以及技术水平;(3)政府的经济政策及产业政策;(4)生产力布局;(5)人口发展趋势及就业情况;(6)国民经济投资及分配;(7)国际环境及变化趋势。
市场需求预测需要的数据主要有:(1)人口及人均收入;(2)国民收入的增长及分配情况;;(3)与产品消费直接有关的政府政策和法规,如进口限制、进口税、销售稅和其它税费、信贷管理及外费管理等;(4)一段时期内产量和产值的生产能力;(5)一段时期内的产品的进口量;(6)代用品或近似代用品的产量和进口量;(7)与有关新投入的产品前后关联度高的产品的产量;(8)国家计划规定的产品或代用品的生产指标;(9)产品出口量;(10)个人或集体消费者们的习惯或嗜好;(11)法律方面的资料。
针对不同的预测问题可选取适当的数学模型进行预测。
实用的预测模型很多,数学建模中常用的预测模型有时间序列模型,回归分析模型和灰色预测模型等等。
回归模型在第四章中已经介绍,本章讲分别介绍时间序列预测模型和灰色预测模型。
6.2 时间序列预测模型时间序列一般指一组按时间顺序排列的数据,展示了研究对象在一定时期的发生变化过程。
时间序列模型,就是根据预测对象时间变化特征,研究事物自身的发展规律,探讨未来发展趋势,是一种重要的定量预测方法。
它是在时间序列变量分析的基础上,运用一定的数学方法建立预测模型,使时间趋势向外延伸,从而预测未来市场的发展变化趋势,确定变量预测值。
时间序列模型包括多种模型,主要适用于经济预测、商业预测、需求预测、库存预测等,预测期限主要为中、短期,不适用于有拐点的长期预测。
在时间序列中,通常根据影响因素将数据的变化趋势分为四大类:长期趋势、季节变动、循环变动和不规则变动。
对于前三种数据趋势预测问题,由于数据均呈现出某种规律性,因此我们能够将数据进行简化、分析,从而使预测成为可能;而不规则变动是指由某种偶然因素引起的突然变动,如战争的发生、政权的更迭、重大自然灾害的发生等,不规则变动没有周期性。
在建模中常用的时间序列预测方法有移动平均法、指数平滑法、趋势外推法、季节指数预测法等等。
6.2.1 移动平均预测法移动平均法是根据时间序列资料逐渐推移,依次计算包含一定项数的时序平均数,以反映长期趋势的方法。
当时间序列的数值由于受周期变动和不规则变动的影响,起伏较大,不易显示出发展趋势时,可用移动平均法消除这些因素的影响,分析、预测序列的长期趋势。
移动平均法有简单移动平均法、加权移动平均法、趋势移动平均法等,这些都是比较简单的时间序列预测方法。
移动平均法的基本方法是,选一个固定的周期N ,对数据进行平均,每递推一个周期就加上后一个数据,舍去初始数据,依次类推,直至把数据处理完毕。
以N =5为例:512345)1(5y y y y y M ++++=,523456)1(6y y y y y M ++++=.()()1156M M 、分别表示第五、第六个周期的一次移动平均值,依次类推。
若移动平均的周期为N ,则可得到计算移动平均值的一般公式:Ny y y y M N t t t t t )1(21)1(−−−−++++=L ,其中,)1(t M 表示第t 期的一次移动平均值。
可见,移动平均法实际上是对于某一期数据,取前N 个数据进行平均,N 个数权数相同,而其它数据的权为零,这样经过移动平均,将消除数据列中异常的因素,对数据进行修匀。
一般情况下,如果数据没有明显的周期变化和趋势变化,可用第t 期的一次移动平均值作为t +1期的预测值,即)1(1ˆt t M y=+. 表6-2中的的第二列和第三列,即是原始数据与一次移动平均值的对比。
始取N =3的3期移动平均,则第三期数据的移动值为5766.33,它可以作为第4期的预测值。
一次移动平均法只能用来对下一期进行预测,不能用于长期预测。
使用移动平均法,最重要的是移动周期N 的选择。
由于移动平均修匀后的方差,随着N 的加大而减少。
也就是N 越大,对原始数据修匀能力越强。
必须选择合理的移动跨期,跨期越大对预测的平滑影响也越大,移动平均数滞后于实际数据的偏差也越大。
跨期太小则又不能有效消除偶然因素的影响。
跨期取值可在3~20间选取。
表6-2 移动平均值序 列 原 始 数 据 一次移动平均值 二次移动平值 1 2 3 4 5 6 7 8 9 10 115600 5796 5930 6092 6257 6567 6851 7141 7436 7738 80455775.3 5939.3 6093.0 6305.3 6558.3 6853.0 7142.7 7438.3 7739.75935.9 6112.5 6318.9 6572.2 6851.3 7144.7 7440.2在一次移动平均值的基础上,应用移动平均的原理,还可以进行二次甚至多次的移动平均,二次移动平均,就是以一项移动平均值为原始数据,再进行一次移动平均。
二次移动平均法的公式为:Ny y y y MN t t t t t)1(21)1(−−−−++++=L ,NM M M M M N t t t t t )1()1()1(2)1(1)1()2(−−−−++++=L .二次移动平均使原始数据得到了进一步修匀,使其显现线性趋势。
表6-2中的第四列数据为N =3的二次移动平均值。
在二次移动平均值的基础上,可建立线性模型:ττt t t b a y+=+ˆ 其中 ,2)2()1(t t t M M a −=)(12)2()1(t t t M M n b −−=,式中:τ-预测超前期数。
对于表6-1中的数据,如以11期数据预测12期值,当取N =3时,则有:,2.80392.74407.773922)2(11)1(1111=−×=−=M M a.5.2992.74407.7739)(132)2(11)1(1111=−=−−=M M b 预测方程为ττ5.2992.8039ˆ11+=+y. 所以第12期的预测值为 7.83385.2992.8039ˆ12=+=y. 二次移动平均法是对一次移动平均数再次进行移动平均,并在两次移动平均的基础上建立预测模型对预测对象进行预测。
二次移动平均法与一次移动平均法相比,其优点是大大减少了滞后偏差,使预测准确性提高。
但它只适用于短期预测。
而且只用于0≥T 的情形。
6.2.2指数平滑预测法指数平滑法(Exponential Smoothing,ES )是布朗(RobertG.Brown )所提出的,他认为时间序列的态势具有稳定性或规则性,所以时间序列可被合理地顺势推延;他认为最近的过去态势,在某种程度上会持续到未来,所以将较大的权数放在最近的资料。
指数平滑法来自于移动平均法,是一次移动平均法的延伸。
它将时间数据加工平滑,从而获得其变化规律与趋势。
根据平滑次数的不同,指数平滑法可以分为一次指数平滑法、二次指数平滑法和三次指数平滑法等。
1. 一次指数平滑法 一次指数平滑公式为)1(1)1()1(−−+=t t t S y S αα.其中)1(t S :t 期数据的指数平滑值;α:平滑常数,0<α<1;t y :现期数据值。