数理统计课程设计(一元线性回归)剖析
- 格式:doc
- 大小:357.54 KB
- 文档页数:8
实验报告金融系金融学专业级班实验人:实验地点:实验日期:实验题目:进行相应的分析,揭示某地区住宅建筑面积与建造单位成本间的关系实验目的:掌握最小二乘法的基本方法,熟练运用Eviews软件的一元线性回归的操作,并能够对结果进行相应的分析。
实验内容:实验采用了建筑地编号为1号至12号的数据,通过模型设计、估计参数、检验统计量、回归预测四个步骤对数据进行相关分析。
实验步骤:一、模型设定1.建立工作文件。
双击eviews,点击File/New/Workfile,在出现的对话框中选择数据频率,因为该例题中为截面数据,所以选择unstructured/undated,在observations中设定变量个数,这里输入12。
图12.输入数据。
在eviews 命令框中输入data X Y,回车出现group窗口数据编辑框,在对应的X,Y下输入数据,这里我们可以直接将excel中被蓝笔选中的部分用cirl+c复制,在窗口数据编辑框中1所对应的框中用cirl+v粘贴数据。
图23.作X与Y的相关图形。
为了初步分析建筑面积(X)与建造单位成本(Y)的关系,可以作以X为横坐标、以Y为纵坐标的散点图。
方法是同时选中工作文件中的对象X和Y,双击得X和Y的数据表,点View/Graph/scatter,在File lines中选择Regressions line/ok(其中Regressions line为趋势线)。
得到如图3所示的散点图。
图3 散点图从散点图可以看出建造单位成本随着建筑面积的增加而降低,近似于线性关系,为分析建造单位成本随建筑面积变动的数量规律性,可以考虑建立如下的简单线性回归模型:二、估计参数假定所建模型及其中的随机扰动项满足各项古典假定,可以用OLS法估计其参数。
Eviews软件估计参数的方法如下:在eviews命令框中键入LS Y C X,按回车,即出现回归结果。
Eviews的回归结果如图4所示。
图4 回归结果可用规范的形式将参数估计和检验结果写为:(19.2645)(4.8098)t=(95.7969)(-13.3443)0.9468 F=178.0715 n=12若要显示回归结果的图形,在equation框中,点击resids,即出现剩余项、实际值、拟合值的图形,如图5所示。
二氧化碳吸附量与活性炭孔隙结构的线性回归分析摘要:本文搜集了不同孔径下不同孔容的活性炭与CO2吸附量的实验数据。
分别以同一孔径下的不同孔容作为自变量,CO2吸附量作为因变量,作出散点图。
选取分布大致呈直线的一组数据为拟合的样本数据。
对样本数据利用最小二乘法进展回归分析,参数确定,并对分析结果进展显著性检验。
同时利用matlab 的regress 函数进展直线拟合。
结果明确:孔径在3. 0~ 3. 5 nm 之间的孔容和CO2吸附量之间存在较好的线性关系。
关键字:活性炭孔容CO2吸附量matlab一、问题分析本文主要研究同一孔径的孔容的活性炭和co2吸附量之间的线性关系,有关实验数据是借鉴双全,罗雪岭等人的研究成果[1]。
以太西无烟煤为原料、硝酸钾为添加剂,将煤粉、添加剂和煤焦油经过充分混合后挤压成条状,在600℃下炭化15 min,然后用水蒸气分别在920℃和860℃下活化一定时间得到2组活性炭,测定了CO2吸附等温线,探讨了2组不同工艺制备的活性炭的CO2吸附量和孔容的关系.数据如下表所示:表1:孔分布与CO2吸附值编号1~12是在不同添加剂量,温度,活化时间处理下的对照组。
因为处理方式不同得到不同结果是互不影响的,可以看出CO2的吸附量的值是互相独立的。
我们将不同孔径下的孔容分为1~7组。
编号孔容/(1110L g μ--⋅)CO2吸附量1/()mL g -⋅1 70 96 115 642 50 913 11 71 65 914 90 76 1225 78 1136 72 56 997 86 1228 13 69 107 9 78 107 10 13 91 137 11 114 110 142 75 12126 114 183作出不同孔径下与CO2吸附量的散点图如下:2468孔容C O 2吸附量10203040506070孔容C O 2吸附量152025303540孔容C O 2吸附量50100150孔容C O 2吸附量406080100120孔容C O 2吸附量5060708090100110孔容C O 2吸附量80100120140160180200孔容C O 2吸附量图1:不同孔容与CO2吸附量的散点图图1中从左往右依次是第1到第7组孔容,从图中可以看出第五、六、七组的点大致分散在一条直线附近,说明两个变量之间有一定的线性相关关系。
目录一.设计目的 (1)二.设计问题 (1)三.设计原理 (1)四.方法实现 (5)五.设计总结 (15)参考文献 (15)致谢 (16)一.设计目的了解一元回归方程,回归系数的检验方法及应用一元回归方程进行预测的方法;学会应用MATLAB软件进行一元回归实验的分析方法。
同时更好的了解概率论与数理统计的知识,熟练掌握概率论与数理统计在实际问题上的应用,并将所学的知识结合Excel对数据的处理解决实际问题。
本设计是利用一元线性回归理论对用切削机房进行金属品加工时为了适当地调整机床,测量刀具的磨损速度与测量刀具的厚度间的关系建立数学模型,并用Excel分析工具库中的回归分析软件进行解算。
二.设计问题用切削机床进行金属加工时,为了适当地调节机床,需要测定刀具的磨损速x关于时间y的线性回归方程。
由此,我们利用这些数据做出刀具厚度三.设计原理在实际问题中,经常会出现两个变量之间的相关关系不是线性的(即直线型),而是非线性的(即曲线型)。
设其中有两个变量x 与y ,我们可以用一个确定函数关系式:)(x y x=大致的描述y 与x 之间的相关关系,函数)(x u 称为y 关于x的回归函数,方程)(x u y =成为y 关于x的回归方程。
一元线性回归处理的是两个变量x 与y 之间的线性关系,可以设想y 的值由两部分构成:一部分由自变量x 的线性影响所致,表示x 的线性函数bx a +;另一部分则由众多其他因素,包括随机因素的影响所致,这一部分可以视为随机误差项,记为ε。
可得一元线性回归模型ε++=bx a y (1)式中,自变量x 是可以控制的随机变量,成为回归变量;固定的未知参数a,b成为回归系数;y 称为响应变量或因变量。
由于ε是随机误差,根据中心极限定理,通常假定),0(~2σεN ,2σ是未知参数。
确定y 与x之间的关系前,可根据专业知识或散点图,选择适当的曲线回归方程,而这些方程往往可以化为线性方程或者就是线性方程,因此我们可以用线性方程:bx a y +=大致描述变量y 与x 之间的关系;1)模型回归系数的估计为了估计回归系数,假定试验得到两个变量x与y 的n 个数据对(),3,2,1,,n iy x i i Λ=我们将这n 对观测值代入式(1),得n i bx a y n i i ,3,2,1,Λ=++=ε这里n εεε,,,21K K 互独立的随机变量,军服从正态分布,即n ,1,2,3i ),~N(0,2K =σε回归系数估计的方法有多种,其中使用最广泛的是最小二乘法,即要求选取的a ,b , 的值使得述随机误差ε 的平方和达到最小,即求使得函数()()∑∑==--==nii i nii bx a y b a Q 1221,ε取得最小值的a ,b 。
二氧化碳吸附量与活性炭孔隙结构的线性回归分析摘要:本文搜集了不同孔径下不同孔容的活性炭与CO2吸附量的实验数据。
分别以同一孔径下的不同孔容作为自变量,CO2吸附量作为因变量,作出散点图。
选取分布大致呈直线的一组数据为拟合的样本数据。
对样本数据利用最小二乘法进行回归分析,参数确定,并对分析结果进行显著性检验。
同时利用matlab 的regress 函数进行直线拟合。
结果表明:孔径在3. 0~ 3. 5 nm 之间的孔容和CO2吸附量之间存在较好的线性关系。
关键字:活性炭 孔容 CO2吸附量 matlab一、问题分析1.1.数据的收集和处理本文主要研究同一孔径的孔容的活性炭和co2吸附量之间的线性关系,有关实验数据是借鉴张双全,罗雪岭等人的研究成果[1]。
以太西无烟煤为原料、硝酸钾为添加剂,将煤粉、添加剂和煤焦油经过充分混合后挤压成条状,在600℃下炭化15 min,然后用水蒸气分别在920℃和860℃下活化一定时间得到2组活性炭,测定了CO2吸附等温线,探讨了2组不同工艺制备的活性炭的CO2吸附量和孔容的关系.数据如下表所示:表1:孔分布与CO2吸附值编号1~12是在不同添加剂量,温度,活化时间处理下的对照组。
因为处理方式不同得到不同结果是互不影响的,可以看出CO2的吸附量的值是互相独立的。
我们将不同孔径下的孔容分为1~7组。
编号孔容/(1110L g μ--⋅)CO2吸附量1/()mL g -⋅0.5~0.8nm 0.8~1.2nm 1.2~1.8nm 1.8~2.2nm 2.2~2.2nm 2.5~3.0nm 3.0~3.5nm 1 7.18 16.2 24.4 75.2 70 96 115 64 2 6.59 14.4 18.4 53.7 50 85.6 91 55.1 3 4.54 11 18.9 71 65 78.3 91 53.7 4 5.13 13.4 29.9 10.3 90 76 122 53.7 5 4.16 10.5 18.9 83.8 78 80.5 113 61.7 6 4.92 12.1 23.4 81.6 72 56 99 53.6 7 5.08 12.6 23.8 93.5 86 77.8 122 65.5 8 5.29 13 25.1 88.4 69 66.4 107 57.7 9 7.47 16.9 26.9 46.4 78 93.2 107 58.2 10 5.44 13 21.4 44.1 91 98.6 137 76.6 11 1.81 64.6 18.3 53.1 114 110 142 75 121.2427.739.5 126 114 98.6 183 98.7作出不同孔径下与CO2吸附量的散点图如下:2468孔容C O 2吸附量10203040506070孔容C O 2吸附量152025303540孔容C O 2吸附量50100150孔容C O 2吸附量406080100120孔容C O 2吸附量5060708090100110孔容C O 2吸附量80100120140160180200孔容C O 2吸附量图1:不同孔容与CO2吸附量的散点图图1中从左往右依次是第1到第7组孔容,从图中可以看出第五、六、七组的点大致分散在一条直线附近,说明两个变量之间有一定的线性相关关系。
且自变量的变化导致因变量CO2的浓度变化,因变量变化具有独立性。
我们就选取第七组的数据进行回归分析。
112101()()ˆ()ˆˆni i i ni i x x y y x x y xβββ==⎧--⎪⎪=⎪⎨-⎪⎪=-⎪⎩∑∑二、问题假设1.假设误差分布服从正态分布。
2.为了简化模型,便于回归分析,我们不考虑实验中各种因素对活性炭吸附的影响,考虑孔容与co2吸附量的数据之间的线性关系。
三、模型建立3.1.回归参数的引进回归函数()(|)y f x E Y X x ===是线性函数的回归分析称为线性回归,当可控制变量只有一个时,即回归函数为01()y f x x ββ==+,那么称为一元线性回归模型,上式称为Y 对x 的一元线性回归方程或者一元线性回归直线,0β、1β称为回归系数,常数0β、1β、2σ均未知。
3.2回归方程的构建由于总体回归方程01()y f x x ββ==+中的参数0β、1β在实际中并不知道,需要通过样本值对它们进行估计,得到估计值0ˆβ,1ˆβ,从而得到样本回归方程01ˆˆY x ββ=+,此样本方程可用作总体回归方程()(|)y f x E Y X x ===的估计。
通常可用最小二乘法估计得到公式由于总体回归方程01()y f x x ββ==+中的参数0β、1β在实际中并不知道,需要通过样本值对它们进行估计,得到估计值0ˆβ,1ˆβ,从而得到样本回归方程01ˆˆY x ββ=+,此样本方程可用作总体回归方程()(|)y f x E Y X x ===的估计。
通常可用最小二乘法估计得到公式012(0,)Y x N ββεεσ=++⎧⎨⎩(1)(2)2σ=101ˆ/ˆˆxy xx l l y xβββ⎧=⎪⎨=-⎪⎩其11n i i x x n ==∑,11ni i y y n ==∑,记12112xy i i i l x y x y==-⋅∑= ,1222112xx i i l x x==-∑1222112yy i i l y y ==-∑1ˆ/xy xxl l β=01ˆy x ββ=- 2ˆe T R xx xx S S S l l β=-=- 可得2.3求一定孔容下的CO2的吸附量的回归直线方程利用matlab 对数据进行计算,结果如下表所示:实验编号孔容i xCO2吸附量iy2i x 2i yi i x y1 115 64 13225 4096 73602 91 55.1 8281 3036.01 5014.13 91 53.7 8281 2883.69 4886.74 122 53.7 14884 2883.69 6551.45 113 61.7 12769 3806.89 6972.16 99 53.6 9801 2872.96 5306.47 122 65.5 14884 4290.25 79918 107 57.7 11449 3329.29 6173.9 9 107 58.2 11449 3387.24 6227.4 10 137 76.6 18769 5867.56 10494.2 11 142 75 20164 5625 10650 12 183 98.7 33489 9741.69 18062.1 ∑1429773.517744551820.2795689.3表2:孔容与C02吸附度的回归计算讲结果代入上上述公式可得下列计算表:(3)表3:回归参数的计算表由此可得线性回归方程为:0.49 5.88y x =+四、回归方程的显著性检验对回归方程是否有意义做判断就是对如下的检验问题做出判断:01:0H β=vs 11:0H β≠拒绝域0H 表示回归方程是显著的。
利用F 检验对参数进行检验。
经计算有T yy S l ==63.7711T f =21R xx S l β==48.421R f =e T R S S S =-=15.3510e f =4.1F 值检验取显著水平α=0.05,其拒绝域为:i x ∑=1429.00n=12i y ∑=773.50x =119.08y =64.462ix∑=177445.00i i x y ∑=95689.302iy∑=51820.272nx =2129340.00n x y ⋅⋅=1148271.602ny =621843.24 xx l =7274.92 xy l =3578.34yy l =1961.75e S =201.662σ=63.771/xy xx l l β==0.4901ˆy x ββ=-=5.88(4) (5)(6) (7)(8)1(1,10)F F α-≥查表可得拒绝域的值为: 4.96F ≥ 计算得87.28/(2)Re S F S n ==-,远远大于F 的临界值,说明拒绝原假设,原假设不成立,自变量和因变量有着显著的线性关系。
4.2.p 值检验将(6)(7)(8)中的各平方和和自由度移入方差分析表,继续进行计算可得:这里p 值很小,因此,在显著性水平0.01下回归方程是显著的。
五、计算方法的涉及和计算机的实现4.1用matlab 拟合直线:先将数据以txt 格式保存,再用dlmread 读取ASCII 码文件。
调用matlab 中的regress 多元线性回归函数(代码见附录),对12个样本数据进行拟合,作出散点图和直线拟合图在一张图上如下:9010011012013014015016017018019050556065707580859095100图2:孔容和CO2吸附量的直线拟合孔容C O 2吸附量从图中可以看出样本点大致分布在直线附近,拟合效果比较好。
4.2直线参数的估计值的置信区间以及三种检验利用regess函数求出参数的估计值和置信区间以及参数的检验统计量(设置α=0.05)如下:图3:用matlab计算的参数值和检验值。
其中,R^2=0.8972指因变量(CO2吸附度)有89.7%可由模型确定,F的值远远超过F的临界值。
P远小于α,因而模型从整体上看是可用的。
六、主要的结论孔容和CO2吸附量之间存在线性关系,经过显著性检验,线性方程回归效果较好,即线性方程能基本描述孔径范围3. 0~ 3. 5 nm的活性炭孔容和CO2吸附量七、参考文献[1]张双全,罗雪岭,郭哲,董明建,岳晓明. CO2吸附量与活性炭孔隙结构线性关系的研究[J]. 中国矿业大学学报. 2008(04)附录Matlab制作散点图:M=dlmread('co2.txt');%读取ASCII码文件for i=1:1:7subplot(4,2,i)x1=M(:,i); y=M(:,8);plot(x1,y, 'bo');xlabel('孔容'),ylabel('CO2吸附量');endMatlab直线拟合:clc; format short g;M=dlmread('co2.txt');%读取ASCII码文件x1=M(:,7); y=M(:,8);plot(x1,y, 'bo');b=regress(y,[ones(size(x1)),x1]); % b=[β0 β1] ',列向量x1=sort(x1); %按升序排序,用于画图y=[ones(size(x1)),x1]*b;%使用矩阵乘法hold on;plot(x1,y, '-r');title('图2:孔容和CO2吸附量的直线拟合')xlabel('孔容');ylabel('CO2吸附量');hold off;Matlab参数估计:clc; format compact; format short g;M=dlmread('co2.txt');%读取ASCII码文件x1=M(:,7); y=M(:,8);[b,bint,r,rint,stats]=regress(y,[ones(size(x1)),x1],0.05);fprintf('%2s%5s%11s\n','参数','估计值','置信区间');%1个汉字算1个字符for i=1:length(b)fprintf ('β%1d%9.4f [%7.4f, %7.4f]\n',i-1,[b(i,:),bint(i,:)]); end% %d将i当整数输出,%7.4f按实数格式输出,区域宽7个字符,4位小数fprintf('\nR^2=%.4f F=%.4f p<%.4e s^2=%.4f\n',stats);。