重庆大学硕士研究生《数理统计》课程大作业(论文)
- 格式:doc
- 大小:170.00 KB
- 文档页数:6
重庆大学全日制学术型硕士研究生 《数理统计》(A )课程试卷2013-2014学年第一学期(秋)请保留四位小数,部分下侧分位数为:0.95 1.65u =,0.99 2.33u =,20.95(1) 3.841χ=,0.95(3,6)9.78f =一、(18分)设1X ,2X ,…,64X 是来自总体N (0,2σ)的样本,X ,2S 分别是样本均值和样本方差:(1)求参数c 满足{}0.1P X S c >⋅=;(2)求概率22122234{1}X X P X X +>+;(3)求322321(2)i i i D X X X +=⎡⎤+-⎢⎥⎣⎦∑。
(请写出计算过程)解:(1)~(1)t n-{}}0.1P X S c P c ∴>⋅=>=得0.95(63)c t = 故 1.650.20638c ==(2)2~(0,)X N σ22212(/)(/)~(2)X X σσχ∴+ 同理22234(/)(/)~(2)X X σσχ+2222223412122234(/)(/)(/)(/)/~(2,2)22X X X X X X F X X σσσσ+++∴=+ 22122234{1}{(2,2)1}X X P P F X X +>=>+ 且0.50.50.51(2,2)(2,2)1(2,2)F F F =⇒= 得2222121222223434{1}1{1}0.5X X X X P P X X X X ++>=-≤=++ (3)令2~(2,2)i i n i Y X X N μσ+=+,112n i i Y Y X n ===∑ 221()(1)ni Y i T Y Y n S =∴=-=-∑3232223211(2)[()]i i i i i D X X X DT D Y Y +==⎡⎤+-==-⎢⎥⎣⎦∑∑2~(0,2(11/))i Y YN n σ-+~(0,1)YN=3222422421[2(11/)4(11/)((32))256(11/32)i Y D n n D σσχσ=+=+=+∑二、(26分)设1X ,2X ,…,n X 是来自总体2~(2,)(0)X N σσ>的样本,{}0.95P X A <=。
()(){}{}()22222111221121221164~,~(8),89111,01(1)11~(0,1)1.28 1.280.281(2)0.261 1.8360.2619818ni i n X N S S X S n X X X X E X X n n n n n D X X DX DX DX X X N n n n P X X P U X P X S P μχσμ=-=--=--=---⎛⎫-=+==⇒- ⎪⎝⎭->=>=⎛ -⎧⎫ <-+<=<⎨⎬ ⎩⎭⎝∑解:由题可知(,)且与相互独立(){}22222222241164. 1.836896464 = 2.08814.688=~(9)991188= 2.08814.688=0.90.01=0.89423948i i i S X X P S S P X X χχχμ=⎧⎫⎫⎪⎪⎪⎪⎪⎪+<⎨⎬⎪⎪⎪⎪⎪⎪⎭⎩⎭⎧⎫⎛⎫⎛⎫⎪⎪ ⎪ ⎪--⎪⎪⎪ ⎪<+<+⎨⎬ ⎪ ⎪⎪⎪⎪ ⎪⎪⎪⎝⎭⎝⎭⎩⎭<<-⎛⎫- ⎪⎝⎭=⋅∑,其中原式()()()()(){}24882255448822554821584~(0,1)=~4998244~(4)8944 2.132= 2.132=0.1i ii i i i i i i i i ii i N X X X t t X XP X XP t μμχμμμμμμ======⎛⎫ ⎪⎛⎫⎛⎫ ⎪-- ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪⎝⎭⎛⎫⎛⎫⎛⎫-- ⎪⎪⎪⎝⎭⎝⎭==--⎧⎫⎛⎫⎪⎪-≤-≤⎨⎬ ⎪⎝⎭⎪⎪⎩⎭∑∑∑∑∑∑∑∑∑()则,()()()(){}222222222891(4)=8~1~(1,8)6498911=(1,8)58.82(8,1)10.90.158.8258.82XXX F FSSXP P F P FSμμμχμ-⎛⎫⎪--==⎧⎫-⎪⎪⎧⎫<<=<=-=⎨⎬⎨⎬⎩⎭⎪⎪⎩⎭(),则也可以用T分布与F分布的关系.0020001111()()1ln(1)11,,ˆˆˆ1ln(1),,ln(1)ln(1)2(;,...,)(;)ln (;,...,)=01ˆ=()()似然方程:得到参数的极大似然估计,再由i A nnx n n xn i i i n P X A F A e p p A EX DX A EX p EX X A EX p X p L x x f x e e d L x x nnx d Xλλλλλλλλλλλλλλλ---==<==-=-=-===--=∴=--=--====-∏∏ 0000010000ln(1)ˆln(1)ˆln(1)ˆ(3)=ln(1)=ln(1)==ˆln (;,...,)ln(1){[ln(1)][]}ln(1)ˆ()ln(1)ˆˆ极大似然估计的不变性,推出的极大似然估计为是的无偏估计且是的无偏估计是有效n A p A X p p EA E X p p EX A AA d L x x p n n nx X p d p n AA p AA A λλλλλλ-=-=----⎡⎤----⎣⎦∴-=-=-----=--∴ ()202ˆlim ln(1)ˆlim lim 0ˆ估计又是相合估计量n n n EA A p DA n Aλ→∞→∞→∞⎧=⎪⎨-⎪==⎩∴221212121222122222222221222121.422,2~222(1)(1)~01~(2) (1)(1)(1)(1)2=222X YX Y X YX X X X Nn mX X n S m SU N n mn S m S n S m S X X Sn mX Xtωσσμμμμμμχχσσσσ+++++-+--==++----+-+++-+-+==的无偏估计为且(,+)(,)又且与独立,记则()()()()()()()121212212121211221212122222=22=22222=12122t n mP t t n mX XP t n m t n mP X X t n m S X X t n m SX X t n m Sαααααωαμμμμαμμα-----+-⎧⎫≤+-⎨⎬⎩⎭⎧⎫⎪⎪+-+⎪⎪+-≤≤+-⎨⎬⎪⎪⎪⎪⎩⎭⎧⎪+-+-≤+≤+++-⎨⎪⎩-+-+±+-因此构造的置信区间为{}{}121201212120121212121212.222=022,22=02=02=0=的无偏估计为,在:成立的条件下,大于某个常数应该是小概率事件,因此构造拒绝域:以下确定常数由X X H X X c K X X c cP X X c P P t t μμμμμμμμμμα+++++>+>+⎧⎫⎪⎪⎪=>+⎬⎪⎪⎭⎧⎫⎪⎪⎪⎪=>+=⎨⎬⎪⎪⎪⎪⎩⎭()()122n m c t n m S ααω--+-⇒=+-拒绝域为:3133011331122333333111~(1,).~(3)220.220.230.20.20.80.20.104220.4因为所以,类错误(弃真):为真类错误(纳伪):为真i i i i i i i i i i i i i i X B p X B p P X H P X p P X p P X p C C P X H P X p αβ=======I ⎧⎫⎧⎫=≥=≥=⎨⎬⎨⎬⎩⎭⎩⎭⎧⎫⎧⎫===+==⎨⎬⎨⎬⎩⎭⎩⎭=+=II ⎧⎫⎧=<=<=⎨⎬⎨⎩⎭⎩∑∑∑∑∑∑∑313311223333120.4120.430.410.40.60.40.648i i i i i i P X p P X p P X p C C ===⎫⎬⎭⎧⎫=-≥=⎨⎬⎩⎭⎧⎫⎧⎫=-==-==⎨⎬⎨⎬⎩⎭⎩⎭=--=∑∑∑()()221221111211=200ˆnE i i i n n nEi i i i i i i i i ni ii nii S y x dS y x x y x x d x yxββββββ======-=--=⇒-==∑∑∑∑∑∑解:()利用最小二乘估计使残差平方和最小参数的最小二乘估计量为2211222111111221111ˆ2=~(,)ˆˆˆ~(,)111ˆ===11ˆ(),由正态分布的性质推知服从正态分布ni ii i i i ni ii nnni i iiiinnni i i i i ii i i ni i nn i i i i i x YY x N x xN E D E E x Y x EY x x x x xD D x Y x x ββεβσβββββββ============+⎛⎫ ⎪ ⎪= ⎪ ⎪⎝⎭⎛⎫⎛ ⎪ ⎪ == ⎪ ⎪⎝⎭⎝∑∑∑∑∑∑∑∑∑∑∑()()()()()222211221222111112211ˆ~(,)ˆˆˆ3=ˆˆˆ2(,)ˆ(,)(,)因此,()nii ni ii n i i nnE i iiiiii i nni i i i i ii i ni ii ii i i i nniii i xDY xN x ES E Y x D Y x E Y x D Y x DY D x Cov Y x x Yx Cov Y x Cov Y x C xxσσβββββββββ==========⎫⎪⎪=⎪ ⎪⎭⎡⎤-=-+-⎣⎦⎡⎤=-=+-⎣⎦==∑∑∑∑∑∑∑∑∑∑()222221112222222222221111(,)(,)221则ni i i i i i i nni iii i nni i Enni i iii i x x ov Y x Y Cov Y Y xxx x ESn n n xxσσσσσσσσ==========+-=+-=-∑∑∑∑∑∑∑因素:车型水平:3种不同的车型A,B,C方差分析前提假设:正态性,方差齐次性,独立性对比分位数:0.95(2,9) 4.26F F >=,拒绝原假设0123:H μμμ==,认为这三种车型耗油量有显著差异。
数理统计论文数理统计在实际生活中的应用摘要:数理统计学是统计学的数学基础,从数学的角度去研究统计学,为各种应用统计学提供理论支持。
它研究怎样有效地收集、整理和分析带有随机性的数据,以对所考察的问题做出推断或预测,直至为采取一定的决策和行动提供依据和建议的数学分支。
概率论作为一门研究随机现象统计规律的数学学科,已在包括控制,通讯,生物,力学,金融,社会科学以及其他工程技术等领域得到了广泛的应用。
关键词: 点估计;方差分析;假设检验;1 绪论数理统计在自然科学、工程技术、管理科学及人文社会科学中得到越来越广泛和深刻的应用,其研究的内容也随着科学技术和政治、经济与社会的不断发展而逐步扩大,但概括地说可以分为两大类:⑴试验的设计和研究,即研究如何更合理更有效地获得观察资料的方法;⑵统计推断,即研究如何利用一定的资料对所关心的问题作出尽可能精确可靠的结论,当然这两部分内容有着密切的联系,在实际应用中更应前后兼顾。
但按本专业的总体设计,我们的数理统计课程只讨论统计推断。
数理统计以概率论为基础,根据试验或观察得到的数据,来研究随机现象统计规律性的学科。
本课程的目的是让学生了解统计推断检验等方法并能够应用这些方法对研究对象的客观规律性作出种种合理的估计和判断。
掌握总体参数的点估计和区间估计。
掌握假设检验的基本方法与技巧。
理解平方差分析及回归分析的原理,并能运用其方法和技巧进行统计推断。
数理统计是伴随着概率论的发展而发展起来的一个数学分支,研究如何有效的由集、整理和分析受随机因素影响的数据,并对所考虑的问题作出推断或预测,为采取某种决策和行动提供依据或建议.数理统计起源于人口统计、社会调查等各种描述性统计活动.公元前2250年,大禹治水,根据山川土质,人力和物力的多寡,分全国为九州;殷周时代实行井田制,按人口分地,进行了土地与户口的统计;春秋时代常以兵车多寡论诸侯实力,可见已进行了军事调查和比较;汉代全国户口与年龄的统计数字有据可查;明初编制了黄册与鱼鳞册,黄册乃全国户口名册,鱼鳞册系全国土地图籍,绘有地形,完全具有现代统计图表的性质.可见,我国历代对统计工作非常重视,只是缺少系统研究,未形成专门的著作.在西方各国,统计工作开始于公元前3050年,埃及建造金字塔,为征收建筑费用,对全国人口进行普查和统计.到了亚里土多德时代,统计工作开始往理性演变.这时,统计在卫生、保险、国内外贸易、军事和行政管理方面的应用,都有详细的记载.统计一词,就是从意大利一词逐步演变而成的.2 数理统计的方法(一)点估计1、点估计概念点估计是数理统计理论的一个重要内容,主要包括制定估计量得一般方法,制定估计量的合理的优良性准则,寻求特定准则下的最优估计,记明特定估计量(用直观或某种一般性方法得到)在某种准则之下有最优性。
研究生课程考核试卷(适用于课程论文、提交报告)科目:数理统计教师:刘琼荪姓名: xxx 学号: 20150702xxx 专业:机械工程类别:学术上课时间: 2016 年 3 月至 2016 年 4 月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师 (签名)我国上世纪70-90年代民航客运量回归分析摘要:中国民航从上实际50年代发展至今已有60多年的历史,这期间中国民航经历了曲折的发展。
随着改革开发以来,中国人民的生活水平日渐提高,出行坐乘飞机逐渐人们可选的交通方式。
我国民航客运量逐年提高,为了研究其历史变化趋势及其成因,现以民航客运量作为因变量y,假设以国民收入x1、消费额x2、铁路客运量x3、民航航线里程x4、来华旅游入境人数x5为影响民航客运量的主要因素。
利用SPSS和excel软件通过建立回归模型分析我国民航客运量主要受到其中哪些因素的影响,并就回归模型分析具体可能的成因。
关键词:民航客运量影响因素回归模型一、问题提出及问题分析2004年,民航行业完成运输总周转量230亿吨公里、旅客运输量1.2亿人、货邮运输量273万吨、通用航空作业7.7万小时。
截止2004年底,我国定期航班航线达到1200条,其中国内航线(包括香港、澳门航线)975条,国际航线225条,境内民航定期航班通航机场133个(不含香港、澳门),形成了以北京、上海、广州机场为中心,以省会、旅游城市机场为枢纽,其它城市机场为支干,联结国内127个城市,联结38个国家80个城市的航空运输网络。
民航机队规模不断扩大,截止至2004年底,中国民航拥有运输飞机754架,其中大中型飞机680架,均为世界上最先进的飞机。
2004年中国民航运输总周转量达到230亿吨公里(不包括香港、澳门特别行政区以及台湾省),在国际民航组织188个缔约国中名列第3位。
从上述事实可以看出我国民航的发展所取得的成果显著。
当前我国民航客运量相当巨大,而影响我国航运客运量的因素有很多,例如第三产业增加值(亿元),城市居民消费水平(绝对元),定期航班航线里程(万千里)等[1]。
研究生课程考核试卷(适用于课程论文、提交报告)科目:概率论与数理统计上课时间:2017.2-2017.5姓名:刘振学号:20160702031专业:机械工程教师:刘朝林工作单位或所在行业:重庆大学考生成绩:阅卷评语:阅卷教师(签名)回归分析在数理统计中的应用摘要:回归分析是数理统计中重要的一种数据统计分析的思想, 是处理变量间的相关关系的一种有效工具。
其目的在于根据已知自变量的变化来估计或预测因变量的变化情况,或者根据因变量来对自变量做一定的控制. 它可以提供变量间相关关系的数学表达式, 且利用概率统计知识,对经验公式及有关问题进行分析、判断以确定经验公式的有效性,从众多的解释变量中,判断哪些变量对因变量的影响是显著的,哪些是不显著的. 还可以利用所得经验公式,由一个或几个变量的值去预测或控制个变量的值时的值,去预测或控制另一个变量的取值,同时还可知道这种预测和控制可以达到什么样的精度。
本文就是针对实际问题运用回归分析中一元线性回归分析的统计方法,来确定自变量与另一个变量的相关关系,并确立出较为合理的回归方程,再对其的可信度进行统计检验.关键词:回归分析;回归方程;F检验法1.问题的提出调查一下重庆大学学生的生活费与家庭收入的关系,看看是否家庭收入越高,学生的每月支出也越多,从而根据学生每月消费支出,进而估计学生的家庭收入情况,对学生的生活补助等问题有重要的参考意义2.数据描述根据调研的重庆大学学生家庭月收入与每月生活费的数据,确定两者关系。
数据来源100多份问卷调查的抽样,取其中10份,绘制表1如下图所示序号家庭月收入每月生活费14800 50025200 60035420 65045600 70056000 75066400 80076800 90087000 100097200 1200108000 1500表1-1 重庆大学学生家庭月收入与每月生活费的数据利用matlab软件画出家庭月收入与每月生活费的散点图,如图一所示图1-1 家庭月收入与每月生活费的散点图3.模型建立我们假设家庭月收入与每月生活费存在线性关系,有,和为回归系数,且未知,对一元线性回归模型{,i=1,2,3,⋯,n,相互独立且同分布与N(0,)4.计算=+=860-0.28×6242=-887.76回归方程为当月收入为零时,将没有生活费,月收入每增加100元,生活费将增加28元5.模型检验检验假设为:取显著性水平,用t检验法拒绝域为:检验统计量其中样本值,拒绝认为x和y 之间存在线性关系若采用F检验法拒绝域F样本值f=拒绝,认为y与x存在相关关系6.结果分析与发现通过模型建立,计算求解,发现家庭月收入x与每月生活费y存在着线性关系,并且经过检验,计算结果是正确的,家庭收入越高,学生的每月可支出费用就越多,基本是家庭月收入每多100元,学生每月生活费就增加28元,对于学生家庭收入的估计有重要意义。
研究生课程考核试卷(适用于课程论文、提交报告)科目:数理统计教师:刘琼荪姓名:xxx 学号:20150702xxx 专业:机械工程类别:学术上课时间:2016 年 3 月至2016 年 4 月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)我国上世纪70-90年代民航客运量回归分析摘要:中国民航从上实际50年代发展至今已有60多年的历史,这期间中国民航经历了曲折的发展。
随着改革开发以来,中国人民的生活水平日渐提高,出行坐乘飞机逐渐人们可选的交通方式。
我国民航客运量逐年提高,为了研究其历史变化趋势及其成因,现以民航客运量作为因变量y,假设以国民收入x1、消费额x2、铁路客运量x3、民航航线里程x4、来华旅游入境人数x5为影响民航客运量的主要因素。
利用SPSS和excel软件通过建立回归模型分析我国民航客运量主要受到其中哪些因素的影响,并就回归模型分析具体可能的成因。
关键词:民航客运量影响因素回归模型一、问题提出及问题分析2004年,民航行业完成运输总周转量230亿吨公里、旅客运输量1.2亿人、货邮运输量273万吨、通用航空作业7.7万小时。
截止2004年底,我国定期航班航线达到1200条,其中国内航线(包括香港、澳门航线)975条,国际航线225条,境内民航定期航班通航机场133个(不含香港、澳门),形成了以北京、上海、广州机场为中心,以省会、旅游城市机场为枢纽,其它城市机场为支干,联结国内127个城市,联结38个国家80个城市的航空运输网络。
民航机队规模不断扩大,截止至2004年底,中国民航拥有运输飞机754架,其中大中型飞机680架,均为世界上最先进的飞机。
2004年中国民航运输总周转量达到230亿吨公里(不包括香港、澳门特别行政区以及台湾省),在国际民航组织188个缔约国中名列第3位。
从上述事实可以看出我国民航的发展所取得的成果显著。
当前我国民航客运量相当巨大,而影响我国航运客运量的因素有很多,例如第三产业增加值(亿元),城市居民消费水平(绝对元),定期航班航线里程(万千里)等[1]。
重庆市生产总值与城市人均可支配收入的关系分析及讨论摘要:一般来说,人均可支配收入越高,人民生活水平则越高。
而该地区的生产总值又反应了当下该地区总的经济发展状况,即人均可支配收入的多少。
所以通过研究地区生产总值来分析了解该地区的人民生活水平就存在很大的实际意义。
本论文通过对重庆市从1985年到2010年的生产总值与城市人均可支配收入的实际调查统计数据(见表1)进行分析并找出其间可能存在的关系,并由此通过当下生产总值来评价人民的生活水平。
我们得出结论:重庆市的生产总值与城市人均可支配收入确实存在一定的关系,并且我们知道是线性关系,同时得到简单一元统计回归模型.1+268173098=xy247404866.0其中y指城市人均可支配收入,x指重庆市生产总值。
通过这个关系式我们就可以很容易地由当年重庆市的生产总值推算出城市人均可支配收入,即可估计出当下人民的生活水平。
由于数据的有限性及统计数据过程中存在的误差影响,对本问题的研究会造成一定的影响。
另外,城市人均可支配收入的影响因素有很多,也很复杂,仅仅只从分析该地区的生产总值来评价人民的生活水平是远远不够的。
但是我们可以通过以上简单的统计回归模型定性的对人民的生活水平进行分析,很方便地即可了解到当下人民的生活状况并采取相应措施。
关键字:重庆市生产总值城市人均可支配收入一元统计回归模型数据分析一、引言随着目前科技和经济的快速发展,寻找一个衡量和预测人民生活水平的标准就非常有必要了。
我们知道,一个地区的生产总值是指本地区所有常住单位在一定时期内生产活动的最终成果,地区生产总值等于各产业增加值之和。
可见一个地区的生产总值能很好的反应当地经济的发展现状,而个人可支配收入的多少又刚好与本地的经济发展状况和人口有关。
另外,人均可支配收入是指个人收入扣除向政府缴纳的个人所得税、遗产税和赠与税、不动产税、人头税、汽车使用税以及交给政府的非商业性费用等以后的余额,个人可支配收入被认为是消费开支的最重要的决定性因素。
研究生课程考核试卷科目:数理统计教师: 李寒宇姓名: 蔡亚楠学号:20131102015t 专业:高电压与绝缘技术类别:学术型上课时间: 2014年3月至2014年5月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)相对地过电压数据的统计分析摘要:过电压是指超过正常运行电压并可使电力系统绝缘或保护设备损坏的电压升高。
电力系统的过电压分布情况决定了电气设备的绝缘水平。
变电站过电压由于影响因素的随机性,使得过电压数据复杂且具有随机性。
本文结合电气工程专业的背景,分析了相对地过电压数据的分布规律。
首先对三相的过电压数据分别进行双样本同分布检验,采用两总体分布比较的假设检验方法。
检验结果显示三相的样本具有相同的分布规律,因此将三相的过电压数据合并进行总体的分布规律检验。
文中运用拟合优度2 检验法检验总体分布是否福才能够正态分布。
检验结果表明样本总体分布不服从正态分布,而是服从切断正态分布.针对相对地过电压数据的统计分析有助于确定设备的绝缘水平,具有一定的研究价值.关键词:过电压;假设检验;统计分布一、问题提出过电压是指超过正常运行电压并可使电力系统绝缘或保护设备损坏的电压升高。
电力系统的过电压分布情况决定了电气设备的绝缘水平.由于过电压数据出现的随机性较大,且有明显的统计特征,因此在对单次过电压数据进行统计分析的同时,还可以用数理统计的方法对系统采集的多次样本进行统计分析研究,并预测过电压的概率分布规律,以便将所得结论用于确定设备及线路的绝缘水平,合理解决绝缘配合问题,使设备绝缘故障率或停电故障率降低到经济上和安全运行上可以接受的水平.二、数据描述本次研究以TR2000过电压在线监测装置在某变电站实地运行所采集的过电压数据进行分析。
该变电站的等级为110kV/38.5kV/10。
5kV,以往的运行经验发现,35kV侧事故频繁,属第一、二类等级符合用户较集中,故在35kV侧安装了一台TR2000过电压在线监测装置.通过对监测装置中导出的数据进行进制转换、图形显示、统计分析等手段,分析变电战过电压的规律,由此可以对电力系统设计、改造和故障分析等工作提供可靠的依据.根据现场情况,将暂态过电压记录倍率设定为1。
重庆大学硕士研究生“数理统计”课外作业学生:学号:201510****专业:动力工程专业重庆大学动力工程学院二O一五年十二月学号201510******* 姓名**** 学院****学院专业****专业成绩一元线性回归分析在风力发电中的应用摘要:能源短缺和环境恶化日益严重,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,风力发电的装机容量也越来越大。
风力机是风力发电机组重要的组成部分,实现风能向机械能的转化,机械能再通过直流发电机转发为电能,其中直流发电机输出的直流电压和风速紧密相关。
本文以课题研究中测得的实验数据为基础,对风力发电直流电输出和风速的线性相关关系进行计算分析,运用数理统计中一元线性回归分析及假设检验的相关知识,采用EXCEL软件进行辅助计算,最终得到了风力发电的直流电输出和风速的线性关系显著,对以后的课题研究具有一定的借鉴作用。
1 问题提出与分析在能源短缺和环境趋向恶化的今天,风能作为一种可再生的清洁能源,越来越受到世界各国的重视,也越来越多地被应用到风力发电中。
风力机和发电机是风力发电机组中将风能转化为电能的重要装置,它们不仅直接关系到输出电能的质量和效率,也影响着整电量输出和风速的相关性。
风力机是风力发电机组重要的组成部分,其实现了风动能到风轮机轴机械能的转化,机械能通过直流电动机转发为电能,其中直流电动机产生的直流电压和风力紧密相关。
风力发电的设计和评价和电量输出与风速的关系密不可分,其中对于数学知识要求很高。
本文以课题研究中实验测得的数据为基础,对风力发电直流电输出和风速是否存在线性关系进行分析,运用数理统计中一元线性回归及非参数检验的相关知识,结合EXCEL软件进行辅助计算分析,最终得到了风力发电的直流电输出和风速关系,为以后科研工作和风力发电的应用具有指导意义。
综上所述,对风力发电的直流电输出和风速的研究,具有理论与实践的重要意义。
2 数据描述本文以风力发电的直流输出和风速的关系为研究对象,采用实验中观察得出的直流电输出和风速的部分数值进行计算分析,风力发电的直流电输出y(单位:MW)和风速x(单位:nmile/h)的数据如表1所示。
大学生考试成绩的量化分析摘要:本文以某某大学化学化工学院2009级高等代数成绩为样本,结合概率论理论基础及统计学原理,探讨学生成绩的整理、成绩分布曲线的描绘以及怎样研究分布曲线所包含的“教”与“学"两方面的信息的方法。
关键词:正态分布频数直方图数字特征值优度检验偏度一、引言目前,考试仍然是高校教学过程中不可或缺的组成部分,对教与学双方而言,考试均起着检查工作成果进而评价绩效、查漏补缺的重要作用。
考试是反馈教学信息,检测和评价教学质量,调控教学过程的重要手段。
大学生在校期间的考试成绩可从多个层面折射出学生学习努力的程度、教师教学的效果、试卷的质量和学校教学管理水平等。
正态分布是连续随机变量概率分布的一种,对于一门课程的考核从掌握参照的角度来说,如果命题设计的合理,学生分数一般服从或近似服从正态分布。
当然并不是所有考试都要求其分布为正态分布,这要根据考试的目的和性质等因素来决定.对于大学成绩,已经不再是诸如各种竞赛性测验和择优录取的升学测验等选拔性的测验,而是一种成就测验,即合格水平测验。
从而,目的在于考核学生是否达到了预定的教学目标和要求,反映了学生的学习功效。
此时,不要求学生成绩呈现正态分布,反而希望学生成绩的分布能呈现负偏态分布。
从学校的教育目的的角度来看,合格水平测验具有普遍意义、更重要的测验。
因此,学生成绩测验呈现负偏态分布时,说明教学恰恰是成功的教学。
本文对某某大学化学化工学院2009级高等代数成绩加以统计,运用英国统计学家K.Pearson提出的2 检验方法进行了实证分析,得到合理的结论。
二、学生成绩分布直方图、成绩分布曲线在刚得到数据时,各种数据信息是杂乱无章的,本文通过对数据进行由低到高分组分类得到各组的频数,求出各组的比例,然后编制出频数直方图,并求出数字特征.某某大学化学化工学院2009级高等代数成绩表(百分制)2。
1数据整理本文将所得数据采用百分制方法,按将从小到大分成了5组。
一、问题提出和问题分析今天的重庆,肩负着中央赋予的历史重任——着力打造西部地区的重要增长极、长江上游地区的经济中心、成为统筹城乡发展的试验者、在西部地区率先实现全面建设小康社会的目标。
2010年初,又一重要规划将重庆发展提升到国家战略——重庆被确定为国家五大中心城市之一,是中西部地区唯一入选的城市。
这说明,重庆未来的发展不可限量。
自1997年直辖以来,重庆市的经济社会发展极为迅猛。
全市的GDP由1997年的1360.24亿元增长至2010年的7894.2亿元,而整个社会的发展进步也有目共睹。
在重庆过去、现在和未来的发展进程中,在重庆的各种发展规划的要求下,建设必将成为山城的另一个符号。
过去十多年中的大规模、大范围的建设成就了现在的重庆,而重庆未来的发展将需要更多的建设。
作为重庆建设中最重要的一环,建筑业在重庆显然有着重要的地位。
建筑业这种专门从事土木工程、房屋建设和设备安装以及工程勘察设计工作的生产部门,为重庆的发展建设提供着众多的基础设施,满足着居住、工业、商业、办公等各种城市需求。
数据显示,在过去的数年中,重庆市建筑业的总产值占全市GDP的7%-8%,是名副其实的支柱产业。
因此建筑业的发展情况,可以从侧面反映出整个重庆社会经济的发展情况,对重庆建筑业的研究就有了很大的现实意义。
建筑企业是建筑业的主体。
众多的建筑企业的良好发展构成了建筑业的良好发展。
对于建筑企业来说,要实现企业的良好经营和发展,必须要有良好的收入来支撑。
在建筑企业收入的众多影响因素中,企业的劳动生产率无疑是值得关注的一个。
企业都在致力于提高自身的劳动生产效率,而不断提高的劳动生产率,可使得企业的生产经营行为更具效率,因而获得更多的收入,实现更好的发展。
所以,研究重庆市建筑企业劳动生产率与企业收入的关系,可从一个角度来了解重庆市建筑企业的发展情况,从而了解到了重庆建筑业的发展以至于重庆市的经济发展情况。
为了找出二者之间的关系或者规律性,本文采用2001-2010这十年中重庆建筑企业劳动生产率和企业平均收入的数据,通过数学分析,找出二者关系。
二、数据描述本文搜集了2001年至2010年这十年中重庆市建筑业企业劳动生产率与同期的建筑业企业平均收入的数据(见表1),其中劳动生产率指劳动者在一定时期内创造的劳动成果与其相适应的劳动消耗量的比值,通过建筑业企业总产值和从业人员人数的比值来反映;而企业平均收入是企业总收入与企业数的比值。
从表1中我们可以看到,重庆市建筑业企业的劳动生产率每年都以一定的幅度增长,而同期建筑业企业平均收入也呈现增长的趋势。
表1 重庆市建筑业企业劳动生产率与建筑业企业平均收入数据年份 劳动生产率(万元/人) 年增长率(%)企业平均收入(万元) 年增长率(%)2001 5.2517 - 2329.116212 -2002 5.9702 13.68 2447.550619 5.08 2003 6.9432 16.30 2929.646591 19.70 2004 8.4026 21.02 2631.520475 -10.18 2005 9.4557 12.53 3156.046753 19.93 2006 10.2046 7.92 3599.129939 14.04 2007 12.0612 18.19 4884.770716 35.72 2008 12.2616 1.66 5989.790979 22.62 2009 15.8958 29.64 7658.702637 27.86 201017.5224 10.23 9947.20632329.88数据来自重庆统计年鉴,2002-2011三、模型建立1. 提出假设条件设建筑业企业平均收入y 对建筑业企业劳动生产率x 呈一元线性关系,且()x ,y i i 满足以下条件:()()012,1,2,0,,1,2,,0,,,1,2,.i i i ii j y x i N i Cov i j i j ββεεσεε⎧=++=⎪⎪=⎨⎪=≠=⎪⎩……,n,……,n,……,n2. 引进参数X :劳动生产率(万元/人) Y :企业平均收入(万元)0β、1β:回归系数S T 2 :总离差的平方和 S R 2:回归平方和 SE2 :残差平方和n :样本容量 r :样本相关系数3. 构建模型根据表1,可以绘制重庆市建筑企业劳动生产率与企业平均收入的散点图(图1)。
图1 重庆市建筑业企业劳动生产率与建筑业企业平均收入的散点图我们假设企业平均收入Y 对劳动生产率X 之间存在着线性关系,有:01Y X ββ=+ 0β和1β为回归系数,且未知。
对方程01y x ββ=+,应使22011()nE i i i S y x ββ==--∑最小,即求解:0111201111n ni i i i n n ni i i ii i i n x y x x x y ββββ=====⎧+=⎪⎪⎨⎪+=⎪⎩∑∑∑∑∑ 记:221ni xx i x n x l ==-∑ 221ni yyi y ny l ==-∑1ni i xyi x y n x y l--==-⋅∑其中11n i i x x n ==∑,11ni i y y n ==∑则^0β、^1β可简记为:^1^^01xyxx y xl l βββ--⎧=⎪⎪⎨⎪=-⎪⎩4. 模型求解在线性回归的模型下,用参数的最小二乘估计计算未知参数。
用r 检验法检验回归方程的显著性。
计算表格如下(表2):表2 建筑业企业劳动生产率与建筑业企业平均收入回归分析计算年份 劳动生产率(万元/人)x 企业平均收入(万元)y x ² y ² xy 2001 5.2517 2329.116212 27.5804 5424782.3267 12231.8196 2002 5.9702 2447.550619 35.6433 5990504.0310 14612.3667 2003 6.9432 2929.646591 48.2080 8582829.1476 20341.1222 2004 8.4026 2631.520475 70.6037 6924900.0105 22111.6139 2005 9.4557 3156.046753 89.4103 9960631.1087 29842.6313 2006 10.2046 3599.129939 104.1339 12953736.3171 36727.6814 2007 12.0612 4884.770716 145.4725 23860984.9480 58916.1966 2008 12.2616 5989.790979 150.3468 35877595.9680 73444.4211 2009 15.8958 7658.702637 252.6765 58655726.0807 121741.2054 2010 17.5224 9947.206323 307.0345 98946913.6417 174298.9281 Σ103.969045573.48121231.1098 267178603.5799564267.9862由表2得:x -=10.3969y =4557.34812niix∑=1231.10982nii y∑=267178603.5799n i iix y ∑=564267.98621ni i xyi x y n x y l--==-⋅=∑564267.9862-10⨯10.3969⨯4557.3481=90445.0616221ni xx i x n x l ==-∑=1231.1098-10⨯10.3969²=150.1545221ni yyi y n y l ==-∑=267178603.5799-10⨯4557.3481²=59484386.53 ^1xy xxl lβ==90445.0616/150.1545=602.35^^01y x ββ--=-=4557.3481-602.35⨯10.3969=-1705.22所以,我们可以得到劳动生产率X 与企业平均收入Y 的样本回归直线方程是:^^^01y x ββ-=+=-1705.22+602.35x用r 检验进行回归方程的显著性检验,取α=0.05xy xx yyl r l l ==90445.0616150.154559484386.53⨯=0.957查表得:0.05 (2)(8)0.632r n r α-==所以有:r r ≥α所以,可以认为劳动生产率X 与企业平均收入Y 之间的线性关系是显著的,即假设成立,有:1705.22602.35Y X=-+四、计算方法设计和计算机实现建立线性回归模型,运用参数的最小二乘估计方法计算未知参数,运用r检验法对回归方程进行显著性检验,数学模型的建立、求解及检验见上节。
运用EXCLE软件中的散点图表观察变量之间的相关性关系,运用EXCEL软件的求和等公式进行相关参数的计算。
各项参数计算公式详见参考文献[1]的103-118页。
五、主要结论通过以上数据分析,可以得出以下的结论:重庆市建筑业企业劳动生产率与建筑业企业平均收入之间存在着线性的相关关系,且劳动生产率每提高1万元可使建筑业企业平均收入增加602.35万元,即建筑业企业劳动生产率可对建筑业企业平均收入产生较大的影响。
这意味着,建筑业企业增加企业收入可以从提高本企业的劳动生产率入手,而根据近几年的数据来看,目前劳动生产率的绝对数值较低,增长率较大,有较大的增长空间,因而企业平均收入也可以有较大的增长。
所以,本文通过数据分析,找出了重庆市建筑业企业平均收入的众多影响因素中比较重要的劳动生产率对其的影响情况,为企业提高收入找出了较有效的改进方向。
参考资料[1].杨虎、刘琼荪、钟波,数理统计,高等教育出版社,2004,103-118[2].重庆统计年鉴,2002—2011。