数理统计大作业
- 格式:pdf
- 大小:589.28 KB
- 文档页数:17
应⽤数理统计作业题及参考答案(第⼀章)第⼀章数理统计的基本概念P261.2 设总体X 的分布函数为()F x ,密度函数为()f x ,1X ,2X ,…,n X 为X 的⼦样,求最⼤顺序统计量()n X 与最⼩顺序统计量()1X 的分布函数与密度函数。
解:(){}{}()12nn i n F x P X x P X x X x X x F x =≤=≤≤≤= ,,,.()()()()1n n n f x F x n F x f x -'=??=.(){}{}1121i n F x P X x P X x X x X x =≤=->>> ,,,. {}{}{}121n P X x P X x P X x =->>>{}{}{}121111n P X x P X x P X x =-?-≤??-≤??-≤()11nF x =-?-()()()()1111n f x F x n F x f x -'=??=?-.1.3 设总体X 服从正态分布()124N ,,今抽取容量为5的⼦样1X ,2X ,…,5X ,试问:(i )⼦样的平均值X ⼤于13的概率为多少?(ii )⼦样的极⼩值(最⼩顺序统计量)⼩于10的概率为多少?(iii )⼦样的极⼤值(最⼤顺序统计量)⼤于15的概率为多少?解:()~124X N ,,5n =,4~125X N ??∴ ??,. (i ){}{}()13113111 1.1210.86860.1314P X P X P φφ>=-≤=-=-=-=-=. (ii )令{}min 12345min X X X X X X =,,,,,{}max 12345max X X X X X X =,,,,.{}{}{}min min 125101*********P X P X P X X X <=->=->>> ,,,{}{}{}5551111011101110i i i i P X P X P X ===->=-?-()12~012X Y N -=,, {}{}121012*********X X P X P P P Y ---∴<=<=<-=<-{}()111110.84130.1587P Y φ=-<=-=-=.{}[]5min 10110.158710.42150.5785P X ∴<=--≈-=.(iii ){}{}{}{}{}55max max 1251151151151515115115i i P X P X P X X X P X P X =>=-<=-<<<=-<=-? {}5max 1510.9331910.70770.2923P X ∴>=-≈-=.1.4 试证:(i )()()()22211nni i i i x a x x n x a ==-=-+-∑∑对任意实数a 成⽴。
数理统计学大作业学院航空航天工程学部专业飞行器设计班级航宇二班学号142103130228 姓名张立指导教师姜永负责教师沈阳航空航天大学2014年12月目录 (2)前言 (3)一、采集样本数据整理及SPSS统计软件的实现 (4)1.1、数据的收集方法及说明 (4)1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4)1.3、画出直方图和折线图 (6)1.4、经验分布函数和图形 (6)1.5、各种概率分布 (7)二、给出总体分布的参数估计 (12)2.1、矩估计法 (12)2.2、最大似然估计 (12)2.3、参数区间估计 (13)三、参数的假设检验 (16)3.1. 样本统计数据的t检验 (16)3.2样本统计数据的2χ检验 (17)四、非参数假设检验(2χ拟合优度检验) (18)4.1、2χ拟合优度检验 (18)五、结论 (20)参考文献 (21)数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。
随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。
由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。
了解数理统计能解决那些实际问题。
对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。
例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。
这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。
NBA球员科比单场总得分与上场时间的线性回归分析摘要篮球运动中,球员的上场时间与球员的场上得分的数学关系将影响到教练对每位球员上场时间的把握,若能得到某位球员的上场时间与场上得分的数据关系,将能更好的把握该名球员的场上时间分配。
本次作业将针对现役NBA球员中影响力最大的球员科比布莱恩特进行研究,对其2012-2013年赛季常规赛的每场得分与出场时间进行线性回归,得到得分与出场时间的一元线性回归直线,并对显著性进行评估和进行区间预测。
正文一、问题描述随着2002年姚明加入NBA,越来越多的中国人开始关注篮球这一项体育运动,并使得篮球运动大范围的普及开来,尤其是青年学生。
本着学以致用的原则,希望将所学理论知识与现实生活与个人兴趣相结合,若能通过建立相应的数理统计模型来做相应的分析,并且从另外一个角度解析篮球,并用以指导篮球这一项运动的更好发展,这也将是一项不同寻常的探索。
篮球运动中,得分是取胜的决定因素,若要赢得比赛,必须将得分超出对手,而影响一位球员的得分的因素是多样的,例如:情绪,状态,体力,伤病,上场时间,防守队员等诸多因素,而上场时间作为最直接最关键的因素,其对球员总得分的影响方式有着重要的研究意义。
倘若知道了其分布规律,则可从数量上掌握得分与上场时间复杂关系的大趋势,就可以利用这种趋势研究球员效率最优化与上场时间的控制问题。
因此,本文针对湖人当家球星科比布莱恩特在2012-2013年赛季常规赛的每场得分与上场时间进行线性回归分析,并对显著性进行评估,以巩固所学知识,并发现自己的不足。
二、数据描述抽出科比布莱恩特2012-2013年常规赛所有82场的数据记录(原始数据见附录),剔除掉其中没有上场的部分数据,得到有参考实用价值的数据如表2.1所示:以上数据由腾讯篮球中心提供,特此说明。
三、模型建立(1)假设条件假定球员每场的发挥均为独立同分布事件, (2)模型构建以上场时间为自变量Xi ,单场得分为应变量Yi ,建立正态线性模型式:()012,1,2,,;0,,,,,i i i ii i i Y x i n N ββεεσεεε=++=⎧⎪⎨⎪⎩且相互独立 其中β0、β1为模型参数。
数理统计第一次1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( )。
(A )∑=-ni i X n122)(μσ是统计量 (B )∑=ni i X n122σ是统计量(C)∑=--ni iX n 122)(1μσ是统计量 (D)∑=ni iX n12μ是统计量2、设两独立随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( )。
)(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F3、设两独立随机变量)1,0(~N X ,2~(16)Y χ)。
)(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ).)(A ∑-=-1111n i i X n )(B ∑=-n i i X n 111 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D)4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X 为样本,S X ,分别为样本均值和标准差,则下列正确的是( )。
2() ~(,)A X N μσ 2() ~(,)B nX N μσ22211()()~()nii C Xn μχσ=-∑)() ~()X D t n Sμ-7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( )( A ) . 12X X +( B ) {}max,15i X i ≤≤( C ) 52X p + ( D ) ()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。
1、设总体X 服从正态分布),(2σμN ,其中μ已知,2σ未知,n X X X ,,,21 为其样本,2≥n ,则下列说法中正确的是( )。
(A )∑=-ni iXn122)(μσ是统计量 (B )∑=ni iXn122σ是统计量(C )∑=--ni i X n 122)(1μσ是统计量 (D )∑=ni i X n12μ是统计量2、设两独立随机变量)1,0(~N X ,)9(~2χY ,则YX 3服从( )。
)(A )1,0(N )(B )3(t )(C )9(t )(D )9,1(F3、设两独立随机变量)1,0(~N X ,2~(16)Y χ)。
)(A )1,0(N )(B (4)t )(C (16)t )(D (1,4)F4、设n X X ,,1 是来自总体X 的样本,且μ=EX ,则下列是μ的无偏估计的是( ).)(A ∑-=-1111n i i X n )(B ∑=-ni i X n 111 )(C ∑=n i i X n 21 )(D ∑-=111n i i X n 5、设4321,,,X X X X 是总体2(0,)N σ的样本,2σ未知,则下列随机变量是统计量的是( ).(A )3/X σ; (B )414ii X=∑; (C )σ-1X ; (D )4221/ii Xσ=∑6、设总体),(~2σμN X ,1,,n X X L 为样本,S X ,分别为样本均值和标准差,则下列正确的是( ).2() ~(,)A X N μσ 2() ~(,)B n X N μσ 22211()()~()ni i C X n μχσ=-∑()~()D t n7、设总体X 服从两点分布B (1,p ),其中p 是未知参数,15,,X X ⋅⋅⋅是来自总体的简单随机样本,则下列随机变量不是统计量为( )( A ) . 12X X +( B ){}max ,15i X i ≤≤( C ) 52X p +( D )()251X X -8、设1,,n X X ⋅⋅⋅为来自正态总体2(,)N μσ的一个样本,μ,2σ未知。
应用数理统计大作业In statistics, the central limit theorem plays a crucial role in understanding the distribution of sample means. By stating that, regardless of the shape of the underlying population distribution, the distribution of sample means approaches a normal distribution as the sample size increases, the central limit theorem provides a powerful tool for making inferences about population parameters based on sample data. 统计学中,中心极限定理在理解样本均值的分布方面扮演着关键角色。
通过表明,无论底层人群分布的形状如何,随着样本量的增加,样本均值的分布会逼近正态分布,中心极限定理为根据样本数据对人群参数进行推断提供了一个强大的工具。
Another important concept in statistical inference is confidence intervals, which provide a range within which the true population parameter is estimated to lie with a certain level of confidence. Confidence intervals are essential in interpreting the results of hypothesis tests, as they indicate the precision of the estimate and allow for an assessment of the uncertainty associated with the sample data. 统计推断中的另一个重要概念是置信区间,它提供了一个范围,真实人群参数被估计在其中的概率。
数理统计学大作业学院航空航天工程学部专业飞行器设计班级航宇二班学号142103130228 姓名张立指导教师姜永负责教师沈阳航空航天大学2014年12月目录 (2)前言 (3)一、采集样本数据整理及SPSS统计软件的实现 (4)1.1、数据的收集方法及说明 (4)1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4)1.3、画出直方图和折线图 (6)1.4、经验分布函数和图形 (6)1.5、各种概率分布 (7)二、给出总体分布的参数估计 (12)2.1、矩估计法 (12)2.2、最大似然估计 (12)2.3、参数区间估计 (13)三、参数的假设检验 (16)3.1. 样本统计数据的t检验 (16)3.2样本统计数据的2χ检验 (17)四、非参数假设检验(2χ拟合优度检验) (18)4.1、2χ拟合优度检验 (18)五、结论 (20)参考文献 (21)数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。
随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。
由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。
了解数理统计能解决那些实际问题。
对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。
例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。
这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。
一、问题提出和问题分析今天的重庆,肩负着中央赋予的历史重任——着力打造西部地区的重要增长极、长江上游地区的经济中心、成为统筹城乡发展的试验者、在西部地区率先实现全面建设小康社会的目标。
2010年初,又一重要规划将重庆发展提升到国家战略——重庆被确定为国家五大中心城市之一,是中西部地区唯一入选的城市。
这说明,重庆未来的发展不可限量。
自1997年直辖以来,重庆市的经济社会发展极为迅猛。
全市的GDP由1997年的1360.24亿元增长至2010年的7894.2亿元,而整个社会的发展进步也有目共睹。
在重庆过去、现在和未来的发展进程中,在重庆的各种发展规划的要求下,建设必将成为山城的另一个符号。
过去十多年中的大规模、大范围的建设成就了现在的重庆,而重庆未来的发展将需要更多的建设。
作为重庆建设中最重要的一环,建筑业在重庆显然有着重要的地位。
建筑业这种专门从事土木工程、房屋建设和设备安装以及工程勘察设计工作的生产部门,为重庆的发展建设提供着众多的基础设施,满足着居住、工业、商业、办公等各种城市需求。
数据显示,在过去的数年中,重庆市建筑业的总产值占全市GDP的7%-8%,是名副其实的支柱产业。
因此建筑业的发展情况,可以从侧面反映出整个重庆社会经济的发展情况,对重庆建筑业的研究就有了很大的现实意义。
建筑企业是建筑业的主体。
众多的建筑企业的良好发展构成了建筑业的良好发展。
对于建筑企业来说,要实现企业的良好经营和发展,必须要有良好的收入来支撑。
在建筑企业收入的众多影响因素中,企业的劳动生产率无疑是值得关注的一个。
企业都在致力于提高自身的劳动生产效率,而不断提高的劳动生产率,可使得企业的生产经营行为更具效率,因而获得更多的收入,实现更好的发展。
所以,研究重庆市建筑企业劳动生产率与企业收入的关系,可从一个角度来了解重庆市建筑企业的发展情况,从而了解到了重庆建筑业的发展以至于重庆市的经济发展情况。
为了找出二者之间的关系或者规律性,本文采用2001-2010这十年中重庆建筑企业劳动生产率和企业平均收入的数据,通过数学分析,找出二者关系。
自然语言中困惑度问题的统计分析姓名:李楠学号:20120102015专业方向:计算机应用技术2012年11月2日摘要数理统计学是研究随机现象统计规律性的一门数学学科,它以概率论为基础,研究如何收集、整理和分析带有误差的随机数据,建立适当的随机数学模型,并在此基础上对随机现象的本质规律性给出推断和预测,为决策提供科学依据。
本文依据数理统计学的知识,通过测试一百多篇语料的困惑度,得出110个样本数据,通过对困惑度样本数据加工处理和汇总后,给出矩估计和极大似然估计、给出参数估计区间、给出参数的t检验和2 检验,进行非参数拟合优度检验,从而得出相应的结论,即判断一个语言模型的好坏。
关键词:困惑度;数理统计;参数估计;假设检验目录前言 ............................................................... 3 一、采集样本及数据整理 (4)1、数据的搜集方法及说明2、数据整理:给出频数、频率分布表及说明3、画出直方图和折线图并给出说明4、画出经验分布函数二、假定总体服从正态分布,给出μ,2σ的估计 (10)1、矩估计法2、极大似然估计3、若总体不是正态分布请探求其参数估计,并写出方案三、参数区间估计 (12)1、方差2σ未知,求数学期望μ的置信区间 ......................... 12 2、数学期望μ,2σ均未知,求方差2σ的置信区间 . (13)注:可先假设总体是正态时进行讨论,若总体不是正态的要给出探求方案四、 参数的假设检验 (14)1. 样本统计数据的t 检验 ....................................... 14 2. 样本统计数据的-2χ检验 .................................................................................... 15 五、非参数假设检验(2χ拟合优度检验或K —S 检验) . (17)1、2χ拟合优度检验或K —S 检验检验2、当上述检验被接受或被拒绝时,请结合实际问题给出说明六、结论 .......................................................... 20 总结、评述和体会参考文献 (21)前言自然语言处理是一项十分庞大而繁复的工程,它是自然科学和社会科学交叉的学科。
研究生课程考核试卷科目:数理统计教师: 李寒宇姓名: 蔡亚楠学号:20131102015t 专业:高电压与绝缘技术类别:学术型上课时间: 2014年3月至2014年5月考生成绩:卷面成绩平时成绩课程综合成绩阅卷评语:阅卷教师(签名)相对地过电压数据的统计分析摘要:过电压是指超过正常运行电压并可使电力系统绝缘或保护设备损坏的电压升高。
电力系统的过电压分布情况决定了电气设备的绝缘水平。
变电站过电压由于影响因素的随机性,使得过电压数据复杂且具有随机性。
本文结合电气工程专业的背景,分析了相对地过电压数据的分布规律。
首先对三相的过电压数据分别进行双样本同分布检验,采用两总体分布比较的假设检验方法。
检验结果显示三相的样本具有相同的分布规律,因此将三相的过电压数据合并进行总体的分布规律检验。
文中运用拟合优度2 检验法检验总体分布是否福才能够正态分布。
检验结果表明样本总体分布不服从正态分布,而是服从切断正态分布.针对相对地过电压数据的统计分析有助于确定设备的绝缘水平,具有一定的研究价值.关键词:过电压;假设检验;统计分布一、问题提出过电压是指超过正常运行电压并可使电力系统绝缘或保护设备损坏的电压升高。
电力系统的过电压分布情况决定了电气设备的绝缘水平.由于过电压数据出现的随机性较大,且有明显的统计特征,因此在对单次过电压数据进行统计分析的同时,还可以用数理统计的方法对系统采集的多次样本进行统计分析研究,并预测过电压的概率分布规律,以便将所得结论用于确定设备及线路的绝缘水平,合理解决绝缘配合问题,使设备绝缘故障率或停电故障率降低到经济上和安全运行上可以接受的水平.二、数据描述本次研究以TR2000过电压在线监测装置在某变电站实地运行所采集的过电压数据进行分析。
该变电站的等级为110kV/38.5kV/10。
5kV,以往的运行经验发现,35kV侧事故频繁,属第一、二类等级符合用户较集中,故在35kV侧安装了一台TR2000过电压在线监测装置.通过对监测装置中导出的数据进行进制转换、图形显示、统计分析等手段,分析变电战过电压的规律,由此可以对电力系统设计、改造和故障分析等工作提供可靠的依据.根据现场情况,将暂态过电压记录倍率设定为1。
数理统计试题及答案一、单项选择题(每题3分,共30分)1. 下列哪个选项是随机变量的期望值?A. 随机变量的众数B. 随机变量的中位数C. 随机变量的平均值D. 随机变量的方差答案:C2. 以下哪个分布是离散分布?A. 正态分布B. 均匀分布C. 泊松分布D. 指数分布答案:C3. 以下哪个统计量是度量数据离散程度的?A. 均值B. 方差C. 标准差D. 众数答案:B4. 以下哪个统计量是度量数据集中趋势的?A. 极差B. 方差C. 标准差D. 均值答案:D5. 以下哪个选项是中心极限定理的描述?A. 样本均值的分布是正态分布B. 样本方差的分布是正态分布C. 样本大小的分布是正态分布D. 总体均值的分布是正态分布答案:A6. 以下哪个选项是二项分布的参数?A. 样本大小B. 总体均值C. 成功概率D. 总体方差答案:C7. 以下哪个选项是描述总体的?A. 样本均值B. 样本方差C. 总体均值D. 总体方差答案:C8. 以下哪个选项是描述样本的?A. 总体均值B. 总体方差C. 样本均值D. 样本方差答案:C9. 以下哪个选项是描述变量之间关系的?A. 相关系数B. 标准差C. 方差D. 均值答案:A10. 以下哪个选项是描述变量内部关系的?A. 相关系数B. 标准差C. 方差D. 均值答案:C二、填空题(每题4分,共20分)1. 随机变量X服从标准正态分布,其均值为______,方差为______。
答案:0,12. 样本容量为n的样本均值的方差为总体方差σ²除以______。
答案:n3. 两个独立的随机变量X和Y的协方差为______。
答案:04. 相关系数ρ的取值范围在______和______之间。
答案:-1,15. 泊松分布的参数λ表示单位时间内发生事件的______。
答案:平均数三、简答题(每题10分,共20分)1. 简述中心极限定理的内容。
答案:中心极限定理指出,对于足够大的样本容量,样本均值的分布将趋近于正态分布,无论总体分布的形状如何。
《概率论与数理统计》作业(参考答案)班级 学号 姓名 得分 注意:书写清楚、整洁;并有主要的解题过程.1. 设1021,,,X X X 是来自总体)3.0,0(2N 的样本,求统计量∑=10129100i iX的分布(需说明理由).解:因)1,0(~3.0/N X i ,)1(~)3.0(22χi X ,由可加性)10(~910010122=∑χi iX2. 设总体),3(~2σN X ,有n=9的样本,样本方差42=s ,求统计量2/)93(-X 的分布(需说明理由).)8(~293t X - 3. 设总体)9,(~,)4,(~μμN Y N X ,有16,1121==n n 的两个独立样本,求统计量222149S S 的分布(需说明理由). )1510~492221,F (S S 4. 4. 设总体X 的概率密度函数为⎩⎨⎧<<+=其他,010,)1(),;(x x x f θθθ,),,,(21n X X X 是来自该总体的一个样本,),,,(21n x x x 是相应的样本值,求(1)未知参数θ的矩估计量;(2)最大似然估计量.((1)XX --=∧112θ;(2) 1ln 1--=∑=∧ni iXnθ班级 学号 姓名 得分 注意:书写清楚、整洁;并有主要的解题过程.5. 设),,(321X X X 是来自总体X 的样本,(1)证明:3211213161X X X ++=μ;3212525251X X X ++=μ;3213313131X X X ++=μ 是总体均值μ的无偏估计量;(2)说明哪一个估计较有效?(需说明理由)提示:(1)求)(1μE =++=)213161(321X X X E μ=++)(21)(31)(61321X E X E X E 同理求另外两个……………………….. (2)求)(1μD =++=)213161(321X X X D )(187)(41)(91)(361321X D X D X D X D =++同理求另外两个的方差,比较大小,小的较有效6. 设有一批胡椒粉,每袋净重X (单位:g )服从正态分布,从中任取9袋,计算得样本均值21.12=x ,样本方差09.02=s ,求总体均值μ的置信度为0.95的置信区间.(306.2)8(025.0=t ,2622.2)9(025.0=t ) 参考答案()44.12,98.11())1(2/=-±n t ns x α7. 设高速公路上汽车的速度服从正态分布,现对汽车的速度独立地做了6次测试,求得这6次测试的方差22)/(08.0s m s =,求汽车速度的方差2σ的置信度为0.9的置信区间. (488.9)5(205.0=χ,145.1)5(295.0=χ)参考答案()3493.0,0422.0())1()1(,)1()1(22/1222/2≈-----n s n n s n ααχχ班级 学号 姓名 得分 注意:书写清楚、整洁;并有主要的解题过程.8. 甲、乙两位化验员各自独立地用相同的方法对某种聚合物的含氯量各作了10次测量,分别求得测定值的样本方差为6065.0,5419.02221==s s ,设测定值总体服从正态分布),(,),(222211σμσμN N ,试求方差比2221σσ的置信度为0.95的置信区间.(03.4)9,9(025.0=F )参考答案()6007.3,2217.0())1,1(,)1(1122/222112/2221≈---n n F s s n F s s αα9. 某糖厂用自动打包机打包,每包标准重量为50公斤,每天开工后需检验一次打包机是否正常工作,某日开工后,测得9包重量,计算得样本均值82.49=x ,样本方差44.12=s ,假设每包的重量服从正态分布.在显著性水平为05.0=α下,打包机工作是否正常?(即检验假设:50:,50:10≠=μμH H ,306.2)8(025.0=t ,2622.2)9(025.0=t )解:由题意,需检验假设:50:,50:10≠=μμH H ;9=n拒绝域为:)1(/2/0->-n t ns x αμ;计算:)8(306.245.03/2.15082.49/025.00t ns x t =<=-=-=μ,不在拒绝域内,即可以认为打包机工作是正常的。
概率论与数理统计大作业一、选题背景概率论与数理统计是现代科学中的重要分支,具有广泛的应用领域。
在实际问题中,我们经常需要通过数据分析来了解事物的规律性和趋势,而概率论与数理统计正是提供了一种科学的方法来处理这些数据。
因此,在学习概率论与数理统计时进行一次大作业,不仅能够加深对知识点的理解,还能够提高自己的数据分析能力和实际问题解决能力。
二、选题内容本次概率论与数理统计大作业选题为“某超市销售数据分析”。
主要内容包括以下几个方面:1. 数据收集首先需要收集某超市近两年来各种商品的销售数据,并将其整理成表格形式。
表格中应包含商品名称、销售量、销售额等信息。
2. 数据处理在收集到数据后,需要对其进行初步处理。
可以使用Excel等工具进行数据清洗、去重、排序等操作,并计算出每种商品的年销售量、年销售额以及平均单价等指标。
3. 数据分析在完成数据处理后,可以开始进行数据分析。
可以从以下几个方面入手:(1)商品销售情况分析通过统计每种商品的销售量、销售额等指标,分析各种商品的销售情况,找出畅销商品和滞销商品,并探究其原因。
(2)季节性分析通过比较不同季节或不同月份的销售数据,分析商品在不同季节或月份的销售情况,找出季节性规律。
(3)地域性分析通过比较不同门店或不同城市的销售数据,分析商品在不同地域的销售情况,找出地域性规律。
(4)用户行为分析通过统计用户购买行为数据,如购买时间、购买频率、购买金额等指标,分析用户行为特点,并提出相应的营销策略。
4. 数据可视化为了更直观地展示数据分析结果,可以使用图表等工具进行数据可视化。
例如可以绘制柱状图、折线图、饼图等来展示各种商品的年销售量和年销售额;也可以使用热力图来展示不同城市或门店的销售情况。
三、选题意义本次概率论与数理统计大作业选题有以下几个意义:1. 提高数据处理能力在进行本次大作业时,需要进行数据收集、处理和分析等操作,这将有助于提高自己的数据处理能力和实际问题解决能力。
————————————————————————————————概率论与数理统计大作业xxxxxxxxxxxxxxxxxxxxxxx2012年12月8日概率论与数理统计一点小结1.简介:概率论(probability theory):研究随机现象数量规律的数学分支。
随机现象是相对于决定性现象而言的。
在一定条件下必然发生某一结果的现象称为决定性现象。
例如在标准大气压下,纯水加热到100℃时水必然会沸腾等。
随机现象则是指在基本条件不变的情况下,一系列试验或观察会得到不同结果的现象。
每一次试验或观察前,不能肯定会出现哪种结果,呈现出偶然性。
例如,掷一硬币,可能出现正面或反面,在同一工艺条件下生产出的灯泡,其寿命长短参差不齐等等。
随机现象的实现和对它的观察称为随机试验。
随机试验的每一可能结果称为一个基本事件,一个或一组基本事件统称随机事件,或简称事件。
事件的概率则是衡量该事件发生的可能性的量度。
虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复的随机试验却往往呈现出明显的数量规律。
例如,连续多次掷一均匀的硬币,出现正面的频率随着投掷次数的增加逐渐趋向于1/2。
又如,多次测量一物体的长度,其测量结果的平均值随着测量次数的增加,逐渐稳定于一常数,并且诸测量值大都落在此常数的附近,其分布状况呈现中间多,两头少及某程度的对称性。
大数定律及中心极限定理就是描述和论证这些规律的。
在实际生活中,人们往往还需要研究某一特定随机现象的演变情况随机过程。
例如,微小粒子在液体中受周围分子的随机碰撞而形成不规则的运动(即布朗运动),这就是随机过程。
随机过程的统计特性、计算与随机过程有关的某些事件的概率,特别是研究与随机过程样本轨道(即过程的一次实现)有关的问题,是现代概率论的主要课题。
数理统计:数理统计是数学系各专业的一门重要课程。
随着研究随机现象规律性的科学—概率论的发展,应用概率论的结果更深入地分析研究统计资料,通过对某些现象的频率的观察来发现该现象的内在规律性,并作出一定精确程度的判断和预测;将这些研究的某些结果加以归纳整理,逐步形成一定的数学概型,这些组成了数理统计的内容。
应用数理统计作业一学号:姓名:电话:二〇一四年十二月国内生产总值的多元线性回归模型摘要:本文首先选取了选取我国自1978至2012年间的国内生产总值为因变量,并选取了7个主要影响因素,进一步利用统计软件SPSS对以上数据进行了多元逐步线性回归。
从而找到了能反映国内生产总值与各因素之间关系的“最优”回归方程.然后利用多重线性的诊断找出存在共线性的自变量,剔除缺失值较多的因子.再次进行主成份线性回归分析,找出最优回归方程。
所得结论与我国当前形势相印证。
关键词:多元线性回归,逐步回归法,多重共线性诊断,主成份分析目录0符号说明 (1)1 介绍 (2)2 统计分析步骤 (3)2。
1 数据的采集和整理 (3)2。
2采用多重逐步回归分析 (7)2.3进行共线性诊断 (17)2。
4进行主成分分析确定所需主成份 (24)2。
5进行主成分逐步回归分析 (27)3 结论 (30)参考文献 (31)致谢 (32)0符号说明1 介绍文中主要应用逐步回归的主成份分析方法,对数据进行分析处理,最终得出能够反映各个因素对国内生产总值影响的最“优”模型及线性回归方程.国内生产总值是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标.它不但可反映一个国家的经济表现,还可以反映一国的国力与财富。
2012年1月,国家统计局公布2011年重要经济数据,其中GDP增长9.2%,基本符合预期。
2012年10月18日,统计显示,2012年前三季度国内生产总值353480亿元,同比增长7.7%;其中,一季度增长8.1%,二季度增长7。
6%,三季度增长7.4%,三季度增幅创下2009年二季度以来14个季度新低。
中国的GDP核算历史不长,上世纪90年代之前通常用“社会总产值”来衡量经济发展情况。
上世纪80年代初中国开始研究联合国国民经济核算体系的国内生产总值(GDP)指标。
一、非参数假设检验数据来自《2009中国卫生统计年鉴》8-1-2各地区人口出生率和死亡率:北京市的人口出生率服从正态分布。
检验假设H由上表可知,假设不成立,即北京市的人口出生率不符合正态分布,应用同种方法可以得到北京市的人口死亡率同样不符合正态分布。
二、多元线性回归分析改革开放以来,我国城乡居民收入分配制度发生了很大的变化。
随着城乡居民收入水平的不断提高,其差距也在逐渐扩大,如果不采取相应的经济政策,任其发展,有可能会影响社会生产力的发展和社会的稳定,因此,需要分析影响城乡居民收入差距的主要因素。
以城乡居民收入比(Y )作为被解释变量,而第一产业增加值占GDP 的比重(X 1)、国家财政对农业支出的增长率(X 2)、乡镇企业职工增长率(X 3)、城镇居民人均年生活费收入增长率(X 4)、第一产业增加值指数(X 5)作为解释变量。
本模型采用时间序列数据,数据来自《中国统计年鉴》(1982—1998)。
模型的理论方程为:Y=0β+1βX 1+2βX 2+3βX 3+4βX 4+5βX 5 城乡居民收入比模型样本观测值数据obs 城乡居民收入比Y 第一产业增加值占GDP 的比重X1 国家财政对农业支出的增长率X2 乡镇企业职工增长率X3 城镇居民人均年生活费收入增长率X4 第一产业增加值指数X51981 2.05 31.73 -26.50 -1.00 4.33 7.00 1982 1.83 33.31 9.33 4.83 8.08 11.50 1983 1.70 32.90 10.27 3.91 6.26 8.30 1984 1.71 32.47 6.34 61.01 15.59 12.90 1985 1.72 28.35 8.73 34.00 12.66 1.80 1986 1.95 27.09 19.91 13.73 20.88 3.30 1987 1.98 26.79 6.25 10.94 10.63 4.70 1988 2.05 25.66 9.38 8.41 22.16 2.50 1989 2.09 25.00 24.23 -1.87 12.69 3.10 1990 2.02 27.05 15.76 -1.09 9.99 7.30 1991 2.18 24.46 12.91 3.72 11.32 2.40 1992 2.33 21.77 8.19 10.12 18.26 4.70 1993 2.53 19.87 17.13 16.67 27.98 4.70 1994 2.60 20.23 21.01 -2.65 36.03 4.00 1995 2.47 20.51 7.93 7.02 22.46 5.00 1996 2.27 20.45 21.83 5.02 12.43 5.10 19972.2318.6810.01-3.396.633.50(以上内容是从网上找的资料)用SPSS进行线性回归分析,结果如下:上表说明了因变量和自变量进入方程的情况。