当前位置:文档之家› 071601 统计学

071601 统计学

071601 统计学
071601 统计学

业务培养目标:本专业主要包括一般统计和经济统计两类专业方向,培养具有良好的数学或数学与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门人才。

业务培养要求:本专业学生主要学习统计学的基本理论和方法,打好数学基础,具有较好的科学素养,受到理论研究、应用技能和使用计算机的基本训练,具有数据处理和统计分析和基本能力。

毕业生应获得以下几方面的知识和能力:

1.具有扎实的数学基础,受到比较严格的科学思维训练;

2.掌握统计学的基本理论、基本知识、基本方法和计算机操作技能;具有采集数据、设计调查问卷和处理调查数据的基本能力;

3.了解与社会经济统计、医药卫生统计、生物统计或工业统计等有关的自然科学、社会科学、工程技术某一领域的基本知识,具有应用统计学理论分析、解决该领域实际问题的初步能力;

4.了解统计学理论与方法的发展动态及其应用前景;

5.对于理学学士,应能熟练使用各种统计软件包,有较强的统计计算能力;对于经济学学士,应具有扎实的经济学基础,熟悉国家经济发展的方针、政策和统计法律、法规,具有利用信息资料进行综合分析和管理的能力;

6.掌握资料查询、文献检索及运用现代信息技术获取相关信息的基本方法;具有一定的科学研究和实际工作能力。

主干学科:数学、统计学、经济学、管理学

主要课程:数学基础课(分析、代数、几何)、概率论、数理统计、运筹学、计算机基础、应用随机过程、实用回归分析、时间序列分析、多元统计分析、抽样调查、非参数统计、统计预测与决策、风险管理等,以及根据应用方向选择的基本课程(如经济统计方向可选择社会调查方法、经济与社会统计、国民经济核算、会计学等)

主要实践性教学环节:包括学年论文、社会调查、生产实习和毕业论文等,一般安排10~20周。

修业年限:四年

授予学位:理学或经济学学士

相近专业:数学与应用数学、信息与计算科学

开设院校:重庆工商大学重庆商学院贵州财经学院云南大学云南财贸学院西北师范大学兰州商学院新疆大学新疆财经学院北京工业大学北方工业大学北京工商大学首都经济贸易大学天津财经学院河北大学燕山大学河北经贸大学山西大学山西财经大学内蒙古财经学院辽宁大学沈阳大学黑龙江大学南京经济学院杭州商学院安徽大学华东冶金学院福州大学青岛建筑工程学院山东经济学院山东工商学院郑州大学河南财经学院广东商学院中南民族学院中央财经大学东北财经大学上海财经大学江西财经大学山东财政学院中南财经政法大学湖南大学西南财经大学西安交通大学中国农业大学北京林业大学石家庄经济学院杭州电子工业学院华东交通大学长安大学西安财经学院暨南大学长春税务学院中国科学技术大学重庆工业管理学院郑州航空工业管理学院安徽财贸学院中国人民大学北京师范大学南开大学东北大学吉林大学复旦大学同济大学华东师范大学南京大学浙江大学厦门大学武汉大学中山大学四川大学兰州大学西安财经学院东北林业大学苏州大学湘潭大学山东大学雁北师范学院鞍山师范学院南京气象学院嘉兴学院武汉理工大学华中师范大学湖南商学院西南交通大学成都信息工

程学院石河子大学北京理工大学中央民族大学沈阳师范大学华东船舶工业学院温州师范学院江西师范大学山东理工大学山东科技大学泰山医学院曲阜师范大学四川师范大学贵州民族学院青海大学等

应用统计学期末复习

应用统计学期末复习重点(按题型整理) 一、填空题(10分) 1.统计学的三种含义:统计工作;统计数据或统计信息;统计学 2.统计学的研究对象是群体现象 3.根据统计方法的构成不同,可将统计学分为描述统计学和推断统计学,根据统计方法研究和应用的侧重不同,可将统计学分为理论统计学和应用统计学。 4.统计研究的基本方法:大量观察法,实验设计法,统计描述法和统计推断法 5.标志是说明总体单位特征的,而指标是说明总体特征的, 6.标志按其性质不同分为数量标志和品质标志两种。按其变异情况可以分为不变标志和可变标志,可变标志称为变量。 7.统计总体具有三个基本特征,即同质性、大量性和变异性。 8.统计指标按其作用可分为总量指标、相对指标、平均指标,按所反映总体的内容不同,可以分为数量指标和质量指标。 9.总量指标指在一定时间、地点条件下说明现象总体的规模和水平的指标,其表现形式为绝对数。 10.总量指标按其反映时间状况不同,可以分为时点指标和时期指标,按指标数值采用的计量单位不同可以分为实物指标,价值指标,劳动量指标。总量指标按其说明总体内容不同,可分为总体标志总量和总体单位总量 11.平均指标说明分配数列中各变量值分布的集中趋势,变异指标说明

各变量值分布的离中趋势 12.计量尺度的类型有定类尺度,定序尺度,定距尺度,定比尺度,根据四种计量尺度计量结果,可将统计数据分为三种类型:名义级数据,顺序级数据,刻度级数据。 13.对名义级数据通常是计算众数,对顺序级数据,通常可以计算众数、中位数;对刻度级数据,同样可以计算众数和中位数,还可以计算平均数。 14.全面调查方式有统计报表制度,普查;非全面调查有重点调查、典型调查、抽样调查。 15.常用的抽样调查组织形式有简单随机抽样,类型随机抽样,机械随机抽样,整群随机抽样,阶段随机抽样。 16.统计分组的关键在于正确选择分组标志和合理划分各组界限 17.按分组标志的多少,统计分组可以分为简单分组和复合分组;按分组标志性质不同,统计分组可以分为品质分组和数量分组;按分组作用和任务不同,有类型分组、结构分组和分析分组。 18.离散变量可作单项式分组或组距式分组,连续变量只能做组距式分组。 19.从统计表的内容看:统计表由主词和宾词两部分构成,从统计表的形式看:统计表包括总标题、横行和纵栏标题、数字资料 20.平均指标可分为两类:计算均值和位置均值。 21.根据算术平均数、众数和中位数的关系,次数分布可以分为对称分布,左偏分布,右偏分布。

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量2222 12n =+X X χ++…X 为 服从自由度为n 的2χ分布,记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值 的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n αχχ,对给定的实数 ),10(<<αα称满足条件: αχχαχα==>? +∞ ) (222 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量 T = 服从自由度为n 的t 分布,记为~()T t n . t 分布的密度函数为

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

应用统计学期末试卷

南京邮电大学 2010 /2011 学年第 一 学期 《应用统计》期末 试卷(A ) 院(系) 班级 学号 姓名 一、单项选择题(每题2分,共10题,合计20分) (1)一个旅游景点的管理员根据以往的经验,有80%游客照相留念,则接下来的两名游客都照相留念的概率是( )。 A.0.65 B.0.36 C.0.5 D.0.4 (2)从一个装有3个红球2个白球的盒子摸球(不放回),则连续两次摸到红球的概率为( )。 A.0.6 B.0.3 C.0.5 D.0.4 (3)下面属于时期指标的是( )。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数 (4)平均发展速度是( )。 A. 定基发展速度的算术平均数 B. 环比发展速度的算术平均数 C. 环比发展速度的几何平均数 D. 增长速度加上100% (5)在回归直线Y =a +bx 中,回归系数b 的意义为( )。 A .x =0时,Y 的期望值 B .X 每变动一个单位引起的Y 的平均变动量 C .Y 每变动一个单位引起的X 的平均变动量 D .X 每变动一个单位时Y 的变动总量 (6)设随机变量2~(3,)X N σ,且(36)0.4P X <<=,则( )0P X <=( )。 A .0.1 B .0.4 C .0.6 D .1 (7)某企业生产某种产品,其产量每年增加5万吨,则该产品的产量环比增长速度( )。 A . 年年下降 B . 年年增长 C . 年年保持不变 D . 无法做结论 (8)设()~X P λ,已知()()12P X P X ===,则()3P X =的数值为( )。 装 订 线 内 不 要 答 题 自 觉 遵 守 考 试 规 则,诚 信 考 试,绝 不 作 弊

《概率统计学》答案

单项选择题: 1.D 对以往数据分析的结果表明,机器在良好状态时,生产的产品合格率为90%,而当机器在有故障状态时,产品合格率为30%,每天开机时机器良好的概率为75%。当某天开机后生产的第一件产品为合格品时,机器是良好状态的概率等于()。 A、0.9 B、0.75 C、0.675 D、0.525 2.D 袋中有5个球(3个新球,2个旧球)。现每次取一个,无放回的抽取两次,则第二次取到新球的概率是()。 A、3/5 B、3/4 C、1/2 D、3/10 3.B 已知在10个电子元件中有2只是次品,从其中取两次,每次随机的取一只,做不放回抽取,则第二次取出的是次品的概率是()。 A、1/45 B、1/5 C、16/45 D、8/45 4.A 已知P(A)=P(B)=P(C)=1/4,P(AB)=P(BC)=0,P(AC)=3/16,则事件A,B,C全不发生的概率等于()。 A、7/16 B、3/4 C、1/4 D、9/16 5.D 6.C

7.B 8.B 甲、乙两袋内都装有两个黑球和两个白球,现从甲、乙两袋中各摸取一个球,记事件A为“从甲袋中摸出白球”,B为“从乙袋中摸出白球”,C为“摸出的两个球颜色不同”,则有()。 A、A,B,C相互独立 B、A,B,C三个事件两两独立 C、A,B,C三个事件两两互不相容 D、AB与C互不相容 9.D 10.C 对于任意两个事件A与B,则有P(A-B)为() A、P(A)-P(B) B、P(A)-P(B)+P(AB) C、P(A)-P(AB) D、P(A)+P(AB) 11.C

12.D 13.A 14.C 15.B

《应用统计学》期末考试试题++a+)+卷

一、单项选择题(每题 2分,共30分) △ 1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、9.3 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组, 请指出哪项是正确的( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 80.1—90% 90.1—100% 100.1—110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C ) 。 A. 5 B. 45 C. 56.5 D. 7.5 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108 斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计 算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数

6.甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41, 平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折 账号的顺序,每50本存折抽出一本登记其余额。这样的抽样组 织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关 C 、表明相关程度很弱 D 、不能说明相关的方向和程度 △10.已知某工厂甲产品产量和生产成本有直线关系,在这条直 线上,当产量为1000时,其生产成本为30000元,其中不随产量 变化的成本为6000元,则成本总额对产量的回归方程是( A ) A 、x y 246000?+= B 、x y 24.06?+= C 、x y 624000?+= D 、x y 600024?+= 11.速度和环比发展速度的关系是( A )。 A 、两个相邻时期的定基发展速度之商等于相应的环比发展速度 B 、两个相邻时期的定基发展速度之差等于相应的环比发展速度

三大抽样分布

三大抽样分布 众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2 分布、t布和F分布。这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。 三大抽样分布的研究意义 c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。”这句话一语道破统计学的重要性。三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。为此,要想研究三大抽样分布,就应该对其发展过程进行研究。统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。 X2分布 x2的早期发展 由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。1891年,X2分布首次被作为统计量的分布导出。Pizzetti在求线性 模型最小二乘估计残差平方和的分布时,通过富氏分析法得出了X2的分布。随着时代的发展,正态分布理论的局限更加明显,更加推动了偏态分布的发展。KarlPearson是对偏态分布贡献最大的人,成为了一代统计学巨人。按照他的观点,统计学应该把在模型基础上对观测数据进行有效预测作为基本任务,所以他开创了一族曲线对观测数据进行拟合,使得分布拟台数据的应用范围进一步扩大。 X2模型

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍 2分布,t 分布,F 分布和正态分布的定义及基本性质, 然后 用理论说明2分布,t 分布,F 分布与正态分布的关系,并且利用数学软件 MATLAB 来验证之. 1.三大分布函数[2] 1.1 2分布 2(n )分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme )赫尔默特(Helmert )、皮尔逊分别于1858年、1876年、1900年所发 现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量X 1,X 2,…X n 相互独立,且都来自正态总体 N (0,,),则称 统计量 2 =x ; X ;…+X ;为服从自由度为n 的2分布,记为 2 2 ~ (n ). 2 分布的概率密度函数为 1 x e 2 x 0 J x 0 其中伽玛函数(X ) e t t x 1dt,x 0, 2 分布的密度函数图形是一个只取非负值 的偏态分布,如下图? x 2 n 2° f(x; n)

2(n2) ,X!,X2相互独立,则X! X2~ 2g n2); 性质3: n 时,2(n) 正态分布; 性质4:设2~ 2(n),对给定的实数 (0 1),称满足条件: P{ 2 2(n)} 2(、f(x)dx (n) 的点2(n)为2(n)分布的水平的上侧分位数. 简称为上侧分位数.对不同的与n,分位 数的值已经编制成表供查 分布,是由英国统计学家戈赛特在1908年“student的'笔名 布在数理统计中也占有重要的位置. 1), Y?2(n), X,Y相互独立,,则称统计量T —X VY/ n 分布,记为T~t( n). 为 性质1: E( 2(n)) n,D( 2(n)) 2n ; 性质2:若X! 2(nJ,X2

统计学常用分布及其分位数

§1、4 常用得分布及其分位数 1、 卡平方分布 卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布 密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2、 t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布得分布密度也就是偶函数,且当n>30时,t

应用统计学期末考试试题A卷

一 、单项选择题(每题2分,共30分) △1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组,请指出哪项是正确的 ( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 —90% —100% —110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C )。 A. 5 B. 45 C. D. 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、 102斤、110斤、105斤、102斤,据此计算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数 6.甲数列的标准差为,平均数为70,乙数列的标准差为,平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本 存折抽出一本登记其余额。这样的抽样组织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关

统计学统计学概率与概率分布练习题

第5章 概率与概率分布 练习题 5.1 写出下列随机事件的基本空间: (1) 抛三枚硬币。 (2) 把两个不同颜色的球分别放入两个格子。 (3) 把两个相同颜色的球分别放入两个格子。 (4) 灯泡的寿命(单位:h )。 (5) 某产品的不合格率(%)。 5.2 假定某布袋中装有红、黄、蓝、绿、黑等5个不同颜色的玻璃球,一次从中取出3个球, 请写出这个随机试验的基本空间。 5.3 试定义下列事件的互补事件: (1) A ={先后投掷两枚硬币,都为反面}。 (2) A ={连续射击两次,都没有命中目标}。 (3) A ={抽查三个产品,至少有一个次品}。 5.4 向两个相邻的军火库发射一枚导弹,如果命中第一个和第二个军火库的概率分别是、, 而且只要命中其中任何一个军火库都会引起另一个军火库的爆炸。试求炸毁这两个军火库的概率有多大。 5.5 已知某产品的合格率是98%,现有一个检查系统,它能以的概率正确的判断出合格品, 而对不合格品进行检查时,有的可能性判断错误(错判为合格品),该检查系统产生错判的概率是多少 5.6 有一男女比例为51:49的人群,已知男人中5%是色盲,女人中%是色盲,现随机抽中 了一个色盲者,求这个人恰好是男性的概率。 根据这些数值,分别计算: (1) 有2到5个(包括2个与5个在内)空调器出现重要缺陷的可能性。 (2) 只有不到2个空调器出现重要缺陷的可能性。 (3) 有超过5个空调器出现重要缺陷的可能性。 5.8 设X 是参数为4=n 和5.0=p 的二项随机变量。求以下概率: (1))2(

5.9 一条食品生产线每8小时一班中出现故障的次数服从平均值为的泊松分布。求: (1) 晚班期间恰好发生两次事故的概率。 (2) 下午班期间发生少于两次事故的概率。 (3) 连续三班无故障的概率。 5.10 假定X 服从12=N ,7=n ,5=M 的超几何分布。求: (1))3(=X P 。(2))2(≤X P 。(3))3(>X P 。 5.11 求标准正态分布的概率: (1))2.10(≤≤Z P 。 (2))49.10(≤≤Z P 。 (3))048.0(≤≤-Z P 。 (4))037.1(≤≤-Z P 。 (5))33.1(>Z P 。 5.12 由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据(单位:L )如下: 试判断该种汽车的耗油量是否近似服从正态分布 5.13 设X 是一个参数为n 和p 的二项随机变量,对于下面的四组取值,说明正态分布是否 为二项分布的良好近似 (1)30.0,23==p n 。(2)01.0,3==p n 。 (3)97.0,100==p n 。(4)45.0,15==p n 。

统计学三大分布及正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1.三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量222 212n =+X X χ++…X 为服从自由度为n 的2χ分布, 记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n α χχ,对给定的实数),10(<<αα称满足条 件:αχχα χα ==>?+∞ ) (2 22)()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查 用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student ”的笔名 首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/T Y n = 服从自由度为n 的t 分布,记为~()T t n .

《应用统计学》期末考试试题及答案(第一套)

《应用统计学》期末考试试题(第一套) 参考答案及评分细则 一、单项选择题(在备选答案中只有一个是正确的,将其选出并把它的英文标号写在题后括号内。不答题或者答错题既不得分,也不倒扣分。每题1分,共10分) 1、某城市工业企业未安装设备普查,总体单位是( B)。 A.工业企业全部未安装设备B.工业企业每一台未安装设备 C.每个工业企业的未安装设备D.每一个工业企业 2、属于数量指标的是( A )。 A.粮食总产量 B.粮食平均亩产量 C.人均粮食生产量 D.人均粮食消费量 3、某市工业企业2006年生产经营成果年报呈报时间规定在2007年1月31日, 则调查期限为( B )。 A.一日B.一个月C.一年D.一年零一个月 4、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出下列哪项 是正确的( C ) A.80-89%B.80%以下C.90%以下D.85%以下 90-99%80.1-90%90-100% 85-95% 100-109% 90.1-100% 100-110% 95-105% 110%以上 100.1-110%110%以上 105-115% 5、某企业2005年职工平均工资为5200元,标准差为110元,2006年职工平均 工资幅长了40%,标准差增大到150元,职工平均工资的相对变异( B )A.增大 B.减小C.不变D.不能比较6、权数对算术平均数的影响作用,实质上取决于( A ) A.作为权数的各组单位数占总体单位数比重的大小 B.各组标志值占总体标志总量比重的大小 C.标志值本身的大小 D.标志值数量的多少 7、已知各期环比增长速度为2%、5%、8%和7%,则相应的定基增长速度的计算方 法为( A )

统计学常用分布

二项分布(,)B n p n 为试验次数,p 为每次成功概率 {}x x n x n p X x C p q -== 其中1p q += (),()E X np Var X npq == ()()tX t n E e q pe =+其中t -¥<<¥ 解释:n 重贝努里实验中正好成功x 次的概率 几何分布()Geo p p 为成功概率 ()x P X x pq == 2(),()E X q p Var X q p == ()(1),ln tX t E e p qe t q =-<- 解释:n 重贝努里实验中首次成功正好在第x+1次 负二项分布(,),1NB k p k >,k 为成功次数,01p <<,p 为成功概率 1{}x k x k x P X x C p q +-== 2(),()E X kq p Var X kq p == ()(),ln 1tX k t p E e t q qe =<-- 解释:贝努里实验系列中第k 次成功正好出现在第x +k 次实验上地概率 泊松分布()P l {},0! x P X x e x l l l -==> (),()E X Var X l l == (1)()t tX e E e e l -=,t -¥<<¥ 解释:贝努里概型中的实验次数很大,但每次成功的概率很小,平均成功次数接近于常数

均匀分布(,)U a b 1 (),X f x a x b b a =<<-;(),X x a F x a x b b a -=<<- 2 ()(),()212a b b a E X Var X +-== 11 ()(1)()r r r b a E X r b a ++-=+- 正态分布2(,)N m s 2 1) 2()x X f x m s -- = 2(),()E X Var X m s == 22 1 2()t t tX E e e m s += 对数正态分布2log (,)N m s 2 1 ln () 2()x X f x m s --=2 221 22(),()(1)E X e Var X e e m m s s ++==- 22 1 2()t t t E X e m s += 解释:如果X~2log (,)N m s ,则logX ~2(,)N m s 指数分布()Exp l ()x X f x e l l -=,()1x X F x e l -=- 21 1 (),()E X Var X l l == (1) ()r r r E X l G += 1()(1,X t M t t l l -=-<

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

统计学三大分布与正态分布的差异

申请大学学士学位论文 大学 学士学位论文 统计学三大分布与正态分布的差异年级专业: 学生: 指导教师:

统计学三大分布与正态分布的差异 中文摘要 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策者提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。而对数据的分析过程中就需要利用到数据的分布来研究分类。 在实际遇到的许多随机现象都服从或近似服从正态分布。而由正态分布构造的三大分布在实际中有广泛的应用,因为这三大分布不仅有明确的背景,而且其抽样分布的密度函数有明显表达式,研究三大分布与正态分布有助于研究实际事例,比如经济安全与金融保险领域、人口统计等。 本文讨论了三大分布与正态分布,并将它们之间的密度函数进行比较说明. 第二章介绍了正态分布的定义、性质,三大分布的定义、性质。 第三章介绍了正态分布与三大分布的密度函数,并将它们之间的密度函数进行比较关键词:正态分布;三大分布;密度函数 The Difference between the Three Statistical Distributions and the Normal Distribution Abstract Statistics is a branch of applied mathematics, the mathematical models are mainly established by the probability and statistics theory based on the collecting

统计学名词解释

名词解释 1.统计学:是应用概率论和数理统计的基本原理和方法,研究数据的收集、整 理、分析、表达和解释的一门科学。 2.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据 信息的搜集整理、分析、表达和解释的一门科学。 3.抽样:是从研那个研究总体抽取少量有代表性的个体,称为抽样。 4.统计推断:是根据已知的样本信息来推断未知的总体,是统计分析的目的, 包括参数估计和假设检验。 5.总体:是根据研究目的确定的同质研究对象的全体。 6.概率:是随机事件发生可能性大小的数值度量。 7.同质:是指所研究的观察对象具有某些相同的性质或特征。 8.变异:是同质个体的某项指标之间的差异,即个体差异。 9.正态分布:频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称 为近似正态分布,如果两端完全对称则称为正态分布。 10.医学参考值范围:又称正常值范围,医学上常将包括绝大多数正常人的某指 标值的波动范围称为该指标的正常值范围。 11.动态数列(dynamic series):是按照一定的时间顺序,将一系列描述某事 物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋势,这些统计指标可以为绝对数、相对数或平均数。 12.人口金字塔:将人口的性别与年龄资料结合起来以图形的方式表达人口的性 别与年龄结构,以年龄为纵轴,人口百分比为横轴,左侧为男,右侧为女,两个对应的直方图,其形似金字塔。 13.负担系数(dependency ratio):又称抚养比或抚养系数,是指人口中非劳 动年龄人数与劳动年龄人数之比。 14.标准化死亡比(SMR):实际死亡人数与期望死亡人数之比称为标准化死亡比。

《应用统计学》期末考试试题及答案(第二套)

《应用统计学》期末考试试题(第二套) 参考答案及评分细则 一、单项选择题(在备选答案中只有一个是正确的,将其选出并把它的英文标号写在题后括号内。不答题或者答错题既不得分,也不倒扣分。每题1分,共10分) 1、指标是说明总体特征的,标志是说明总体单位特征的,所以( B) A、标志和指标之间的关系是固定不变的 B、标志和指标之间的关系是可以变化的 C、标志和指标都是可以用数值表示的 D、只有指标才可以用数值表示 2、属于质量指标的是( B )。 A、货物周转量 B、单位面积产量 C、年末人口数 D、工业增加值 3、所选择单位的标志总量占全部总体标志总量的绝大比例,这些单位就是( C )。 A、调查单位 B、代表性单位 C、重点单位 D、典型单位 4、划分连续变量的组限时,相邻的组限必须( A ) A、重叠 B、相近 C、不等 D、间断 5、宏发公司2004年计划规定利润应比2003年增长10%,实际执行的结果比2003年增长了12%,则其计划完成程度为( D )。 A、 83% B、 120% C、 98.2% D、 101.8% 6、甲班学生平均成绩80分,标准差8.8分,乙班学生平均成绩70分,标准差 8.4分,因此( A ) A、甲班学生平均成绩代表性好一些 B、乙班学生平均成绩代表性好一些 C、无法比较哪个班学生平均成绩代表性好 D、两个班学生平均成绩代表性一样 7、若各年环比增长速度保持不变,则各年增长量( A ) A、逐年增加 B、逐年减少 C、保持不变 D、无法做结论

8、在物价上涨后,同样多的人民币少购买商品2%,则物价指数为( B ) A 、90.00% B 、102.04% C 、90.91% D 、109.18% 9、在其它条件不变的情况下,提高估计的概率保证程度,其估计的精确程度(B ) A 、随之扩大 B 、随之缩小 C 、保持不变 D 、无法确定 10、下列回归方程中,肯定错误的是( C ) A 、88.0,32?=+=r x y B 、88.0,32?=+-=r x y C 、88.0,32?-=+-=r x y D 、88.0,32?-=-=r x y 二、多项选择题(在备选答案中有二个以上是正确的,将它们全选出并把它们的标号写在题后括号内,每题所有答案选择正确的得分;不答、错答、漏答均不得分。每题2分,共10分) 1、哪些属于离散变量( ABC )。 A 、某企业职工总人数 B 、某行业职工总人数 C 、全国城镇居民家庭总户数 D 、旅客周转量 2、在以下什么条件下,加权算术平均数等于简单算术平均数?( AD ) A 、各组次数相等 B 、各组变量值不等 C 、变量数列为组距数列 D 、各组次数占总次数的比重相等 3、下列指标中属于时点指标的有( ABD ) A 、企业数 B 、在册职工人数 C 、某种商品的销售量 D 、某地区2006年末人口数 4、计算平均发展速度可采用的公式有( ABD )。 A 、n n a a x 0 = B 、n x x π= C 、n x x ∑= D 、n R x = 5、指数的作用是( ABD )。 A 、综合反映复杂现象总体数量上的变动情况 B 、分析现象总体变动中受各个因素变动的影响 C 、现象总体各单位变量分布的集中趋势 D 、利用指数数列分析现象的发展趋势 三、判断题(请判断每题的表述是否正确,将判断结果写在题后括号内,正确填“√”,错误填“×”。不答题或者答错题既不得分,也不倒扣分每小题1分,共10分)

概率论与数理统计学1至7章课后答案

第二章作业题解: 掷一颗匀称的骰子两次, 以X 表示前后两次出现的点数之和, 求X 的概率分布, 并验证其满足(2.2.2) 式. 解: 由表格知X 并且,361)12()2(= ===X P X P ;362)11()3(====X P X P ; 363)10()4(====X P X P ;364)9()5(====X P X P ; 36 5)8()6(= ===X P X P ;366)7(==X P 。 即 36 | 7|6)(k k X P --== (k =2,3,4,5,6,7,8,9,10,11,12) 设离散型随机变量的概率分布为,2,1,}{Λ===-k ae k X P k 试确定常数a . 解:根据 1)(0 ==∑∞=k k X P ,得10 =∑∞ =-k k ae ,即 111 1 =---e ae 。 故 1-=e a 甲、乙两人投篮时, 命中率分别为 和 , 今甲、乙各投篮两次, 求下列事件的概率: (1) 两人投中的次数相同; (2) 甲比乙投中的次数多. 解:分别用)2,1(,=i B A i i 表示甲乙第一、二次投中,则 12121212()()0.7,()()0.3,()()0.4,()()0.6,P A P A P A P A P B P B P B P B ======== 两人两次都未投中的概率为:0324.06.06.03.03.0)(2121=???=B B A A P , 两人各投中一次的概率为: 2016 .06.04.03.07.04)()()()(1221211212212121=????=+++B B A A P B B A A P B B A A P B B A A P 两人各投中两次的概率为:0784.0)(2121=B B A A P 。所以: (1)两人投中次数相同的概率为3124.00784.02016.00324.0=++ (2) 甲比乙投中的次数多的概率为:

相关主题
文本预览
相关文档 最新文档