应用统计学期末复习参考
- 格式:doc
- 大小:125.50 KB
- 文档页数:10
应用统计期末试题及答案一、选择题1.以下哪个不属于统计学的基本特征?A.数据的整理B.数据的分析C.数据的收集D.数据的存储答案:D2.统计学最基本的分支是:A.计量经济学B.经济数学C.运筹学D.数理统计学答案:D3.以下哪个不是统计推断的主要内容?A.假设检验B.抽样调查C.回归分析D.方差分析答案:C4.在进行推断统计时,样本大小的影响是:A.样本越大,结果越可靠B.样本越小,结果越可靠C.样本大小对结果没有影响D.样本大小不确定是否影响结果答案:A5.在统计学实证研究中,显著性水平通常设定为:A.0.01B.0.05C.0.10D.根据具体研究而定答案:B二、填空题1. 样本标准差的计算公式为______。
答案:s=√(Σ(Xi-X)²/(n-1))2. 定量数据常用的测度是______。
答案:均值3. 相对频数是指某一现象发生的______。
答案:次数与总次数的比值4. 抽样的目的是为了_________。
答案:对总体进行估计和推断5. 当P值小于显著性水平时,我们应该_________。
答案:拒绝原假设三、计算题某电商平台想要评估新推出的促销活动对销售额的影响,随机抽取了100个订单,并记录了促销前后的销售额。
其中,促销前的均值为120元,标准差为30元;促销后的均值为150元,标准差为40元。
已知总体分布近似满足正态分布。
1.请判断这次促销活动是否真正对销售额有显著的影响?答:首先,我们可以进行两个样本均值的差异检验。
设定原假设H0为促销前后销售额均值无显著差异,备择假设H1为促销后销售额均值较促销前有显著提高。
计算检验统计量:t = (x1 - x2) / √(s1²/n1 + s2²/n2)= (150 - 120) / √((30²/100 + 40²/100))查表或使用统计软件可得t值,自由度为(n1 + n2 - 2) = 198。
应用统计学期末复习重点(按题型整理)一、填空题(10分)1.统计学的三种含义:统计工作;统计数据或统计信息;统计学2.统计学的研究对象是群体现象3.根据统计方法的构成不同,可将统计学分为描述统计学和推断统计学,根据统计方法研究和应用的侧重不同,可将统计学分为理论统计学和应用统计学.4.统计研究的基本方法:大量观察法,实验设计法,统计描述法和统计推断法5.标志是说明总体单位特征的,而指标是说明总体特征的,6.标志按其性质不同分为数量标志和品质标志两种。
按其变异情况可以分为不变标志和可变标志,可变标志称为变量。
7.统计总体具有三个基本特征,即同质性、大量性和变异性.8.统计指标按其作用可分为总量指标、相对指标、平均指标,按所反映总体的内容不同,可以分为数量指标和质量指标.9.总量指标指在一定时间、地点条件下说明现象总体的规模和水平的指标,其表现形式为绝对数。
10.总量指标按其反映时间状况不同,可以分为时点指标和时期指标,按指标数值采用的计量单位不同可以分为实物指标,价值指标,劳动量指标。
总量指标按其说明总体内容不同,可分为总体标志总量和总体单位总量11.平均指标说明分配数列中各变量值分布的集中趋势,变异指标说明各变量值分布的离中趋势12.计量尺度的类型有定类尺度,定序尺度,定距尺度,定比尺度,根据四种计量尺度计量结果,可将统计数据分为三种类型:名义级数据,顺序级数据,刻度级数据。
13.对名义级数据通常是计算众数,对顺序级数据,通常可以计算众数、中位数;对刻度级数据,同样可以计算众数和中位数,还可以计算平均数.14.全面调查方式有统计报表制度,普查;非全面调查有重点调查、典型调查、抽样调查。
15.常用的抽样调查组织形式有简单随机抽样,类型随机抽样,机械随机抽样,整群随机抽样,阶段随机抽样.16.统计分组的关键在于正确选择分组标志和合理划分各组界限17.按分组标志的多少,统计分组可以分为简单分组和复合分组;按分组标志性质不同,统计分组可以分为品质分组和数量分组;按分组作用和任务不同,有类型分组、结构分组和分析分组。
《应用统计学》复习要点(要求:每人携带具有开方功能的计算器)一、名词解释(重复啦)二、计算题1. 在某地区随机抽取计算120。
解:2.某银行为缩短顾客到银行办理业务等待的时间,准备了两种排队方式进行试验。
为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二(1)(2)比较两种排队方式等待时间的离散程度。
(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。
解:3. 某大学为了解学生每天上网的时间,在全校学生中随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据如下:z(0.01)统计量值分别为1.65、1.96和2.58)解:4. 利用下面的信息,构建总体均值μ的置信区间。
(1)总体服从正态分布,且已知σ=500,n=15,=8900,置信水平为95%。
(注:z统计量值为1.96)(2)总体不服从正态分布,且已知σ=500,n=35,=8900,置信水平为95%。
(注:z统计量值为1.96)(3)总体不服从正态分布,σ未知,n=35,=8900,s=500,置信水平为90%。
(注:z统计量值为1.65)(4)总体不服从正态分布,σ未知,n=35,=8900,s=500,置信水平为99%。
(注:z统计量值为2.58)解:5.对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
在α=0.05的显著性水平下,检验该生产商的说法是否属实?(注:z统计量值为1.96)解:6.一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为7.25小时,标准差为2.5小时。
据报道,10年前每天每个家庭看电视的平均时间是6.7小时。
取显著性水平α=0.01,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”?(注:z统计量值为1.96)解:7.下面是7个地区2000年的人均国内生产总值GDP(Y)和人均消费水平(X)的统计数据(注:此题对应的t统计量值为2.57(1(2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。
《应用统计学》期末复习解答一、单选题1.统计总体的同质性是指( A )A.总体各单位具有某一共同的品质标志或数量标志B.总体各单位具有某一共同的品质标志属性或数量标志值C.总体各单位具有若干互不相同的品质标志或数量标志D.总体各单位具有若干互不相同的品质标志属性或数量标志值2.按某一标志分组的结果,表现出( A )A.组内同质性和组间差异性B.组内差异性和组间差异性C.组内同质性和组间同质性D.组内差异性和组间同质性3.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D )A.全部工业企业B.800家工业企业C.每一件产品D.800家工业企业的全部工业产品4.统计调查的基本任务是取得原始统计资料,所谓原始统计资料是(C)A.统计部门掌握的资料B.对历史统计资料进行整理后取得的资料C.直接向调查单位进行登记取得的资料D.统计年鉴或统计公报上发布的资料5.已知两个同类企业的职工平均工资的标准差分别为10元和6元,而平均工资分别为3000元、3500元,则两个企业的工资离散程度为( A )A.甲大于乙B.乙大于甲C.两者相等D.无法判断6.一个连续性生产的工厂,为检验产品的质量,在一天中每隔1小时取5分钟的产品做检验,这种抽样方法属于( C )A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样7.进行统计分组的关键是(B)A.划分各组组限B.正确选择分组标志C.确定各组组距D.计算各组组中值8.对一批进口商品的质量进行假设检验,在显著性水平为0.01时,原假设被拒绝;如果使用0.05的显著性水平,则原假设( A)A.一定会被拒绝B.可能会被拒绝C.一定会被接受D.必须重新假设检验 9.下列分组中按品质标志分组的是(B )A.人口按年龄分组B.产品按质量优劣分组C.企业按固定资产原值分组D.乡镇按工业产值分组 10.当一组数据属于右偏分布时,则(B ) A.平均数、中位数与众数是合而为一的 B.众数在左边,平均数在右边C.众数的数值较小,平均数的数值较大D.众数在右边,平均数在左边11.下列关于相关系数的陈述中哪一个是错误的( A ) A.数值越大说明两个变量之间的关系就越强B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系C.只是两个变量之间线性关系的一个度量,不一定意味两个变量之间存在因果关系D.绝对值不会大于112.如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加( D ) A.15% B.5% C.5.25% D.15.79% 13.某橡胶厂生产汽车轮胎,根据历史资料统计结果,平均里程为25000公里,标准差为1900公里。
统计学各章节期末复习知识点统计学是一门研究数据收集、分析和解释的学科。
作为一门广泛应用于各个领域的学科,统计学的知识点非常丰富。
以下是统计学各章节的期末复习知识点汇总:1.数据收集与描述-数据类型:定量数据和定性数据-数据收集方式:问卷调查、观察、实验-描述统计:中心趋势(均值、中位数、众数)、离散程度(范围、方差、标准差)、数据分布(直方图、条形图、饼图)2.概率论基础-随机试验与样本空间-事件与事件概率-古典概型、几何概型和统计概型-条件概率与独立性-伯努利试验与二项分布3.随机变量及其分布-随机变量与分布函数-离散型随机变量与其分布律-连续型随机变量与其概率密度函数-均匀分布、正态分布、指数分布等常见分布4.多个随机变量的分布-边缘分布与条件分布-两个离散型随机变量的联合分布律-两个连续型随机变量的联合概率密度函数-相互独立的随机变量的分布5.随机变量的数字特征-数学期望与其性质-方差与标准差-协方差与相关系数-矩、协方差矩阵与相关系数矩阵6.大数定律与中心极限定理-辛钦大数定律-中心极限定理-切比雪夫不等式与伯努利不等式7.统计推断基础-参数估计:点估计、区间估计-置信区间与置信水平-假设检验:原假设与备择假设、显著性水平、拒绝域-类型Ⅰ错误和类型Ⅱ错误-样本容量与统计检验的效应大小8.单样本与双样本推断-单个总体均值的推断:正态总体与非正态总体-单个总体比例的推断-两个总体均值的推断:独立样本与配对样本-两个总体比例的推断9.方差分析与回归分析-单因素方差分析-两因素方差分析-简单线性回归分析:最小二乘法-多元线性回归分析:拟合优度、剩余平方和、变量选择10.非参数统计方法-指标:秩和检验、秩和相关检验、符号检验- 分布:符号检验、秩和检验、秩和相关检验、Kolmogorov-Smirnov检验这些是统计学各个章节的期末复习知识点的一个概述。
每个章节都拥有更加详细和复杂的内容,需要学生在复习中深入理解并进行练习。
统计学期末考试题库及答案统计学是一门应用数学的学科,通过收集、整理和分析数据来揭示事物背后的规律和趋势。
统计学在各个领域中都起到了重要的作用,因此在学习统计学的过程中,期末考试是一个评估学生掌握程度的重要途径。
本文将提供一份统计学期末考试题库及答案,帮助大家进行复习和备考。
题库一:基础概念与原理1. 什么是样本均值?如何计算样本均值?2. 请解释什么是正态分布,并列举正态分布的特点。
3. 请描述一下统计推断的概念和过程。
4. 什么是假设检验?请简要描述假设检验的步骤。
5. 解释相关性和回归分析之间的关系。
题库二:抽样与估计1. 请解释简单随机抽样和分层抽样的概念,并列举它们的优缺点。
2. 什么是置信区间?请描述如何计算置信区间。
3. 解释抽样误差和非抽样误差的区别。
4. 请解释抽样分布的概念,并说明中心极限定理的含义。
5. 什么是样本量?为什么样本量对估计结果的可靠性很重要?题库三:假设检验1. 请解释什么是零假设和备择假设。
2. 什么是显著性水平?为什么在假设检验中很重要?3. 请描述一下单样本t检验和双样本t检验的原理和应用场景。
4. 什么是卡方检验?请说明卡方检验的步骤和应用。
5. 解释ANOVA(方差分析)的概念和用途。
答案一:基础概念与原理1. 样本均值是指从总体中取得的一组观察值的平均数。
计算样本均值的方法是将观察值相加,然后除以观察值的总数。
2. 正态分布是一种对称的连续概率分布,其特点包括:均值、中位数和众数相等;曲线呈钟形,两侧尾部逐渐降低;分布的参数由均值和标准差决定。
3. 统计推断是根据样本数据来推断总体特征的过程。
它包括参数估计和假设检验两个主要步骤。
4. 假设检验是一种基于样本数据对总体参数陈述进行推断的方法。
它的步骤包括:提出原假设和备择假设;选择适当的检验统计量;计算检验统计量的观察值;根据观察值和显著性水平进行决策,并得出结论。
5. 相关性是指两个或多个变量之间存在的关系,而回归分析则是研究因变量与一个或多个自变量之间的关系,并建立一个数学模型来解释这种关系。
统计学期末复习(仅供参考)单项选择题20个,40分,论述题4个,20分,计算题40分(15+6+6+6+7)第3章累积分布图p51,第4,第7,第8章单项选择题1.指出下面的数据哪一个属于分类数据( C )A某种产品的销售价格(元):212622 28B对某一事物的看法:同意保持中立反对C购买商品时的支付方式:现金、信用卡、支票D某汽车生产企业各季度的产量(万辆):20 2530 36A、D属于数值型数据,B属于顺序数据2.下列哪一个属于顺序变量(B )A年龄B受教育程度C企业所属的行业D性别C、D属于分类变量A属于数值型变量3.一项调查表明,在所抽取的2000个消费者中,他们每月在网上购物的平均花费是200元,这项调查的样本是( B )A。
所有网上购物的消费者B.2000个消费者C。
所有在网上购物的消费者的网上购物的平均花费金额D.2000个消费者的网上购物的平均花费金额A是总体,C是参数,D 是统计量4.最近发表的一项调查表明,‘汽车消费税率调整后,消费者购买大排量汽车的比例显著下降’.这一结论属于( D )A.对样本的描述B。
对样本的推断C。
对总体的描述 D.对总体的推断5.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是‘价格便宜’.研究者使用的方法是(推断统计方法)6.分层抽样的特点是( B)A使得总体中的每一个元素都有相同的机会被抽中B在抽样之前先将总体的元素划分为若干类,使得每一类都有相同的机会被抽中C先将总体划分为若干群,使得每一群都有相同的机会被抽中D先将总体各元素按某种顺序排列,使总体中的每一个元素都有相同的机会被抽中A是简单抽样的特点,C是整群抽样的特点,D是系统抽样的特点7.一名学生为了完成统计学作业,在《统计年鉴》中找到2010年城镇家庭的人均收入数据,这一数据属于( C )A.分类数据B。
顺序数据C。
截面数据D。
时间序列数据8。
某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入,这项研究的总体是( B)样本是(A)参数是(D)统计量是(C)A。
组口値企业数Z y200-30025047505303010500 <10-50045042500—600550189900 6oa以上&5D H7JS0音计12051200搀刑制额分姐沦业數/;(性-切(叫-石丁RD-300第01931212359W33J 300^400350305878J17634&74OD—50045042544 322f56O.l $00—6005501S15210.3Z7378S.260D以卜6501149876 3548639.2—120102T21.516146667L20《应用统计学》复习要点(要求:每人携带具有开方功能的计算器)、名词解释1•统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2•方差分析:是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。
3•假设检验:是事先对总体参数或分布形式做出某种假设,然后利用样本信息来判断原假设是否成立。
分为参数假设检验和非参数假设检验。
一般采用逻辑上的反证法,依据统计上的小概率原理。
4.置信区间:是指由样本统计量所构成的总体参数的估计区间。
在统计学中,一个概率样本的置信区间是对这个样本的某个总体参数的区间估计。
置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的成都。
5•置信水平:是指总体参数值落在样本统计值某一区内的概率。
6•抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。
抽样分布是统计推断的理论基础。
7•方差分析:是通过分析数据的误差判断各总体均值是否相等,研究分类型自变量对数值型因变量的影响,分为单因素方差分析和双因素方差分析。
(重复啦)8•相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度是研究随机变量之间的相关关系的一种统计方法。
应用统计学期末复习参考一、简答题(30分)1、统计学研究的对象是什么?答:统计学的研究对象是客观对象的数量方面,具体说,是研究总体现象的数量特征与规律性,以帮人们科学地认识客观事物。
2、在应用统计学研究实际问题时,需要兼备哪两方面的知识?答:一方面要掌握统计学的基本理论与方法,另一方面要具有实际问题的知识背景。
这样才能把定量分析与定性分析结合起来,在应用统计方法进行定量分析的基础上,再应用各学科的专业知识对统计分析的结果做出合理的解释。
3、统计学中总体、个体和样本的定义?答:总体就是某一特定研究中所有单元的集合。
通常由具有相同性质的许多单元构成,而构成总体的每个单元被称为个体。
个体是我们借以收集数据的对象,可以由人、单位或物充当。
样本是指从总体中抽取的部分个体构成的集合4、统计研究中抽样的必要性?答:统计研究的目的是认识总体的数量特征,但有时构成总体的个体数量很大,实际工作中不可能或不必要对每个个体的数量特征逐一调查,通常是以某种方式从总体中抽取一部分个体代表总体进行研究。
样本是总体的代表,从统计中抽取样本的目的就是通过对样本特征的分析去推断总体的特征。
5、品质型变量和数值型变量的定义?答:品质型变量又称定性变量,是指反映事物品质特征的变量,其表现为类别,通常是用文字来表示的;数值型变量又称定量变量,是指反映事物特征的变量,通常使用自然或度量衡单位进行计量,其结果表现为具体的数值。
数值型变量根据其取值是否连续,又可以分为离散变量和连续变量两种形式。
6、参数与统计量的定义以及它们在统计研究中的关系?答:参数是用来描述总体特征的概括性值,通常用大写字母表示,如总体均值,标准差,总体比例等;统计量是用来描述样本特征的概括性值,通常用小写字母表示,如样本均值,样本标准差,样本比例等。
在进行统计推断时,总体数据通常是不完全的,所以参数是一个未知的常数,但样本是经过抽样所确定下来的,所以统计量总是可以计算出来的,通过样本统计量来对总体参数进行推断与检验。
7、统计研究的过程包括哪三个步骤?答:统计研究包括以下三个过程——第一、统计数据的收集:统计数据的收集是指对现象总体中全部或足够多的单位进行调查,收集大量的以数字为主的信息资料,借以反映总体的数量特征;第二、统计数据的整理:统计数据的整理是对零星、分散的统计数据进行系统化、条理化的加工处理过程,使数据更加符合统计分析的需要;第三、统计数据的分解和解释:统计数据的分析和解释是统计学的核心内容,它是通过各种统计方法描述现有数据的状况,推断未知总体的数量特征,以达到探索数据内在规律的目的。
8、统计数据来源的三种主要途径?答:统计数据的来源主要包括以下三个途径:第一、大量观察法:大量观察法的数学依据是大数定理,大数定律是随机现象的基本规律;第二、描述统计法:描述统计法,就是运用各种表格、图形和数字来概括总体数量特征的方法;第三、推断统计法:推断统计法,就是在人们可以控制的范围内,根据样本资料的特征,对总体的特征做出估计和预测的方法。
9、统计报表制度的定义?统计报表制度是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式,既政府统计部门向列入调查范围的全部统计调查机构单位发放统计报表,这些机构单位定期填好统计报表后,向发放报表的政府统计部门报送。
10、抽样调查的定义及特点?答:抽样调查,也称样本调查,是从调查对象的总体中按照一定程序抽取一部分单位为样本进行调查,获取数据,并以此来推断总体数量特征的数据收集方式。
抽样调查具有以下特点:经济性好、时效性强、适用面广、准确性高。
11、重点调查与典型调查的定义及它们与抽样调查的区别?答:重点调查是从调查对象的全部单位中选择少数重点单位进行调查;典型调查的目的是通过典型单位来描述或揭示事物的本质和规律,因此所选择的典型单位应具有我们所研究问题的本质属性或特征。
抽样调查与其它两种调查的不同之处:抽样调查是随机地抽取调查单位,因此可以根据抽样结果推断总体的数量特征,因而重点调查和典型调查的单位不是随机的,具有一定的主观性,因此调查结果不能用于推断总体。
12、统计调查方案的设计包括哪六个步骤?答:统计调查方案的设计包括以下六个步骤:第一、明确调查目的;第二、确定调查对象和调查单位;第三、确定调查内容;第四、确定调查时间和调查期限;第五、选择调查方式与方法;第六、制定调查的组织实施计划。
13、统计数据的整理主要包括哪几个步骤?答:统计数据的整理主要包括以下五个步骤:第一、数据审核;第二、数据分组;第三、数据汇总;第四、编制频数分布表;第五、绘制统计图。
14、品质型数据整理的步骤?对于品质型数据的整理,是按照品质型数据的类型将总体划分为若干组,然后将每一个单位按其表现归入其中一组,还要计算出每一类别的频数、频率,同时编制频数分布表,以便对数据及其特征有一个初步的了解。
具体步骤是:第一步,列出各类类别;第二步,计算各类别的频数、频率;第三步,编制频数分布表。
15、频数、频率与频数分布的概念?答:频数,也称次数,是指落在各类别中的数据个数;频率,也称比重,是指各类别中的数据个数占全部数据总数的比例,通常用百分数表示;频数分布,也称次数分布,是各个类别及其相应的频数的对应排列,将频数分布用表格的形式表现出来就是频数分布表。
16、组距式分组的步骤?答:对于数据做组距式分组,应当按照下列步骤进行:(一)第一步:对数据进行排序,找出最大值与最小值,计算全距。
全距即全部数据中的最大值与最小值之差。
(二)第二步:确定组数、组距和组限:组数的多少主要取决于数据分布的特点。
如果组数过少,数据的分布就会过于集中,便会混淆数据的界限;如果组数过多,又可能造成数据的分布过于分散,同样不便于观察数据分布的特征和规律,因此组数的多少应适中。
在实际分组时,我们可以参考美国学者史特杰斯(H.A.Sturges)提出的经验公式来确定组数K:K=1+3.322Lgn 式中:n为数据的个数,对结果用四舍五入法取整即为组数。
组距(class width)是一个组的上限与下限的差,一般由全距与组数来决定。
组距=全距/组数。
为了编表和计算方便,也是审美习惯使然,组距通常取整数,且多取5或10的倍数。
组限(class Limit)是一个组两边的数值,也是各组数据变化的范围。
在确定组限时,不能将不同性质的数据划归到一个组内。
(三)根据分组整理成频数分布表。
17、向上累计和向下累计的概念?答:向上累计是从变量值小的一组向变量值大的一组累加频数;向下累计是从变量值大的一组向变量值小的一组累加频数。
18、统计表的构成内容以及设计原则?答:统计表是用于展示统计数据的基本工具,主要由总标题、行标题、列标题和数字资料四部分组成。
(二)统计表的设计原则第一、统计表的标题应简明、确切地概括所要反映的内容,一般需要标明数据所属的时间、地点及数据本身的含义。
第二、各行和各列的排列应当注意反映出数据资料的逻辑关系,一般应按照先局部后整体的原则,即先列各项目,后列总体。
第三、表中必须注明数字资料的计量单位。
第四、统计表一般是开口式,即统计表的左右两边不封口,表中的上下两条横线一般用粗线。
第五、在统计表的下方加上必要的注释,注明指标的含义,包括项目及资料来源等。
19、集中趋势的概念以及常用的测度值?答:集中趋势是一组数据分布的中心倾向或一般水平,其测度值通常表现为平均值。
常用的集中趋势测度值包括五种,具体表现为:众数、中位数、算术平均值、调和平均数和几何平均数。
20、众数的概念?答:众数是一组数据中出现频数最多的变量值,记作M0。
众数能够直观地反映数据分布的集中趋势,在现实生活中有许多场合都用众数来说明社会经济现象的一般水平。
21、中位数的概念?答:中位数是一组数据按一定顺序排列后,处于中间位置上的变量值,记作Me。
显然,中位数将全部变量值分成两部分,一半变量值比中位数大,另一半变量值则比中位数小。
22、算术平均数的概念?算术平均数也称均值,它是全部数据的平均数,可以概括地反映全部数据的平均水平。
23、调和平均数的概念?答:调和平均数又称倒数平均数,是将各变量值的倒数求平均之后再求倒数而得到的平均数值,记做H。
根据所掌握的数据是否分组,调和平均数分为简单调和平均数与加权调和平均数两种形式。
24、简单几何平均数的计算方法?答:简单几何平均数是n个变量值连乘积的n次方根,其计算公式为:G==25、众数、中位数和均值的关系?答:众数、中位数和均值的关系与数据分布的状况有关。
如果数据的分布完全对称,则众数M、中位数eM和均值x必定相等,即0eM M x==;如果0ex M M<<则是负偏分布;如果0eM M x<<则是正偏分布。
26、众数、中位数和均值的应用范围?众数是数据中出现频率最多的数值,具有不受极端值影响的特点,是品质型数据集中趋势的常用测度值。
中位数是一种位置的代表值,其特点是不受数据极端值的影响,它主要用于测度带有顺序数据的集中趋势,但不适用于没有顺序意义的品质型数据。
均值是根据全部数值计算的,具有综合全部数据信息的特点,是管理领域中应用最广泛的集中趋势测度值。
27、离散程度的定义及其测度值?答:统计中把一组数据远离其中心的程度称为离散程度。
离散程度的测度值主要包括:极差、四分位差、标准差与方差、方差和离散系数。
28、极差的定义与计算方法?答:极差也称全距,它是一组数据的最大值与最小值之差,记作R 。
其计算公式为:R=最大值-最小值。
30、四分位差的定义与计算方法?答:四分位差也称内距,它是第三个四分位数与第一个四分位数之差,记作Qd,其计算公式为:Qd=Q3-Q1。
31、标准差与方差的定义?标准差是各变量值与其平均数的离差平方的平均数的平方根,它是测度数值型数据离散程度的最主要方法。
标准差的平方即为方差。
32、离散系数的定义及其计算公式?答:离散系数通常是用标准差来计算的,因此也称标准差系数,它是一组数据的标准差与其相应的平均值之比,是测度数据离散程度的相对指标,其计算公式为:总体离散系数:V δμ= ,样本离散系数:sv x = 。
33、偏态的概念及其计算公式? 答:偏态是指一组数据分布的偏斜方向及程度。
未分组数据的偏态系数:()313n i i xxns α=-=∑,已分组数据的偏态系数:()3131k i ii k i i x x f f sα==-=⎛⎫ ⎪⎝⎭∑∑。
34、峰度的概念及其计算公式?答:峰度是指一组数据分布的尖峭程度。
通常与正态分布的高峰相比较,若分布的形状又低又阔,称为平峰分布;若分布的形状又高又窄,则称为尖峰分布。
未分组数据的峰度系数:()414n i i x x ns β=-=∑,已分组数据的峰度系数:()4141k i i i k i i xx f f sβ==-=⎛⎫ ⎪⎝⎭∑∑。