×第二章 统计数据的描述
- 格式:ppt
- 大小:779.50 KB
- 文档页数:81
第二章统计数据的描述一、填空题:1.统计分组有等距分组与异距分组两大类。
2. 频率是每组数据出现的次数与全部次数之和的比值。
3. 统计分组的关键在于确定组数和组距。
4. 统计表从形式上看,主要由表头(总标题)、横行标题、纵栏标题和数字资料(指标数值)四部分组成。
5. 均值是测度集中趋势最主要的测度指标,标准差是测度离散趋势最主要的测度指标。
6.当平均水平和计量单位不同时,需要用变异系数(离散系数)来测度数据之间的离散程度。
7.众数是一组数据中出现次数最多的变量值。
8.对于一组数据来说,四分位数有 3 个。
二、单项选择题:1. 次数是分配数列组成的基本要素之一,它是指( B )。
A、各组单位占总体单位的比重B、分布在各组的个体单位数C、数量标志在各组的划分D、以上都不对2. 某连续变量数列,其末组为600以上。
又如其邻近组的组中值为560,则末组的组中值为( D )。
A、620B、610C、630D、6403. 变量数列中各组频率的总和应该是( B )。
A、小于1B、等于1C、大于1D、不等于14. 某连续变量数列,其首组为500以下。
又如其邻近组的组中值为520,则首组的组中值为( C )。
A、460B、470C、480D、4905. 在下列两两组合的指标中,哪一组的两个指标完全不受极端数值的影响(D )A、算术平均数和调和平均数B、几何平均数和众数C、调和平均数和众数D、众数和中位数6. 在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距应取(D )A、9.3B、9C、6D、107. 一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差为5公斤;女生的平均体重是50公斤,标准差为5公斤.据此数据可以推断( B) 用变异系数算A、男生体重的差异较大B、女生体重的差异较大C、男生和女生的体重差异相同D、无法确定8. 某生产小组有9名工人,日产零件数分别为10,11,14,12,13,12,9,15,12.据此数据计算的结果是( A ) 众数12 中位数12 平均数12A、均值=中位数=众数B、众数>中位数>均值C、中位数>均值>众数D、均值>中位数>众数9. 按连续型变量分组,最后一组为开口组,下限值为2000。
统计学简答题参考答案统计学简答题参考答案第⼀章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是⼀门收集、整理、显⽰和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计⽅法来源于对统计数据的研究,⽬的也在于对统计数据的研究,离开了统计数据,统计⽅法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源。
答:统计数据来源于两个⽅⾯:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查⽅式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、⽹络等渠道获得。
3.简要说明抽样误差和⾮抽样误差。
答:统计调查误差可分为⾮抽样误差和抽样误差。
⾮抽样误差是由于调查过程中各环节⼯作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利⽤样本推断总体时所产⽣的误差,它是不可避免的,但可以控制的。
4.解释描述统计和推断统计的概念?(P5)答:描述统计是⽤图形、表格和概括性的数字对数据进⾏描述的统计⽅法。
推断统计是根据样本信息对总体进⾏估计、假设检验、预测或其他推断的统计⽅法。
第⼆章统计数据的描述1描述次数分配表的编制过程。
答:分⼆个步骤:(1)按照统计研究的⽬的,将数据按分组标志进⾏分组。
按品质标志进⾏分组时,可将其每个具体的表现作为⼀个组,或者⼏个表现合并成⼀个组,这取决于分组的粗细。
按数量标志进⾏分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为⼀个组;组距式分组将变量的取值范围(区间)作为⼀个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2. ⼀组数据的分布特征可以从哪⼏个⽅⾯进⾏测度?答:数据分布特征⼀般可从集中趋势、离散程度、偏态和峰度⼏⽅⾯来测度。
常⽤的指标有均值、中位数、众数、极差、⽅差、标准差、离散系数、偏态系数和峰度系数。
3.怎样理解均值在统计中的地位?答:均值是对所有数据平均后计算的⼀般⽔平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的⼀种反映,在统计推断中显⽰出优良特性,由此均值在统计中起到⾮常重要的基础地位。
第2章统计数据的描述●9.某百货公司6月份各天的销售额数据如下单位万元257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 1计算该百货公司日销售额的均值、中位数和四分位数2计算日销售额的标准差。
解1将全部30个数据输入Excel表中同列点击列标得到30个数据的总和为8223 于是得该百货公司日销售额的均值见Excel练习题2.9 xxn822330274.1万元或点选单元格后点击“自动求和”→“平均值”在函数EVERAGE 的空格中输入“A1A30”回车得到均值也为274.1。
在Excel表中将30个数据重新排序则中位数位于30个数据的中间位置即靠中的第15、第16两个数272和273的平均数Me2722732272.5万元由于中位数位于第15个数靠上半位的位置上所以前四分位数位于第1第15个数据的中间位置第8位靠上四分之一的位置上由重新排序后的Excel 表中第8位是261第15位是272从而QL2612732724261.25万元同理后四分位数位于第16第30个数据的中间位置第23位靠下四分之一的位置上由重新排序后的Excel表中第23位是291第16位是273从而QU2912732724290.75万元。
2未分组数据的标准差计算公式为s30211iixxn 利用上公式代入数据计算是个较为复杂的工作。
手工计算时须计算30个数据的离差平方并将其求和再代入公式计算其结果得s21.1742。
见Excel练习题2.9 我们可以利用Excel表直接计算标准差点选数据列A列的最末空格再点击菜单栏中“∑”符号右边的小三角“▼”选择“其它函数”→选择函数“STDEV”→“确定”在出现的函数参数窗口中的Number1右边的空栏中输入A1:A30→“确定”即在A列最末空格中出现数值21.17412即为这30个数据的标准差。
第二章统计数据的描述一、单项选择题1.下列中,最粗略、计量层次最低的计量尺度是()A.间隔尺度B.顺序尺度C.比例尺度D.列名尺度2.将全国人口按“民族”划分为汉、白、彝、回、藏…..,这里使用的计量尺度是()A.比例尺度B.列名尺度C.间隔尺度D.顺序尺度3.某个人对某一事物的态度可以划分为非常同意、同意、保持中立、不同意、非常不同意,这里使用的计量尺度是()A.列名尺度B.间隔尺度C.顺序尺度D.比例尺度4.下列中,计量层次的最高、最精确的计量尺度是()A.比例尺度B.间隔尺度C.顺序尺度D.列名尺度5.下列调查方式中,只能调查一些最基本、最一般现象的调查方式是()A.抽样调查B.重点调查和典型调查C.统计报表D.普查6.实际中应用最为广泛的一种调查方式是()A.重点调查B.统计报表C.普查D.抽样调查7.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是()A.抽样调查B.典型调查C.重点调查D.普查8.一次性调查是指()A.只做过一次的调查B.调查一次以后不再调查C.间隔一段时间在进行一次调查D.只隔一年就进行一次的调查9.在统计分析中,对累积的次数分配用得最直接的是()A.供给曲线B.需求曲线C.洛伦茨曲线D.边际需求曲线10.专门用来衡量和反映收入分配平均程度的统计指标是()A.基尼系数B.可决系数C.相关系数D.离散系数11.一般认为,基尼系数在()之间是比较恰当的。
A.0.1— —0.4 C.— —0..812.一般认为,基尼系数等于( )是收入分配不公平的警戒线。
A.0.2B.0.6C. 利用公式计算众数的基本假定之一是众数组的频数在该组内呈( )A.正态分布 分布 C.均匀分布 D.偏态分布14.计算中位数时,假定中位数所在组的频数在该组内呈( )A.左偏分布B.正态分布C.右偏分布D.均匀分布15.反映数据分布集中趋势的最主要的测度值是( )A.众数B.中位数C.均值D.几何平均数16.各个变量值与均值的离差之和( )A.大于0B.小于0C.等于0D.等于一个不为0的常数17.各个变量值与均值的离差平方和( )A.为最大B.为最小C.为0D.为一个不为0的常数18.下列中,专门用来衡量众数代表性大小的离散程度测度值是( )A.异众比率B.四分位差C.方差或标准差D.极差19.下列中,专门用来衡量中位数代表性大小的离散程度测度值是( )A.方差和标准差B.内距C.异众比率D.平均差20.下列中,适用于列名数据的集中趋势测度值是( )A.众数B.中位数C.均值D.几何均值21.描述数据离散程度最简单的测度值是( )A.平均差B.方差和标准差C.极差D.四分位差22.经验法则表明,当一组数据呈对称分布时,大约有95%的数据在( )范围之内。
第二章统计数据的描述统计整理:是根据统计研究任务的要求,对调查所搜集到的原始资料进行审核、分组、汇总、编表,使其条理化、系统化的工作过程。
统计整理的内容:审核、分组、汇总、编表数据整理的原则:目的性、联系性、简明性2.1.1统计分组一、统计分组:根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。
基本要求组内的单位性质相同组间的单位性质相异二、统计分组种类类型分组的目的是划分现象类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。
简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。
品质分组是将总体按品质标志进行分组,变量分组是将总体按数量标志进行分组三、统计分组方法1、品质分组方法品质分组是将总体按品质标志进行分组.品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。
有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。
2、数量标志(变量)分组方法按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。
变量分组方法从以下几个方面说明:(1)单项式分组:以一个变量值代表一组。
如居民家庭按儿童数或人口数分组,这种分组适用于离散性变量且变量值的个数较少情况。
(2)组距式分组:以变量值变动的一个区间作为一组,并且把区间的距离称为组距。
这种分组适用于连续型变量,也适用于离散型变量的变量值个数较多的情况。
组距式分组步骤: 第一步、将原始资料排序并计算全距R第二步、确定组数第三步、确定组距(max-min)/K第四步、确定组限第五步、整理成表全距R =最大值—最小值组距i = 每组中最大变量值与最小变量值之间的距离或差数。
组限= 各组最大的变量值称为上限,最小的变量值称为下限,确定组限的方法有两种:间断式确定组限和重叠式确定组限。
第二章统计数据的描述在对一组统计数据的分布变化进行深入研究之前,我们首先研究一组数据的特征。
为了比较精确地描述一组统计资料的特征,需要使用一些统计指标来描述它。
一组数据的统计特征通常包括以下四个方面:1、集中趋势,也称作中心位置。
即表示一组数据的中心位置的数据点是在什么地方,也就是数据位置的度量。
2、离散性。
即一组数据的分散程度,也就是数据散布的范围。
3、倾斜度。
一组数据所描述的曲线既可以是左右对称的,也可能是倾斜的,即通过曲线最高点的垂线把曲线分为两半,是左右对称还是并不对称。
4、尖削度。
这就是一组数据所描绘的曲线顶部的峰态特征。
根据一组数据所描绘的曲线顶部既可能是尖峰状的,也可能是扁平状的。
即使根据两组数据所描绘的曲线具有相同的中心位置和离散程度,但它们的尖削度也可能是不一样的。
在管理科学中,我们最感兴趣的常常是数据的集中趋势和离散程度,本章就主要介绍度量这两个特征的统计量。
第一节数据集中趋势的度量一组数据的集中趋势通常用平均数、中位数和众数等来表示。
这些统计量均称为平均指标。
它表明同类社会经济现象的各单位的某一数量指标在一定时间、地点等条件下达到的平均水平。
平均指标的特点是将一组数据中各个数据之间的差异抽象化,用一个指标来代表各个数据的一般水平,它反映了一组数据中各个数据的典型水平、中心位置或集中趋势。
一、平均数管理统计中常用的平均数有算术平均数、调和平均数和几何平均数等几种。
但这里我们主要介绍算术平均数。
算术平均数又称均值,常用x来表示。
根据计算方法的不同,算术平均数又可分为简单算术平均数和加权算术平均数。
1、简单算术平均数简单算术平均数的计算公式如下:xx x xNxNNiiN =+++==∑121式中:N 是数据的个数;2122x i 是各数据的观察值。
2、加权算术平均数如一组数据是已经经过分组的,共有N 组。
x i 为各相应组中数据的观察值或每一组的中心值,f i 是观察值为x i 的相应组中数据出现的次数,又称为频率,则可以采用加权平均法来计算其均值,其公式为x x f x f x f f f f xf fN NNiii Nii N =++++++===∑∑11221211式中:x i 是各相应组中数据的观察值;f i 是观察值为x i 的相应组中数据出现的次数,又称为频率; N 是组数。
第二章统计数据的描述【说明】(一)统计数据的分类、表达形式1.按数据的计量尺度不同划分•分类数据---列名尺度、定类尺度、名义尺度的计量结果对事物进行分类的结果,数据表现为类别,用文字来表述⏹表现为类别,用文字来表述⏹•顺序数据----定序尺度的计量结果对事物类别顺序的测度⏹数值型数据----定距尺度、定比尺度的计量结果⏹对事物的精确测度⏹结果表现为具体的数值⏹2.按采集方法划分1、观测数据(observational data)2、试验数据(experimental data)3.按时间状况划分•截面数据(cross-sectional data)在相同或者近似相同的时间点上采集的数据⏹描述现象在某一时刻的变化情况⏹•时间序列数据(time series data)在不同时间上采集到的数据⏹描述现象随时间变化的情况⏹(二)数据的表现形式绝对数按其所反映的时间状况不同,划分为:时期数、时点数⏹(计量单位有实物单位、价值单位、复合单位)相对数包括:比例(Proportion)、比率(Ratio)⏹(计量单位有百分比、千分比)统计数据的描述过程一、第一个环节——统计数据的搜集(一)统计数据的来源(渠道)(二)统计数据的搜集方式、方法(三)统计数据的质量要求(评价标准)1. 精度:最低的抽样误差或者随机误差2. 准确性:最小的非抽样误差或者偏差3. 关联性:满足用户决策、管理和研究的需要4. 及时性:在最短的时间里取得并发布数据5. 一致性:保持时间序列的可比性6. 最低成本:以最经济的方式取得数据二、第二个环节——统计数据的整理【重点】数据的整理与显示的基本原则:要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的;•对分类数据和顺序数据主要是进行分类整理;•对数值型数据则主要是进行分组整理;•适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据。