第二章统计数据的描述方案
- 格式:ppt
- 大小:2.02 MB
- 文档页数:98
第2章统计数据的描述练习:2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
2.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
2.3某百货公司连续40天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
第2章统计数据的描述●9.某百货公司6月份各天的销售额数据如下(单位:万元):257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。
解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值:(见Excel练习题2.9)x=xn∑=822330=274.1(万元)或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。
在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:M e=2722732+=272.5(万元)由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而:Q L=261+2732724-=261.25(万元)同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:Q U=291-2732724-=290.75(万元)。
(2)未分组数据的标准差计算公式为:s =302 1()1iix xn=--∑利用上公式代入数据计算是个较为复杂的工作。
手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。
(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。
统计数据的描述与分析统计数据在各个领域中起着重要的作用,能够客观地反映事物的发展、变化和趋势。
本文将探讨统计数据的描述与分析方法,以及其在决策制定、研究分析和问题解决过程中的应用。
一、统计数据的描述统计数据的描述是对收集到的数据进行整理和概括,以便更好地了解数据的特征和规律。
常用的统计数据描述方法包括:1. 描述性统计量:包括均值、中位数、众数、方差、标准差等,用于衡量数据的集中趋势和离散程度。
2. 频数分布表:将数据按一定规则进行分类,并统计每个分类的频数,进而绘制出频数分布表或直方图,有助于直观地了解数据的分布情况。
3. 百分位数:用于描述数据中某个特定位置的值,如四分位数、中位数等,可以帮助判断数据的分布形态。
二、统计数据的分析统计数据的分析是对数据进行深入研究和解读,从中提取有价值的信息。
以下是常见的统计数据分析方法:1. 相关分析:通过计算相关系数,分析不同变量之间的关系强度和方向,了解它们之间的相关性。
2. 回归分析:通过建立数学模型,探究自变量对因变量的影响程度,进而预测和解释变量之间的关系。
3. 方差分析:用于比较不同组之间的均值差异是否显著,可用于分析实验结果的有效性及因素之间的影响。
4. 时间序列分析:用于分析时间相关的数据,了解其趋势、周期和季节性变化,并预测未来的发展趋势。
5. 群组分析:将数据按照某种特征进行分组,比较不同组之间的差异,发现隐藏的规律和特点。
三、统计数据的应用统计数据在实际应用中有着广泛的用途,主要包括以下几个方面:1. 决策制定:管理者可以利用统计数据进行决策分析,评估不同方案的风险和潜力,帮助做出科学合理的决策。
2. 研究分析:研究人员可以利用统计数据进行实证研究,验证假设并获取结论,推动学科进步和科学发展。
3. 问题解决:统计数据可用于解决各种实际问题,如市场调研、质量控制、资源管理等,提供决策依据和参考。
4. 趋势预测:通过对历史数据的分析,可以发现并预测未来的发展趋势,为政府、企业等提供发展战略和规划方向。
医学统计学简答题第二章定量数据的统计描述1.变异系数与标准差的区别标准差使用的度量衡单位与原始数据相同,在两组数据均数相差不大,单位也相同时,从标准差的大小就可以直接比较两样本的变异程度。
但是有时我们需要对均数相差较大或单位不同的几组观测值的变异程度进行比较,标准差不再适宜,这时就应该使用变异系数了。
2.集中趋势和离散趋势的指标及适用范围(1)集中趋势:算术均数、几何均数、中位数,统称平均数,均反映集中趋势。
算术均数:主要适用于对称分布,尤其适合正态分布资料。
几何均数:应用于对数正态分布,也可应用于呈倍数关系的等比资料。
在医院中主要用于抗原(体)滴度资料。
中位数:适合条件:a.极偏态资料。
b.有不确定的数据(有>或<)。
c.有特大值或特小值。
d.分布不明的资料。
(2)离散趋势:极差、四分位数间距、方差和标准差、变异系数均反映离散趋势极差:除了两端有不确定数据之外,均可计算极差。
四分位间距:用于描述偏态分布资料。
方差和标准差:用于描述正态分布计量资料的离散程度。
变异系数:a.均数相差较大。
b.单位不同。
3.简述变异系数的实用时机变异系数适用于变量单位不同或均数差别较大时,直接比较无可比性,适用变异系数比较。
4.怎样正确描述一组计量资料(1)根据分布类型选择指标(2)正态分布资料选用均数与标准差,对数正态分布资料选用几何均数,一般偏态分布资料选用中位数与四分位数间距。
5.标准差与标准误的联系和区别有哪些?区别:(1)概念不同:标准差是描述观察值(个体值)之间的变异程度,S越小,均数的代表性越好;标准误是描述样本均数的抽样误差,标准误越小,均数的可靠性越高。
(2)用途不同:标准差与均数结合估计参考值范围。
(3)计算含量的关系不同:当样本含量n足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0。
联系:标准差、标准误均为变异指标,当样本含量不变是,标准误与标准差成正比。
6.正态分布的主要特征(1)正态曲线在横轴上方均数处最高,即频数最大(2)正态分布以均数为中心,左右对称,无限接近于x轴(3)曲线与横轴所围面积为1。
第二章统计数据的描述统计整理:是根据统计研究任务的要求,对调查所搜集到的原始资料进行审核、分组、汇总、编表,使其条理化、系统化的工作过程。
统计整理的内容:审核、分组、汇总、编表数据整理的原则:目的性、联系性、简明性2.1.1统计分组一、统计分组:根据研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分。
基本要求组内的单位性质相同组间的单位性质相异二、统计分组种类类型分组的目的是划分现象类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。
简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。
品质分组是将总体按品质标志进行分组,变量分组是将总体按数量标志进行分组三、统计分组方法1、品质分组方法品质分组是将总体按品质标志进行分组.品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。
有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。
2、数量标志(变量)分组方法按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。
变量分组方法从以下几个方面说明:(1)单项式分组:以一个变量值代表一组。
如居民家庭按儿童数或人口数分组,这种分组适用于离散性变量且变量值的个数较少情况。
(2)组距式分组:以变量值变动的一个区间作为一组,并且把区间的距离称为组距。
这种分组适用于连续型变量,也适用于离散型变量的变量值个数较多的情况。
组距式分组步骤: 第一步、将原始资料排序并计算全距R第二步、确定组数第三步、确定组距(max-min)/K第四步、确定组限第五步、整理成表全距R =最大值—最小值组距i = 每组中最大变量值与最小变量值之间的距离或差数。
组限= 各组最大的变量值称为上限,最小的变量值称为下限,确定组限的方法有两种:间断式确定组限和重叠式确定组限。