2-统计数据的描述
- 格式:pptx
- 大小:1.28 MB
- 文档页数:87
附录1:各章练习题答案第1章绪论(略)第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 4610.015.035~40 40~45 45~50 159637.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
一、实训背景随着我国经济的快速发展,统计数据在政府决策、企业管理和学术研究等方面发挥着越来越重要的作用。
为了提高我们对统计数据的理解和应用能力,本次实训旨在通过实际操作,学习如何对统计数据进行分析、描述和解释。
二、实训目的1. 掌握统计数据的收集、整理和描述方法;2. 熟悉常用的统计图表和统计指标;3. 培养对统计数据的分析和解释能力;4. 提高运用统计方法解决实际问题的能力。
三、实训内容1. 统计数据的收集本次实训以某地区2019年居民消费水平调查数据为例,通过查阅相关资料和实际调查,收集到以下数据:(1)居民消费水平(元/年)(2)居民收入水平(元/年)(3)居民教育程度(4)居民年龄2. 统计数据的整理对收集到的数据进行整理,主要包括以下几个方面:(1)对数据进行分类和分组,以便更好地分析;(2)计算各组的频数、频率和众数;(3)计算平均值、中位数、极差和标准差等统计指标。
3. 统计数据的描述(1)绘制统计图表根据整理后的数据,绘制以下统计图表:①居民消费水平分布图②居民收入水平分布图③居民教育程度分布图④居民年龄分布图(2)计算统计指标①计算居民消费水平、收入水平、教育程度和年龄的平均值、中位数、极差和标准差;②计算居民消费水平与收入水平的相关系数。
4. 统计数据的分析(1)分析居民消费水平与收入水平的关系;(2)分析居民教育程度与消费水平的关系;(3)分析居民年龄与消费水平的关系。
四、实训结果与分析1. 居民消费水平与收入水平的关系通过相关系数计算,得出居民消费水平与收入水平的相关系数为0.85,说明两者之间存在较强的正相关关系。
即收入水平越高,消费水平也越高。
2. 居民教育程度与消费水平的关系从居民教育程度分布图可以看出,高教育程度的居民在消费水平上普遍较高。
这说明教育程度对消费水平有一定的影响。
3. 居民年龄与消费水平的关系通过分析居民年龄分布图和消费水平分布图,可以得出以下结论:(1)青年群体(18-35岁)消费水平较高,这与他们的收入水平和消费观念有关;(2)中年群体(36-55岁)消费水平相对稳定,这与他们的生活需求和消费能力有关;(3)老年群体(56岁以上)消费水平相对较低,这与他们的收入水平和消费观念有关。
统计数据的描述在我们的日常生活和工作中,统计数据无处不在。
从市场调研的销售数据,到医学研究中的患者症状统计,再到学校里的学生成绩分析,统计数据为我们提供了宝贵的信息,帮助我们做出更明智的决策。
然而,要真正理解和利用这些数据,首先需要学会对其进行准确的描述。
那么,什么是统计数据的描述呢?简单来说,就是用一些特定的方法和指标,将一堆看似杂乱无章的数据转化为有意义、易于理解和分析的形式。
这就像是给一堆未经雕琢的原石进行打磨和雕琢,让它们展现出内在的价值和美丽。
描述统计数据时,最常用的方法之一就是使用集中趋势的度量指标。
这包括平均数、中位数和众数。
平均数,大家应该都很熟悉,就是将所有数据相加,然后除以数据的个数。
比如说,一个班级里 5 名学生的考试成绩分别是 80 分、90 分、85 分、75 分和 95 分,那么他们的平均成绩就是(80 + 90 + 85 + 75 + 95)÷ 5 = 85 分。
平均数能够反映出数据的总体水平,但它也有一个缺点,就是容易受到极端值的影响。
比如,如果这 5 名学生中,有一个人的成绩是 20 分,那么平均成绩就会被拉低很多。
这时候,中位数就派上用场了。
中位数是将数据按照从小到大或从大到小的顺序排列后,位于中间位置的那个数。
如果数据的个数是奇数,那么中位数就是中间的那个数;如果数据的个数是偶数,那么中位数就是中间两个数的平均值。
继续上面的例子,将成绩从小到大排列为 75 分、80 分、85 分、90 分、95 分,中间的数是 85 分,所以中位数就是 85 分。
即使有极端值,中位数也不会受到太大影响,它更能反映数据的中间水平。
众数则是数据中出现次数最多的那个值。
比如在一组数据 1, 2, 2, 3, 3, 3, 4 中,众数就是 3,因为 3 出现的次数最多。
众数可以帮助我们了解数据中最常见的情况。
除了集中趋势,数据的离散程度也是描述统计数据的重要方面。
离散程度反映了数据的分布范围和波动情况。
第2章统计数据的描述练习:2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
2.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
2.3某百货公司连续40天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
第二章统计数据的描述一、单项选择题1.下列中,最粗略、计量层次最低的计量尺度是()A.间隔尺度B.顺序尺度C.比例尺度D.列名尺度2.将全国人口按“民族”划分为汉、白、彝、回、藏…..,这里使用的计量尺度是()A.比例尺度B.列名尺度C.间隔尺度D.顺序尺度3.某个人对某一事物的态度可以划分为非常同意、同意、保持中立、不同意、非常不同意,这里使用的计量尺度是()A.列名尺度B.间隔尺度C.顺序尺度D.比例尺度4.下列中,计量层次的最高、最精确的计量尺度是()A.比例尺度B.间隔尺度C.顺序尺度D.列名尺度5.下列调查方式中,只能调查一些最基本、最一般现象的调查方式是()A.抽样调查B.重点调查和典型调查C.统计报表D.普查6.实际中应用最为广泛的一种调查方式是()A.重点调查B.统计报表C.普查D.抽样调查7.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是()A.抽样调查B.典型调查C.重点调查D.普查8.一次性调查是指()A.只做过一次的调查B.调查一次以后不再调查C.间隔一段时间在进行一次调查D.只隔一年就进行一次的调查9.在统计分析中,对累积的次数分配用得最直接的是()A.供给曲线B.需求曲线C.洛伦茨曲线D.边际需求曲线10.专门用来衡量和反映收入分配平均程度的统计指标是()A.基尼系数B.可决系数C.相关系数D.离散系数11.一般认为,基尼系数在()之间是比较恰当的。
A.0.1—0.2B.0.2—0.4C.0.4—0.6D.0.6—0..812.一般认为,基尼系数等于()是收入分配不公平的警戒线。
A.0.2B.0.6C.0.4D.0.813.利用公式计算众数的基本假定之一是众数组的频数在该组内呈()A.正态分布B.t分布C.均匀分布D.偏态分布14.计算中位数时,假定中位数所在组的频数在该组内呈()A.左偏分布B.正态分布C.右偏分布D.均匀分布15.反映数据分布集中趋势的最主要的测度值是()A.众数B.中位数C.均值D.几何平均数16.各个变量值与均值的离差之和()A.大于0B.小于0C.等于0D.等于一个不为0的常数17.各个变量值与均值的离差平方和()A.为最大B.为最小C.为0D.为一个不为0的常数18.下列中,专门用来衡量众数代表性大小的离散程度测度值是()A.异众比率B.四分位差C.方差或标准差D.极差19.下列中,专门用来衡量中位数代表性大小的离散程度测度值是()A.方差和标准差B.内距C.异众比率D.平均差20.下列中,适用于列名数据的集中趋势测度值是( )A.众数B.中位数C.均值D.几何均值21.描述数据离散程度最简单的测度值是( )A.平均差B.方差和标准差C.极差D.四分位差22.经验法则表明,当一组数据呈对称分布时,大约有95%的数据在( )范围之内。
实习二统计描述第164~180页实习二统计描述医学统计资料类型¾数值变量资料:又称为计量资料。
变量值是定量的,有单位的,表示为数值的大小。
¾无序分类资料:又称为计数资料。
变量值是定性的,没有单位,表示为相互独立的类别。
¾有序分类资料:又称为等级资料。
变量值是定性的,没有单位,各类别具有程度上的差异。
注:不同类型的资料,统计方法不同;各种类型的资料之间是可以相互转化的。
一、数值变量资料的统计描述统计描述包括两个方面:集中趋势的描述和离散趋势的描述一、数值变量资料的统计描述(一)数值变量资料的频数表频数表(frequency table):当变量值或者观测值较多时,将变量值分为适当的组段,统计各组段中相应的频数(或者人数),以描述数值变量资料的分布特征和分布类型。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途1.描述数值变量资料的分布特征集中趋势(central tendency):频数最多的组段代表了中心位置(平均水平),从两侧到中心,频数分布是逐渐增加的。
离散趋势(tendency of dispersion):从中心到两侧,频数分布是逐渐减少的。
反映了数据的离散程度或者变异程度。
一、数值变量资料的统计描述(一)数值变量资料的频数表频数表的用途2.描述数值变量资料的分布类型正态分布:集中位置居中,左右两侧频数基本对称。
常见近似正态分布。
偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布:集中位置偏向数值小的一侧或者左侧,有较长的右尾部。
负偏态分布:集中位置偏向数值大的一侧或者右侧,有较长的左尾部。
一、数值变量资料的统计描述(二)数值变量资料的频数分布图及正态曲线直方图及近似正态分布直方图及正偏态分布(二)数值变量资料的频数分布图及正态曲线一、数值变量资料的统计描述(三)集中趋势指标描述1.算数均数(均数mean )适用于正态分布或者近似正态分布总体均数:µ;样本均数:一、数值变量资料的统计描述一、数值变量资料的统计描述(三)集中趋势指标描述2.几何均数(geometric mean,G)适用于一种特殊的偏态分布资料:等比资料(常见于抗体滴度)。