统计学教案:离中趋势的代表值——极差、标准差
- 格式:doc
- 大小:160.00 KB
- 文档页数:8
统计学(B)一、单项选择题(每题2分,共20分)1、统计学自身的发展,沿着两个不同的方向,形成()A、描述统计学与理论统计学B、理论统计学与推断统计学C、理论统计学与应用统计学D、描述统计学与推断统计学2、某地区为了掌握地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是()A普查B典型调查C抽样调查D重点调查3、用组中值与次数求坐标点连接而成的统计图是()A直方图B条形图C曲线图D折线图4、离中趋势指标中,最容易受极端值影响的是()A极差B平均差C标准差D标准差系数5、一组数据的偏态系数为1.3,表明该组数据的分布是()A正态分布B平顶分布C左偏分布D右偏分布6、抽样平均误差说明抽样指标与总体指标之间的()A实际误差B平均误差C实际误差的平方D允许误差7、假设检验是检验()的假设是否成立。
A样本方差B总体指标C样本方差D样本平均数8、用组中值代表组内变量值的一般水平有一定的假定性,即()A、各组的次数必须相等B、变量值在本组内的分布是均匀的C、组中值能取整数D、各组必须是封闭组9、总体平均数的假设检验方法,在小样本,且方差未知时,通常采用()A、Z检验法B、t检验法C、2χ检验法D、F检验法10、年劳动生产率x(千元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均()A、增加70元B、减少70元C、增加80元D、减少80元二、多项选择题(每题2分,共10分)1、概率抽样调查()A、是一种非全面调查B、其目的是根据抽样结果推断总体数量特征C、它具有经济性、时效性、准确性和灵活性等特点D、其调查单位是随机抽取的E、抽样推断的结果往往缺乏可靠性2、常用的样本指标有()A样本平均数B样本成数C抽样误差D样本方差E标准差3、在什么条件下,加权算术平均数等于简单算术平均数()。
A、各组次数相等B、各组变量值不等C、变量数列为组距数列D、各组次数都为1E、各组次数占总次数的比重相等国人口总量之比4、总体平均数的假设检验方法通常有()A、Z检验法B、t检验法C、2χ检验法D、F检验法E、几何检验法5、中位数是()A由标志值在变量数列中所处的位置决定的B根据标志值出现的次数决定的C总体单位水平的平均值D总体一般水平的代表值E不受总体中极端数值的影响三、填空题(每空2分,共20分)1、一个完整的统计工作过程可以划分为_____、____、_____、_______四个阶段。
极差方差标准差极差、方差和标准差是统计学中常用的三种测量数据离散程度的方法,它们在数据分析和研究中起着重要的作用。
本文将分别介绍极差、方差和标准差的概念、计算方法和应用场景,帮助读者更好地理解和运用这三种统计指标。
首先,我们来介绍极差。
极差是用来衡量数据的离散程度的指标,它是一组数据中最大值和最小值之间的差值。
计算极差的方法非常简单,只需将数据中的最大值和最小值相减即可得到极差。
例如,对于一组数据{3, 5, 7, 9, 11},最大值为11,最小值为3,因此极差为11-3=8。
极差越大,说明数据的波动范围越大,反之则波动范围较小。
在实际应用中,极差常常用来描述一组数据的波动情况,例如股票价格的波动范围、温度的变化范围等。
接下来,让我们来了解方差。
方差是描述一组数据离散程度的统计量,它衡量的是每个数据点与数据集平均值的偏离程度。
方差的计算方法是将每个数据点与平均值的差的平方求和,然后除以数据点的个数。
简单来说,方差就是数据偏离平均值的程度的平均值。
方差越大,说明数据点偏离平均值的程度越大,数据的波动性也就越大。
在实际应用中,方差常用来衡量一组数据的稳定性和可靠性,例如在金融领域中用来衡量投资组合的风险。
最后,让我们来介绍标准差。
标准差是方差的平方根,它是描述一组数据离散程度的常用指标。
标准差可以帮助我们更直观地理解数据的波动情况,因为它的数值与原始数据的单位保持一致。
计算标准差的方法是先计算方差,然后将方差的平方根作为标准差。
标准差越大,说明数据的波动范围越大,反之则波动范围较小。
在实际应用中,标准差常用来衡量一组数据的稳定性和可靠性,例如在质量控制中用来衡量产品质量的稳定性。
综上所述,极差、方差和标准差是统计学中常用的三种测量数据离散程度的方法,它们分别从不同角度描述了数据的波动情况。
通过对这三种指标的理解和应用,我们可以更好地分析和理解数据,为决策提供有力的支持。
希望本文能够帮助读者更好地掌握极差、方差和标准差的概念和应用,提升数据分析能力。
【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
第三章统计分布的数值特征只知道什么是统计分布是不够的,还必须学会对其进行量化描述。
描述统计分布的重要的特征值有两个,一个是说明其集中趋势的平均指标,另一个是说明其离散程度的变异指标。
这一对矛盾的指标分别从不同角度反映了统计分布的分布特点,它们相辅相成,相互补充,缺一不可。
本章着重就这两个指标展开讨论,介绍了它们的理论、方法与应用,充分理解掌握本章的内容,对于以后各章节的学习尤为重要。
本章的目的与要求通过本章学习,要求学生在了解总体分布的两个重要特征值就是平均指标与变异指标的前提下,着重掌握这两个指标的计算方法及其数学性质;明确反映集中趋势的各种平均指标的计算特点与作用、反映离散程度的各种变异指标的计算特点与作用;还要学会利用这两个特征值得各自数学性质,采用简捷法计算算术平均数和标准差,以提高计算效率;此外,算术、调和与几何平均数三者之间的关系,算术平均数与众数、中位数之间的关系等也是学生应充分理解掌握的内容。
本章主要内容(计划学时7 )一、分布的集中趋势(1)——数值平均数1、算术平均数2、调和平均数3、几何平均数二、分布的集中趋势(2)——位置平均数1、众数2、中位数3、其他分位数三、分布的离中趋势——变异指标1、变异全距2、平均差3、标准差4、变异系数学习重点一、重点掌握各种平均数的特点、应用条件、应用范围和计算方法,及其相互之间的关系;二、了解变异指标的意义和作用,熟练掌握各种变异指标的计算方法,尤其应重点掌握标准差的计算与应用;三、理解掌握算术平均数与标准差的数学性质,并且能利用其数学性质进行简捷计算;四、明确平均指标与变异指标的相互关系及其运用原则。
学习难点一、各种平均指标的应用条件、运用范围,尤其是加权算术权数的选择;二、根据所掌握的资料,应选择算术平均或调和平均方法;三、标准差的理论依据及其计算方法,尤其是成数标准差的计算更是初学者不易掌握的问题。
第一节 分布的集中趋势(1)——数值平均数一、统计平均数1、反映总体分布的集中趋势2、反映统计数列所达到的一般水平(静态、动态)3、与强度相对数的区别 二、算术平均数(用A x 表示) (一)算术平均数的基本内容: 算术平均数=总体单位总量总体标志总量(二)简单算术平均数nxnx x x x ni inA ∑==+++=121可简写为:nx x A∑=式中: x i 为变量值 n 是总体单位数 Σ为总和符号例3-1.1 从某味精厂的生产线上随机抽取了10包味精,测得每包净重分别为(单位:克)499 497 501 499 502 503 500 499 498 500 将此十个数据相加除以十就是算术平均数(结果为499.8克)。
第三章 数据分布特征的度量第一节 一.集中趋势 (一)概念:指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是要寻找数据一般水平的代表值或中心值。
(二)特点:1.集中趋势测度值是一个代表性值,表示被研究总体的一般水平(数据的共性)2.平均数把被研究总体的数量标志值在各个单位之间的数量差异抽象化了 (三)作用:1.利用集中趋势测度值对比不同总体的一般水平2.利用集中趋势测度值比较.反映同一单位某一标志不同时期一般水平的发展变化,说明事物的发展过程和变化趋势3.利用集中趋势测度值分析现象之间的相互关系,并推算其它有关的指标。
(四)度量Ⅰ.数值均值(μ) 1.算术均值 (1)特点:①集中趋势的最常用测度值 ②一组数据的均衡点所在 ③体现了数据的必然性特征 ④易受极端值的影响 (2)数学性质:①数值观测值与算术均值的离差之和等于0 ∑=-0)(μx 或 ∑=-0)(f x μ ②数值观测值与算术均值的离差平方和最小∑=-min )(2μx 或∑=-min )(2f x μ③均值易受极端值的影响2.调和均值(H ) (1)特点:①调和均值是各个变量值倒数的算术均值的倒数 ②易受极端值的影响3.几何均值(G)(1)特点:①适用于对比率数据的平均②主要用于计算平均速度Ⅱ.位置均值1.众数(M o)(1)概念:一组数据中出现次数最多的变量值,Mo表示(2)特点①众数的值与相邻两组频数的分布有关②用于数值型分组数据,适合于数据量较多时使用③不受极端值的影响④一组数据可能没有众数或有几个众数(不唯一性)2.中位数(M e)(1)概念:依据数据从小到大排序后,处于中间位置上的变量值,用Me表示(2)特点:①不受极端值影响②数据分布偏斜程度较大时应用绝对值之和为最小(中位数与各数据的距离之和最短)③各变量值与中位数的离差3.分位数(Q)(1)概念:是将全部数据排序后等分为若干个分位点,各分位点上的数值称为分位数(五)算术均值与众数和中位数的关系第二节数据离中程度的度量一.离散程度(一)概念:测量一组数据差异程度,反应频数分布数列中各个数据的变动范围或差异程度。
对统计数据的分布特征,主要从哪⼏个⽅⾯进⾏描述?
数据分布特征可以从集中趋势、离中趋势及分布形态三个⽅⾯进⾏描述。
1、平均指标是在反映总体的⼀般⽔平或分布的集中趋势的指标。
测定集中趋势的平均指标有两类:位置平均数和数值平均数。
位置平均数是根据变量值位置来确定的代表值,常⽤的有:众数、中位数。
数值平均数就是均值,它是对总体中的所有数据计算的平均值,⽤以反映所有数据的⼀般⽔平,常⽤的有算术平均数、调和平均数、⼏何平均数和幂平均数。
2、变异指标是⽤来刻画总体分布的变异状况或离散程度的指标。
测定离中趋势的指标有极差、平均差、四分位差、⽅差和标准差、以及离散系数等。
标准差是⽅差的平⽅根,即总体中各变量值与算术平均数的离差平⽅的算术平⽅根。
离散系数是根据各离散程度指标与其相应的算术平均数的⽐值。
3、矩、偏度和峰度是反映总体分布形态的指标。
矩是⽤来反映数据分布的形态特征,也称为动差。
偏度反映指数据分布不对称的⽅向和程度。
峰度反映是指数据分布图形的尖峭程度或峰凸程度。
【课题】离中趋势的代表值——极差、标准差
【教学目标】
知识目标:1.理解离中趋势统计描述的意义与平均指标和离散程度指标
二者的辩证关系。
2.掌握极差、标准差的计算和分析。
能力目标:1.能理解和掌握极差、标准差的计算过程。
2.能利用极差、标准差的计算结果,对研究总体的离中趋势进行应用分析。
【教学重点、难点】
(参考配套教学用书《统计基础知识教学参考书》P32)
教学重点:离中趋势统计描述的意义、标准差的计算和分析
教学难点:加权式标准差的计算和分析
演示法、讲授法、分组讨论法。
【课时安排】
4课时
【教学过程】
第一环节导入
上一节我们讨论了描述某一变量集中趋势代表值的方法,平均指标反映现象的集中趋势,反映现象的一般水平。
为了揭示标志值间的差异,从相反的角度来揭示现象的离中趋势,应计算标志变异指标,它是变量数量特征的另一个方面。
现在我们一起察看如下例题:
例1:我校04级电算化(1)班的两组同学的英语成绩组成的两个数列如下:甲数列:68 69 70 71 72, x=70分
乙数列:50 60 70 80 90, x=70分
绘制成线段图
[教师提问,学生讨论]
两组同学的英语平均成绩(x)=70分,但有区别吗?你们认为哪一组的标志值分散?哪一组的平均值(x)代表性高?为什么?
第二环节新授课
一、离中趋势统计描述的意义
从例1的计算结果显示得知:由于甲数列变量的离散程度小,说明其集中趋势强,其均值的代表性就高。
(一)离差
1.概念:离差是指同质中各个单位中的某种变量值与中心位置的差异。
2.算术平均数与离差的关系
算术平均数是测定集中趋势最常用的代表值,它的实质是把正负离差相互抵消后反映变量集中趋势的中心点的代表值。
例如:甲数列:68 69 70 71 72, x=70
离差:-2 -1 0 1 2
乙数列:50 60 70 80 90, x=70
离差:-20 -10 0 10 20
(二)离中趋势统计描述的具体作用:
(1)能够反映总体各单位标志值分布的离中趋势;
(2)是衡量平均数代表性的尺度;
(3)可以说明和比较社会经济现象的均衡、稳定和协调性的高低;
(4)是推断统计的重要依据。
二、离中趋势代表值的计算方法:
离散程度测度:极差、标准差、离散系数。
(一)极差
[演示]幻灯片
极差也称为全距(R),是变量分布中最大值与最小值之差。
它是描述变量离散状况最简单的测量值。
其基本计算公式是:
1.根据单项式数列计算极差,公式为:全距(R)=最大变量值-最小变量值2.根据组距数列计算极差,公式为:全距(R)=最高值组上限值-最低值组下限值
[教师举例讲解]
例如1:甲数列:68 69 70 71 72, x=70, R =72-68=4
乙数列:50 60 70 80 90, x=70, R=90-50=40
例如2:某车间40名工人日产量资料如表3-16所示。
表3-16 某车间40名工人日产量资料表
根据资料计算:R =100-50=50(件)
[分析]
用极差来评价变量离散状况是:极差值较小,说明变量值离散范围小,离
散程度也较小,变量值较集中,平均数的代表性较大;反之,极差值较大,说明变量值离散范围大,离散程度较大,变量值较分散,平均数的代表性较小。
因此甲数列均值的代表性高于乙数列。
[演示]幻灯片
(二)标准差
标准差是测定标志变动程度的主要指标。
标准差(σ)是总体单位各变量值与其平均数的离差平方的算术平均数的平方根。
标准差的计量单位与变量值的计量单位相同。
分为简单式标准差、加权式标准差。
(一)如果算术平均数是采用简单平均法计算的,则标准差也采用简单式。
其计算公式如下:
σ=
()
n
x x
∑-2
式中:σ——标准差。
[教师举例讲解]
例1:以甲、乙两个数列的例子来说明简单式标准差的计算方法。
表3-21 甲组日产量标准差计算表
表3-22 乙组日产量标准差计算表
(1) 705
350
1
==
=
∑=n
x
x n
i i
甲(件) (2)(
)
414.15
10
1
2
≈=
=
∑-=n
n
i i
x
x 甲
甲
σ(件) (3)705
350
1
==
=
∑=n
x
x n
i i
乙
(件) (4)(
)
14.145
1000
1
2
≈=
=
∑-=n
n
i i
x
x 乙
乙
σ(件) [分析]
计算结果表明,甲组标准差比乙组标准差小,所以甲组变量的离散程度比
乙组小,即甲组变量分布范围比乙组集中,甲组平均数的代表性大。
(二)如果算术平均数是采用加权平均法计算的,则标准差也就是加权式。
()
∑∑-==⋅=
n
i i
n
i i
f
f x
x 1
1
2
i σ
[教师举例讲解]
例: 某班组25名工人日产量分组资料如表3-19所示,试计算标准差。
表3-19 单项数列标准差计算表
x =
∑∑==n
i i
i
n
i i f
f
x 1
1=
25
400
=16(件) ()
∑∑-==⋅=
n
i i
n
i i
i
f
f x
x 11
2
σ=
2425
100
==(件)
表3-20 组距变量数列标准差计算表
==
=
∑∑==100
3100
1
1
n
i i
n
i i
i f
f
x x 31(千克) ()
∑∑-==⋅=
n
i i
n
i i
i
f
f x
x 11
2
σ=
100
4900
=7(千克) 第三环节 课堂练习.
计算题:配套习题集P46第24题,计算职工工资全距、标准差。
第四环节小结.
1.极差计算公式;
2.简单式标准差计算公式和计算过程
3.加权式标准差计算公式和计算过程
第五环节布置作业.:
使用配套《统计原理习题集》(第二版):
(1)P46第41题,计算职工工资全距、标准差。
(2)P47~48第43题,计算标准差。