统计学 第四章
- 格式:doc
- 大小:292.00 KB
- 文档页数:7
第四章 差异量教学目的:1.理解全距、四分位距、百分位距、平均差、方差、标准差和差异系数等概念;2.掌握各种差异量指标的计算方法。
数据的分布特征不仅有集中趋势,还有离中趋势。
以动态的眼光,从不同的角度看,数据是向中间变动的,也是向两端变动的。
两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。
【如】:比较下列两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。
即A 组较集中,B 组较分散。
因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。
差异量:表示一组数据的离中趋势或变异程度的量称为差异量。
常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差和差异系数。
第一节全距、四分位距、百分位距一、全距全距:是一组数距中最大值与最小值之差。
优点:意义明确,计算方便。
缺点:反应不灵敏,易受极端值影响。
二、四分位距(一)四分位距的的概念四分位距:是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。
)(1.4213Q Q QD -=QD :表示四分位距; Q 3:表示第三四分位数;Q 1:表示第一四分位数。
所以:四分位距的公式又为:22575P P QD -=(二)四分位数的计算方法 1、原始数据计算法(1)将数据由小到大进行排列; (2)分别求出三位四分位数(点); (3)代入公式计算。
【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:(1)先将原始数据从小到大排列好;12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40Q 1=18 Md =27 Q 3=34(2)求出Q 1、Md 、Q 3;(3)将Q 1、Md 、Q 3的得数代入公式(4.1)。
第四章统计综合指标(一)(一)填空题1、总量指标是反映社会经济现象的统计指标,其表现形式为绝对数。
2、总量指标按其反映总体的内容不同,分为总体的标志总量和总体单位总量;按其反映的时间状况不同,分为时期结构和时点结构.反映总体在某一时刻(瞬间)上状况的总量指标称为时点结构 ,反映总体在一段时期内活动过程的总量指标称为时期结构.3、相对指标的数值有两种表现形式,一是有名数,二是无名数。
4、某企业中,女职工人数与男职工人数之比为1:3,即女职工占25%,则1:3属于比例相对数,25%属于结构相对数。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、银行系统的年末储蓄存款余额是( D )A。
时期指标并且是实物指标 B。
时点指标并且是实物指标C。
时期指标并且是价值指标 D. 时点指标并且是价值指标2、某企业计划规定本年产值比上年增长4%,实际增长6%,则该企业产值计划完成程度为( B )A、150%B、101。
9%C、66.7%D、无法计算3、总量指标具有的一个显著特点是( A )A. 指标数值的大小随总体范围的扩大而增加B. 指标数值的大小随总体范围的扩大而减少C。
指标数值的大小随总体范围的减少而增加D. 指标数值的大小随总体范围的大小没有直接联系4、在出生婴儿中,男性占53%,女性占47%,这是( D )A、比例相对指标B、强度相对指标C、比较相对指标D、结构相对指标5、我国1998年国民经济增长(即国内生产总值为)7。
8% ,该指标是( C )A. 结构相对指标B. 比例相对指标 C。
动态相对指标 D。
比较相对指标6、某商店某年第一季度的商品销售额计划为去年同期的110%,实际执行的结果,销售额比去年同期增长24.3%,则该商店的商品销售计划完成程度的算式为( B)A。
124.3%÷210% B。
124.3%÷110%C。
210%÷124。
3 D. 条件不够,无法计算7、下面属于时点指标的是( A )A. 商品库存量 B。
第四章 推断统计概述第一部分 概率论基本知识← 一、概率的定义;二、概率的性质;三、概率的加法定理和乘法定理← 四、概率分布类型四、概率分布类型← 概率分布(probability distribution )是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。
← 依不同的标准,对概率分布可作不同的分类。
1、离散型分布与连续型分布← 依随机变量的类型,可将概率分布分为离散型概率分布与连续型概率分布。
← 教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。
2、经验分布与理论分布← 依分布函数的来源,可将概率分布分为经验分布与理论分布。
← 经验分布(empirical distribution )是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布。
← 理论分布(theoretical distribution )是按某种数学模型计算出的概率分布。
3、基本随机变量分布与抽样分布← 依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布(sampling distribution )。
← 基本随机变量分布是随机变量各种不同取值情况的概率分布,← 抽样分布是从同一总体内抽取的不同样本的统计量的概率分布。
第二部分 几种常见的概率分布← 一、二项分布← 二项分布(binomial distribution )是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创始的,因此又称为贝努里分布。
← 2.二项分布函数← 二项分布是一种离散型随机变量的概率分布。
← 用 n 次方的二项展开式来表达在 n 次二项试验中成功事件出现的不同次数(X =0,1…,n )的概率分布,叫做二项分布函数。
← 二项展开式的通式(即二项分布函数):← ←← ← ←← 成功概率 p ;样本容量 n← 在成功概率为p 的总体中随机抽样,抽取样本容量为n 的样本中,有X 次为成()011111100q p C q p C q p C q p C q p n n n n n n n n n n n ++++=+---Λ()Xn X X n X q p C P -⋅⋅=()X n X q p X n X n -⋅-=!!!功的概率: ←(X =0,1…,n ) ←称X 服从参数为n ,p 的二项分布,记为: ←X ~B(n ,p ) 其中,0<p<1 ←二项分布的性质 ←二项分布有如下性质: ←①当p=q 时,图形是对称的。
第四章、统计综合指标
实际完成数值
5、计划完成程度相对数=
计划任务数值
6、动态相对数=
基期指标数值
报告期指标数值
平均指标:它可以反映总体各单位标志值分布的集中趋势。
例题:某车间80名工人日产量资料如下;
根据开口组组中值计算公式,计算如下:
假定下限值=上限值-邻组组距=8-4=4 ; 假定上限值=下限值+邻组组距=20+4=24
最小组组中值=
628
42=+=+上限值假定下限值
最大组组中值=
222
24
202=+=+假定上限值下限值
∑∑=
+⋯++++⋯+++=f xf f f f f f x f x f x f x x n n n 321332211=35.1480
1148
=
例题:某商店销售三批同种商品,资料如下;
解:已知价格和各批销售额,可按加权调和平均数公式计算平均价格:
H=∑∑=
++++++x m m x m x m x m m m m n
n n (22)
1121=)(94.109330
36280
112
12320108129601101100012320
1296011000千克元==
++++
例题:某批产品的生产要经过三道工序,且要经过三次检验,第一次检验合格率为95%,第二次检验合格率为96%,第三次检验合格率为98%,求平均合格率。
解:G=%33.96%98%96%95...3321=**=n n x x x x
(1)、确定中位数的位次
2
∑f
=
12002
2400
= ;中位数在1900—2000元,按照公式计算: i f S f
L m
m e *-+
=M -∑12
=1900+)(29.1915100850
107022400
元=*-
(2)、确定众数组,1900—2000组次数最多,该组即为众数组; 根据公式已知:L=1900 U=2000,3904608501=-=∆;6002508502=-=∆
i L e *∆+∆∆+
=M 2
11=1900+
39.1939100600390390
=*+(元)
例题:甲班40名同学平均身高为171cm ,平均差为8.5cm ,乙班身高资料如下图,比较两个班平均身高的代表性:
解:乙
x =171 cm , ∑
∑-=f f x x D A ..=
()cm 3.740292= 甲乙两班平均身高相同,但乙甲....D A D A 〉,故乙x 的代表性大。
解:26100
4
*406*3618*3221*2823*2418*207*163*12=+++++++=
x
全距R=42—10=32
平均差=∑∑-=f f x x D A ..=)(32.5100
532cm = ; 标准差=()∑∑-=
f
f
x x 2
σ=
)(44.6100
4144
cm = 离散系数⎪⎪⎩
⎪⎪⎨⎧
===⇒==*=⇒%77.24%100*266.44%100*%46.20%100*2632.5%100....x V x
D A V D A σσ
标准差系数平均差系数
是非标志的平均数和标准差:
因为是非标志只有两个具体表现,所以可用1代表“是”,用0代表“非”,在此可以把1和0视为是非标志的标志值,全部总体单位数用N 表示,标志值为1的单位数用1N 表示,标志值为0的单位数用0N 来表示,则: N=1N +0N 成数P=
N N 1 ;成数Q=N
N 0 显然N N 1+N N
0=1 即P+Q=1 ,所以 Q=1-P
公式:是非标志的平均数P x = 是非标志的标准差=
σ()P P -1
例题:某工厂生产某种产品合格率为95%,不合格率为5%,求是非标志平均数和标准差? 解:P x ==95% 是非标志的标准差:=
σ()P P -1=()%79.21%951%95=-∙。