统计学公式大全 PPT
- 格式:ppt
- 大小:500.00 KB
- 文档页数:52
统计学复习含公式 Revised by BLUE on the afternoon of December 12,2020.1、统计学:是收集、汇总和分析统计数据的科学和艺术。
2、统计数据的分析是统计学的核心内容,它是通过统计描述和统计推断的方法探索数据内在规律的过程。
3、普查:是为某一特定目的而专门组织的一次性全面调查,如人口普查、工业普查、农业普查等。
4、抽样调查的特点:经济性;时效性高;适应面广;准确性高。
5、调查方案:是指导整个过程的纲领性文件,其内容包括调查目的、调查对象和调查单位、调查项目和调查表等内容。
6、组距分组的几个步骤:一、确定组数二、确定组距三、确定组限和进行次数分配四、绘制统计图五、分析。
)7、为消除组距不同对频数分布的影响,需要计算频数密度,即频数密度=频数/组距,用频数密度才能准确反映频数分布的实际情况。
8、以组中值作为代表值有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组距中值两侧呈对称分布。
9、描述统计的内容也包括频数分布、但主要是关于集中趋势和离中趋势的描述问题。
10、众数:是一组数据中出现次数最多的变量值。
从分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的数值即为众数,记为M。
11、众数是一组数据中心位置的一个代表值。
当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,实际上也可以认为有多个众数。
12、协方差的大小会受到计量单位和数据均值水平的影响,从而使不同相关总体之间的相关程度缺乏可比性。
13、时间系列:是反映现象随时间的变化而变化的数据系列,也称为时间数列或动态数列。
14、用报告期水平减去基期水平,就等于增长量。
其中,当基期水平为上期水平时,就称为逐期增长量,当基期水平为某个时期的固定发展水平时,就称为累计增长量。
15、报告水平与基期水平之比,称为发展速度。
其中,当基期水平为上期水平时,就称为环比发展速度;当基期水平为某个时期的固定发展水平时,就称为定基发展速度。
统计学公式汇总(1) αβδμσνπρυt u F X s 2χ(2) 均数(mean ):nX nX X X X n∑=+⋅⋅⋅++=21 式中X 表示样本均数,X 1,X 2,X n 为各观察值。
(3) 几何均数(geometric mean, G ):)lg (lg )lg lg lg (lg 121121nX n X X X X X X G n nn ∑--=+⋅⋅⋅++=⋅⋅⋅•=式中G 表示几何均数,X 1,X 2,X n 为各观察值。
(4) 中位数(median, M )n 为奇数时,)21(+=n XM n 为偶数时,2/][)12()2(++=n n XX M式中n 为观察值的总个数。
(5) 百分位数 )%(L xx f x n f iL P ∑-⋅+= 式中L为Px 所在组段的下限,f x 为其频数,i 为其组距,L f ∑为小于L各组段的累计频数。
(6) 四分位数(quartile, Q ) 第25百分位数P 25,表示全部观察值中有25%(四分之一)的观察值比它小,为下四分位数,记作Q L ;第75百分位数P 75,表示全部观察值中有25%(四分之一)的观察值比它大,为上四分位数,记作Q U 。
(7) 四分位数间距 等于上、下四分位数之差。
(8) 总体方差 NX 22)(μσ-∑=(9) 总体标准差 NX 2)(μσ-∑=(10) 样本标准差 1/)(1)(222-∑-∑=--∑=n nX X n X X s (11) 变异系数(coefficient of variation, CV ) %100⨯=XsCV (12) 样本均数的标准误 理论值nX σσ=估计值ns s X =式中σ为总体标准差,s为样本标准差,n 为样本含量。
(13) 样本率的标准误 理论值np )1(ππσ-=估计值np p s p )1(-=式中π为总体率,p 为样本率,n 为样本含量。
(14) 总体率的估计:正态分布法,(n p p u p n p p u p /)1(,/)1(-⋅+-⋅-αα) 式中p 为样本均数,s 为样本标准差,n 为样本含量。