统计学第二章
- 格式:ppt
- 大小:820.50 KB
- 文档页数:21
第二章 数据频数的分布第一节 数据的预处理与统计分组一、数据的预处理 (主要包括三个方面内容) (一)数据审核——针对可修补的数据1.准确性审核审核的对象:登记性误差(非抽样误差),这是审核的重点 。
审核方法:逻辑检查和计算检查 。
2.全面性审核:是否有遗漏,应调查的内容是否齐全。
3.及时性审核:是否按规定的时间获取数据资料。
(二)数据筛选——针对不可修补的数据 (三)数据排序 二、统计分组(一)统计分组的意义1.含义:使组与组之间具有差异性(对客观现象总体而言是“分”),而同一组内保持相对的同质性(对构成总体的每个个体而言是“合”) 2.作用:①划分现象类型②研究现象的内部结构③分析现象之间的依存关系 (二)统计分组的原则1.组内同质性和组间差异性原则;2.“穷举”性原则;3.“互斥”性原则。
(三)统计分组的方法1.定性数据分组和定量数据分组A 定性数据分组:根据分析研究目的科学合理的列出所分的类别B 定量数据分组:(1)单变量值分组——适用于离散型变量、变量较少(2)组距分组——适用于连续型变量,但往往以离散型变量值的形式出现①确定组数:N K lg 32.31+= N :总体容量或总体数据个数 K :先取整再+1 ②确定组距(一个组的上限和下限之差)等距分组(多为自然现象):Nxx K R d lg 32.31min max +-==R :全距 异距分组(多为社会现象) ③确定组限组中值:每组上、下限之间的中点位置的变量值闭口组:组中值=(上限+下限)÷2开口组:首组开口组组中值=首组上限-邻组组距/2末组开口组组中值=末组下限+邻组组距/2 ④统计频数:“不重不漏”的总原则,“上限不在内”的处理方法2.简单分组和复合分组第二节 一、频数分布1.含义: 把数据分成的各个组以及相应的频数依一定的次序全部列出来,就形成了频数分布,又称为次数分布。
2.两个基本构成要素:(1)对现象总体的分组(2)各组所出现的元素数或数据数,即频数3.百分比形式——频率(1)含义:频数以相对数的形式,即各组频数占频数之和比重的形式出现,这种频数被称为频率 (2)作用:映了各组频数的大小对总体所起作用的相对强度 (3)性质:①任何频率都介于0和1之间 ②各组频率之和等于1。