- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
频数分布表实例
Frequency Distribution Table Example
原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38 组别 ≥ 15 且< 25 组距 ≥ 25 且< 35 ≥ 35 且< 45 组界 组中值 20 30 40 频数 3 5 2
第三节 频数分布
一,频数分布及其种类 Frequency distribution:在分组的基础上,把所有 数据或总体单位按组归并,排列,形成所有数据 或总体各单位在各组间的分布,又称分布数列. f 频数分布两部分组成:组别,频数f和频率 ∑ f 性质: f f 0≤ ≤1 ∑ f =1 f ∑
∑
二,统计图
统计图用来表现数据的几何图形. 遵守如实反映,便于比较,通俗易懂,鲜明醒目,灵 活机动的原则. (一)直方图和条形图 1Histogram:用矩形的宽度和高度表示频数分布,横 轴表示数据分组,纵轴表示频数或频率. 2 Bar chart:用宽度相同的条形的高度或长度来表示数 据的变动.可横置或纵置.纵置也叫柱形图. 区别: 条形图用条形的长度表示各类别数量的多少,其宽 度是固定的,直方图是用面积表示数量的多少. 直方图各矩形通常是连续排列,而条形图则是分开 排列.
四,国民经济统计中的常用分类
(一)经济成分:公有,非公有 (二)登记注册类型:内资,港澳台,外商投 资 (三)国民经济行业:A---P (四)三次产业:农林牧渔,工业建筑,流通 服务 (五)机构部门:非金融,金融,政府,住户
五,统计数据分组应用
应用数据分组划分现象类型——研究不同类 型现象的特征. 反映现象内部结构——计算各组比重,反映 —— 总体内部结构. 研究现象之间的依存关系——有助于人们全 面,深刻地认识事物.先按一个标志分组, 再计算另一个标志在各组的数值,据以观察 它们之间的相互依存关系.
一,统计表
(二)统计表的种类 按用途分:调查表,整理表,分析表. 按主词是否分组和分组的情况,分为简单表,分组 表,复合表 (三)统计表的设计原则和方法 科学,实用,简练,醒目,美观 1设计表式 纵横交叉线条组成的长方形表格. 线条的绘制,表左右两端不封口,尽量少横竖线. 合计栏. 栏数编号.
(三)统计表的设计原则和方法
一,频数分布及其种类
(一)品质分布 经过属性分组,组别表现为一系列的概念和范畴. (二)变量分布 经过变量分组,组别表现为不同的数值或数域. 单项数列:以一个变量值为一组. 组距数列:以表示一定变动范围的两个变量构成的 组.各组组距相等叫等距数列,不等叫异距数列. 组距=上限-下限 组中值=(上限+下限)/2 缺下限的组的组中值=上限-相邻组的组距/2 缺上限的组的组中值=下限+相邻组的组距/2
三,数据的预处理
(二)数据的订正 审核中发现迟报,漏报及计算错误,应及时催报,补 报,改正. 针对不同的错误作出不同的处理: 对于可以肯定地一般错误,即代为更正,并向有关单 位核对. 对于可疑之处或无法代为更正的错误,应通知原报单 位复查更正. 对于在一个单位发现的有代表性的重大差错,除通知 原报单位更正外,还要将差错情况通报尚未报送资料 的单位,以防止类似错误发生. 错误情节属于违反统计法规的,应查明责任,予以适 当处理.
四,频数分布的类型
1对称分布型 正态分布:中间多,两边少,对称. 2偏态分布型 非对称,右偏(正偏),左偏(负偏). ( ) 3U型分布 中间少,两边多,人口死亡率分布. 4丁型分布 正丁(供给曲线),反丁(需求曲线)
第四节 数据的显示
数据的表现形式主要有统计表和统计图. 一,统计表 (一)统计表的结构 统计表(Statistical table)是以纵横交叉的线条组成 的表格来表现统计数据的一种形式,或者说统计表是 用来反映统计数据的一种表格,例如调查表,整理表, 数据积累表,分析表等. 总标题,横行标题,纵栏标题,数字资料 主词:要说明的对象,总体,总体的各个组,总体单 位的名称和时间. 宾词:用来说明主词的各个统计指标,包括指标名称 和数值.
三,频数分布的编制
(二)变量频数分布的编制 1单项数列的编制 对于离散型变量,如果变量值的种类较少且变量的变动 范围不大时,可编制单项数列. 首先应将各种变量值按大小顺序排列,然后计算各变量 值的频数和频率,最后将上述结果以表格的形式表现. 2组距数列的编制 离散变量,若变动幅度不大,变量值的种类较多,则 宜编成组距数列. 连续变量,可取值难以一一列出,只能编制组距数列. (1)将原始数据大小顺序排列,并确定最大值,最小值 和全距R (2)确定组距数列的类型.等距or异距.
(上界+下界)/ 2
二,累积频数和累计频率
Cumulative frequency和cumulative absolute frequency:将变量频数分布中各组频数或频率 依次累加而得到的各组频数或频率. 向上累计:变量值低组——高组 向下累计:变量值高组——低组
三,频数分布的编制
数列的编制过程实质上是分组与汇总的过程. (一)品质频数分布的编制 首先按品质数列对总体作属性分组,划分各 组界限,属性分组比较简单,分组标志一经 确定,组名称和组数也就确定,不存在组与 组之间界限划分的困难. 分组确定后,再汇总各组单位数,并编成统 计表,即得品质数列.
2组距数列的编制
(4)确定组限和组限的表示法 最小组下限低于或等于最小变量值,最大组上限应 大于最大变量值. 如果有极端值,可用开口组. 组限应有利于表现总体单位分布规律. 对于等距数列,如果组距是5的倍数,则每组下限 也最好是5的倍数.还应确定组限的表示法是用同 限,还是用异限. (5)从最小组依次排列,并分别计算各组频数和其 他有关指标,形成分组的统计表.
二,统计数据分组的类型
(一)属性分组和变量分组 属性分组(Attributive grouping)是按照反映 事物的属性和品质标志来进行的分组,例: 按性别,民族,文化程度,职业分组. 变量分组(Variable grouping)是指按照数量 标志进行的分组.组限是指各种不等的变量 值.
二,统计数据分组的类型
5统计调查方案的主要内容包括下列哪些方面 () A确定调查的目的和任务 B确定调查对象和调查单位 C确定调查项目,拟定调查表式或调查问卷 D确定调查时间和方法 E确定调查人员
课前练习
判断 统计调查中的调查单位与填报单位是一致的. () 统计是研究事物的数量特征,而不去研究其 质的规定性.() 典型调查时专门组织的一次性的全面调查. ()
2内容设计 标题设计:简明扼要,内容,数据的空间时间范围. 指标数值的填写:数字数位对齐,0补齐,缺数用 "…",不该有数用"—",数字栏没有空格. 计量单位栏的设计:一个单位写于纵栏标题,小写 入括号.全表一个单位写在表的右上方.横行的计 量单位可以专设一栏. 注解与资料来源:表下方注明资料来源,添加注解 或说明. 画图举例说明.
一,数据整理及其类型
统计数据整理(Statistical data arrangement)就是对 搜集得到的初始数据进行审核,分组,汇总,使之条 理化,系统化,变成能反映总体特征的综合数据的工 作过程. 根据数据搜集的方式和研究任务不同,统计数据的整理 可以分为下列三种: 定期统计报表数据的整理 统计台帐:为整理统计数据和进行统计分析而专 门设置的一种系统积累统计资料的表册. 专题性统计数据的整理.——根据专题研究的目的确 定整理的内容和题目,注意资料的时效性,广泛性, 政策性. 历史统计数据的整理.——对本部门,本单位的历史 统计数据按照研究目的的要求,进行系统的加工和处 理.
(二)简单分组,复合分组和分组体系 简单分组(Simple grouping):就是将总体按一个 标志进行的分组. 复合分组(Composite grouping):按照两个或两 个以上的标志对总体加以重叠的分组,所谓重叠的 分组,是指在前一次分组结果的内部再进行下一次 分组. 分组体系(Grouping system):是按照两个或两 个以上的标志对总体加以平行的分组,从不同的侧 面分别说明总体的特征.
2组距数列的编制
(3)确定组数和组距.组数越多,组距越小. 注意 考虑组内的同质性. 要能反映总体分布的规律,即要体现原始数据分布 的集中趋势或离中趋势. 组距不能太大或太小.一般在5-15组内.组距最好 是5的整数倍. 在等距数列情况下,如果总体单位数不是很多,变 量变动范围不是很大时,可用斯特吉斯经验公式计 算出一个参考组距.
三,统计数据分组的原则和方法
(一)原则 穷尽原则:分组时每一个总体单位都应有组可归, 各个组要有足够的空间容纳总体的所有单位. 互斥原则:组与组之间在涵义上和口径上不能发生 重叠. 反映事物本质的原则:使分组的结果尽量反映事物 的本质特征,突出各组之间质的差异.
三,统计数据分组的原则和方法
(二)分组标志的选择 Classification characteristic:统计数据分组时 所依据的标志. (三)分组界限的划分 Grouping ambit: 组限分明:例如性别,党派 属性有过渡,复杂,依据分类目录
3将统计总体按某一标志分组的结果表现为() A组内同质性,组间差异性 B组内差异性,组间差异性 C组内同质性,组间同质性 D组内差异性,组间同质性
课前练习
4某连续变量,其末组的组限为"500"以上,又 知其邻组的组中值为460,则末组的组中值应 为多少() A520 B540 C560 D580
课前练习
二,数据整理的原则和内容
(一)原则 目的性原则——按目的整理综合指标 联系性——指标之间有联系,有逻辑关系 简明性——同一资料有不同整理方法,选简明方法 (二)内容 根据目的和要求,确定应该整理的指标,并根据分 析的需要确定具体的分组. 对大量原始数据进行预处理. 对各指标进行汇总,计算出各组单位数,总体单位 数以及各组,总体的有关标志值之和. 将汇总整理的数据编制成统计表. 对统计数据分门别类地系统积累.