第三章 社会统计资料的整理2015
- 格式:ppt
- 大小:869.00 KB
- 文档页数:42
第三章社会统计资料的整理原始资料杂乱无章,需加整理,才能为人所用。
统计资料的整理,其基础是统计分组。
所谓统计分组.就是按统计研究的目的和要求,将总体单位或全部调查数据按一定的标志划分成若干组,使组内差异尽量小,而组与组之间则有明显差异,从而使原本杂乱无章的资料有序化,以便为在统计分析中提炼各种有用信息打下基础。
第一节统计分组的原则与标准统计分组的标志分为数量标志和品质标志两大类。
按国际惯例,无论采用何种标志进行统计分组,都应遵循以下一般原则:(1)分组应使各类别构成之和等于总体;(2)分组设计应能反映统计总体的分布规律性。
在统计资料搜集的基础上,按分组原则,将总体中所有单位依一定顺序归类整理,即可得到能够表明总体单位总数在各组分配情况的频数(或次数)分布数列,简称数列。
频数分布数列是统计分组工作的产物。
显然,按品质标志进行分组,我们可以得到品质数列;按数量标志进行分组,我们可以得到变量数列。
统计分组的关键在于选择分组标志和划分各组界限。
一般来讲,按品质标志来分组,其差别比较明确,区分也较容易。
按数量标志来分组则不同,对于划分各组界限,变量数列有较大的任意性。
如果划分不当,不仅容易混淆各组的差别,也可能无法反映变量的分布特征。
在统计整理和统计分析中,广泛应用变量数列,借以观察某一数量标志的变动及其分布状况。
因此,如何编制变量数列是我们重点需要掌握的。
第二节统计表统计调查搜集来的资料往往是没有次序的原始资料,使原始资料有序化,列表和作图是两种基本方法,得到的分别就是统计表和统计图。
变量数列是统计表的一种常用形式。
1.统计表的格式、内容与种类统计表是表示统计资料的表格,在由横行、纵栏交叉结合而成的表格上,它能系统地组织和合理地安排大量数字资料。
统计表的主要功用是汇总和积累统计资料,以简捷和有条理的方式表示统计资料的特征,从而使统计资料易于查对、比较、分析和记忆。
统计表通常有一定格式:总标题、横行标题(表侧)、纵栏标题(表头)、统计数值(表身)。
《社会统计学》全书目录第一章导论第一节什么是社会统计学社会统计的产生与发展·社会统计学的对象与特点·社会统计的方法·社会统计工作的程序第二节社会统计学的几个基本概念总体与单位·标志与变量·指标与指标体系第二章社会统计资料的搜集第一节统计调查的方法及种类原始资料与次级资料·静态资料与静态资料·全面调查与非全面调查·一般调查与专项调查·经常性调查与一次性调查第二节统计调查的组织形式普查·重点调查·典型调查·抽样调查第三节概念的操作化与测量概念的操作化·定类尺度·定序尺度·定距尺度·定比尺度第四节统计误差登记性误差·代表性误差·抽样误差第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”·频数(或次数)分布数列·品质数列与变量数列第二节统计表统计表的格式、内容与种类·统计表的制作规则第三节变量数列的编制对于离散变量·对于连续变量·组距和组数的确定·累计频数第四节统计图直方图·折线图·曲线图·累计顿数分布曲线·洛仑兹曲线与基尼系数第四章集中趋势测量法第一节算术平均数对于未分组资料的算术平均数计算·对于分组资料的算术平均数计算·算术平均数的性质第二节中位数对于未分组资料的中位数计算·对于分组资料的中位数计算·中位数的性质·其他分割法第三节众数对于未分组资料的众数计算·对于分组资料的众数计算·众数的性质第四节几何平均数、调和平均数及其他几何平均数·调和平均数·各种平均数的关系第五章离中趋势测量法第一节全距与四分位差全距·四分位差第二节平均差对于未分组资料A·D的计算·对于分组资料A·D的计算·平均差的性质第三节标准差对于未分组资科S的计算·对于分组资料S的计算·标准差的性质·标准分第四节相对离势变异系数·异众比率·偏态系数第六章概率与概率分布第一节概率论随机现象和随机事件·事件之间的关系·先验概率·经验概率第二节概率的数学性质概率的数学性质·排列与样本点的计数·运用概率方法进行统计推断的前提第三节概率分布、期望值与变异数离数型随机变量及其概率分布·连续型随机变量的概率分布·分布函数·数学期望·变异数第七章假设检验第一节二项分布二项分布的数学形式·二项分布的讨论第二节统计检验的基本步骤建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布正态分布的数学形式·标准正态分布·正态曲线下的面积·二项分布的正态近似法第四节中心极限定理抽样分布·中心极限定理第五节总体均值和成数的单样本检验σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验第八章常用统计分布第一节超几何分布超几何分布的数学形式·超几何分布的数学期望与方差·关于超几何分布的近似第二节泊松分布泊松分布的数学形式·泊松分布的性质·关于泊松分布的近似第三节卡方分布(2 分布)卡方分布的数学形式·卡方分布的性质·样本方差的抽样分布第四节F分布F分布数学形式·F分布的性质·关于F分布的近似第九章参数估计第一节点估计无偏性·一致性·有效性第二节区间估计精确性和可靠性·抽样平均误差与概率度·区间估计的步骤第三节其他类型的置信区间σ未知,小样本总体均值的区间估计·总体成数的估计·总体方差的区间估计第四节抽样平均误差简单随机抽祥的抽样误差·分层抽样的抽样误差·整群抽样的抽样误差·等距抽祥的抽样误差第五节样本容量的确定影响样本容量的因素·确定样本容量第十章双样本假设检验及区间估计第一节两总体大样本假设检验大样本均值差检验·大样本成数差检验第二节两总体小样本假设检验小样本均值差检验·小样本方差比检验第三节配对样本的假设检验单一实验组的假设检验·一实验组与一控制组的假设检验·对实验设计与相关检验的评论第四节双样本区间估计σ12和σ22已知,对均值差的区间估计·σ12和σ22未知,对均值差的区间估计·大样本成数区间估计·配对样本均值差的区间估计第十一章非参数检验第一节符号检验配对样本的“符号检验”·符号检验与二项检验·简便检验·“符号检验”的作用第二节配对符号秩检验配对样本的符号秩检验·配对符号秩检验的步骤·符号秩检验的效力第三节秩和检验独立样本的秩和检验·秩和·秩和检验的具体步骤·U检验第四节游程检验独立样本的游程检验·游程·游程检验的具体步骤·差符号游程检验第五节累计频数检验独立样本的累计频数检验·累计频数检验的步骤·没有预测方向和已经预测方向·经验分布与理论分布之比较第十二章相关与回归分析第一节变量之间的相互关系相关程度与方向·因果关系第二节定类变量的相关分析列联表·削减误差比例·λ系数·τ系数第三节定序变量的相关分析同序对、异序对、同分对·G amma系数·肯德尔等级相关系数·萨默斯(d系数)·斯皮尔曼等级相关系数·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE性质·相关指数R第六节曲线相关与回归第十三章2 检验与方差分析第一节拟合优度检验问题的导出·拟合优度检验(比率拟合检验)·正态拟合检验第二节无关联性检验独立性、理论频数及自由度·关于频数比较和连续性修正·列联表的卡方分解·关系强度的量度第三节方差分析总变差及其分解·关于自由度·关于检验统计量F o的计算·相关比率·关于方差分析的几点讨论第四节回归方程与相关系数的检验回归系数的检验·积差系数的检验·回归方程的区间估计第十四章动态分析与指数分析第一节时间数列及其指标分析时间数列的构成与分类·动态比较指标·动态平均指标第二节时间数列的趋势分析随手绘法·移动平均法·半数平均法·最小平方法第三节指数分析法动态指数及其分类·质量指标综合指数·数量指标综合指数·用与个体指数的联系来求综合指数·其他权数形式的质量和数量综合指数·指数体系和因素分析·静态指数。
第三章社会统计资料的整理第一节统计分组的原则与标准“穷举”与“互斥”·频数(或次数)分布数列·品质数列(定类和定序)与变量(定距)数列第二节统计表统计表的格式、内容与种类·统计表的制作规则第三节变量数列的编制离散变量数列与连续变量数列·单项数列与组距数列·组距和组数的确定·等距分组与异距分组·开口组与闭口组·频数密度与标准组距频数·累计频数第四节统计图频数分布曲线(直方图、折线图、曲线图)·累计频数分布曲线·洛仑兹曲线与基尼系数一、填空1.统计表从内容上看,是由()和宾词两部分构成的。
2.主词是统计表要说明的();宾词是用来说明主词的()。
3.变量数列有两个构成要素()和()。
4.基尼系数为(),表示收入绝对不平均;基尼系数为(),表示收入绝对平均。
5.统计表通常有一定格式,统计表各部位的名称分别是()、横行标题、纵栏标题、()。
6.实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈大,收入分配(),反之,则收入分配()。
7.对于连续变量,恰是某一组限的数据应按照()的原则归入相应的组别。
8.统计表按主词的分组情况,可分为简单表、简单分组表和()。
9.统计分组的关键在于()和划分各组界限。
二、单项选择题1.统计表的数字部分中符号“……”代表的含义是()。
A.某项数字不存在B.缺少某项数字C.某项数字较大D.提醒注意核计2.某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为26.2岁,则该城市男性青年结婚的年龄分布为()。
A.正偏B.负偏C.对称D.不能作出结论3.上限与下限之差是()。
A.组限B.组距C.组中值D.极差4.累计频数分布曲线一般都呈()。
A.钟型曲线B.U 型曲线C.J 型曲线D.逻辑斯蒂曲线三、多项选择题1.累计频数分布曲线()。
A.只有持续增长或持续减少两种形状B.呈对称的钟型C.一般呈S状D.斜率为零处对应于空组E.曲线最高处对应于含有最多单位的间距2.如果某连续变量的数值分布很不均匀,且有极端值出现,则数列应编制()。