统计学第三章数据的整理
- 格式:docx
- 大小:17.30 KB
- 文档页数:5
1. 2.掌握3.掌握 4.用Excel5.§3.1数据的预处理3.1.1 数据审核3.1.2 数据筛选3.1.3 数据排序1.错误2.符合条件3.升序和降序4.按需要汇总(raw data)完整性准确性检查数据是否有错误,计算是否正确等数值型数据,计算检查)(second hand data)1.适用性2.时效性3.确认(data filter)1. 2.不符合明显错误剔除符合筛选出来,而不用Excel 进行数据筛选8名学生的考试成绩数据(data filter)(data rank)1.一定顺序2.有助于3.排序本身就是分析的目的4.借助于计算机(方法)1.分类数据 字母型习惯上用升序汉字型首位拼音字母笔画多少2.数值型–递增递增–递减x (2)>…>x (n)数据透视表(pivot table )1.复杂提取有用 2.重要信息汇总和作图3. 4.首行列标题拖至区域,将需要汇总的“变【向导—3步骤之3】对,即可输出数据透视表§3.2 分类和顺序数据的整理与显示3.2.1 分类数据的整理与显示3.2.2 顺序数据的整理与显示(基本问题)1.弄清数据类型2.分类数据和顺序数据分类整理3.数值型数据分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整(基本过程) BAEDC比率百分比比例频数分类(可计算的统计量)1.个数2.一类别全部数据3.4.不同类别制作频数分布表(bar Chart )1.宽度相同高度或长短2.单式复式3.分类数据频数分布4.条形图可以横置或纵置汇源果汁露露品牌(side - 1.不同时间或不同空间2.差异或变化趋势688563328247戴尔电脑品牌1.频数多少排序2.分类数据不同品牌饮料的帕累托图百事可乐露露汇源果汁品牌(pie Chart)1.圆形及圆内扇形的角度2.各组成部分所占的比例结构性问题3.绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占不同品牌饮料的构成旭日升冰茶22%分类数据显示图例(可计算的指标)频数逐级累加频率(百分比)的逐级累加☺☺☺☺☺☺———100.092562510276168753044.075.090.0100.0132225270300乙城市回答类别100.093.060.034.012.7300279180102387.040.066.087.3100.0211201982623007.033.026.021.312.72199786438非常不满意不满意一般满意非常满意百分比(%)户数(户)百分比(%)户数(户)向下累积向上累积百分比(%)户数(户)乙城市家庭对住房状况评价的频数分布(243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向上累积非常不满意不满意一般满意非常满意(b)向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布(annular chart)1. 2.同时绘制多个总体3. 4.环形图主要用于展示分类和顺序数据满意非常满意§3.3 数值型数据的整理与显示3.3.1 数据分组3.3.2 数值型数据的图示等距分组等距分组异距分组异距分组(要点)一个变量值离散变量值较少的情况☺☺☺☺(要点)1.一个区间2.连续变量3.变量值较多4.“不重不漏”5.等距不等距☺~ ☺☺~ ☺☺~ ☺☺~ ☺☺~ ☺(步骤)1.确定组数2.确定组距上限与下限之差,可根据全部数据的最大统计频数并整理成频数分布表(几个概念)(例题分析)【例】某电脑公司2005年前四个月各天的销售量数据(单位:台)。
统计学第三章数据的整理
1
统计分组的依据是()。
A、标志
B、指标
C、标志值
D、变量值
正确答案:A 我的答案:A得分:4.0分
2
在进行组距分组时,以组中值作为该组数据的代表值的假定前提条件是()。
A、各组变量值均相等
B、各组数据在本组内呈均匀分布
C、各组组距均相等
D、各组频数均相等
正确答案:B 我的答案:B得分:4.0分
3
等距分组适合于()。
A、一切变量
B、变量变动比较均匀的情况
C、呈急剧升降变动的变量
D、按一定比率变动的变量
正确答案:B 我的答案:B得分:4.0分
4
确定连续型变量的组限时,相邻的组限一般要求()。
A、不重叠
B、重叠
C、不等
D、重叠或不重叠
正确答案:D 我的答案:D得分:4.0分
5
组距数列末组的向上累计为()。
A、该组的频数
B、频数之和
C、该组的频率
D、末组的向下累计频数
正确答案:B 我的答案:B得分:4.0分
6
反映人口死亡现象按年龄分布的次数分布为()。
A、钟形分布
B、U型分布
C、J型分布
D、反J型分布
正确答案:B 我的答案:B得分:4.0分
7
组数与组距的关系是()。
A、组数越多,组距越小
B、组数越多,组距越大
C、组数与组距无关
D、组数越少,组距越小
正确答案:A 我的答案:A得分:4.0分
8
按某一标志分组的结果表现为()。
A、组内同质性,组间同质性
B、组内同质性,组间差异性
C、组内差异性,组间同质性
D、组内差异性,组间差异性
正确答案:B 我的答案:B得分:4.0分
9
连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,末组的组中值为()。
A、260
B、215
C、230
D、185
正确答案:C 我的答案:C得分:4.0分
10
某年收入变量数列,其分组依次为10万元以下,10—20万元,20—30万元,30万元以上,则有()。
A、10万元应归入第一组
B、20万元应归入第二组
C、20万元应归入第三组
D、30万元应归入第三组
正确答案:C 我的答案:C得分:4.0分
二.多选题(共5题,20.0分)
1
统计资料整理的内容一般包括()。
A、资料审核
B、统计分组
C、统计汇总
D、编制统计表
正确答案:ABCD 我的答案:ABCD得分:4.0分
2
在分配数列中,()。
A、各组的频数之和应等于100
B、各组的频率之和应等于100%
C、某组频率越大,则该组标志值所起的相对作用就越大
D、某组频数越大,则该组标志值所起的绝对作用就越大
正确答案:BC 我的答案:BC得分:4.0分
统计表从形式上看由()组成。
A、总标题
B、横行标题
C、纵栏标题
D、主词
正确答案:ABC 我的答案:ABC得分:4.0分
4
统计表从内容上看由()组成。
A、总标题
B、横行标题
C、主词
D、宾词
正确答案:ABC 我的答案:CD得分:0.0分
5
选择分组标志时应考虑的因素有()。
A、统计研究目的或分组目的
B、标志能否反映事物本质
C、是区分事物数量差别还是性质差别
D、现象所处的客观历史条件
正确答案:ABD 我的答案:ABD得分:4.0分
三.判断题(共10题,40.0分)
1
按一个标志进行分组的是简单分组,按多个标志进行分组的是复合分组。
我的答案:√得分:4.0分正确答案:√
2
向上累计是各组上限以下的累计频数或累计频率,当所关注的是标志值较小的现象的次数分配情况时,通常采用向上累计。
我的答案:√得分:4.0分正确答案:√
资料审核的内容主要包括完整性、准确性和及时性三方面。
我的答案:√得分:4.0分正确答案:√
4
在编制变量数列时,若资料有特大或特小的极端数值,则宜采用开口组表示。
我的答案:√得分:4.0分正确答案:√
5
所谓“上限不在内”原则,是指当某单位的标志值恰好等于某组上限时,就把该单位归入该组。
我的答案:×得分:4.0分正确答案:×
6
能够对总体进行分组,是由于统计总体中各单位所具有的差异性决定的。
我的答案:√得分:4.0分正确答案:√
7
开口组组距数列计算的组中值为近似值。
我的答案:√得分:4.0分正确答案:√
8
饼状图是以图形面积的大小表现各组的频数或频率的大小。
我的答案:√得分:4.0分正确答案:√
9
分组标志的种类主要包括品质标志分组、数量标志分组和空间标志分组。
我的答案:×得分:4.0分正确答案:×
10
向下累计是各组下限以上的累计频数或累计频率,当所关注的是标志值较大的现象的次数分配情况时,通常采用向下累计。
我的答案:√得分:4.0分正确答案:√。