SAS学习系列15. 统计学基础知识Ⅱ—统计表,统计图
- 格式:docx
- 大小:1.04 MB
- 文档页数:17
小学六年级小升初数学专题复习(23)——统计表与统计图一、简单的统计表知识归纳1.统计表定义:是表现数字资料整理结果的最常用的一种表格.是由纵横交叉线条所绘制的表格来表现统计资料的一种形式.统计调查所得来的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格中,就形成“统计表”.2.统计表构成及格式:一般由表头、行标题、列标题和数字资料四个主要部分组成,必要时可以在统计表的下方加上表外附加.(1)表头应放在表的上方,它所说明的是统计表的主要内容.(2)行标题和列标题通常安排在统计表的第一列和第一行,它所表示的主要是所研究问题的类别名称和指标名称,通常也被称为“类”.(3)表外附加通常放在统计表的下方,主要包括资料来源、指标的注释、必要的说明等内容.统计表分类:统计表形式繁简不一,通常是按项目的多少,分为单式统计表与复式统计表两种.只对某一个项目数据进行统计的表格,称为单式统计表,也称之为简单统计表.统计项目在2个或2个以上的统计表格,称之为复式统计表.1.按作用不同:统计调查表、汇总表、分析表.2.按分组情况不同:简单表、简单分组表、复合分组表.(1)简单表:即不经任何分组,仅按时间或单位进行简单排列的表.(2)简单分组表:即仅按一个标志进行分组的表.(3)复合分组表:即按两个或两个以上标志进行层叠分组的表.常考题型例1:六一儿童节,学校进行歌咏比赛,7位评委给张华的打分如下:评委 1 2 3 4 5 6 7打分92 90 95 88 85 97 90去掉一个最高分,一个最低分,张华的平均分是分.分析:根据平均数的应用和求平均数的方法解答即可.解:去掉一个最高分97分,最低分85分;其他五位评委打的平均分是:(92+90+95+88+90)÷5=455÷5=91(分);答:张华的平均分是91分;故答案为:91.点评:此题属于简单的统计和求平均数问题,根据求平均数的方法,总数÷份数=平均数,列式计算即可.二、两种不同形式的单式条形统计图知识归纳1.条形图定义:用一个单位长度表示一定的数量,根据数量的多少画成长短不同的条形,条形的宽度必须保持一致,然后把这些条形排列起来,这样的统计图叫做条形统计图.它可以表示出每个项目的具体数量.2.单式条形统计图只表示一种数据的变化情况,比较简单.常考题型例:看图回答问题.(1)哪个季度的月平均销售量多?多多少?(2)从统计图中你还能发现什么信息?分析:(1)先分别求出第一季度和第三季度的月平均销售量,再比较哪个季度的月平均销售量多,进而求出多的具体的数量即可;(2)从统计图中我还能发现以下信息:一月销售120箱,二月销售110箱,三月销售130箱,七月销售195箱,八月销售190箱,九月销售185箱;其中二月销售的箱数最少,七月销售的箱数最多;等等.解:(1)第一季度的月平均销售量:(120+110+130)÷3,=360÷3,=120(箱),第三季度的月平均销售量:(195+190+185)÷3,=570÷3,=190(箱),190>120,190-120=70(箱);答:第三季度的月平均销售量多,多70箱.(2)从统计图中我还能发现以下信息:一月销售120箱,二月销售110箱,三月销售130箱,七月销售195箱,八月销售190箱,九月销售185箱;其中二月销售的箱数最少;七月销售的箱数最多;等等.点评:此题主要考查从条形统计图中获取信息,并根据信息解决问题;也考查了求平均数的方法:平均数=总数量÷总份数.三、单式折线统计图知识归纳1.折线统计图:用一个单位长度表示一定数量,用折线的上升或下降表示数量的多少和增减变化.容易看出数量的增减变化情况.2.折现统计图制作步骤:(1)标题:根据统计表所反映的内容,在正上方写上统计图的名称;(2)画出横、纵轴:先画纵轴,后画横轴,横、纵轴都要有单位,按纸面的大小来确定用一定单位表示一定的数量;(3)描点、连线:根据数量的多少,在纵、横轴的恰当位置描出各点,然后把各点用线段顺序连接起来.常考题型例:如图,电车从A站经过B站到达C站,然后返回.去时B站停车,而返回时不停,去时的车速为每小时48千米,返回时的车速是每小时千米.分析:从统计图中可知电车从A站到达B站用了4分钟,并在B站休息了1分钟,从B站到达C站用了5分钟,所以电车从A站到达C站共行驶了4+5=9(分钟),根据“速度×时间=路程”求出从A站到C站的距离;电车在C站休息了3分钟,从第13分钟开始行驶到第19分钟返回A站,根据“速度=路程÷时间”即可得出答案.解:48×(4+5)÷(19-13),=48×9÷6,=72(千米);答:汽车从C站返回A站的速度是每小时行72千米.故答案为:72.点评:此题首先根据问题从图中找出所需要的信息,然后根据数量关系式:“速度×时间=路程”和“速度=路程÷时间”即可作出解答.四、扇形统计图知识归纳1.扇形统计图的特点:扇形统计图是用整个圆的面积表示总数,用圆内的扇形面积表示各部分数量占总数的百分比.2.读懂扇形统计图:(1)获取信息的方法:运用综合、对比等多种观察方法,可以从扇形统计图中获取信息,还可以利用这些信息提出相应的问题.(2)扇形统计图的优点:它可以清楚地表示出部分数量与总数、部分数量与部分数量之间的关系.3.利用扇形统计图解决问题,就是解决有关不同类型的百分数应用题,按照百分数应用题的解题思路和解题方法进行解答.常考题型例:如图是某小学六年级学生视力情况统计图.①视力正常的有76人,视力近视的有人;②假性近视的同学比视力正常的人少%;(百分号前保留一位小数)③视力正常的学生与视力非正常学生人数的比是.分析:由图可知:把总人数看成单位“1”,视力正常的人数占总人数的38%,近视的人数占总人数的30%,假性近视的人数占总人数的32%;①视力正常的有76人,它对应的百分数是38%,由此用除法求出总人数,再求出总人数的30%就是近似的人数;②用视力正常占的百分数减去假性近视人数占的百分数,然后用求得的差除以视力正常占的百分数即可;③先求出视力非正常学生人数占总人数的百分数,然后作比.解:①76÷38%×30%,=200×30%,=60(人);答:视力近视的有60人.②(38%-32%)÷38%,=6%÷38%,≈15.8%;答:假性近视的同学比视力正常的人少15.8%.③38%:(32%+30%),=38%:62%,=38:62,=19:31;答:视力正常的学生与视力非正常学生人数的比是19:31.故答案为:60,15.8%,19:31.点评:解决本题关键是从图中读出数据,找出单位“1”,再根据基本的数量关系求解.一.选择题(共6小题)1.如图,()可以表示下面哪种情况的统计.A.4个学生期末数学考试成绩B.四年级喜欢各项运动的男女生人数C.小明1﹣﹣8岁的身高D.蛋糕店的草莓蛋糕和芒果蛋糕最近5天的销售情况2.下图表示的是甲班和乙班男、女生人数的情况.如果每个班都是36人,那么甲班的男生比乙班多()人.A.4 B.11 C.18 D.433.5、如图是两个厂男、女职工人数的统计图,甲厂和乙厂的女职工人数相比,()。
统计图知识点总结统计图是指利用图形表示统计数据的一种图形表达方式,是统计学中常用的一种数据展示方法。
统计图可以直观地展示出数据的分布规律和趋势变化,能够帮助人们更好地理解和分析数据。
在日常生活和工作中,统计图被广泛运用于各个领域,如教育、经济、医疗、环境保护等,以帮助人们更好地理解、分析和决策。
本文将从统计图的基本概念、常见类型和应用技巧等方面进行总结和介绍,以期帮助读者更好地掌握统计图知识。
一、统计图的基本概念1. 统计图的定义统计图是一种用图形来表示、说明和说明数字材料的图形,可直观地描述事物的数量关系、数量占比和变化趋势等现象。
统计图的主要功能是通过图形方式直观地展现数据的特点和规律。
2. 统计图的作用统计图能够帮助我们更好地理解和分析数据,通过直观的图形展示,可以更容易地观察数据的变化趋势和规律,帮助我们进行数据的比较和分析,以便更好地制定决策和规划。
3. 统计图的特点统计图一般具有直观、简洁、易于比较和分析等特点,能够使人们更直观地理解数据,便于做出决策和规划。
二、统计图的常见类型根据数据的类型和展示需求,统计图可分为多种类型,主要包括柱状图、折线图、饼图、散点图、雷达图等,每种类型都有其独特的优势和适用范围。
以下将对各种类型的统计图进行详细介绍。
1. 柱状图柱状图是以柱形的高度或长度来表示不同类别的数据,通过不同颜色或不同形状的柱形来区分不同类别的数据。
柱状图通常适用于展示不同类别的数据之间的比较情况,可以显示数据的大小和数量差异。
2. 折线图折线图是以折线的形式显示数据的变化情况,通过将数据点连成折线来描绘数据的变化趋势。
折线图适用于展示时间序列数据的变化情况,能够清晰地展现数据的趋势和变化规律。
3. 饼图饼图是以扇形的面积或角度来表示不同类别的数据,并通过不同颜色或标签来区分各个部分。
饼图通常适用于展示不同类别数据所占比例的情况,能够直观地呈现数据的比例和占比情况。
4. 散点图散点图是以点的形式展示两个变量之间的关系,通过将数据点在坐标平面上散布来显示变量之间的相关性。
15.统计学基础知识Ⅱ—统计表,统计图(七)统计表统计表和统计图都是表达统计资料的重要工具。
统计表,表达统计资料具体、明确,可以用来表达定性资料、定量资料、混合型资料;统计图,表达统计资料形象、生动,但只能要么表达定性资料、要么表达定量资料。
一、表达定性资料的统计表1. 二维2×2表列联表(2个定性指标)(1)完全随机设计从全体对象中随机抽取n个个体,然后按属性A、B的两个分类进行两两组合分成四格,得到相应的2×2的频数表。
(2)队列研究设计若把全体研究对象按因素A(是否接触某危险因素)分为两组(接触组、非接触组),再对每组的个体进行跟踪观察,并按因素B(是否患病)分成两组(患病组、未患病组),得到的2×2表。
(3)病例-对照研究设计若把全体研究对象按因素B(是否患某病)分成两组(病例组、对照组),再对每组中的个体进行回顾性调查,并按因素A(是否接触某危险因素)分成两组,得到的2×2表。
(4)配对研究设计n个受试对象(或一组样品)分别用甲乙两种检测方法进行检测,并按测定结果(阳性+,阴性-)分类计数,即按“都为阳性,一阳一阴,一阴一阳,都为阴性”四种情况分别计数,得到的2×2表。
2×2列联表,都可以作相关分析(两属性是否有相关关系)、独立性检验(或两总体率之间差异的显著性检验,用Fisher精确检验);2×2队列研究设计,常需要先计算相对危险度RR(=af/ce),并做假设检验:H0:RR=1;H1:RR=0. 做该检验需要用Mantel-Haenszel 2统计量(U统计量)。
2×2队列研究设计和2×2病例-对照研究设计,可由经验Logistic 变换公式计算Z i统计量,进而做U检验。
2×2配对研究设计,检验两种检测方法之间有无显著性差别。
2. 二维R×C列联表(R,C≥2)(1)双向无序R×C表(2)单向有序R×C表(3)双向有序属性不同R×C表(4)双向有序属性相同R×C表适用的分析、检验方法:双向无序R×C表,所选用的统计方法应当与分组变量各水平的先后顺序或取值大小无关,仅与表中总频数、各行的合计、各列的合χ检验、基计有关。
符合这些要求的方法有Pearson的拟合优度检验2χ检验、对数线性模型、于似然函数(或熵的分解)导出的似然比2SAS的FREQ过程步进行Fisher精确检验。
单向有序R×C表,所选用的统计方法应当与有序的那个分组变χ检验已无能量各水平的先后顺序或取值大小有关。
显然,通常的2为力,应考虑把有序变量当作半定量指标在计算中加以考虑的方法:秩和检验、Ridit检验、CPD分析、有序变量的Logistic回归模型、有序变量的对数线性模型。
双向有序属性不同R×C表,当把两个属性看成地位平等的相互关系时,常需要考虑它们之间是否存在线性关系,即需要对资料进行相关分析(Spearman秩相关分析、典型相关分析);若把一个属性当成自变量,另一个属性当成因变量,常需要考察它们之间是否存在直χ检验:“利线变化趋势,即需要对资料进行线性趋势检验(U检验、2χ分量和偏离线性回归的2χ用回归思想产生的与线性回归有关的2分量”)。
双向有序属性相同R×C表,两个分组变量都是“测定结果”,且档次划分也相同(有序)。
对这种资料,研究者关心的不是两变量之间是否存在相关性或线性趋势,而是这两种测定结果的一致性如何。
适合采用一致性检验:Kappa检验。
特别地,如表3.2.8,研究者可能更关心:文化课成绩与体育锻炼达标的等级之间是否呈现某种特殊的变化趋势(直线趋势模型,即主对角线上的频数占大多数,之外的频数之和趋于0),可以用前面线性趋势检验、或一些特殊模型:对称模型、条件对称模型、对角线模型。
注:有时候若想要更多的挖掘R×C表的统计信息,还可以对R ×C表进行分割,得到若干2×2表做进一步研究。
3. 高维列联表(变量个数≥3)例如,下面是三维列联表:处理高维列联表资料的方法,借助统计软件有Logistic回归模型(只能分析自变量对因变量的影响)、对数线性模型(可分析全部变量及其交互作用对列联表中格网格上理论频数之对数的影响);也可以将高维列联表压缩为二维列联表再进行处理。
4. 具有重复测量设计的定性资料(做方差分析)(1)单因素重复测量资料:方差分析的总思想:将总变异分解为:个体间(between subjects)变异与个体内的变异。
其中个体内变异是与重复因素有关的变量。
(2)双因素重复测量资料方差分析总思想:将总变异分解为:对象间(between subjects)变异与对象内(within subject)变异,其中对象内变异是与重复因素有关的变量。
二、定量资料的统计表1. 随机区组设计一元定量资料适合做方差分析,事先需要检验正态性和方差齐性(若不满足则要数据变换和非参数检验)。
2. 含一个协变量的随机区组设计一元定量资料初始体重x是协变量,适合做一元协方差分析(若含有多个协变量,则要做多元协方差分析)。
3. 拉丁方设计一元定量资料4×4拉丁方设计:注:拉丁方要求分组数和处理数相同,在每行每列各种处理都出现且仅出现一次。
既要控制系统误差且试验动物的数量又较少,则常采用拉丁方设计(处理数不能太多,一般以4~10个为宜)。
基本要求:(1)必须是三个因素(分组、处理、结果)的实验,且三个因素的水平数相等(若三因素的水平数略有不同,应以主要处理因素的水平数为主,其它两因素的水平数可进行适当调整);(2)三因素间是相互独立的,均无交互作用;(3)各行、列、字母所得实验数据的方差齐。
4. 配对交叉设计一元定量资料示例:两阶段交叉设计当试验中涉及到一个具有2水平的试验因素,这两个水平要先后作用于同一个受试对象,并且这两个水平要么在条件相近的同一对受试者中交叉实施,就称为配对二阶段交叉设计;要么在两组受试者中交叉实施,就称为成组二阶段交叉设计。
可以考察一个具有两水平的试验因素和两个受试对象组因素(即个体差异、测定顺序)对观测结果的影响;试验因素的两个水平在两组受试对象中施加的顺序呈交叉状;对于每一个受试者而言,均有一个“洗脱期”,从而消除“携带效应”的影响。
另外,还有三阶段交叉设计、3×3交叉设计(将三种处理或药物分三个时期先后给予同一个受试者,观察受试者接受每种处理后的反应;处理A、B、C施加的顺序共有6种排列方式,即ABC、ACB、BAC、BCA、CAB、CBA,故至少要将受试者分为6个组,每组中至少要有一位受试者)。
5. 析因设计析因设计(factorial design)是一种多因素的交叉分组设计。
它不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用。
两个或多个因素如存在交互作用,表示各因素不是各自独立的,而是一个因素的水平有改变时,另一个或几个因素的效应也相应有所改变;反之,如不存在交互作用,表示各因素具有独立性,一个因素的水平有所改变时不影响其他因素的效应。
6. 裂区试验设计先将每一区组按第一因素的处理数划分小区(称为主区),在主区里随机安排主处理,然后在每个主处理里按第二因素的处理数再划分小区(称为副区),在副区里随机排列副处理。
数据。
(八)统计图一、定量变量的统计图形1. 直方图(histogram)对于数值型变量,常用直方图来展示某个变量取值的分布。
将变量取值的范围分成若干区间,在等间隔区间的情况,每个区间的长度称为组距。
考察数据落入每一区间的频数与频率,在每个区间上画一个矩形,它的宽度是组距,它的高度可以是频数、频率或密度(频率/组距),在高度是密度的情况,每一矩形的面积恰是数据落入区间的频率。
这种直方图可以估计总体的概率密度。
2. 盒形图(boxplot)盒形图(也称箱图、箱线图、盒子图)是用更为简洁的方法表现数据在数轴上的分布及其特点的图形。
例如,下图是分地区情况对家庭收入所绘的盒形图:3. 散点图(Scatter Plot)通常得到的数据可能有两个变量,比如家庭收入和家庭支出。
希望通过图形了解家庭收入和家庭支出的关系,这时可以用一个变量为横坐标(如家庭收入),另一个为纵坐标(如家庭支出)对数据进行描点来作图。
这种图称为散点图。
例如,4. 线图(Line Plot)将散点进一步用线段连接起来,就是线图。
可以表示变量间的取值变化情况,有单式和复式两种。
在复式线图中可用不同颜色的实线来标志区别,例如,二、分类变量的统计图形1. 条形图(Bar Chart)用若干个细长的矩形条的高度(不是宽度,也不是面积)来表示定性变量各水平组的频数。
分为单式条形图——横轴上只有一个定性变量;复式条形图——横轴上有两个或多个定性变量例如,2. 饼图(Pie Chart)用圆的各扇形面积的大小来表示定性变量各水平组的频数。
例如,3. 马赛克图(Mosaic Plot)马赛克图一般不对单个变量作,而是对两个分类变量来做,好处是直观显示了两个变量每种取值组合的观测个数和比例。
例如,三、其它图1. 经验分布图经验分布图,是根据样本观测值做出的经验分布函数而绘制的,经验分布函数是样本对总体累积分布函数的一个估计。
2. 概率图概率图,在直方图基础上我们可以猜想变量是否服从某类型的分布?通过绘制概率图可以来证实我们的想法。
概率图将数值排序,给出每个数值对应的分位数,然后打点作图。
如果这些点呈现线性特征,说明他们与理论分布相符,同时又在图像上加上一条给定分布的曲线,并给出分布的系数。
3. PP图PP 图,是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地检测样本数据是否符合正态分布分布。
如果被检验的数据符合所指定的分布,则代表样本数据的点应当基本在代表理论分布的对角线上。
4. QQ图绘制QQ图,鉴别样本分布是否近服从正态分布的一种直观简便的图形,它是以某种分布的分位数为横坐标,以样本值为纵坐标绘制的散点图。
Q-Q图的结果与P-P图非常相似,只是P-P图是用分布的累计比,而Q-Q图用的是分布的分位数来做检验。
和P-P图一样,如果数据为正态分布,则在Q-Q正态分布图中,数据点应基本在图中对角线上。
注:Q-Q图与P-P图判断正态分布不具准确性,一般不太用。