数据的整理复习
- 格式:docx
- 大小:14.99 KB
- 文档页数:2
数据的收集整理及描述复习教案一、教学目标:1.了解数据的收集方法;2.掌握数据的整理和描述方法;3.能够运用所学知识进行实际问题的解决。
二、教学重难点:1.数据的整理方法;2.数据的描述方法。
三、教学内容:1.数据的收集方法;2.数据的整理方法;3.数据的描述方法。
四、教学过程:1.导入:引入教材内容,告诉学生本节课将学习数据的收集、整理及描述方法,提出问题:“什么是数据?为什么需要对数据进行收集、整理和描述?”让学生思考并回答。
2.讲解:1)数据的收集方法:-个别观察法:通过观察个别现象得到数据,适用于小样本的情况;-抽样观察法:通过观察部分现象推断整体情况,适用于大样本的情况;-实验法:通过特定条件的实验得到数据,适用于实验研究的情况;-文献调查法:通过查阅文献资料得到数据,适用于需要详细资料的情况。
2)数据的整理方法:-分类整理法:将数据按照一定规则进行分类整理,便于统计和分析;-图表整理法:使用图表形式展示数据,如表格、条形图、折线图等;-统计指标法:使用统计指标描述数据,如均值、中位数、众数等。
3)数据的描述方法:-数值描述:使用数字进行描述,如平均数为5、最大值为10等;-可视化描述:使用可视化方式展示数据,如图表、图像等;- 文字描述:使用文字进行描述,如“大部分学生的体重在50-70kg之间”等。
3.练习:请学生根据以下情景进行数据的收集、整理和描述:情景一:班所有学生的身高数据情景二:地区每个月的降雨量数据情景三:电商平台每天的订单量数据学生需要运用所学的知识,选择合适的数据收集方法,并进行数据整理和描述。
4.讲解和总结:教师对练习结果进行点评,并解释正确答案。
总结本节课的内容,强调数据的收集、整理和描述在统计学中的重要性,及应用范围等。
五、实践应用:让学生以小组形式,选择一个实际问题,进行数据收集、整理和描述。
鼓励学生自主思考和合作解决问题,并对解决结果进行展示和交流。
六、课堂作业:要求学生选择一个自己感兴趣的话题,进行数据的收集、整理和描述,并写一篇小结,归纳所学知识和体会。
数据的收集与整理复习一、引言数据的收集与整理是数据分析的重要环节,它涉及到从各种来源收集数据,并将其整理、清洗、转换为可用于分析的格式。
本文将详细介绍数据收集与整理的步骤及技巧,以帮助读者更好地掌握这一重要的数据处理技能。
二、数据收集1. 数据来源数据可以来自各种渠道,包括但不限于以下几个方面:- 内部数据:组织内部已有的数据,如销售记录、客户信息等。
- 外部数据:来自外部机构或第三方提供的数据,如行业报告、市场调研数据等。
- 网络数据:通过网络爬虫或API接口获取的数据,如社交媒体数据、网站访问数据等。
2. 数据收集工具数据收集可以使用多种工具,根据数据来源的不同选择合适的工具进行收集,常用的工具包括:- Excel:适用于结构化数据的收集和整理。
- 数据库管理系统:适用于大规模数据的管理和查询。
- 爬虫工具:适用于从网页中抓取数据。
- 调查问卷工具:适用于收集用户反馈和调查数据。
3. 数据收集步骤数据收集的步骤可以分为以下几个阶段:- 确定数据需求:明确需要收集的数据类型、数据量和数据来源。
- 设计数据收集方法:确定数据收集的方式,如调查问卷、实地观察等。
- 收集数据:按照设计好的方法进行数据收集,确保数据的准确性和完整性。
- 数据录入:将收集到的数据录入到相应的工具或系统中。
- 数据验证:对录入的数据进行验证,确保数据的准确性和一致性。
三、数据整理1. 数据清洗数据清洗是指对收集到的数据进行检查和处理,以确保数据的质量和准确性。
常见的数据清洗操作包括:- 缺失值处理:对缺失值进行填充或删除。
- 异常值处理:对异常值进行识别和处理。
- 重复值处理:对重复值进行删除或合并。
- 数据格式转换:将数据转换为统一的格式。
2. 数据转换数据转换是指将原始数据转换为可用于分析的格式。
常见的数据转换操作包括:- 数据合并:将多个数据集合并为一个。
- 数据拆分:将一个数据集拆分为多个。
- 数据透视:根据特定的维度和指标对数据进行汇总和分析。
数据分析复习提纲
一、数据的基本分类
1.定性数据
2.定量数据
定量数据是有关度量的数据,其中有两类:
(1)离散定量数据:是指只有有限个可能取值的数据,如年龄、性别、省份等。
(2)连续定量数据:是数值的定量数据,如年收入、体重等。
二、数据清洗
数据清洗是数据分析过程中的重要环节,它的主要作用是检查数据的
质量和完整性,进行缺失值处理、异常值处理、重复值处理等,保证分析
结果准确。
1.缺失值处理
缺失值处理是一种清理数据的重要技术,其主要目的是用有效的方式
插补缺失值,保证分析时充分利用数据资源。
常用的插补缺失值的方法有:均值插补、中位数插补、众数插补等。
2.异常值处理
异常值处理是指检测和处理离群点的一种技术,它的目的是检测到和
去除异常值,以保证分析的正确性。
常用的异常值处理方法有:硬/软异
常值删除法、极值缩放法、内外点聚类法等。
3.重复值处理
重复值处理是指在数据清洗中,检测和删除数据中的重复值,保证原始数据的一致性。
第20 章数据的整理与初步处理基础复习知识点 1 平均数1. 为了增强学生对新型冠状病毒的认识与防控能力,某学校组织了“抗击疫情,我们在行动”学生手抄报比赛活动.其中八年级五个班收集的作品数量(单位:幅)分别为:42,48,45,46,49,则这组数据的平均数是 ( )A.44B.45C.46D.472. 某快递公司快递员张山某周每日投放快递物品件数为:有4天是30件,有2天是35件,有1天是41件,这周张山日平均投递物品件数为 ( )A.35.3件B.35件C.33件D.30件3. 八年级某班五个合作学习小组的人数如下:5,7,6,x,7.已知这组数据的平均数是6,则x的值为 ( )A.7B.6C.5D.44. 一次演讲比赛中,评委将从演讲内容、演讲能力、演讲效果三方面为选手打分,并分别按5:3:2的比例计入总评成绩,小明的三项成绩(单位:分)分别是90、95、90,他的总评成绩是 ( )A.91分B.91.5分C.92分D.92.5分5.如果公司分别赋予面试和笔试7和3的权.根据甲、乙两人的平均成绩,公司将录取 .7. 某班有50名学生,平均身高为166 cm,其中20名女生的平均身高为160 cm,则30名男生的平均身高为cm.8. 某公司招聘职员两名,对甲、乙、丙、丁四名候选人进行了笔试和面试,各项成绩满分均为100分,然后再按笔试占60%(1)这四名候选人面试成绩的平均数为 .(2)现得知候选人丙的综合成绩为87.6分,则表中x的值等于 .(3)求其余三名候选人的综合成绩,并以综合成绩排序确定所要招聘的前两名人选.知识点 2数据的集中趋势1. 一般地,将一组数据按由小到大的顺序排列(即使有相等的数据也要全部参加排列),处于正中间位置的一个数据(或中间位置两个数据的平均数)叫做这组数据的中位数.2. 一组数据中出现次数最多的数据称为这组数据的众数,一组数据可以有不止一个众数,也可以没有众数.3. 平均数、中位数和众数的选用:平均数能充分利用各数据的信息,但易受极端值的影响;当一组数据中的个别数据波动较大时,一般用中位数来描述这组数据的集中趋势,但中位数不能充分地利用各数据的信息;当一组数据中某些数据多次重复出现时,众数往往更能反映问题,但当各数据重复出现的次数大致相同时,它往往没有什么特别意义.9. 在一次女子跳水比赛中,八名运动员的年龄(单位:岁)分别为:12,13,13,14,15,13,13,15.这组数据的众数是( )A.12B.13C.14D.1510. 新冠肺炎疫情爆发以来,山西共派出13 批医疗队支援湖北,共计1516人,白衣逆行,千里驰援.如表是山西11A.33人B.86人C.91人D.98人11. 若一组数据:2,2,x,5,7,7的众数为7,则x为 ( )A.2B.5C.6D.712. 通过测试从9位书法兴趣小组的同学中,择优挑选5位去参加中学生书法表演,若每位同学的测试成绩各不相同.则被选中同学的成绩肯定不少于这9位同学测试成绩统计量中的 ( )A.平均数B.众数C.中位数D.加权平均数13.该班此次英语听力口语考试成绩众数比中位数多分.14. 在一次数学答题比赛中,六位同学答对题目的个数分别为:7,5,3,7,5,10,则这组数据的众数是 .15. 为了保障人民群众的身体健康,在预防新型冠状病毒期间,进入超市购物人员都需要测量体温,某8位顾客已知这8位顾客的平均体温为37C.求:(1)表中a的值.(2)这组数据的中位数和众数.16. 某公司销售部有营业员15人,该公司为了调动营业员的积极性,决定实行目标管理,根据目标完成的情况对营业员进行适当的奖励,为了确定一个适当的月销售目标,公司有关部门统计了这15人某月的销售量,如下(1)直接写出这15名营业员该月销售量数据的平均数、中位数、众数.(2)如果想让一半左右的营业员都能达到月销售目标,你认为(1)中的平均数、中位数、众数中,哪个最适合作为月销售目标? 请说明理由.温馨提示:确定一个适当的月销售目标是一个关键问题,如果目标定得太高,多数营业员完不成任务,会使营业员完不成任务,进而失去信心;如果目标定得太低,不能发挥营业员的潜力。
数据的收集与整理复习题及答案一、选择题(共10小题;共30分)1. 假如你想知道自己的步长,那么你的调查问题是 ( )A. 我自己B. 我每跨一步平均长度为多少?C. 步长D. 我走几步的长度2. 调查某班30名同学的跳高成绩时,在收集到的数据中,不足1.50米的数出现的频率是0.82,则达到或超过1.50米的数出现的频率是 ( )A. 0.82B. 0.18C. 30D. 13. 为了解某市参加中考的32000名学生的体重情况,抽查了其中1600名学生的体重进行统计分析.下面叙述正确的是 ( )A. 32000名学生是总体B. 1600名学生的体重是总体的一个样本C. 每名学生是总体的一个个体D. 以上调查是普查4. 甲、乙两所学校男女生人数如图所示,甲学校有1000人,乙学校有1250人,则A. 甲校的女生与乙校的女生一样多B. 甲校的女生比乙校的女生少C. 甲校的女生比乙校的女生多D. 甲校与乙校共有女生1250人5. 为了解某校2000名师生对我市“三创”工作(创国家园林城市、国家卫生城市、全国文明城市)的知晓情况,从中随机抽取了100名师生进行问卷调查,这项调查中的总体是 ( )A. 2000名师生对我市“三创”工作的知晓情况B. 从中抽取的100名师生C. 从中抽取的100名师生对我市“三创”工作的知晓情况D. 1006. 某校为了解九年级11个班级学生(每班40名)的视力情况,下列做法中,比较合理的是 ( )A. 了解每一名学生的视力情况B. 了解每一名男生的视力情况C. 了解每一名女生的视力情况D. 每班各抽取10名男生和10名女生,了解他们的视力情况7. 今年我市有近4万名考生参加中考,为了解这些考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,以下说法正确的是 ( )A. 这1000名考生是总体的一个样本B. 近4万名考生是总体C. 每位考生的数学成绩是个体D. 1000名学生是样本容量8. 在一个不透明的袋子里装有3个黑球和若干个白球,它们除颜色外都相同.在不允许将球倒出来数的前提下,小明为估计其中的白球数,采用如下办法:随机从中摸出一球,记下颜色后放回袋中,充分摇匀后,再随机摸出一球,记下颜色,⋯,不断重复上述过程.小明共摸100次,其中20次摸到黑球.根据上述数据,小明估计口袋中白球大约有 ( )A. 10个B. 12个C. 15个D. 18个9. 已知 2001 年至 2012 年杭州市小学学校数量(单位:所)和在校学生人数(单位:人)的两幅统计图,由图得出如下四个结论:①学校数量 2007 年至 2012 年比 2001 年至 2006 年更稳定;②在校学生人数有两次连续下降,两次连续增长的变化过程;大于1000;③ 2009 年的在校学生人数学校数量④2009 年至2012 年,各相邻两年的学校数量增长和在校学生人数增长最快的都是2011 年至2012 年.其中,正确的结论是A. ①②③④B. ①②③C. ①②D. ③④10. 如图所示的是小刚一天中的作息时间分配的扇形统计图,如果小刚希望把自己每天的阅读时间调整为2小时,那么他的阅读时间需增加A. 15分钟B. 48分钟C. 60分钟D. 105分钟二、填空题(共6小题;共18分)11. 据统计,某州今年参加九年级毕业会考的学生为46000人,为了了解全州九年级考生毕业会考数学考试情况,从中随机抽取了500名考生的数学成绩进行统计分析,在这个问题中,样本容量是.12. 我区有15所中学,其中九年级学生共有3000名.为了了解我区九年级学生的体重情况,请你运用所学的统计知识,将解决上述问题要经历的几个重要步骤进行排序.①收集数据;②设计调查问卷;③用样本估计总体;④整理数据;⑤分析数据.则正确的排序为(填序号)13. 如图所示,(1)总共统计了名学生的心跳情况;(2)次数段的学生数最多,约占%;(3)如果每半分钟心跳30−39次属于正常范围,那么心跳次数属于正常范围的学生约占%.14. 刘强同学为了调查全市初中生人数,他对自己所在的城区初中生人数作了调查,城市人口大约3万人,初中生人数大约1200人,全市人口实际大约300万,为此他推断全市初中生人数为12万,但教育局提供全市初中生人数为8万,与估计有很大的偏差,用你所学的统计知识找出其中错误的原因:.15. 某市青年足球队的12名队员的年龄情况如下表所示,则这12名队员中最小年龄是岁;最大年龄的频数是,出现次数最多的年龄的频数是.16. 要了解一批炮弹的杀伤力情况,适宜采取(选填“全面调查”或“抽样调查”).三、解答题(共6小题;共52分)17. 开发新能源,是社会主义新农村建设的必然要求.你想知道现在农村利用新能源的现状和开发潜能吗?请你设计一个调查方案,然后加以总结.(1) 你调查的问题是.(2) 你调查的对象是.(3) 你打算采用的方法是.(4) 你打算向调查对象提什么样的问题?(5) 对你的调查结果你打算如何处理?18. 某校八年级所有女生的身高统计数据如下表,请回答下列问题:(1)(2) 身高在145 cm到165 cm的女生有多少人?(3) 一女生的身高恰好为155 cm,哪一组包含这个身高?这一组出现的频数、频率各是多少?19. 某电视台播放一则新闻,奶粉“合格率为50%”,请据此回答下列问题:(1) 这则新闻是否说明市场上所有奶粉的合格率恰好有50%为合格?(2) 你认为这则新闻来源于普查还是抽样调查?为什么?(3) 如果已知在这次抽查中各项指标均合格的奶粉共有1000袋,你能算出共有多少袋奶粉接受检查了吗?20. 下列调查中,哪些适合抽样调查?哪些适合普查?为什么?(1) 工厂准备对一批即将出厂的饮料中含有细菌总数的情况进行调查;(2) 小明准备对全班同学所喜爱的球类运动的情况进行调查;(3) 了解全市九年级同学的视力情况;(4) 某农田保护区对区内的水稻秧苗的高度进行调查.21. 某校有三个年级,各年级的人数分别为七年级600人,八年级540人,九年级565人,学校为了解学生生活习惯是否符合低碳观念,在全校进行了一次问卷调查,若学生生活习惯符合低碳观念,则称其为“低碳族”;否则称其为“非低碳族”,经过统计,将全校的低碳族人数按照年级绘制成如下两幅统计图:(1) 根据图①、图②,计算八年级“低碳族”人数,并补全上面两个统计图;(2) 小丽依据图①、图②提供的信息通过计算认为,与其他两个年级相比,九年级的“低碳族”人数在本年级全体学生中所占的比例最大,你认为小丽的判断正确吗?说明理由.22. 随着互联网、移动终端的迅速发展,数字化阅读越来越普及,公交、地铁上的“低头族”越来越多.某研究机构针对“您如何看待数字化阅读”问题进行了随机问卷调查(问卷调查表如右图所示),并将调查结果绘制成图1 和图2 所示的统计图(均不完整).请根据统计图中提供的信息,解答下列问题:(1) 本次接受调查的总人数是人.(2) 请将条形统计图补充完整.(3) 在扇形统计图中,观点E的百分比是,表示观点B的扇形的圆心角度为度.(4) 假如你是该研究机构的成员,请根据以上调查结果,就人们如何对待数字化阅读提出建议.答案第一部分1. B2. B3. B4. A5. A6. D7. C8. B9. B 10. C第二部分11. 50012. ②①④⑤③.13. 27;30−33;26;5614. 抽样不具有代表性15. 18;2;416. 抽样调查第三部分17. (1) 农村新能源的利用现状和开发潜能17. (2) 不同年龄段的村民17. (3) 问卷调查,实地考察17. (4) 使用新能源有什么好处?你打算如何利用和开发新能源?17. (5) 写调查报告,呈交有关部门,以引起人们的重视.(答案不唯一,只要符合实际即可)18. (1) 这个学校八年级共有女生50+60+70+20=200(人).18. (2) 身高在145 cm到165 cm的女生有60+70=130(人).×100%=35%.18. (3) 从上表可以看出,155 cm在第3组,第3组出现的频数是70,频率为7020019. (1) 不一定.19. (2) 抽样调查,不可能普查,普查具有破坏性.19. (3) 1000÷50%=2000(袋),所以约有2000袋奶粉接受检查了.20. (1) 适合抽样调查,因为调查具有破坏性.20. (2) 适合普查,因为考察对象数量很少,易于调查.20. (3) 适合抽样调查,因为考察对象较多,且费时、费力.20. (4) 适合抽样调查,因为考察对象的数量巨大,且费时、费力等.21. (1)21. (2) 七年级:300÷600=50%;八年级:444÷540=82.2%;九年级:456÷565=80.7%;∵50%<80.7%<82.2%,∴小丽的判断是错误的,八年级最大.22. (1) 500022. (2)22. (3) 4%;1822. (4) 答案不唯一.如:应该充分利用数字化阅读获取信息方便的优势,但不要成为“低头族”而影响人际交往.。
【期末复习六】 数据的收集与整理【知识优梳理】1、数据处理的基本过程是:⑴ (普查、抽样调查);⑵ (作出统计表、统计图);⑶ (根据统计表、统计图进行描述);⑷ (分析原因、得出结论、作出判断)。
2、收集数据的方法有: 调查法、 调查法、 查询法。
调查的方式分为 调查和 调查两类。
要能判断适合哪一类。
抽样调查要具有 性、 性和 性。
在抽样调查中总体: 个体:样本: 样本容量: (样本容量无单位...)3、统计中经常用 整理数据,为了更直观地看出表格中的信息,用 图、 图、 图 和 图来描述数据。
条形图的特点: ,扇形图的特点: , 折线图的特点: ,直方图的特点: 。
4、画直方图的步骤是:(1)计算 : - ;(2)决定 和 (近1法);(3)列 :划记法;(4)画 :小长方形的面积= × = 。
【例题精分析】例1、为了解某市七年级一次期末数学测试情况,从8万名考生中抽取了1000名学生的数学成绩进行统计分析,下列说法中正确的是( )A 、这1000名学生是总体的一个样本B 、每位学生的数学成绩是个体C 、8万名学生是总体D 、1000名学生是样本容量例2、某火车站为了了解某月每天上午乘车人数,抽查了其中10天的每天上午的乘车人数,所抽查的这10天每天上午乘车人数是这个问题的( )A 、总体B 、个体C 、一个样本D 、样本容量例3、为了调查学校毕业生的健康状况,从800名毕业生中抽取了50名学生进行体检,这个问题中: 总体是 ;个体是 ;样本是 .例4、某班学生的期中成绩(成绩为整数)的频数分布表如下,请根据表中提供的信息回答下列问题:(1)m = ,n = ,p = ,q = ;(2)在表内,频率最小的一组的成绩范围是 (3)成绩优秀的学生有 人(成绩大于或等于80分为优秀).例5、下图是一位病人的体温记录折线图,看图回答下列问题:(1)护士每天每隔 小时给病人量一次体温; (2)这个病人的最高体温是 ℃, 最低体温是 ℃;(3)他在4月8日12时的体温是 ℃; (4)图中的横虚线表示 ; (5)从图中看这个病人的病情是恶化还是好转?48月日/h 47月日49月日人数/人0510152000.51 1.52时间/时38个数据,第三、四、五组中共有46个数据;又第三组,第三组中的频数为 。
第一章数据结构概述基本概念与术语1.数据:数据是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序所处理的符号的总称。
2。
数据元素:数据元素是数据的基本单位,是数据这个集合中的个体,也称之为元素,结点,顶点记录。
(补充:一个数据元素可由若干个数据项组成。
数据项是数据的不可分割的最小单位。
)3.数据对象:数据对象是具有相同性质的数据元素的集合,是数据的一个子集。
(有时候也叫做属性。
)4.数据结构:数据结构是相互之间存在一种或多种特定关系的数据元素的集合。
(1)数据的逻辑结构:数据的逻辑结构是指数据元素之间存在的固有逻辑关系,常称为数据结构。
数据的逻辑结构是从数据元素之间存在的逻辑关系上描述数据与数据的存储无关,是独立于计算机的。
依据数据元素之间的关系,可以把数据的逻辑结构分成以下几种:1.集合:数据中的数据元素之间除了“同属于一个集合“的关系以外,没有其他关系.2.线性结构:结构中的数据元素之间存在“一对一“的关系。
若结构为非空集合,则除了第一个元素之外,和最后一个元素之外,其他每个元素都只有一个直接前驱和一个直接后继。
3。
树形结构:结构中的数据元素之间存在“一对多“的关系.若数据为非空集,则除了第一个元素(根)之外,其它每个数据元素都只有一个直接前驱,以及多个或零个直接后继。
4.图状结构:结构中的数据元素存在“多对多"的关系.若结构为非空集,折每个数据可有多个(或零个)直接后继.(2)数据的存储结构:数据元素及其关系在计算机内的表示称为数据的存储结构。
想要计算机处理数据,就必须把数据的逻辑结构映射为数据的存储结构。
逻辑结构可以映射为以下两种存储结构:1.顺序存储结构:把逻辑上相邻的数据元素存储在物理位置也相邻的存储单元中,借助元素在存储器中的相对位置来表示数据之间的逻辑关系.2.链式存储结构:借助指针表达数据元素之间的逻辑关系。
不要求逻辑上相邻的数据元素物理位置上也相邻。
数据的收集与整理
小结与复习教材教法
一、教材分析
本章共有抽样调查、数据的整理与表示,由样本推断总体三节内容,都是统计的初步知识。
教材从一些日常生活中的实例,引入抽样调查的方法,介绍了抽样调查是科学可靠的,在此基础上对抽样调查得到的数据进行整理,并介绍了对整理后的数据的表示方法。
还说明了用样本估计总体时,抽取的样本一是要有代表性,二是样本容量要足够大,这样才能用样本特性来估计总体特性。
重点:用样本估计总体的方法。
难点:对抽样调查得到的数据进行整理与表示。
本章是统计的初步知识,是对前面所学有关统计知识的总结与概括。
二、教法建议
1.教学时,注意本章内容与生活、生产、科学技术的联系,要多从学生身边的实例来切入主题,这样可以激起学生学习的兴趣。
2.注意温故而知新,复习本章时也要结合已学过的平均数、频率、频数等等知识来进行复习。
3.让学生体会统计的思想方法,运用统计的思想方法解决生活中遇到的有关问题。
4.要养成认真细心的学习习惯,并注意加强合作的学习意识。
学生对这一章知识掌握的情况如何,学习中还存在着什么问题,只有在检验之后才能清楚,之后才好进行恰当的答疑释难。
因此,复习时,以看学生是否已掌握了统计的初步知识,是否会解决简单的实际问题为标识。
所以,如果把复习课结合实习作业进行,是比较理想的。
在完成实习作业(或给出一个实例)的同时,给学生一个检查知识的详细纲要,让学生边复习边做实习作业,会收到事半功倍的效果。
数据的离散程度
1•我们通常用数据的离散程度来描述一组数据的波动范围和偏离平均数的差异程度. 组数据离散程度的统计量有:极差、方差、标准差
2•—组数据中的最大数据与最小数据的差称为极差,即 极差=最大数据一最小数据. 3.在一组数据中,各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差,通 常用S2表示,即
oS 2
=—[(兀丄-壬尸 <X 2-X ?+(^3-^)2+……+(务-壬)2 ]。
n
方差越小,这组数据的离散程度越小,数据就越集中,平均数代表性就越大 4.标准差:
标准差也是表示一组数据离散程度的量 .
例题
一次科技知识竞赛,两组学生成绩统计如下: 分数 50
60 70 80 90 100 人 甲组 2 5 10 13 14 6 数
乙组
4
4
16
2
12
12
已知算得两个组的人均分都是 80分,请根据你所学过的统计知识,进一步判断这两个组这 次竞赛中成绩谁优谁次,并说明理由
.
反映一
(场―©2十(乜一02十…(耳—
云)2
H
.••甲组的成绩更整齐些.
中,数字10和20分别表示样本的(). A.数据个数、方差 B.平均数、容量 C •数据个数、平均数
D.标准差、平均数
2•样本3,-4, 0,-1,2的方差是 __________ .
3•—组数据的标准差是 2,将这组数据都扩大为原来的
3倍,则所得的一组数据的标准差是
4•
(1)2002年月气温的极差是 ________ , 2003年月气温的极差是 ___________ .由此可知: 年同期气温变化较大;
⑵2002年2月的平均气温是 _______ , 2003年2月的平均气温是 ______________ ;
⑶2002年2月的气温方差是 _________________ , 2003年3月的气温方差是 ________________
由此可知 ____________ 年同期气温变化较稳定.
_ 2 + 5 十 10 十 13 + 14 + 6
25 4 4-4 + 16 + 2 + 12 + 12 25 ;乙
6 3 _ 6 v^=l[(2-^/+(5-^)a +^ + C6-y)a ] = ™?
v 皤=|[(4-爭
十
(4—争十…十(12 —弓)
】
245 ]=
—
练习
1•在样本方差的计算公式
10 L
—20 I + …+ 他。
—20)^ ] |。