第10章_1数据分析与处理
- 格式:ppt
- 大小:3.74 MB
- 文档页数:61
§10.1 统计调查(1)【教学目标】1.了解通过全面调查收集数据的方法和划记法,经历简单的数据的收集、整理、描述和分析数据得出结论,即数据处理的一般过程;2.会设计简单的调查问卷收集数据,能根据问题查找有关资料,获得数据信息,会用表格整理数据,用条形图、扇形图直观地描述数据;3.通过实际参与收集、整理、描述、分析数据的活动,经历统计的一般过程,感受统计在生活和生产中的作用,增强学习统计的兴趣,初步建立统计的观念,初步培养重视调查研究的良好习惯和科学态度.【教学过程】一、预习导航回忆小学所学的统计的有关知识,并在旁边空白处记录下来.二、新知探究自学课本回答下列问题:我们可以采用的方法收集数据;统计中经常用整理数据;可以用和来直观地描述数据.叫做全面调查.尝试练习1:问题一:如果要了解全班同学对语文、数学、外语、政治、历史、地理、生物七个学科的喜爱情况,你会怎样做?1.收集数据如何收集数据,让各小组的同学在下面的问卷调查中获取数据.填完后交小组长,由小组长表唱票,小组成员在表格中进行统计.1. 确定调查目的;2. 选择调查对象;3. 设计调查问题.2.整理数据语数外物政历地生51 1 2 人学科类3.描述数据描述数据的方法通常用条形统计图或扇形统计图来直观地反映数据揭示的信息. 条形统计图:就是用坐标的形式来描述.如:扇形统计图:用一个圆代表总体,然后将各部分所占的百分比将圆分成若干个部分,再在各部分中标出相应的百分比和名称.如图所示:制作扇形统计图关键是确定各部分所占圆心角的大小,它的确定方法就是用该部分数据所占的百分比×360o ,如语文所占的百分比是20%,则相对应的圆心角为360o ×20%=72o.注意:各部分的圆心角之和可能与360 o有一定的误差.条形统计图与扇形统计图的优缺点各是什么? 4.全面调查的意义 在上面的调查中,我们利用调查问卷得到了全班同学喜爱的学科数据,利用表格整理数据,并用统计图直观形象的描述了数据.利用表和图分析了解到了全班同学喜爱学科的情况.在这个调查中,全班同学是要考查的全体对象.像这样考查全体对象的调查就叫做全面调查(也叫做普查).三、巩固提高例 经调查,某班同学上学所用的交通工具中,自行车占60%,公交车占30%,其他占10%,请画出扇形图描述以上统计数据.例 春节文艺晚会是大家都喜欢的节目,下面是路刚班级喜爱某种节目的人数分布 表,但因不小心,他打翻墨水,有些地方被墨水遮掉了.请你帮他解决以下问题.(1)被墨水遮掉的3处应是① _______ ②_______ ③________;(2)从上表中可知该班同学喜欢_______的人数最多;(3)画出条形图表示全班同学喜欢某种节目的分布情况. 四、课堂小结五、当堂检测1. 某中学初一(3)班50名学生参加数学测验,测验题目共20题,每题5分满分100分.统计结果如下:节目编号节目类别 划计 人数 百分比 1 相声 ① ② ③_ 2 小品 正 8 19% 3 歌曲 正5 12% 4 舞蹈 正 8 19% 5 杂技 正 7 17%6 戏曲 3 7% 合计42421语文% 数学25 %全对的2人对19题的8人对18题的10人对17题的9人对16题的6人对15题的6人对14题的5人对12题的2人对10题的1人对6题的1人.(1)请你设计一张表格对以上数据进行统计并填上相应数据?(2)你能用条形图把上述数据表示出来吗?2. 根据下面的数据制作扇形统计图并回答问题.对滨州市家庭人口数据的一次统计结果表明:2口之家占24%,3口之家占41%,4口之家占20%,5口之家占10%,6口之家占3%,其他占2%.(1)哪一类家庭人口多?占百分之几?(2)哪两类家庭的百分比之和超过了半数,且最多?(3)哪两类家庭的百分比之和刚达到30%?§10.1 统计调查(2)【教学目标】1.了解总体、个体、样本及样本容量的概念,通过抽样调查,初步感受抽样的必要性及样本的代表性,明确在什么情况下采用抽样调查或全面调查,进一步熟悉对数据的收集、整理、描述和分析;2.理解抽样调查的方法,通过案例理解简单随机抽样,体会用样本估计总体的统计思想,合理运用抽样调查方法来解决实际问题;3.通过实际参与收集、整理、描述、分析数据的活动,体会数学在生活和生产中的作用,激发学生爱数学的热情.【教学过程】一、预习导航我们可以采用的方法收集数据;统计中经常用整理数据;可以用和来直观地描述数据.叫做全面调查.二、新知探究自学课本,回答下列问题:如果要对某校2000名学生对新闻、体育、动画、娱乐、戏曲五类电视节目的喜爱情况,怎样进行调查?(1) 抽样调查的意义在上述问题中,由于学生人数比较多,全面调查花费的时间长,消耗的人力、物力大,因此需要寻求既省时又省力又能解决问题的方法,这就是抽样调查.,叫做抽样调查.(2)总体、个体、样本、样本容量的定义总体: .个体: .样本: .样本容量: .(3)抽样的注意事项:①抽样调查要具有广泛性和代表性,即样本容量要恰当.样本容量过少,那么不能很好地反映总体的情况,比如要调查2000名学生对电视节目的喜爱情况,若抽取的样本容量为几名学生就不能反映2000名学生的喜爱情况;如果抽取的学生人数过多,必然花费大量的时间、精力,达不到省时省力的目的.再如要调查60岁以上的老人的生病情况,在医院去抽取一些60岁以上的住院病人,它又不具有代表性,则应从60岁以上的老人册中任意抽取部分老人的生病情况来反映总体的60岁老人的生病情况,才能达到目的.②抽取的样本要有随机性.为了使样本能较好地反映总体的情况,除了有合适的样本容量外,抽取时还要尽量使每一个个体都有相等的机会被抽到,所谓随机就是机会相等.例如在2000名学生的注册学号中,随意抽取100个学号,调查这些学号对应的100名学生.当然还可以在上学或放学时,在学校门口随机进行调查;或则每隔10个人调查一个,直到调查满确定的样本容量.总体说来抽样调查最大的优点就是在抽样过程中避免了人为的干扰和偏差,因此,随机抽样是最科学、应用最广泛的抽样方法,一般情况下,样本容量越大,估计精确度就越高.尝试练习:某校有2000名学生,要想了解全校学生对新闻、体育、动画、娱乐、戏曲五类电视节目的喜爱情况,怎样进行调查?⑴可以用全面调查的方法对全校学生逐个进行调查吗?这样做你认为有什么不足之处?⑵能否有既省时省力又能解决问题的新方法?请阅读教材P153-155后,小组讨论交流你的理解.⑶什么是总体、个体、样本、样本容量?在上面的问题中总体、个体、样本、样本容量分别是什么?⑷你明白了统计的思想了吗?抽样调查是实际中经常采用的调查方式.抽样调查有什么优点?需要注意什么?⑸见教材P154表10-2,你知道哪个节目最受学生喜爱?百分比为多少?据此你知道全校2000名学生中有多少学生最喜爱这个节目?⑹试用条形图和扇形图来描述表10-2中的数据.三、巩固提高1. 为了解全校学生的平均身高,小明调查了座位在自己旁边的3名同学,把他们的身高的平均值作为全校学生的平均身高的估计.⑴小明的调查是抽样调查吗?⑵如果是抽样调查,指出调查的总体、个体、样本和样本容量.⑶这个调查结果能较好地反映总体的情况吗?如果不能,请说明理由.2. 举出不宜用全面调查的例子,并说明理由.3. 某班要选3名学生代表本班参加班级间的交流活动.现在按下面的办法抽取:把全班同学的姓名分别写在没有明显差别的小纸片上,把纸片混放在一个盒子里,充分搅拌后,随意抽取3张,按照纸片上所写的名字选取3名同学.你觉得上面的抽取过程是简单随机抽样吗?为什么?四、课堂小结五、当堂检测1.要调查下面几个问题,你认为应该作全面调查还是抽样调查?⑴了解全班同学每周体育锻炼的时间.⑵调查市场上某种食品的色素含量是否符合国家标准.⑶鞋厂检测生产的鞋底能承受的弯折次数.2.指出下列调查中的总体、个体、样本和样本容量.⑴从一批电视机中抽取20台,调查电视机的使用寿命.⑵从学校七年级中抽取30名学生,调查学校七年级学生每周用于数学作业的时间.3.小明家搞池塘养鱼已三年,头一年放养鱼苗20000尾,其成活率约为70%,在秋季捕捞时,随意捞出10尾,称得每尾的质量如下(单位:千克):0.8 0.9 1.2 1.3 0.8 0.9 1.1 1.0 1.2 0.8.⑴估计这塘鱼的总产量是多少千克?⑵如果把这塘鱼全部卖掉,其市场售价为每千克4元,那么能收入多少元?除去当年的投资成本16000元,第一年纯收入是多少元?⑶已知该养鱼户的第二年纯收入为48000元,那么第二年比第一年增长的百分率是多少?§10.1 统计调查(3)【教学目标】1.感受分层抽样的必要性,初步掌握分层抽样的基本步骤和方法;2.经历收集、处理数据的过程,会用分层抽样的方法来收集数据、整理数据、分析数据、做出决策,能利用分层抽样的知识解决简单实际生活中的问题;3.增强用统计方法解决实际问题的意识,通过研究解决问题的过程,初步培养学生合作交流的意识和探究精神.【教学过程】一、预习导航1.什么是抽样调查?2.什么是总体、个体、样本和样本容量?3.统计的思想是什么?4.抽样调查有什么优点?简单随机抽样时需要注意什么?二、新知探究:自学课本,回答下列问题:(1)分层抽样:.分层抽样的优点:.(2)在什么情况下分层?分层的根据是什么?尝试练习问题某地区有500万电视观众,要想了解他们对新闻、体育、动画、娱乐、戏曲五类节目的喜爱情况.⑴不能用对学生调查数据去估计整个地区电视观众的情况呢?⑵如果抽取一个容量为1000的样本进行调查,你会怎样调查?⑶采用分层抽样与在整个地区直接进行简单随机抽样相比,这样抽取样本一般能更好地反映总体.如果青少年、成年人、老年人的人数比为2∶5∶3,则可按下表抽取:教材P157表10-3是按上述做法进行调查并整理得到的数据,从中可以大致估计出整个地区观众对五种节目的喜爱情况.请你画条形图和扇形图描述表10-3中的数据.⑷由表10-3中数据还可以估计各个年龄段中观众对某类节目喜爱的情况.如,各个娱乐37% 35.2% 19.7%三、巩固提高1. 如果整个地区的观众中,青少年、成年人、老年人的人数比为3∶4∶3,要抽取容量为500的样本,则各年龄段分别抽取多少人合适?2. 根据表10-3,请你计算各个年龄段中最喜爱新闻、体育、戏曲类节目的百分比,画出折线图,分析随年龄变化,观众喜爱节目的变化情况.3. 活动1的问题中,除了根据年龄段分不同的人群,还可以按其他特征分吗?四、课堂小结五、当堂检测1.调查收集数据的方式通常有______________和_____________两种.当总体中个体数目较少时用________________的方式获得数据较好,当总体中个体数目较多时用____________的方式获得数据较好.但关于电视机寿命、火柴质量等具有破坏性的调查不宜采用_____________,国家人口普查采用________________.2.对某中学学生户外活动时间进行抽样调查,学校共有学生1500名,其中男生有800名,女生有700名.如果样本大小为150,小明现有三种方案:A:在七年级学生中用简单随机抽样,抽取150名学生进行调查;B:对全校学生进行简单随机抽样,抽取150名学生进行调查;C:分别在男生中用简单随机抽样抽取80名,在女生中用简单随机抽样抽取70名进行调查.你觉得哪种方案调查的结果会更精确一点?说说你的理由.3.小张和小李去练习射击,第一轮10枪打完后两人的成绩如图所示,通常新手的成绩不太稳定,那么根据图中的信息,估计小张和小李两人中新手是 .4.小王某月手机话费中的各项费用统计情况见下列图表,请你根据图表信息完成 下列各题:(1) 该月小王手机话费共有多少元?(2) 扇形统计图中,表示短信费的扇形的圆心角为多少度? (3) 请将表格补充完整; (4)50403020100项目金额/§10.2 直方图(1)【教学目标】1.了解频数及频数分布的概念,根据实际问题,会选择合适组距对数据进行等距分组,用表格整理数据,表示频数分布,会画简单的频数分布直方图(等距分组),并利用频数分布直方图解释数据中蕴含的信息;2.通过学习用表格整理数据表示频数分布,体会表格在整理数据中的作用,通过学习用简单频数分布直方图描述数据的方法,进一步体会统计图表在描述数据中的作用;3. 初步建立统计的观念,初步培养调查研究的良好习惯和实事求是的科学态度.【教学过程】一、预习导航1.什么是分层抽样?2.分层抽样的优点是什么?二、新知探究自学课本回答下列问题:称为组距.叫做频数.尝试练习:活动1提出问题探索解决问题的方法问题1:为了参加学校年级之间的广播操比赛,七年级准备从63名同学中挑出身高相差不多的40名同学参加比赛.你知道应该怎样选择吗?为什么?问题2:已知63名学生的身高数据,为了使选取的参赛选手身高比较整齐,你知道怎样做才能知道数据(身高)的分布情况吗?(即在哪些身高范围学生比较多?而哪些身高范围学生比较少?)活动2 用频数分布描述数据的方法阅读教材,并结合以上探究,你知道用频数分布描述数据的一般步骤是什么?注意对以下概念的理解:1.组距2.频数3.频数分布直方图4.频数折线图活动3 应用频数分布解决简单的实际问题为了考察某种大麦穗长的分布情况,在一块试验田里抽取了100个麦穗,量得它们的长度(数据见教材).列出样本的频数分布表,画出频数分布直方图.问题在活动1的问题2中,对数据进行分组时,组距取3,把数据分成8组.如果组距取2或4,那么数据分成几个组?这样做能否选出身高比较整齐的40名队员?三、巩固提高1. 为了解九年级女生的身高(单位:cm)情况,某中学对部分九年级女生身高进行了一次测量, 所得数据整理后列出了频数分布表,并画了部分频数分布直方图(图、表如下):cm)根据以上图表,回答下列问题:(1)M=_______,m=_______,N=_______,n=__________; (2)补全频数分布直方图.四、课堂小结五、当堂检测1.一个容量为80的样本最大值是143,最小值是50,取组距为10,则可以分成( ) A .10组 B .9组 C .8组 D .7组2.已知在一个样本中,50个数据分别落在5个组内,第一、二、三、五组数据的个数分别是2, 8, 15, 5,则第四组频数是______.3.超市为了制定某个时间段收银台开放方案,统计了这个时间段本超市顾客在收银台排队付款的等待时间,并绘制成如下的频数分布直方图(图中等待时间6分钟到7分钟表示大于或等于6分钟而小于7分钟,其它类同).这个时间段内顾客等待时间不少于6分钟的人数为( ) A .5 B .7 C .16 D .33(第3题)/min§10.2 直方图(2)【教学目标】1.根据实际问题,会选择合适组距对数据进行等距分组,用表格整理数据,表示频数分布;2.会画简单的频数分布直方图(等距分组),并利用频数分布直方图解释数据中蕴含的信息. 进一步体会统计图表在描述数据中的作用;3. 增强学习统计的兴趣,初步培养调查研究的良好习惯和科学态度.【教学过程】一、预习导航1.什么是组距、频数?2.用频数分布描述数据的一般步骤是什么?二、新知探究:活动熟练掌握用频数分布直方图解决问题的一般步骤从蔬菜大棚中收集到50株西红柿秧上小西红柿的个数:28 62 54 29 32 47 68 27 55 4336 79 46 54 25 82 16 39 32 6461 59 67 56 45 74 49 36 39 5285 65 48 58 59 64 91 67 54 5768 54 71 26 59 47 58 52 52 70请按组距为10将数据分组,列出频数分布表,画出频数分布直方图和频数折线图,分析数据分布的情况.(先独立思考后分组交流评讲)三、巩固提高:⑴全班有多少同学?⑵组距是多少?组数是多少?⑶跳绳的次数x在100≤x<140范围内的同学有多少?占全班同学的百分之几?⑷画出适当的统计图表示上面的信息.⑸你怎样评价这个班的跳绳成绩?四、课堂小结五、当堂检测1.某县教育部门对该县参加奥运知识竞赛的7500名初中学生的初试成绩(成绩均为整数..)(1)抽取样本的容量为;(2)根据表中数据,补全图中频数分布直方图;(3)若规定初试成绩在90分以上(不包括90分)的学生进入决赛,则全县进入决赛的学生约为人.2.为了增强环境保护意识,6月5日“世界环境日”当天,在环保局工作人员指导下,若干名“环保小护士”组成了“控制噪声污染”课题学习研究小组.该小组抽样调查了全市40个噪声测量点在某时刻的噪声声级(单位: dB ),将调查的数据进行处理(设所测数据均为正整数)组别噪声声级分组频数频率1 44.5~59.5 4 0.12 59.5~74.5 a 0.23 74.5~89.5 10 0.254 89.5~104.5 b c5 104.5~119.56 0.15合计40 1.00根据表中提供的信息解答下列问题:(1)频数分布表中的a=___________,b=____________,c=____________;(2)补充完整频数分布直方图;(3)如果全市共有200个测量点,那么在这一时刻噪声声级小于75 dB的测量点约有多少个?第十章 数据的收集、整理与描述复习【教学目标】1. 通过复习小结,进一步领悟到现实生活中通过数据处理,对未知的事情作出合理的推断的事实;2. 通过复习,进一步明确数据处理的一般过程;3. 在与他人交流合作的过程中学会收集、整理、描述数据. 【教学过程】一、本章知识网络: 数据处理的一般过程得出结论直方图折线图扇形图条形图据收集数据抽样调查全面调查二、知识链接:1. 统计图 扇形统计图 容易表示出一个对象在总体中所占的百分比. 条形统计图 可以表示出各种情况下各个项目的具体数目. 折线统计图 可以表现出同一对象的发展变化情况2. 全面调查 为一特定目的而对所有考察对象作的全面调查 抽样调查 为一特定目的而对部分考察对象作的调查 抽样调查中的总体 所要考察的对象的全体 个体 其中每一个考察对象样本 从总体中取出的一部分个体 样本容量 样本中个体的数目 3. 直方图画频数分布直方图的一般步骤(1)计算最大值与最小值 (2)决定组距与组数(3)列频数分布表 (4)画频数分布直方图三、巩固练习:1. 右图是根据某中学为地震灾区捐款情况而制作的统计图,已知该校在校学生2000人,请你根据统计图计算该校七年级有学生 人, 七年级共捐款 元,该校三个年级共捐款 元.人均捐款数(元)0246810121416七年级八年级九年级年级/日4821温度/℃2. 某校七年级学生进行体育测试,七年级(2)班男生的立定跳远成绩制成频数分布直方图,图中从左到右各矩形的高之比是2:3:7:5:3,最后一组的频数是6,根据直方图所表达的信息,解答下列问题.(1)该班有多少名男生?(2)若立定跳远的成绩在 2.0米以上(包括2.0米)为合格率是多少四、当堂检测 一、精心选一选,你一定能行1.下列调查适合作全面调查的是( ) A.了解在校大学生的主要娱乐方式 B.了解我市居民对废电池的处理情况 C.日光灯管长要检测一批灯管的使用寿命D.对甲型HINI 流感患者的同一车厢乘客进行医学检查2.要了解全校学生的课外作业负担情况,你认为作抽样方法比较合适的是( ) A.调查全校女生 B.调查全校男生C.调查九年级全体学生D.调查七、八、九年级各100人 3.要反映某市一周内每天的最高气温的变化情况,宜采用( ) A.条形统计图 B.扇形统计图 C.折线统计图 D.频数分布直方图4.小明在选举班委时得了28票,下列说法错误的是( ) A.不管小明所在的班级有多少学生,所有选票中选小明的选票频率不变 B. 不管小明所在的班级有多少学生,所有选票中选小明的选票频数不变 C.小明所在班级的学生人数不少于28人 D.小明的选票的频率不能大于15.一个班有40名学生,在期末体育考试中,优秀的有18人,在扇形统计图中,代表体育优秀扇形的圆心角度数是( ) A.144 B.162 C.216 D.250二、耐心填一填,你一定很棒的! 6.为了考察某校七年级男生的身高情况,调查了60名男生的身高,那么它的总体是____________,个体是__________________,样本是______________.7.小明家本月的开支情况如右图所示,如果用于其它方面的支出是150元,那么他家用于教育支出是____________元.8.某市为了了解七年级学生的身体素质情况,随机抽取了500名七年级学生进行检测,身体素质达标率为92%,请你估计该市6万名七年级学生中,身体素质达标的大约有_____________万人.9.测得某市2月份1~10日最低气温随日期变化折线图如图所示 ()1 最低气温为2c 的天数为_______天.()2 该市这10天的天气变化趋势是___________________.三、挑战你的技能10.老师布置每位学生估计本班的数学平均成绩,小玲是数学兴趣小组的成员,就向数学兴趣小组的全体成员做了调查,用他们的数学平均成绩估计本班的数学平均成绩,这样的抽样调查合理吗?为什么?11.某校为了了解七年级学生的学习情况,在这个年级抽取了50名学生对某课进行了测试.将所得的成绩(成绩均为整数)进行整理(如下边所示),请你画出频数分布直方图和频数折线图,并回答问题:(1)全班有多少同学?(2)组距是多少?组数是多少?(3)测试成绩在70≤x<80范围的同学有多少?占全班同学的百分比?(4)画出适当的统计图表示上面的信息.(5)你怎样评价这个班的测试成绩?12. 某校学生会准备调查全校七年级学生 每天(除课间操外)的课外锻炼时间. (1)确定调查方式时,甲说:“我到(1)班去调查全体同学”;乙同学说:“我到体育场上去询问参加锻炼的同学”;丙同学说:“我到全校七年级每个班去随机调查一定数量的同学”.你认为调查方式最合理的是(填“甲”、或“乙”或“丙”)____________________(2)他们采用了最为合适的调查方法收集数据,并绘制了条形和扇形统计图,请将两幅统计图补充完整;图1(3)若该七年级共有1200名同学,请你估计其中每天(除课间操外)课外锻炼时间不大于20分钟的人数.20分钟约40分钟及以上图2。
七年级数学(人教版)第十章《数据的收集、整理与描述》教材分析西葛中学董介文一、教材的地位:在当今的信息社会里,我们需要用数据解决问题。
统计概率所提供的“运用数据进行推断”的思考方法已成为现代社会一种普遍使用并且强有力的思维方式。
数据的收集、整理与描述与我们的生活息息相关。
例如:日本的福田地震、海啸和核泄漏问题已成为全世界人民关注的焦点,每天都需要收集大量的统计数据,并对这些数据进行精细的分析,并得出结论,从而采取有效措施;全国的人口普查;一个家庭的收入与支出;分析中考学生的数学成绩;统计学生的视力情况、身高、体重等等,都需要收集数据、整理数据、描述数据、得出结论。
这一章的知识充分体现了数学来源于生活,并服务于生活,更注重了数学的时效性。
在人教版的数学课程中,已加强统计概率的份量,已将“统计与概率”列为知识领域之一,成为与“数与代数”“图形与几何”并重的内容,这使得义务教育阶段的数学课程结构更加合理,使学生解决问题的能力得到更全面的培养。
在近几年的中考120分中,与数据的收集、整理与描述相关的这些统计知识和概率知识所占的比重有所加大,占9分左右。
“统计与概率”领域主要学习收集、整理、描述和分析数据等处理数据的基本方法和概率的初步知识,这些内容在三个年级均有安排,教学要求随着年级的升高和学生水平的增长逐渐提高。
本套教材安排了三章。
这三章内容采用统计部分和概率部分分开编排的方式,前两章是统计,最后一章是概率。
统计部分的两章内容按照数据处理基本过程的不同侧重点来安排,分别是7年级下册的第10章“数据的收集、整理与描述”,8年级下册的第20章“数据的分析”;概率部分为9年级上册的第25章“概率初步”。
二、教材安排:第十章是统计部分的第一章,内容包括:1.利用全面调查与抽样调查(以抽样调查为重点)收集和整理数据;2.利用统计图表(以直方图为重点)描述数据;3.展现收集、整理、描述和分析数据得出结论的统计调查的基本过程。
Excel数据处理与分析知到章节测试答案智慧树2023年最新上海商学院第一章测试1.在Excel中,一个工作簿就是一个Excel文件,其扩展名为()。
参考答案:.XLSX2.在Excel中,一个工作簿可以包含()工作表。
参考答案:多个3.Excel电子表格A1到C5为对角构成的区域,其表示方法是()。
参考答案:A1:C54.以下单元格引用中,下列哪一项属于混合引用()。
参考答案:B$205.在Excel中,下面关于单元格的叙述正确的是()。
参考答案:工作表中单元格是由单元格地址来表示的6.Excel在公式运算中,如果引用第6行的绝对地址,第D列的相对地址,则应为()。
参考答案:D$67.在Excel中,进行公式复制时()发生改变。
参考答案:相对地址中所引用的单元格8.在下列Excel运算符中,优先级最高的是()。
参考答案::9.设在B1单元格存有一公式为:=A$5,将其复制到D1后,公式变为=C$5。
参考答案:对10.设在单元格A1中有公式:=B1+B2,若将其复制到单元格C1中则公式为=D1+D2。
参考答案:对第二章测试1.在Excel中,给当前单元格输入数值型数据时,默认为()。
参考答案:右对齐2.在工作表的单元格内输入数据时,可以使用"自动填充"的方法,填充柄是选定区域()的小黑方块。
参考答案:右下角3.使用自动填充方法输入数据时,若在A1输入2,A2输入4,然后选中A1:A2单元格区域,再拖动填充柄至A10,则A1:A10区域内单元格填充的数据为()。
参考答案:2,4,6,…,204.使用自动填充方法输入数据时,若在A1输入2,然后选中A1,再拖动填充柄至A10,则A1:A10区域内单元格填充的数据为()。
参考答案:全25.当鼠标指针位移到工作表中选定区域的填充柄上时,指针变为()光标。
参考答案:黑十字6.若要将610031作为文本型数据输入单元格,应输入()。
参考答案:'6100317.利用Excel的自定义序列功能建立新序列。
第10章多维标度分析10.1多维标度法的基本思想当维数p>3时,即使给出了p维空间R P中n个样本点的坐标,我们都难以想象这n个点的相互位置关系,因此自然希望在我们熟悉的低维空间R k(k<p,如k=1,2,3)中能以较高的相似度重新展示这n个点的数据结构,并由此对原始样本数据进行统计分析.另外,即使维数p≤3,有时问题也不容易解决.比如地图上任意两个城市之间的直线距离和实际道路距离不一样,若仅给了一组城市相互间的实际道路距离,你能否标出这些城市之间的相对位置呢?又假定只知道哪两个城市最近,哪两个城市次近,等等,你还能确定它们之间的相对位置吗?重新标度的位置与实际位置相似度达到多大?把上面的不同“城市”换作不同的“产品”、“品牌”、“指标”等,也会遇到类似的问题.多维标度法(multidimensional scaling,MDS)就是一类将高维空间中的研究对象(样本或变量)简化到低维空间中进行定位、归类和分析,同时又有效地保留研究对象间原始关系的多元数据分析技术的总称,是一种维数缩减方法.多维标度法于20世纪40年代起源于心理测度学,用于大致测定人们判断的相似性,1958年Torgerson在其博士论文中首先正式提出了这一方法.多维标度法现在已广泛应用于心理学、市场营销、经济管理、交通、生态学及地质学等领域.多维标度法内容丰富、方法较多,其理论分析手段与主成分分析有相通之处,但也有自己的特点.根据研究对象的相关指标是用距离、比例等度量化数据给出还是用顺序、秩等给出,相应的分析方法分为度量分析法和非度量分析法,而古典多维标度法是其中最常用的度量分析法.10.2古典多维标度法下面根据参考文献[2],用一个例子来介绍几个与多维标度法相关的基本概念.【例10.1】(数据文件为eg10.1)表10-1给出了我国部分城市间的距离,由于道路弯弯曲曲,这些距离并不是这些城市间的真正距离.我们希望在地图上重新标出这八个城市,使得它们之间的距离尽量接近表10-1中的距离.表10-1 我国八个城市间的距离单位:千米北京天津济南青岛郑州上海杭州南京北京0天津118 0济南439 363 0青岛668 571 362 0郑州714 729 443 772 0上海1259 1145 886 776 984 0杭州1328 1191 872 828 962 203 0南京1065 936 626 617 710 322 305 0 10.2.1多维标度法的几个基本概念定义10.1一个n×n阶矩阵,如果满足条件(1)(2)则称矩阵D为广义距离阵,dij称为第i点与第j点间的距离.注意:这样定义的距离不是通常意义下的距离,而是通常距离的拓广,比如人们熟悉的距离三角不等式在这里就未必成立.对于距离阵,多维标度法的目的是要寻找较小的正整数k(如k=1,2,3)和相应低维空间R k中的n个点x₁,x₂,…,xn ,记表示xi与xj在R k中的欧氏距离,使得与D在某种意义下尽量接近.将找到的这n个点写成矩阵形式称X为D的一个古典多维标度(CMDS)解.在多维标度分析中,形象地称xi为D的一个拟合构造点,称X为D的拟合构图,称为D的拟合距离阵.特别地,当=D时,称xi为D的构造点,称X为D的构图.又若X为D的构图,令式中,P为正交阵,a为常数向量,则Y=(y₁,y₂,…,yn)也为D的构图,这是因为平移和正交变换不改变两点间的欧氏距离,即若D的构图存在,那么它是不唯一的.定义10.2对于一个n×n的距离阵,如果存在某个正整数k和R k中的n个点x₁,x₂,…,xn,使得(10.1)则称D为欧氏距离阵.下面讨论如何判断一个距离阵D是否为欧氏距离阵;在已知D为欧氏距离阵的条件下,如何确定定义10.2中相应的k和R k中的n个构造点x₁,x₂,…,xn.令(10.2)(10.3)式中,In 为n×n阶单位阵,1n,为分量全为1的n维列向量.借助这些定义,下面给出一个距离阵D为欧氏距离阵的充要条件.定理10.1设D为n×n阶距离阵,B由式(10.3)定义,则D是欧氏距离阵的充要条件为B≥0.证明:(必要性)设D是欧氏距离阵,由定义和式(10.2)可知,存在正整数k 和R k中的n个构造点x₁,x₂,…,xn,使得又由式(10.3)可得(10.5)式中,为元素全为1的nxn阶矩阵.注意式中(10.6)将它们代入式(10.5)中,可得(10.7)由式(10.4)知,再结合式(10.6),可得(10.8)将代入式(10.8),化简可得式中,将式(10.9)表示为矩阵形式,得到这里乘积HX所得的结果是将X中心化,即(10.10)(充分性)反之,若B≥0,记k=rank(B),λ₁,λ₂,…,λk (λ₁≥λ₂≥…≥λk>0)为B的正特征值,x(1),(2),…,x(k)为相应的特征向量,且令注意:这里x₁,x₂,…,xn表示由X的各行转置后得到的k×1列向量.令A=diag(λ₁,λ₂,…,λk),,则,即P的列为标准正交化特征向量,于是(10.11)由此可得说明正好是D的构图,所以D是欧氏距离阵,充分性得证.注意:充分性的证明给出了从欧氏距离阵D出发得到构图X的方法,即D→A→B→X具体步骤为:由D知dij,由得A,再由得B,最后求B的特征值λ₁,λ₂,…,λk和相应的特征向量x(1),(2),…,x(k),n×k阶矩阵X=(x(1),(2),…,x(k))的行向量转置后得到的n个k×1列向量x₁,x₂,…,xn 即为D的n个构成点,而矩阵即为D的构图,据式(10.11),X 也可以由来计算.由定理10.1知,D是欧氏距离阵的充要条件是B≥0.因此若B有负特征值,那么D一定不是欧氏距离阵,此时不存在D的构图,只能求D的拟合构图,记作,以区别真正的构图X.在实际中,即使D为欧氏距离阵,记它的构图为n×k 矩阵X,当k较大时也失去了实用价值,这时宁可不用X,而去寻找低维的拟合构图.也就是说,在D的构图不存在和构图存在但k较大两种情形下都需要寻找D的低维拟合构图.令这两个量相当于主成分分析中的累积贡献率,我们希望k不要取太大,就可以使a₁.k和a₂.k比较大,比如说,大于80%就比较合适.当k取定后,用表示B的对应于特征值λ₁,λ₂,…,λk的正交化特征向量,使得.通常还要求λk >0,若λk<0,要缩小k的值.最后,令则即为D的拟合构图,或者说为D的古典多维标度解,(均为k×1列向量)即为D的n个拟合构造点.有的文献也把称为X的主坐标,把多维标度分析称为主坐标分析.下面用一个具体例子(参见参考文献[2])来说明上述求解步骤.【例10.2】设有距离阵D如下(为简洁起见,对称阵都只写出上三角部分):由于,可求得A,āig ,āgj及āgg如下:再由bij =aij-āig-āgj+āgg可得由于B的7个列b₁,b₂,…,b₇有如下线性关系b₃=b₂-b₁,b₄=-b₁,b₅=-b₂,b₆=b₁-b₂,b₇=0于是B的秩最多为2,注意到B的第一个二阶主子式非退化,故rank(B)=2=k,并且可求得B的7个特征值分别为:λ₁=λ₂=3,λ₃=λ₄=…=λ₇=0且对应于λ₁,λ₂的特征向量分别为:故7个拟合构造点在R²中的坐标分别为:(√3/2,1/2),(√3/2,-1/2),(0,-1),(-√3/2,-1/2),(-√3/2,1/2),(0,1 ),(0,0)因为B≥0,所以原矩阵D是欧氏距离阵,故这7个拟合构造点就是D的构造点.容易验证,这7个构造点在R²中的欧氏距离阵恰为D,即10.2.2已知距离矩阵时CMDS解的计算上面计算CMDS解的过程在R中可使用stats包中的cmdscale()函数来实现,也可以使用MASS包中处理非度量MDS问题的isoMDS()函数来实现,但cmdscale()函数的好处是可以同时计算出B的特征值和特征向量以及两个累积贡献率a₁.k 和a₂.k的值.【例10.3】(数据文件为eg10.3)根据表10-1给出的我国八个城市间的距离矩阵D,利用R软件stats包中的cmdscale()函数求D的CMDS解,给出拟合构图及拟合构造点.解:在R中的程序为:#例10.3打开数据文件eg10.3.xls,选取数据区域C2:K10,然后复制>eg10.3=read.table("clipboard",header=T) #在R中读入数据>D10.3=cmdscale(eg10.3,k=2,eig=T) #k取为2,eig=T给出矩阵B的前两个特征#向量和特征值>D10.3$points[,1] [,2]北京-658.14610 -52.301759天津-522.00992 -133.917153济南-229.30657 32.365307青岛-80.72182 -277.225217郑州-171.98297 474.047645上海610.52727 -102.636996杭州659.93216 5.717159南京391.70794 53.951014$eig[1]1.756015e+06 3.367695e+05 7.888679e+04 3.770390e+041.320482e+04 -4.001777e-11 -1.434722e+04 -3.259473e+04......>sum(abs(D10.3$eig[1:2]))/sum(abs(D10.3$eig)) #计算a1.2[1] 0.9221257>sum((D10.3$eig[1:2])~2)/sum((D10.3$eig)~2) #计算a2.2[1] 0.9971656>x=D10.3$points[,1]>y=D10.3$points[,2]>plot(x,y,xlim=c(-700,800),ylim=c(-300,600)) #绘散点图(见图10-1)#根据两个特征向量的分量大小>text(x,y,labels=s(eg10.3),adj=c(0,-0.5),cex=0.8) #名标出#将拟合点用行#名标出图10-1我国八城市距离阵的拟合构图由R计算结果可见,矩阵B的八个特征值分别为:1756015,336770,78887,37704,13205,0,-14347,-32595最后两个特征值为负,表明距离矩阵D不是欧氏距离阵.a1.2=92.2%,a2.2=99.7%,故k=2就可以了.由前两个特征向量可得八个拟合构造点分别为:(-658.1,-52.3),(-522.0,-133.9),(-229.3,32.4),(-80.7,-277.2) (-172.0,474.0),(610.5,-102.6),(659.9,5.7),(391.7,54.0)容易计算出八个拟合构造点在R²中的欧氏距离阵,如表10-2所示.将它们与表10-1中城市间的原始距离数据进行比对,可以发现大多数距离数据拟合较好,少数数据误差较大.表10-2我国八个城市间的距离阵的拟合构图10.2.3已知相似系数矩阵时CMDS解的计算定义10.3一个n×n阶的矩阵,如果满足条件(1)(2)则称C为相似系数矩阵,cij称为第i点与第j点间的相似系数.在进行多维标度分析时,如果已知的数据不是n个对象之间的广义距离,而是n个对象间的相似系数,则只需将相似系数矩阵C按式(10.12)转换为广义距离阵D,其他计算与上述方法相同.令(10.12)由定义10.3可知,,显见,故D为距离)为欧氏距离阵. 阵,可以证明,当C≥0时,由式(10.12)定义的距离阵D=(dij【例10.4】(数据文件为eg10.4)为了分析下列六门课程之间的结构关系,找到了由劳雷和马克斯维尔得到的相关系数矩阵(见表10-3).其中,相关系数的值越大(小),表示课程越(不)相似.易见相关系数矩阵也为相似系数矩阵,记为C,求C的CMDS解,并给出拟合构图及拟合构造点.表10-3六门课程相关系数矩阵盖尔语英语历史算术代数几何盖尔语 1 0.439 0.41 0.288 0.329 0.248 英语0.439 1 0.351 0.354 0.32 0.32g 历史0.41 0.351 1 0.164 0.19 0.181 算术0.288 0.354 0.164 1 0.595 0.47 代数0.329 0.32 0.19 0.595 1 0.464 几何0.248 0.329 0.181 0.47 0.464 1解:据表10-3知,.于是由变换式(10.12)知(10.13)由式(10.13)易得六门课程的广义距离阵D,如表10-4所示.表10-4由六门课程相关系数矩阵转化所得的距离阵盖尔语英语历史算术代数几何盖尔语0 1.059 1.086 1.193 1.158 1.226英语 1.059 0 1.139 1.137 1.166 1.158 历史 1.086 1.139 0 1.293 1.273 1.280 算术 1.193 1.137 1.293 0 0.900 1.030 代数 1.158 1.166 1.273 0.900 0 1.035 几何 1.226 1.158 1.280 1.030 1.035 0余下工作可以仿照例10.3进行,在R中的程序为:#例10.4打开数据文件eg10.4.xls,选取数据区域A10:G16,然后复制>eg10.4=read.table("clipboard",header=T) #在R中读入数据>D10.4=cmdscale(eg10.4,k=2,eig=T) #k取为2,eig=T给出矩阵B的前两个特#征向量和特征值>D10.4$points[,1] [,2]盖尔语0.4028583 0.26570653英语0.2415986 0.48339407历史0.6210937 -0.50817963算术-0.4575066 0.03803193代数-0.4216733 -0.04017726几何-0.3863706 -0.23877565$eig[1]1.142825e+00 6.225908e-01 6.022539e-01 5.245848e-013.963587e-01 1.998401e-15......>sum(abs(D10.4$eig[1:2]))/sum(abs(D10.4$eig)) #计算a1.2[1] 0.5368268>sum((D10.4$eig[1:2])^2)/sum((D10.4$eig)~2) #计算a2.2[1] 0.6805523>x=D10.4$points[,1]>y=D10.4$points[,2]>plot(x,y,xlim=c(-0.6,0.8),ylim=c(-0.6,0.7)) #根据两个特征向量的分量大小绘制拟合图>text(x,y,labels=s(eg10.4),adj=c(0,-1),cex=0.8) #将拟合点用行名标出由R计算出的B的六个特征值按大小顺序依次为:λ₁=1.1428,λ₂=0.6226,λ₃=0.6023,λ₄=0.5246,λ₅=0.3964λ₆=0.0000因为a1.2=53.68%,a2.2=68.06%,不足80%,可考虑取k=3(这里从略).由前两个特征向量可得8个拟合构造点,分别为:(0.403,0.266),(0.242,0.483),(0.621,-0.508),(-0.458,0.038),(-0.422,-0. 040),(-0.386,-0.239).图10-2大体反映了这六门课程的基本结构,从图中可以直观地看出,算术、代数、几何较为接近,英语和盖尔语较为相近,而历史课程与其他课程的差异较大.图10-2六门课程相似系数矩阵的古典拟合构图10.3非度量多维标度法在实际问题中,涉及更多的可能是不易量化的相似性测度,如两种颜色的相似性,虽然我们可以用较小(大)的数字表示颜色非常(不)相似,但是这里的数字只表示颜色之间的相似或不相似程度,并不表示色彩实际的数值大小,因而这是一种非度量的定序尺度,能够利用的唯一信息就是这种顺序(秩).古典多维标度法基于主成分分析的思想,在低维空间上利用主坐标重新标度距离,这时式中,是距离dij 的拟合值;eij是拟合误差.但有时dij和之间的拟合关系可以表示为:(10.14)式中,f为一个未知的单调递增函数.这时,我们用来构造的唯一信息就是{dij }的秩,将{dij,i<j}从小到大排列为:与(i,j)所对应的dij 在上面的排列中的名次(由小到大)称为(i,j)的秩或dij的秩.我们欲寻找一个拟合构图(或一组拟合构造点),使后者相互之间的距离也有如上的次序,即并记为:这种模型大多出现在相似系数矩阵的场合,因为相似系数强调的是研究对象之间的相似,而不是它们的距离.在处理这种模型的各种方法中,最为流行的是Shepard-Kruskal算法,它的计算步骤如下:(1)已知相似系数矩阵D=(dij)(这里仍用D来记相似系数矩阵),并将其非对角元素从小到大排列为:(2)设是k维拟合构造点,相应的距离阵为,令(10.15)极小是对一切而言的,使上式达到极小的称为对的最小二乘单调回归.如果,在式(10.15)中取,这时是D 的构图.若对X作一正交平移变换yi =Pxi+b,P为正交阵,b为常数向量,则式(10.15)的分子不变.(3)若k固定,且能存在一个,使得则称为k维最佳拟合构图.(4)由于Sk (也称为压力指数,stress)是k的单调下降序列,取k,使Sk适当地小.例如Sk ≤5%最好,5%<Sk≤10%次之,Sk>10%较差.求解可用梯度法进行迭代(参见参考文献[2]).10.4案例分析与R实现案例10.1(数据文件为case10.1)表10-5给出了2010年我国31个省、直辖市、自治区农村居民家庭人均生活消费支出的统计数据.一共选取8个指标:x₁为食品消费;x₂为衣着消费;x₃为居住消费;x₄为家庭设备用品及服务;x₅为交通通信;x₆为文教娱乐用品及服务;x₇为医疗保健;x8为其他商品和服务支出.试用多维标度法对其进行统计分析,并对分析结果的实际意义进行解释.表10-5 2010年我国各地区农村居民家庭人均生活消费支出单位:元地区x₁x₂x₃x₄x₅x₆x₇x8北京2994.66 699.42 1990.21 473.62 1112.44 950.61 840.61 193.21天津2060.83 365.86 888.32 233.02 467.48 462.25 360.47 98.50河北1351.41 250.92 839.66 218.90 464.80 462.25 360.47 78.87山西1372.49 315.78 614.70 173.62 357.74 420.21 328.92 80.40内蒙古1675.04 317.71 751.99 177.91 598.61 374.19 467.97 97.41辽宁1714.15 369.15 745.03 185.23 448.97 500,28 413.83 112.87吉林1523.32 309.75 752.79 171.92 368.64 454.05 462.42 104.47黑龙江1483.95 387.17 793.80 164.63 455.90 560.71 443.16 101.86上海3806.82 554.13 2020.25 528.01 1459.45 997.65 584.51 209.66 江苏2491.51 350.01 1170.88 327.69 785.53 908.10 362.28 146.87浙江3055.59 551.53 2044.32 410.62 1145.99 839.19 709.30 172.34安1632.96 232.20 867.51 231.23 338.99 363.92 264.39 82.10 徽2537.15 310.14 865.50 292.71 638.07 462.17 251.36 141.23 福建江1812.66 174.61 782.72 205.27 331.81 285.23 243.84 75.48 西1804.45 305.56 832.95 324.70 649.21 421.91 383.89 84.51 山东河1371.17 261.52 765.18 254.47 401.44 250.47 287.83 90.14 南湖1763.05 217.61 816.42 262.26 331.35 288.12 295.24 116.73 北湖2087.85 209.85 719.20 243.90 343.82 315.93 293.59 96.23 南2630.05 215.51 986.70 235.01 637.08 326.53 307.43 177.27 广东1675.41 110.46 692.51 192.77 310.30 182.55 228.99 62.30 广西1724.47 117.36 609.77 135.22 312.53 318.04 138.35 90.49 海南1750.01 224.13 548.00 260.71 281.73 239.03 270.31 50.70 重庆1881.18 226.62 625.28 239.48 360.70 218.62 276.06 69.59 四川1319.43 137.49 621.80 135.64 229.66 186.19 178.07 44.21 贵州云1604.50 160.72 638.09 167.66 337.85 206.45 239.94 43.11 南西1325.71 326.65 352.88 181.27 282.43 51.06 71.16 75.77藏1299.22 237.87 837.54 233.37 336.22 397.61 376.20 75.77 陕西1315.25 184.23 551.63 146.93 256.70 238.03 203.13 46.0g 甘肃1442.88 255.19 944.23 193.59 369.60 198.53 307.92 62.55 青海1541.77 302.61 776.44 188.12 444.02 241.08 417.92 101.22 宁夏1394.38 303.66 695.17 137.69 382.14 170.15 314.73 59.94 新疆解:本案例我们采用R软件MASS包中的isoMDS()函数来实现分析计算(当然也可以用前面使用的cmdscale()函数),在R中的操作过程如下:#打开数据文件case10.1.xls,选取A2:I33区域,然后复制>case10.1<-read.table("clipboard",header=T) #将eg10.1.xls数据读入到#Case10.1中>D1=as.matrix(case10.1) #需要将数据转换成矩阵形式>D=dist(D1) #求距离阵>library(MASS) #载入MASS包,这样才能使用isoMDS()函数>fit=isoMDS(D,k=2)>fit$points[,1] [,2]北京-1882.08165 -405.5501799天津-181.18356 83.5568197河北378.06842 -316.9090361山西519.63551 -161.3723531内蒙古140.53475 -118.3236722辽宁239.59269 -57.3466211 吉林311.06135 -196.5769112 黑龙江257.18237 -303.2689490 上海-2574.54791 164.4633867 江苏-864.88942 19.9653109 浙江-1891.26840 -273.7180203 安徽241.99333 -56.7533361 福建-562.74468 426.2460037 江西187.41927 149.4628003 山东-23.94055 -68.0772001 河南480.52386 -165.0996828 湖北186.03261 68.3345125 湖南-11.86522 317.5767900 广东-645.99328 471.6486570 广西377.05811 164.2765177 海南362.23481 229.5403989 重庆360.53994 226.6307228 四川206.07019 261.9414880 贵州708.60794 -0.5224843 云南435.30179 117.9074584 西藏836.32175 163.8641180 陕西475.58204 -309.3702220 甘肃712.09253 -10.0972309 青海372.00020 -192.4072738 宁夏321.09711 -124.8186386 新疆529.56410 -105.2031733 $stress[1] 3.267686>x=fit$points[,1]>y=fit$points[,2]>plot(x,y) #画散点图(见图10-3)>text(x,y,labels=s(case10.1),adj=c(0.5,1.5),cex=0.7) #设置标签位#置大小>abline(h=0,v=0,lty=3) #采用虚线划分四个象限从图10-3可以比较直观地看出在总支出方面,上海、北京、广东、浙江、江苏、天津、福建等沿海地区是我国传统的经济发达地带,又是改革开放的前沿,雄厚的经济实力为农业和农村经济发展奠定了坚实的基础,农村居民的人均消费水平相对较高.北京在享受型消费方面领先于其他省区,说明北京的农民比较重视文化生活,由于他们身处祖国的政治文化中心,因此在文化、教育、医疗等方面有很高的消费和投入.而广东农民更重视物质上的消费,尤其在食物方面,广东人很下工夫,但是他们在文化生活上支出却不高,也不太注重这方面的投入.从总体来看,我国绝大多数地区农村居民家庭的消费水平比较低,消费结构不合理,我国农村居民家庭消费水平在不同地区间存在着明显的差异.图10-3 2010年我国农村居民家庭人均生活消费支出古典拟合构图习题10.1证明当C≥0时,由式(10.12)定义的距离阵D=(d₂)为欧氏距离阵.10.2(数据文件为ex10.2)在R中利用古典多维标度法对表10-6中的六个经济发展指标数据进行分析评价.其中,x₁为农业产值,x₂为林业产值,x₃为牧业产值,x₄为企业人数,x₅为企业总产值,x₆为利润总额.表10-6 2003年广东省各地区农村经济发展状况指标城市x₁x₂x₃x₄x₅x₆广州市97.84 1.28 38.86 141.98 2089.55 121.07深圳市11.20 0.66 12.59 156.52 418.16 50.12珠海市 5.67 0.11 3.60 17.39 360.58 10.58汕头市29.87 0.57 17.26 52.45 673.74 24.07佛山市52.39 0.29 32.14 90.77 1649.81 62.74韶关市47.82 4.47 18.44 27.91 144.51 16.14河源市33.57 3.10 12.84 12.62 51.25 4.73梅州市57.10 2.74 28.02 44.12 226.65 19.75惠州市61.57 4.70 25.20 70.38 568.79 40.39汕尾市29.82 1.70 12.09 30.52 189.00 6.78东莞市20.97 0.14 20.35 134.63 1380.42 74.01中山市16.87 0.21 5.33 91.43 1148.14 52.10江门市57.33 1.79 39.21 85.64 1252.07 32.68阳江市47.72 3.27 21.39 19.52 191.64 11.08湛江市87.20 4.72 34.07 40.60 390.06 20.96茂名市112.00 7.85 81.36 76.47 739.34 40.85肇庆市76.06 16.45 46.77 52.97 569.93 19.40清远市57.35 6.67 28.47 17.95 75.29 6.76潮州市27.05 1.63 14.88 35.22 501.63 20.97揭阳市71.08 2.09 26.43 50.52 891.76 17.79云浮市44.07 4.65 38.97 22.23 188.47 8.7010.3(数据文件为ex10.3)表10-7给出了2011年全国31个省、直辖市、自治区的城镇居民家庭人均消费性支出的8个主要指标数据,根据这些数据,采用多维标度法进行分析评价.表10-7全国31个省、直辖市、自治区城镇居民家庭人均消费性支出数据(2011年)单位:元地区食品x₁衣着x₂居住x₃家庭设备及用交通通信x₅文教娱乐x₆医疗保健x7其他x8品x₄北京6905.512265.881923.711562.553521.23306.821523.32975.37天津6663.311754.981763.441174.622699.532116.011415.39836.82河北3927.261425.991372.25809.85 1526.61203.99955.95 387.40山西3558.041461.91327.78832.74 1487.661419.43851.30 415.44内蒙古4962.42514.091418.61162.872003.541812.071239.36765.13辽宁5254.961854.631385.62929.37 1899.061614.521208.3643.15吉林4252.851769.471468.29839.31 1541.371468.341108.51562.48黑龙江4348.451681.881185.96723.58 1363.621190.871082.96476.89上海8905.952053.812225.681826.223808.413746.381140.821394.86江苏6060.911772.061187.741193.812262.192695.52962.45 647.06浙江7066.222138.991518.061109.423728.232816.121248.9811.51安徽5246.761371.011501.39690.66 1365.011631.28907.58 467.77福建6534.941494.961661.841179.842470.181879.02773.26 667.00江西4675.161272.881114.49914.88 1310.211429.3641.23 389.06山东4827.612008.841510.841013.822203.991538.44938.86 518.27河南4212.761706.941087.08977.52 1573.641373.94919.83 484.76湖北5363.681677.911172.11814.81 1382.21489.67915.72 347.68湖南4943.891499.021292.55940.79 1975.51526.1790.76 434.25广东7471.881404.62005.151370.283630.622647.94948.18 773.17广西5074.491019.341237.91884.85 2000.571502.65779.08 349.48海南5673.65 780.101342.29729.86 1830.81141.81783.34 360.91重庆5847.92056.791205.661079.271718.731474.881050.62540.63四川5571.691483.541226.141020.161757.521369.47735.26 532.52贵州4565.851209.881102.99857.55 1395.281331.43578.33 311.57云南4802.261587.18827.84 570.46 1905.861350.65822.41 381.38西藏5184.181261.29781.12 428.03 1278.0514.44 424.10 527.74陕西5040.471673.241193.81914.26 1502.441857.61100.51500.42甘4182.41470.21139.8660.48 1289.81158.3874.05 413.37肃7 6 5 0 0青海4260.271394.281055.15723.23 1293.45967.90 854.25 406.93宁夏4483.441701.731247.14885.36 1637.611441.18978.12 521.47新疆4537.461715.94888.16 791.43 1377.671122.18912.99 493.56 10.4(数据文件为ex10.4)对表10-8给出的我国12个城市间的航空距离矩阵D,利用R软件中的cmdscale()函数求D的CMDS解,并给出拟合构图X及拟合构造点.表10-8我国12个城市间的航空距离矩阵10.5(数据文件为ex10.5)在R中利用古典多维标度法对表10-9中给出的2006年我国东部和西部地区20省区工资水平数据.请对相关经济发展指标数据进行分析评价.其中x₁为国有单位工资,x₂为城镇集体单位工资,x3为股份合作单位工资,x₄为联营单位工资,x5为有限责任公司工资,x₆为股份有限公司工资,x₇为其他单位工资,x8为港、澳、台商投资单位工资,x9为外商投资单位工资.表10-9我国2006年20个省区工资水平数据单位元地区x₁x₂x₃x₄x₅x₆x₇x8X 9北京41313 17550 14603 20154 30732 54595 28023 52593 64192 河北17057 10255 12947 23894 17580 15835 10362 17282 18014 山西18540 12014 10208 16308 20554 15917 11883 14583 17363 内蒙古19275 12404 11216 12238 17439 18211 12966 14222 19041 辽宁20305 10793 13175 11859 18852 24453 10095 19206 19756 吉林16983 9106 9698 10413 15249 20657 10381 13461 22562 上海40141 22959 20912 30984 31305 43673 42206 26244 42556 江苏28143 15279 16199 17302 20453 25487 15954 18200 23446 浙江41920 22006 19220 32979 19903 26994 21657 19593 20950 江西16227 10000 12118 13939 14710 17365 10388 10982 13731 山东22552 13024 13588 27823 15732 17440 12798 15602 18248 湖北17708 10265 10787 14262 14683 14985 9671 12545 23261 湖南18459 12490 14442 14328 15754 18228 15525 15812 17574 广西18384 12025 11071 13637 16549 17854 13231 12910 22427 重庆21168 13471 14460 16283 15637 21497 13368 17098 25037 四川19884 12624 13522 14962 13251 16606 10693 16909 20749 贵州17248 12590 14796 12306 14227 19361 12482 13436 15359 云南19520 11859 12806 14890 16308 19720 10833 15054 20944 陕西16894 8879 19713 14943 18215 18856 13613 14634 18077 甘肃17836 11411 9832 6439 13998 22076 8407 16877 20139。
Excel高级数据处理与分析(微课版)第一章:Excel高级数据处理与分析概述1.1 学习目标了解Excel高级数据处理与分析的概念及应用领域掌握Excel高级数据处理与分析的基本方法掌握Excel高级数据处理与分析的工具和功能1.2 教学内容Excel高级数据处理与分析的概念及应用领域Excel高级数据处理与分析的基本方法Excel高级数据处理与分析的工具和功能1.3 教学过程引入案例:分析一家公司的销售数据讲解Excel高级数据处理与分析的概念及应用领域演示Excel高级数据处理与分析的基本方法演示Excel高级数据处理与分析的工具和功能1.4 课后作业分析自己所在班级的成绩数据,使用Excel进行高级数据处理与分析第二章:数据清洗与整理2.1 学习目标掌握数据清洗与整理的概念和方法掌握使用Excel进行数据清洗与整理的技巧2.2 教学内容数据清洗与整理的概念和方法使用Excel进行数据清洗与整理的技巧2.3 教学过程引入案例:分析一家公司的销售数据,需要先进行数据清洗和整理讲解数据清洗与整理的概念和方法演示使用Excel进行数据清洗与整理的技巧2.4 课后作业分析一组杂乱无章的销售数据,使用Excel进行数据清洗与整理第三章:数据排序与筛选3.1 学习目标掌握数据排序与筛选的概念和方法掌握使用Excel进行数据排序与筛选的技巧3.2 教学内容数据排序与筛选的概念和方法使用Excel进行数据排序与筛选的技巧3.3 教学过程引入案例:分析一家公司的销售数据,需要对数据进行排序和筛选讲解数据排序与筛选的概念和方法演示使用Excel进行数据排序与筛选的技巧3.4 课后作业分析一家公司的销售数据,使用Excel进行数据排序和筛选第四章:数据透视表与数据透视图4.1 学习目标掌握数据透视表与数据透视图的概念和方法掌握使用Excel进行数据透视表与数据透视图的技巧4.2 教学内容数据透视表与数据透视图的概念和方法使用Excel进行数据透视表与数据透视图的技巧4.3 教学过程引入案例:分析一家公司的销售数据,需要使用数据透视表和数据透视图讲解数据透视表与数据透视图的概念和方法演示使用Excel进行数据透视表与数据透视图的技巧4.4 课后作业分析一家公司的销售数据,使用Excel创建数据透视表和数据透视图第五章:条件格式与高级筛选5.1 学习目标掌握条件格式与高级筛选的概念和方法掌握使用Excel进行条件格式与高级筛选的技巧5.2 教学内容条件格式与高级筛选的概念和方法使用Excel进行条件格式与高级筛选的技巧5.3 教学过程引入案例:分析一家公司的销售数据,需要使用条件格式和高第六章:函数和公式在数据处理中的应用6.1 学习目标掌握常用函数在数据处理中的应用学会使用公式对数据进行复杂计算6.2 教学内容常用函数:SUM、AVERAGE、COUNT、MAX、MIN等公式:绝对引用、相对引用、混合引用名称管理器:定义单元格名称,简化公式编写6.3 教学过程引入案例:计算一家公司销售团队的业绩总额和平均业绩讲解常用函数在数据处理中的应用演示公式和名称管理器的使用6.4 课后作业使用SUM、AVERAGE等函数计算班级成绩的总分和平均分第七章:图表制作与数据可视化7.1 学习目标掌握Excel图表的基本类型及其适用场景学会使用Excel制作图表并进行美化7.2 教学内容图表基本类型:柱状图、折线图、饼图、条形图等图表设计:更改图表样式、颜色、添加图表元素等数据序列:添加和删除数据序列、更改数据序列类型等7.3 教学过程引入案例:分析一家公司的销售数据,需要制作相应的图表讲解图表的基本类型及其适用场景演示图表的制作和美化过程7.4 课后作业根据给定的数据,制作并美化一个柱状图和折线图第八章:宏和VBA在Excel中的应用8.1 学习目标了解宏和VBA的概念及其在Excel中的应用掌握简单的宏和VBA代码编写8.2 教学内容宏的概念:宏的录制、运行和编辑VBA概述:VBA编程环境、变量、函数、过程等VBA代码编写:简单的VBA代码示例8.3 教学过程引入案例:自动化处理大量数据,提高工作效率讲解宏和VBA的概念及其在Excel中的应用演示宏的录制和VBA代码的编写8.4 课后作业编写一个简单的VBA代码,实现批量替换单元格内容的功能第九章:数据与外部数据9.1 学习目标掌握外部数据源的导入方法学会使用数据更新外部数据9.2 教学内容外部数据源:Excel文件、文本文件、数据库等数据:创建数据、更新外部数据数据透视表与外部数据:使用数据透视表分析外部数据9.3 教学过程引入案例:分析多个Excel文件中的销售数据讲解外部数据源的导入方法演示数据的创建和更新9.4 课后作业导入一个外部文本文件,并使用数据更新数据第十章:Excel高级技巧与实践应用10.1 学习目标掌握Excel的高级技巧学会将Excel应用于实际工作中10.2 教学内容高级筛选:高级筛选功能的使用数据分类:分类汇总、数据排序等实践应用:制作一份完整的销售数据分析报告10.3 教学过程引入案例:完成一份销售数据分析报告讲解高级筛选和数据分类的功能和使用方法演示实践应用:制作销售数据分析报告10.4 课后作业应用所学的Excel高级技巧,完成一份个人财务报表的分析第十一章:Excel在数据分析和报告中的最佳实践11.1 学习目标学习如何在Excel中实施最佳实践以提高数据分析的准确性和效率。
人教版七年级下期第10章《数据的收集、整理与描述》(有答案)人教版七年级下期第10章《数据的收集、整理与描述》(有答案)一.选择题(共6小题)1.以下问题,不适合用全面调查的是()A.了解全班同学每周体育锻炼的时间B.旅客上飞机前的安检C.学校招聘教师,对应聘人员面试D.了解全市中小学生每天的零花钱2.下列调查中,适合采用普查方式的是()A.调查市场上婴幼儿奶粉的质量情况B.调查黄浦江水质情况C.调查某个班级对青奥会吉祥物的知晓率D.调查《直播南京》栏目在南京市的收视率3.下列调查中,须用普查的是()A.了解某市学生的视力情况B.了解某市中学生课外阅读的情况C.了解某市百岁以上老人的健康情况D.了解某市老年人参加晨练的情况4.为了检查一批灯管的使用寿命,从中抽取了10只进行检测,以下说法正确的是()A.这一批灯管是总体B.10只灯管是总体的一个样本C.每只灯管是个体D.10只灯管的使用寿命是总体的一个样本5.为了了解某地区12 000名初中毕业生参加中考的数学成绩,从中抽取了500名考生的数学成绩进行统计分析,下列说法正确的是()A.个体是指每个考生B.12000名考生是个体C.500名考生的成绩是总体的一个样本D.样本是指500名考生6.今年我市有近4万名考生参加中考,为了解这些考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,以下说法正确的是()A.这1000名考生是总体的一个样本B.近4万名考生是总体C.每位考生的数学成绩是个体D.1000名学生是样本容量二.填空题(共8小题)7.学校为七年级学生订做校服,校服型号有小号、中号、大号、特大号四种.随机抽取了100名学生调查他们的身高,得到身高频数分布表如下,已知该校七年级学生有800名,那么中号校服应订制套.8.已知一组数据是连续的整数,其中最大值是242,最小数据是198,若把这组数据分成9个小组,则组距是.9.某镇卫生部门2014年4月份对镇所辖学校的中小学生进行体质健康测试,随机抽取了200名学生的测试成绩作为样本,数据整理如下表,其中x的值为.10.如图是某市20132016-年私人汽车拥有量和年增长率的统计图.该市私人汽车拥有量年净增量最多的是年,私人汽车拥有量年增长率最大的是年.11.图1表示某地区2003年12个月中每个月的平均气温,图2表示该地区某家庭这年12个月中每月的用电量.根据统计图,请你说出该家庭用电量与气温之间的关系(只要求写出一条信息即可):.12.我区有15所中学,其中九年级学生共有3000名.为了了解我区九年级学生的体重情况,请你运用所学的统计知识,将解决上述问题要经历的几个重要步骤进行排序.①收集数据;②设计调查问卷;③用样本估计总体;④整理数据;⑤分析数据.则正确的排序为.(填序号)13.为了解我市某学校“书香校园”的建设情况,检查组在该校随机抽取40名学生,调查了解他们一周阅读课外书籍的时间,并将调查结果绘制成如图的频数直方图(每小组的时间值包含最小值,不包含最大值),根据图中信息估计该校学生一周课外阅读时间不少于4小时的人数占全校人数的百分数约等于.14.对某班组织的一次考试成绩进行统计,已知80.5~90.5分这一组的频数是8,频率是0.2,那么该班级的人数是人.三.解答题(共6小题)15.2013年我国中东部地区先后遭遇多次大范围雾霾天气,其影响范围、持续时间、雾霾强度历史少见,给人们生产生活造成了严重影响.为此“雾霾天气的主要成因”就成为某校环保小组调查研究的课题,他们随机调查了部分市民,并对调查结果进行整理,绘制了如下尚不完整的统计图表.请根据图表中提供的信息解答下列问题;(1)填空:m=,n=,扇形统计图中表示E组的扇形圆心角等于度.(2)若该市人口约有800万人,请你估计其中持D组“观点”的市民人数;(3)治理雾霾天气需要每个人的环保行动和参与,作为一名中学生的你能为“应对雾霾天气,保护环境”做些什么?请你写出来.(只需写出一条措施或建议即可)16.某校有1000名学生.为了解全校学生的上学方式,该校数学兴趣小组在全校随机抽取了100名学生进行抽样调查.整理样本数据,得到下列图表(频数分布表中部分划记被污染渍盖住)(1)本次调查的个体是;(2)求扇形统计图中,乘私家车部分对应的圆心角的度数;(3)请估计该校1000名学生中,选择骑车和步行上学的一共有多少人?17.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩进行统计.请你根据尚未完成的频数分布表和频数分布直方图,解答下列问题:(1)填充频数分布表的空格;(2)补全频数直方图,并绘制频数分布直方图;(3)全体参赛学生中,竞赛成绩落在哪组范围内的人数最多?(4)若成绩在90分以上(不含90分)为优秀,则该校成绩优秀的约为多少人?18.网瘾低龄化问题已引起社会各界的高度关注,有关部门在全国范围内对1235-岁的网瘾人群进行了简单的随机抽样调查,得到了如图所示的两个不完全统计图.请根据图中的信息,解决下列问题:(1)求条形统计图中a的值;(2)求扇形统计图中1823-岁部分的圆心角;(3)据报道,目前我国1235-岁的人数.-岁网瘾人数约为2000万,请估计其中122319.某校为开展每天一小时阳光体育活动,准备组建篮球、排球、羽毛球、乒乓球四个兴趣小组,并规定每名学生只能参加1个小组,且不能不参加.该校对九年级学生报名情况进行了抽样调查,并将所得数据绘制成了如下两幅统计图:根据图中的信息,解答下列问题:(1)本次调查共抽样了名学生;(2)补全条形统计图;(3)若该校九年级共有450名学生,试估计报名参加排球兴趣小组的人数.20.班主任张老师为了了解本班学生课堂发言情况,对前一天本班男、女生的发言次数进行了统计,并绘制成如下频数分布折线图(图1).(1)该班共有名学生;(2)在张老师的鼓励下,该班学生第二天的发言次数比前一天明显增加,图2是全班第二天发言次数变化的人数的扇形统计图七年级数学下册数据收集与整理解答题专项练习1、某地区教育部门为了解初中数学课堂中学生参与情况,并按“主动质疑、独立思考、专注听讲、讲解题目”四个项目进行评价.检测小组随机抽查部分学校若干名学生,并将抽查学生的课堂参与情况绘制成如图所示的扇形统计图和条形统计图(均不完整).请根据统计图中的信息解答下列问题:(1)本次抽查的样本容量是;(2)在扇形统计图中,“主动质疑”对应的圆心角为度;(3)将条形统计图补充完整;(4)如果该地区初中学生共有60000名,那么在课堂中能“独立思考”的学生约有多少人?2、我市中小学全面开展“阳光体育”活动,某校在大课间中开设了A:体操,B:跑操,C:舞蹈,D:健美操四项活动,为了解学生最喜欢哪一项活动,随机抽取了部分学生进行调查,并将调查结果绘制成了如下两幅不完整的统计图,请根据统计图回答下列问题:(1)这次被调查的学生共有人.(2)请将统计图2补充完整.(3)统计图1中B项目对应的扇形的圆心角是度.(4)已知该校共有学生3600人,请根据调查结果估计该校喜欢健美操的学生人数.3、某中学改革学生的学习模式,变“老师要学生学习”为“学生自主学习”,培养了学生自主学习的能力.小华与小明同学就“你最喜欢哪种学习方式”随机调查了他们周围的一些同学,根据收集到的数据绘制了以下两个不完整的统计图(如图).请根据上面两个不完整的统计图回答以下4个问题:(1)这次抽样调查中,共调查了名学生.(2)补全条形统计图中的缺项.(3)在扇形统计图中,选择教师传授的占%,选择小组合作学习的占%.(4)根据调查结果,估算该校1800名学生中大约有人选择小组合作学习模式.4、2017年3月27日是全国中小学生安全教育日,某校为加强学生的安全意识,组织了全校学生参加安全知识竞赛,从中抽取了部分学生成绩(得分取正整致,满分为10分)进行统计,绘制了图中两幅不完整的统计图.(1)a= ,n= ;(2)补全频数直方图;(3)该校共有2000名学生.若成绩在70分以下(含70分)的学生安全意识不强,有待进一步加强安全教育,则该校安全意识不强的学生约有多少人?5、为了促进学生多样化发展,某校组织开展了社团活动,分别设置了体育类、艺术类、文学类及其它类社团(要求人人参与社团,每人只能选择一项).为了解学生喜爱哪种社团活动,学校做了一次抽样调查.根据收集到的数据,绘制成如下两幅不完整的统计图,请根据图中提供的信息,完成下列问题:(1)此次共调查了多少人?(2)求文学社团在扇形统计图中所占圆心角的度数;(3)请将条形统计图补充完整;(4)若该校有1500名学生,请估计喜欢体育类社团的学生有多少人?6、某校举行“汉字听写”比赛,每位学生听写汉字39个,比赛结束后随机抽查部分学生的听写结果,以下是根据抽查结果绘制的统计图的一部分.根据以上信息解决下列问题:(1)在统计表中,m= ,n= .(2)扇形统计图中“C组”所对应的圆心角的度数是.(3)若该校共有900名学生,如果听写正确的个数少于24个定为不合格,请你估计这所学校本次比赛听写不合格的学生人数.7、某校为了解九年级1 000名学生的身体健康情况,从该年级随机抽取了若干名学生,将他们按体重(均为整数,单位:kg)分成五组(A:39.5~46.5;B:46.5~53.5;C:53.5~60.5;D:60.5~67.5;E:67.5~74.5),并依据统计数据绘制了如下两种尚不完整的统计图.解答下列问题:(1) 这次抽样调查的样本容量是________,并补全频数分布直方图;(2) C组学生的频率为________,在扇形统计图中D组的圆心角是________度;(3) 请你估计该校九年级体重超过60 kg的学生大约有多少名.8、某市为了增强学生体质,全面实施“学生饮用奶”营养工程.某品牌牛奶供应商提供了原味、草莓味、菠萝味、香橙味、核桃味五种口味的牛奶提供学生饮用.浠马中学为了了解学生对不同口味牛奶的喜好,对全校订购牛奶的学生进行了随机调查(每盒各种口味牛奶的体积相同),绘制了如图两张不完整的人数统计图:(1)本次被调查的学生有________名;(2)补全上面的条形统计图1,并计算出喜好“菠萝味”牛奶的学生人数在扇形统计图中所占圆心角的度数;(3)该校共有1200名学生订购了该品牌的牛奶,牛奶供应商每天只为每名订购牛奶的学生配送一盒牛奶.要使学生每天都喝到自己喜好的口味的牛奶,牛奶供应商每天送往该校的牛奶中,草莓味要比原味多送多少盒?9、初三年级教师对试卷讲评课中学生参与的深度与广度进行评价调查,其评价项目为主动质疑、独立思考、专注听讲、讲解题目四项.评价组随机抽取了若干名初中学生的参与情况,绘制成如图所示的频数分布直方图和扇形统计图(均不完整),请根据图中所给信息解答下列问题:(1)在这次评价中,一共抽查了名学生;(2)在扇形统计图中,项目“主动质疑”所在的扇形的圆心角的度数为度;(3)请将频数分布直方图补充完整;(4)如果全市有6000名初三学生,那么在试卷评讲课中,“独立思考”的初三学生约有多少人?10、某中学为了搞好对“传统文化学习”的宣传活动,对本校部分学生(随机抽查)进行了一次相关知识了解程度的调查测试(成绩分为A、B、C、D、E五个组,x表示测试成绩).通过对测试成绩的分析,得到如图所示的两幅不完整的统计图.请你根据图中提供的信息解答以下问题:(1)参加调查测试的学生为________人;(2)将条形统计图补充完整;(3)本次调查测试成绩中的中位数落在________组内;(4)若测试成绩在80分以上(含80分)为优秀,该中学共有学生2600人,请你根据样本数据估计全校学生测试成绩为优秀的总人数.参考答案1、解:(1)本次调查的样本容量为224÷40%=560(人),故答案是:560;(2)“主动质疑”所在的扇形的圆心角的度数是:360°×=54°,故答案是:54;(3)“讲解题目”的人数是:560﹣84﹣168﹣224=84(人).(4)60000×=18000(人),答:在试卷评讲课中,“独立思考”的初三学生约有18000人.2、解:(1)140÷28%=500(人),故答案为:500;(2)A的人数:500﹣75﹣140﹣245=40(人);补全条形图如图:(3)75÷500×100%=15%,360°×15%=54°,故答案为:54;(4)245÷500×100%=49%,3600×49%=1764(人).3、解:(1)由题意可得,本次调查的学生有:300÷60%=500(名),故答案为:500;(2)由题意可得,教师传授的学生有:500﹣300﹣150=50(名),补全的条形统计图如右图所示;(3)由题意可得,选择教师传授的占: =10%,选择小组合作学习的占: =30%,故答案为:10,30;(4)由题意可得,该校1800名学生中选择合作学习的有:1800×30%=540(名),故答案为:540.4、解:(1)∵本次调查的总人数为30÷10%=300(人),∴a=300×25%=75,D组所占百分比为×100%=30%,所以E组的百分比为1﹣10%﹣20%﹣25%﹣30%=15%,则n=360°×15%=54°,故答案为:75、54;(2)B组人数为300×20%=60(人),补全频数分布直方图如下:(3)2000×(10%+20%)=600,答:该校安全意识不强的学生约有600人.5、解:(1)80÷40%=200(人).∴此次共调查200人.(2).∴文学社团在扇形统计图中所占圆心角的度数为108°.(3)补全如图.(4)1500×40%=600(人).∴估计该校喜欢体育类社团的学生有600人6、(1)m=30,n=20;(2)90°(3)“听写正确的个数少于24个”的人数有:10+15+25=50 (人).900×=450 (人).答:这所学校本次比赛听写不合格的学生人数约为450人.7、(1) 样本容量是4÷8%=50;B组的频数为12,补全频数分布直方图如图所示。