数据分析试卷
- 格式:doc
- 大小:44.00 KB
- 文档页数:2
大数据分析考试试卷一、单项选择题(每题2分,共20分)1. 大数据分析中,以下哪项不是数据清洗的目的?A. 去除重复数据B. 纠正错误的数据C. 增加数据量D. 填补缺失值2. 在大数据环境下,以下哪种技术不是用于数据存储的?A. HadoopB. NoSQL数据库C. 传统关系型数据库D. Spark3. 大数据的4V特性中,哪个表示数据的多样性?A. VolumeB. VelocityC. VarietyD. Veracity4. 在进行大数据分析时,以下哪项不是数据预处理的步骤?A. 数据清洗B. 数据转换C. 数据挖掘D. 数据归一化5. 大数据技术中,以下哪项不是数据挖掘的算法?A. 决策树B. 聚类算法C. 线性回归D. 数据清洗6. 在大数据架构中,以下哪项不是数据仓库的组成部分?A. 数据存储B. 数据处理C. 数据可视化D. 数据加密7. 大数据分析中,以下哪项不是数据可视化的目的?A. 提高数据的可读性B. 降低数据的复杂性C. 增加数据的复杂性D. 帮助用户理解数据8. 在大数据技术中,以下哪项不是数据集成的方法?A. 数据转换B. 数据清洗C. 数据融合D. 数据迁移9. 大数据环境下,以下哪项不是数据安全和隐私保护的措施?A. 数据加密B. 访问控制C. 数据共享D. 匿名化处理10. 在大数据技术中,以下哪项不是数据质量管理的步骤?A. 数据验证B. 数据清洗D. 数据监控二、多项选择题(每题3分,共15分)11. 在大数据分析中,以下哪些是数据挖掘的主要任务?A. 分类B. 聚类C. 关联规则学习D. 数据清洗12. 大数据技术中,以下哪些是数据存储的解决方案?A. Hadoop分布式文件系统B. 内存数据库C. 云存储服务D. 传统关系型数据库13. 在大数据环境下,以下哪些是数据预处理的常见步骤?A. 数据清洗B. 数据转换C. 数据压缩D. 数据加密14. 大数据分析中,以下哪些是数据可视化的常见工具?A. TableauB. Power BIC. ExcelD. Hadoop15. 在大数据架构中,以下哪些是数据仓库的组成部分?A. 数据存储B. 数据处理D. 数据安全三、简答题(每题5分,共20分)16. 请简述大数据的4V特性,并解释每个特性的含义。
数据分析期末考试试卷一、选择题(每题2分,共20分)1. 在数据分析中,以下哪项不是数据清洗的目的?A. 去除重复数据B. 纠正错误数据C. 增加无关数据D. 标准化数据格式2. 描述性统计分析中,以下哪个指标不能反映数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差3. 以下哪种图形最适合展示时间序列数据的变化趋势?A. 柱状图B. 饼图C. 折线图D. 散点图4. 假设检验中,如果P值小于显著性水平α,我们通常会得出什么结论?A. 拒绝原假设B. 接受原假设C. 无法得出结论D. 需要更多的数据5. 以下哪种分析方法主要用于探索数据的潜在结构?A. 回归分析B. 因子分析C. 描述性统计D. 假设检验二、简答题(每题10分,共30分)6. 请简述数据可视化的重要性及其在数据分析中的应用场景。
7. 描述一下什么是相关性分析,并举例说明其在实际问题中的应用。
8. 解释什么是数据挖掘,并简述其在商业智能中的作用。
三、计算题(每题15分,共30分)9. 给定一组数据:3, 5, 7, 9, 11, 13, 15, 17, 19, 21。
请计算这组数据的平均数、中位数、众数和标准差。
10. 假设你正在进行一项研究,研究的目的是检验某种新药是否比传统药物更有效。
你已经收集了两组数据,一组是使用新药的患者,另一组是使用传统药物的患者。
请描述你将如何使用假设检验来分析这些数据。
四、案例分析题(每题20分,共20分)11. 假设你是一家电子商务公司的数据分析员,公司最近推出了一款新产品。
你被要求分析销售数据,以确定产品是否成功。
请描述你将如何收集和分析数据,以及你将使用哪些关键指标来评估产品的表现。
五、论述题(共10分)12. 论述大数据时代下,数据分析对于企业决策的重要性,并举例说明数据分析如何帮助企业实现更精准的市场定位。
试卷结束语:请同学们认真审题,仔细作答。
数据分析是一门实践性很强的学科,希望本次考试能够检验你们对数据分析理论知识的掌握和应用能力。
合肥学院2009至2010学年第 一 学期数 据 分 析 课程考试( A )卷系 级 专业 学号 姓名题号 一 二 三 四 五 总 分 得分 阅卷一、是非题:(每题2分,共20分) 13111ˆ1Q +M+Q 333M 、三平均( )12211()()2()()niii xyn n iii i RR S S Spearman q RR SS 、相关系数=( )222221ˆ3(0,)1 ( )n N I SSE n1、若,则().1ˆˆ41()()kkkt n p s、的置信区间为 ( )122598,()G N G N X X G X、 设(95,4),(100,0.25),如果 则得分装订 线命题教师 共 页,第 页6R Q R Q 、聚类分析法是根据分类对象的不同可分为型和型两大类其中型是对样品进行分类,型是对变量(指标)进行分类. ( )17,10(1,2,1)()max ()=(1,2,). ( )piji iX X X p i a a j i Var Z Var a X Z a X X i i p、设()是维随机向量,如果它满足当时, 则称为的第主成份8p 、因子分析中的因子个数与变量个数一定相同.( )9、典型相关分析是研究两组变量之间相关关系的 一种统计方法. ( )10、偏最小二乘回归分析法只能建立一个一对多的 线性回归模型 . ( )二、写出下列程序的运行结果( 20分)data a;input sub $ mea1-mea3; drop mea1-mea3; mea=mea1;output ; mea=mea2;output ; mea=mea3;output ;得分cards ;a 2 5 4b 3 6 2c 2 4 6d 11 45 72;proc print data=a;run;三、根据下列程序运行的结果作出数据分析 (20分)得分研究某地成年人血压与年龄之间的关系,数据见程序行。
一、选择题(每题5分,共25分)1. 下列关于数据收集的说法,错误的是()A. 数据收集可以通过观察、实验、调查问卷等方式进行B. 数据收集应准确、全面,并能够代表所研究的对象或现象C. 数据收集可以通过网络、报纸、书籍等途径获取D. 数据收集过程中,应避免主观臆断和偏见2. 下列关于数据整理的说法,错误的是()A. 数据整理包括对数据进行分类、排序和清理等步骤B. 数据整理可以使用表格、统计图表等工具进行C. 数据整理过程中,应保留原始数据,便于后续分析D. 数据整理可以删除一些无关紧要的数据,以便简化分析过程3. 下列关于平均数的说法,错误的是()A. 平均数是描述一组数据中心趋势的指标B. 平均数包括算术平均数、中位数和众数C. 平均数可以反映数据的集中程度D. 平均数可以用来比较不同数据集的特征4. 下列关于图表分析的说法,错误的是()A. 图表是一种强大的工具,能够将数据转化为易于理解和比较的形式B. 在选择图表类型时,应考虑数据的类型和关系C. 通过观察图表,可以分析数据之间的关系和趋势D. 图表分析只能用于定性数据5. 下列关于数据分析方法的说法,错误的是()A. 数据分析方法包括描述性统计、推断性统计和预测性统计B. 描述性统计可以用来描述数据的集中趋势和离散程度C. 推断性统计可以用来检验假设和估计参数D. 预测性统计可以用来预测未来的数据变化二、填空题(每题5分,共25分)1. 数据分为__________数据和__________数据两种类型。
2. 数据整理包括对数据进行__________、__________和__________等步骤。
3. 平均数包括__________、__________和__________。
4. 图表分析包括__________、__________和__________。
5. 数据分析方法包括__________统计、__________统计和__________统计。
一、选择题(每题3分,共30分)1. 下列哪组数据表示的平均数最大?A. 2, 3, 4, 5B. 1, 2, 3, 4C. 0, 1, 2, 3D. 3, 4, 5, 62. 一组数据的中位数是3,下列哪组数据可能符合条件?A. 1, 2, 3, 4B. 1, 2, 3, 5C. 2, 3, 4, 5D. 3, 4, 5, 63. 下列哪个统计量可以用来描述数据的波动大小?A. 平均数B. 中位数C. 众数D. 极差4. 下列哪个数据集的方差最大?A. 2, 4, 6, 8B. 1, 3, 5, 7C. 0, 2, 4, 6D. 3, 5, 7, 95. 下列哪个数据集的众数是3?A. 1, 2, 3, 3B. 2, 3, 4, 5C. 3, 4, 5, 6D. 4, 5, 6, 76. 下列哪个数据集的标准差最小?A. 2, 4, 6, 8B. 1, 3, 5, 7C. 0, 2, 4, 6D. 3, 5, 7, 97. 下列哪个数据集的极差最大?A. 2, 4, 6, 8B. 1, 3, 5, 7C. 0, 2, 4, 6D. 3, 5, 7, 98. 一组数据为2, 4, 6, 8,下列哪个说法正确?A. 中位数是3B. 众数是4C. 平均数是5D. 极差是19. 下列哪个数据集的方差是0?A. 1, 1, 1, 1B. 2, 2, 2, 2C. 3, 3, 3, 3D. 4, 4, 4, 410. 下列哪个数据集的标准差是0?A. 1, 1, 1, 1B. 2, 2, 2, 2C. 3, 3, 3, 3D. 4, 4, 4, 4二、填空题(每题5分,共25分)11. 一组数据为5, 7, 9,则这组数据的平均数是______。
12. 一组数据的中位数是8,则这组数据中至少有一个数是______。
13. 一组数据的众数是10,则这组数据中至少有______个数是10。
14. 一组数据的极差是12,则这组数据中最大数与最小数的差是______。
数据分析测试题一、选择题(每小题3分,共30分)1.有19位同学参加歌咏比赛,所得的分数互不相同,取前10位同学进入决赛.某同学知道自己的分数后,要判断自己能否进入决赛,他只需知道这19位同学成绩的()A.平均数B.中位数C.众数D.方差2.某特警部队为了选拔“神枪手”,举行了1 000米射击比赛,最后由甲、乙两名战士进入决赛,在相同条件下,两人各射靶10次,经过统计计算,甲、乙两名战士的总成绩都是环,甲的方差是,乙的方差是,则下列说法中,正确的是()A.甲的成绩比乙的成绩稳定 B.乙的成绩比甲的成绩稳定C.甲、乙两人成绩的稳定性相同D.无法确定谁的成绩更稳定3.对于数据3,3,2,3,6,3,10,3,6,3,2.①这组数据的众数是3;②这组数据的众数与中位数的数值不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的数值相等.其中正确结论的个数为()4.综合实践活动中,同学们做泥塑工艺制作.小明将活动组各同学的作品完成情况绘成了下面的条形统计图.根据图表,我们可以知道平均每个学生完成作品()件.5.某公司员工的月工资如下表:A. B.C. D.6.下列说法中正确的有()①描述一组数据的平均数只有一个;②描述一组数据的中位数只有一个;③描述一组数据的众数只有一个;④描述一组数据的平均数、中位数和众数都一定是这组数据里的数;⑤一组数据中的一个数大小发生了变化,一定会影响这组数据的平均数、众数和中位数. 个个 个个7.某同学在本学期的前四次数学测验中得分依次是95,82,76,88,马上要进行第五次测验了,他希望五次成绩的平均分能达到85分,那么这次测验他应得( )分.8.样本方差的计算公式中,数字20和30分别表示样本的( ) A.众数、中位数 B.方差、偏差 C.数据个数、平均数 D.数据个数、中位数9.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么所求出的平均数与实际平均数的差是( )10.某赛季甲、乙两名篮球运动员12场比赛得分情况用图表示如下:对这两名运动员的成绩进行比较,下列四个结论中,不正确...的是( ) A.甲运动员得分的方差大于乙运动员得分的方差 B.甲运动员得分的中位数大于乙运动员得分的中位数 C.甲运动员得分的平均数大于乙运动员得分的平均数 D.甲运动员的成绩比乙运动员的成绩稳定 二、填空题(每小题3分,共24分)11.某果园有果树200棵,从中随机抽取5棵,每棵果树的产量如下:(单位:kg )98 102 97 103 105这棵果树的平均产量为 kg ,估计这棵果树的总产量为 kg. 12.在航天知识竞赛中,包括甲同学在内的6•名同学的平均分为74分,其中甲同学考了89分,则除甲以外的5名同学的平均分为_______分. 13.已知一组数据它们的中位数是,则______.14.有个数由小到大依次排列,其平均数是,如果这组数的前个数的平均数是,后个数的平均数是,则这个数的中位数是_______.15.若已知数据的平均数为,则数据的平均数(用含的表达式表示)为_______. 16.某超市招聘收银员一名,对三名应聘者进行了三项素质测试.下面是三名应聘者的素质测试成绩:测试成绩素质测试小李小张小赵计算机70 90 65商品知识50 75 55语言80 35 80公司根据实际需要,对计算机、商品知识、语言三项测试成绩分别赋予权重4,3,2,则这三人中将被录用.年南京青奥会某项目6名礼仪小姐的身高如下(单位:cm):168,166,168,167,169,168,则她们身高的众数是_____cm.18.某校八年级甲、乙两班举行电脑汉字输入比赛,两个班参加比赛的学生每分钟输入汉字的个数经统计和计算后结果如下表:班级参加人数平均字数中位数方差甲55 135 149 191乙55 135 151 110有一位同学根据上面表格得出如下结论:①甲、乙两班学生的平均水平相同;②乙班优秀人数比甲班优秀人数多(每分钟输入汉字达150个以上为优秀);③甲班学生比赛成绩的波动比乙班学生比赛成绩的波动大.上述结论正确的是___________(填序号).三、解答题(共46分)19.(6分)某乡镇企业生产部有技术工人15人,生产部为了合理制定产品的每月生产定额,统计了15人某月的加工零件数如下:加工零件数/件540 450 300 240 210 120人数 1 1 2 6 3 2(1(2)假如生产部负责人把每位工人的月加工零件数定为260件,你认为这个定额是否合理为什么?20.(6分)为调查八年级某班学生每天完成家庭作业所需时间,在该班随机抽查了8名学生,他们每天完成作业所需时间(单位:)分别为60,55,75,55,55,43,65,40.(1)求这组数据的众数、中位数.(2)求这8名学生每天完成家庭作业的平均时间;如果按照学校要求,学生每天完成家庭作业时间不能超过,问该班学生每天完成家庭作业的平均时间是否符合学校的要求?21.(6分)某校260名学生参加植树活动,要求每人植4~7棵,活动结束后随机抽查了20名学生每人的植树量,并分为四种类型,A :4棵;B :5棵;C :6棵;D :7棵.将各类型的人数绘制成扇形统计图(如图①)和条形统计图(如图②),经确认扇形统计图是正确的,而条形统计图尚有一处错误. 回答下列问题:(1)写出条形统计图中存在的错误,并说明理由. (2)写出这20名学生每人植树量的众数、中位数.(3)在求这20名学生每人植树量的平均数时,小宇是这样分析的: 第一步:求平均数的公式是12nx x x x n+++=;第二步:在该问题中,n =4,x 1=4,x 2=5,x 3=6,x 4=7; 第三步:4567554x .+++==(棵).②请你帮他计算出正确的平均数,并估计这260名学生共植树多少棵22.(7分)某校在一次数学检测中,八年级甲、乙两班学生的数学成绩统计如下表:分数 50 60 70 80 90 100 人数甲班 1 6 12 11 15 5 乙班351531311(1)甲班的众数是多少分,乙班的众数是多少分,从众数看成绩较好的是哪个班(2)甲班的中位数是多少分,乙班的中位数是多少分,甲班成绩在中位数以上(包括中位数)的学生所占的百分比是多少,乙班成绩在中位数以上(包括中位数)的学生所占的百分比是多少,从中位数看成绩较好的是哪个班(3)甲班的平均成绩是多少分,乙班的平均成绩是多少分,从平均成绩看成绩较好的是哪个班23.(7分)某单位欲从内部招聘管理人员一名,对甲、乙、丙三名候选人进行了笔试和面试两项测试,三人的测试成绩如下表所示:测试成绩(分)测试项目甲乙丙笔试75 80 90面试93 70 68根据录用程序,组织200名职工对三人利用投票推荐的方式进行民主评议,三人得票率(没有弃权票,每位职工只能推荐1人)如图所示,每得一票记作1分.(1)请算出三人的民主评议得分.(2)如果根据三项测试的平均成绩确定录用人选,那么谁将被录用(精确到)(3)根据实际需要,单位将笔试、面试、民主评议三项测试得分按的比例确定个人成绩,那么谁将被录用?24.(7分)我们约定:如果身高在选定标准的±2%范围之内都称为“普通身高”.为了解某校九年级男生中具有“普通身高”的人数,我们从该校九年级男生中随机选出10名男生,分别测量出他们的身高(单位:cm)收集并整理如下统计表:男生序号①②③④⑤⑥⑦⑧⑨⑩身高163 171 173 159 161 174 164 166 169 164根据以上表格信息,解答如下问题:(1)计算这组数据的三个统计量:平均数、中位数和众数;(2)请你选择一个统计量作为选定标准,找出这10名具有“普通身高”的是哪几位男生并说明理由;(3)若该年级共有280名男生,按(2)中选定标准,请你估算出该年级男生中“普通身高”的人数约有多少名?25.(7分)某校八年级学生开展踢毽子比赛活动,每班派5名学生参加,按团体总分多少排列名次,在规定时间内每人踢100个以上(含100)为优秀.下表是成绩最好的甲班和乙班5名学生的比赛数据(单位:个):为参考.请你回答下列问题:(1)计算两班的优秀率.(2)求两班比赛成绩的中位数.(3)估计两班比赛数据的方差哪一个小.(4)根据以上三条信息,你认为应该把冠军奖杯发给哪一个班级?简述你的理由.九年级数学数据分析专题检测试卷参考答案解析:19位同学参加歌咏比赛,所得的分数互不相同,取前10位同学进入决赛,中位数就是第10位同学的成绩,因而要判断自己能否进入决赛,他只需知道这19位同学成绩的中位数就可以.故选B .解析:本题考查了方差的意义,方差越小,数据越稳定.在甲、乙两名战士总成绩相同的条件下,∵ >,∴ 乙的成绩比甲的成绩稳定.解析:将这组数据从小到大排列为:2,2,3,3,3,3,3,3,6,6,10,共11个数,所以第6个数据是中位数,即中位数为3.因为数据3的个数为6,所以众数为3.平均数为,由此可知①正确,②③④均错误,故选A. 解析:625.862412610692481276=+++⨯+⨯+⨯+⨯.解析:元出现了次,出现的次数最多,所以这组数据的众数为元;将这 组数据按从大到小的顺序排列,中间的(第5个)数是元,即其中位数为元; ,即平均数为2 200元.解析:一组数据的中位数和平均数只有一个,但出现次数最多的数即众数,可以有多个,所以①②对,③错;由于一组数据的平均数是取各数的平均值,中位数是将原数据按由小到大顺序排列后,进行计算得来的,所以平均数与中位数不一定是原数据里的数,故④错; 一组数据中的一个数大小发生了变化,它的平均数一定发生变化,众数、中位数可能发生改变,也可能不发生改变,所以⑤错.解析:利用求平均数的公式解决.设第五次测验得分,则588768295x++++, 解得.解析:设其他29个数据的和为,则实际的平均数为,而所求出的平均数为,故.11. 解析:抽取的5棵果树的平均产量为; 估计这棵果树的总产量为. 解析:13. 解析:将除外的五个数从小到大重新排列后为中间的数是,由于中位数是,所以应在20和23中间,且21220=+x,解得.14. 解析:设中间的一个数即中位数为,则,所以中位数为. 15. 解析:设的平均数为,则31)(21)(21)(2321+++++x x x 13233)2(321321+++⨯=+++=xx x x x x .又因为3321x x x ++=x ,于是y . 16.小张 解析:∵ 小李的成绩是:9565234280350470=++⨯+⨯+⨯,小张的成绩是:9772234235375490=++⨯+⨯+⨯,小赵的成绩是:65234280355465=++⨯+⨯+⨯,∴ 小张将被录用.解析:众数是在一组数据中,出现次数最多的数据,这组数据中168出现了3次,出现的次数最多,故这组数据的众数为168.18. ①②③ 解析:由于乙班学生每分钟输入汉字的中位数为151,说明有一半以上的学生都达到每分钟150个及以上,而甲班学生的中位数为149,说明不到一半的学生达到150个及以上,说明乙班优秀人数比甲班优秀人数多,故②正确;由平均数和方差的意义可知①③也正确. 19.解:(1)平均数:540450300224062103120226015++⨯+⨯+⨯+⨯=(件);中位数:240件,众数:240件.(2)不合理,因为表中数据显示,每月能完成件以上的一共是4人,还有11人不能达到此定额,尽管是平均数,但不利于调动多数员工的积极性.因为既是中位数,又是众数,是大多数人能达到的定额,故定额为件较为合理.20.解:(1)在这8个数据中,55出现了3次,出现的次数最多,即这组数据的众数是55;将这8个数据按从小到大的顺序排列为40,43,55,55,55,60,65,75,其中最中间的两个数据都是55,即这组数据的中位数是55. (2)这8个数据的平均数是,所以这8名学生完成家庭作业的平均时间为.因为,所以估计该班学生每天完成家庭作业的平均时间符合学校的要求. 21.分析:(1)A 类型人数为20×20%=4,B 类型人数为20×40%=8,C 类型人数为20×30%=6,D 类型人数为20×10%=2,所以条形统计图中D 类型数据有错.(2)这20个数据中,有4个4,8个5,6个6,2个7,所以每人植树量的众数是5棵,中位数是5棵.(3)小宇的分析是从第一步出现错误的,公式不正确,应该使用4458667220x ⨯+⨯+⨯+⨯=计算出正确的平均数.把这个平均数乘260可以估计这260名学生共植树的棵数. 解:(1)D 有错. 理由:10%×20=2≠3. (2)众数为5棵. 中位数为5棵. (3)①第一步. ②4458667220x ⨯+⨯+⨯+⨯==(棵).估计这260名学生共植树:×260=1 378(棵).点拨:(1)众数是一组数据中出现次数最多的数据.(2)求一组数据的中位数时,一定要先把这组数据按照大小顺序排列.(3)在求一组数据的平均数时,如果各个数据都重复出现若干次,应选用加权平均数公式112212(=)k kk x w x w x w x n w w w n+++=+++求出平均数.22.解:(1)甲班中分出现的次数最多,故甲班的众数是分; 乙班中分出现的次数最多,故乙班的众数是分. 从众数看,甲班成绩好.(2)两个班都是人,甲班中的第名的分数都是分,故甲班的中位数是分; 乙班中的第名的分数都是分,故乙班的中位数是分.甲班成绩在中位数以上(包括中位数)的学生所占的百分比为 ;乙班成绩在中位数以上(包括中位数)的学生所占的百分比为 .从中位数看,成绩较好的是甲班. (3)甲班的平均成绩为 ;乙班的平均成绩为 .从平均成绩看,成绩较好的是乙班.23.分析:通过阅读表格获取信息,再根据题目要求进行平均数与加权平均数的计算.解:(1)甲、乙、丙的民主评议得分分别为:50分、80分、70分. (2)甲的平均成绩为:75935021872.6733++=≈(分),乙的平均成绩为:80708023076.6733++=≈(分),丙的平均成绩为:90687022876.0033++==(分).由于76.677672.67>>,所以乙将被录用.(3)如果将笔试、面试、民主评议三项测试得分按的比例确定个人成绩,那么 甲的个人成绩为:472.9433⨯75+3⨯93+3⨯50=++(分),乙的个人成绩为:477433⨯80+3⨯70+3⨯80=++(分),丙的个人成绩为:477.4433⨯90+3⨯68+3⨯70=++(分),由于丙的个人成绩最高,所以丙将被录用. 24.解:(1)平均数为()163171173159161174164166169164166.4cm 10+++++++++=,中位数为166164165cm 2+=(),众数为164cm ().(2)选平均数作为标准: 身高x 满足166.412%166.412%x ⨯-⨯+()≤≤(),即163.072169.728x ≤≤时为“普通身高”,此时⑦、⑧、⑨、⑩男生的身高为“普通身高”.(3)以平均数作为标准,估计全年级男生中“普通身高”的人数约为428011210⨯=. 25.解:(1)甲班的优秀率:52, 乙班的优秀率:53.(2)甲班5名学生比赛成绩的中位数是97个;乙班5名学生比赛成绩的中位数是100个. (3)甲班的平均数=100597+118+96+100+89=(个),甲班的方差 ;乙班的平均数=1005104+91+110+95+100=(个),乙班的方差 .∴ .即乙班比赛数据的方差小.(4)冠军奖杯应发给乙班.因为乙班5名学生的比赛成绩的优秀率比甲班高,中位数比甲班大,方差比甲班小,综合评定乙班踢毽子水平较好.。
数据分析模拟测试试卷您的姓名: [填空题] *_________________________________1. 单选题(分值:1分)下列不属于供应链指标的是()。
[单选题] *A、库存周转率B、采购单价C、订单响应时间D、咨询成交率(正确答案)2. 单选题(分值:下列监控的数据指标中,属于流量规模类指标的是()。
[单选题] *A、访客数(正确答案)B、跳失率C、访问深度D、平均停留时间3. 单选题(分值:下列可以反映客户对品牌忠诚度的数据指标是()。
[单选题] *A、复购率(正确答案)B、新客户数量C、最近一次购买时间D、消费金额4. 单选题(分值:下列哪个图表类型不是由柱形图延伸出来的()。
[单选题] *A、堆积柱形图B、瀑布图C、直方图D、热力图(正确答案)5. 单选题(分值:以下不属于营销推广指标的是()。
[单选题] *A、展现量B、点击量C、投入产出比D、活跃客户数(正确答案)6. 单选题(分值:以下属于柱状图延伸出的图表类型是( )。
[单选题] *A、条形图B、瀑布图(正确答案)C、折线图D、散点图答案解析:柱形图可以延伸出其他类型的图表,如堆积柱形图,瀑布图等。
7. 单选题(分值:在电子商务活动中,消费者的肖像权、姓名权、隐私权等受到侵犯,这实质上是对消费者()的侵犯。
[单选题] *A、财产安全权B、人身安全权(正确答案)C、公平交易权D、知情权8. 单选题(分值:某店铺新上了10件衣服,其定价分别为:75、70、90、70、58、80、55、70、75、55,则这组价格中的众数和中位数分别是()。
(单位:元) [单选题] *A、70、 75B、70、 69C、55、 75D、70、70(正确答案)9. 单选题(分值:数据的离散程度分析主要是用来反映数据之间的差异程度,()说明集中程度越差,平均数的代表性越弱,反之,平均数的代表性越强。
[单选题] *A、离散程度越大(正确答案)B、离散程度越小C、离散程度越均匀D、离散程度越无序10. 单选题(分值:下列对比项目中不合理的是()。
一、填空题(2×20)
1.方程显著性检验是检验-----对-----的影响是否显著;参数显著性检验是检验---对----的影响是否显著。
2.选择“最优”回归方程的方法有--------、-------、-------等。
3.Spss for windows中主成分分析由-----------过程实现。
4.因子分析把每个原始变量分解为两部分因素:一部分为-------,另一部分为-----。
5.在快速聚类过程中,数据的标准化可通过------过程来实现,在分层聚类中,数据的标准化可通过------选项来实现。
6.Q型聚类是指对--- -进行聚类,R型聚类是指对-- --进行聚类。
7.凝聚点是指-----------------------------。
8.因子分析中a ij的统计意义是---------------。
9.取消一个自变量后回归平方和减少的数值,称为因变量对这个自变量的-------。
10.按变量相关程度来分,在-------和---------情况下主成分分析效果较好。
11.在以曲线划分的判别法中通常采用--------距离。
二、简答(3×10)
1.简述主成分分析、因子分析的基本思想,以及两者的的联系和差异。
2.简述方差分析的基本原理及应用条件。
3. 简述聚类分析的基本思想,Q型聚类分析与R型聚类分析的区别,系统聚类法的基本步骤。
三、计算题(12+8+10)
1.现收集了财政收入(Y)与工业总产值(X1)、建筑业总产值(X2)1978—1990年数据,经分析回归方程为
Y=524.536+0.05265X1+0.454X2
T值(7.518) (2.695) (3.214)
R2=.0.990 F=246.240
(1) 对所求得的方程作显著性检验,在A=0.05时,你的结论是什么?
(2) 对各回归系数作显著性检验. (A=0.05)
(3) 说明回归方程的经济意义.
(4) 求出回归方程的复相关系数.
(5) 若因变量Y与自变量X1,X2的偏相关系数分别为r y1;2=0.64916,r y2;1=0.71188,说明了什么?
(6) 若1991年工业总产值为24502亿元,建筑业总产值为2980亿元,试求1991年财政收入的预测值与
预测区间.(1-A=95%,随机误差项的标准差δ=121.85)
有关临界值:F0.05(2,10)=4.1,F0.05(2,13)=3.8,t0.05(10)=1.812 t0.025(10)=2.228
2.下表是进行因子分析的结果,试根据下列信息计算变量共同度h i2及公共因子F j的方差贡献,并说明其统计意义.
Component Matrix
Component
1 2 3
X1
.969 -1.084E-02 .205
X2
.911 .321 -.102
X3
.847 -.120 .323
X4
.941 .281 -2.693E-02
X5
.899 .215 -1.963E-02
X6
-.313 .839 .305
X7
-.666 6.280E-02 .679
X8
.575 -.580 .367
Extraction Method: Principal Component Analysis.
a 3 components extracted.
3.下面给出五个元素两两之间的距离,用最长距离法求出五个元素的聚类图.
1 2 3 4 5
10
2 4 0
3 6 9 0
4 1 7 10 0
5 6 3 5 8 0。