《 数据分析 》课程期末考试试题A卷
- 格式:doc
- 大小:246.00 KB
- 文档页数:16
数据分析期末复习专练一、选择题:本题共10小题,每小题3分,共30分。
在每小题给出的选项中,只有一项是符合题目要求的。
1.为了考察库存2000只灯泡的使用寿命,从中任意抽取15只灯泡进行实验,在这个问题中.下列说法正确的是()A.总体是2000只灯泡B.样本是抽取的15只灯泡C.个体是每只灯泡的使用寿命D.个体是2000只灯泡的使用寿命2.某校举办了一次“交通安全知识”测试,王老师从全校学生的答卷中随机抽取了200名学生的答卷,并将测试成绩分为,,,四个等级,绘制出如图所示的条形统计图.若该校学生共有1000名,则估计该校成绩为的学生人数为()A.30B.75C.150D.2003.以下调查中,适宜全面调查的是()A.了解某班学生的身高情况B.了解某批灯管的使用寿命C.了解当代大学生的主要娱乐方式D.了解全国中学生的课外阅读情况4.某班统计了该班全体学生60秒内高抬腿的次数,绘制出频数分布表:次数60≤<8080≤<100100≤<120120≤<140140≤<160160≤<180180≤<200频数1241417134给出以下结论:①组数是6;②组距是20;③全班有55名学生;④高抬腿次数在120≤<180范围内的学生占全班学生的80%.其中正确结论的个数为()A.1B.2C.3D.45.将数据83,85,87,89,84,85,86,88,87,90分组,86.5∼88.5这组的频数是()A.1B.2C.3D.46.如图,一、二两组同学将本组最近5次数学平均成绩分别绘制成折线统计图.由统计图可知,成绩进步幅度大的组是()A.一组B.二组C.一组、二组进步幅度一样大D.无法判断7.某校开展了“爱阅读”活动,七(1)班统计了1~6月全班同学的课外阅读数量(单位:本),绘制了折线统计图(如图所示),则下列说法中正确的是()A.6月份阅读数量最大B.阅读数量超过40本的月份共有5个C.相邻的两个月中,1月到2月的阅读数量增长最快D.4月份阅读数量为38本8.下图所示的两个统计图中,女生人数多的学校是()A.甲校B.乙校C.甲、乙两校女生人数一样多D.无法确定9.下列四种统计图:条形图、扇形图、折线图、直方图,能够显示数据分布情况的是()A. B. C. D.10.下图是某种学生快餐的营养成分统计图,若脂肪有30 ,则蛋白质有()A.135 B.130 C.125 D.120 二、填空题:本题共9小题,每小题3分,共27分。
数据分析期末考试试卷一、选择题(每题2分,共20分)1. 在数据分析中,以下哪项不是数据清洗的目的?A. 去除重复数据B. 纠正错误数据C. 增加无关数据D. 标准化数据格式2. 描述性统计分析中,以下哪个指标不能反映数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差3. 以下哪种图形最适合展示时间序列数据的变化趋势?A. 柱状图B. 饼图C. 折线图D. 散点图4. 假设检验中,如果P值小于显著性水平α,我们通常会得出什么结论?A. 拒绝原假设B. 接受原假设C. 无法得出结论D. 需要更多的数据5. 以下哪种分析方法主要用于探索数据的潜在结构?A. 回归分析B. 因子分析C. 描述性统计D. 假设检验二、简答题(每题10分,共30分)6. 请简述数据可视化的重要性及其在数据分析中的应用场景。
7. 描述一下什么是相关性分析,并举例说明其在实际问题中的应用。
8. 解释什么是数据挖掘,并简述其在商业智能中的作用。
三、计算题(每题15分,共30分)9. 给定一组数据:3, 5, 7, 9, 11, 13, 15, 17, 19, 21。
请计算这组数据的平均数、中位数、众数和标准差。
10. 假设你正在进行一项研究,研究的目的是检验某种新药是否比传统药物更有效。
你已经收集了两组数据,一组是使用新药的患者,另一组是使用传统药物的患者。
请描述你将如何使用假设检验来分析这些数据。
四、案例分析题(每题20分,共20分)11. 假设你是一家电子商务公司的数据分析员,公司最近推出了一款新产品。
你被要求分析销售数据,以确定产品是否成功。
请描述你将如何收集和分析数据,以及你将使用哪些关键指标来评估产品的表现。
五、论述题(共10分)12. 论述大数据时代下,数据分析对于企业决策的重要性,并举例说明数据分析如何帮助企业实现更精准的市场定位。
试卷结束语:请同学们认真审题,仔细作答。
数据分析是一门实践性很强的学科,希望本次考试能够检验你们对数据分析理论知识的掌握和应用能力。
长春财经学院《跨境电商数据分析》2023-2024学年第一学期期末试卷考试时间:120 分钟;考试课程:《跨境电商数据分析》;满分:100分;姓名:——;班级:——;学号:——一、填空题(每题2分,共20分)1. 跨境电商的特征包括随时性、小批量、多批次、便捷性和__________。
2. 人们利用各种方式达到信息交流的目的,使面对面的直接交谈转变为采用各种现代化传递媒介进行信息交流的过程称为__________。
3. 卖家在选品时可以从广泛、专业、精选、__________、坚持、重复六个角度出发,理性、有逻辑地开展选品工作。
4. 折线图是将点和线连接在一起的图表,它可以反映__________和分布情况。
5. 知识产权合规性数据分析一般包括广告合规、__________和财税合规。
6. 客户生命周期标签包括:认知—兴趣—购买—成长—__________—流失。
7. 不直接通过站外渠道进入店铺页面,而是先到站外活动承接页、速卖通首页等中间页,然后再进入店铺的方式称为__________。
8. 客户消费金额较高,消费频次偏低,且已很久没有消费行为的客户类型属于__________。
9. 不采取任何措施并支付仓储费,要比采取措施(如降低价格或移除库存)花费更高成本的商品称为__________。
10. 市场数据分析不需要结合__________数据展开。
二、单选题(每小题3分,共30分)1. 跨境电商数据分析中,哪个指标通常用于衡量用户对商品的购买意向?()A. 页面浏览量(PV)B. 跳出率(Bounce Rate)C. 转化率(Conversion Rate)D. 平均访问时长2. 在进行跨境电商市场细分时,主要依据的数据类型不包括以下哪一项?()A. 消费者地理位置B. 年龄与性别C. 社交媒体互动记录D. 宗教信仰3. 下列哪项是跨境电商数据分析中常用的可视化工具?()A. PhotoshopB. ExcelC. TableauD. Instagram4. A/B测试主要用于评估跨境电商网站中哪两个版本的效果差异?()A. 广告文案与图片B. 产品价格与库存量C. 网站布局与颜色搭配D. 物流方式与支付选项5. 在跨境电商数据分析中,RFM模型主要用于分析什么?()A. 用户活跃度与忠诚度B. 产品成本与利润C. 物流效率与配送时间D. 市场容量与竞争态势6. 下列哪项数据不属于跨境电商销售数据分析的范畴?()A. 销售额与销售量B. 退货率与差评率C. 网站流量来源D. 供应商交货准时率7. 跨境电商数据分析中,使用聚类分析的主要目的是什么?()A. 预测未来销售趋势B. 识别不同消费者群体C. 确定最佳物流路径D. 优化广告投放位置8. 以下哪个因素不是影响跨境电商数据分析准确性的关键因素?()A. 数据来源的多样性B. 数据清洗的彻底性C. 分析方法的适用性D. 数据分析师的经验水平9.在跨境电商中,以下哪个指标最能直接反映网站的盈利能力?A. 访问量(Visits)B. 跳出率(Bounce Rate)C. 平均订单价值(Average Order Value, AOV)D. 用户留存率10. 下列哪种数据分析方法适用于发现隐藏在大量数据中的关联规则?A. 回归分析B. 聚类分析C. 关联规则挖掘D. 因子分析三、判断题(每小题3分,共30分)1. 跨境电商数据分析主要是通过社交媒体平台的互动数据来评估市场趋势和消费者行为的。
电子商务数据分析期末试卷(二)1. 单选题(分值:1分)标准答案:A()影响店铺的利润,与销售额及成交人数密切相关。
•A、客单价•B、动销率•C、成交转化率•D、咨询成交率2. 单选题(分值:1分)标准答案:A()指标是电子商务数据监控的核心,包括访问电子商务网站的访客数、访问深度等数据指标。
•A、流量•B、销售及转化•C、商品•D、客户3. 单选题(分值:1分)标准答案:B( )是以高亮的形式展示数据信息,并且可以清楚直观地看到页面上每一个区域的访客兴趣焦点。
•A、柱形图•B、热力图•C、雷达图•D、交叉图4. 单选题(分值:1分)标准答案:B报表是用表格的形式呈现电子商务运营过程中特定时间段的各项数据,关于报表制作,下列说法错误的是()。
•A、报表根据展现形式的不同可分为列表式和矩阵式•B、报表的目标用户对报表中数据指标的选择没有影响•C、数据报表的制作根据围绕电子商务日常数据汇报需求展开•D、通过报表有助于运营人员了解电子商务经营动态,进行整体评估5. 单选题(分值:1分)标准答案:B仓储费用、库存周转率、残次库存比及售罄率等指标属于()。
•A、商品类目指标•B、供应链指标•C、流量指标•D、营销推广指标6. 单选题(分值:1分)标准答案:C关于报表,下列说法错误的是( )。
•A、电商企业的日、周、月报表各有不同的侧重点•B、报表根据展现形式的不同可以分为列表式和矩阵式•C、报表是通用的,发送给运营人员和管理层人员的报表完全无需区分•D、通过报表有助于运营人员了解电商企业经营动态,进行整体评估7. 单选题(分值:1分)标准答案:C进行分组分析时需要遵循相应原则,其中()指进行分组的每一个单位都只能属于一个分组,不能同时属于两个或两个以上的分组。
•A、无遗漏原则•B、时间范围可比•C、排他性原则•D、整体性质可比答案解析:时间范围可比、整体性质可比属于对比分析在选择指标时遵循原则。
8. 单选题(分值:1分)标准答案:C某店铺2019年9月访客数为1896人,2019年8月的访客数为1756人,2018年9月访客数为1359人,其2019年9月同比增长率为()。
2020-2021学年第二学期《R语言数据分析方法与实验》期末考试试题第一题(共35分)探索nycflights13数据集1.从flights数据中找出到达时间延误2小时或者更多的所有航班,并将生成的新数据保存为flight_arr2hr。
(5分)2.将生成的flight_arr2hr数据集根据目的地(dest)进行分组,统计出抵达每个目的地的航班数量,筛选出抵达航班数量前十名的目的地,将结果命名为top10_dest。
(5分) 3.从weather表中挑选出以下变量:year, month, day, hour, origin, humid, wind_speed,并将其与flight_arr2hr表根据共同变量进行左连接, 生成的新数据保存为flight_weather (5分)4.基于flight_weather数据集,根据不同出发地(origin)在平行的三个图中画出风速wind_speed(x轴)和出发延误时间dep_delay(y轴)的散点图,以及平滑曲线。
(5分)5.flights中每家航空公司在2013年有多少班次的航班被取消了?提示:依据dep_time来判断某班次航班是否被取消(5分)6.找出flights中每一家航空公司的航班最常去的目的地机场,以及flights中每家航空公司飞往最常去的目的地机场的航班数量(10分)第二题(共20分)探索diamonds数据集1.对diamonds数据集,生成一个新变量id,用于存储每条观测值所在的行数。
挑选出id, x, y, z四个变量,将宽数据转换为长数据:将x, y, z的变量名存为新变量dimension,将x, y, z的值存为新变量length。
转换后的长数据存为xyz_long。
(5分)2.将xyz_long数据集转换回宽数据xyz_wide。
宽数据xyz_wide包含id, x, y, z四个变量。
(5分)3.写代码找出diamonds中最常见和最不常见的color,即出现次数最多和最少的color。
《大数据分析师(初级)》考前模拟A3卷1.【单选题】搜狗搜索引擎的爬虫叫()。
A:百度蜘蛛B:360SpiderC:SogouspiderD:Bingbot正确答案:C2.【单选题】数据采集的()与技术执行的速度、团队内部成员协同以及数据分析需求和目标实现的效率有关。
A:全面性B:多维性C:无序性D:高效性正确答案:D答案解析:数据采集的高效性与执行速度、协调性有关。
3.【单选题】下列数据预处理任务,( )可以用来平滑数据,消除数据噪声。
A:数据清洗B:数据集成C:数据变换D:数据规约正确答案:A答案解析:消除噪声属于数据清洗阶段的任务4.【单选题】下列不是用于大数据查询分析计算的产品是( )。
A:HiveB:HBaseC:SparkSQLD:Dremel正确答案:B答案解析:Hbase是分布式存储技术。
5.【单选题】数据仓库—般都是存在层次架构的,比如可以分为ODS、DW、DM层,不同粒度的表,不同作用的表,一般会分布在不同的层级中,如下相关信息表存放在ODS层的有( )。
A:从源系统同步至数仓的粒度相同的一张登录日志表B:日期为天粒度的登录统计表C:从人的角度统计的登录情况表D:日期为月粒度的登录统计表正确答案:A答案解析:ODS层存储的明细数据。
6.【单选题】从数据量方面来看,互联网系统和机器系统产生的数据量要()企业系统的数据量。
A:远远大于B:远远小于C:等于D:无法确定正确答案:A7.【单选题】数据规约的目的是( )。
A:填补数据中的空缺值B:集成多个数据源的数据C:得到数据集的压缩表示D:规范化数据正确答案:C8.【单选题】下列陈述不正确的是()。
A:大数据将实现科学决策B:大数据使政府决策更加精准化C:大数据彻底将群体性事件化解在萌芽状态D:大数据将实现预测式决策正确答案:C答案解析:由于大数据是从量变到质变的过程,加之数据被广泛挖掘,决策依据的信息完整性越来越高,依据信息的理性决策要高于以盲目决策。
命题方式:单独命题佛山科学技术学院2008—2009学年第一学期《数据分析》课程期末考试试题A卷专业、班级:姓名:学号:共3 页第 2 页共 3 页第3 页一(1)SAS界面包括输出框,日志框,编辑器(2)在非数值变量后面家上”$”符号.(3) 自由格式输入数据应加上”@@”标记.(4) 三均值的计算公式^M=1/4Q1+1/2M+1/4Q3二程序:data t1;input x@@;cards;100.00 107.57 112.42 96.21 121.58 107.21 117.16 116.19 101.37 109.78 112.83 104.37 105.40 109.50 111.60 112.10 113.50 112.40 proc univariate plot normal;run;proc capability graphics normal;histogram x/normal;qqplot x/normal(….);run;(1)由上图可知道均值:109.510556 方差:40.5703938变异系数:5.81632451 峰度:0.05978054偏度:-0.3324812(2)中位数:上四分位数:下四分位数:四分位极差:(3)做出直方图、QQ图、茎叶图、箱线图直方图:QQ图茎叶图:箱线图:(4)进行正态性W 检验(取05.0=α).由上图可以知道Wo=0.978265,P=0.9304>05.0=α; 故不能拒绝原假设Ho,所以是高度显著的。
三data t2; input x1-x4; cards ;16.7 26.7 6.4 35.0 18.2 28.0 3.2 29.7 16.7 26.7 2.1 34.9 18.1 26.7 4.3 31.5 16.7 26.0 3.0 32.7 18.1 30.2 7.0 34.9 20.2 30.5 4.8 34.4 20.2 29.5 5.5 36.2 21.5 31.5 5.8 36.5 18.8 30.6 5.4 35.4 21.6 27.8 5.4 34.1 21.3 29.5 5.8 35.8proc corr cov pearson ; run ;(1)计算协方差矩阵,Pearson 相关矩阵; 协方差矩阵:Pearson 相关矩阵:(2)分析各指标间的相关性(取10.0=α)由Pearson 相关矩阵的上三角矩阵看出r13,r14都大于10.0=α 故这些向量的相关性不是很强。
大学试卷学年第 1 学期;课号课程名称数据挖掘与数据分析(A卷; ,闭卷);适用班级(或年级、专业)(每位考生需要答题纸(8k)2 张、草稿纸(16k)1 张)一、选择题(20分, 2分*10题)1.数据挖掘基本任务不包括()A.分类与预测B.聚类分析C.关联规则D.战略分析2.聚类分析通常要求()A.类别内数据“差异性”尽可能小,类别间“差异性”尽可能小B.类别内数据“差异性”尽可能大,类别间“差异性”尽可能大C.类别内数据“差异性”尽可能小,类别间“差异性”尽可能大D.类别内数据“差异性”尽可能大,类别间“差异性”尽可能小3.数据挖掘建模过程不包括()A.数据取样、探索、预处理B.模式发现C.数据建模及模型评估D.数据存储空间4.数据标准化主要目的是()A.消除指标之间的量纲和大小不一的影响B.完全消除数据之间的差异C.有利于节省数据计算时间D.有利于减少数据计算存储空间5.数据规约包括()A.属性规约和数值规约B.属性规约和变量规约C.数值规约和变量规约D.属性规约与数值压缩6.关联分析主要任务包括()A.支持度分析B.关联规则的产生C.模式分析D.结构挖掘7.()表示分类模型中正确分类的样本数与样本总数的比值A.准确度(Accuracy)B.精确度(Precision)C.支持度D.置信度8.聚类算法不包括哪类()A.基于划分的方法B.基于层次的方法C.基于密度的方法D.基于智能的方法9.项集A、B同时发生的概率称为关联规则的()A.支持度B.置信度C. 可信度D.提升度10.离群点检测方法不包括()A.基于统计B.基于控制模型C.基于聚类D.基于邻近度二、判断题(20分,2分*10题,正确标记√,错误标记×)1. 数据挖掘基本任务包括利用分类与预测、聚类、关联规则等方法。
()2. Numpy包正确的安装命令如下:pip python install numpy。
()3.相关性分析是数据特征分析方法。
2021-2022学年第二学期电子商务数据分析课程考试试卷A1、下列数据指标中不属于供应链指标的是()。
A、订单满足率B、商品访客数C、库存周转率D、平均配送成本2、下列不属于指数工具的是()。
A、百度指数B、百度统计C、搜狗指数D、360趋势3、以下第三方工具中可查看竞争对手店铺销售数据、引流途径、广告投放、活动推广等数据信息的是()。
A、店侦探B、京东商智C、火车采集器D、百度指数4、()是产品在平台交易热度的体现,是衡量店铺、产品受欢迎程度的一个重要指标,它越高该产品越受消费者欢迎。
A、产品交易指数B、产品搜索指数C、产品购买指数D、产品收藏指数5、下列采集行为属于违法行为的是()。
A、使用生意参谋工具导出自己店铺运营数据B、使用百度指数工具获取关键词搜索指数及用户画像数据C、通过技术手段进入竞争对手网站数据库获取网站流量及销售数据D、使用数据采集工具采集其他网站公开数据信息用于数据分析6、以下不属于客户行为数据的是()。
A、购买时间B、客户地域C、支付金额D、评价7、产品获客能力是对产品为店铺或平台获取新客户的能力的衡量,主要指标不包括()。
A、客户关注量B、收藏量C、重复购买率D、店铺销售额8、在Excel中COUNT函数的功能是()。
A、求和B、计数C、算平均值D、条件求和9、某网店是一家经营化妆品的网店,近期,该网店的客户总数为200人,其中30人重复购买,这30人中有18人重复购买1次(即:购买2次),有12人重复购买2次(即:购买3次),那么交易次数计算,近期该网店的复购率是()。
A、21%B、18%C、15%D、30%10、某企业店铺单日成交了4个客户的订单,订单金额分别是:4620元、5670元、3850元、6660元,其客单价为()。
A、4713.3元B、4160元C、5200元D、6162.5元11、某网店是一家天猫旗舰店,专营女士碎花裙。
近日该店主上新一批商品,并将其中两款商品加入了直通车推广,一个星期后后台统计结果如下:通过查看案例中的数据,判断商品A与商品B,哪款点击转化率更高一些?()A、商品AB、商品BC、一样高D、无法判断12、请将数据清单处理功能进行分类汇总的一般步骤进行正确排序()。
数据分析期末考试试卷(附带答案)请注意以下说明:- 本试卷共分为两部分:选择题和解答题。
- 所有答案均应在答题纸上写出,并标明题号。
- 每道选择题只有一个正确答案,请选出最恰当的答案。
- 解答题应尽量简洁明了,如有计算过程,请写清楚。
- 考试时间为120分钟,试卷满分为100分。
- 祝你好运!选择题1. 数据分析的目的是:A. 收集数据B. 组织数据C. 提取信息D. 分享结果2. 下面哪个不是数据分析常用的可视化工具:A. 折线图B. 饼图C. 柱状图D. 线性回归模型3. 数据清洗是指:A. 删除不需要的数据B. 处理数据中的缺失值和异常值C. 将数据转换为可视化形式D. 对数据进行统计分析4. 数据挖掘是从大量的数据中发现:A. 数据的类型B. 数据的来源C. 数据的模式和关联性D. 数据的质量5. 在回归分析中,用于预测的变量称为:A. 因变量B. 自变量C. 联合变量D. 相关变量解答题1. 简述数据分析的步骤。
2. 举例说明数据清洗的过程。
3. 什么是数据可视化?简要介绍一种常用的数据可视化工具。
4. 解释线性回归模型的概念和作用。
5. 什么是关联分析?举例说明如何进行关联分析。
答案选择题:1. C2. D3. B4. C5. B解答题:1. 数据分析的步骤包括:收集数据、清洗数据、探索数据、分析数据、可视化数据和得出结论。
2. 数据清洗的过程可以举例为以下步骤:- 删除含有缺失值的观测数据- 填充缺失值- 删除异常值- 校验数据是否符合预设规则3. 数据可视化是通过图表、图形等方式将数据转化为可视形式以便更好地理解和分析数据的过程。
一种常用的数据可视化工具是柱状图,它可以直观地展示不同类别或变量之间的比较情况。
4. 线性回归模型是一种用于建立因变量与一个或多个自变量之间关系的统计模型。
它的作用是通过对自变量与因变量的关系进行建模和分析,来预测因变量的数值。
5. 关联分析是对数据集中项之间的关联性进行探索和分析的过程。
《数据分析与SPSS软件应用》试卷A一、填空题(每空2分,共20分)1. 统计分析所使用的数据按照其测量精度,可以分为四种类型,分别是定性数据、定序数据、和。
2. SPSS中可以进行变量转换的命令有。
3. 多选项二分法是将设置为一个SPSS变量,而多选项分类法是将设置为SPSS变量。
4. 进行两独立样本群均值比较前,首先要验证的是。
5. 协方差分析中,对协变量的要求是数值型,多个协变量间互相独立和。
6. 多配对样本的柯克兰Q检验适用的数据类型为。
7. 衡量定距变量间的线性关系常用相关系数。
8.常用来刻画回归直线对数据拟合程度的检验统计量指标为。
二、选择题(每小题2分,共20分)1. 在SPSS中,以下哪种不属于SPSS的基本运行方式?()A 完全窗口菜单方式B 批处理命令方式C 程序运行方式D 混合运行方式2. 设置变量属性时,不属于SPSS提供的变量类型的是()A 数值型B 科学计数型C 分数型D 字符型3. 数据的描述统计分析结果显示偏度值为-1.3,则下列对数据分布状态说法正确的是()A 左偏B 正偏C 与正态分布一致D 可能存在极大值4. 若原假设与备择假设为:H0:μ1=μ2 H1:μ1≤μ2,则:()A 应使用右侧单尾检验B 应使用左侧单尾检验C 应使用双尾检验D 无法检验5. 下列哪个不是单因素方差分析的基本假定?()A 各总体的均值相等B 各总体相互独立C 样本来自于正态总体D 各总体的方差相等6. 两个配对样本的Wilcoxon符号秩检验所对应的参数检验方法是?()A 两个独立总体均值差的检验B 两个配对总体均值差的检验C 一个总体均值的检验D 单因素方差分析7. 皮尔逊简单相关系数为1,说明()A 两变量之间不存在线性相关关系B 两变量之间是负相关关系C 两变量之间存在完全的线性相关关系D 两变量之间具有高度相关性8.下列说法正确的是()A回归分析是以变量之间存在函数关系为前提的B回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法C 回归分析中自变量个数只能为一个D 回归分析是反应确定性问题的统计分析方法9.以下关于聚类分析的叙述中错误的是()A 聚类分析的目的在于将事物按其特性分成几个聚类,使同一类内的事物具有高度相似性B 不同聚类的事物则具有高度的异质性C 对于衡量相似性,只能使用距离的工具D 建立聚类的方法,有层次聚类法和快速聚类法10. 关于因子分析,错误的说法是()A 适用于多变量、大样本B 原变量间不必要存在高度的相关性C定类和定序变量不适合做因子分析D 因子得分可以作为新变量存储在数据表格中三、判断题(每小题2分,共20分)1. SPSS中可将”.”用于变量命名,且”.”可以位于变量名末尾。
一、数据库知识单项选择题1. 数据库系统的核心是(B)A、数据模型B、数据库管理系统C、软件工具D、数据库2. 下列叙述中正确的是(C)。
A、数据库是一个独立的系统,不需要操作系统的支持B、数据库设计是指设计数据库管理系统C、数据库技术的根本目标是要解决数据共享的问题D、数据库系统中,数据的物理结构必须与逻辑结构一致3. 下列模式中,能够给出数据库物理存储结构与物理存取方法的是( A )。
A、内模式B、外模式C、概念模式D、逻辑模式4. SQL语句中修改表结构的命令是(C )。
A、MODIFY TABLEB、MODIFY STRUCTUREC、ALTER TABLED、ALTER STRUCTURE5. SELECT-SQL语句是(B ) 。
A、选择工作区语句B、数据查询语句C、选择标准语句D、数据修改语句6. SQL语言是( C )语言。
A、层次数据库B、网络数据库C、关系数据库D、非数据库7. 如果要创建一个数据组分组报表,第一个分组表达式是"部门",第二个分组表达式是"性别",第三个分组表达式是"基本工资",当前索引的索引表达式应当是( B )。
A、部门+性别+基本工资B、部门+性别+STR(基本工资)C、STR(基本工资)+性别+部门D、性别+部门+STR(基本工资)8. 数据库DB、数据库系统DBS、数据库管理系统DBMS三者之间的关系是( A )。
A、DBS包括DB和BMSB、DBMS包括DB和DBSC、DB包括DBS和DBMSD、DBS就是DB,也就是DBMS9. 下列有关数据库的描述,正确的是( C )。
A、数据库是一个DBF文件B、数据库是一个关系C、数据库是一个结构化的数据集合D、数据库是一组文件10. 下列说法中,不属于数据模型所描述的内容的是( C )。
A、数据结构B、数据操作C、数据查询D、数据约束11. 数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作,这种功能称为( C ) 。
《数据分析》期末复习题1. 在电子商务领域,商务数据可以分为两大类:_______和_____。
[填空题] *空1答案:前端行为数据空2答案:后端商业数据2. 场景营销是基于___、_____、_____等三大场景之一的一种新营销理念。
[填空题] *空1答案:输入场景空2答案:搜索场景空3答案:浏览场景3. 电商的基础数据主要有_____、____、会员数据、___和_____。
[填空题] *空1答案:营销数据空2答案:流量数据空3答案:交易及服务数据空4答案:行业数据4. 一般平台商都不支持____个月以上的交易数据下载。
[填空题] *_________________________________(答案:3)5. ____是电商运营的核心指标。
[填空题] *_________________________________(答案:转化率)6. 通常我们提到的转化率是____。
[填空题] *_________________________________(答案:成交转化率)7. ____是指为了达到某个目标进行多个方案并行测试,每个方案仅有一个变量不同,最后以某种规则选择最优的方案。
[填空题] *_________________________________(答案:A/B测试)8. ____用高亮颜色展示用户的访问偏好,对用户的体验数据进行可视化展示。
[填空题] *_________________________________(答案:热图|热力图)9. 下列不属于流量数据的是()。
[单选题] *A.人均费用(正确答案)B.浏览量C.访客数D.在线时长10. 下列属于第三方数据网站的是()。
[单选题] *A.百度统计B.数据魔方C.量子恒道(正确答案)D.谷歌分析11. 下列属于数据收集内部渠道的是()。
①客户调查②专家与客户访谈③专业调研机构④内部数据库 [单选题] *A.①、②、④(正确答案)B.①、③、④C.①、②、③D.全部12. 下列不属于数据分析工具的是() [单选题] *A.SPSSB.RC.PowerPoint(正确答案)D.Python13. ()是电商运营中采购与销售的中转站。
数据分析本科试题及答案一、单项选择题(每题2分,共20分)1. 数据分析中,用于描述数据集中趋势的统计量是()。
A. 方差B. 标准差C. 平均值D. 极差答案:C2. 以下哪个选项不是数据清洗的目的()。
A. 去除重复数据B. 纠正错误数据C. 增加数据量D. 识别并处理缺失值答案:C3. 在数据分析中,相关系数的取值范围是()。
A. -1到1之间B. 0到1之间C. -1到0之间D. 0到正无穷答案:A4. 以下哪个算法不是监督学习算法()。
A. 决策树B. 支持向量机C. K-均值聚类D. 逻辑回归答案:C5. 数据可视化中,用于展示数据分布情况的图表是()。
A. 散点图B. 折线图C. 柱状图D. 直方图答案:D6. 以下哪个选项是时间序列分析中常用的模型()。
A. 线性回归模型B. 逻辑回归模型C. ARIMA模型D. 神经网络模型答案:C7. 在数据分析中,用于识别异常值的方法是()。
A. 箱线图B. 相关系数C. 回归分析D. 聚类分析答案:A8. 以下哪个选项是描述性统计分析的内容()。
A. 预测未来趋势B. 识别数据模式C. 建立因果关系D. 计算数据的平均值答案:D9. 在数据分析中,用于评估分类模型性能的指标是()。
A. 均方误差B. 精确率C. 召回率D. 以上都是答案:D10. 以下哪个选项不是数据预处理的步骤()。
A. 数据清洗B. 特征选择C. 数据转换D. 模型训练答案:D二、多项选择题(每题3分,共15分)11. 数据分析中,以下哪些是数据转换的常见方法()。
A. 归一化B. 标准化C. 离散化D. 数据清洗答案:ABC12. 在数据分析中,以下哪些是特征选择的目的()。
A. 提高模型的准确性B. 减少计算复杂度C. 降低模型过拟合的风险D. 增加数据量答案:ABC13. 以下哪些是数据可视化中常用的图表类型()。
A. 散点图B. 热力图C. 树状图D. 饼图答案:ABCD14. 在数据分析中,以下哪些是数据挖掘的常见任务()。
《Excel数据处理与分析》期末考试卷A1【单选题】(2分)为了区别"数字"与"数字字符串"数据,Excel要求在输入项前添加( )符号来确认。
A."B.'C.#D.@回答正确B2【单选题】(2分)Excel 2010主界面窗口中编辑栏上的"fx"按钮用来向单元格插入( )。
A.文字B.数字C.公式D.函数正确答案:C3【单选题】(2分)以下能计算出字符串“ISBN-ABC-123人教版”中汉字个数的公式是。
A.Len(("ISBN-ABC-123人教版")+LenB("ISBN-ABC-123人教版")B.LenB ("ISBN-ABC-123人教版")+Len(("ISBN-ABC-123人教版")C.Len(("ISBN-ABC-123人教版")-LenB("ISBN-ABC-123人教版")D.LenB ("ISBN-ABC-123人教版")-Len(("ISBN-ABC-123人教版")回答正确D4【单选题】(2分)在Excel 2010中,若需要将工作表中某列上大于某个值的记录挑选出来,应执行数据菜单中的( )。
A.排序命令按钮B.筛选命令按钮C.分类汇总命令按钮D.合并计算命令按钮正确答案:B5【单选题】(2分)关于模糊查找,以下叙述中正确的是。
A.通配符*表示一个任意符号B.通配符?表示多个任意符号C.可以使用通配符*和#进行模糊查找D.以上都不对回答正确D6【单选题】(2分)企业要最小运输成本问题,最有效的工具是。
A.模拟运算表B.方案分析C.规划求解回答正确C7【单选题】(2分)是一种以工作任务和任务完成时间为依据的图形。
A.直方图B.甘特图C.双轴图D.组合图回答正确B8【单选题】(2分)在Excel2010中,在某单元格内输入“=5>=3”确定后单元格内显示A.#NUMB.#N/AC.TRUED.FALSE回答正确C9【单选题】(2分)在Excel中,若单元格中出现#N/A、这是指在函数或公式中没有。
2021年秋学期《数据分析》期末考试试题(A卷)命题教师:教研室审核:教务科审核:适用班级:高技2101班级:学号:姓名:分数:实操考试题:请根据题目要求及提供的源数据,完成以下操作:一、完成年度销量分析任务内容在电子商务运营过程中,电商企业需要及时总结上一年的销量变化,通过分析销量的变化趋势,找出其中存在的问题,并指导制定下一年的销售目标或生产量。
临近年关,某小家电品牌线上店铺的运营主管计划制作年度数据报告,为了使报告结构清晰,并且直观展现其中的关键数据,主管安排小何统计2018年度每个季度的小家电销量,并将2018年总销量与之前三年的销量分别进行比较,并选择合适的图表类型进行呈现。
任务操作请根据题目要求、原始数据进行处理和分析,并截图。
(每小题10分,共40分)1.根据题意与原始数据5-1 2018年各季度销量,制作适当的图表,并进行美化;2.结合图表,对2018年度的销量进行分析;3.根据题意与原始数据5-2 2014-2018年销量统计表,计算环比增长率,制作适当的图表,并进行美化;4.对2015-2018年度的销量及环比增长率进行分析,.给企业管理者提供辅助决策。
二、推广数据分组分析任务内容企业在进行营销推广后,对推广数据进行分析,能够帮助其了解推广的整体效果,衡量投入产出比,指导其进行推广策略的优化。
在2019年秋季来临之际,某企业安排了为期6天的换季促销推广活动,在活动结束后,营销部门经理想要评估推广效果,于是安排小李对推广期间的订单量和销售额数据进行分析,明确该次推广对商品销售的影响,以及免费和付费推广渠道各自的推广效果,为企业后续营销策略的制定提供参考。
任务操作使用Excel工具中的VLOOKUP函数对推广数据进行分组分析。
将操作步骤及关键节点成果截图。
(每小题10分,共60分)1.数据整理,添加订单量、销售额分组项;2.添加订单量、销售额的组限和分组下限。
订单量组限以50为单位,销售额组限以2000为单位。
大数据分析与应用期末考试一,单项选择题,每小题1分,20小题共计20分1、当前大数据技术的基础是由()首先提出的。
[单选题] *A、微软B、百度C、谷歌(正确答案)D、阿里巴巴2、大数据的起源是()。
[单选题] *A、金融B、电信C、互联网(正确答案)D、公共管理3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是()。
[单选题] *A、数据管理人员B、数据分析员C、研究科学家(正确答案)D、软件开发工程师4、()反映数据的精细化程度,越细化的数据,价值越高。
[单选题] *A、规模B、活性C、关联度D、颗粒度(正确答案)5、数据清洗的方法不包括()。
[单选题] *A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理(正确答案)6、智能健康手环的应用开发,体现了()的数据采集技术的应用。
[单选题] *A、统计报表B、网络爬虫C、API接口D、传感器(正确答案)7、下列关于数据重组的说法中,错误的是()。
[单选题] *A、数据重组是数据的重新生产和重新采集(正确答案)B、数据重组能够使数据焕发新的光芒C、数据重组实现的关键在于多源数据融合和数据集成D、数据重组有利于实现新颖的数据模式创新8、智慧城市的构建,不包含()。
[单选题] *A、数字城市B、物联网C、联网监控(正确答案)D、云计算9、大数据的最显著特征是()。
[单选题] *A、数据规模大(正确答案)B、数据类型多样C、数据处理速度快D、数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的()。
[单选题] *A、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析(正确答案)C、在分析效果上更追究效率而不是绝对精确D、在数据规模上强调相对数据而不是绝对数据11、下列关于舍恩伯格对大数据特点的说法中,错误的是()。
数据分析期末试题及答案数据分析期末试题及答案⼀、⼈⼝现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买⼒计算的⼈均GDP(x1)、成⼈识字率(x2),⼀岁⼉童疫苗接种率(x3)的数据,试⽤多元回归分析的⽅法分析各国家和地区平均寿命与⼈均GDP、成⼈识字率、⼀岁⼉童疫苗接种率的关系。
(25分)解:1.通过分别绘制地区平均寿命(y)、按购买⼒计算的⼈均GDP(x1)、成⼈识字率(x2),⼀岁⼉童疫苗接种率(x3)之间散点图初步分析他们之间的关系上图是以⼈均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。
尝试多种模型后采⽤曲线估计,得出表⽰地区平均寿命(y)与⼈均GDP(x1)的对数有线性关系上图是以成⼈识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。
上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。
x)为横轴,地区平均寿命(y)为纵轴的散点图,上图是以疫苗接种率(x3)的三次⽅(33由图可知,他们之间呈正线性关系所以可以采⽤如下的线性回归⽅法分析。
2.线性回归先⽤强⾏进⼊的⽅式建⽴如下线性⽅程设Y=β0+β1*(Xi1)+β2*Xi2+β3*3iX+εi i=1.2 (24)其中εi(i=1.2……22)相互独⽴,都服从正态分布N(0,σ^2)且假设其等于⽅差模型汇总b模型R R ⽅调整R ⽅标准估计的误差1 .952a.907 .891 3.332a. 预测变量: (常量), x3, x1, x2。
b. 因变量: y上表是线性回归模型下的拟合优度结果,由上表知,R值为0.952,⼤于0.8,表⽰两变量间有较强的线性关系。
且表⽰平均寿命(y)的95.2%的信息能由⼈均GDP(x1)、成⼈识字率(x2),⼀岁⼉童疫苗接种率(x3)⼀起表⽰出来。
建⽴总体性的假设检验提出假设检验H0:β1=β2=β3=0,H1,:其中⾄少有⼀个⾮零得如下⽅差分析表Anova b模型平⽅和df 均⽅ F Sig.1 回归1937.704 3 645.901 58.190 .000a残差199.796 18 11.100总计2137.500 21a. 预测变量: (常量), x3, x1, x2。
2021年秋学期《数据分析》期中考试试题(A卷)命题教师:教研室审核:教务科审核:适用班级:高技2101班级:学号:姓名:分数:实操考试题:请根据题目要求及提供的源数据,完成以下操作:一、完成推广数据分析任务内容在电商运营中,做好推广工作是企业销售的重中之重,它可以帮助企业提升品牌形象、拓展市场占有率,最终完成商品销售。
某电子商务企业计划近期进行一次活动推广,部门经理安排小周对店铺不同渠道的推广数据进行处理,找出优势渠道,从而进行精准推广投放。
任务分析精准推广投放,是基于用户画像的基础,针对不同用户投放不同的广告,从而达到推广精准化、高效化的目的。
衡量精准推广投放的重要指标,就是对不同渠道的推广投放效果进行比较,发现不同渠道之间的差异,从而指导选择出更合适的推广渠道。
由于免费推广渠道和付费推广渠道的效果分析指标略有不同,小周决定先对已采集到的推广数据进行分类,然后分别对免费推广渠道产生的数据和付费渠道产生的数据进行处理和计算,以便后期进行更精准的分析。
任务操作请针对企业的实际推广数据进行分类和处理,并截图。
(每小题10分,共50分)1.数据分类,分别筛选出“免费推广渠道”、“付费推广渠道”2.对“免费推广渠道”工作表进行“数据清洗”3.在“免费推广渠道”工作表添加新的字段“点击率”和“点击转化率”,计算后排序。
4.对“付费推广渠道”工作表进行处理,添加新的字段“投资回报率(ROI)”,以百分比显示5.给企业管理者辅助决策,根据渠道分类,分别推荐两个优势渠道,并说明为什么?二、月度访客量的描述性统计分析任务内容流量对于电子商务企业极为重要,访客数作为其中一个重要指标需要重点关注。
在店铺日常运营过程中,需要根据每月的访客情况进行数据统计,使运营人员能够监控到访客量变化,查看店铺访客异常情况,从而为制定、调整营销策略做辅助。
某线下实体店自9月1日开始转战电子商务平台,营业一个月内每天店铺销售额和销量一直不高,部门经理通过分析历史销售数据发现,线上进店的客户中产生购买的客户占比,即成交转化率数据高于行业平均水平,影响销量的主要原因是访客数较低。
命题方式:单独命题佛山科学技术学院2008—2009学年第一学期《数据分析》课程期末考试试题A卷专业、班级:姓名:学号:共3 页第 2 页共 3 页第3 页一(1)SAS界面包括输出框,日志框,编辑器(2)在非数值变量后面家上”$”符号.(3) 自由格式输入数据应加上”@@”标记.(4) 三均值的计算公式^M=1/4Q1+1/2M+1/4Q3二程序:data t1;input x@@;cards;100.00 107.57 112.42 96.21 121.58 107.21 117.16 116.19 101.37 109.78 112.83 104.37 105.40 109.50 111.60 112.10 113.50 112.40 proc univariate plot normal;run;proc capability graphics normal;histogram x/normal;qqplot x/normal(….);run;(1)由上图可知道均值:109.510556 方差:40.5703938变异系数:5.81632451 峰度:0.05978054偏度:-0.3324812(2)中位数:上四分位数:下四分位数:四分位极差:(3)做出直方图、QQ图、茎叶图、箱线图直方图:QQ图茎叶图:箱线图:(4)进行正态性W 检验(取05.0=α).由上图可以知道Wo=0.978265,P=0.9304>05.0=α; 故不能拒绝原假设Ho,所以是高度显著的。
三data t2; input x1-x4; cards ;16.7 26.7 6.4 35.0 18.2 28.0 3.2 29.7 16.7 26.7 2.1 34.9 18.1 26.7 4.3 31.5 16.7 26.0 3.0 32.7 18.1 30.2 7.0 34.9 20.2 30.5 4.8 34.4 20.2 29.5 5.5 36.2 21.5 31.5 5.8 36.5 18.8 30.6 5.4 35.4 21.6 27.8 5.4 34.1 21.3 29.5 5.8 35.8proc corr cov pearson ; run ;(1)计算协方差矩阵,Pearson 相关矩阵; 协方差矩阵:Pearson 相关矩阵:(2)分析各指标间的相关性(取10.0=α)由Pearson 相关矩阵的上三角矩阵看出r13,r14都大于10.0=α 故这些向量的相关性不是很强。
四:data t4;input num$ y x1 x2; cards ;1 169 265 3782 2 81 98 30083 192 330 24504 116 195 2137 5 55 53 25606 162 274 24507 120 180 32548 223 375 38029 131 205 2838 10 67 86 2347 ;proc reg data =t4; model y=x1-x2/i ; run ;(1) 求回归方程,给出各参数的实际解释由上图可以知道B=4.14260 ,1B=0.49482,2B=0.00890回归方程为y=4.14260+0.49482x1+0.00890x2;工厂产量y及工人数x1、成本x2的有关数据如下B为基本产量,当成本x2固定时,工人数x1每增加一个单位,产量y就增加0.49482个0单位,同理当成本x1固定时,成本x2每增加一个单位,产量y就增加0.00890个单位。
(2)求出方差分析、参数估计的结果方差分析:由方差分析图可以知道2=4.645152R=SSM/SST=27272/27304=0.9988F值为2935.52参数估计第五题:data t5;input x1-x7;cards;12.5 16.4 16.7 22.8 29.3 3.017 26.67.8 9.9 10.2 12.6 17.6 0.841 10.613.4 10.9 9.9 10.9 13.9 1.772 17.819.1 19.8 19.0 29.7 39.6 2.449 35.88.0 9.8 8.9 11.9 16.2 0.789 13.79.7 4.2 4.2 4.6 6.5 0.874 3.90.6 0.7 0.7 0.8 1.1 0.056 1.013.9 9.4 9.3 9.8 13.3 2.126 17.19.1 11.3 9.5 12.2 16.4 1.327 11.6;proc princomp;run;特征值:x1=6.36880695,x2=0.39792475,x3=0.16038442,x4=0.04542733,x5=0.02241485,x6=0.00474882. X7=0.00029289;贡献率和累计贡献率分别为:各主成分分别为:由于W1已经达到了90%所以第一主成分为w1=0.348824X1+0.390078X2+0.391810X3+0.385562X4+0.383622X5+0.353720X6+0.389491x 7六:data t6;input xy$ x1-x7;cards;1 36.05 7.13 7.75 16.67 11.68 2.38 12.88 1 37.69 7.01 8.94 16.15 11.08 0.83 11.67 1 38.69 6.01 8.82 14.79 11.44 1.74 13.23 1 37.75 9.61 8.49 13.15 9.76 1.28 11.28 1 35.71 8.04 8.31 15.13 7.76 1.41 13.25 1 39.77 8.49 12.94 19.27 11.05 2.04 13.29 1 40.91 7.32 8.94 17.60 12.75 1.14 14.80 1 33.70 7.59 10.98 18.82 14.73 1.78 10.101 35.02 4.72 6.28 10.03 7.15 1.93 10.392 52.41 7.70 9.98 12.53 11.70 2.31 14.69 2 52.65 3.84 9.16 13.03 15.26 1.98 14.57 2 55.85 5.50 7.45 9.55 9.52 2.21 16.30 2 44.68 7.32 14.51 17.13 12.08 1.26 11.57 2 45.79 7.66 10.36 16.56 12.86 2.75 11.69 2 50.37 11.35 13.30 19.25 14.59 2.75 14.87 ;data t61;input x1-x7;cards;64.34 8.00 22.22 20.06 15.12 0.72 22.89;proc discrim data=t6 testdata=t61out=a1outstat=a2 outcross=a3testout=a4 method=normallist crosslist testlist all;class xy;var x1-x7;priors equal;run;(1)求出三个协方差矩阵;S!=S2=S=(2)用距离判别求出线性判别函数,用交叉确认法计算误判率;由上图可以知道线性判别函数为:W!=-206.18758+16.6024x1-2.77150x2-5.80267x3+14.17359x4-8.00073x5+7.4917 4x6-22.87514x7W2=-382.57458+23.14210x1-3.89531x2-5.94472x3+17.23215x4-10.19191x5+12.6 0276x6-32.83581x7用交叉确认法计算误判率P=2/15=13.33%(3)判别待判样品属于哪一类.判别待判样品属于2类七、(15分)利用上一题的数据(共16个)进行聚类分析:(1)最短距离法,写出聚类过程,画出谱系图(取nclusters=4);(2)最长距离法,写出聚类过程,画出谱系图(取nclusters=4),求出四个聚类统计量;(3)快速聚类法分3类的结果,在平面坐标系中画出分类图.data t7;input x1-x7;cards;36.05 7.13 7.75 16.67 11.68 2.38 12.8837.69 7.01 8.94 16.15 11.08 0.83 11.6738.69 6.01 8.82 14.79 11.44 1.74 13.2337.75 9.61 8.49 13.15 9.76 1.28 11.2835.71 8.04 8.31 15.13 7.76 1.41 13.2539.77 8.49 12.94 19.27 11.05 2.04 13.2940.91 7.32 8.94 17.60 12.75 1.14 14.8033.70 7.59 10.98 18.82 14.73 1.78 10.1035.02 4.72 6.28 10.03 7.15 1.93 10.3952.41 7.70 9.98 12.53 11.70 2.31 14.6952.65 3.84 9.16 13.03 15.26 1.98 14.5755.85 5.50 7.45 9.55 9.52 2.21 16.3044.68 7.32 14.51 17.13 12.08 1.26 11.5745.79 7.66 10.36 16.56 12.86 2.75 11.6950.37 11.35 13.30 19.25 14.59 2.75 14.8764.34 8.00 22.22 20.06 15.12 0.72 22.89;proc cluster data=t7 method=sin std nonorm outtree=tree1;var x1-x7;run;proc tree data=tree1 graphics horizontal out=c1 nclusters=4;run;proc print data=c1;run;proc cluster data=t7 method=com std nonorm outtree=tree2;var x1-x7;run;proc tree data=tree2 graphics horizontal out=c2 nclusters=4; run;proc print data=c2;run;proc fastclus maxc=3distance list cluster=cdata=t6 out=d;run;proc plot;plot x2*x1=c;run;(1)最短距离法,写出聚类过程,画出谱系图(取nclusters=4);(2)最长距离法,写出聚类过程,画出谱系图(取nclusters=4),求出四个聚类统计量;(3)快速聚类法分3类的结果,在平面坐标系中画出分类图.。