数据采集与统计分析A卷
- 格式:doc
- 大小:77.02 KB
- 文档页数:5
信息素养培训平台2022.3 大数据分析师(初级)考前冲刺题A3卷1.【单选题】下列不属于分布式计算技术的是()。
A:MapReduceB:SparkC:FlinkD:TensorFlow正确答案:D答案解析:分布式计算技术包括MapReduce、Spark和Flink。
2.【单选题】在Flume日志采集过程中,目的地对应的组件为()。
A:sourceB:sinkC:channelD:selector正确答案:B答案解析:Flume日志采集中,source对应源,sink对应目的3.【单选题】下列关于HBase特性描述不正确的是()。
A:Google的Bigtable的开源实现B:是典型的分布式数据库系统C:采用行式存储D:支持数据的随机读取正确答案:C答案解析:HBase是一个开源的、分布式NoSQL数据库系统,是Google的Bigtable的开源实现,是Apache基金会的顶级项目。
作为一个典型的分布式数据库系统,HBase具有高可靠性、高性能、可伸缩等分布式架构特性。
虽然HBase底层采用了H DFS的存储,但与HDFS支持顺序存取不同,HBase采用列式存储结构,支持数据的随机存取功能。
因此,HBase 是一个可以进行随机存取和检索数据的存储平台。
HBase的目标是存储并处理由成千上万的行和列所组成的大型数据。
具体来说,HBase可以通过水平扩展的方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表 。
4.【单选题】大数据在哪个领域的应用是最为成熟的()。
A:教育领域B:商业领域C:医疗领域D:智能城市领域正确答案:B答案解析:目前,大数据在商业领域的应用是最为成熟的。
这主要有两个原因。
第一个原因是商业领域变现更快,大数据能够快速、直接地体现出来价值。
另外一个原因是商业领域产生的数据量非常庞大,消费者的行为都会成为对企业非常有价值的数据来源,这也让大数据能够在商业领域落地有了非常扎实的基础。
一、选择题1.如图是王涵某两天进行体育锻练的时间统计图,第一天锻炼了1小时,第二天锻炼了40分钟.王涵这两天体育锻炼时间最长的项目是()A.跳绳B.跳远C.跑步D.仰卧起坐2.某校八年级有1600名学生,从中随机抽取了200名学生进行立定跳远测试,下列说法正确的是()A.这种调查方式是普查B.200名学生的立定跳远成绩是个体C.样本容量是200D.这200名学生的立定跳远成绩是总体3.某校学生参加体育兴趣小组情况的统计图如图所示,若参加人数最少的小组有50人,则参加人数最多的小组有()A.50人B.70人C.80人D.200人4.“三农问题”是指农业、农村、农民这三个问题。
随着“三农”问题的解决,某农民近两年的年收入发生了明显变化,已知前年和去年的收入分别是40000元和60000元,下面是依据①②③三种农作物每种作物每年的收入占该年年收入的比例绘制的扇形统计图.依据统计图得出的以下四个结论正确的是()A.①的收入去年和前年相同B.③的收入所占比例前年的比去年的大C.去年②的收入为2.1万D.前年年收入不止①②③三种农作物的收入5.如图是一个扇形统计图,那么以下从图中得出的结论:①A占总体的25%;②表示B的扇形的圆心角是18 ;③C和D所占总体的百分比相等;④分别表示A、B、C的扇形的圆心角的度数之比为5:1:7.正确的有()A.1个B.2个C.3个D.4个6.为了了解三中九年级840名学生的体重情况,从中抽取100名学生的体重进行分析.在这项调查中,样本是指()A.840名学生B.被抽取的100名学生C.840名学生的体重D.被抽取的100名学生的体重7.一组数据的最小值为6,最大值为29,若取组距为5,则分成的组数应为()A.4B.5C.6D.78.下列调查中,最适合采用全面调查的是()A.对全国中学生睡眠事件的调查B.对我市各居民日平均用水量的调查C.对光明中学七(1)班学生身高调查D.对某批次灯泡使用寿命的调查9.以下问题,不适合用普查的是()A.一个班级学生的体重B.旅客上飞机前的安检C.学校招聘教师,对应聘人员面试D.某品牌袋装食品的质量10.以下问题,不适合采用全面调查方式的是()A.调查全班同学对“郑万高铁”的了解程度B.了解我市中学生的近视率C.疫情期间对国外入境人员的健康状况检查D.旅客上飞机前的安检11.为了解某市6万名八年级学生每天做家庭作业所用的时间,从该市八年级学生中抽取1000名学生进行调查,下列说法正确的是()A.6万名八年级学生是总体B.其中的每名八年级学生每天做家庭作业所用的时间是个体C.所调查的1000名学生是总体的一个样本D.样本容量是1000名学生12.为了解我市中学生中15岁女生的身高状况,随机抽查了10个学校的200名15岁女生的身高,则下列表述正确的是A.总体指我市全体15岁的女中学生B.个体是200名女生的身高C.个体是10个学校的女生D.抽查的200名女生的身高是总体的一个样本二、填空题13.有效的垃圾分类,可以减少污染、保护地球上的资源.为了更好地开展垃圾分类工作,某社区居委会对本社区居民掌握垃圾分类知识的情况进行调查.从中随机抽取部分居民进行垃圾分类知识测试,并把测试成绩分为A,B,C,D四个等次,绘制成如图所示的两幅不完整的统计图.下面有四个推断:①本次的调查方式是抽样调查,样本容量是40;②扇形统计图中,表示C等次的扇形的圆心角的度数为72°;③测试成绩为D等次的居民人数占参测总人数的10%;④测试成绩为A或B等次的居民人数共30人.所有合理推断的序号是______.14.为了了解我校七年级850名学生的数学成绩,从中抽取了90名学生数学成绩进行统计分析,这个问题中的样本容量是_____.15.进行数据的调查收集,一般可分为以下六个步骤,但它们的顺序弄乱了,正确的顺序是__________.(用字母按顺序写出即可)A.明确调查问题;B.记录结果;C.得出结论;D.确定调查对象;E.展开调查;F.选择调查方法.16.为了了解某中学八年级男生的身体发育情况,从该中学八年级男生中随机抽取40名男生的身高进行了测量,已知身高(单位:cm)在1.60~1.65这一小组的频数为6,则身高在1.60~1.65这一小组的频率是____.17.某研究所发布了《2019年中国城市综合实力排行榜》,其中部分城市的综合实力、GDP和教育科研与医疗的排名情况如图所示,综合实力排名全国第5名的城市,教育科研与医疗排名全国第_____名.18.为了估计湖里有多少条鱼,先捕了100条鱼,做好标记然后放回到湖里,过一段时间,待带有标记的鱼完全混合于鱼群后,再捕上200条鱼,发现其中带有标记的鱼为8条,湖里大约有鱼_____条.19.某校计划在“阳光体育”活动课程中开设乒乓球、羽毛球、篮球、足球四个体育活动项目.为了了解全校学生对这四个活动项目的选择情况,体育老师从全体学生中随机抽取了部分学生进行调查(规定每人必须并且只能选择其中一个项目),并把调查结果绘制成如图所示的统计图,根据这个统计图可以估计该学校1500名学生中选择篮球项目的学生约为______名.20.在数学活动课上,小派运用统计方法估计瓶子中的豆子的数量.他先取出100粒豆子,给这些豆子做上记号,然后放回瓶子中,充分摇匀之后再取出100粒豆子,发现其中16粒有刚才做的记号,利用得到的数据可以估计瓶子中豆子的数量约为______粒.三、解答题21.某校想了解学生对“太昊陵”的了解程度,在该校抽取了部分学生进行问卷,问卷有以下四个选项:A.十分了解;B.了解较多:C.了解较少:D.不了解(要求:每名被调查的学生必选且只能选择一项).现将调查的结果绘制成两幅不完整的统计图.请根据两幅统计图中的信息回答下列问题:(1)本次被抽取的学生共有名;(2)选“B.了解较多”的频数是,请补全条形统计图;(3)扇形图中的选项“C.了解较少”部分所占扇形的圆心角的大小为______°;22.某校初二年段进行了中考体育项目长跑的模拟测试,从中抽取部分学生的成绩等级进行统计,根据成绩等级绘制成如图所示的两个统计图(不完整).请结合统计图完成下列各题:(1)此次共抽取了多少名学生的成绩?(2)请把条形统计图补充完整;(3)求在扇形统计图中,成绩“合格”类所对应的圆心角度数;23.为了解全县6000名初中七年级学生对“阳光跑操”活动的喜欢程度,某校学生课外小组随机抽取部分学生进行调查,被调查的每个学生按A(非常喜欢)、B(比较喜欢)、C (一般)、D(不喜欢)四个等级对活动进行评价.(1)小华在本校调查了30名初中七年级学生对“阳光跑操”活动的喜欢程度.他的抽样是否合理?为什么?(2)该校学生课外小组从全县初中七年级学生中随机抽取了200名初中七年级学生,调查他们对“阳光跑操”活动的喜欢程度.如图所示,是该小组采集数据后绘制的两幅不完整的统计图.请你根据统计图提供的信息,解答下列问题:①图①中“D”所在扇形的圆心角为__________;②在图②中补画条形统计图中不完整的部分;③全县6000名初中七年级学生对“阳光跑操”活动“非常喜欢”和“比较喜欢”的学生共有多少人?24.为了了解小学生的体能情况,抽取了某校一个年级的部分学生进行一分钟跳绳次数的测试,将所得数据整理后,画出频率分布直方图如图所示.已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5(1)求第四小组的频率.(2)问参加这次测试的学生数是多少?(3)若次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标人数是多少人?25.小李家准备购买一台台式电脑,小李将收集到的该地区A,B,C三种品牌电脑销售情况的有关数据统计如下:根据上述三个统计图,请解答:(1)直接写出6至11月三种品牌电脑销售总量最多的电脑品牌,以及11月份A品牌电脑的销售量;(2)11月份,其它品牌的电脑销售总量是多少台?(3)你建议小李购买哪种品牌的电脑?请写出你的理由(写出一条理由即可).26.某校为了解七年级学生体育测试情况,以九年级(1)班学生的体育测试成绩为样本,,,,四个等级进行统计,并将统计结果绘制成如下的统计图,请你结合图中按A B C D所给信息解答下列问题:(说明:A级:90分~100分;B级:75分~89分;C级:60分~74分;D级:60分以下)(1)请把条形统计图补充完整;(2)样本中D级的学生人数占全班学生人数的百分比是;(3)扇形统计图中A级所在的扇形的圆心角度数是;(4)若该校九年级有500名学生,请你用此样本估计体育测试中A级和B级的学生人数约为人.【参考答案】***试卷处理标记,请不要删除一、选择题1.A解析:A【分析】由统计图可以算出每个项目两天的锻炼时间和,然后通过比较可以得到正确选项.【详解】解:由题意可得:跳绳的锻炼时间为:108604050%182038360⨯+⨯=+=(分钟),跑步的锻炼时间为:36050%726040%40241236360⨯-⨯+⨯=+=(分钟),跳远的锻炼时间为:36010836040%6018360--⨯⨯=(分钟),仰卧起坐的锻炼时间为:72408360⨯=(分钟),所以王涵这两天体育锻炼时间最长的项目是跳绳,故选A .【点睛】本题考查扇形统计图的应用,熟练掌握扇形统计图各部分圆心角度数、各部分所占百分比及各部分数量之间的关系式是解题关键.2.C解析:C【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象.从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.【详解】A、是抽样调查,故A不符合题意;B、每名学生的立定跳远成绩是个体,故B不符合题意;C、样本容量是200,故C符合题意;D、所有学生的立定跳远成绩是总体,故D不符合题意;故选:C.【点睛】此题考查了总体、个体、样本、样本容量,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.3.C解析:C【分析】根据题意和统计图中的数据可以求得总的人数,进而求得参加人数最多的小组的人数.【详解】解:由题意可得,参加体育兴趣小组的人数一共有:50÷25%=200(人),∴参加人数最多的小组的有:200×(1-25%-35%)=200×40%=80(人),故选C.【点睛】本题考查了扇形统计图,解题的关键是明确题意,找出所求问题需要的条件,利用数形结合的思想解答.4.C解析:C【分析】根据扇形统计图中各项目的圆心角即可得到每部分占总体的百分比,据此对各选项逐一判断即可得到答案.【详解】A、前年①的收入为40000×117360=13000,去年①的收入为60000×117360=19500,此选项错误;B、前年③的收入所占比例为360135117360--×100%=30%,去年③的收入所占比例为360126117360--×100%=32.5%,此选项错误; C 、去年②的收入为60000×126360=21000=2.1(万元),此选项正确; D 、前年年收入即为①②③三种农作物的收入,此选项错误,故选:C .【点睛】 本题主要考查扇形统计图,解题的关键是掌握扇形统计图是用整个圆表示总数用圆内各个扇形的大小表示各部分数量占总数的百分数,并且通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.5.D解析:D【分析】①根据A 的圆心角是90°,即可得到结论;②用360°×5%即可得到结论;③根据C 和D 所占总体的百分比得到结论;④A 、B 、C 的扇形的圆心角的度数即可得到结论.【详解】解:①90360×100%=25%;故符合题意; ②表示B 的扇形的圆心角是360°×5%=18°,故符合题意;③∵C 所占总体的百分比=1-5%-25%-35%=35%,故符合题意;④表示A 、B 、C 的扇形的圆心角的度数分别为90°,18°,126°,∴表示A 、B 、C 的扇形的圆心角的度数之比为5:1:7,故符合题意;故选:D .【点睛】本题考查了扇形统计图,正确的识别图形是解题的关键.6.D解析:D【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象.从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.【详解】解:样本是被抽取的100名学生的体重.故选:D .【点睛】考查了总体、个体、样本、样本容量,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.7.B解析:B【分析】用极差除以组距,如果商是整数,组数=这个整数加1,如果商不是整数,用进一法,确定组数;【详解】 ∵29623 4.655-==, ∴分成的组数是5组.故答案选B .【点睛】 本题主要考查了频数分布直方图,准确计算是解题的关键.8.C解析:C【分析】根据普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似判断.【详解】A. 对全国中学生睡眠事件的调查,量多,最好用抽样调查;B. 对我市各居民日平均用水量的调查,量多,最好用抽样调查;C. 对光明中学七(1)班学生身高调查,适合用全面调查;D. 对某批次灯泡使用寿命的调查,具有破坏性,适合用抽样调查;【点睛】本题考查的是抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查. 9.D解析:D【分析】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似.【详解】解:A 、一个班级学生的体重,适合采用普查的方式,故A 不符合题意;B 、旅客上飞机前的安检,适合采用普查的方式,故B 不符合题意;C 、学校招聘教师,对应聘人员面试,适合采用普查的方式,故C 不符合题意;D 、某品牌袋装食品的质量,适合抽样调查,故D 符合题意;故选:D .本题考查了抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.10.B解析:B【分析】在要求精确、难度相对不大,实验无破坏性的情况下应选择普查方式,当考查的对象很多或考查会给被调查对象带来损伤破坏,以及考查经费和时间都非常有限时,普查就受到限制,这时就应选择抽样调查.【详解】解:A.调查全班同学对“郑万高铁”的了解程度适合全面调查;B.了解我市中学生的近视率适合抽样调查,不适合采用全面调查;C.疫情期间对国外入境人员的健康状况检查适合全面调查;D.旅客上飞机前的安检适合合全面调查.故选:B.【点睛】本题考查了抽样调查和全面调查的区别,选择普查还是抽样调查要根据所要考查的对象的特征灵活选用,一般来说,对于具有破坏性的调查、无法进行普查、普查的意义或价值不大,应选择抽样调查,对于精确度要求高的调查,事关重大的调查往往选用普查.11.B解析:B【分析】总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目.我们在区分总体、个体、样本、样本容量,这四个概念时,首先找出考查的对象.从而找出总体、个体.再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.【详解】解:A、该校八年级全体学生每天做家庭作业所用的时间是总体,故A不符合题意;B、其中的每名八年级学生每天做家庭作业所用的时间是个体,故B符合题意;C、从中抽取的1000名学生每天做家庭作业所用的时间是总体的一个样本,故C不符合题意;D、样本容量是1000,故D不符合题意;故选:B.【点睛】此题考查了总体、个体、样本、样本容量,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.12.D【分析】本题考查的是确定总体.解此类题需要注意“考查对象实际应是表示事物某一特征的数据,而非考查的事物.”我们在区分总体、个体、样本、样本容量这四个概念时,首先找出考查的对象.本题中的研究对象是:我市中学生中15岁女生的身高.【详解】解:本题中的总体是某总体指我市全体15岁的女中学生的身高状况,不是指“我市全体15岁的女中学生”故A 错误;个体是这10个学校中每名15岁女生的身高,而非指“10个学校的女生“,故B 和C 错误. 故选D .【点睛】本题考查的是确定总体、个体和样本.解此类题需要注意“考查对象实际应是表示事物某一特征的数据,而非考查的事物.”A 、B 、C 对概念理解不准确.二、填空题13.①②④【分析】根据扇形统计图中A 等级对应的百分比为条形统计图中读取其人数为12人可得样本容量;利用C 等级的人数占样本容量的比例可得其圆心角度数;测试成绩为D 等次的居民人数占参测总人数的百分比为求解即 解析:①②④【分析】根据扇形统计图中A 等级对应的百分比为30%,条形统计图中读取其人数为12人,可得样本容量;利用C 等级的人数占样本容量的比例,可得其圆心角度数;测试成绩为D 等次的居民人数占参测总人数的百分比为81304540-%-%-⨯100%,求解即可;测试成绩为A 或B 等次的居民人数共()403045⨯%+%,求解即可.【详解】解:①样本容量为1230%40÷=,故①正确;②表示C 等次的扇形的圆心角的度数为83607240⨯︒=︒,故②正确; ③测试成绩为D 等次的居民人数占参测总人数的百分比为81304540-%-%-⨯100%=5%,故③错误; ④测试成绩为A 或B 等次的居民人数共()40304530⨯%+%=(人),故④正确; 故答案为:①②④.【点睛】本题考查扇形统计图与条形统计图信息关联,读取两个统计图中相关信息是解题的关键. 14.【分析】根据样本容量:一个样本包括的个体数量叫做样本容量即可得【详解】解:为了了解我校七年级850名学生的数学成绩从中抽取了90名学生数学成绩进行统计分析这个问题中的样本容量是90故答案为:90【点解析:【分析】根据样本容量:一个样本包括的个体数量叫做样本容量即可得.【详解】解:为了了解我校七年级850名学生的数学成绩,从中抽取了90名学生数学成绩进行统计分析,这个问题中的样本容量是90,故答案为:90.【点睛】本题主要考查总体、个体、样本、样本容量,解题要分清具体问题中的总体、个体与样本,关键是明确考查的对象.总体、个体与样本的考查对象是相同的,所不同的是范围的大小.样本容量是样本中包含的个体的数目,不能带单位.15.ADFEBC【解析】数据的收集调查分为以下6个骤明确调查问题根据调查问题确定调查对象然后根据这些选择调查方法然后展开调查记录结果进行分析最后得出结论;所以正确地顺序是ADFEBC解析:ADFEBC【解析】数据的收集调查分为以下6个骤,明确调查问题,根据调查问题确定调查对象,然后根据这些选择调查方法,然后展开调查,记录结果进行分析,最后得出结论;所以正确地顺序是ADFEBC.16.15【分析】根据频率=频数÷总数计算可得【详解】解:根据题意知该组的人数为:6÷40=015故答案为:015【点睛】本题主要考查频数与频率解题的关键是掌握频率=频数÷总数解析:15【分析】根据“频率=频数÷总数”计算可得.【详解】解:根据题意知该组的人数为:6÷40=0.15,故答案为:0.15.【点睛】本题主要考查频数与频率,解题的关键是掌握频率=频数÷总数.17.3【分析】由第一个图可得综合实力排名全国第5名的城市的GDP排名第九再由第二个图可求解【详解】解:由第一个图可得综合实力排名全国第5名的城市的GDP排名第九由第二个图可得GDP排名第九的城市的教育科解析:3【分析】由第一个图可得综合实力排名全国第5名的城市的GDP排名第九,再由第二个图可求解.【详解】解:由第一个图可得综合实力排名全国第5名的城市的GDP排名第九,由第二个图可得GDP排名第九的城市的教育科研与医疗的排名为第3名,故填3.18.2500【分析】根据通过样本去估计总体的统计思想捕上200条鱼发现其中带有标记的鱼为8条说明有标记的占到而有标记的共有100条从而可求得总数【详解】∵捕上200条鱼发现其中带有标记的鱼为8条∴说明有解析:2500【分析】根据通过样本去估计总体的统计思想.捕上200条鱼,发现其中带有标记的鱼为8条,说明有标记的占到8200,而有标记的共有100条,从而可求得总数.【详解】∵捕上200条鱼,发现其中带有标记的鱼为8条∴说明有标记的占到8 200∵有标记的共有100条∴湖里大约有鱼100÷8200=2500条故答案为:2500【点睛】本题考查了用样本估算整体的思想,用样本估计总体时,样本容量越大,样本对总体的估计也就越精确.相应地,搜集、整理、计算数据的工作量也就越大.随机抽样是经过数学证明了的可靠的方法,它对于估计总体特征是很有帮助.19.300【分析】先计算出调查学生人数中选择篮球项目学生所占的百分比再利用样本估计总体用总人数乘以选择篮球项目学生所占的百分比即可得出答案【详解】解:选择篮球项目学生所占的百分比为:1-16-28-36解析:300【分析】先计算出调查学生人数中选择篮球项目学生所占的百分比,再利用样本估计总体用总人数乘以选择篮球项目学生所占的百分比即可得出答案.【详解】解:选择篮球项目学生所占的百分比为:1-16%-28%-36%=20%,∴学校1500名学生中选择篮球项目的学生人数约为:1500×20%=300(名).故答案为:300.【点睛】本题考查了扇形统计图,读懂统计图,从统计图中得到必要的信息是解决问题的关键.20.625【分析】设瓶子中有豆子x粒根据去除100粒刚好有记号的16粒列出算式再进行计算即可【详解】设瓶子中有豆子x粒根据题意得:解得x=625粒即估计瓶子中的豆子数量约为625粒故答案为:625【点睛解析:625【分析】设瓶子中有豆子x粒,根据去除100粒刚好有记号的16粒列出算式,再进行计算即可.【详解】设瓶子中有豆子x粒,根据题意得:x100,10016解得x=625粒,即估计瓶子中的豆子数量约为625粒,故答案为:625.【点睛】本题考查用样本估计总体.根据样本和总体的关系,列方程进行计算即可.三、解答题21.(1)100;(2)40,见解析;(3)108【分析】(1)用“C.了解较少”的人数除以其所占的百分比即可求解;(2)用总人数减去A、C、D的人数即可求解;(3)用“B.了解较多”所占的百分比乘以360°即可求解.【详解】解:(1)由题意得:30÷30%=100名,∴本次被抽取的学生共有100名;(2)“B.了解较多”的学生人数为:100-20-30-10=40名,补全条形图如下:(3)30%×360°=108°,∴扇形图中的选项“C.了解较少”部分所占扇形的圆心角的大小为108°.【点睛】本题考查了条形统计图与扇形统计图,读懂统计图,从中找到有用的信息是解题的关键.22.(1)120名;(2)见详解;(3)144°【分析】(1)根据良好的=的人数除以所占的百分比,即可得出抽取的学生人数;(2)先算出合格率,不合格率,再求出优秀率,进而求出优秀人数,即可把统计图补充完整;。
《大数据分析师(初级)》考前模拟A3卷1.【单选题】搜狗搜索引擎的爬虫叫()。
A:百度蜘蛛B:360SpiderC:SogouspiderD:Bingbot正确答案:C2.【单选题】数据采集的()与技术执行的速度、团队内部成员协同以及数据分析需求和目标实现的效率有关。
A:全面性B:多维性C:无序性D:高效性正确答案:D答案解析:数据采集的高效性与执行速度、协调性有关。
3.【单选题】下列数据预处理任务,( )可以用来平滑数据,消除数据噪声。
A:数据清洗B:数据集成C:数据变换D:数据规约正确答案:A答案解析:消除噪声属于数据清洗阶段的任务4.【单选题】下列不是用于大数据查询分析计算的产品是( )。
A:HiveB:HBaseC:SparkSQLD:Dremel正确答案:B答案解析:Hbase是分布式存储技术。
5.【单选题】数据仓库—般都是存在层次架构的,比如可以分为ODS、DW、DM层,不同粒度的表,不同作用的表,一般会分布在不同的层级中,如下相关信息表存放在ODS层的有( )。
A:从源系统同步至数仓的粒度相同的一张登录日志表B:日期为天粒度的登录统计表C:从人的角度统计的登录情况表D:日期为月粒度的登录统计表正确答案:A答案解析:ODS层存储的明细数据。
6.【单选题】从数据量方面来看,互联网系统和机器系统产生的数据量要()企业系统的数据量。
A:远远大于B:远远小于C:等于D:无法确定正确答案:A7.【单选题】数据规约的目的是( )。
A:填补数据中的空缺值B:集成多个数据源的数据C:得到数据集的压缩表示D:规范化数据正确答案:C8.【单选题】下列陈述不正确的是()。
A:大数据将实现科学决策B:大数据使政府决策更加精准化C:大数据彻底将群体性事件化解在萌芽状态D:大数据将实现预测式决策正确答案:C答案解析:由于大数据是从量变到质变的过程,加之数据被广泛挖掘,决策依据的信息完整性越来越高,依据信息的理性决策要高于以盲目决策。
数据分析中级 模块二 数据采集与处理方案 多选题试卷总分:72答题时间:45分钟数据分析需求分析需要进行以下( )方面的分析。
[2分]-----正确答案(正确答案:ABD)1.A真实性B价值性C技术性D可行性2.店铺运营类数据采集表类型多样,最常见的就是店铺运营日报表,包含的数据指标通常有( )等。
[2分]-----正确答案(正确答案:ABCD)流量类AB订单类C转化类交易类D3.数据采集工具选择过程中需要注意( )。
[2分]-----正确答案(正确答案:ABC)使用范围AB数据类型C功能需求技术实力D4.一独立商城想要获取某细分行业市场发展趋势,其可以采用的数据渠道有( )[2分]-----正确答案(正确答案:ABCD)A某权威数据公司最新发布的含有该行业市场趋势的行业分析报告电视台新闻报道的该行业所属重点商品年度消费数据BC百度指数相关关键词搜索指数D生意参谋中该行业的市场交易指数5.采集某独立商城上行业竞争对手商品的销售价格,可使用以下哪些数据采集工具( )。
[2分]-----正确答案(正确答案:BD)A百度指数B八爪鱼店侦探CD火车采集器6.在电子商务数据分析需求分析时,需要对需求进行哪些分析?( )[2分]-----正确答案(正确答案:ABC)真实性AB可行性C价值性D快捷性7.对淘宝平台某类商品销量数据进行分析,以下数据采集方式可行的是( )[2分]-----正确答案(正确答案:AB)A使用爬虫类工具对平台上该类商品的销量数据持续进行采集使用生意参谋BC使用1688指数工具D使用百度指数工具8.想要采集某独立商城上行业竟品商品销售价格,以下数据采集工具中可以使用的有( )。
[2分]-----正确答案(正确答案:CD)A百度指数B店侦探C八爪鱼D后羿采集器9.数据检查是数据采集后至关重要的一步,以下属于数据检查内容的是( )。
[2分]-----正确答案(正确答案:ABD)A完整性检查B规范性检查保密性检查CD准确性检查10.下面哪些属于客户画像数据指标?( )[2分]-----正确答案(正确答案:ABCD)A客户的性别B年龄地址CD购物时间偏好采集淘宝网商品销售价格可以使用以下哪些工具?( )[2分]-----正确答案(正确答案:BC)11.A百度指数B后羿采集器逐鹿工具箱CD生意参谋数据分析中市场类指标主要用于描述行业情况和企业在行业中的发展情况,下列属于市场类指标的是( )。
统计调查练习试卷1(题后含答案及解析)题型有:1. 单选题单项选择题以下每小题各有四项备选答案,其中只有一项是正确的。
1.政府对企业事业单位的经常性统计调查中数据来源于企业事业单位( )。
A.对其经济活动、业务活动原始资料的日常积累B.进行的民意调查C.进行的市场调查D.进行的居民生活调查正确答案:A解析:向调查单位采集原始数据大致可以分为两种情况:①政府对企业事业单位的经常性统计调查中数据的采集,其采集的数据来源于企业事业单位对其经济活动、业务活动原始资料的日常积累;②其他调查(如:民意调查、居民生活调查、市场调查等)中数据的采集,其采集的数据主要来自被调查人员的回答。
知识模块:统计调查2.专业统计的组织形式一般采用( )。
A.谁购进,谁统计B.谁负责,谁统计C.谁销售,谁统计D.管什么业务就做什么统计正确答案:D解析:专业统计的组织形式,一般采用“管什么业务就做什么统计”的办法,也就是说,分别由企业的各职能部门负责进行其业务范围内的专业统计工作。
知识模块:统计调查3.根据我国多数工业企业的经验,在企业内建立( )是搞好企业统计工作的行之有效的组织形式。
A.综合统计科室B.三级统计网C.专业统计科室D.企业统计机构正确答案:B解析:三级统计网是指根据企业集中统一领导和分级管理的要求,在厂部、车间、班组三级建立所管范围内的综合统计工作,使之上下成线。
三级统计网是搞好企业统计工作的行之有效的组织形式。
知识模块:统计调查4.下列资料中属于原始记录的是( )。
A.统计台账B.个人生产记录C.汇总表D.企业内部报表正确答案:B解析:原始记录是指按照统计、会计和业务三种核算的要求,通过一定的表格形式,对企业生产经营活动的情况所作的最初的、直接的数字或文字记载,分为综合性原始记录和单项事件原始记录。
B项属于综合性原始记录。
知识模块:统计调查5.企业原材料入库单和考勤表属于( )。
A.统计台账B.企业内部报表C.单项事件原始记录D.综合性原始记录正确答案:C解析:单项事件原始记录是指对生产经营活动过程中的某类单项事件所作的记录,例如原材料入库单,领料单,产品质量检验单,成品入库单,废品通知单,在制品盘点表,交接班记录,考勤表等。