6811统计初步练习题及答案
- 格式:doc
- 大小:198.00 KB
- 文档页数:5
统计师之初级统计基础理论及相关知识练习题含答案讲解单选题(共20题)1. 从指数理论和方法上看,统计指数所研究的主要是()A.广义指数B.狭义指数C.广义指数和狭义指数D.拉氏指数和派氏指数【答案】 B2. 某工业企业2017年有关资料如下:2017年全年主营业务收入200万元;一、二季度从业人员平均人数均为50人,三季度平均人数80人,四季度平均人数60人;发放从业人员计时、计件工资120万元,奖金、津贴30万元;福利费支出3万元。
A.2.4B.2.5C.2.55D.3【答案】 B3. 在一项抽样调查中,数据录入时发生了错误,这种行为造成的误差属于()。
A.抽样误差B.抽样框误差C.无回答误差D.计量误差【答案】 D4. 一般情况下,复议机关应当在受理行政复议申请之日起()日内做出决定。
A.60B.30C.20D.15【答案】 A5. 统计调查项目的审批机关在审批统计调查项目时,应当审查该调查项目的()。
A.合法性、可行性、科学性B.必要性、合法性、科学性C.必要性、可行性、科学性D.必要性、可行性、合法性【答案】 C6. 标准正态分布的均值和标准差分别为()A.0,1B.1,0C.0,0D.1,1【答案】 A7. 《统计法》规定,国家统计局派出的调查机构组织实施的统计调查活动中发生的统计违法行为,由()负责查处。
A.国家统计局B.国家统计局派出的省级调查机构C.省级人民政府统计机构D.组织实施该项统计调查的调查机构【答案】 D8. 某种产品的单位成本y(元/件)对产量x(千件)的回归方程为y=100-0.2x,其中“-0.2”的意义是()。
A.产量每增加1千件,单位成本下降0.2元B.产量每增加1千件,单位成本平均下降0.2元C.产量每增加1千件,单位成本下降20%D.产量每增加1千件,单位成本下降0.2%【答案】 B9. 现行统计调查制度规定的单位从业人员不包括()。
A.在岗职工B.返聘的离退休人员C.外方人员D.勤工俭学的在校学生【答案】 D10. 根据《统计法》规定,下列行为不属于统计违法行为的是()。
《统计的初步认识》习题1.收集数据的方法有:______、______、______、______、______等.2.下面的统计活动,采用什么方法收集数据较合适?(1)迎春中学近几年的升学人数;(2)班级同学的身髙;(3)7:30〜8:00这段时间内,某交警指挥岗处来往的车辆数;(4)某种品牌钢笔的受欢迎程度.3.请设计一个调查问卷,对全班同学的体重情况进行调查.4.下面的统计活动,采用什么方法收集数据较合适?①了解一批炮弹的杀伤半径;②一家公司点心的甜度是否适中;③了解红星中学八年级学生每天在家作息时间;④每天下午课外活动操场上人数;⑤全校七年级、八年级、九年级在读生总数.5.下面统计活动中,适合采用查资-收集数据的有( )A.调查某城市居民家庭收人状况‘B.谁在2006年世界杯足球赛中进球最多C.检查某种药品的疗效D.本班同学最喜爱的电视节目6.下面的调查必须用全面调查方式来收集数据的有( )A.检查一批灯管使用寿命的长短B.了解春节晚会的收视率C.了解青少年学生对文艺明星、体育明星的态度D.“神舟”飞船发射前机器上的零部件是否正常(2)各学校的百分数只能通过调查得出,其他学校的情况与上表中的情况并无关系.7.为了调查广大农民对农村税费改革的反应,以及税费改革在农村的落实情况,国务院调查了某些农户,并以这300农户的反应情况来估计全国农户的反应情况,请帮忙设计过程.步骤:①首先编制调查问卷,发给选出的农户填写.8.在数学、外语、语文3门学科中,某校八年级开展了同学们最喜欢学习哪门学科的调查(八年级共有200人).(1)调查的问题是什么?(2)调查的对象是谁?(3)在被调查的200名学生中,有40人最喜欢学语文,60人最喜欢学数学,80人最喜欢学外语,其余的人选择其他,求最喜欢学数学这门学科的学生占学生总数的比例;(4)根据调查情况,把八年级学生最喜欢学习某学科的人数及其占学生总数的百分比填人下表:9.某同学在设计“你在快餐中是如何选择餐具的?”调查问卷时用到下面的提问,你觉得是否合适?应该怎样改进?(1)你一定常选择快餐这种用餐方式?( )A.是B.不是C.有时是(2)你在选择快餐时难道不自带碗筷等餐具吗?( )A.是B.不是C.有时是(3)我认为自带碗筷具有意义.( )A.同意B.不同C.不确定10.假如你想知道你们班级里的同学遇到不开心的事情的时候主要用哪几种方式排解心中的烦恼,还想知道男、女同学排解烦恼的主要方式是否一样,请你进行调查,然后对你调查出的结果加以总结,那么:(1)你的调查问题:__________________________________________;(2)你的调查对象:__________________________________________;(3)你感兴趣的是调查对象的:__________________________________________;(4)你的调查方法:__________________________________________;(5)你打算向你的调查对象提出哪些问题___________________、_______________________ (至少提出两个问题).。
一、选择题1.下列命题不正确的是()A.研究两个变量相关关系时,相关系数r为负数,说明两个变量线性负相关B.研究两个变量相关关系时,相关指数R2越大,说明回归方程拟合效果越好.C.命题“∀x∈R,cos x≤1”的否定命题为“∃x0∈R,cos x0>1”D.实数a,b,a>b成立的一个充分不必要条件是a3>b32.“人机大战,柯洁哭了,机器赢了”,2017年5月27日,岁的世界围棋第一人柯洁不敌人工智能系统AlphaGo,落泪离席.许多人认为这场比赛是人类的胜利,也有许多人持反对意见,有网友为此进行了调查.在参与调查的男性中,有人持反对意见,名女性中,有人持反对意见.再运用这些数据说明“性别”对判断“人机大战是人类的胜利”是否有关系时,应采用的统计方法是()A.分层抽样B.回归分析C.独立性检验D.频率分布直方图3.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢抖音的人数占男生人数的16,女生喜欢抖音的人数占女生人数23若有95%的把握认为是否喜欢抖音和性别有关,则男生至少有()人.(K2≥k0)0.0500.010k0 3.841 6.635A.12 B.6 C.10 D.184.A B两支篮球队进行比赛,约定先胜3局者获得比赛的胜利,比赛随即结束.除第五局A队获胜的概率是12外,其余每局比赛B队获胜的概率都是13.假设各局比赛结果相互独立.则A队以3:2获得比赛胜利的概率为()A.427B.281C.1681D.8275.已知12P(B|A)=,P(A)=35,则()P AB等于( )A.56B.910C.215D.1156.某光学仪器厂生产的透镜,第一次落地打破的概率为0.3;第一次落地没有打破,第二次落地打破的概率为0.4;前两次落地均没打破,第三次落地打破的概率为0.9.则透镜落地3次以内(含3次)被打破的概率是().A.0.378B.0.3C.0.58D.0.9587.从装有形状大小相同的3个黑球和2个白球的盒子中依次不放回地任意抽取3次,若第二次抽得黑球,则第三次抽得白球的概率等于( ) A .15B .14C .13D .128.随机变量a 服从正态分布()21,N σ,且()010.3000P a <<=.已知0,1a a >≠,则函数1x y a a =+-图象不经过第二象限的概率为( ) A .0.3750B .0.3000C .0.2500D .0.20009.以下四个命题,其中正确的个数有( )①由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程^0.212y x =+中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.2个单位;④对分类变量X 与Y ,它们的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的把握程度越大. A .1B .2C .3D .410.在5道题中有3道理科题和2道文科题,如果一次性抽取 2道题,已知有一道是理科题的条件下,则另一道也是理科题的概率为 A .13B .14C .12D .3511.对具有线性相关关系的变量x ,y 有一组观测数据(),i i x y (1,2,,8i =),其回归直线方程是1ˆ8ˆybx =+,且1238x x x x ++++=()123826y y y y ++++=,则实数ˆb的值是( ) A .116B .14C .13D .1212.袋中有6个黄色、4个白色的乒乓球,做不放回抽样,每次任取1个球,取2次,则关于事件“直到第二次才取到黄色球”与事件“第一次取到白球的情况下,第二次恰好取得黄球”的概率说法正确的是( )A .事件“直到第二次才取到黄色球”与事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率都等于23 B .事件“直到第二次才取到黄色球”与事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率都等于415C .事件“直到第二次才取到黄色球”的概率等于23,事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率等于415D .事件“直到第二次才取到黄色球”的概率等于415,事件“第一次取得白球的情况下,第二次恰好取得黄球”的概率等于23二、填空题13.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________.14.某人进行射击训练,射击一次命中靶心的概率是0.9,各次射击相互独立,他连续射击3次,则“第一次没有命中靶心后两次命中靶心” 的概率是______. 15.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.16.红队队员甲、乙、丙与蓝队队员A ,B ,C 进行围棋比赛,甲对A ,乙对B ,丙对C 各一盘.已知甲胜A 、乙胜B 、丙胜C 的概率分别为0.6,0.5,0.5,假设各盘比赛结果相互独立,则红队至少两名队员获胜的概率是____________.17.甲、乙两个小组各10名学生的英语口语测试成绩的茎叶图如图所示.现从这 20名学生中随机抽取一人,将“抽出的学生为甲小组学生”记为事件A ;“抽出的学生英语口语测试成绩不低于85分”记为事件B .则P (A|B )的值是_____.18.在一段线路中有4个自动控制的常用开关A 、B 、C 、D ,如图连接在一起,假定在2019年9月份开关A ,D 能够闭合的概率都是0.7,开关B ,C 能够闭合的概率都是0.8,则在9月份这段线路能正常工作的概率为________.19.现有A,B两队参加关于“十九大”知识问答竞赛,每队3人,每人回答一个问题,答对者为本队赢1分,答错得0分;A队中每人答对的概率均为23,B队中3人答对的概率分别为23,23,13,且各答题人答题正确与否之间互不影响,若事件M表示“A队得2分”,事件N表示“B队得1分”,则()P MN=______.20.投到某出版社的稿件,先由两位初审专家进行评审,若能通过两位初审专家的评审,则直接予以录用,若两位初审专家都未予通过,则不予录用,若恰能通过一位初审专家的评审,则再由第三位专家进行复审,若能通过复审专家的评审,则予以录用,否则不予录用.设稿件能通过各初审专家评审的概率均为12,复审的稿件能通过评审的概率为14,各专家独立评审,则投到该出版社的1篇稿件被录用的概率为__________.三、解答题21.某校将进行篮球定点投篮测试,规则为:每人至多投3次,先在M处投一次三分球,投进得3分,未投进不得分,以后均在N处投两分球,每投进一次得2分,未投进不得分.测试者累计得分高于3分即通过测试,并终止投篮.甲、乙两位同学为了通过测试,进行了五轮投篮训练,每人每轮在M处和N处各投10次,根据他们每轮两分球和三分球的命中次数情况分别得到如图表:若以每人五轮投篮训练命中频率的平均值作为其测试时每次投篮命中的概率. (1)求甲同学通过测试的概率;(2)在甲、乙两位同学均通过测试的条件下,求甲得分比乙得分高的概率.22.2020年10月1日既是中华人民共和国第71个国庆日,又是农历中秋节,双节同庆,很多人通过短视频APP 或微信、微博表达了对祖国的祝福.某调查机构为了解通过短视频APP 或微信、微博表达对祖国祝福的人们是否存在年龄差异,通过不同途径调查了数千个通过短视频APP 或微信、微博表达对祖国祝福的人,并从参与者中随机选出200人,经统计这200人中通过微信或微博表达对祖国祝福的有160人.将这160人按年龄分组:第1组[)15,25,第2组[)25,35,第3组[)35,45,第4组[)45,55,第5组[]55,65,得到的频率分布直方图如图所示:(1)求a 的值并估计这160人的平均年龄;(2)把年龄在第1,2,3组的居民称为青少年组,年龄在第4,5组的居民称为中老年组,选出的200人中通过短视频APP 表达对祖国祝福的中老年人有26人,问是否有99%的把握认为是否通过微信或微博表达对祖国的祝福与年龄有关? 附:()()()()()2n ad bc K a b c d a c b d -=++++23.某外卖平台为提高外卖配送效率,针对外卖配送业务提出了两种新的配送方案,为比较两种配送方案的效率,共选取50名外卖骑手,并将他们随机分成两组,每组25人,第一组骑手用甲配送方案,第二组骑手用乙配送方案.根据骑手在相同时间内完成配送订单的数量(单位:单)绘制了如图茎叶图:(1)根据茎叶图,求各组内25位骑手完成订单数的中位数,已知用甲配送方案的25位骑手完成订单数的平均数为52,结合中位数与平均数判断哪种配送方案的效率更高,并说明理由;(2)设所有50名骑手在相同时间内完成订单数的平均数m ,将完成订单数超过m 记为“优秀”,不超过m 记为“一般”,然后将骑手的对应人数填入如表列联表;(3)根据(2)中的列联表,判断能否有95%的把握认为两种配送方案的效率有差异.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.24.某花圃为提高某品种花苗质量,开展技术创新活动,在A ,B 实验地分别用甲、乙方法培育该品种花苗.为观测其生长情况,分别在实验地随机抽取各50株,对每株进行综合评分,将每株所得的综合评分制成如图所示的频率分布直方图,记综合评分为80分及以上的花苗为优质花苗.(1)用样本估计总体,以频率作为概率,若在A ,B 两块实验地随机抽取3株花苗,求所抽取的花苗中优质花苗数的分布列和数学期望;(2)填写下面的列联表,并判断是否有99%的把握认为优质花苗与培育方法有关.优质花苗 非优质花苗 合计甲培育法 20乙培育法 10合计附:下面的临界值表仅供参考.20()P K k ≥0.050 0.010 0.001 0k 3.8416.63510.828(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)25.近几年,电商行业的蓬勃发展带动了快递业的迅速增长,快递公司揽收价格一般是采用“首重+续重”的计价方式.首重是指最低的计费重量,续重是指超过首重部分的计费重量,不满一公斤按一公斤计费.某快递网点将快件的揽收价格定为首重(不超过一公斤)8元,续重2元/公斤(例如,若一个快件的重量是0.6公斤,按8元计费;若一个快件的重量是1.4公斤,按8元2+元110⨯=元计费).根据历史数据,得到该网点揽收快件重量的频率分布直方图如下图所示(1)根据样本估计总体的思想,将频率视作概率,求该网点揽收快件的平均价格; (2)为了获得更大的利润,该网点对“一天中收发一件快递的平均成本i y (单位:元)与当天揽收的快递件数i x (单位:百件)()1,2,3,4,5i =之间的关系”进行调查研究,得到相关数据如下表:每天揽收快递件数i x (百件) 2 3 4 5 8 每件快递的平均成本i y (元)5.64.84.44.34.1根据以上数据,技术人员分别根据甲、乙两种不同的回归模型,得到两个回归方程:方程甲:(1)ˆ0.2 5.6yx =-+,方程乙:(2)4ˆ 3.5y x=+. ①为了评价两种模型的拟合效果,根据上表数据和相应回归方程,将以下表格填写完整(结果保留一位小数),分别计算模型甲与模型乙的残差平方和1Q ,2Q ,并依此判断哪个模型的拟合效果更好(备注:ˆˆi i i e y y =-称为相应于点(),i i x y 的残差,残差平方和21ˆni i Q e==∑; 每天揽收快递件数i x /百件 2 3 4 5 8 每天快递的平均成本i y /元 5.6 4.8 4.4 4.34.1模型甲预报值(1)ˆi y5.25.04.8②预计该网点今年6月25日(端午节)一天可以揽收1000件快递,试根据①中确定的拟合效果较好的回归模型估计该网点当天的总利润(总利润=(平均价格-平均成本)×总件数).26.自然资源部门对某市饮用水厂中的地下水质量进行监测,随机抽查了100眼水井进行监测,得到溶解性总固体浓度(单位:mg L)和硫酸盐浓度(单位:mg L)的分布如下表:(1)估计事件“该市某一水井中溶解性总固体浓度不超过500,且硫酸盐浓度不超过150”的概率;(2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市水井中溶解性总固体浓度与硫酸盐浓度有关?附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.()2P K k ≥0.050 0.010 0.001 k 3.8416.63510.828【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】根据相关系数、相关指数的知识、全称命题的否定的知识,充分、必要条件的知识对四个选项逐一分析,由此得出命题不正确的选项. 【详解】相关系数r 为负数,说明两个变量线性负相关,A 选项正确. 相关指数2R 越大,回归方程拟合效果越好,B 选项正确.根据全称命题的否定是特称命题的知识可知C 选项正确.对于D 选项,由于33a b a b >⇔>,所以33a b >是a b >的充分必要条件,故D 选项错误.所以选D. 【点睛】本小题主要考查相关系数、相关指数的知识,考查全称命题的否定是特称命题,考查充要条件的判断,属于基础题.2.C解析:C 【解析】 【分析】根据“性别”以及“反对与支持”这两种要素,符合,从而可得出统计方法。
国家初级统计试题及答案1. 单项选择题A. 统计学是一门研究数据收集、分析、解释、展示和呈现的学科。
B. 统计学只关注数据的收集和分析。
C. 统计学不包括数据的解释和展示。
D. 统计学是一门纯粹的数学分支。
答案:A2. 多项选择题以下哪些是描述性统计分析中常用的方法?A. 计算平均数B. 绘制散点图C. 进行假设检验D. 计算中位数答案:A, B, D3. 判断题统计学中的抽样误差是指由于样本选择不当导致的误差。
A. 正确B. 错误答案:B4. 简答题请简述统计学中总体和样本的概念。
答案:总体是指研究对象的全部个体的集合,而样本是从总体中抽取的一部分个体的集合,用于代表总体进行研究。
5. 计算题已知某地区男性的平均身高为170cm,标准差为5cm。
如果随机抽取了100名男性,请计算这100名男性的平均身高的95%置信区间。
答案:由于样本量较大,可以近似使用正态分布。
置信区间的计算公式为:平均值± 1.96 * (标准差/ √样本量)。
因此,95%置信区间为:170 ± 1.96 * (5 / √100) = 170 ± 0.98cm,即169.02cm到170.98cm。
6. 案例分析题某公司对过去一年的销售额进行统计,发现销售额的分布如下表所示:销售额区间(万元) | 频数-|0-50 | 1050-100 | 20100-150 | 30150-200 | 40请分析销售额的分布情况。
答案:销售额的分布呈现正偏态,即销售额在0-200万元之间,随着销售额的增加,频数逐渐增多,且在150-200万元区间的频数最高,说明大多数销售额集中在较高的销售额区间。
7. 论述题论述统计学在数据分析中的应用及其重要性。
答案:统计学在数据分析中的应用包括但不限于数据清洗、数据探索、数据建模、预测分析等。
其重要性在于能够提供数据的量化描述,帮助决策者理解数据背后的模式和趋势,从而做出更准确的决策。
初级统计基础试题及答案一、单项选择题(每题2分,共10分)1. 统计学中,用来描述一组数据的集中趋势的度量是:A. 方差B. 标准差C. 平均数D. 中位数答案:C2. 在统计分析中,以下哪个不是离散型随机变量?A. 掷骰子得到的点数B. 一个班级学生的人数C. 一个工厂生产的零件数量D. 一个城市的人口总数答案:D3. 以下哪个选项不是描述数据分布的形状?A. 对称性B. 偏斜性C. 峰态D. 相关性答案:D4. 以下哪个统计量是衡量数据离散程度的?A. 众数B. 极差C. 均值D. 标准差答案:D5. 假设检验中,如果原假设为真,但错误地拒绝了它,这种情况称为:A. 第一类错误B. 第二类错误C. 正确决策D. 无法判断答案:A二、多项选择题(每题3分,共15分)1. 以下哪些是统计学中常用的数据收集方法?A. 观察法B. 实验法C. 调查法D. 文献法答案:ABCD2. 在统计学中,以下哪些因素会影响数据的分布?A. 样本大小B. 总体的异质性C. 数据的测量尺度D. 随机误差答案:ABCD3. 以下哪些是描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 方差答案:ABC4. 以下哪些是描述数据离散程度的统计量?A. 极差B. 标准差C. 变异系数D. 峰度答案:ABC5. 在统计分析中,以下哪些是常见的概率分布?A. 正态分布B. 二项分布C. 泊松分布D. t分布答案:ABCD三、判断题(每题1分,共10分)1. 样本均值是总体均值的无偏估计。
答案:√2. 标准差越大,数据的离散程度越大。
答案:√3. 相关系数的取值范围是[-1, 1]。
答案:√4. 回归分析可以用来预测未来的趋势。
答案:√5. 置信区间越宽,估计的精确度越高。
答案:×6. 假设检验中,p值越小,拒绝原假设的证据越充分。
答案:√7. 众数是数据集中出现次数最多的数值。
答案:√8. 方差和标准差都是描述数据离散程度的统计量,但方差更常用。
第一章定量资料的统计描述1第一部分一、单选题1、甲乙丙三位研究者评价人们对四种方便面的喜好程度。
甲让评定者先挑选出最喜欢的品牌,然后挑出剩余三种最喜欢的,最后挑出剩余两种比较喜欢的。
研究者乙让评定者把四种品牌分别给予1~5的等级评定(1表示最不,5表示最喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。
三位研究者所使用的数据类型是:BA.称名数据-顺序数据-计数数据B.顺序数据-等距数据-称名数据C.顺序数据-等距数据-顺序数据D.顺序数据-等比数据-计数数据2、调查200名不同年龄组的被试对手表的偏好程度如下:表1 200名不同年龄组的被试对手表的偏好程度该题自变量和因变量的数据类型是:DA.称名数据-顺序数据B.计数数据-等比数据C.顺序数据-等距数据D.顺序数据-称名数据3、157.5的实上限是:CA.157.75 B.157.65 C.157.55 D.158.54、随机现象的数量化表示称为:BA.自变量B.随机变量C.因变量 D.相关变量5、实验或研究对象的全体称为:AA.总体B.样本点C.个体D.元素6、下列数据中,哪个数据是顺序变量:CA.父亲月收入2400元B.迈克的语文成绩是80分C.约翰100米短跑得第2名D.玛丽某项技能测试得了5分。
二、概念题数据类型、变量、观测值、随机变量、总体、样本、个体、次数、比率、概率、参数、统计量、μ、ρ、r、σ、S、β、n。
第一章定量资料的统计描述2一、单选题1、一批数据中各个不同数据值出现的次数情况是:AA.次数分布B.概率密度C.累积概率密度D.概率2、以下各种图形中,表示连续数据频次分布的是:CA.条图B.圆图C.直方图D.散点图3、特别适用于描述具有百分比结构的分类数据的统计图:BA.散点图B.圆图C.条图D.线图5、以下各种统计图中,表示离散数据频次分布的:AA.圆图B.直方图C.散点图D.线形图6、相关变量的统计图是:AA.散点图B.圆图C.条图D.线图7、适用于描述某种事物在时间上的变化趋势,以及一事物随另外一事物的发展变化的趋势,还适用于比较不同人物群体在心理或教育现象上的变化特征以及相互联系的统计图是:D A.散点图B.圆图C.条图D.线图二、多选题1、频次分布可以为:ABCDA.简单次数分布B.分组次数分布C.相对次数分布D.累积次数分布2、以下各种图形中,表示连续数据频次分布的是:BDA.圆图B.直方图C.条图D.线图3、累加曲线的形状大约有:ABDA.正偏态B.负偏态C.F分布D.正态分布4、统计图按照形状划分为:ABCDA.直方图B.曲线图C.圆图D.散点图三、简答题1、简述条图、直方图、圆图、线图、散点图的用途。
统计初步例题和知识点总结在我们的日常生活和学习中,统计知识无处不在。
它帮助我们从大量的数据中提取有价值的信息,做出更明智的决策。
接下来,让我们通过一些例题来深入理解统计的初步知识。
一、知识点梳理1、数据的收集普查:对全体对象进行调查。
抽样调查:从总体中抽取部分个体进行调查。
抽样方法:简单随机抽样、分层抽样、系统抽样等。
2、数据的整理与表示频数分布表:将数据按照一定的范围进行分组,统计每组的频数。
频数分布直方图:用矩形的高度表示频数,直观展示数据的分布情况。
3、数据的集中趋势平均数:一组数据的总和除以数据的个数。
中位数:将一组数据从小到大(或从大到小)排列,位于中间位置的数。
众数:一组数据中出现次数最多的数据。
4、数据的离散程度极差:一组数据中的最大值减去最小值。
方差:每个样本值与全体样本值的平均数之差的平方值的平均数。
标准差:方差的算术平方根。
二、例题解析例题 1:为了解某小区居民的月用水量情况,随机抽取了 50 户居民进行调查,得到如下数据(单位:吨):10 12 15 18 20 22 25 28 30 32 11 13 16 19 21 23 26 29 31 33 12 14 17 20 22 24 27 30 32 34 10 13 15 18 21 23 25 28 31 33 35(1)请列出这组数据的频数分布表。
(2)绘制频数分布直方图。
解:(1)首先,确定组数和组距。
这里我们取组距为 5,组数=(最大值最小值)÷组距=(35 10)÷ 5 = 5。
|月用水量(吨)|频数||::|::|| 10 15 | 15 || 15 20 | 10 || 20 25 | 8 || 25 30 | 10 || 30 35 | 7 |(2)根据频数分布表绘制频数分布直方图,横坐标为月用水量,纵坐标为频数,每个矩形的宽度为组距,高度为频数。
例题 2:已知一组数据:2,3,5,7,8,9,10。
统计初步练习题及答案一. 选择题(每题4分)1.在用样本频率估计总体分布的过程中:下列说法正确的是( C ) A:总体容量越大:估计越精确 B:总体容量越小:估计越精确 C:样本容量越大:估计越精确 D:样本容量越小:估计越精确 2.刻画数据的离散程度的度量,下列说法正确的是( )(1) 应充分利用所得的数据,以便提供更确切的信息; (2) 可以用多个数值来刻画数据的离散程度;(3) 对于不同的数据集,其离散程度大时,该数值应越小;A :(1)和(3)B :(2)和(3)C : (1)D :都正确3.数据5:7:7:8:10:11的标准差是( C ) A :8 B :4 C :2 D :14.某公司现有职员160人:中级管理人员30人:高级管理人员10人:要从其中抽取 20个人进行身体健康检查:如果采用分层抽样的方法:则职员:中级管理人员和高 级管理人员各应该抽取多少人( )A :8:15:7B :16:2:2C :16:3:1D :12:3:55.比较甲乙两种机器的使用寿命:下列情况中:甲好于乙时最理想的是( B ) A :平均数甲略小于平均数乙:且方差甲大于方差乙: B :平均数甲略大于平均数乙:且方差甲小于方差乙: C :平均数甲略小于平均数乙:且方差甲小于方差乙: D :平均数甲略大于平均数乙:且方差甲大于方差乙:6.已知两组样本数据xx x x n,,,,321的平均数为h :yy y y m,,,,321的平均数为k, 则把两组数据合并成一组以后:这组样本的平均数为:( B ) A :2k h + B :n m mk nh ++ C :n m nh mk ++ D :nm kh ++ 7.某商场一天中售出李宁牌运动鞋12双:其中各种尺码的鞋的销售量如下表所示:则A :25:25B :24:24.25C :24.5:25D :25:24.58.从162人中抽取一个样本容量为16的样本:采用系统抽样的方法则必须从这162人中剔除( B )人A :1B :2C :3D :49.在下列各图中:每个图的两个变量具有相关关系的图是( D )(1) (2) (3) (4)A :(1)(2)B :(1)(3)C :(2)(4)D :(2)(3)10.一个容量为20的样本数据:分组后:组距与频数如下:2),70,60[;4),60,50[;5),50,40[;4),40,30[;3),30,20[;2),20,10[:则样本在)50,0[上的频率为( D ) A :201 B :41 C :21 D :10711.观察新生婴儿的体重:其频率分布直方图如下图所示:则新生婴儿体重在[2800:3200]的频率为( C )0.002 频率/组距婴儿体重2400 2700 3000 3300 3600 390012.在样本方差的计算公式中)30(301252222212⨯-+⋅⋅⋅++=n x x x s中:数字30和25分别表示样本的( A )A:容量:平均数 B:标准差:平均数 C:容量:方差 D:平均数:容量二. 填空题(每题3分)13.系统抽样与简单随机抽样的联系在于:将总体均分后对第一部分进行抽样采用的是_____简单随机抽样________;14.已知xx x x n321,,的平均数为a,则2,,2,233321+++xx x n的平均数是_3a+2____________;15.已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,12,那么这组数据在8.5至15内的频率为__________;16.实验测得四组(x,y )人值为(1:2):(2:3.5):(4:6.5):(6:9.5),测y 与x 之间的线性回归方程为____5.05.1ˆ+=x y_______________:当x 为5时:估算y 的值为___8________:二.填空题答案:16.____________________ ___________________ 三.解答题(共40分)17某班4个小组的人数分别为10:10:x :8:已知这组数据的中位数和平均数相等:求这组数据的中位数。
统计初步的练习题2022统计学是一门研究数据收集、整理、分析和解释的学科,被广泛应用于各个领域。
掌握统计学的基本概念和方法,对于正确理解和运用统计数据至关重要。
下面我将为大家呈现一些统计学初步的练习题,帮助大家巩固和加深对统计学的理解与应用。
问题一:某班级的学生数学成绩如下:65, 80, 75, 90, 95, 70, 85。
计算这组数据的均值、中位数和众数。
解答一:首先计算均值,即所有数据之和除以数据个数。
在这个例子中,所有数据之和为65+80+75+90+95+70+85=540,数据个数为7。
因此,均值为540/7≈77.14。
接下来计算中位数,即将数据从小到大排列,并找出中间位置的数。
由于这组数据有7个数,中间位置为第4个数,即90。
最后计算众数,即出现次数最多的数。
在这个例子中,每个数据只出现一次,因此不存在众数。
问题二:某餐厅的某天销售额如下:1500, 1200, 2000, 1800, 1600, 1900。
计算这组数据的范围和标准差。
解答二:范围是数据的最大值减去最小值。
在这个例子中,最大值为2000,最小值为1200,因此范围为2000-1200=800。
标准差是一种衡量数据分散程度的指标。
标准差可以通过以下公式计算:标准差=√(Σ(xi-μ)²/n),其中Σ代表求和,xi代表每个数据,μ代表均值,n代表数据个数。
首先计算均值,即(1500+1200+2000+1800+1600+1900)/6=1700。
然后带入公式计算标准差:√((1500-1700)²+(1200-1700)²+(2000-1700)²+(1800-1700)²+(1600-1700)²+(1900-1700)²)/6≈348.3。
问题三:某超市的一周蔬菜销售情况如下:120 kg, 150 kg, 180 kg, 130 kg, 140 kg。
18.1统计的初步认识同步精练一、单选题1、某班进行民主选举班干部,要求每位同学将自己心中认为最合适的一位侯选上,投入推荐箱.这个过程是收集数据中的()A.确定调查对象B.展开调查C.选择调查方法D.得出结论2、班长对全班同学说:“请同学们投票,选举一位同学”,你认为班长在收集数据过程中的失误是()A.没有明确调查问题B.没有规定调查方法C.没有确定对象D.没有展开调查3、下列调查中,适宜采用全面调查方式的是()A.了解我县中小学生课后的手机使用情况 B.了解一批手机电池的使用寿命C.了解我县初中生的视力情况D.了解全班学生参加社会实践活动的情况4、未成年人上网备受社会的关注,某市青少年研究所调查了某中学七年级学生在“十一”黄金周期间的上网次数,应选用的调查方法是( )A.访问B.观察C.查阅资料D.问卷调查5、下列调查中:①调查某批次手机屏的使用寿命;②调查某班学生的视力情况;③调查全国初中生每天体育锻炼所用时间;④调查某校百米跑最快的学生.最适合采用全面调查方式的是()A.①③B.②④C.①②D.③④6、下列调查中,适合采用普查方式的是()A.防疫期间对进入校园人员进行体温检测B.了解某市全体学生的体育达标情况C.了解一批圆珠笔的使用寿命D.了解我市人民乘坐高铁出行的意愿7、下列调查中,适合用全面调查方式的是()A.对全国中学生心理健康现状的调查B.对某航班旅客上飞机前的安检C.了解一批签字笔的使用寿命D.对冷饮市场上冰淇淋质量情况的调查8、在向学生调查“我最喜爱的科目”时,向学生询问以下几个问题,不合理的是( )①你喜欢上的课是什么课?②你比较喜欢的科目是什么?③你喜欢上学吗?A.①B.①②C.②D.③二、填空题1、第七次全国人口普查属于__________(填“全面”或“抽样”)调查.2、进行数据的调查收集,一般可分为以下六个步骤,但它们的顺序弄乱了,正确的顺序是__________.(用字母按顺序写出即可)A.明确调查问题;B.记录结果;C.得出结论;D.确定调查对象;E.展开调查;F.选择调查方法.3、已知全班有40位学生,他们有的步行、有的骑车、还有的乘车来上学,根据以下已知信息完成统计表:4、为了了解某地区七年级学生每天体育锻炼的时间,要进行抽样调查.以下是几个主要步骤:①随机选择该地区一部分七年级学生完成调查问卷;②设计调查问卷;③用样本估计总体;④整理数据;⑤分析数据.正确的顺序是__________.5、小聪,小玲,小红三人参加“普法知识竞赛”,其中前5题是选择题,每题10分,每题有A、B 两个选项,且只有一个选项是正确的,三人的答案和得分如下表,试问:这五道题的正确答案(按1~5题的顺序排列)是_______6、开学之初,七(一)班的张老师为了安排座位,需要了解全班同学的视力情况,你认为张老师应采取_____方法.三、解答题1、如图是甲、乙两人在一次射击比赛中击中靶的情况(击中靶中心的圆面为10环,靶中各数字表示该数字所在圆环被击中所得环数),每人射击了6次,请列表将甲、乙两人的射击成绩表示出来.2、为了丰富同学们的课余生活,某学校举行“亲近大自然”户外活动,现随机抽取了部分学生进行主题为“你最想去的景点是?”的问卷调查,要求学生只能从“A(植物园)、B(动物园)、C(湿地公园)、D(岳麓山)”四个景点中选择一个,根据调查结果,绘制了两幅不完整的统计图.(1)这次问卷调查的人数是_________人;(2)补全条形统计图;(3)计算“A”所在扇形的圆心角度数为_________;(4)若该学校共有3000名学生,则估计该校最想去岳麓山的学生约为_________人.3、光明学校七年级10个班共有680名学生,全是走读生.为了了解七年级学生双休日的活动情况,调查员准备采用问卷调查的方式收集数据,请你帮助他设计一张问卷调查表.4、小明为了了解本班全体同学在阅读方面的情况,采取全面调查的方法,从喜欢阅读“科普常识、小说、漫画、营养美食”等四类图书中调查了全班学生的阅读情况(要求每位学生只能选择一种自己喜欢阅读的图书类型)根据调查的结果绘制了下面两幅不完整的统计图.请你根据图中提供的信息解答下列问题:(1)该班喜欢阅读科普常识的同学有人,该班的学生人数有人;(2)补全条形统计图;(3)在扇形统计图中,表示“漫画”类所对圆心角是度,喜欢阅读“营养美食”类图书的人数占全班人数的百分比为.5、下面是某同学对全班同学在家完成数学作业的方式与用时进行的调查,他设计了一个调查问卷,这一问卷设计的是否合理?你会做怎样的调整?调查问卷:______年______月______日6、设计调查问卷时,下列提问是否合适?如果不合适的话应该怎样改进?(1)你上学时使用的交通工具是A.汽车B.摩托车C.步行D.其他(2)你对老师的教学满意吗?A.比较满意B.满意C.非常满意.。
统计初步练习题及答案
一. 选择题(每题4分)
1.在用样本频率估计总体分布的过程中,下列说法正确的是( C ) A:总体容量越大,估计越精确 B:总体容量越小,估计越精确 C:样本容量越大,估计越精确 D:样本容量越小,估计越精确 2.刻画数据的离散程度的度量,下列说法正确的是( )
(1) 应充分利用所得的数据,以便提供更确切的信息; (2) 可以用多个数值来刻画数据的离散程度;
(3) 对于不同的数据集,其离散程度大时,该数值应越小;
A :(1)和(3)
B :(2)和(3)
C : (1)
D :都正确
3.数据5,7,7,8,10,11的标准差是( C ) A :8 B :4 C :2 D :1
4.某公司现有职员160人,中级管理人员30人,高级管理人员10人,要从其中抽取 20个人进行身体健康检查,如果采用分层抽样的方法,则职员,中级管理人员和高 级管理人员各应该抽取多少人( )
A :8,15,7
B :16,2,2
C :16,3,1
D :12,3,5
5.比较甲乙两种机器的使用寿命,下列情况中,甲好于乙时最理想的是( B ) A :平均数甲略小于平均数乙,且方差甲大于方差乙; B :平均数甲略大于平均数乙,且方差甲小于方差乙; C :平均数甲略小于平均数乙,且方差甲小于方差乙; D :平均数甲略大于平均数乙,且方差甲大于方差乙;
6.已知两组样本数据
x
x x x n
,,,,3
2
1
的平均数为h ,
y
y y y m
,,,,3
2
1
的平均数为
k, 则把两组数据合并成一组以后,这组样本的平均数为:( B ) A :
2k h + B :n m mk nh ++ C :n m nh mk ++ D :n
m k
h ++ 7.某商场一天中售出李宁牌运动鞋12双,其中各种尺码的鞋的销售量如下表所示,则
A :25,25
B :24,24.25
C :24.5,25
D :25,24.5
8.从162人中抽取一个样本容量为16的样本,采用系统抽样的方法则必须从这162人
中剔除( B )人
A :1
B :2
C :3
D :4
9.在下列各图中,每个图的两个变量具有相关关系的图是( D )
(2) A :(1)(2) B :(1)(3) C :(2)(4) D :(2)(3)
10.一个容量为20的样本数据,分组后,组距与频数如下:
2),70,60[;4),60,50[;5),50,40[;4),40,30[;3),30,20[;2),20,10[;则样本在)50,0[上的频率为( D ) A :
201 B :41 C :21 D :10
7
11.观察新生婴儿的体重,其频率分布直方图如下图所示,则新生婴儿体重在[2800,3200]的频率为( C )
0.001 婴儿体重
2400 2700 3000 3300 3600 3900
A :0.5
B :0.1
C :0.3
D :0.45 12.在样本方差的计算公式中
)30(30
12522
22212
⨯-+⋅⋅⋅++=
n x x x s
中,数字30和25分别表示样本的( A )
A:容量,平均数 B:标准差,平均数 C:容量,方差 D:平均数,容量
二. 填空题(每题3分)
13.系统抽样与简单随机抽样的联系在于:将总体均分后对第一部分进行抽样采用的是
_____简单随机抽样________;
14.已知
x
x x x n
3
2
1
,,的平均数为a,则
2,,2,23332
1
+++x
x x n
的平均数是
_3a+2____________;
15.已知样本7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,12,9,13,12,那么这组数据在8.5至15
内的频率为____0.7______;
16.实验测得四组(x,y )人值为(1,2),(2,3.5),(4,6.5),(6,9.5),测y 与x 之间
的线性回归方程为____5.05.1ˆ+=x y
_______________;当x 为5时,估算y 的值为___8________;
二.填空题答案:
13._____________________ 14.____________________ 15.________________
16.____________________ ___________________ 三.解答题(共40分)
17某班4个小组的人数分别为10,10,x ,8,已知这组数据的中位数和平均数相等,求这
组数据的中位数。
不论这几个数字按照什么顺序排的,我们都有8=x
18
若由资料知,y 对x 呈线性相关关系,试求: (1) 方程y=bx+a 的回归系数a ,b;
(2) 限为10年时,维修费用是多少? 解:由x =
=++++5654324,5
.75.65.58.32.2++++=y =5.0
=⨯+⨯+⨯+⨯+⨯=∑=0.765.655.548.332.225
1
i
i i y
x 112.3
90362516945
1
2=++++=∑=i i
x
23.116
5900
.5453.112552
5
1
25
1=⨯-⨯⨯-=--=
∑∑==x x
y
x y
x b i i
i i
i
08.0423.15=⨯-=-=x b y a 故所求的回归直线方程为08.023.1ˆ+=x y 当10=x ,38.12ˆ=y
元
19.若
x x x x n ,,,,321 的方差是s 2
,a ,b 是常数。
求(1)
s x x x b b b n 2
121,,,的方差+++ ; (2)s x x x n a a a 2
221,,,的方差 ;
(3) s x x x b a b a b a n 2
321,,,的方差+++ ;
22
322
222
1)3()2(;)1(:aS S aS S S S Key ===
20.有一个容量为100的样本,数据的分组及各组的频数如下:
;10),5.30,5.27[;20),5.27,5.24[;22),5.24,5.21[;18),5.21,5.18[;16),5.18,5.15[;6),5.15,5.12[8),5.33,5.30[。
(3) 列出样本的频率分布表;
(4) 画出频率分布直方图和频率折线图 (5) 估计数据小于30.5频率 很不好意思,这个题的序号搞乱了!
前两小问的答案我就不给出了,直接给出第三小问的答案
92.05.30:的频率为数据小于Key
很不好意思,还有两道选择题的答案没有给出 还是请大家商榷后,再定吧!。