统计整理练习题 (答案)学习资料
- 格式:doc
- 大小:28.00 KB
- 文档页数:4
统计练习题及答案一、选择题1. 以下哪个是描述变量之间关系的统计学方法?A. 回归分析B. 抽样调查C. 假设检验D. 方差分析答案:A2. 一个总体的均值是100,标准差是15,求其95%置信区间的宽度。
A. 4.5B. 6C. 7.5D. 9答案:C3. 以下哪个不是统计学中的基本概念?A. 总体B. 样本C. 变量D. 函数答案:D4. 什么是统计学中的“中心极限定理”?A. 任何分布的样本均值的分布都趋近于正态分布B. 任何分布的样本的分布都趋近于正态分布C. 总体均值的分布都趋近于正态分布D. 总体的分布都趋近于正态分布答案:A5. 以下哪种情况下,使用配对样本t检验是合适的?A. 比较两个独立样本均值的差异B. 比较两个配对样本均值的差异C. 比较一个样本均值与总体均值的差异D. 比较两个不同总体方差的差异答案:B二、简答题1. 什么是标准正态分布?请简述其特点。
答案:标准正态分布是一个均值为0,标准差为1的正态分布。
其特点是对称分布,以均值为中心,数据分布呈钟形曲线,且99.7%的数据落在均值±3个标准差的范围内。
2. 描述什么是双尾检验和单尾检验,并简述它们的区别。
答案:双尾检验是指在假设检验中,备择假设涉及总体参数的两个方向的变化,即大于或小于零假设中的参数值。
单尾检验则只关注一个方向的变化。
区别在于双尾检验的拒绝域在零假设两侧,单尾检验的拒绝域在一侧。
三、计算题1. 假设有一个样本,其数据如下:2, 4, 6, 8, 10。
计算样本的均值、中位数和众数。
答案:均值 = (2+4+6+8+10)/5 = 6;中位数 = 6(因为数据已经排序,中间的数是6);众数 = 6(因为6出现的次数最多)。
2. 如果一个总体的平均年龄是40岁,标准差是10岁,一个随机选择的样本的平均年龄是45岁,样本量是100。
请问这个样本的平均年龄与总体平均年龄之间是否有显著差异?答案:使用单样本t检验,计算t值 = (45-40)/(10/√100)= 5/1= 5。
统计调查与整理习题及其答案一、填空题1.常用的统计调查方式主要有、、、、等。
2.典型调查有两类:一是;二是。
3.统计调查按调查对象包括的范围不同可分为、。
4.确定调查对象时,还必须确定两种单位,即和。
5.重点调查是在调查对象中选择一部分进行调查的一种调查。
6.询问调查具体包括、、、等。
7.访问调查的方式有、。
8.邮寄调查的问卷发放方式有、、三种。
9.根据观察者是否使用科学的观察仪器,观察可分为和。
10.调查表一般由、和三部分组成。
11.就一般的统计数据而言,其质量评价标准为、、、、、。
二、单项选择题1.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( )。
A普查B典型调查C抽样调查D重点调查2.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( )。
A统计报表B重点调查C全面调查D抽样调查3.人口普查规定统一的标准时间是为了( )。
A避免登记的重复与遗漏B确定调查的范围C确定调查的单位D登记的方便4.以下哪种场合宜采用标准式访问( )。
A居民入户调查B座谈会C当事人或知情者个别采访D观察法5.某地进行国有商业企业经营情况调查,则调查对象是( )。
A该地所有商业企业B该地所有国有商业企业C该地每一国有商业企业D该地每一商业企业6.以下哪种调查的报告单位与调查单位是一致的( )。
A 工业普查B工业设备调查C职工调查D未安装设备调查7.统计调查所搜集的可以是原始资料,也可以是次级资料,原始资料与次级资料的关系是( )。
A原始资料来源于基层单位,次级资料来源于上级单位B次级资料是由原始资料加工整理而成C原始资料与次级资料之间无必然联系D原始资料与次级资料没有区别8.调查项目通常以表的形式表示,称作调查表,一般可分为( )。
A单一表和复合表B单一表和一览表C简单表和复合表D简单表和一览表9.通过调查大庆、胜利、辽河等油田,了解我国石油生产的基本情况。
第一章序论一、单项选择题1、社会经济统计是分析研究社会经济现象的_____。
A、质量方面B、数量方面C、质与量两个方面D、各个方面2、以下哪点不是统计总体的特征____。
A、社会性B、同质性C、大量性D、差异性答案:1是B;2是A3、社会经济统计的基本特点是_____。
A、数量性B、社会性C、抽象性D、总体的同质性4、以下哪个是组成总体的前提条件_____。
A、大量性B、同质性C、综合性D、广泛性答案:3是A;4是B5、抽查5个学生的考试成绩,考试成绩分别是75分、80分、85分、89分、93分。
这5个数字是____。
A、标志值B、标志C、变量D、指标答案:A6、在工业生产设备普查中,总体单位是_。
A、每个工业企业B、每台设备C、每台工业生产设备D、每台已安装设备7、在工业生产设备普查中,总体是___。
A、所有工业企业B、每个工业企业C、所有工业生产设备D、工业企业的每台设备答案:6是C;7是C8、下列哪个是连续变量___。
A、工厂数B、人数C、净产值D、设备数9、研究某市职工家庭收支情况时,统计总体应确定为____。
A、该市全体职工B、该市全部职工家庭C、该市每个职工家庭D、该市全部居民家庭答案:8是C;9是B10、下列标志属于品质标志的是____。
A、教师的教龄B、学生的成绩C、商品价格D、民族11、一个统计总体____。
A、只能有一个标志B、只能有一个指标C、可以有多个指标D、可以有多个标志答案:10是D;11是C12、以全国的石油工业企业为总体,则大庆石油工业总产值是:____。
A、品质标志B、数量标志C、数最指标D、质量指标13、要了解某市职工情况,统计指标是:____。
A、该市每个职工B、该市每个职工的工资C、该市全部职工D、该市职工的工资总额答案:12是B;13是D二、多项选择题1、统计的特点包括____。
A、数量性B、社会性C、可变性D、不变性E、综合性2、下列哪些是数量标志____。
统计考试题及答案一、选择题(每题2分,共20分)1. 以下哪项不是描述数据集中趋势的度量?A. 平均数B. 中位数C. 众数D. 方差答案:D2. 标准差和方差之间的关系是什么?A. 标准差是方差的平方B. 方差是标准差的平方C. 标准差和方差是相等的D. 标准差是方差的倒数答案:B3. 以下哪个不是统计学中的抽样方法?A. 简单随机抽样B. 分层抽样C. 系统抽样D. 整体抽样答案:D4. 相关系数的取值范围是多少?A. -1 到 1B. 0 到 1C. -∞ 到+∞D. 1 到∞答案:A5. 以下哪个是统计学中的参数估计方法?A. 点估计B. 区间估计C. 假设检验D. 以上都是答案:B6. 一个总体的均值是100,标准差是15,从中抽取一个样本容量为100的样本,样本均值的期望值是多少?A. 85B. 90C. 100D. 150答案:C7. 以下哪个是统计学中的非参数检验方法?A. t检验B. 方差分析C. 卡方检验D. 相关性检验答案:C8. 在统计学中,一个变量的变异系数是其标准差与其均值的比率。
这种说法正确吗?A. 正确B. 错误答案:A9. 一个正态分布的总体,其均值和中位数相等。
这种说法正确吗?A. 正确B. 错误答案:A10. 以下哪个是统计学中的假设检验的步骤?A. 建立假设B. 计算检验统计量C. 确定显著性水平D. 以上都是答案:D二、填空题(每题2分,共20分)1. 统计学中,数据的_________是指数据的分布形态,如正态分布、偏态分布等。
答案:分布类型2. 在进行假设检验时,如果检验结果拒绝了原假设,我们说发现了_________。
答案:统计显著性3. 一个样本的方差是其标准差的_________。
答案:平方4. 统计学中,_________是指在一定条件下,随机变量的取值范围。
答案:概率分布5. 一个总体的均值和标准差已知,样本容量为n,样本均值的方差是总体方差的_________。
统计学题库+答案一、单选题(共50题,每题1分,共50分)1、已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。
A、简单算术平均数B、加权算术平均数C、加权调和平均数D、几何平均数正确答案:C2、当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A、函数关系B、回归关系C、随机关系D、相关关系正确答案:A3、如果分配数列把频数换成频率,那么方差()。
A、不变B、增大C、减小D、无法预期其变化正确答案:A4、按地理区域划片进行的区域抽样,其抽样方法属于()。
A、整群抽样B、等距抽样C、类型抽样D、简单随机抽样正确答案:A5、次数分配数列是()。
A、按数量标志分组形成的数列B、按品质标志分组形成的数列C、按统计指标分组所形成的数列D、按数量标志和品质标志分组所形成的数列正确答案:D6、按组距式分组()。
A、会使资料的真实性受到一定的影响B、会增强资料的真实性C、不会使资料的真实性受到损害D、所得资料是虚假的正确答案:A7、调查时间的含义是()。
A、调查资料报送的时间B、调查工作期限C、进行调查的时间D、调查资料所属的时间正确答案:D8、相关分析中,要求相关的两变量()。
A、都是随机的B、都不是随机变量C、其中因变量是随机变量D、其中自变量是随机变量正确答案:A9、某农贸市场土豆价格2月份比1月份上升5%,3月份比2月份下降2%,则3月份土豆价格与1月份相比()。
A、下降3%B、下降2%C、提高2.9%D、提高3%正确答案:C10、现象之间线性依存关系的程度越低,则相关系数()。
A、越接近于0B、越接近于1C、越接近于1D、在0.5和0.8之间正确答案:A11、计算平均指标最常用的方法和最基本的形式是()。
A、中位数B、众数C、调和平均数D、算术平均数正确答案:D12、全国的粮食产量与人口数之比是()。
A、总量指标B、平均指标C、相对指标D、数量指标正确答案:C13、相关系数的取值范围是()。
《统计学》习题三参考答案一、单项选择题:1、统计分组的关键问题是( A )。
A、确定分组标志和划分各组界限B、确定组距和组数C、确定组距和组中值D、确定全距和组距2、按某一标志分组的结果就表现为( C )。
A、组内差异性、组间同质性B、组内同质性、组间同质性C、组内同质性、组间差异性D、组内差异性、组间差异性3、用组中值代表各组内的一般水平的假定条件是( D )。
A、各组的次数均相等B、各组的组距均相等C、各组的变量值均相等D、各组次数在本组内呈均匀分布4、频数分布用来说明( A )。
A、总体单位在各组的分布情况B、各组变量值的构成情况C、各组标志值的分布情况D、各组变量值的变动程度5、在编制分配数列时,离散型变量的相邻组的组限( C )。
A、必须是间断的B、必须是重叠的C、既可以是间断的,也可是重叠的D、应当是相近的6、在编制分配数列时,连续型变量的相邻组的组限必须( C )。
A、交叉B、不等C、重叠D、间断二、多项选择题:1、统计分组的作用在于(ABE)。
A、划分现象的类型B、反映总体内部结构C、比较现象的一般水平D、分析现象的变化关系E、提示现象之间数量依存关系2、统计数据整理的内容一般有(ABCE)。
A、对原始资料进行预处理B、对统计资料进行分组C、对统计资料进行汇总D、对统计资料进行分析E、编制统计表,绘制统计图3、某单位100名职工按奖金额多少分组为“300以下、300~400、400~600、600~800、800以上”这五个组。
这一分组(BDE)。
A、是等距数列B、分组标志是连续型变量C、末组组中值为800D、相邻组的组限是重叠的E、某职工奖金600元,应统计在“600~800”这一组内4、在次数分配数列中,(B C E)。
A、各组的频数之和等于100%B、各组频率大于0C、频数越小,则该组的标志值所起的作用越小D、总次数一定,频数和频率成反比E、频率表明各组标志值对总体的相对作用程度三、简答题:1、统计资料整理的步骤是什么?统计整理的步骤主要有:第一,设计统计整理方案;第二,对数据进行审核、筛选、排序;第三,对数据进行处理(分组和汇总);第四,要用适当的形式(统计图、表)显示数据;第五,进行数据积累和保管。
统计整理一、单项选择题:1、下面属于按品质标志分组的有(C)A 企业按职工人数分组B 企业按工业总产值分组C 企业按经济类型分组D 企业按资金占用额分组2、下列分组表是属于(B)A 类型分组B 分析分组C结构分组D其他分组3、下面属于按数量标志分组的有(B)A 工人按政治面貌分组B 工人按年龄分组C 工人按性质分组D 工人按民族分组4、变量数列中各组频率(以百分数表示)的总和应该(D)A 大于100%B 小于100%C 不等于100%D 等于100%5、组距变量数列的全距等于(D)A 最大组的上限与最小组的上限之差B 最大组的下限与最小组的下限之差C 最大组的下限与最小组的上限之差D 最大组的上限与最小组的下限之差6、对于越高越好的现象按连续型变量分组,如第一组为75以下,第二组为75-85,第三组为85-95,第四组为95以上,则数据(A)A 85在第三组B 75在第一组C 95在第三组D 85在第二组7、按连续型变量分组,其末组为开口组,下限为2000。
已知相邻组的组中值为1750,则末组组中值为(B)A 2500B 2250C 2100D 22008、某企业工人日产量资料如下:表中的“50—60、60—70、70—80、80—90、90—100、100—110、110—120、120—130”是(C)A 标志B 变量C 变量值D 次数9、接上题,题中的“6、12、12、14、15、18、22、8”是(D)A 标志B 变量C 变量值D 次数10、接上题,表中“90—100”这一组的组中值是(B)A 85B 95C 75D 9011、接上题,表中“100—110”这一组的组距是(A)A 10B 20C 30D 4012、接上题,表中“120—130”这一组的频率是(A)A7.48% B 7.51% C 6.92% D 8.1%二、多项选择题:2、下列分组属于品质标志分组的有(BCD)A、按工资分组B、按职业分组C、按产业分组D、按地区分组E、按人均收入分组3、下列分组属于数量标志分组的有(ADE)A、按工龄分组B、按性别分组C、按工种分组D、按人数分组E、按平均工资分组4、次数分布数列根据分组标志的特征不同,可以分为(DE)A、单项变量数列B、组距变量数列C、异距变量数列D、变量数列E、品质数列。
统计试题及答案一、选择题1. 总体中各个个体具有完全相同的性质,这种总体是()。
A. 有限总体B. 无限总体C. 异质总体D. 同质总体答案:D2. 抽样调查中,样本容量为50的样本均值是32,样本标准差为10,那么样本均值分布的近似分布的均值和标准误差分别是()。
A. 32,10/√50B. 32,10/√5C. 32,20/√50D. 32,20/√5答案:A3. 某工厂生产的零件直径服从正态分布N(20, 4),从中随机抽取一件产品,其直径大于22mm的概率为()。
A. 0.5B. 0.6C. 0.3D. 0.158答案:D4. 下列哪个统计量是衡量数据集中趋势的指标?()。
A. 方差B. 标准差C. 均值D. 相关系数答案:C5. 一位研究者想要检验两个样本是否有显著差异,他应该使用以下哪种假设检验?()。
A. 相关性检验B. 回归分析C. t检验D. 方差分析答案:C二、填空题1. 在统计学中,用来表示数据分散程度的一个指标是________。
答案:方差2. 如果一个随机变量X服从参数为μ和σ的正态分布,记作X~N(μ, σ^2),那么X的数学期望E(X)等于________。
答案:μ3. 在抽样调查中,为了估计总体均值,研究者通常会计算样本的________。
答案:样本均值4. 为了检验两个相关样本的均值是否存在显著差异,可以使用________检验。
答案:配对样本t检验5. 在回归分析中,用来衡量自变量对因变量变化的解释程度的统计量是________。
答案:决定系数三、简答题1. 请简述什么是随机变量及其类型。
答案:随机变量是将随机试验的结果映射为实数的函数。
根据其取值是否是离散的,随机变量可以分为离散型随机变量和连续型随机变量。
离散型随机变量的取值是可数的,而连续型随机变量的取值是不可数的,可以在一个区间内取任意值。
2. 描述中心极限定理的含义及其在统计学中的应用。
答案:中心极限定理是概率论中的一个重要定理,它描述了在一定条件下,大量独立随机变量之和的分布趋近于正态分布,无论原始随机变量的分布如何。
统计学答案整理一,单项选择题1、质量指标( D ).A. 不能用数值来反映 B。
反映事物的本质联系C。
必需用数值来反映 D. 有时能够用数量指标来反映2、从认识的顺序上来讲,一项完整的统计工作可分为四个阶段,即( B )。
A。
统计调查、统计整理、统计设计和统计分析B。
统计设计、统计调查、统计整理和统计分析C.统计调查、统计设计、统计整理和统计分析D.统计设计、统计整理、统计调查和统计分析3、指出错误的命题( B )。
A.凡统计指标都可以表示为具体的量B.凡统计标志都可以表示为具体的量C.质量指标反映的是现象之间的数量关系D。
数量指标反映的是总体现象量的规模4、统计认识对象是( A ).A. 社会经济现象的数量方面B. 社会经济现象的质量方面C. 社会经济现象的数量方面和质量方面D. 社会经济现象的所有方面5、统计所研究的是( A )。
A。
社会经济的总体现象 B. 社会经济的个体现象C. 社会经济的总体现象或个体现象 D。
非社会经济的总体现象6、统计学的研究方法有很多,其特有的方法是( C )。
A. 统计推断法B. 统计分组法C. 大量观察法 D。
综合指标法7、社会经济统计中最常用、最重要的分布是( C ).A。
连续型变量分布 B。
离散型变量分布C。
正态分布 D。
其他类型分布8、按变量的性质和数据的多少划分,变量数列可以分为( B )。
A。
等距数列与异距数列 B。
单项数列和组距数列C. 开口组数列和闭口组数列 D。
等差数列和等比数列9、将总量指标按其反映总体总量的内容不同分为( A )。
A.总体标志总量指标和总体单位总量指标B.时期指标和时点指标C.实物总量指标和价值总量指标D.动态指标和静态指标10、若以我国工业企业为研究对象,则单位总量指标为( A )。
A。
工业企业总数 B。
工业职工总人数C。
工业设备台数 D。
工业增加值11、加权算术平均数的计算过程中,权数的加权作用表现在( B )。
A. 权数绝对数大小 B。
统计基础题库及答案详解一、选择题1. 以下哪项不是描述性统计的内容?A. 均值B. 方差C. 标准差D. 相关性分析答案:D2. 在统计学中,总体是指:A. 研究对象的全体B. 研究对象的一部分C. 研究对象的样本D. 研究对象的统计量答案:A3. 下列哪个是离散型随机变量的期望值?A. 0B. 1C. 2D. 3答案:B二、填空题1. 统计学中,________是用来估计总体参数的。
答案:样本2. 标准正态分布的均值为________,标准差为________。
答案:0,13. 相关系数的取值范围在________和________之间。
答案:-1,1三、简答题1. 简述什么是中心极限定理?答案:中心极限定理是统计学中的一个基本定理,它描述了在一定条件下,大量独立同分布的随机变量之和经过标准化后,其分布趋近于正态分布。
2. 什么是抽样误差?为什么会产生抽样误差?答案:抽样误差是指由于样本的随机性导致的样本统计量与总体参数之间的差异。
产生抽样误差的原因主要是因为样本是从总体中随机抽取的,它不能完美代表总体。
四、计算题1. 给定一组数据:2, 4, 6, 8, 10,计算其均值和标准差。
答案:均值:(2+4+6+8+10)/5 = 6标准差:sqrt(((2-6)^2 + (4-6)^2 + (6-6)^2 + (8-6)^2 + (10-6)^2) / 5) = sqrt(20/5) = 22. 如果一个正态分布的总体均值为μ=100,标准差为σ=15,求P(85 < X < 115)。
答案:使用标准正态分布表,查找z值分别为(85-100)/15和(115-100)/15,然后计算两个z值对应的正态分布累积概率,最后相减即可得到所求概率。
五、论述题1. 论述统计推断与描述性统计的区别和联系。
答案:描述性统计主要关注对数据集的总结和描述,如计算均值、中位数、方差等统计量。
而统计推断则是在已知样本信息的基础上,对总体参数进行估计或假设检验。
实验统计方法复习试题有部分答案第二章习题二、分析和计算题1.某农村地区1999年14岁女孩的身高资料如下,请编制频数表和观察频数分布情况,计算集中和离散趋势指标,并估计参考值范围。
表某农村地区1999年14岁女孩的身高资料(c m)142.3148.8142.7144.4144.7145.1143.3154.2152.3142.7156.6 137.9143.9141.2139.3145.8142.2137.9141.2150.6142.7151.3 142.4141.5141.9147.9125.9139.9148.9154.9145.7140.8139.6 148.8147.8146.7132.7149.7154.0158.2138.2149.8151.1140.1 140.5143.4152.9147.5147.7162.6141.6143.6144.0150.6138.9 150.8147.9136.9146.5130.6142.5149.0145.4139.5148.9144.5 141.8148.1145.4134.6130.5145.2146.2146.4142.4137.1141.4 144.0129.4142.8132.1141.8143.3143.8134.7147.1140.9137.4 142.5146.6135.5146.8156.3150.0147.3142.9141.4134.7138.5 146.6134.5135.1141.9142.1138.1134.9146.7138.5139.6139.2 148.8150.3140.7143.5140.2143.6138.7138.9143.5139.9134.4 133.1145.9139.2137.4142.3160.9137.7142.9126.8解(计算机直接法计算结果,可能与加权法计算结果有所出入)m e a n=143.217s=6.42969,m e d=142.75,m o d e=142.7m a x=162.6m i n=125.9r=36.7p75=147.1p25=139.3q=7.895%的参考值范围:(130.615,155.819)2.有60人的血清抗体效价,分别为:7人1:1,11人1:20,22人1:40,12人1:80,8人1:160,求平均抗体效价。
统计整理练习试卷2(题后含答案及解析)全部题型 2. 多选题多项选择题以下每小题至少有两项正确答案,每选对一项得0.5分,全部选对得满分。
多选或错选不得分。
1.统计分组体系可以是平行的也可以是复合的,下述分组中属于复合分组体系的是( )。
A.对工人分别按性别和工资级别分组B.对企业分别按产值和行业分组C.先按某一标志分组,然后按另一标志重叠分组D.对工人先作性别分组,在此基础上按工资级别分组E.对不同行业的企业分别按产值分组正确答案:C,D,E解析:平行分组体系是指对同一个总体进行多个简单分组,然后将这些平行排列起来;复合分组体系是指对同一个总体进行多个复合分组。
A、B项属于平行分组体系;C、D、E项属于复合分组体系。
知识模块:统计整理2.统计整理的步骤包括( )A.设计统计整理方案B.对原始资料进行审核C.数据处理D.编制统计表E.逐级整理与集中整理相结合正确答案:A,B,C,D解析:E项是统计整理的组织方式。
知识模块:统计整理3.统计分组的作用具体表现在( )。
A.划分总体现象的类型B.研究总体现象的结构和比例C.反映现象的发展趋势D.研究总体现象之间的依存关系E.研究各因素影响程度正确答案:A,B,D解析:统计分组的作用具体表现在:①划分总体现象的类型;②研究总体现象的结构和比例;③研究总体现象之间的依存关系。
知识模块:统计整理4.正确选择分组标志,需考虑( )。
A.根据研究目的选择分组标志B.选择反映事物本质区别的标志C.将调查资料与历史资料对比时,应注意可比性问题D.根据经济发展变化及历史条件选择分组标志E.可以选择任何分组标志正确答案:A,B,C,D 涉及知识点:统计整理5.下面按品质标志分组的是( )。
A.工厂按产值计划完成程度分组B.学生按健康状况分组C.企业按所有制分组D.职工按工龄分组E.职工按文化程度分组正确答案:B,C,E解析:按品质标志分组是指以反映事物属性差异的标志作为分组标志划分各组;按数量标志分组是指以反映事物数量差异的标志划分各组。
统计考纲要求1.理解总体、个体、样本等概念.2.会指出具体问题中的总体、个体、样本、样本容量.3.了解简单随机抽样、系统抽样、分层抽样等三种抽样方法.4.会根据特征选用合适的抽样方法抽取样本.5.理解用样本的频率分布估计总体.6.理解用样本均值、方差和标准差估计总体的均值、方差和标准差.知识点一:总体与样本1.定义:在统计中,所研究对象的全体叫做总体,组成总体的每个对象叫做个体.2.定义:被抽取出来的个体的集合叫做总体的样本,样本所含个体的数目叫做样本容量. 知识点二:抽样1.简单随机抽样定义:我们采用抽签的方法,将总体按照某种顺序编号,写在小纸片上.将小纸片揉成小团,放到一个不透明的袋子中,充分搅拌后,再从中逐个抽出10个小纸团.最后根据编号找到个体.这种抽样叫做简单随机抽样.注意:简单随机抽样必须保证总体的每个个体被抽到的机会是相同的.也就是说,简单随机抽样是等概率抽样.2.系统抽样定义:当总体所含的个体较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分中抽取一定数目的个体.这种抽样叫做系统抽样(或机械抽样).主要步骤:从容量为N的总体中,用系统抽样抽取容量为n的样本,按照下面的步骤进行:(1)编号:将总体的N个个体编号;(2)确定间隔:可以考虑用Nn(取整数)作间隔分段,将总体分成n段;(3)抽样:按照一定的规则抽取样本.如抽每段的第k个顺序号的个体(k为小于Nn的整数),得到容量为n的样本.3.分层抽样当总体是由有明显差异的几个部分组成时,可将总体按差异情况分成互不重叠的几个部分——层,然后按各层个体总数所占的比例来进行抽样,这种抽样叫做分层抽样. 对分层抽样的每一层进行抽样时,可采用简单随机抽样或系统抽样. 知识点三:用样本估计总体 1.用样本的频率分布估计总体频率频率的定义:各组内数据的个数,叫做该组的频数.每组的频数与全体数据的个数之比叫做该组的频率.频率分布直方图:根据频数分布表中各组的频率,得到频率分布表,由频率分布表画出频率分布直方图.用样本的频率分布估计总体的步骤为: (1)选择恰当的抽样方法得到样本数据;(2)计算数据最大值和最小值、确定组距和组数,确定分点并列出频率分布表; (3)绘制频率分布直方图;(4) 观察频率分布表与频率分布直方图,根据样本的频率分布,估计总体中某事件发生的概率.2.用样本均值、标准差估计总体 (1)平均数或均值定义:如果有n 个数1x ,2x ,…,n x ,那么121()n x x x x n=+++叫做这n 个数的平均数或均值,x 读作“x 拔”. 均值反映出这组数据的平均水平. (2)样本方差定义:如果样本由n 个数1x ,2x ,…,n x 组成,那么样本的方差为 2222121()()()1n s x x x x x x n ⎡⎤=-+-++-⎣⎦-. (3)样本标准差由于样本方差的单位是数据的单位的平方,使用起来不方便.因此,人们常使用它的算术平方根来表示个体与样本均值之间偏离程度,叫做样本标准差.即(+-n s x .题型一 总体、个体、样本、样本容量例1 某地区为了掌握7岁儿童身高状况,随机抽取200名儿童测试身高,请指出其中的总体、个体、样本与样本容量.解答:该地区所有7岁儿童的身高是总体,每一个7岁儿童的身高是个体,被抽取的200名7岁儿童的身高是样本,样本容量是200.题型二抽样例2某中职学校为了解2009级新生的身体发育情况,从1000名新生中,利用系统抽样,抽取一个容量为50的样本.请你来完成这个抽样.解答:将这1000名学生编号(也可以利用新生录取号),由于100020 50,所以取每段间隔为20,将编号分成50段,规定各段抽取第16个顺序号的学生,得到容量为50的样本.其学生号码依次为16,36,56,76, (996)题型三用样本均值、标准差估计总体例3 科研人员在研究地里的麦苗长势时,随机抽取20株,测得各株高为(单位:mm): 61675867656459625866645960635860 62606363求样本均值、样本方差、样本标准差.分析:应用公式解答:样本均值61.95,样本方差约为8.68,样本标准差约为2.95.一、选择题1.要能清楚的表示各部分在总体中所占的百分比,应选择().A 扇形统计图B 折线统计图C条形统计图 D 表框统计2.某社区有400个家庭,其中高等收入家庭120户,中等收入家庭180户,低收入家庭100户,为了调查社会购买力的某项指标,要从中抽取一个容量为100的样本记作①;某校高一年级有12名女排球运动员,要从中选出3人调查学习情况记作②.那么,完成上述2项调查应采用的抽样方法是( ).A. ①用随机抽样法,②用系统抽样法B.①用分层抽样法,②用随机抽样法C.①用系统抽样法,②用分层抽样法D.①用分层抽样法,②用系统抽样法3. 以下物征数中能反映一组数据波动大小的是().A极差B平均数C方差D以上都不是4.某同学参加跳远比赛前,若教练想对他10次的训练成绩进行了分析以判断他的成绩是否稳定,则教练需要知道该同学这10次成绩的( ).A平均数 B.方差 C.频数 D.频率5.数据5,7,7,8,10,11的平均值是( ).A.2B. 4C.8D. 16.一组数据:5,7,7,a,10,11,它们的平均值是8,则a的值是( ).A2 B.4 C.8 D.17.扇形统计图中,占圆面积40%的扇形的圆心角的度数是(B )A 162°B 144°C 150°D 120°8.用随机数表法从100名学生(男生25人)中抽选20人进行问卷调查,某男生被抽到的概率是( C ).A.1100B.125C.15D.149. 为了了解1200名学生对课改试验的意见,计划从中抽取一个容量为30的样本,若采用系统抽样的方法,则分段间隔为( ).A.40B.30C.20D.1210. 数据-1,-2,0,1,2的标准差是()A 1B 2 C、0 D二、判断题1.数据1,2,3,2 的众数是2, ( )2.为了了解某校学生早餐就餐情况,四位同学做了不同的调查:小华向初一年级的三个班级的全体同学做了调查;小明向初二年级的三个班级的全体同学做了调查;小华向初三年级的全体同学做了调查;小珍分别向初一(1)班、初二(1)、初三(1)班的全体同学做了调查,则小华同学的抽样调查较科学.()3.要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是抽取的60只灯泡.()4.为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中总体是被抽查的200名考生.()5.某校一个年级有12个班,每个班有50名学生,每班的学号都是1~50,为了了解学生的课外兴趣爱好,要求对每班学号为20的学生进行问卷调查,那么这里采用的抽样方法是抽签法.()6.某职业学校高一年级有机电、财经、医护这三个专业,其学生人数之比是5∶3∶2,若用分层抽样的方法抽取容量为100的样本,则应从医护专业中抽取20个个体.()7. 为了知道一锅汤的味道,妈妈从锅里舀了一勺汤尝尝,这种调查方式是抽样调查.()8.若数据1,2,5,3,4的平均数为3.()9.青年歌手大奖赛共有10名选手参赛,并请了7名评委,下表是7名评委给参加最后决赛的两位选手甲评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为84.()10. 有四位同学从编号为1-50的总体中抽取8个个体组成一个样本,他们选取的样本中个体编别为:①05,10,15,20,25,30,35,40;②43,44,45,46,47,48,49,50;③1,3,5,7,9,11,13,15,17;④43,25,2,17,35,9,24,19.认为样本④较具有随机性.()三、填空题1.从某工厂生产的某一批零件中,随机抽取10件,测得长度为(单位:cm):79、81、80、78、79、81、79、82、79、78,则总体是_______,个体是_______,样本是_______,样本容量是_______.2.0,-1,1,-2,1 的中位数是为________.3.数据2,4,6,8 的平均数是是________.4.小新家今年6月份头6天用米量如下表:请你运用统计知识,估计小新家6月份(30天)用米量为________千克。
统计整理练习题统计整理练习题一、单项选择题1.统计分组是统计资料整理中常用的统计方法,它能够区分()。
A.总体中性质相同的单位 B.总体标志 C.一总体与它总体D.总体中性质相异的单位【答案】D2.统计分组的关键在于确定()。
A.组中值 B.组距C.组数 D.分组标志和分组界限【答案】D3..按照反映事物属性差异的品质标志进行分组称为按品质标志分组。
下述分组中属于这一类的是()。
A.人口按年龄分组 B.在校学生按性别分组C.职工按工资水平分组 D.企业按职工人数规模分组【答B4.按数量标志分组的关键是确定()。
A.变量值的大小B.组数 C.组中值 D.组距【答案】D5.全国总人口按年龄分为5组,这种分组方法属于()。
A.简单分组 B.复合分组C.按品质标志分组D.以二都不对【答A6.对某校学生先按年级分组,在此基础上再按年龄分组,这种分组方法是()。
A.简单分组 B.复合分组 C.再分组 D.平行分组【答案】B7.对某校学生分别按年级和年龄分组,由此形成的分组体系是()。
A.平行分组体系 B.复合分组体系 C~二者兼而有之 D.二者都不是【答案】A8.组距数列中的上限一般是指()。
A.本组变量的最大值B.本组变量的最小值C.总体内变量的最大值 D.总体内变量的最小值【答案】A9.组距和组数是组距数列中的一对基本要素,当变量的全距一定时,组距和组数()。
A.没有关系 B.关系不确定 C.有正向关系 D.有反向关系【答案】D10.等距数列和异距数列是组距数列的两种形式,其中等距数列是指()。
A.各组次数相等的数列B.各组次数不等的数列 C.各组组距相等的数列D.各组组距不等的数列【答案】C11.用离散变量作分组标志时,相邻组的上下限应()A.重合 B.间C.不相等 D.相等【答案】B12.某企业职工月工资收入最高者为4260元,最低者为2700元,据此分为六个组,形成闭口式等距数列,则组距应为()。
统计专题训练经典练习题(含答案)统计专题训练经典练题(含答案)以下是一些统计学的经典练题,附带答案供参考。
1. 对于一个班级的学生成绩,已知平均分为75分,标准差为5分。
如果班级总人数为100人,问有多少学生的成绩在65分以上?答案:根据正态分布的性质,我们可以应用标准正态分布表,计算得到 z 值为 (65-75)/5 = -2,查表得到对应的累积概率为 0.0228,因此在65分以上的学生人数约为0.0228 * 100 ≈ 2.28,即约有 2 名学生的成绩在65分以上。
2. 一家工厂生产的产品长度服从正态分布,平均长度为10cm,标准差为0.5cm。
若从该工厂中随机抽取50个产品,问有多少产品的长度在9.5cm至10cm之间?答案:由于从该工厂中抽取的产品长度服从正态分布,我们可以计算出抽样分布的均值和标准差为 10cm 和0.5cm/sqrt(50) ≈0.0707cm。
然后,我们可以将区间 [9.5cm, 10cm] 转化为 z 值计算区间内的概率。
计算得到 z 值为 (10-9.5)/0.0707 ≈ 7.07,查表得到对应的累积概率为 0.9999。
因此,在9.5cm至10cm之间的产品数量约为0.9999 * 50 ≈ 49.995,即约有 50 个产品的长度在9.5cm至10cm之间。
3. 某次调查发现,两种不同品牌的汽车在某一地区的市场占有率的估计值分别为 0.60 和 0.40,并且总样本量为 5000。
现在需要对这一地区汽车市场占有率的差异进行检验。
问如何构建零假设和备择假设?并说明该检验的类型。
答案:对于差异检验,我们可以构建如下的零假设和备择假设:零假设(H0):两个品牌的汽车市场占有率没有差异,即 p1= p2。
备择假设(H1):两个品牌的汽车市场占有率存在差异,即p1 ≠ p2。
该检验属于双侧检验,因为备择假设是双向的,即可能两个品牌的市场占有率存在大于和小于的差异。
统计调查与整理习题及其答案一、填空题1.常用的统计调查方式主要有、、、、等。
2.典型调查有两类:一是;二是。
3.统计调查按调查对象包括的范围不同可分为、。
4.确定调查对象时,还必须确定两种单位,即和。
5.重点调查是在调查对象中选择一部分进行调查的一种调查。
6.询问调查具体包括、、、等。
7.访问调查的方式有、。
8.邮寄调查的问卷发放方式有、、三种。
9.根据观察者是否使用科学的观察仪器,观察可分为和。
10.调查表一般由、和三部分组成。
11.就一般的统计数据而言,其质量评价标准为、、、、、。
二、单项选择题1.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是( )。
A普查B典型调查C抽样调查D重点调查2.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( )。
A统计报表B重点调查C全面调查D抽样调查3.人口普查规定统一的标准时间是为了( )。
A避免登记的重复与遗漏B确定调查的范围C确定调查的单位D登记的方便4.以下哪种场合宜采用标准式访问( )。
A居民入户调查B座谈会C当事人或知情者个别采访D观察法5.某地进行国有商业企业经营情况调查,则调查对象是( )。
A该地所有商业企业B该地所有国有商业企业C该地每一国有商业企业D该地每一商业企业6.以下哪种调查的报告单位与调查单位是一致的( )。
A 工业普查B工业设备调查C职工调查D未安装设备调查7.统计调查所搜集的可以是原始资料,也可以是次级资料,原始资料与次级资料的关系是( )。
A原始资料来源于基层单位,次级资料来源于上级单位B次级资料是由原始资料加工整理而成C原始资料与次级资料之间无必然联系D原始资料与次级资料没有区别8.调查项目通常以表的形式表示,称作调查表,一般可分为( )。
A单一表和复合表B单一表和一览表C简单表和复合表D简单表和一览表9.通过调查大庆、胜利、辽河等油田,了解我国石油生产的基本情况。
统计整理练习题(答
案)
统计整理
一、单项选择题:
1、下面属于按品质标志分组的有(C)
A 企业按职工人数分组
B 企业按工业总产值分组
C 企业按经济类型分组
D 企业按资金占用额分组
2、下列分组表是属于(B)
A 类型分组
B 分析分组 C结构分组 D其他分组
3、下面属于按数量标志分组的有(B)
A 工人按政治面貌分组
B 工人按年龄分组
C 工人按性质分组
D 工人按民族分组
4、变量数列中各组频率(以百分数表示)的总和应该(D)
A 大于100%
B 小于100%
C 不等于100%
D 等于100%
5、组距变量数列的全距等于(D)
A 最大组的上限与最小组的上限之差
B 最大组的下限与最小组的下限之差
C 最大组的下限与最小组的上限之差
D 最大组的上限与最小组的下限之差
6、对于越高越好的现象按连续型变量分组,如第一组为75以下,第二组为75-85,第三组为85-95,第四组为95以上,则数据(A)
A 85在第三组
B 75在第一组
C 95在第三组
D 85在第二组
7、按连续型变量分组,其末组为开口组,下限为2000。
已知相邻组的组中值为1750,则末组组中值为(B)
A 2500
B 2250
C 2100
D 2200
8、某企业工人日产量资料如下:
表中的“50—60、60—70、70—80、80—90、90—100、100—110、110—120、120—130”是(C)
A 标志
B 变量
C 变量值
D 次数
9、接上题,题中的“6、12、12、14、15、18、22、8”是(D)
A 标志
B 变量
C 变量值
D 次数
10、接上题,表中“90—100”这一组的组中值是(B)
A 85
B 95
C 75
D 90
11、接上题,表中“100—110”这一组的组距是(A)
A 10
B 20
C 30
D 40
12、接上题,表中“120—130”这一组的频率是(A)
A7.48% B 7.51% C 6.92% D 8.1%
二、多项选择题:
2、下列分组属于品质标志分组的有(BCD)
A、按工资分组
B、按职业分组
C、按产业分组
D、按地区分组
E、按人均收入分组
3、下列分组属于数量标志分组的有(ADE)
A、按工龄分组
B、按性别分组
C、按工种分组
D、按人数分组
E、按平均工资分组
4、次数分布数列根据分组标志的特征不同,可以分为(DE)
A、单项变量数列
B、组距变量数列
C、异距变量数列
D、变量数列
E、品质数列。