第3章用统计量描述数据习题答案
- 格式:doc
- 大小:98.00 KB
- 文档页数:5
《统计学》练习与实践答案第一章总论一、单项选择题1-5 ADDBA6-10 BCBDA11-15 BBDAC二、多项选择题1.AB2.BCE3.BD4.BCE5.CD三、判断分析题1.正确。
总体是由许多总体单位构成的有机整体。
如果每一个总体单位的情况都一样,没有差异,只要了解一个总体单位就知道总体的情况,就不需总体了。
2. 正确。
统计学是一门研究如何合理测定、收集、整理、显示和分析反映客观现象数据的方法论科学。
由于在社会科学、自然科学和工程技术的所有研究和实际工作中,几乎都有数量表现,都要要运用数据来分析和解决问题,因此,统计方法的应用也扩展到几乎所有的研究领域。
3.错误。
描述统计和推断统计都是统计方法论的组成部分。
描述统计是推断统计的基础,没有描述统计提供准确的样本数据,推断统计是无源之水;没有推断统计学就不能从数据中揭示总体更深层次的数量规律性,就不可能使统计方法论更为完善。
第二章统计数据收集和整理一、单项选择题1.D2.C3.D4.C5.C6.C7.B8.C9.B 10.C 12.A 13.A 14.B二、多项选择题1.ABC2.ABCDE3.ADE4.DE5.ACE三、判断分析题1.错误。
虽然普查中只有登记性误差,而抽样调查中既有登记性误差,又有抽样误差;但普查中由于调查单位多,容易发生登记性误差,抽样调查由于调查单位较少,可以避免登记性误差的发生,而抽样误差可以计算和控制。
因此抽样调查的结果往往比普查更准确。
2.错误。
准确性是统计工作的生命。
准确的统计数据,才能如实反映客观实际,才能为决策提供科学的依据。
但是,强调准确性并非要求绝对求准,由于各种原因(包括时间和费用的制约),统计数据不可避免会出现误差。
但只要误差在允许范围内即达到一定的准确性要求,统计资料就能够满足需要,发挥其应有的作用。
3.错误。
统计分组要保持组内的同质性和组与组之间的差异性。
进行统计分组时,如果组数过多,分组过细,会将性质相同的单位分在不同的组里,这是不科学的。
第一章一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
这里的“月收入”是()A.分类变量B.顺序变量C.数值型变量D.离散变量7.要反映我国工业企业的整体业绩水平,总体单位是()A.我国每一家工业企业B.我国所有工业企业C.我国工业企业总数D.我国工业企业的利润总额8.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这里的参数是()A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均消费额D.1000个消费者的平均消费额9.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A.分类数据B.顺序数据C.截面数据D.时间序列数据10.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。
统计学(第五版)课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
《数据模型与决策》练习题及答案1 《管理统计学》习题解答(2010年秋MBA周末二班,邢广杰,学号: ) 第3章描述性统计量(一) P53 第1题抽查某系30个教工,年龄如下所示:61,54,57,53,56,40,38,33,33,45,28,22,23,23,24,22,21,45,42,36,36,35,28,25,37,35,42,35,63,21(i)求样本均值、样本方差、样本中位数、极差、众数;(ii)把样本分为7组,且组距相同。
作出列表数据和直方图;(iii)根据分组数据求样本均值、样本方差、样本中位数和众数。
解:n1(i)样本均值=37.1岁 x,x,in,i1nn211222样本方差=189.33448 s,(X,X),(X,nX),,iin-1n-1,,i1i1把样本按大小顺序排列:21,21,22,22,23,23,24,25,28,28,33,33,35,35,35,36,36,37,38,40,42,42,45,45,53,54,56,57,61,631样本中位数=(35+36)/2=35.5岁 m,(X,X)nn()(,1)222R,X,X,极差63-21=42岁 (n)(1)m,众数35岁 0(ii)样本分为7组、且组距相同的列表数据、直方图如下所示累计频教工分组教工年龄组中值数教职工岁数分组频数图f频数() 分组(岁) (x) i(16,23] 6 19.5 6 108(23,30] 4 26.5 106(30,37] 8 33.5 18 频数频数4(37,44] 4 40.5 222(44,51] 2 47.5 24 0(51,58] 4 54.5 28 23303744515865教职工岁数(58,65] 2 61.5 30(iii)根据分组数据求样本均值、样本方差、样本中位数和众数。
k1样本均值=36.3岁 X,Xif,in,i11kk211222样本方差=174.3724 s,(X,X)f,(Xf,nX),,iiiin-1n-1,,i1i1n30,F,1022样本中位数=34.375岁 m,I,i,30,7f8ff,84,mm-1众数33.5岁 mIi307,,,,,02fff2844,,,,,mm-1m,1 (二) P53 第2题某单位统计了不同级别的员工的月工资水平资料如下:月工资(元) 800 1000 1200 1500 1900 2000 2400员工数(人) 5 8 25 36 24 16 6累计频数 5 13 38 74 98 114 120求样本均值、样本标准差、样本中位数和众数。
第3、4章习题1、落在某一特定类别或组中的数据个数称为()A频数B频率C频数分布表D累积频数2、一个样本或总体中各个部分的数据与全部数据之比称为()A频数B频率C比例D比率3、样本或总体中各个不同类别数值之间的比值称为()A频数B频率C比例D比率4、下面哪一个图形最适合于描述结构性问题()A条形图B饼图C雷达图D直方图5、将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为()A单变量值分组B组距分组C等距分组D连续分组6、组中值是()A一个组的上下限之差B一个组的上、下限之间的中点值C一个组的最小值D一个组的最大值7、气泡图主要是用于描述()A两个变量之间的关系B三个变量之间的关系C两个变量的对比关系D三个变量的对比关系8、下面那些关于茎叶图的描述是正确的()A反应了原始数据的分布B适用于大批量数据C保留了原式数据信息D更适合分类数据E叶上只保留数值的最后一个数字9、下面关于直方图与条形图的描述正确的是()A条形图宽度固定,表示类别;直方图宽度表示各组组距B 条形图用长度表示频数多少直方图用面积表示频数多少C 两者的矩形都是连续排列的D 条形图主要用于展示分类数据;直方图主要用于展示数值型数据E条形图主要用于描述数据的分布;直方图主要用于描述各类别数据的多少答案:ACDBBBB 8、ACE 9、ABD10、下列关于众数的叙述不正确的是()A一组数据可能有多个众数B众数主要适用于分类数据C一组数据的众数是唯一的D众数不受极端值影响11、如果一个数据的标准分数是3,表明该数据()A比平均数高出3个标准差B比平均数低3个标准差C等于3倍的平均数D等于3倍的标准差12、经验法则表明,当一组数据呈对称分布的时候,在平均数加减2个标准差的范围内大约有()A68%的数据B95%的数据C99%的数据D100%的数据13、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是()A至少有75%的数据落在平均数加减3个标准差范围内B至少有89%的数据落在平均数加减3个标准差范围内C至少有94%的数据落在平均数加减3个标准差范围内D至少有99%的数据落在平均数加减3个标准差范围内14、离散系数的主要用途是()A反应一组数据的离散程度B反应一组数据的平均水平C比较多组数据的离散程度D比较多组数据的平均水平15、如果一组数据分布的偏态系数在0.5~1或-1~0.5之间,则表明该组数据属于()A高度偏态分布B中等偏态分布C对称分布D轻微偏态分布16、对于右偏分布,平均数、中位数、众数之间的关系是()A平均数>中位数>众数B中位数>平均数>众数C众数>中位数>平均数D众数>平均数>中位数17、某班学生平均成绩是80分,标准差是10分,如果已知该班学生的成绩呈对称分布,可以判断成绩在70~90分之间的学生大约占()A95% B89% C68% D99%18、某公司进行计算机水平测试,新员工的平均分是80分,标准差是5分,假设新员工的成绩分布式未知的,则新员工的成绩在65~95分之间的新员工至少占()A75% B89% C94% D95%19、下列叙述中正确的是()A如果计算每个数据与平均数的离差,则这些离差的和总是等于零的B如果考试成绩的分布是对称的,平均数是75,标准差是12,则考试成绩在63~75分之间饿比例大约为95%C平均数和中位数相等D中位数大于平均数20、一组样本数据为3,3,1,5,13,12,11,9,7。
目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。
1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。
1.5举例说明总体、样本、参数、统计量、变量这几个概念。
1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。
1.8请举出统计应用的几个例子。
1.9请举出应用统计的几个领域。
1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。
1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。
回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。
第一章统计和统计数据名词解释1.统计学:收集处理分析解释数据并从数据中得出结论的科学。
2.描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。
3.推断统计:研究如何利用样本数据来推断总体特征的统计方法。
4.分类数据:只能归于某一类别的非数字型数据。
5.顺序数据:只能归于某一有序类别的非数字型数据。
6.数值型数据:按数字尺度测量的观察值。
7.总体:包含所研究的全部个体(数据)的集合。
8.样本:从总体中抽取的一部分元素的集合。
9.参数:用来描述总体特征的概括性数字度量。
10.变量:说明现象某种特征的概念。
11.分类变量:说明事物类别的一个名称。
12.顺序变量:说明事物有序类别的一个名称。
13.数值型变量:说明事物数字特征的一个名称。
14.概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
15.非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
16.简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。
17.分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。
18.整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
19.系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一单位作为初始单位,然后按事先规则确定其它样本单位。
20. 抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误差简答题。
1.概率抽样与非概率抽样比较:性质不同,非概不依据随机原则选样本,样本统计量分布不确切,无法使用样本的结果对总体相应参数进行推断。
操作简便,时效快,成本低,专业要求不很高。
概率抽样依据随机原则抽选样本,理论分布存在,对总体有关参数可进行估计,计算估计误差,得到总体参数的置信区间。
提出精度要求。
2.数据收集方法的选择:抽样框中有关信息,目标总体特征,调查问题的内容,有形辅助物的使用,实施调查的资源,管理与控制,质量要求3.误差的控制:抽样误差是抽样随机性带来的,不可避免可以计算,改大样本量。
描述统计练习题及参考答案单选题1.某考生在一项测验中得分6060,,经换算百分等级为7070,这表明在所有考生中,得分低于该,这表明在所有考生中,得分低于该考生的人数占总人数的A .30 A .30%% B.40 B.40%% C C..6060%% D D..7070%%2.用于描述两个变量之间相关关系的统计图是A .直方图.直方图B B B.线形图.线形图.线形图C C C.条形图.条形图.条形图D D D.散点图.散点图3.将Z 分数转换成T 分数时,需要进行A .正态化转换.正态化转换B B B.非正态化转换.非正态化转换.非正态化转换C C C.线性转换.线性转换.线性转换D D D.非线性转换.非线性转换4. 4. 已知某次学业成就测验的平均分数是已知某次学业成就测验的平均分数是8080,标准差为,标准差为4。
如果某考生得分为9292,则该分数,则该分数转换为标准分后是A .1B 1 B..2C 2 C..3D 3 D..45.现有一列数据,它们是4,4,5,3,5,5,2。
这列数据的平均数、众数和全距依次是A .4,4,2 B. 42 B. 4,,5,3 C 3 C..5,4,4 D 4 D..5,5,16.一组数据的平均数是100100,标准差是,标准差是2525,这组数据的变异系数是(,这组数据的变异系数是() A A..4% B B..2525%% C C..4 D 4 D..257.有一组数据:.有一组数据:33,6,2,7,3232,,4,8,6,5。
要描述这组数据的特征,受极端数据值影响的统计量是()A A.平均数.平均数.平均数B B B.中数.中数.中数C C C.四分位数.四分位数.四分位数D D D.众数.众数8.在某次考试中,小明的语文、数学成绩均为8080,英语成绩为,英语成绩为7575。
已知全班三科平均成绩。
已知全班三科平均成绩都为6565,语文标准差为,语文标准差为1010,数学标准差为,数学标准差为1515,英语标准差为,英语标准差为5。
请举出统计应用的几个例子:1、用统计识别作者:对于存在争议的论文,通过统计量推出作者2、用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3、挑战者航天飞机失事预测请举出应用统计的几个领域:1、在企业发展战略中的应用2、在产品质量管理中的应用3、在市场研究中的应用④在财务分析中的应用⑤在经济预测中的应用你怎么理解统计的研究内容:1、统计学研究的基本内容包括统计对象、统计方法和统计规律。
2、统计对象就是统计研究的课题,称谓统计总体。
3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。
④统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
举例说明分类变量、顺序变量和数值变量:分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度”等就是顺序变量。
数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。
定性数据和定量数据的图示方法各有哪些:1、定性数据的图示:条形图、帕累托图、饼图、环形图2、定量数据的图示:a、分组数据看分布:直方图b、未分组数据看分布:茎叶图、箱线图、垂线图、误差图c、两个变量间的关系:散点图d、比较多个样本的相似性:雷达图和轮廓图直方图与条形图有何区别:1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距。
2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。