统计学课后答案解析
- 格式:doc
- 大小:646.25 KB
- 文档页数:23
版权归wagxjysys所有违者必究第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
第四章动态数列一﹑单项选择题1.下列动态数列中属于时点数列的是A.历年在校学生数动态数列B.历年毕业生人数动态数列C.某厂各年工业总产值数列D.某厂各年劳动生产率数列2.构成动态数列的两个基本要素是A.主词和宾词B.变量和次数C.分组和次数D.现象所属的时间及其指标值3.动态数列中各项指标数值可以相加的是A.相对数动态数列B.平均数动态数列C.时期数列D.时点数列4.最基本的动态数列是A.指数数列B.相对数动态数列C.平均数动态数列D.绝对数动态数列5.动态数列中,指标数值的大小与其时间长短没有直接关系的是A.时期数列B.时点数列C.相对数动态数列D.平均数动态数列6.动态数列中,指标数值是经过连续不断登记取得的数列是A.时期数列B.时点数列C.相对数动态数列D.平均数动态数列7.下列动态数列中属于时期数列的是A.企业历年职工人数数列B.企业历年劳动生产率数列C.企业历年利税额数列D.企业历年单位产品成本数列8.动态数列中,各项指标数值不可以相加的是A.相对数动态数列B.绝对数动态数列C.时期数列D.时点数列9.动态数列中,指标数值大小与其时间长短有关的是A.相对数动态数列B.绝对数动态数列C.时期数列D.时点数列10.动态数列中,指标数值是通过一次登记取得的数列是A.相对数动态数列B.绝对数动态数列C.时期数列D.时点数列11.编制动态数列的最基本原则是保证数列中各项指标必须具有A.可加性B.可比性C.连续性D.一致性12.基期为某一固定时期水平的增长量是A.累计增长量B.逐期增长量C.平均增长量D.年距增长量13.基期为前期水平的增长量是A.累计增长量B.逐期增长量C.平均增长量D.年距增长量14.累计增长量与逐期增长量之间的关系是A.累计增长量等于相应的各个逐期增长量之和B.累计增长量等于相应的各个逐期增长量之差C.累计增长量等于相应的各个逐期增长量之商D.累计增长量等于相应的各个逐期增长量之积15.平均增长量等于A.累计增长量B.逐期增长量C.逐期增长量之和除以逐期增长量的项D.以上均不对16.动态数列中的发展水平是指A.总量指标B.相对指标C.平均指标D.以上指标均可17.进行动态分析的基础指标是A.发展水平B.平均发展水平C.增长量D.平均增长量18.动态数列的分析指标主要包括两个类别,即A.发展水平和发展速度B.水平指标和速度指标C.平均发展水平和平均发展速度D.增长量和增长速度19.序时平均数和一般平均数的共同点在于两者A.都是根据动态数列计算B.都是根据变量数列计算C.都是反映现象的一般水平D.均可以消除现象波动的影响20.根据时期数列计算序时平均数应采用A.简单算术平均法B.加权算术平均法C.简单序时平均法D.加权序时平均法21.根据间隔相等连续时点数列计算序时平均数应采用A.简单算术平均法B.加权算术平均法C.简单序时平均法D.加权序时平均法22.根据间隔不相等连续时点数列计算序时平均数应采用A.简单算术平均法B.加权算术平均法C.简单序时平均法D.加权序时平均法23.根据间隔相等间断时点数列计算序时平均数应采用A.简单算术平均法B.加权算术平均法C.简单序时平均法D.加权序时平均法24.根据间隔不相等间断时点数列计算序时平均数应采用A.简单算术平均法B.加权算术平均法C.简单序时平均法D.加权序时平均法25.序时平均数计算中,“首未折半法”运用于A.时期数列的资料B.间隔相等的时点数列资料C.间隔不等的时点数列资料D.由两个时点数列构成的相对数动态数列26.将研究对象在不同时间上的数量差异抽象化,从动态上说明现象在某一时期内发展的一般水平的方法是A.一般平均数B.序时平均数C.平均发展速度D.平均增长速度27.间隔不相等的间断时点数列计算平均发展水平,应采取A.以每次变动持续的时间长度对各时点水平加权平均B.用各间隔长度对各间隔的平均水平加权平均C.对各时点水平简单算术平均D.以数列的总速度按几何平均法计算28.根据采用的对比基期不同发展速度有A.环比发展速度与定基发展速度B.环比发展速度与环比增长速度C.定基发展速度与定基增长速度D.环比增长速度与定基增长速度29.发展速度的计算方法可以表述为A.报告期水平与基期水平之差B.增长量与基期水平之差C.报告期水平与基期水平之比D.增长量与基期水平之比30.基期为前一期水平的发展速度是A.定基发展速度B.环比发展速度C.年距发展速度D.平均发展速度31.基期为某一固定期水平的发展速度是A.定基发展速度B.环比发展速度C.年距发展速度D.平均发展速度32.定基发展速度和环比发展速度的关系是两个相邻时期的定基发展速度A.之商等于相应的环比发展速度B.之差等于相应的环比发展速度C.之和等于相应的环比发展速度D.之积等于相应的环比发展速度33.增长速度是A.动态数列水平之差B.动态数列水平之比C.增长量同发展速度之比D.增长量同作为比较基准的数列水平之比34.定基增长速度与环比增长速度的关系表现为A.定基增长速度等于各环比增长速度的连乘积B.定基增长速度等于各环比增长速度的连乘积的n次方根C.各环比增长速度连乘积加一等于定基增长速度加一D.定基增长速度等于各环比增长速度加一后的连乘积减一35.既然总速度是环比发展速度的连乘积,那么平均发展速度就应按A.简单算术平均数计算B.加权算术平均数计算C.几何平均数计算D.调和平均数计算36.发展速度与增长速度的关系是A.定基发展速度等于环比增长速度加一B.环比增长速度等于环比发展速度减一C.定基增长速度的连乘积等于定基发展速度D.环比增长速度的连乘积等于环比发展速度37.动态数列中的平均增长速度是A.各个时期环比增长速度的算术平均数B.各个时期环比增长速度的调和平均数C.各个时期环比增长速度的几何平均数D.各个时期环比增长速度的序时平均数38.采用几何平均法计算平均发展速度的理由是A.各期环比发展速度之积等于总速度B.各期环比发展速度之和等于总速度C.各期环比增长速度之积等于总速度D.各期环比增长速度之和等于总速度39.已知各期定基发展速度和时期数,而不知道各期水平要计算平均发展速度A.只能用水平法计算B.只能用累计法计算C.两种方法皆能计算D.两种方法都无法计算40.已知各时期发展水平之和与最初水平及时期数,要计算平均发展速度A.只能用水平法计算B.只能用累计法计算C.两种方法皆能计算D.两种方法都无法计算41.当动态数列分析目的是侧重于考察期未发展水平,则平均发展速度A.应采用算术平均法计算B.应采用调和平均法计算C.应采用几何平均法计算D.应采用方程式法计算42.当动态数列分析目的是侧重于考察整个时期中各年发展水平的总和,则平均发展速度A.应采用算术平均法计算B.应采用调和平均法计算C.应采用几何平均法计算D.应采用方程式法计算43.动态数列中的平均发展速度等于A.各时期定基发展速度的序时平均数B.各时期环比发展速度的序时平均数C.各时期环比发展速度的算术平均数D.各时期定基发展速度的算术平均数44.几何平均数所计算的平均发展速度的数值大小A.不受最初水平和最未水平的影响B.只受中间各期发展水平的影响C.只受最初水平和最未水平的影响D.既受最初水平和最未水平的影响,又受中间各期发展水平的影响45.累计法计算平均发展速度的实质是从最初水平出发A.按平均增长量增长,经过n期,正好达到最未水平B.按平均发展速度发展,经过n期,正好达到第n期实际水平C.按平均发展速度计算得到的各期理论水平之和正好等于各期的实际水平总和D.按平均发展速度发展得到的各期理论水平之和正好等于最未期的实际水平46.直线趋势方程Y C=a+bx中a和b的意义是A.a是截距,b表示X=0的趋势值B.a表示最初发展水平的趋势值,b表示平均发展水平C.a表示最初发展水平的趋势值,b表示平均发展速度D.a是直线的截距,表示最初发展水平的趋势值;b是直线的斜率,表示按最小平方法计算的平均增长量47.用最小平方法配合趋势直线方程Y C=a+bx在什么条件下,a=Y;b=ΣXY/ΣX2A.ΣX=0B.Σ(Y-Y)=0C.ΣY=0D.Σ(Y-Y)2=最小值二﹑多项选择题1.构成动态数列的两个基本要素是A.变量B.次数C.现象所属的时间D.现象所属的范围E.反映现象的统计指标数值2.动态数列按研究任务不同可以分为A.绝对数动态数列B.平均数动态数列C.相对数动态数列D.时期数列E.时点数列3.动态数列的作用表现在A.描述现象变化的过程B.说明现象发展的速度和趋势C.探索现象发展变化的规律性D.对现象的发展进行预测E.反映现象总体的分布特征4.时期数列的特点A.数列中各个指标数值可以相加B.数列中指标数值大小与其时期长短无直接关系C.数列中各个指标数值不能相加D.数列中指标数值大小与其时期长短有直接关系E.数列中指标数值通常是通过连续不断登记而取得的5.时点数列的特点A.数列中各个指标数值可以相加B.数列中指标数值大小与其间隔长短无直接关系C.数列中各个指标数值不能相加D.数列中指标数值大小与其间隔长短有直接关系E.数列中指标数值通常是通过间断登记而取得的6.下列动态数列中,各项指标数值不能相加的有A.绝对数动态数列B.相对数动态数列B.平均数动态数列D.时期数列E.时点数列7.下列数列中,属于两个时期对比构成的相对数动态数列有A.全员劳动生产率动态数列B.百元产值利润率动态数列C.职工人数动态数列D.计划完成程度动态数列E.出勤率动态数列8.下列数列中属于时期数列的有A.历年年未人口总数B.历年出生人数B.历年工业增加值D.各月商品库存量E.各月未银行存款余额9.下列数列中属于时点数列的有A.高校每年毕业生人数B.高校每年在校学生数C.银行每月未银行存款余额D.商店各月商品库存额E.我国历年外汇储备量10.编制动态数列应遵循的原则有A.时期长短应该相等B.指标的经济内容应该相同C.总体范围应该一致D.指标的计算方法应该一致E.指标的计算价格和计量单位应该一致11.动态数列中的水平分析指标有A.发展水平B.平均发展水平C.增长量D.平均增长量E.平均发展速度12.动态数列中的速度分析指标有A.平均发展水平B.增长速度C.平均发展速度D.平均增长速度E.发展速度13.下列指标中属于序时平均数的有A.平均发展水平B.平均增长量C.平均发展速度D.平均增长速度E.平均指标14.动态数列中的发展水平包括A.期初水平B.期未水平C.中间水平D.报告期水平E.基期水平15.将不同时期的发展水平加以平均所得到的平均数称为A.一般平均数B.算术平均数C.序时平均数D.动态平均数E.平均发展水平16.平均增长量的计算公式是A.逐期增长量之和/逐期增长量项数B.逐期增长量的序时平均数C.累计增长量/动态数列项数-1D.累计增长量/动态数列项数E.累计增长量/动态数列项数+117.定基发展速度与环比发展速度之间的关系表现为A.两个相邻时期的定基发展速度之商等于相应的环比发展速度B.定基发展速度等于相应的各个环比发展速度的连乘积C.定基发展速度等于环比发展速度加一D.定基发展速度等于环比增长速度加一后的连乘积E.环比发展速度乘积等于总速度18.增长速度和发展速度的关系为A.仅差一个基数B.发展速度=增长速度+1C.定基增长速度=各环比增长速度的连乘积C.定基发展速度=定基增长速度+1E.定基增长速度=各环比发展速度的连乘积-119.定基增长速度等于A.累计增长量除以基期发展水平B.定基发展速度减去一C.总速度减去一D.环比增长速度的连乘积E.逐期增长量除以前期发展水平20.环比增长速度等于A累计增长量除以基期发展水平B.环比发展速度减去一C.定基发展速度减去一D.环比增长速度的连乘积E.逐期增长量除以前期发展水平21.动态数列中的发展水平可以是A.总量指标B.相对指标C.平均指标D.变异指标E.样本指标22.增长1%的绝对值等于A.累计增长量除以定基发展速度B.逐期增长量除以环比发展速度C.逐期增长量除以环比增长速度×100D.累计增长量除以定基增长速度×100E.固定期水平除以10023.计算平均发展速度的方法有A.几何平均法B.水平法C.方程式法D.累计法E.序时平均法24.平均发展速度从广义上讲属于A.静态平均数B.动态平均数C.序时平均数D.几何平均数E.调和平均数25.计算平均发展速度的几何平均法和方程式法的区别是A.数理依据不同B.侧重点不同C.适用条件不同D.适用范围不同E.对资料要求不同26.常用的长期趋势测定的方法有A.时距扩大法B.移动平均法C.分段平均法D.最小平方法E.季节比率法27.直线趋势方程Y c=a+bx的参数b是表示A.趋势值B.趋势线的截距C.趋势线的斜率D.当X=0时的Yc的数值E.当X每变动一个单位时Y c平均增减的数值三﹑填空题1.动态数列一般由两个基本要素构成,即和。
第四章一、单项选择题1.由反映总体单位某一数量特征的标志值汇总得到的指标是()A.总体单位总量 B。
质量指标C。
总体标志总量 D.相对指标2。
各部分所占比重之和等于1或100%的相对数()A.比例相对数 B.比较相对数 C.结构相对数 D.动态相对数3.某企业工人劳动生产率计划提高5%,实际提高了10%,则提高劳动生产率的计划完成程度为( )A.104。
76% B。
95。
45% C。
200% D。
4。
76%4。
某企业计划规定产品成本比上年度降低10%实际产品成本比上年降低了14。
5%,则产品成本计划完成程度()A.14。
5%B.95% C。
5% D.114。
5%5.在一个特定总体内,下列说法正确的是( )A。
只存在一个单位总量,但可以同时存在多个标志总量B。
可以存在多个单位总量,但必须只有一个标志总量C。
只能存在一个单位总量和一个标志总量D.可以存在多个单位总量和多个标志总量6。
计算平均指标的基本要求是所要计算的平均指标的总体单位应是()A.大量的 B。
同质的 C.有差异的 D.不同总体的7.几何平均数的计算适用于求()A.平均速度和平均比率 B。
平均增长水平C.平均发展水平D.序时平均数8。
一组样本数据为3、3、1、5、13、12、11、9、7这组数据的中位数是()A。
3 B.13 C。
7.1 D.7 9。
某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是( )A。
方差 B.极差 C。
标准差 D。
变异系数10。
用标准差比较分析两个同类总体平均指标的代表性大小时,其基本的前提条件是( )A。
两个总体的标准差应相等 B。
两个总体的平均数应相等C。
两个总体的单位数应相等 D。
两个总体的离差之和应相等11。
已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应采用()A。
简单算术平均数 B。
加权算术平均数C.加权调和平均数D.几何平均数12.算术平均数、众数和中位数之间的数量关系决定于总体次数的分布状况。
统计学课后习题答案附录三:部分习题参考解答老师说这份答案有些错误,慎重参考哈~~第一章(15-16)一、判断题2.答:对。
3.答:错。
实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。
4.答:对。
5.答:错。
描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。
6.答:错。
有限总体全部统计成本太高,经常采用抽样调查,因此也必须使用推断技术。
7.答:错。
不少社会经济的统计问题属于无限总体。
例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。
8.答:对。
二、单项选择题1.A;2.A;3.A;4.B。
三、分析问答题1.答:定类尺度的数学特征是“=”或“”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。
;定序尺度的数学特征是“”或“”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“”或“”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。
3.答:如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。
第二章(45-46)一、单项选择题1.C;2.A;3.A。
二、多项选择题1.A.B.C.D;2.A.B.D;3.A.B.C.三、简答题1.答:这种说法不对。
从理论上分析,统计上的误差可分为登记性误差、代表性误差2.答:统计报表的日常维持需要大量的人力、物力、财力;而且统计报表的统计指标、指标体系不容易调整,对现代社会经济调查来说很不合适。
第1章导论1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度.经估计,森林公园生长着25000颗成年松树,该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。
该研究的总体是()A、250颗成年松树 B、公园中25000颗成年松树C、所有高于60英尺的成年松树D、森林公园中所有年龄的松树2、某森林公园的一项研究试图确定成年松树的高度。
该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。
该研究所感兴趣的变量是()A、森林公园中松树的年龄B、森林公园中松树的数量C、森林公园中松树的高度D、森林公园中数目的种类3、推断统计的主要功能是()A、应用总体的信息描述样本B、描述样本中包含的信息C、描述总体中包含的信息D、应用样本信息描述总体4、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育.这一叙述是()的结果A、定性变量B、试验 C、描述统计 D、推断统计5、一名统计学专业的学生为了完成其统计学作业,在图书馆找到一本参考书中包含美国50个州的家庭收入中位数。
在该生的作业中,他应该将此数据报告来源于()A、试验B、实际观察 C、随机抽样D、已发表的资料6、某大公司的人力资源部主任需要研究公司雇员的饮食习惯。
他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。
该研究的目的是为了改善公司餐厅的现状。
这种数据的收集方式可以认为是()A、观察研究B、设计的试验C、随机抽样D、全面调查7、下列不属于描述统计问题的是()A、根据样本信息对总体进行的推断B、感兴趣的总体或样本C、图、表或其他数据汇总工具D、了解数据分布特征8、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。
该研究人员感兴趣的总体是()A、该大学的所有学生B、所有的大学生C、该大学所有的一年级新生D、样本中的200名新生9、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从()2,N n σμ的正态分布,由正态分布,标准化得到标准正态分布:x ~()0,1N ,因此,样本均值不超过总体均值的概率P为:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159 因此,()0.3P x μ-≤=0.63186.2在练习题6.1中,我们希望样本均值与总体均值μ的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=210.95Φ-≥0.975⇒Φ≥1.96⇒≥42.6828843n n ⇒≥⇒≥6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使得 6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑ 解:由于卡方分布是由标准正态分布的平方和构成的: 设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量222212χ=+++n Z Z Z服从自由度为n 的χ2分布,记为χ2~ χ2(n ) 因此,令6221ii Z χ==∑,则()622216ii Zχχ==∑,那么由概率6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑,可知:b=()210.956χ-,查概率表得:b=12.596.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差22211(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得 212()0.90p b S b ≤≤=解:更加样本方差的抽样分布知识可知,样本统计量:222(1)~(1)n s n χσ--此处,n=10,21σ=,所以统计量22222(1)(101)9~(1)1n s s s n χσ--==-根据卡方分布的可知:()()2212129990.90P b S b P b S b ≤≤=≤≤=又因为:()()()2221221911P n S n ααχχα--≤≤-=-因此:()()()()22221212299919110.90P b S b P n S n ααχχα-≤≤=-≤≤-=-= ()()()()222212122999191P b S b P n S n ααχχ-⇒≤≤=-≤≤- ()()()2220.950.059990.90P S χχ=≤≤=则: ()()2210.9520.0599,99b b χχ⇒==()()220.950.051299,99b b χχ⇒==查概率表:()20.959χ=3.325,()20.059χ=19.919,则()20.95199b χ==0.369,()20.05299b χ==1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。
第五章一、单项选择题1.抽样推断的目的在于( )A.对样本进行全面调查 B.了解样本的基本情况C.了解总体的基本情况 D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于( )A.样本单位数 B.总体方差C.抽样比例 D.样本单位数和总体方差3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差( )A.一年级较大 B.二年级较大C.误差相同 D.无法判断4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将( )A.高估误差 B.低估误差C.恰好相等 D.高估或低估5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量( )A.扩大到原来的2倍 B.扩大到原来的4倍C.缩小到原来的1/4 D.缩小到原来的1/26.当总体单位不很多且差异较小时宜采用( )A.整群抽样 B.纯随机抽样C.分层抽样 D.等距抽样7.在分层抽样中影响抽样平均误差的方差是()A.层间方差 B.层内方差C.总方差 D.允许误差二、多项选择题1.抽样推断的特点有()A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题C.用样本指标来推断总体指标 D.抽样误差可以事先计算E.抽样误差可以事先控制2.影响抽样误差的因素有( )A.样本容量的大小 B.是有限总体还是无限总体C.总体单位的标志变动度 D.抽样方法E.抽样组织方式3.抽样方法根据取样的方式不同分为( )A.重复抽样 B.等距抽样 C.整群抽样D.分层抽样 E.不重复抽样4.抽样推断的优良标准是( )A.无偏性 B.同质性 C.一致性D.随机性 E.有效性5.影响必要样本容量的主要因素有( )A.总体方差的大小 B.抽样方法C.抽样组织方式 D.允许误差范围大小E.要求的概率保证程度6.参数估计的三项基本要素有()A.估计值 B.极限误差C.估计的优良标准 D.概率保证程度E.显著性水平7.分层抽样中分层的原则是( )A.尽量缩小层内方差 B.尽量扩大层内方差C.层量扩大层间方差 D.尽量缩小层间方差E.便于样本单位的抽取三、填空题1.抽样推断和全面调查结合运用,既实现了调查资料的_______性,又保证于调查资料的_______性。
统计学课后题及答案解析王文华1 、什么是统计学?答:统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从数据中得出结论的方法,统计所研究的是来自各领域的数据。
数据收集即取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。
2、解释描述统计和推断统计。
答:数据分析所用的方法可分为描述统计方法和推断统计方法。
(1)描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
(2)推断统计是研究如何利用样本数据来推断总体特征的统计方法。
比如,对产品的质量进行检验,往往是破坏性的,不可能对每个产品进行测量。
这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题。
3、统计数据可分为哪几种类型?不同类型的数据各有什么特点?答:统计数据是对现象进行测量的结果,可以从不同角度对统计数据进行分类:(1)按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
①在分类数据中,各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺序是可以改变的;②顺序数据也表现为类别,但这些类别之间是有顺序的;③数值型数据具有分类数据和顺序数据的特点,并且还可以进行加、减、乘、除运算。
(2)按照统计数据的收集方法,可以将其分为观测数据和实验数据。
①观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物进行人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据;②实验数据是在实验中通过控制实验对象收集到的数据,自然科学领域的大多数数据都是实验数据。
(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
①截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况;②时间序列数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
统计学第一至四章答案第一章一、思考题1.统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
统计方法可分为描述统计和推断统计。
2.统计数据的分类:按计量尺度:分类数据、顺序数据和数值型数据按获取数据的方式:观测数据和实验数据按数据与时间的关系:截面数据和时间序列数据特点:分类数据各类别之间是平等的并列关系,各类别之间的顺序可以任意改变;顺序数据的分类是有序的;数值型数据说明的是现象的数量特征,是定量数据;观测数据是通过调查或观测而收集到的数据,是在没有对事物进行人为控制的条件下得到的;实验数据是在实验中控制实验对象而收集到的数据;截面数据也称静态数据,描述的是现象在某一时刻的变化情况;时间序列数据也称动态数据,描述的是现象随时间的变化情况。
3.对武昌分校的全体教师进行工资调查,那么全体教师就是总体,从中抽取五十名教师进行调查,这五十名教师的集合就是样本,全体教师工资的总体平均值和总体标准差等描述特征的数值就是参数,五十名教师工资的样本平均值和样本标准差等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说教师的工资。
4.有限总体:指总体的围能够明确确定,而且元素的数目是有限可数的。
例如:武昌分校10 级金融专业学生无限总体:指总体所包含的元素是无限的、不可数的。
例如:整个宇宙的星球5.变量可分为分类变量、顺序变量、数值型变量。
同时数值型变量可分为离散型变量和连续型变量。
6.离散型变量只能取有限个值,而且其取值都以整位数断开,可以一一列举,例如“产品数量” 、“企业数”。
连续型变量的取值指连续不断的,不能一一列举。
例如“温度” 、“年龄”。
二、练习题1.(1)数值型变量(2)分类变量(3)数值型变量(4)顺序变量(5)分类变量2.(1)这一研究的总体是IT 从业者,样本是从IT 从业者中抽取的1000 人,样本量是1000(2)“月收入”是数值型变量(3)“消费支付方式”是分类变量3.(1)这一研究的总体是所有的网上购物者(2)“消费者在网上购物的原因”是分类变量第二章一、思考题1:答:1: 普查的特点:①:普查通常是一次性的或周期性的;②:普查一般需要规定统一的调查时间;③:普查的数据一般比较准确;4:普查的使用围比较狭窄,只能调查一些最基本的、特定的现象。
应用统计学课后习题与参考答案第一章一、选择题1.一个统计总体(D)。
A.只能有一个标志 B.只能有一个指标C.可以有多个标志 D.可以有多个指标2.对100名职工的工资收入情况进行调查,则总体单位是(D)。
A.100名职工 B.100名职工的工资总额C.每一名职工 D.每一名职工的工资 3.某班学生统计学考试成绩分别为65分、72分、81分和87分,这4个数字是(D)。
A.指标 B.标志C.变量 D.标志值4.下列属于品质标志的是(B)。
A.工人年龄 B.工人性别C.工人体重 D.工人工资5.某工业企业的职工数、商品销售额是(C)。
A.连续变量 B.离散变量C.前者是离散变量,后者是连续变量 D.前者是连续变量,后者是离散变量 6.下面指标中,属于质量指标的是(C)。
A.全国人口数 B.国内生产总值C.劳动生产率 D.工人工资7.以下指标中属于质量指标的是(C)。
A.播种面积 B.销售量C.单位成本 D.产量8.下列各项中属于数量指标的是(B)。
A.劳动生产率 B.产量C.人口密度 D.资金利税率二、简答题1.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?总体是“所有的网上购物者”。
(2)“消费者在网上购物的原因”是定类变量、定序变量还是数值型变量?分类变量。
(3)研究者所关心的参数是什么?所有的网上购物者的月平均花费。
(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?统计量。
(5)研究者所使用的主要是描述统计方法还是推断统计方法?推断统计方法。
2.要调查某商场销售的全部冰箱情况,试指出总体、个体是什么?试举若干品质标志、数量标志、数量指标和质量指标。
总体:该商店销售的所有冰箱。
总体单位:该商店销售的每一台冰箱。
品质标志:型号、产地、颜色。
数量标志:容量、外形尺寸;数量指标:销售量、销售额。
质量指标:不合格率、平均每天销售量、每小时电消耗量。
第一章1.举出你所知道的统计应用的例子。
答:期末考试后统计班里同学的成绩,从而进行排名等;人口普查统计,从而得知男女人口比例,年龄分布等;统计一个生态系统里某种物种的密度;统计股票市场上某一天的各种数据;统计某个城市的人均收入水平,人民幸福指数,对某一电视节目的看法等。
2. 解释定性数据和定量数据的区别,分别给出一个定性数据和一个定量数据的例子。
答:定性数据和定量数据的区别:定性数据是由于我们考虑的是取值为类别的变量,对这些类别用数字来分别代表就得到定性数据;定量数据是我们所考虑的变量的取值为数值,它将在某个区间上连续取值,或在某个区间上取离散的值。
定性数据的例子:例如考察某幼儿园10个人的性别,定义1=男,2=女,则所得到定性数据为:1,1,2,2,2,1,2,1,1,1. 定量数据的例子:考察某幼儿园10个人的身高,则此变量取值区间为(0,200)(单位:cm)3. 解释样本和总体的区别。
答:总体是根据一定目的和要求所确定的研究事物的全体。
为了了解总体的分布,我们从总体中随机地抽取一些个体,称这些个体的全体为样本。
样本和总体的区别在于总体是要考虑对象的全体,而样本是从总体中抽取出的一部分具有代表性的个体,从而通过对样本的研究得出关于总体的一些结论。
4. 解释离散型变量和连续型变量的区别,并各举一例。
离散型变量是指其数值只能用自然数或整数单位计算。
例如:某企业里职工的人数连续型变量是如果所考虑变量可以在某个区间内取任一实数,即变量的取值可以是连续的。
例如:生产零件的规格尺寸。
5.阐述四种主要的收集数据方法的区别。
答:观测,访问,问卷,实验区别:观测数据的研究者尽量不干涉研究对象的行为模式;访问在一定程度上对被访问者心理造成干扰,则收集到的数据会有误差;问卷常会产生未响应误差;实验时需要其控制它变量的影响。
6.举出一些观测数据和实验数据的例子。
答:(1)观测数据:证券分析人员可能会记录某即将收购的公司在被收购的前一天的股市收盘价,并与宣布被收购的当天的收盘价比较。
(2)试验数据:研究某药物是否具有特定效用,将所有志愿者分成治疗者和控制组。
治疗组每天服用一片该药物,而控制组则服用一片大小形状颜色与前一药物相同或相近的安慰剂。
7.答:(1)是样本。
所有的CEO的收入排行榜上的数据是总体,我们从中抽取的500名CEO的收入排行榜上的数据是样本。
(2)其中CEO所在公司所属行业是定性变量,而上一年全年CEO 总收入(百万美元),过去5年中CEO的总收入,公司所持有的股票份额(百万),CEO的年龄(岁),CEO的效率评分是定量变量。
8. 答:定类水平:性别定序水平:人可以根据年龄分为幼年、少年、青年、中年、壮年、老年定距水平:温度定比水平:身高,收入9.答:根据这个样本知:约有80%的顾客认为此药膏非常好,约有6.4%的顾客认为此药膏一般,而约有13.6%的顾客的反应不明朗。
10.第二章1.(1)两个班考试成绩的柱形图如下所示:(22.(1(2)国产车销售量帕累托图进口车销售量帕累托图:帕累托图如下所示:.6.9第三章1.答:频数分布表比较清晰的展现出在每个分组中的数据占样本数据的百分比。
2.答:频数分布图便于对数据的主要特征(高点,低点,集中点等)得到直观的印象。
3.答:相对频率很容易可以看出每组的频数,而累积频率可以方便的看出该组数据之前的累积频率。
4.(1)9组;(2)10组;(3)18组;(4)15组。
5. 0组。
6. 组。
7.(1)组距:10(2)数据趋向于集中到58(3)数据呈左偏态尖峰分布。
(4)相对频数分布为组频数相对频数15~24 1 2.5%25~34 2 5.0%35~44 5 12.5%45~54 10 25.0%55~64 15 37.5%65~74 4 10.0%75~84 3 7.5%8.(1)答:5名员工由于生病每年缺勤的天数少于3天。
17名员工由于生病每年缺勤的天数少于6天。
(2)累积频数分布缺勤的天数累计频数累积频率0~3 5 10%3~6 17 34%6~9 40 80%9~12 48 96% (3)根据累积频数折线图,75%的员工每年由于生病而缺勤的天数不超过37.5天9.柱体图如下:(2)直方图如下所示:直方图说明大多数人上网时间在4到7个小时之间;也有一部分人上网时间在1到3个小时之12.年龄Stem-and-Leaf PlotFrequency Stem & Leaf1.00 4 . 03.00 4 . 7994.00 5 . 01244.00 5 . 68993.00 6 . 1231.00 6 . 72.00 7 . 133.00 7 . 6893.00 8 . 0441.00 8 . 7Stem width: 10Each leaf: 1 case(s)13.答:茎叶图展示数据如下:冰层厚度(厘米)Stem-and-Leaf PlotFrequency Stem & Leaf2.00 4 . 395.00 5 . 188895.00 6 . 489996.00 7 . 0022252.00 8 . 01Stem width: 1.0Each leaf: 1 case(s)14.答:用散点图表示数据如下:15.答:散点图如下:16.答:袋中苹果数量的均值为:21.71,中位数为:22.17.答:该机器每天被使用的次数的均值为70.53。
18.答:(1)售价的均值是:1.6380(2)售价的中位数是:1.4500(3)售价的众数是:1.4919.答:地震等级的中位数是:7.050 地震等级的均值是:6.967 死亡人数的中位数是:1100,死亡人数的均值是:5607.79地震等级选择均值作为集中趋势的度量;死亡人数选择中位数作为集中趋势的度量。
20.答:(1)(2)数据显示不存在异常值。
21.答:(1)样本均值是:4.154万元;样本标准差是:0.5317 (2)中位数:4.200;上四分位数:3.750;下四分位数:4.650(3)样本中每个员工获得5%的加薪后集合的样本均值为:4.3615,样本标准差为:0.55827(4)月薪的样本均值为:0.3462,样本标准差为:0.04431 (5)用不同的度量来衡量数据的变异所得结果是不同的。
22.答:(1)数据的均值是:49.23 数据的中位数是:46.50 (2)茎叶图:(3)数据呈右偏态,扁平分布。
23.答:(1)女生体重差异大,因为男生体重的变异系数比女生的小;(2)(3)(4)95%24.答:此位应试者A项测试更为理想。
25.答:国内乘客的变异系数为CV1=4.5/21x100%=21.4%海外乘客的变异系数为CV2=6.8/35X100%=19.4%根据两组乘客的行李重量的变异系数可以看出,国内乘客携带行李重量的相对离散程度更高,而海外乘客的相对离散程度则比国内更低一些。
26.答:(1)因为这是两组不同水平的变量,均值相差很远,使用变异系数可对离散性进行有意义的比较。
(2)市盈率的变异系数为:0.165,投资收益率的变异系数为:0.208,这说明投资收益率的相对离散程度比市盈率的大。
27.答:(1)使用标准差和方差来反映风险(2)商业类股票,因为商业类股票方差较小,离峰值较集中(3)选择高科技类股票,因为两类股票峰值左侧的频数都较少,而峰值及其右侧的频数较多,其中高科技类股票的收益率更高,选择它有更大几率获得更多利润。
第四章1.答:(1)16(2)利用等可能事件求概率的方法。
(3)掷一枚骰子的结果中1点到6点的结果是相等的,互斥的。
2.答:(1)1150(2)使用相对频数的方法3.答:(1)古典概率(2)古典概率(3)主观概率4答:(1)一共有36种可能结果,具体组合略。
(2)利用古典概型求概率。
15答:(1)131(2)526.答:(1)实验是对40个学生进行问卷调查。
(2)40个学生中有23个回答“是”是一个可能的事件。
(3)0.25(4)不一定7.答:(1)实验是对驾驶员违章进行的调查。
(2)有1910名驾驶员违章数为0。
(3)0.009(4)使用了相对频数的方法。
8.答:概率是0.159.答:不是,如果电池是另一辆车上的,则概率是0.02,这是因为这两件事是相互独立的。
.10.答:这是公平的,抽签的次序并不影响公平性。
证明如下:第一次抽到的概率:第二次抽到的概率:第三次抽到的概率:第四次抽到的概率:第五次抽到的概率:因此,任何一次抽中的概率都是0.2.11.答:这从概率的方面讲是公平的,因为在未抽签之前每个人抽到的概率都是0.2.12.答:(1)在15次实验中至少3次成功的概率是:0.18 (2)在10次实验中最多1次成功的概率是:0.74(3)在12次实验中,成功次数至少3次最多5次的概率是:0.11 13.答:恰有3个航班晚点的概率是0.129,最多有4个航班晚的点概率是:0.9914.答:(1)0.724(2)0.171(3)0.10515.答:(1)0.251(2)0.8(3)0.00816.答:蛋糕上葡萄干的平均粒数是:317.答:该种汽车的耗油量近似服从正态分布。
这是因为我们通过所给数据画出直方图如下,可看出所给数据近似服从正态分布。
18. 答:思路:在Excel中改变n和p值,可以得到这四个二项分布图像,再与正态分布比较。
(1)(2)(3)(4)19.答:学生成绩不及格的概率和处于65~80之间的概率是0.6520.答:40984元。
第五章1.答:[51.32,58.68]2.答:[38.91,41.09]3.答:(1)0.556(2)[16.90,23.10]4.答:Z=1.44075.05.答:(1)总体均值的点估计是20元。
这是因为样本均值是总体均值的无偏估计。
(2)[18.60,21.40]6.答:(1)[18.78,21.22](2)这是因为样本量增大了。
7.答:(1)总体均值的点估计是:80.60(2)[79.84,81.36](3)(2)的结果的意义是:在100次抽取60笔交易时会有99次总体均值落在(2)的区间内。
8.答:全体学生中,每篇文章平均拼写错误的单词数目的95%置信区间是:[59.29,60.81]9.答:(1)总体均值是20.样本均值是总体均值的最佳估计。
(2)这是因为总体的方差未知,总体分布形态未知,且样本量少于30.需要的假定是:1,观测是独立的;2因变量总体服从正态分布。
(3)t(19)分布的上侧0.025分位数是:0.032(4)总体均值的95%置信区间是:[19.99,20.01](5)认为总体均值是21只是不合理的,认为是25只也是不合理的。
10.答:总体均值的98%置信区间是[29.99,38.14]解释:在100次抽取15个人的样本中总体均值有98次会在区间[29.99,38.14]中。