统计学课后题及答案解析王文华
- 格式:docx
- 大小:12.33 KB
- 文档页数:2
第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
《统计学》课程习题(修订)3•某市拟对该市专业技术人员进行调査,想要通过调査来研究下列问题:(1)通过描述专业技术人员队伍的学历结构来反映队伍的整体质量;(2)研究专业技术人员总体的职称结构比例是否合理;(3)描述专业技术人员总体的年龄分布状况;(4)研究专业技术人员完成的科研成果数是否与其最后学历有关。
请回答:(1) _____________________ 该项调查研究的调查对象是 ;(2)_____________________ 该项调查研究的调查单位是 ;(3) _____________________ 该项调查研究的报告单位是 ;(4)为完成该项调查研究任务,对每一个调查单位应询问下列调查项目。
4.某车间按工人日产量情况分组资料如下:根据上表指出:(1)变量、变量值、上限、下限、次数(频数);(2)各组组距、组中值、频率。
注:年龄以岁为单位,小数部分按舍尾法处理。
6.对下列指标进行分类。
(只写出字母标号即可)A手机拥有量B商品库存额C市场占有率D人口数E出生人口数F单位产品成本G人口出生率H利税额(1)时期性总量指标有:___________ ;(2)时点性总量指标有: ___________ (3)质量扌旨标有: _____________ ;(4)数量指标有: _____________ ;(5)离散型变量有:_______________ ;(6)连续型变量有:____________ o 7.现有某地区50户居民的月人均可支配收入数据资料如下(单位:元):8869289999469508641050927949852102792897881610009181040854110090086690595489010069269009998861120893900800938864919863981916818946926895967921978821924651850要求:(1)试根据上述资料作等距式分组,编制次(频)数分布和频率分布数列; (2)编制向上和向下累计频数、频率数列;(3)用频率分布列绘制直方图、折线图和向上、向下累计图;(4)根据图形说明居民月人均可支配收入分布的特征。
统计学课后习题答案附录三:部分习题参考解答老师说这份答案有些错误,慎重参考哈~~第一章(15-16)一、判断题2.答:对。
3.答:错。
实质性科学研究该领域现象的本质关系和变化规律;而统计学则是为研究认识这些关系和规律提供合适的方法,特别是数量分析的方法。
4.答:对。
5.答:错。
描述统计不仅仅使用文字和图表来描述,更重要的是要利用有关统计指标反映客观事物的数量特征。
6.答:错。
有限总体全部统计成本太高,经常采用抽样调查,因此也必须使用推断技术。
7.答:错。
不少社会经济的统计问题属于无限总体。
例如要研究消费者的消费倾向,消费者不仅包括现在的消费者而且还包括未来的消费者,因而实际上是一个无限总体。
8.答:对。
二、单项选择题1.A;2.A;3.A;4.B。
三、分析问答题1.答:定类尺度的数学特征是“=”或“”,所以只可用来分类,民族可以区分为汉、藏、回等,但没有顺序和优劣之分,所以是定类尺度数据。
;定序尺度的数学特征是“”或“”,所以它不但可以分类,还可以反映各类的优劣和顺序,教育程度可划分为大学、中学和小学,属于定序尺度数据;定距尺度的主要数学特征是“+”或“-”,它不但可以排序,还可以用确切的数值反映现象在两方面的差异,人口数、信教人数、进出口总额都是定距尺度数据;定比尺度的主要数学特征是“”或“”,它通常都是相对数或平均数,所以经济增长率是定比尺度数据。
3.答:如考察全国居民人均住房情况,全国所有居民构成统计总体,每一户居民是总体单位,抽查其中5000户,这被调查的5000户居民构成样本。
第二章(45-46)一、单项选择题1.C;2.A;3.A。
二、多项选择题1.A.B.C.D;2.A.B.D;3.A.B.C.三、简答题1.答:这种说法不对。
从理论上分析,统计上的误差可分为登记性误差、代表性误差2.答:统计报表的日常维持需要大量的人力、物力、财力;而且统计报表的统计指标、指标体系不容易调整,对现代社会经济调查来说很不合适。
统计学课后练习题答案第三章节:数据的图表展⽰ (1)第四章节:数据的概括性度量 (15)第六章节:统计量及其抽样分布 (26)第七章节:参数估计 (28)第⼋章节:假设检验 (38)第九章节:列联分析 (41)第⼗章节:⽅差分析 (43)3.1 为评价家电⾏业售后服务的质量,随机抽取了由100个家庭构成的⼀个样本。
服务质量的等级分别表⽰为:A.好;B.较好;C⼀般;D.较差;E.差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上⾯的数据属于什么类型。
顺序数据(2)⽤Excel制作⼀张频数分布表。
⽤数据分析——直⽅图制作:接收频率E16D17C32B21A14(3)绘制⼀张条形图,反映评价等级的分布。
⽤数据分析——直⽅图制作:(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收频数频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14141005101520253035CDBAE204060801001203.2 某⾏业管理局所属40个企业2002年的产品销售收⼊数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上⾯的数据进⾏适当的分组,编制频数分布表,并计算出累积频数和累积频率。
4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics汽车销售数量N Valid 10Missing 0 Mean 9.60 Median 10.00 Mode 10 Std. Deviation 4.169 Percentiles 25 6.2550 10.0075 12.504.2 随机抽取25个网络用户,得到他们的年龄数据如下:19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:1、排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线:分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K=+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄(Binned)分组后的均值与方差:分组后的直方图:4.6 在某地区抽取120家企业,按利润额进行分组,结果如下:要求:(1)计算120家企业利润额的平均数和标准差。
第一章总论三、填空题1、统计工作;统计资料;统计学2、数量特征;数量关系3、经济学;唯物辩证法(或马克思主义哲学)4、信息;咨询;监督5、同质性;大量性;差异性6、有限总体;无限总体7、可变的数量标志;变量的具体数值表现8、连续变量;离散变量9、各种互相联系的统计指标;基本统计指标体系;专题统计指标体系10、总体;总体单位四、简答题1.简述统计的含义及其相互间的关系1、统计有三种涵义,即统计工作、统计资料和统计学。
统计的三种涵义之间的关系:统计工作(统计活动)是基础,统计工作的结果形成统计资料。
有了统计资料,才能进一步地做好下一阶段的统计工作。
统计工作为统计学研究的打下了资料基础。
统计学为统计工作开创了方向,并指导统计工作的顺利进行。
统计工作是实践,统计学是理论方法,三者之间的关系是理论与实践的关系。
2.如何理解统计指标体系比统计指标应用更为广泛和重要2、因为任何社会经济总体都是一个相互联系的有机整体,这种联系是产生统计指标体系的客观基础,同时也产生了使用统计指标体系的要求。
同时,从对社会经济总体的认识来讲,一个统计指标的作用是有限的,只有用相互联系的一套指标才能全面地认识社会经济总体及其运动过程,因此统计指标体系比统计指标的应用更为广泛和重要。
3.如何理解总体和总体单位的关系3、统计总体是由客观存在的,具有某种共同性质的许多个别事物构成的整体;总体单位是指构成总体的个体单位。
总体和总体单位是互为存在,条件地连续在一起的。
没有总体单位,总体就不存在;总体单位也不可能离开总体而单独存在,如离开总体,则无法确定总体单位。
4.简述统计指标和指标的关系4、标志和指标既有区别,又有联系。
区别:第一,标志是说明总体单位属性或特征的名称;而指标是说明总体数量特征的名称。
第二,标志有只能用文字说明的品质标志和可以用数值表示的数量标志两种;而指标都能用数值表示。
联系:第一,有许多统计指标的数值是由总体单位的数量标志值汇总而来的。
第2章练习题1、二手数据的特点是()A.采集数据的成本低,但搜集比较困难B. 采集数据的成本低,但搜集比较容易C.数据缺乏可靠性D.不适合自己研究的需要2、从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样3、从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()A.重复抽样B.不重复抽样C.分层抽样D.整群抽样4、一个元素被抽中后不再放回总体,然后从所剩下的元素中抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()A.不重复抽样B.重复抽样C.系统抽样D.多阶段抽样5、在抽样之前先将总体的元素划分为若干类,然后从各个类中抽取一定数量的元素组成一个样本,这样的抽样方式称为()A. 简单随机抽样B. 系统抽样C.分层抽样D.整群抽样6、先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。
这样的抽样方式称为()A. 分层抽样B. 简单随机抽样C.系统抽样D.整群抽样7、先将总体划分为若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,这样的抽样方式称为()A. 系统抽样B. 多阶段抽样C.分层抽样D.整群抽样8、为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方是()A. 简单随机抽样B. 整群抽样C.系统抽样D.分层抽样9、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是()A. 系统抽样B. 简单随机抽样C.分层抽样D.整群抽样10、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是?()A.分层抽样B. 整群抽样C.系统抽样D.简单随机抽样11、为了了解女性对某种化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查。
1:各章练习题答案2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:40个企业按产品销售收入分组表按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100~110 110~120 120~130 130~140 140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40 100.0 ————(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
(3)茎叶图如下:65 1 866 1 4 5 6 867 1 3 4 6 7 968 1 1 2 3 3 3 4 5 5 5 8 8 9 969 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 970 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 971 0 0 2 2 3 3 5 6 7 7 8 8 972 0 1 2 2 5 6 7 8 9 973 3 5 674 1 4 72.5 (1)属于数值型数据。
第2章 统计数据的描述-—练习题●2。
解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel 练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积.整理得到频数分布表如下:●13.因为女生的离散系数为V=s x =550=0。
1 男生体重的离散系数为 V=s x =560=0.08 对比可知女生的体重差异较大.(2) 男生:x =602.2公斤公斤=27.27(磅),s =2.25公斤公斤=2.27(磅);女生:x =2.250公斤公斤=22。
73(磅),s =2.25公斤公斤=2.27(磅);(3)68%; (4)95%。
14 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适.离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。
(2)利用Excel 进行计算,得成年组身高的平均数为172.1,标准差为4。
202,从而得:成年组身高的离散系数:024.01.1722.4==s v ; 又得幼儿组身高的平均数为71。
3,标准差为2.497,从而得:幼儿组身高的离散系数: 2.4970.03571.3s v ==; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。
统计学课后题及答案解析王文华
1 、什么是统计学?
答:统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从数据中得出结论的方法,统计所研究的是来自各领域的数据。
数据收集即取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。
2、解释描述统计和推断统计。
答:数据分析所用的方法可分为描述统计方法和推断统计方法。
(1)描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
(2)推断统计是研究如何利用样本数据来推断总体特征的统计方法。
比如,对产品的质量进行检验,往往是破坏性的,不可能对每个产品进行测量。
这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题。
3、统计数据可分为哪几种类型?不同类型的数据各有什么特点?
答:统计数据是对现象进行测量的结果,可以从不同角度对统计数据进行分类:
(1)按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
①在分类数据中,各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺序是可以改变的;
②顺序数据也表现为类别,但这些类别之间是有顺序的;
③数值型数据具有分类数据和顺序数据的特点,并且还可以进行加、减、乘、除运算。
(2)按照统计数据的收集方法,可以将其分为观测数据和实验数据。
①观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物进行人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据;
②实验数据是在实验中通过控制实验对象收集到的数据,自然科学领域的大多数数据都是实验数据。
(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
①截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况;②时间序列数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。