贾俊平《统计学》章节题库(含考研真题)(导论)【圣才出品】
- 格式:pdf
- 大小:874.10 KB
- 文档页数:18
第2章 数据的搜集一、单项选择题1.二手数据的特点是( )。
A.采集数据的成本低,但搜集比较困难B.采集数据的成本低,搜集比较容易C.数据缺乏可靠性D.不适合自己研究的需要【答案】B【解析】二手数据是指与研究相关的原信息已经存在,只是对原信息重新加工、整理,使之成为进行统计分析可以使用的数据。
二手数据具有搜集方便、数据采集快、采集成本低等优点,但是得到的数据往往缺乏相关性。
2.从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为( )。
A.简单随机抽样B.分层抽样C.系统抽样D.整群抽样【答案】A【解析】分层抽样也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。
系统抽样也称等距抽样,先将总体各素,直至抽取n个元素组成一个样本。
整群抽样是指先将总体划分成若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,再对抽中的每个群总包含的所有元素进行观察。
3.从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为( )。
A.重复抽样B.不重复抽样C.分层抽样D.整群抽样【答案】A【解析】重复抽样又称放回式抽样,是指每次从总体中抽取的样本单位,经检验之后又重新放回总体,参加下次抽样,这种抽样的特点是总体中每个样本单位被抽中的概率是相等的。
4.一个元素被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元素,直到抽取”个元素为止,这样的抽样方法称为( )。
A.重复抽样B.不重复抽样C.分层抽样D.整群抽样【解析】不重复抽样亦称不放回抽样,是指每次从总体中抽取的样本单位,经检验之后不再放回总体,在下次抽样时不会再次抽到前面已抽中过的样品单位。
总体每经一次抽样,其样本单位数就减少一个,因此每个样品单位在各次抽样中被抽中的概率是不同的。
5.在抽样之前先将总体的元素划分为若干类,然后从各个类中抽取一定数量的元素组成一个样本,这样的抽样方式称为( )。
第1章导论一、思考题1.什么是统计学?答:统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从数据中得出结论的方法,统计研究的是来自各领域的数据。
数据收集也就是取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。
2.解释描述统计和推断统计。
答:数据分析所用的方法可分为描述统计方法和推断统计方法。
(1)描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
(2)推断统计是研究如何利用样本数据来推断总体特征的统计方法。
比如,对产品的质量进行检验,往往是破坏性的,不可能对每个产品进行测量。
这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?答:统计数据是对现象进行测量的结果,可以从不同角度对统计数据进行分类:(1)按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
①在分类数据中,各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺序是可以改变的;②顺序数据也表现为类别,但这些类别之间是可以比较顺序的;③数值型数据具有分类数据和顺序数据的特点,并且还可以进行加、减、乘、除运算。
(2)按照统计数据的收集方法,可以将其分为观测数据和实验数据。
①观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据;②实验数据则是在实验中控制实验对象而收集到的数据,自然科学领域的大多数数据都为实验数据;(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
①截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况;②时间序列数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于所描述现象随时间变化的情况。
【关键字】单位《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
这里的“月收入”是()A.分类变量B.顺序变量C.数值型变量D.离散变量7.要反映我国工业企业的整体业绩水平,总体单位是()A.我国每一家工业企业B.我国所有工业企业C.我国工业企业总数D.我国工业企业的利润总额8.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这里的参数是()A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均消费额D.1000个消费者的平均消费额9.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A.分类数据B.顺序数据C.截面数据D.时间序列数据10.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。
第1章导论一、单项选择题1.在抽样推断中,总体参数是一个()。
[中央财经大学2018研]A.随机变量B.已知的量C.统计量D.确定的量【答案】D【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。
2.统计年鉴中2016年全国各大城市的人均家庭收入数据属于()。
[中央财经大学2018研]A.定类数据B.定序数据C.截面数据D.时间序列数据【答案】C【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。
比如,2010年我国各地区的国内生产总值就是截面数据。
时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
比如2010~2012年我国的国内生产总值就是时间序列数据。
3.在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是()。
[浙江工商大学2017研]A.品质标志B.数量标志C.标志值D.数量指标【答案】A【解析】“等级”属于顺序数据,只能用文字来描述,因此是品质标志,其标志值为“优秀”“良好”“及格”。
4.下面不属于描述统计问题的是()。
[山东大学2015研]A.根据样本信息对总体进行的推断B.了解数据分布的特征顺序数据C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
BCD三项都是描述统计问题。
A项中根据样本信息对总体进行推断则是推断统计内容。
5.一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。
调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。
第6章统计量及其抽样分布一、单项选择题1.在抽样推断中,样本统计量是()。
[中央财经大学2015研]A.未知但确定的量B.一个已知的量C.随机变量D.惟一的【答案】C【解析】统计量是用来描述样本特征的概括性数字度量。
它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,是随机变量。
2.在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。
如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本均值的分布服从()。
[山东大学2015研]A.正态分布,均值为12分钟,标准差为0.3分钟B.正态分布,均值为12分钟,标准差为3分钟C.左偏分布,均值为12分钟,标准差为3分钟D.左偏分布,均值为12分钟,标准差为0.3分钟【答案】A【解析】中心极限定理:设从均值为μ、方差为σ2(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大(通常是大于36)时,样本均值X 的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布。
故即使总体是左偏分布,该样本均值仍服从正态分布,其均值为12,标准差为3/10=0.3。
3.设总体X ~N (2,σ2),X 1,…,X 16是来自总体X 的样本,161116i i X X ==∑,则48X σ-服从的分布是( )。
[对外经济贸易大学2015研]A .t (15)B .t (16)C .χ2(15)D .N (0,1)【答案】D【解析】由题可知样本均值2~(2,)16X N σ则 ()2/4~01X N -,σ即()18~04N X -,σ4.1000名学生参加某课程的考试,平均成绩是82分,标准差是8分,从学生中随机抽取100个同学作为样本,则样本均值的数学期望和抽样分布的标准差分别为()。
[华中农业大学2015研]A.82,8B.82,0.8C.82,64D.86,1【答案】B【解析】由中心极限定理得,在大样本条件下,样本均值X的抽样分布近似服从均值为μ方差为σ2/n的正态分布。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】第12章多元线性回归12.1 考点归纳【知识框架】【考点提⽰】(1)多元线性回归模型,包括回归模型的基本假定(简答题考点),最⼩⼆乘估计(选择题、计算题考点);(2)回归模型的拟合优度评价(简答题、计算题考点);(3)显著性检验(计算题考点);(4)多重共线性的含义、产⽣的问题、判别及处理⽅式(简答题考点)。
【核⼼考点】考点⼀:多元线性回归模型1.回归模型假定(1)E (ε)=0;(2)D (ε)=σ2;(3)()2cov ,0i j i j i j σεε?==?≠?2.参数的最⼩⼆乘估计使残差平⽅和Q =∑(y i -y ∧i )2=∑(y ∧i =β∧0-β∧1x 1-β∧2x 2-…-β∧k x k )2达到最⼩的β∧0,β∧1,β∧2,…,β∧k 。
由此可以得到求解β∧0,β∧1,β∧2,…,β∧k 的标准⽅程组为:00?0?00,1,2,,i i ββi ββQ βQ i k β==??===???多元线性回归的最⼩⼆乘估计是最优线性⽆偏估计。
考点⼆:回归⽅程的拟合优度表12-1 多元线性回归⽅程的评价【提⽰】实际应⽤中,采⽤调整的判定系数来评价多元回归⽅程的拟合优度。
【真题精选】多元线性回归模型的调整的多重判定系数取值范围在0⾄1之间。
[对外经济贸易⼤学2018研]【答案】√【解析】多重判定系数R2=SSR/SST是多元回归中的回归平⽅和占总平⽅和的⽐例,它是度量多元回归⽅程拟合程度的⼀个统计量,反映了在因变量y的变差中被估计的回归⽅程所解释的⽐例,取值为0~1。
调整的多重判定系数R a2与多重判定系数R2不同之处在于:R a2同时考虑了样本量n和模型中⾃变量的个数k的影响,这就使得R a2的值永远⼩于R2,⽽且R a2的值不会由于模型中⾃变量个数的增加⽽越来越接近1,因此R a2的取值也为0~1。
第1章 导 论一、单项选择题1.指出下面的变量哪一个属于分类变量?( )A.年龄B.工资C.汽车产量D.购买商品时的支付方式(现金、信用卡、支票)【答案】D【解析】分类变量是指观测结果表现为某种类别的变量。
题中D项购买商品时的支付方式分为三类:现金、信用卡和支票,因此属于分类变量。
ABC三项均属于数值型变量。
2.指出下面的变量哪一个属于顺序变量?( )A.年龄B.工资C.汽车产量D.员工对企业某项改革措施的态度(赞成、中立、反对)【答案】D【解析】顺序变量又称为有序分类变量,观测结果表现为某种有序类别的变量。
C项员工对企业某项改革措施的态度按顺序依次表现为:赞成、中立、反对三种,因此属于顺序变量。
ABD三项均属于数值型变量。
3.指出下面的变量哪一个属于数值型变量?( )A.年龄B.性别C.企业类型D.员工对企业某项改革措施的态度(赞成、中立、反对)【答案】A【解析】数值型变量又称为定量变量,观测结果表现为数字的变量。
A项生活费支出的观测结果表现为数字的变量,因此为数值型变量。
BD项均为顺序变量,C项为分类变量。
4.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的总体是( )。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入【答案】B【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。
题中的总体为200万个家庭。
5.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的样本是( )。
B.200万个家庭C.2000个家庭的总收入D.200万个家庭的人均收入【答案】A【解析】样本是指从总体中抽取的一部分元素的集合。
题中的样本为2000个家庭。
6.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
第1章导论
一、单项选择题
1.在抽样推断中,总体参数是一个()。
[中央财经大学2018研]
A.随机变量
B.已知的量
C.统计量
D.确定的量
【答案】D
【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。
由于总体数据通常是不知道的,所以参数是一个未知的确定的常数。
2.统计年鉴中2016年全国各大城市的人均家庭收入数据属于()。
[中央财经大学2018研]
A.定类数据
B.定序数据
C.截面数据
D.时间序列数据
【答案】C
【解析】按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数
据。
截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。
比如,2010年我国各地区的国内生产总值就是截面数据。
时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
比如2010~2012年我国的国内生产总值就是时间序列数据。
3.在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是()。
[浙江工商大学2017研]
A.品质标志
B.数量标志
C.标志值
D.数量指标
【答案】A
【解析】“等级”属于顺序数据,只能用文字来描述,因此是品质标志,其标志值为“优秀”“良好”“及格”。
4.下面不属于描述统计问题的是()。
[山东大学2015研]
A.根据样本信息对总体进行的推断
B.了解数据分布的特征顺序数据
C.分析感兴趣的总体特征
D.利用图、表或其他数据汇总工具分析数据
【答案】A
【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
BCD三项都是描述统计问题。
A项中根据样本信息对总体进行推断则是推断统计内容。
5.一项民意调查的目的是想确定年轻人愿意与其父母讨论的话题。
调查结果表明:45%的年轻人愿意与其父母讨论家庭财务状况,38%的年轻人愿意与其父母讨论有关教育的话题,15%的年轻人愿意与其父母讨论爱情问题。
该调查所收集的数据是()。
[山东大学2015研]
A.分类数据
B.顺序数据
C.数值型数据
D.实验数据
【答案】A
【解析】分类数据是指只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
实验数据是在实验中控制实验对象而收集到的数据,观测数据是通过调查或观测而收集到的数据,故该调查所搜集的数据为观测数据而非实验数据。
6.数据分析的真正目的是()。
[重庆大学2013研]
A.心目中有了某种结论性的东西,然后去找一些统计数据来支持已有的结论
B.是为统计服务的,使统计变得完美无缺
C.从数据中找出规律,从数据中寻找启发,得出结论
D.是研究如何利用样本数据来推断总体特征,为决策者提供一个科学的依据
【答案】C
【解析】数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。
7.根据人的性别特征将人口划分为男性和女性两类,所采用的测度计量尺度是()。
[中央财经大学2012研]
A.名义尺度
B.顺序尺度
C.差距尺度
D.比例尺度
【答案】A
【解析】数据的测量尺度有四种:①分类尺度,即名义尺度。
按照事物的某种属性对其进行平行的分类,数据表现为类别,如“性别”。
②顺序尺度。
对事物类别顺序的测度,数据表现为有序的类别,如“产品登记”“受教育程度”。
③差距尺度。
对事物类别或次序之间间距的测度,没有绝对零点,数据表现为数字。
④比例尺度。
对事物类别或次序之间间距的测度,有绝对零点,数据表现为数字。
8.以下关于参数和统计量的说法正确的是()。
[中央财经大学2011研]
A.总体参数是随机变量
B.样本统计量都是总体参数的无偏估计量
C.对一个总体参数进行估计时,统计量的表达式是唯一的
D.样本统计量是随机变量
【答案】D
【解析】参数是用来描述总体特征的概括性数字度量,研究者所关心的参数通常有总体平均数、总体标准差、总体比例等,由于总体数据通常是不知道的,所以参数是一个未知的常数。
无偏性是指估计量抽样分布的数学期望等于被估计的总体参数,并非所有的估计量都具有无偏性。
对总体参数进行估计时,用不同估计方法得到的估计量可能不同。
统计量是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,是随机变量。
9.以下哪一种情形涉及定性数据的收集?()[中山大学2012研]
A.质量控制工程师测量电灯泡的寿命
B.社会学家通过抽样调查来估计广州市市民的平均年收入
C.运动器材厂家在区分各大俱乐部棒球选手是左撇子还是右撇子时做的调查
D.婚礼策划公司通过抽样调查来估计上海市市民举办婚礼的平均开销
【答案】C
【解析】分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
10.研究如何利用样本数据来推断总体特征的统计学方法是()。
[中央财经大学2012研]
A.描述统计
B.理论统计
C.推断统计
D.应用统计
【答案】C
【解析】统计学主要分为描述统计学和推断统计学。
描述统计是指描绘(describe)或总结(summarize)观察量基本情况的统计总称。
推断统计是研究如何利用样本数据来推断总体特征的统计方法。
11.下面变量中属于顺序变量的是()。
[中央财经大学2012研]
A.职业
B.产品产量
C.年龄
D.产品等级
【答案】D
【解析】顺序变量是说明事物有序类别的一个名称,其取值是顺序数据。
它不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
12.制定一个完整的统计调查方案,不包括()。
[中央财经大学2012研]
A.确定调查目的
B.明确调查对象和调查单位
C.选择调查方式方法
D.确定调查结果的公布时间
【答案】D
【解析】统计调查方案的主要内容包括:调查目的、调查的对象和调查单位、调查表、。