当前位置:文档之家› 统计学基础练习题五

统计学基础练习题五

统计学基础练习题五
统计学基础练习题五

统计学基础练习题五

统计学基础(练习题五)

一、单项选择题

1.在抽样推断中,必须遵循()抽取样本

A、随意原则

B、随机原则

C、可比原

则 D、对等原则

2.相关系数r的取值范围为()

A、(0,1)

B、[-1,1]

C、(-1,1)

D、(-1,0)

3.相关系数r的取值范围为()

A、(0,1)

B、[-1,1]

C、(-1,1)

D、(-1,0)

4.如果变量x和变量y之间的相关系数为-1,

这说明两变量之间是()

A、低度相关关系

B、完全相关

关系

C、高度相关关系

D、完全不相

5.现象之间的相互关系可以归纳为两种类型,

即()

A、相关关系和函数关系

B、相关关系和

因果关系

C、相关关系和随机关系

D、函数关系和

因果关系

6.直线相关系数的绝对值接近1时,说明两变

量相关关系的密切程度是()

A、完全相关

B、微弱相关

C、无线性

相关 D、高度相关

7.相关系数r的取值范围为()

A、-∞

B、-1≦r≦+1

C、

-1

8.当变量x按一定数值变化时,变量y也近似

地按固定数值变化,这表明变量x和变量y之间

存在着()

A、完全相关关系

B、复相关关系

C、直线相关关系

D、没有相关关系

9.一元线性回归模型的参数有()

A、一个

B、两个

C、三个

D、三个以上

10.工人的出勤率与产品合格率之间的相关系数如果等于0.85,可以断定两者是()

A、显著相关

B、高度相关

C、正相关

D、负相关

11. 当自变量x的值增加,因变量y的值也随之增加,两变量之间存在着()

A、曲线相关

B、正相关

C、负相关

D、无相关

12.相关系数的取值范围是()

A、0

B、-1

C、-1≤r≤1

D、-1≤r≤0

13.直线相关系数的绝对值接近于1时,说明两变量相关系数的密切程度是()

A、完全相关

B、微弱相关

C、无线性相关

D、高度相关

14.下面的几个式子中,错误的是()

A、y=40+1.6x r=0.89

B、y=-5-3.8x r=-0.94

C、y=36-2.4x r=0.96

D、y=-36+3.8x r=0.98

15.下列关系中,属于正相关关系的有()

A、合理限度内,施肥量和平均产量之间的关系

B、产品产量与单位产品成本之间的关系

C、商品的流通费用与销售利润之间的关系

D、流通费用率与商品销售量之间的关系

二、多选题在每小题列出的四个备选项中至少

有两个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选、少选或未选均无分。1.下列现象属于相关关系的有()

A、家庭收入与消费支出

B、物价水平与商品供求关系

C、亩产量与施肥关系

D、学号与考试成绩

2.相关系数r的数值()

A、可为正值

B、可为负值

C、可大于

1 D、可等于-1

3.下列属于负相关的现象是()

A、商品流转的规模愈大,流通费用水平越低

B、流通费用率随商品销售额的增加而减少

C、国民收入随投资额的增加而增长

D、生产单位产品所耗工时随劳动生产率的提高而减少

4.抽样调查()

A、是一种非全面调查

B、抽样误差可以事先控制

C、它具有经济性、时效性、准确性和灵活性等特点

D、其调查单位是重点抽取的

5.相关系数r =0.9,这表明现象之间存在着()A、高度相关关系 B、低度相关关系C、低度负相关关系 D、高度正相关关系6.影响抽样误差大小的因素有()

A、抽样调查的组织形式

B、抽取样本单位的方法

c、总体被研究标志的变异程度 D、抽取样本单位数的多少

7.相关分析特点有()

A、相关系数的绝对值介于0和1之间

B、两变量只能算出一个相关系数

C、相关系数有正负号

D、两变量都是随机的

三、判断题

1.当直线相关系数r=0时,说明变量之间不存在

任何相关系数。()

2.在直线回归分析中,两个变量是对等的,不需

要区分因变量和自变量。()

3.当直线相关系数r=0时,说明变量之间不存在

任何相关关系。()

4.在直线回归分析中,两个变量是对等的,不需

要区分因变量和自变量。()

5.定量预测必须以定性预测为基础,定性预测是

定量预测的前提。()

6.如果两个变量的变动分向一致,同时呈上升或

下降趋势,则二者是正相关关系。()

7.判断现象之间是否存在相关关系必须计算相

关系数。()

8.当直线相关系数R=0时,说明变量之间不存在

任何相关关系。()

9.回归分析中计算的估计标准误就是因变量的

标准差。()

10.抽样误差是可以避免的。()

11.如果两个变量的变动方向一致,同时呈上升

或下降趋势,则二者是正相关关系。()12.对无限总体进行调查的最有效、最可行的方

式通常为抽样调查。()

13.回归分析和相关分析一样,所分析的两个变

量一定都是随机变量。()

14.相关系数越大,说明相关程度越高;相关系

数越小,说明相关程度越低。()

15.若直线回归方程yc=170-2.5x,则变量x和

y之间存在负的相关关系。()

16.只有当相关系数接近于+1时,才能说明两

变量之间存在高度相关关系。()

17.假定变量x与y的相关系数为0.8,变量m

与n的相关系数为-0.9,则x与y的相关密切程度高。()

18.回归系数b的符号与相关系数r的符号,可

以相同也可以不同。()

19.由于经济现象发展总是有章可循的,因此,

统计预测是不可能产生失误的。()

20.回归系数b的符号和相关系数γ的符号,可

以相同也可以不相同。()

21.相关系数有正负数之分,负相关系数说明变

量间不存在相关关系。()

22.对无限总体进行调查的最有效、最可行的方

式通常为抽样调查。()

23.抽样调查在抽取样本时必须遵守随机原则。

()

24.相关关系和函数关系都属于完全确定性的

依存关系。()

四、问答题

1.什么是相关关系?它和函数关系有什么不同?

2.相关分析与回归分析有何区别与联系?

3.什么是相关关系?相关关系的特点?

五、计算分析题

1.某班40名学生,按某课程的学习时数每8人为一组进行分组,其对应的学习成绩如下表:

学习

时数

学习成绩(分) 10

40 14

50 20

60 25

70 36 90

试根据上述资料建立学习成绩(y )倚学习时间

(x )的直线回归方程。(要求列表计算所需数据资料,写出公式和计算过程,结果保留两位小数。)

2. 根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下:

(x 代表人均收,y 代表销售额)

∑∑∑∑∑======20700,2740,370,310,40,522y xy x y x n

计算: (1)建立直线回归方程;

(2)若x=400时,试推算Y 的值。

(要求写出公式和计算过程,结果保留两位小数。)

3. 已知:∑∑∑∑∑======1481

,30268,79,426,21,622xy y x

y x n (15分)

要求: (1)计算变量x 与变量y 间的相关系数;

(2) 建立变量y倚变量x 变化的直线回归方程。

(要求写出公式和计算过程,结果保留四位小数。)

4.某地区家计调查资料得到,每户平均年收入为8800元,方差为4500元,每户平均年消费支出为6000元,均方差为60元,支出对于收入的回归系数为0.8

要求: (1)计算收入与支出的相关系数;

(2)拟合支出对于收入的回归方程;

(3)收入每增加1元,支出平均增加多少元。

5.某部门5个企业产品销售额和销售利润资料如下:

企业编号

产品销

售额(万

元)

销售利

润(万

元)

1 430 22.0

2 480 26.5

3 650 40.0

4 950 64.0

5 1000 69.0

试计算产品销售额与利润额的相关系数,并进行分析说明。

(要求列表计算所需数据资料,写出公式和计算过程,结果保留四位小数。)

统计学第五章课后题及答案解析

第五章 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查 B.了解样本的基本情况 C.了解总体的基本情况 D.推断总体指标 2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数 B.总体方差 C.抽样比例 D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大 B.二年级较大 C.误差相同 D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差 B.低估误差 C.恰好相等 D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A.扩大到原来的2倍 B.扩大到原来的4倍 C.缩小到原来的1/4 D.缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样 B.纯随机抽样 C.分层抽样 D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差 B.层内方差 C.总方差 D.允许误差 二、多项选择题 1.抽样推断的特点有() A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题 C.用样本指标来推断总体指标 D.抽样误差可以事先计算 E.抽样误差可以事先控制 2.影响抽样误差的因素有() A.样本容量的大小 B.是有限总体还是无限总体 C.总体单位的标志变动度 D.抽样方法 E.抽样组织方式 3.抽样方法根据取样的方式不同分为() A.重复抽样 B.等距抽样 C.整群抽样 D.分层抽样 E.不重复抽样 4.抽样推断的优良标准是() A.无偏性 B.同质性 C.一致性 D.随机性 E.有效性 5.影响必要样本容量的主要因素有() A.总体方差的大小 B.抽样方法

统计学基础试题

2014-2015学年第一学期《统计学》期复习资料 一、单项选择题 1.下列属于品质标志的有(B )。 A.劳动时间 B.健康状况 C.工资级别 D.劳动生产率 2.标志是说明( A )。 A.总体单位的特征的名称 B.总体单位量的特征的名称 C.总体质的特征的名称 D.总体量的特征的名称 4.调查某乡镇工业企业职工工资情况,则调查对象是( B )。 A.该乡镇全部工业企业 B.该乡镇全部工业企业的职工 C.该乡镇全部工业企业的职工的工资 D.该乡镇工业企业每一名职工的工资 5.对某地区三家不同部门进行某项改革的企业进行调查,以了解某近阶段生产情况和存在问题,以便为今后的普遍推广积累经验,这种调查是( C ) A.普查 B.重点调查 C.典型调查 D.抽样调查 6.按连续型变量分组,第一组为75以下,第二组为75~85,第三组为85~95,第四组为95以上,则数据( A ) A.75在第一组 B.85在第二组 C.85在第三组 D.95在第四组 7.按连续型变量分组,其末组为开口组,下限为2000。已知相邻组的组中值为1750,则末组组中值为( C ) A.2100 B.2200 C.2250 D.2500 第一步: 一般情况下,组中值=(上限+下限)/2 已知相邻组组中值为975,相邻组的上限即为末组的下限1000,即975=(1000+下限)/2 由该公式得到下限=950 所以,相邻组组距=1000-950=50 第二步: 计算开口组的组中值时,只有下限而无上限,则 组中值=下限+相邻组组距/2=1000+50/2=1025 8.在全国医院总体中,医院数(a)、医院医生人数(b)和病床张数(c)三个指标() A.都是总体单位总量 B.a是总体安慰总量,b、c是总体标志总量 C.都是总体标志总量 D.b是总体安慰总量,a、c是总体标志总量 9.某商店计划规定本年费用水平比去年下降4%,实际下降了6%,则该商店费用水平计划完成程度是( A ) A.97.9% B.101.9% C.102.1% D.150% 10.不能全面反映总体各单位标志值变异程度的标志变异指标是() A.平均差 B.标准差系数 C.标准差 D.全距 11.要了解某市工业企业生产设备情况,则统计总体是( )。 A.该市全部工业企业 B.该市每一个工业企业 C.该市工业企业的某一台设备 D.该市所有工业企业的全部生产设备 12.下列情况属于离散变量的是( C )。 A.营业额 B.工龄 C.工厂数D.职工年收入 13.调查问卷中,开放式问题一般应该排在问题的( C )。 A.开头B.中间C.最后D.都可以

《统计学基础》练习

1.“统计”一词的三种涵义是( B )。 A.统计调查统计整理统计分析 B.统计工作统计资料统计科学 C.统计信息统计咨询统计监督 D.统计理论统计方法统计技能 2.社会经济统计的研究对象是(C )。 A、抽象的数量特征和数量关系 B、社会经济现象的规律性 C、社会经济现象的数量特征和数量关系 D、社会经济统计认识过程的规律和方法 3.统计研究的基本方法包括( D )。 A.调查方法汇总方法分析方法 B.调查方法整理方法预测方法 C.相对数法平均数法指数法 D.大量观察法统计分组法综合指标法 4.某工人月工资1000元,则“工资”是( A )。 A.数量标志 B.品质标志 C.质量指标 D.数量指标 5.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A、品质标志 B、数量标志 C、标志值 D、数量指标 6.下述调查属于经常性调查的是()。 A.每隔10年进行一次人口普查 B.对五年来商品价格变动情况进行调查 C.对2000年职称评审结果进行调查 D.按月上报商品销售额 7.统计调查方案中的调查时限是指() A.调查工作的起讫时间 B.搜集资料的时间 C.时期现象资料所属的时间 D.时点现象资料所属的时间 8.某产品在检验和测量时常有破坏性,一般宜采用() A.全面调查 B.典型调查 C.抽样调查 D.重点调查 9.要对某工厂生产设备状况进行调查,则该厂“每一台生产设备”是() A.调查对象 B.调查单位 C.调查项目 D.报告单位 10.统计调查误差的代表性误差() A. 存在于所有的非全面调查中 B.只在典型调查中存在 C. 只在抽样调查中存在 D.只在重点调查中存在 11.抽样调查与典型调查都属于非全面调查,二者的根本区别在于() A.灵活程度不同 B.组织方式不同 C.作用不同 D.选取调查单位的方法不同 12.对医院的医疗设备普查时,每个医院是() A.调查对象 B.调查总体 C.调查单位D.填报单位 13.重点调查中重点单位是指() A、标志总量在总体中占有很大比重的单位 B、具有典型意义或代表性的单位 C、那些具有反映事物属性差异的品质标志的单位 D、能用以推算总体标志总量的单位 14.对某省饮食业从业人员的健康状况进行调查,调查单位是() A.某省饮食业的全部网点 B.某省饮食业的每个网点 C.某省饮食业所有从业人员数 D.某省饮食业每个从业人员 15.统计分组的首要问题是()

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学基础_第五章_动态数列分析

统计学基础第五章动态数列分析 【教学目的】 1.区分不同种类的动态数列 2.熟练掌握计算平均发展水平的各种方法 3.掌握发展速度、增长速度的种类,运用它们之间的数量关系进行动态指标的相互推算 4.理解趋势的意义,运用长期趋势测定方法对长期趋势进行测定 5.计算季节比率,并且深刻理解季节比率的经济含义 【教学重点】 1.总量指标动态数列的种类和特点 2.动态比较指标和动态平均指标的计算 3.动态数列的分析方法 【教学难点】 1.绝对数时间数列中的时点数列平均指标的计算 2.相对数、平均数时间数列动态平均指标的计算 3.动态数列分析方法中的季节变动分析方法 【教学时数】 教学学时为12课时 【教学容参考】 第一节动态数列的意义和种类 一、动态数列的概念 将某一个统计指标在不同时间上的各个数值,按时间先后顺序排列,就形成了一个动态数列,也叫做时间数列。动态数列一般由两个基本要素构成:一是被研究现象所属的时间;二是反映该现象的统计指标数值。 通过编制和分析动态数列,首先可以从现象的量变过程中反映其发展变化的方向、程度和趋势,研究其质量变化的规律性。 其次,通过对动态数列资料的研究,可以对某些社会经济现象进行预测。 第三,利用动态数列,可以在不同地区或国家之间进行对比分析。 编制和分析动态数列具有非常重要的作用,这种方法已成为对社会经济现象进行统计分析的一种重要方法。 【案例】 下面图表列举了我国2004~2007年若干经济指标的动态数列。 表5-1 我国2004-2007年若干经济指标 二、动态数列的种类 按照构成动态数列的基本要素———统计指标的表现形式不同,动态数列可分为绝对数动态数列、相对数动态数列和平均数动态数列三种类型。其中绝对数动态数列是基本的数列,相对数和平均数动态数列是派生数列。

第三版统计学基础练习题部分答案

第一章 1统计数据可分为哪几种类型不同类型的数据各有什么特点 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 2变量分为那几类:分类变量、顺序变量和数值型变量。 3举例说明离散型变量和连续型变量: 离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得. 在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.

练习书上有答案:需注意:用数值表示的属于数值变量。分类选择的属于分类变量。投票选举的属于顺序变量。 第二章: 简述普查和抽样调查的特点: 抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。 特点:第一普查通常是一次性的或周期性的。第二普查一般需要规定统一的调查时间。第三普查的数据一般笔记哦啊准确,规范化程度也较高,因此它可以为抽样调查或其他调查提供基本的依据。第四普查使用范围比较狭窄,只能调查一些最基本的、特定的现象。 调查方案包括哪几方面的内容:调查目的、调查对象和调查单位、调查项目和调查表。 什么是调查问卷:它由哪几部分组成 调查问卷是用来收集调查数据的一种工具,是调查者根据调查目的和要求所涉及的,有一系列问题、备选答案、说明以及码表组成的一种调查形式。结构:开头部分、甄别部分、主体部分和背景部分组成。

现代统计学基础知识测试题

1、一个统计总体() A、只能有一个标志 B、只能有一个指标 C、能够有多个标志 D、能够有多个指标 2、调查某大学2000名学生学习情况,则总体单位是() A 、2000名学生 B、 2000名学生的学习成绩 C、每一名学生 D、每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A、该地所有商业企业 B、该地所有国有商业企业 C、该地每一国有商业企业 D、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A、工业普查 B、工业设备调查 C、职工调查 D、未安装设备调查

5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时刻规定是( )。 A、调查时刻 B、调查期限 C、标准时刻 D、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则() A、50在第一组,70在第四组 B、60在第三组,80在第五组 C、70在第四组,80在第五组 D、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采纳( )

A、简单算术平均法 B、加权算术平均法 C、加权调和平均法 D、几何平均法 8、用水平法检查长期打算完成程度,应规定( ) A、打算期初应达到的水平 B、打算期末应达到的水平 C、打算期中应达到的水平 D、整个打算期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,那个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、进展水平指标 10、时刻序列中,每个指标数值能够相加的是()。 A、相对数时刻序列 B、时期数列 C、间断时点数列 D、平均数时刻序列

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学基础复习题

10级电商《应用统计学》期末复习 一、单选题 1.统计学的研究对象是( A ) A.客观事物的总体数量特征和数量关系 B.统计工作过程 C.总体与样本的关系 D.抽象数量的联系和空间形式 2.按某一标志分组的结果,表现出( A ) A.组内同质性和组间差异性 B.组内差异性和组间差异性 C.组内同质性和组间同质性 D.组内差异性和组间同质性 3.指出下面的数据哪一个属于顺序数据( D ) 个人的年龄分别是25,22,34,41,33 B.性别:男,女 C.上市公司所属行业:金融,房地产,医药,机械制造 D.员工对企业某项改革措施的态度:赞成,中立,反对 4.下列不属于描述统计问题的是( A ) A.根据样本信息对总体进行的推断 B.了解数据分布的特征 C.分析感兴趣的总体特征 D.利用图、表或其他数据汇总工具分析数据 5.我国六次人口普查规定的标准时间是2010年11月1日0时(截止时间),下列情况应计入人口数的是( D ) 年11月2日出生的婴儿 年10月29日21时出生,10月31日23时死亡的婴儿 年10月29日23时死亡的人 年11月1日3时死亡的人 6.某商场2010年空调销售量为10000台,库存年末比年初减少100台,这两个总量指标是( A ) A.时期指标 B.时点指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 7.某企业某年上半年月产量分别为410、420、380、410、420、420万件,则该企业上半年的平均月产量、中位数和众数分别为( A ) 、415、420 、420、420 、420、420 、420、410 8.下列数列中属于时间序列数据的是( B ) 年我国的国内生产总值 年我国的国内生产总值 年底我国的人口数 年10月我国的进口额 9.下列关于相关系数的陈述中哪一个是错误的( A ) A.数值越大说明两个变量之间的关系就越强 B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系 C.只是两个变量之间线性关系的一个度量,并不意味两个变量之间存在因果关系 D.绝对值不会大于1 10.如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加( D ) % % 同时研究居民的消费支出与居民货币收入和消费品价格的数量关系,属于( B ) A.单相关 B.复相关 C.直线回归 D.曲线回归 12.在回归直线$μμ0 1 y x β β=+中,μ1 β表示( C )

统计学基础练习题五

统计学基础(练习题五) 一、单项选择题 1.在抽样推断中,必须遵循()抽取样本 A、随意原则 B、随机原则 C、可比原则 D、对等原则 2.相关系数r的取值范围为() A、(0,1) B、[-1,1] C、(-1,1) D、(-1,0) 3.相关系数r的取值范围为() A、(0,1) B、[-1,1] C、(-1,1) D、(-1,0) 4.如果变量x和变量y之间的相关系数为-1,这说明两变量之间是() A、低度相关关系 B、完全相关关系 C、高度相关关系 D、完全不相关 5.现象之间的相互关系可以归纳为两种类型,即() A、相关关系和函数关系 B、相关关系和因果关系 C、相关关系和随机关系 D、函数关系和因果关系 6.直线相关系数的绝对值接近1时,说明两变量相关关系的密切程度是() A、完全相关 B、微弱相关 C、无线性相关 D、高度相关 7.相关系数r的取值范围为() A、-∞

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学第五章 练习

第五章 一、填空题: 1、时间序列的构成要素包括 和 。 2、绝对数时间序列可以分为 和 两种,序列中不同时间数值相加有实际的意义的是 。 3、设i=1,2,…n , i a 为第i 期发展水平,则1a 称为 ,n a 称为 ,/i a 1 i a 是 , /i a 1a 是 。 4、计算间断时点序列平均发展水平,一般有两个假设条件:假设上期末水平 本期初水平,其二是假设现象在间断期内数量 变化。 5、时间序列的波动可以分解为 、 、循环变动和不规则变动。 6、报告期粮食总产量增加12%,粮食播种面积增加9%,则粮食每亩产量提高 。 二、单项选择题 1、时间序列与变量数列( )。 A 、都是根据时间顺序排列的 B 、都是根据变量值大小排列的 C 、前者根据时间顺序排列的,后者根据变量值大小排列的 D 、前者根据变量值大小排列的,后者根据时间顺序排列的 2、时间序列中,数值大小与时间长短有直接关系的是( )。 A 、时点序列 B 、时期序列 C 、平均数时间序列 D 、相对数序列 3.对时间数列进行动态比较分析和动态平均分析的基础指标是( )。 A 、发展水平 B 、发展速度 C 、平均发展水平 D 、平均发展速度 4、发展速度属于( )。 A 、比例相对数 B 、动态相对数 C 、比较相对数 D 、强度相对数 5、一个动态数列的多个环比增长速度分别为4%、6%、9%,该数列的定基增长速度为( )。 A 、4%×6%×9% B 、 104%×106%×109% C 、(4%×6%×9%)-1 D 、(104%×106%×109%)-1 6、 若各年环比增长速度保持不变,则各年的增长量( )。 A 、逐年增加 B 、逐年减少 C 、保持不变 D 、无法判断

统计学基础

一、单项选择题(共10道小题,共100.0分) 1.在下列调查中.调查单位与填报单位一致的是( )。 A. 公司设备调查 B. 农村耕地调查 C. 学生学习情况调查 D. 汽车养护情况调查 2. 3.在统计调查中,调查标志的承担者是( )。 A. 调查对象 B. 调查单位 C. 填报单位 D. 调查表 4. 5.填报单位( )。 A. 是调查标志的承担者 B. 是负责向上报告调查内容的单位 C. 是构成调查对象的每一单位 D. 即是总体单位 6. 7.变量数列中各组频率之和是( )。 A. 不等于l B. 大于1 C. 小于1 D. 等于l

8. 9. 统计表的结构,从其外形看,是由( )。 A. 标题和数字资料两部分构成 B. 标题、横行、纵栏标目三部分构成 C. 横行和纵栏数字资料构成 D. 标题、横纵、纵栏、数字资料等部分构成 10. 11.有20个工人看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、 4、3、4、6、3、4、 5、2、4,按以上资料编制分配数列,应采用( )。 A. 单项式分组 B. 等距分组 C. 不等距分组 D. 以上几种分组均可 12. 13.某厂劳动生产率计划在去年的基础上提高8%,执行结果仅比去年提高4%, 则劳动生产率的计划完成相对数算式为( )。 A. 4%÷8% B. 8%÷4% C. (100%+4%)÷(100%+8%) D. (1+8%÷1+4%) 14. 15. (错误) 下面属于结构相对指标的是( )。

A. 招生录取率 B. 人均钢产量 C. 轻重工业比例 D. 人均国民收入 16.对全市科技人员进行调查,每位科技人员是总体单位,科技人员的职称是 ( )。 A. 品质标志 B. 变量 C. 变量值 D. 标志值 17. 18.某学生某门课成绩为80分,则该成绩是( )。 A. 品质标志 B. 数量标志 C. 变量 D. 指标 1.设2000~2004年各年的环比增长速度为6%、7%、8%、9%和10%,则平均增长速度为 ( )。 A. B. C.

统计学基础练习题一

统计学基础(练习题一) 一、单项选择题 1.调查某大学5000名学生学习成绩,则总体单位是() A、5000名学生 B、5000名学生的学习成绩 C、每一名学生 D、每一名学生的学习成绩2.下列属于品质标志的是() A、工人年龄 B、工人性别 C、工人体重 D、工人工资等级 3.要了解我国农村经济的具体状况,最适合的调查方式是() A、普查 B、典型调查 C、重点调查 D、抽样调查 4.按连续型变量分组,其末组为开口组,下限为2000,已知相邻组的组中值为1750,则末组的组中值为() A、2500 B、2250 C、 2100 D、2200 5.某商场2007年空调销售量为6500台,库存年末比年初减少100台,这两个总量指标是() A、时期指标 B、时点指标 C、前者是时期指标,后者是时点指标 D、前者是时点指标,后者是时期指标 6.下列标志中属于品质标志的是() A、年龄 B、工龄 C、职业 D、工资 7.在编制组距数列时,影响组数多少的主要因素是() A、组距 B、全距 C、组中值 D、组距和全距 8.下述各项调查属于全面调查的是() A、对某种连续生产的产品质量进行抽样检验 B、对全国钢铁生产中的重点单位进行调查 C、对某地区工业企业设备进行普查 D、抽选部分地块进行农产量调查 9.下列分组中属于按品质标志分组的是() A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组 10.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为() A、230 B、260 C、185 D、215 11.某城市进行工业企业未安装设备普查,个体是() A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 12.几位学生的某门课成绩分别是67分、78分、88分、96分,则“成绩”是() A、品质标志 B、数量标志 C、标志值 D、数量指标

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

《统计学基础知识》试题答案

《统计学基础知识》试题答案 一、单项选择题(以下每小题各有四项备选答案,其中只有一项是正确的。本题共40分,每小题1分。) 1(统计调查方案中的调查工作期限是指( )。 A(调查工作的起止时间 B(搜集资料的时间 C(时期现象资料所属的时间 D(时点现象资料所属的时间 2(有意识地选择几个城乡结合部地区调查外来流动人口在本市的生活状况,这种调查方式属于( )。 A(典型调查 B(重点调查 C(抽样调查 D(普查 3(对职工的生活水平状况进行分组研究,正确地选择分组标志应当用( )。 A(职工月工资总额 B(职工人均月收入额 C(职工家庭成员平均月收入额 D(职工的人均月岗位津贴及奖金数额 4(次数分布中的次数是指( )。 A(划分各组的数量标志 B(分组的组数 C(分布在各组的总体单位数 D(标志变异个数 5(某连续变量分为5组:第一组为40~50,第二组为50~60,第三组为60~70,第四组为70~80,第五组为80以上。依习惯上规定( )。 A(50在第一组,70在第四组 B(60在第二组,80在第五组

C(70在第四组,80在第五组 D(50在第二组,80在第四组 6(一个开口组距数列最大组的下限为600以上,其相邻组的下限为400,则该数列最大组的组中值应为( )。 A(500 B(650 C(700 D(800 7(时点指标的数值( )。 A(与其时间间隔长短无关 B(通常连续登记 C(时间间隔越长,指标数值越大 D(具有可加性 8(一个企业产品销售收入计划增长5,,实际增长9,,则计划超额完成程度为( )。 A(4, B(180, C(103.81, D(3.81, 9(将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为( )。 A(动态相对指标 B(结构相对指标 C(比例相对指标 D(比较相对指标 10(两个总体的平均数相等,标准差不等,若比较两总体平均数的代表性,以下说法正确的是( )。 A(标准差大的,代表性大 B(标准差小的,代表性大 C(标准差小的,代表性小 D(两平均数的代表性相同 11(加权算术平均数中权数的实质是( )。 A(各组的单位数 B(总体单位数 C(各组的单位数占总体单位数的比重

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

统计学基础模拟试题B卷答案

)

A.样本单位数 B.估计值 C.抽样误差范围 D.概率保证程度 D.抽样平均误差 4.指出下面的数列那些属于时点数列( ADE)。 A.某种股票周一至周五隔天的收盘价 B.某工厂个月份的利润额 C.某地区2005-2009年的各年平均人口数 D.某商店各月末的商品库存额 E.某企业2005年-2009年年末固定资产净值 三、判断题 1.统计一词包含统计工作、统计资料、统计学等三种含义。(√) 2.调查单位和填报单位在任何情况下都不一致。(×) 3.统计分组的关键问题是确定分组标志。(√) 4.置信概率表达了区间估计的可靠性。(√) 5.如果变量X的数量减少,变量Y的数值也随之减少,则称两个变量为负相关。(×) 四、填空题 1.统计指标按其反映的数量特点不同可以分为数量指标和质量指标。 2.统计调查根据被研究总体的范围分为全面调查和非全面调查。 3.在对数据进行分组时,如果将一个变量值作为一组称为单项式分组;如果把某一区间的变量值作为一组则称为组距式分组。 4.总量指标按其反映现象总体内容的不同可分为总体单位总量和总体标志总量。 5.总指数的计算方法有综合指数和平均数指数两种。 五、简答题 1.调查对象、调查单位和填报单位有何区别? 答: 调查对象是应搜集其资料的许多单位的总体; 调查单位是构成调查对象的每一个单位,它是进行登记的标志的承担者; 报告单位也就填报单位,它是提交调查资料的单位,一般是基层企事业组织。 2.一般情况下,怎样根据经济内容确定综合指数中同度量因素的所属时期? 答: (1)编制质量指标综合指数,作为同度量因素的数量指标固定在计算期上。 (2)编制数量指标综合指标,作为同度量因素的质量指标固定在基期上。 (3)上述确定方法不是固定不变的。

统计学思考题

第一章导论 1、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。按照统计数据 的收集方法,可以将其分为观测数据和实验数据。按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。现实中处理的大多数都是数值型数据。 2、解释分类数据、顺序数据和数值数据的意义。 对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合 样本:是从总体中抽出的一部分元素的集合。如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。样本统计量通常用英文字母来表示。如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。 变量:是说明现象某种特征的概念。如,商品销售额,受教育程度,产品的质量等级等。 4、变量可分为哪几类? 变量可以分为分类变量、顺序变量、数值型变量,数值型变量根据其取值的不同,又可分为离散型变量和连续型变量。分类变量是说明事物类别的一个名称,顺序变量是说明事物有序类别的一个名称,数值型变量是说明事物数字特征的一个名称。 5、举例说明离散型变量和连续性变量。 离散型变量是只能取可数值的变量,只能取有限个值,而且其取值都以整位数断开,可以一一列举,如,企业量,产品数量;连续型变量是可以在一个或多个区间中取任何值的变量。它的取值是连续不断的,不 能一一列举,如,年龄,温度,零件尺寸的误差等。 第二章数据的搜集 1、比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样也称随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,抽样时是按一定的概率以随机抽样原则抽取样本;其次,每个单位被抽中的概率是已知的,或是可以计算出来的;最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 如果调查的目的在于掌握研究对象总体的数量特征,根据调查的结果对总体参数进行评估,得到总体参数的置信区间,就应当采用概率抽样的方法。非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。非抽样调查也适合市场调查中概念测试,如产品包装测试、广告测试等。第三章数据的图表表示 1、分类数据和顺序数据的整理和图示方法各有那些? 分类数据的整理方法有频数和频数分布,图示方法有条形图、帕累托图、饼图、环形图;顺序数据的整理方法有累积频数和累积频率,图示方法有累积频数分布和频率图。 2、数值型数据的分组方法有哪些?简述组距分组的步骤。 数据分组的方法有单变量值分组和组距分组。 组距分组的步骤:(1)确定组数,一般数据所分组数不应少于5组且不多于15组;(2)确定各组的组距,组距=(最大值-最小值)/组数,组距宜取5或10的倍数;(3)确定上下限,第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。 3、直方图与条形图有何区别? 直方图与条形图不同。首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章数据的概括性变量 1、一组数据的分布特征可以从那几个方面进行测度? 一组数据的分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2、对于比率数据的平均为什么采用几何平均? 3、简述众数、中位数、和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜采用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。 平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等时,这时则应选择平均数作为集中趋势的测度值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。 4、为什么要计算离散系数? 方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。 离散系数也成为变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v s=s/(x-bar),离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说 明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 第五章参数估计 1、怎样理解置信区间? 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限,由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。 2、解释95%的置信区间 如果抽取了许多不同的样本,比如说抽取了100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例成为置信水平,也称为置信度或置信系数。 第六章假设检验 1、什么是假设检验中的显著性水平?统计显著是什么意思? 通常把(a-er-fa)称为显著性水平,显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01. 2、什么是假设检验中的两类错误? 对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。当然,这是依据样本提供的信息进行判断的,也就是由部分来推断,总体。因而判断有可能正确,也有可能错误,也就是说,我们面临着犯错误的可能。所犯的错误有两种类型,第一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用(a-er-fa)表示所以成为其真错误;第二类错误是原假设为伪我们却没有拒绝,犯这类错误的概率用(bei-ta)表示,所以成为取伪错误。 3、解释假设检验中的P值。 P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。 第七章方差分析 1、什么是方差分析?它研究的是什么? 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型隐变量是否有显著影响。 方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。 2、简述方差分析的基本思想。 为了研究分类型自变量对对数值型因变量的影响,需要从对数据误差来源的分析入手,误差主要分为组内误差和组间误差,组内误差只包含随机误差,而组间误差除了包含随机误差,还会包含系统误差。3、解释组内误差和组间误差的含义。 组内误差(SSE):反映组内误差大小的平方和,也称为残差平方和,是由于抽样的随机性所造成的随机误差。它反映了每个样本内各观测值之间的离散状况。 组间误差(SSA):反映组间误差大小的平方和,也称为因素平方和,是随机误差和系统误差的总和。它反映了样本均值之间的差异程度。 4、解释则内方差和组间方差的含义。 组间误差和组内误差经过平均后的数值称为均方或方差。 组间方差(MSA)=组间平方和/自由度(SSA/k-1) 组内误差(MSE)=组内平方和/自由度(SSE/n-k) 5、简述方差分析的基本步骤。 1、提出假设; 2、构造检验的统计量;(1)计算各样本的均值(2)计算全部观测值的总均值(3)计算各误差平方和(4)计算统计量 3、统计决策; 4、方差分析表; 5、用Excel进行方差分析。 第八章一元线性回归 1、解释相关关系的含义,说明相关系的特点。 相关关系1)变量间关系不能用函数关系精确表达;2)一个变量的取值不能由另一个变量唯一确定;3)当变量x 取某个值时,变量y 的取值可能有几个。 2、相关分析主要解决那些问题? 相关分析就是对两个变量之间线性关系的描述和度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本之间的变量关系是否能代表总体变量之间的关系? 3、解释回归模型、回归方程、估计的回归方程的含义。 回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程。 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。 估计的回归方程:根据样本数据求出的回归方程的估计。 4、解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的联系。 总平方和(SST):是全部观测值Xij与总均值x-两bar的误差平方和。 残差平方和(SSE):反映组内误差大小的平方和。 回归平方和(SSR):反映了y的总变差中由于x与y之间的线性关系引起的y的变化部分。 SST=SSR+SSE 5、解释判定系数(R2)的含义和作用。 含义:判定系数是对估计的回归方程拟合优度的度量。判定系数等于相关系数的平方,即r2=(r)2 作用:反映回归直线的拟合程度;R2越接近1,说明回归方程拟合的越好;R2越接近0,说明回归方程拟合的越差。 6、在回归分析中,F检验和t检验各有什么作用? F检验是检验自变量和因变量之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y= 来表示。 t检验的显著性检验是要检验自变量对因变量的影响是否显著。在一元线性回归模型y= 中,如果白塔1=0,则回归线是一条水平线,表面因变量y的取值不依赖与自变量x,即两个变量之间没有线性关系。 7、简述线性关系检验和回归系数检验的具体步骤。 线性关系检验:1、提出假设,H0:回归系数等于0,两个变量之间的线性关系不显著;2、计算检验统计量F=(SSR/1)/(SSE/(n-2));3、做出决策,根据显著性水平,分子自由度和分母自由度查F分布表,找到相应的临界值,比较与F的大小,判断是否拒绝原假设 回归系数检验:1、提出检验;2、计算检验统计量t;3、做出决策

相关主题
文本预览
相关文档 最新文档