当前位置:文档之家› 统计学练习题

统计学练习题

统计学练习题
统计学练习题

《统计学》练习题

一、选择题

1、根据样本计算的用于描述总体特征的度量工具(如均值)被称为( D )。

A、参数

B、总体

C、样本

D、统计量

2、下列属于分类变量的是( D )。

A、年龄

B、工资

C、产量

D、性别

3、为了估计某城市中拥有私家车的家庭比例,随机抽取500个家庭,得到拥有私家车的家庭比例为30%,这里的30%是(B)。

A、参数值

B、统计量的值

C、样本量

D、统计量

4、抽样调查不可避免的误差是( B )。

A、系统性误差

B、偶然性误差

C、观察性误差

D、登记性误差

5、下列关于抽样误差的说法,正确的是( B )。

A、抽样误差是针对某个具体样本的检测结果与总体结果的差异而言

B、样本容量N越大,抽样误差越小

C、总体的变异度越大,抽样误差越小

D、抽样误差可控制,也可避免

6、不适用于顺序尺度的统计量是( D )。

A、频率

B、众数

C、中位数

D、均值

7、描述定性数据的两种最常用的图示法是( A )。

A、条形图和饼图

B、散点图和饼图

C、散点图和条形图

D、条形图和茎叶图

8、下列图形中,适合描述顺序数据的是( D )。

A、直方图

B、茎叶图

C、箱线图

D、环形图

9、对连续变量或变量值较多的离散变量分组是,通常采用的分组方法是(B)。

A、单项式分组

B、组距式分组

C、等距分组

D、异距分组

10、为了描述身高与体重的依存关系,适合采用的图形是( B )。

A、直方图

B、散点图

C、箱线图

D、雷达图

11、在对几组数据的离散程度进行比较时使用的统计量通常是( D )。

A、异众比率

B、平均差

C、标准差

D、离散系数

12、当观察数据偏斜程度较大时,应该选用( D )测度数据的集中趋势。

A、均值

B、标准差

C、变异系数

D、中位数

13、从一个均值=20,标准差=的总体中随机抽取n=36的样本。假定该总体并不是很偏,则样本均值小于的近似概率为( B )。

A、B、C、D、

14、从一个均值为60,标准差为8的总体里随机抽查容量n=100的样本,则样本均值和抽样分布的标准误差分别为( B )。

A、60,8

B、60 ,

C、,8

D、,

15、对于非正态总体,在大样本条件下,估计总体均值使用的分布是( A )。

A、正态分布

B、t分布

C、 2分布

D、F分布

16、一个估计量的有效性是( D )。

A 、该估计量的数学期望等于被估计的总体参数 C 、该估计量的方差比其他估计量的大

B 、该估计量一个具体数值等于被估计的总体参数 D 、该估计量的方差比其他估计量的小 17、为调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排序后,每隔50名学生抽取一名学生进行调查,这种调查方法是(

C )。

A 、简单随机抽样

B 、整群抽样

C 、系统抽样

D 、分层抽样 18、在下列叙述中,错误的是( C )。

A 、样本均值的抽样分布是从总体中抽取特定容量样本的所有样本均值的分布

B 、样本统计量是对样本的一种数量描述

C 、参数是对总体的一种数量描述,它的值总是已知的

D 、样本均值的期望值等于总体均值

19、以样本均值为估计量对总体均值进行区间估计,且总体方差已知,则下列说法正确的是( A )。 A 、95%的置信区间比90%的置信区间宽 B 、样本容量较小的置信区间较小 C 、相同置信水平下,样本容量大的置信区间大 D 、样本均值越小,区间越大

20、抽取一个容量为100的随机样本,其均值-

x =81,标准差s=12,总体均值μ的95%的置信区间为( B )。 A 、8197.1± B 、8135.2± C 、8110.3± D 、8152.3±

21、根据某校学生周上网时间的一个样本,用99%的置信水平构造的该校学生周上网时间的置信区间为~小时,则全校学生的周上网时间( D )。

A 、肯定在这一区间内

B 、有99%的可能性在这一区间内

C 、有1%的可能性在这一区间内

D 、可能在这一区间内,也可能不在这一区间内

22、某地区的写字楼月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的允许误差为25元,则应抽取的样本容量是( B )。

A 、100

B 、110

C 、120

D 、130

23、研究者想收集证据予以支持的假设通常称为( B )。

A 、原假设

B 、备择假设

C 、合理假设

D 、正常假设

24、消费者协会针对消费者对某种品牌的A 玩具铅含量超标的投诉的回应是没有证据表明该玩具铅超标,则在该假设检验中消费者协会提出的备择假设内容为( A )。

A 、该品牌的所有A 玩具铅含量超标

B 、该品牌的所有A 玩具铅含量不超标

C 、被抽检的A 玩具铅含量不超标

D 、无法确定 25、在假设检验中,P 值越小,则( B )。

A 、拒绝原假设的可能性越小

B 、拒绝原假设的可能性越大

C 、拒绝备择假设的可能性越大

D 、不拒绝备择假设的可能性越小 26、在一次假设检验中。当显着性水平01.0=α

原假设被拒绝时,则用05.0=α时( A )

。 A 、一定会被拒绝 B 、一定不会被拒绝 C 、需要重新检验 D 、有可能拒绝原假设 27、Z C

设为检验统计量的计算值,检验假设为

H o

:μ≤μ0,H o :μ>μ0,当Z

C

=时,计算出的P 值

为( A )。

A 、

B 、

C 、

D 、

28、在单因素方差分析中,若SST=20,SSE=10,K=4,N=20,则统计量F 值为( C )。 A 、2 B 、 C 、 D 、

29、在单因素方差分析中,F 统计量分子与分母自由度分别为( C )。 A 、k-1, n B 、k-1, n-1 C 、k-1, n--k D 、n-k, k-1

30、在方差分析中,进行多重比较的前提是( A )。

A 、拒绝原假设

B 、不拒绝原假设

C 、可以拒绝原假设,也可以不拒绝原假设

D 、各样本均值相等 31、在回归模型

i i i y x αβμ=++ 中,β

反映的是( B )。

A 、由于x 的变化引起的y 的线性变化部分

B 、由于x 的变化引起的y 平均的变化部分

C 、由于y 的变化引起的x 的线性变化部分

D 、由于y 的变化引起的x 的线性变化部分 32、在一元回归中,作了t 检验后再作F 检验( B )。

A 、无意义

B 、与t 检验的结论相同

C 、与t 检验的结论不同

D 、与可决系数的结论不同

33、利用估计回归方程进行区间估计时,关于置信区间与预测区间(置信度,样本量n ,自变量值相同),下列说法正确的是( B )。

A 、置信区间比预测区间宽

B 、预测区间比置信区间宽

C 、两者一样宽

D 、不一定 34、对一元线性回归模型,以s

e

表示估计标准误差,r 表示样本相关系数,则( D )。

A 、s e

=0时,r=1 B 、s

e

=0时,r=-1 C 、

s

e

=0时,r=1 D 、

s

e

=0时,r=1或-1

35、对多个总体的方差进行检验时,进行方差分析所构造的统计量F 是( D )。

A 、SSE

SSA

B 、 MSE

SSA

C 、SSE

MSA

D 、MSE

MSA

36、由最小二乘法拟合回归方程的数学依据是,满足因变量( D )。

A 、平均值与其估计值的离差平方之和最小

B 、实际值与其平均值的离差平方之和最小

C 、实际值与其估计值的离差之和为0

D 、实际值与其估计值的离差平方之和最小 37、在应用过程中发现,若对回归模型增加一个解释变量,多重可决系数

R 2

一般会( B )

A 、减少

B 、增加

C 、不变

D 、不能确定 38、在多元回归分析中,多重共线性是指模型中( A )。

A 、两个或两个以上的自变量彼此相关

B 、两个或两个以上的自变量彼此无关

C 、因变量与一个自变量相关

D 、因变量与两个或两个以上的自变量相关 39、根据可决系数与F 统计量的变化关系可知,当

12

=R

,有( D )

。 A 、F=1 B 、F=-1 C 、F=0 D 、F=∞

40、在n=45,的一组样本估计的线性回归模型中,包括4个解释变量,若计算的多重相关系数为,则调整后的多重相关系数为( B )。

A 、

B 、

C 、

D 、

二、问答题

1、怎样理解描述统计学和推断统计学在探索数量规律性方面的不同之处

描述统计学主要包括利用获得的数据,绘制统计图,并计算一些数字特征值;

推断统计学主要包括利用获得的样本数据,进行区间统计、假设检验、回归分析、方差分析、时间序列分析等;

总而言之,描述统计学只是了解数据的现状,而推断统计学则要基于现有数据进行预测。

2、数据的计量尺度分为哪几种不同计量尺度各有什么特点

定类尺度:是测量尺度中层次最低的计量尺度,按照某种属性把事物进行分类,可以用定类尺度来度量性别、品牌类型等对象;

定序尺度:具有定类尺度的一切特征,同时还能反映出类别之间的等级,即不仅能把事物分成不同的类别,而且不同类别之间还能进行排序;

定距尺度:在定序尺度的基础上,对事物类别或者次序之间间距的测度,没有绝对零点,可以进行加减运算。

定比尺度:也称比率尺度,是最高层次的度量尺度,有绝对零点,除了可以分类、比较大小及加减运算外,还可以进行乘除运算,计量测度值之间的比值。

3、试描述数据集中趋势的测度指标并简要分析指标特征(至少五个)

算术平均数:分为简单算术平均数和加权算术平均数,前者根据原始数据直接计算平均值,后者所依据的数据是经过一定整理的,即是根据一定规则分组的;

几何平均数:是n个变量值连乘积的n次方根,常用G表示,分为简单几何平均数和加权几何平均数;

调和平均数:根据变量值的倒是计算,也叫倒数平均数,是均值的一种重要的表现形式,用字母Hm 表示,分为简单调和平均数和加权调和平均数;

中位数:度量数据集中趋势额另一重要测度,是一组数据按数值大小从小到大排序后,处于中点位置的变量,通常用Me表示,是一个位置代表值,不受极端变量值影响;

众数:是一组数据中出现次数最多的变量的值,不受极端值的影响,同时也可用于数值型数据,不能用于分类数据数值的确定。

4、怎样理解算术均值在统计学的重要地位

算数均值在统计学中具有重要地位,它是进行统计分析和统计推断的基础,首先,从统计思想上看,均是一组数据的重心所在,是数据误差相互抵消后的必然结果,其次,均值是有一些重要的数学性质,这些数学性质在实际中有着广泛的应用,许多统计分析都来源于这些性质,同时也体现了均值的统计思想。

5、茎叶图与直方图相比有什么优点它们的应用场合是什么

直方图作为传统数据整理方法,其局限性表现为整理后就损失了原始数据的信息;

而茎叶图是探索性数据分析统计,即直接描述和分析未分组的原始数据,直观地描述了原始数据的分布特点,并能根据数据的特点,选择适当的分析工具探索数据的内在数量规律,有助于用户思考对数据进一步分析的方案,既保留了数据的原始信息,又为准确计算均值等提供了方便和可能,通过茎叶图可以看出数据的分布形状以及数据的离散状况;

直方图通常用于大批量数据,而茎叶图通常适用于小批量数据。

6、一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的人回答他们的消费支出方式是用信用卡。请回答一下问题:

(1)这一研究的总体是什么

(2)月收入是哪一类计量尺度的变量

(3)消费支出方式是哪一类计量尺度的变量

(4)这一研究涉及截面数据还是时间序列数据

(1)所有的IT从业者;(2)定比尺度;(3)定类尺度;(4)截面数据

7、简述中心极限定理

设从均值为μ,方差为σ

的任意一个总体中抽取样本容量为n的随机样本,则当n充分大时,样本

均值-

x的抽样分布近似服从均值为μ,方差为σ/n的正态分布

8、写出大样本条件下总体比率左侧检验的基本步骤。

(1)根据问题要求提出原假设和备择假设,H o:μ≥μ0,H o:μ<μ0;

(2)确定适当的检验统计量及相应的抽样分布——(正态分布)N(0,1);

(3)选取显着水平α,确定原假设

H o的接受域为

zα值得右侧,拒绝域为zα的左侧;

(4)计算统计量的值;

(5)作出决策,若P≤α,则拒绝

H o,若P≥α,则接受H o

9、简述样本容量与置信水平、总体方差、允许误差间的关系

(1)样本容量与置信水平成正比,即当样本容量越大时,置信水平越高;

(2)样本容量与总体方差成反比,即当样本容量越大时,总体方差越小;

(3)样本容量与允许误差成反比,即当样本容量越大时,允许误差越小。

10、评价优良估计量的主要标准有哪些并对每一标准作出说明。

无偏性:不是要求估计量与总体参数不得有偏差,而是指如果对同一个总体反复抽样,则要求各个样

本所得出所谓的估计量(统计量)的平均值等于总体参数;

有效性:估计量与总体之间存在的方差越小,估计量对总体的估计也就越准确,估计量越有效;

一致性:当样本量逐渐增加时,样本的估计量能够逐渐逼近总体参数。

11、在研究方法上,参数估计与假设检验有什么相同点和不同点

相同点:在研究方法上,它们都利用样本对总体进行某种推断;

不同点:推断角度不同,参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的,而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

12、什么是方差分析它的基本思想和原理是什么简述方差分析的基本步骤

方差分析就是针对一定因素分析各总体的各个因素水平是否有差异,分为单因素方差分析和双因素方差分析,单因素方差分析是针对一个因素进行的,而双因素方差分析则是针对两个因素进行的。

基本思想:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。

基本原理是认为不同处理组的均数间的差别基本来源有两个:

(1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SSw,组内自由度dfw。

(2) 实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作SSb,组间自由度dfb。

步骤:

(1)建立原假设和备择假设;

(2)选择显着性水平;

(3)确定决策点;

(4)计算并决策。

13、 写出一元线性回归分析中回归方程线性关系显着性检验的基本步骤。 (1)提出假设:0

1:0 :0i i H H ββ=≠

(H

o

即自变量与因变量的线性关系不显着,

H

o

即两者关系显着);

(2)计算检验统计量F F=SSR/1 SSE/(n-2) F (1,n-2);

(3)确定显着性水平α,并根据分子自由度1和分母自由度(n-2)找出临界值F ; (4)作出决策:若F >F ,则拒绝

H

o

;若F ≤F ,则接受

H

o

14、 解释总误差平方和SST 、水平项平方和SSA 、误差项平方和SSE 的含义及三者的关系。

SST 是每个观察值的整体均值之间的平方差之和;

SSA 每个水平的平均观察值与总体均值之间平方差之和,反映各总体的样本均值之间的差异程度; SSE 是组内平方和,是反映每个样本各观察值的离散程度; SST=SSA+SSE

15、 解释总平方和SST 、回归平方和SSR 、残差平方和SSE 的含义及三者间的关系

总平方和SST 是观测值与其平均值的偏差之和,反映因变量的n 个观察值与其均值的总离差; 回归平方和SSR 反映自变量x 的变化对因变量与取值变化的影响,值越大,占得比重就越大; 残差平方和SSE 反映除x 以外的其他因素,对y 取值的影响,也称为不可解释的平方和; SST=SSR+SSE

16、 简述一元线性回归模型

εβ

α++=X

Y

i

i

的基本假定

模型中,y 是Xi 的线性部分加上误差项而得到的,线性部分a+BXi 反映了由于Xi 的变化而引起的y 的

变化,误差项是随机变量是不能有Xi 和y 之间的线

性关系所解释的变异性,它反映了除Xi和y之间的线性关系之外的随机因素对y的影响,误差项

假设是一个服从正态分布的随机变量,且相互独立。

三、计算题

1、甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。乙班考试成绩的分布如下:

要求:(1)计算乙班考试成绩的均值及标准差;

(2)比较甲乙两个班考试成绩的离散程度大

计算:(1)众数、中位数与平均数

(2)标准差系数

(3)分析数据的偏斜方向

3、一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据如下表所示:

15 19 22 24 30

16 19 22 24 31

17 20 23 25 34

18 20 23 27 38

19 21 23 29 41

(1)画出该组数据的茎叶图

(2)画出该组数据的箱线图

(3)根据茎叶图和箱线图说明上网者年龄的分布特征。

4、某种生产线的感冒冲剂规定每包重量为12克,超重或过轻都是严重问题,从过去的资料可知

σ是,质检员每小时抽取25包冲剂称重检验,并做出是否停工的决策。假定产品重量服从正态分布。

96

.1

,

65

.1

025

.0

05

.0

=

=z

z

(1)建立适当的原假设与备择假设。(2)当

α=时,该检验的决策准则是什么(3)如果

-

x=克,你将做出什么决策(4)如果

-

x=克,你将做出什么决策

5、从均值μ=5、标准差σ

=10的总体中,抽取样本容量n=100的简单随机样本,样本均值记为

-

x,试回

答:

(1)-

x的数学期望是多少

(2)-

x的标准差是多少

(3)-

x的抽样分布是什么

6、设X ,X ,X 是取自某总体的容量为3的样本,试证明下列统计量都是该总体均值μ的无偏估计量,并判断哪一个估计量更有效。

(1)μ=1/2 X +1/3 X +1/6 X

(2)μ=1/3 X +1/3 X +1/3 X

(3)μ=1/6 X +1/6 X +2/3 X

7、一家研究机构检查了吸烟者美誉在香烟上的花费,总共抽取了100名吸烟者作为样本,调查结果显示

样本均值

x=200元,样本方差s=35元。

(1)总体均值的点估计是多少并解释其含义。

(2)用95%的置信水平,总体均值的置信区间是什么并解释其含义。

(3)如果总共抽取了64个人,其他条件不变,那么总体均值95%的置信区间是什么比较这两个置信区间有何不同

8、某购物中心想了解有多大比例的顾客再付款时使用会员卡,调查了100个顾客,发现有32人在付款时用会员卡。

(1)估计总体比例的值。

(2)计算所估计比例的标准差。

(3)求出总体比例的标准差。

(4)解释以上你所求出的结果。

9、某企业质检员从某天生产的一批食品袋中随机抽取36袋,测得其平均重量为克,标准差为克。 (1)试确定该天生产的食品袋平均重量95%的置信区间。

(2)若按照要求食品袋的标准重量至少为200克才算合格品,在当天抽检的36袋中有2袋重量低于200克,试确定该天生产的食品袋合格率95%的置信区间。

(3)若企业规定只有当天生产的食品合格率在95%以上的才属于生产正常,质检员认为目前企业的生产属于正常,试用假设检验的方法和步骤检验质检员的判断是否属实(05.0=α)。(注:

96

.1025.02

==z z α

z α=

10、某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:

已知食品包重服从正态分布,要求:

(1)确定该种食品平均重量95%的置信区间;

(2)如果规定食品重量低于100克属于不合格,确定该批食品合格率90%的置信区间; (3)采用假设检验方法检验该批食品的重量是否符合标准要求(α=)(写出检验的具体步骤)。

11、某公司管理者想比较A 、B 、C 、D 四种培训方案的效果,随机抽取了48名工人并随机分配进行了四种

培训,将培训结束后每组工人每小时组织产品数进行方差分析,得到了下面的分析结果:

1)完成上面的方差分析表;

2) 若显着性水平α=005

.,检验这四种培训方案效果是否有显着差异并判断是否需要进行多重比较

12、下表为根据随机抽样样本计算出的部分方差分析表,请根据方差分析原理完成该表,并请用

α=的显着水平说明这些数据能否说明各总体均值之间是否存在明显差异。

13、一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x 1

)、

各地区的年人均收入(x 2

)、广告费用(x 3

)之间的关系,搜集到30个地区的有关数据。利用Excel 得到

下面的回归结果(05.0=α):

方差分析表

参数估计表

1)将方差分析表中的所缺数值补齐。

2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。 3)检验回归方程的线性关系是否显着 4)检验各回归系数是否显着

5)计算判定系数2

R ,并解释它的实际意义。

6)计算估计标准误差

y

s ,并解释它的实际意义。

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学计算题

统计学计算题 27、【104199】(计算题)某班级30名学生统计学成绩被分为四个等级:A .优;B .良;C .中;D .差。结果如下: B C B A B D B C C B C D B C A B B C B A B A B B D C C B C A B D A A C D C A B D (1)根据数据,计算分类频数,编制频数分布表; (2)按ABCD 顺序计算累积频数,编制向上累积频数分布表和向下累计频数分布表。 【答案】 28、【104202】(计算题)某企业某班组工人日产量资料如下: 根据上表指出: (1)上表变量数列属于哪一种变量数列; (2)上表中的变量、变量值、上限、下限、次数; (3)计算组距、组中值、频率。 【答案】(1)该数列是等距式变量数列。 (2)变量是日产量,变量值是50-100,下限是,、、、、9080706050上限是,、、、、10090807060次数是111625199、、、、; (3)组距是10,组中值分别是 9585756555、、、、 ,频率分别是13.75%31.25%.20%23.75%11.25% 、、。 29、【104203】(计算题) 甲乙两班各有30名学生,统计学考试成绩如下:

(1)根据表中的数据,制作甲乙两班考试成绩分类的对比条形图; (2)比较两班考试成绩分布的特点。 【答案】 乙班学生考试成绩为优和良的比重均比甲班学生高,而甲班学生考试成绩为中和差的比重比乙班学生高。因此乙班学生考试成绩平均比乙班好。两个班学生都呈现出"两头大,中间小"的特点,即考试成绩为良和中的占多数,而考试成绩为优和差的占少数。 30、【104205】(计算题)科学研究表明成年人的身高和体重之间存在着某种关系,根据下面一组体重身高数据绘制散点图,说明这种关系的特征。 体重(Kg ) 50 53 57 60 66 70 76 75 80 85 身高(cm ) 150 155 160 165 168 172 178 180 182 185 【答案】散点图:

统计学考试试卷A及答案

2012—2013学年第二学期闽江学院考试试卷 考试课程:统计学 试卷类别:A卷□√B卷□考试形式:闭卷□√开卷□ 适用专业年级:2011级金融学、国际贸易学、保险学专业 注明:试卷答案请做在答题纸上。 一、单选题(每题1分,共30分,30%) 1. 下列不属于描述统计问题的是() A根据样本信息对总体进行的推断B了解数据分布的特征 C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据 2. 根据样本计算的用于推断总体特征的概括性度量值称作() A.参数 B. 总体C.样本 D. 统计量 3. 通过调查或观测而收集到的数据称为() A.观测数据 B. 实验数据 C.时间序列数据 D. 截面数据 4. 从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。 A.重复抽样 B.不重复抽样 C.分层抽样 D.整群抽样5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这样的调查方式称为()。 A 系统抽样 B 整群抽样 C 滚雪球抽样 D 判断抽样 6. 下面的哪一个图形最适合于描述结构性问题() A.条形图 B.饼图 C.雷达图 D. 直方图 7. 对于大批量的数据,最适合描述其分布的图形是( ) A.条形图 B.茎叶图 C.直方图 D.饼图 8. 将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。最后一组的组中值近似为( ) A.5000 B.7500 C.5500 D.6500 9. 下列关于众数的叙述,不正确的是() A.一组数据可能存在多个众数 B.众数主要适用于分类数据 C.一组数据的众数是唯一的 D.众数不熟极端值的影响 10. 一组数据的最大值与最小值之差称为() A.平均数 B.规范差 C.极差 D.四分位差 11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是() A.至少有75%的数据落在平均数加减3个规范差的范围之内 B. 至少有89%的数据落在平均数加减3个规范差的范围之内

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

统计学计算题

统计学原理复习1(计算题) 1.某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90 分为良,90─100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并 编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)计算本单位职工业务考核平均成绩 (4)分析本单位职工业务考核情况。 解:(1) (2)分组标志为"成绩",其类型为"数量标志";分组方法为:变量分组中的开放组距式分组,组限表示方法是重叠组限; (3)本单位职工业务考核平均成绩 (4)本单位的职工考核成绩的分布呈两头小, 中间大的" 正态分布"的形态,说明大多数职工对业务知识的掌握达到了该单位的要求。

2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下: 试问哪一个市场农产品的平均价格较高?并说明原因。 解: 解:先分别计算两个市场的平均价格如下: 甲市场平均价格()375.14 5 .5/==∑∑= x m m X (元/斤) 乙市场平均价格325.14 3.5==∑∑=f xf X (元/斤) 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到 两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。 3.某车间有甲、乙两个生产组,甲组平均每个工人的日产量 为36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何%( (1-4%)/(1-8%)*100%=96%/92%*100%=%结果表明:超额完成%(%-100%) ) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为(元)众数为(元) 求中位数: 先求比例:(1500-720)/(1770-720)= 分割中位数组的组距:(800-700)*= 加下限700+= 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)= 分割众数组的组距:*(800-700)= 加下限:700+= 年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下: /人) (55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下:

根据表中资料计算中位数和众数。中位数为(元) 众数为(元) 求中位数: 先求比例:(50-20)/(65-20)= 分割中位数组的组距:(800-600)*= 加下限:600+= 7.某企业产值计划完成103%,比去年增长5%。试问计划规定比去年增长 多少% (上年实际完成= 本年实际计划比上年增长 ()/==%) 8.甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高 (2)哪个单位工人的生产水平整齐 % 3.33V %7.44V /8.1x /5.1x ====乙甲乙甲人)(件人)(件9.在 计算平均数里,从每个标志变量中减去75个单位,然后将每个差数 缩小10倍,利用这个变形后的标志变量计算加权算术平均数,其中各个变量的权数扩大

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学计算题五

统计学第五次作业答案(第十二章指数) 一、简答题 简述编制综合指数的两个基本要点及一般原则; 编制综合指数的基本原理的两个要点是:第一是引进同度量因素,使全部个体的数量得以综 合;第二是固定同度量因素,消除同度量因素变动的影响。 综合指数按其指数化指标区分为数量指标指数和质量指标指数。编制数量指标指数,一般原则是采用基期的质量指标作同度量因素,即以质量指标作同度量因素且固定在基期;编制质量指标指数,一般原则是采用报告期的数量指标作同度量因素,即以数量指标作同度量因素且固定在报告期。 二、计算题 解:设原料基期平均价格为0x ,报告期平均价格1x ,基期购进数量为0f ,报告期购进数量为1f ,则有: 11 1 1 3.86610 3.011202715.8 3.72610120730x f x f ?+?= = =≈+∑∑ 00 00 3.20200 2.754801960 2.88200480680 x f x f ?+?= = =≈+∑∑ 011 3.20610 2.751202282 3.136******** x f f ?+?= =≈+∑∑ (1) 总平均价格指数10 3.72 129.17%2.88 x I x = == 总平均价格变动的绝对量: 11001 3.72 2.880.84x f x f f f -=-=∑∑∑∑(元) (2) 固定构成指数1101 1 1 3.72 118.85%3.13 x x f x f I f f = ÷= =∑∑∑∑

各等级平均价格变动的影响额 1101 1 1 3.72 3.130.59x f x f f f -=-=∑∑∑∑(元) (3) 结构影响指数01001 3.13 108.68%2.88 f x f x f I f f = ÷= =∑∑∑∑ 购进数量变动的影响额 01001 3.13 2.880.25x f x f f f -=-=∑∑∑∑(元) (4) 三者之间的数量关系: 相对数关系:129.17%118.85%108.68%=? 绝对数关系:0.840.590.25=+(元)(元)(元) 结果表明:该企业报告期购进的该原料的总平均价格上升了29.17%,即增加0.84元。其中,由于两等级的价格平均上升了18.85%,使总平均价格增加了0.59元;由于购进数量结构变动使得总平均价格上升了8.68%,使总平均价格增加了0.25元。 解:设基期产量为0q ,报告期产量1q ,基期单位成本0p ,报告期单位成本1p ,则有 11 14115462004445030610p q =?+?+?=∑ 00 15100402005038028500p q =?+?+?=∑ 01 15115402005045032225 p q =?+?+?=∑ (3分) (1) 总成本指数11 00 30610 107.40%28500 p q I p q = = =∑∑ 总成本增减额 11 00 30610285002110p q p q -=-=∑∑(元) (2) 单位成本总指数1101 30610 94.99%32225 p p q I p q = = =∑∑

统计学考试试题及答案

统计学考试试题及答案文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《统计学原理》期末考试题 一、单选题{每小题2分,共12分} 1.对某城市工业企业未安装设备进行普查,总体单位是(B )。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 2.反映不同总体中同类指标对比的相对指标是( B)。 A.结构相对指标 B.比较相对指标 C.强度相对指标 D.计划完成程度相对指标 3.在组距分组时,对于连续型变量,相邻两组的组限(A ) A.必须是重叠的 B.必须是间断的 C.可以是重叠的,也可以是间断的 D.必须取整数 4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是(A)。 A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样 5.在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差(A ) A.缩小为原来的% B.缩小为原来的50% C.缩小为原来的25% D.扩大为原来的四倍 6.下列哪两个变量之间的相关程度高(C )。 A.商品销售额和商品销售量的相关系数是0. 9 B.商品销售额与商业利润率的相关系数是0. 84 C.平均流通费用率与商业利润率的相关系数是一 D.商品销售价格与销售量的相关系数是一

二、多选题(每小题2分,共8分) 1.要了解某地区的就业情况( ABE) A.全部成年人是研究的总体 B.成年人口总数是统计指标 C.成年人口就业率是统计标志 D.反映每个人特征的职业是数量指标 E.某人职业是教师是标志表现 2.影响加权算术平均数的因素有(AB ) A.各组频率或频数 B.各组标志值的大小 C.各组组距的大小 D.各组组数的多少 E.各组组限的大小 3.简单随机抽样(ACDE ) A.适用于总体各单位呈均匀分布的总体 B.适用于总体各单位标志变异较大的总体 C.在抽样之前要求对总体各单位加以编号 D.最符合随机原则 E.是各种抽样组织形式中最基本最简单的一种形式 4.下面哪几项是时期数列(BC ) A.我国近几年来的耕地总面积 B.我国历年新增人口数 C.我国历年图书出版量 D.我国历年黄金储备 E.某地区国有企业历年资金利税率 三、填空题(每小题2分.共10分) 1.变量按其取值的连续性可分为(离散变量)和(连续变量)两种。 2.统计调查根据(被研究总体范围)可分为全面调查和非全面调查,根据(调查登记时间是否连续)可分为连续调查和不连续调查。 3.总体是非标志(0,1)分布的平均数为P ,方差为P(1-P)。

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

统计学计算题整理

: 典型计算题一 1、某地区销售某种商品的价格和销售量资料如下: 根据资料计算三种规格商品的平均销售价格。 解: 36== ∑∑ f f x x (元) 点评: 第一,此题给出销售单价和销售量资料,即给出了计算平均指标的分母资料,所以需采用算术平均数计算平均价格。第二,所给资料是组距数列,因此需计算出组中值。采用加权算术平均数计算平均价格。第三,此题所给的是比重权数,因此需采用以比重形式

表示的加权算术平均数公式计算。 2、某企业1992年产值计划是1991年的105%,1992年实际产值是1991的的116%,问1992年产值计划完成程度是多少? 解: %110% 105% 116=== 计划相对数实际相对数计划完成程度。即1992年计划完成程度为 110%,超额完成计划10%。 点评:此题中的计划任务和实际完成都是“含基数”百分数,所以可以直接代入基本公式计算。 3、某企业1992年单位成本计划是1991年的95%,实际单位成本是1991年的90%,问1992年单位成本计划完成程度是多少? 解: 计划完成程度 %74.94% 95% 90==计划相对数实际相对数。即92年单位成本计划完成程度是 94.74%,超额完成计划5.26%。 点评:本题是“含基数”的相对数,直接套用公式计算计划完成程度。 4、某企业1992年产值计划比91年增长5%,实际增长16%,问1992年产值计划完成程度是多少? 解: 计划完成程度%110% 51% 161=++= 点评:这是“不含基数”的相对数计算计划完成程度,应先将“不含基数”的相对数还原成“含基数”的相对数,才能进行计算。 5、某企业1992年单位成本计划比1991年降低5%,实际降低10%,问1992年单位成

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

相关主题
文本预览
相关文档 最新文档