当前位置：文档之家› 统计学

统计学

《统计学》2011年7月考试考前练习题

一、单项选择题

1．关于均值，下列说法正确的是（ A ）。

A ．均值不适用于定类数据和定序数据

B ．均值不适用于定距数据和定比数据

C ．各变量与其均值的离差之和等于1

D ．几何平均数不适用于定比数据

2．我国目前的零售价格指数的特点是（ D ）。

A ．是根据全部零售商品计算而得

B ．对所选商品使用的价格是该商品的市价

C ．对所选商品使用的价格是该商品的议价

D ．是采用加权算术平均形式计算的

3．在使用基期价格作权数计算商品销售量指数时，（ C ）。

A ．包含了价格变动的影响

B ．包含了价格和销售量变动的影响

C ．消除了价格变动的影响

D ．消除了价格和销售量变动的影响

4．如果A 与B 互斥，则有（ A ）。

A ．)()()(

B P A P B A P += B ．)()()(B P A P B A P +=

C ．)()()(B P A P B A P ?=

D ．)()()(B P A P B A P ?=

5．下列哪种指数是个体指数（ B ）。

A ．消费价格指数

B ．生猪价格指数

C ．道琼斯指数

D ．恒生指数

6．假设检验所依据的是（ B ）。

A ．中心极限定理

B ．小概率原理

C ．反证法

D ．排中律

7．帕氏指数的特点之一是（ A ）。

A ．更多地用于计算质量指数而非数量指数

B ．采用了基期变量值加权

C ．不同时期的帕氏指数具有可比性

D ．帕氏指数不宜用来计算综合指数

8．在无交互作用的双因素方差分析中，如果因素A 有r 个水平，因素B 有S 个水平，则SST ，SSA ，SSB 的自由度分别为（ C ）。

A ．rS ，r ，S

B ．()()11--S r ，1-r ，1-S

C ．1-rS ，1-r ，1-S

D ．1-rS ，r ，S

9．指数按其反映的内容不同可分为（ A ）。

A ．数量指数和质量指数

B ．个体指数和综合指数

C ．简单指数和加权指数

D ．定基指数和环比指数

10．以1980年为基期，1998年为报告期计算的国内生产总值的平均发展速度应开（ B ）次方。

A ．17

B ．18

C ．19

D ．20

11．今有34?列联表，总频数320，52.172=χ，则其V 相关系数等于（ D ）。

A ．0.233

B ．0.229

C ．0.135

D ．165.0

12．若已知一数列的环比增长速度分别为%5、%7、%10、%13，则该数列的定基增长速度为（ B ）。

A ．%113%110%107%105

??? B ．()1%113%110%107%105-??? C ．()1%113%110%107%105+??? D ．%13%10%7%5???

13．用水平法计算平均发展速度，实际上只与数列的（ D ）相关联。

A ．最初水平

B ．中期水平

C ．最末水平

D ．A 和C

14．平均增长量与累计增长量的关系是（ B ）。

A ．平均增长量乘时期数等于累计增长量

B ．平均增长量等于累计增长量除以时间数列项数1-

C ．平均增长量的连乘积等于累计增长量

D ．平均增长量乘时间数列项数1-等于累计增长量

15．置信水平表达了区间估计的（ A ）。

A ．可靠性

B ．精确性

C ．显著性

D ．有效性

16．()2,~σμN X ，2σ未知，00:μμ≥H ，则0μ的拒绝域为（ A ）。

A ．αt t -≤

B ．αt t -≥

C ．αt t ≤

D ．2αt t ≥

17．若00μμ＝：H ，抽出一个样本，其均值0μ

A ．肯定拒绝原假设

B ．有可能拒绝原假设

C ．肯定接受原假设

D ．以上说法都不对

18．已知变量x 与y 之间存在着负相关，指出下列方程中（ C ）肯定是错误的。

A ．x y 7.08?--=

B ．x y 8.0150?-=

C ．x y 34.0130?+-=

D ．x y 053.025?-=

二、多项选择题

1．关于方差和标准差，正确的说法是（ BD ）。

A ．方差有量纲

B ．标准差有量纲

C ．方差和标准差都有量纲

D ．方差的平方根是标准差

E ．方差的实际意义比标准差清楚

2．在方差分析中，如果MSE MSA

F =近似等于1，则说明（ BCE ）。

A ．方差分析中应该拒绝原假设

B ．方差分析中应该接受原假设

C ．组间方差中不包含系统因素的影响

D ．组间方差中包含系统因素和随机因素的影响

E ．r 个总体的均值没有显著差异

3．设X 是任一离散型随机变量，()()n i p x X p i i ,,2,1 ===是X 的概率函数，则必然有（ ABE ）。

A ．()1≤==i i p x X P n i ,,2,1 =

B ．()0≥==i i p x X P n i ,,2,1 =

C ．1)(≥==i i p x X P n i ,,2,1 =

D ．()0

11==

=∑∑==n i n i i i p x X P

E ．()1

11==

=∑∑==n i n

i i i p x X P

4．现在有三道判断题，事件i A 表示第i 道判断题正确()3,2,1=i ，则至少有两道判断题正确可以表示为（ BC

）。

A ．321321321A A A A A A A A A -

B ．321321321321A A A A A A A A A A A A +++-

C ．3213231212A A A A A A A A A -++

D ．-

----

-++323121A A A A A A

E ．321A A A

5．对于单因素方差分析的误差平方和SSE ，以下正确的选项有（ AD ）。

A ．反映随机因素的影响

B ．反映随机因素和系统因素的影响

C ．自由度为1-r ，1-r 为水平个数

D ．自由度为1-n ，n 为样本数据个数

E ．自由度为1-r

6．现根据样本数据建立的单位产品成本（元）对产量（千件）的一元线性回归方程为x y 8.470?-=，这就意味着（ ABD ）。

A ．产量每增加1千件，单位成本平均降低4.8元

B ．产量为1千件时，单位成本为65.2元

C ．产量每增加1千件，单位成本平均增加4.8元

D ．单位成本与产量之间存在着负相关

E ．单位成本与产量之间存在着正相关

7．在指数体系中，总量指数与各因素指数之间的数量关系是（ BE ）。

A ．总量指数等于各因素指数之和

B ．总量指数等于各因素指数的乘积

C ．总量指数等于各因素指数之比

D ．总量的变动差额等于各因素变动差额之积

E ．总量的变动差额等于各因素变动差额之和

8．不能运用乘除运算方法的计量尺度有（ ABC ）。

A ．列名水平

B ．有序水平

C ．间隔水平

D ．比较水平

E ．定比尺度

9．若（n x x x .,,21 ）是来自总体X 的一个样本，()

2,~σμN X ，则（ AC ）。 A ．21-n s 是2σ的无偏估计 B ．2n s 是2σ的无偏估计 C ．x 是μ的无偏估计

D ．2x 是2

σ的无偏估计 E ．1-n s 是σ的无偏估计

10．根据各年的月度资料计算的季节比率（ CE ）。

A ．其均值为%400

B ．其总和为%100

C ．其平均数为%100

D ．其总和为%400

E ．其总和为%1200 11．若置信区间为])[(2221

21221n n z x x σσα+±-，则下列哪种说法是正确的（ ABCDE ）。 A ．两个正态总体，方差2221σσ、已知

B ．两个非正态总体，大样本，方差

2221σσ、已知

C ．)(21x x -的数学期望为21μμ-

D ．)(21x x -的方差为222121n n σσ+

E ．)(21x x -服从正态分布

12．在编制加权综合指数时，确定权数需要考虑的问题有（ ABD ）。

A ．现象之间的内在联系

B ．权数的所属时期

C ．权数的具体数值

D ．权数的具体形式

E ．权数的稳定性和敏感性

三、填空题

1．检验回归系数的显著性时，检验的统计量t =_____；检验相关系数r 的显著性时,检验的统计量t =_____。解答:

b s b 212r n r --

2．方差分析是通过误差的分析，判断多个_____是否相等的一种统计方法。

解答:正态总体均值

3．对于正态总体均值的假设检验，如果假设为00:μμ=H ，01:μμ≠H ，则接受域为_____，此时称为_____检验。解答:

2αZ Z ≤ 双侧

4．统计上把α称为假设检验中的_____水平。

解答:显著性

5．统计推断是由_____和_____组成的。

解答:参数估计假设检验

6．在无交互作用的双因素方差分析中，若因素A 有5个水平，因素B 有4个水平，则SST 的自由度为_____，SSA 的自由度为_____，SSE 的自由度为_____。

解答:19 4 12

7．设)1,0(~N X ，()x F 与()x f 分别是其分布函数和概率密度函数，则()=0F ______；==)0(x P ______。

解答:0.5 0

8．掷一枚均匀的骰子，出现3点的概率为_____；出现3点以下的概率为_____；出现3点的整数倍数的概率为_____。

解答:61 31 31

9．测定季节变动常用的方法有_____和_____它们均以_____指标来反映季节波动。

解答:按月（季）平均法趋势剔除法季节比率（指数）

四、简答题

1．众数、中位数和均值之间存在什么样的数量关系？

解答:

众数、中位数和均值是三种描述数据集中趋势的主要测量值。当数据呈正态分布时，三个测量值完全相等；当分布出现偏态时，三者表现出差别。如果是右偏分布，则X >Me>M0;如果是左偏分布，则M0>Me>X 。一般说来，均值与中位数间的距离约是中位数与众数间距离的1／2。这个规律可以大致表示为：M0"P X -3(X -Me)

2．什么是定比尺度？它具有哪些特征？

解答:定比尺度又称比率尺度或比较水平，其英文译为Ratio Scale ，它是对事物之间比值的一种测度，可用于参数与非参数统计推断。虽然它与定距尺度同属于一个等级的计量尺度，但其功能要比定距尺度强一些，其主要特征体现为：

①除能区分类别、排序、比较大小、求出大小差异、可采用加减运算以外，还可以进行乘除运算。

②具有绝对零点，即"０"表示"没有"或"不存在"。

③所有统计量均可对其进行分析。

即不仅包括其它三种计量尺度可以采用的统计量，如：频数、频率、众数、中位数、四分位数、均值、标准差等，而且还可以采用其他更为复杂的统计量，如T 统计量、Z 统计量、F 统计量、2

χ统计量等。

3．怎样理解在统计分组过程中的"互斥"、"不重不漏"、"上限不包括在内"、"下限不包括在内"的原则？

解答:在统计分组中的"互斥"原则，就是指各组中不应相互包含。所谓"不重"就是指一项数据只能归入其中的一组，而不能同时归入两个或两个以上的组。所谓"不漏"就是指各组别能够穷尽，即在所分的全部组别中，每项数据都能分在其中的一组而没有遗漏。为了解决"不重"问题，在统计分组中习惯上规定，对于越大越好的数值，采用"上限不包括在内"的原则，即当采用重叠组限时，某一变量值恰与组限同值，应将其归入下限组，而不是上限组；对于越小越好的数

值，则采用"下限不包括在内"的原则，即当采用重叠组限时，某一变量值恰与组限同值，则应将其归入上限组，而不是下限组。为了解决"不漏"的问题，在分组时可以采用开口组，这样可以将极端值包括在分组中，不被遗漏。

4. 事件的独立和互斥有何区别和联系？

解答:两个事件互斥是指两个事件不可能同时发生。而两个事件独立是指其中任一事件发生与否并不影响另一事件。

如果两个事件互斥，则它们之间不可能独立。因为如果A 出现则B 的概率为0，如果B 出现A 的概率也为0，所以互斥事件是相互依赖（不独立）的。

如果两个事件不互斥，则可能独立，也可能不独立。然而独立的事件不可能是互斥的。

5. 假设检验分为哪几个步骤？

解答:分为五个步骤：（1）提出原假设和替换假设；（2）确定适当的检验统计量；（3）规定显著性水平α；（4）计算检验统计量的值；（5）作出统计决策并加以解释。

6. 简述应用方差分析的条件。

解答:应用方差分析要求符合两个条件：

（1）各个水平的观察数据，要能看作是从服从正态分布的总体中随机抽取的样本。

（2）各组观察数据是从具有相同方差的相互独立的总体中抽得的。

7. 在对两组数据差异程度进行比较时，能否直接比较两组数据的标准差？

解答:标准差的大小，不仅取决于各个变量值与其均值离差的大小，还取决于变量值水平的高低。如果两组数据的计量单位相同，且均值水平相同，可以利用标准差来比较差异程度，但如果两组数据的计量单位不同，或均值水平不同，就不可以直接比较两组数据的标准差，而应当比较两数据的离散系数。

8. 置信区间的直观意义是什么？

解答:置信区间表达了区间估计的准确性或精确性。对此，我们可以这样理解。由于估计量θ、θ都是样本的函数，一旦得到了一组样本观察值n x x x ,,,21?，就可以计算出一对数值θ()n x x x ,...,,21和θ()n x x x ,...,,21，反复抽取样本，就能得到多组不同的样本值，从而得出多对θ、θ数值，确定多个置信区间。在给定显著性水平α的条件下，当我们建立了100个置信区间，那么平均就有α-1个置信区间包含真值θ，或说对每一个置信区间有α-1的概率包含了θ；同时有100α个置信区间不包含θ，或说对每一个置信区间有α概率不包含θ。这就是置信区间的直观含义或意义。

9. 在统计分析中为什么要把绝对数和相对数结合起来运用？

解答:绝对数反映了现象的总规模和总水平，但不易说明现象的发展程度和差别；相对数能够揭示事物内部的联系和现象间的对比关系，却把现象的具体规模抽象了。绝对数和相对数各有长处和弱点，只有把它们结合起来，才能使我们对事物的认识更为全面。

五、计算题（需写出计算过程，答案精确到小数点后两位）

1．一个口袋里装有5个白球，3个红球，从袋里随机取球三次，均不放回。

求：（1）取到3个球都是红球的概率。

（2）取到3个球都是白球的概率。

（3）取到的球的颜色不相同的概率。

解答:（1）

5613833

1==C C P （2）2853835

2==C C P

（3）取到的球的颜色不相同，即2红1白或者1红2白。则：

38251315233C C C C C P += 5645

或者：2131P P P --=

5645

2855611=--

2．有甲乙两个生产小组，甲组平均每个工人的日产量为36件，标准差为9.6件。乙组工人日产量资料如下：

要求：（1）计算乙组平均每个工人的日产量和标准差。

（2）比较甲、乙两生产小组哪个组的日产量差异程度大？

解答:（1）

986.8F )X X (F ,5.29133438151345343538251515F

X F 4

1i i 4

1i 2i i 41

-i i

i i i

=-=+++?+?+?+?=∑∑∑∑===＝＝乙乙σX （2）

305.0X ,267.0X ==乙乙乙甲甲甲＝＝σσV V

说明乙组日产量差异程度大于甲组。

3. 某农贸市场三种商品的资料如下：

计算：（1）三种商品的成交额指数；

（2）三种商品的价格总指数和销售量总指数，并分析价格和销售量变动对销售额的影响程度。

解答:（1）三种商品的成交额指数：

％29.1140.70.8001

10/1===∑∑q p q p v

增加的绝对额：

∑∑=-=-)(0.10.70.80011万元q p q p

（2）三种商品的价格总指数：

%26.1056.70.8/111011

10/1==?=∑∑q p p p q p p

增加绝对额：

∑∑=-=?-)(4.06.70.8/1110111万元q p p p q p

（3）三种商品的销售量总指数：

%57.1080.76.700100000010/1===?=∑∑∑∑q p q p q p q p q q

增加绝对额：

∑∑=-=-?)(6.00.76.7000001

万元q p q p q q

4. 某市调查职工平均每天用于家务劳动的时间。该市统计局主持这项调查的人认为职工用于家务劳动的时间不超过2

小时。随机抽取225名职工进行调查的结果为：8.1=x 小时，44.12=s 。

问：调查结果是否支持调查主持人的看法？（05.0=α，645.105.0=t ，645.105.0=Z ）

解答:解一：

（1）2:2:10<≥μμH H

（2）05.0=α 当225=n 时相等与ααz t 。故645.1==ααz t

（3）

5.22252.128.10-=-=-=n s x t μ （4）拒绝域αt t -≤ 645.15.2-<-

（5）拒绝0H ，即可以接受调查主持人的看法。

解二：由于225=n 为大样本，可用z 统计量。

2:2

:10<≥μμH H 5.22252.128.10-=-=-=n s x z μ

645.1=αz ，z ＜αz -

落入拒绝域，即调查结果支持该调查人的看法。

应用统计学论文

应用统计学课程论文经过这学期短暂的学习应用统计学，我对这门学科也有了一定认识。应用统计学是一门运用统计学的原理和方法，研究各个领域有关数据收集、整理、分析的科学是经济、管理类专业的一门重要专业基础课程。掌握统计学的基本理论和方法，具有较好的科学素养，能熟练地运用计算机分析数据，能从事统计调查、统计信息管理、数量分析、市场研究、质量控制等工作。在当前的社会发展中，是市场经济和信息经济的时代，社会各个方面的发展都需要对信息进行收集、分析和整理，所以学好应用统计对不久即将走向社会的我们是只有好处，没有坏处的。绪论一、应用统计学的发展：从统计学的发展过程来看，可以把统计学大致分为古典统计学、近代统计学和现代统计学三个时期。第一、古典统计学时期：古典统计学时期是指17世纪初至18世纪末，这是统计学的创立时期,亦称古典统计学时期。在这时期出现了政治算术学派和德国的国势学派两个统计学派. 1、国势学派国势学派又称记述学派，产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项，故称记述学派。 2、政治算术学派政治算术学派产生于19世纪中叶的英国,其创始人是威廉和约翰.“算术”是指统计方法。主要利用实际资料，运用数字、重量和尺度等统计方法对实际情况作了系统的数量对比分析，从而为统计学的形成和发展奠定了方法论基础。第二、近代统计学时期：近代统计学是指18世纪末到19世纪末这一百年的统计学，它是古典统计学的继续和发展，是古典统计学向现代统计学过渡的统计学。近代统计学的发端，不能不提到著名的统计学家阿道夫·凯特勒的卓越员献。他既继承了国势学和政治算术的传统，把统计学从作为管理国家行政的“政治医学”，扩展到作为研究社会内在矛盾及其规律性数量表现的科学认识方法，又积极地把古典概率引人统计学，以研究社会经济现象偶然变化中的规律性表现。 1、数理统计学派指概率论引进统计学形成数理统计学,以概率作为理论基础,抽象掉统计学的社会经济现象内涵,变成了抽象的数学分析和推断技术. 2、社会统计学派指研究社会现象变动的原因和规律性的实质性科学。社会统计学在这里也称为社会经济统计学,包括政治统计.经济统计.人口统计.犯罪统计等多方面内容. 第三、现代统计学时期：

统计学统计学概率与概率分布练习题

第5章概率与概率分布练习题 5.1 写出下列随机事件的基本空间：（1）抛三枚硬币。（2）把两个不同颜色的球分别放入两个格子。（3）把两个相同颜色的球分别放入两个格子。（4）灯泡的寿命（单位：h ）。（5）某产品的不合格率（%）。 5.2 假定某布袋中装有红、黄、蓝、绿、黑等5个不同颜色的玻璃球，一次从中取出3个球，请写出这个随机试验的基本空间。 5.3 试定义下列事件的互补事件：（1） A ={先后投掷两枚硬币，都为反面}。（2） A ={连续射击两次，都没有命中目标}。（3） A ={抽查三个产品，至少有一个次品}。 5.4 向两个相邻的军火库发射一枚导弹，如果命中第一个和第二个军火库的概率分别是、，而且只要命中其中任何一个军火库都会引起另一个军火库的爆炸。试求炸毁这两个军火库的概率有多大。 5.5 已知某产品的合格率是98%，现有一个检查系统，它能以的概率正确的判断出合格品，而对不合格品进行检查时，有的可能性判断错误（错判为合格品），该检查系统产生错判的概率是多少 5.6 有一男女比例为51：49的人群，已知男人中5%是色盲，女人中%是色盲，现随机抽中了一个色盲者，求这个人恰好是男性的概率。根据这些数值，分别计算：（1）有2到5个（包括2个与5个在内）空调器出现重要缺陷的可能性。（2）只有不到2个空调器出现重要缺陷的可能性。（3）有超过5个空调器出现重要缺陷的可能性。 5.8 设X 是参数为4=n 和5.0=p 的二项随机变量。求以下概率：（1）)2(

5.9 一条食品生产线每8小时一班中出现故障的次数服从平均值为的泊松分布。求：（1）晚班期间恰好发生两次事故的概率。（2）下午班期间发生少于两次事故的概率。（3）连续三班无故障的概率。 5.10 假定X 服从12=N ，7=n ，5=M 的超几何分布。求：（1）)3(=X P 。（2）)2(≤X P 。（3）)3(>X P 。 5.11 求标准正态分布的概率：（1）)2.10(≤≤Z P 。（2）)49.10(≤≤Z P 。（3）)048.0(≤≤-Z P 。（4）)037.1(≤≤-Z P 。（5）)33.1(>Z P 。 5.12 由30辆汽车构成的一个随机样本，测得每百公里的耗油量数据（单位：L ）如下：试判断该种汽车的耗油量是否近似服从正态分布 5.13 设X 是一个参数为n 和p 的二项随机变量，对于下面的四组取值，说明正态分布是否为二项分布的良好近似（1）30.0,23==p n 。（2）01.0,3==p n 。（3）97.0,100==p n 。（4）45.0,15==p n 。

应用统计学试题和答案分析

六、计算题：（要求写出计算公式、过程，结果保留两位小数，共4题，每题10分） 1、某快餐店对顾客的平均花费进行抽样调查，随机抽取了49名顾客构成一个简单随机样本，调查结果为：样本平均花费为元，标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间；（φ（2）=）49=n 是大样本，由中心极限定理知，样本均值的极限分布为正态分布，故可用正态分布对总体均值进行区间估计。已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据，得该快餐店顾客的总体平均花费数额%的置信区间为（，） 3 要求：①、利用最小二乘法求出估计的回归方程；②、计算判定系数R 。附：10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题解 ① 计算估计的回归方程： ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为：y ) =+x ② 计算判定系数： 4 计算下列指数：①拉氏加权产量指数；②帕氏单位成本总指数。 4题解： ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题（每小题1分，共10题） 1、我国人口普查的调查对象是，调查单位是。 2、___ 频数密度 =频数÷组距，它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用饼图条图图来显示。 4、某百货公司连续几天的销售额如下：257、276、297、252、238、310、240、236、265，则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元，2005年3季度完成的GDP=36亿元，则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%，职工人数增加了2%，则该企业工资总额增长了 % 。 7、对回归系数的显着性检验，通常采用的是 t 检验。 8、设置信水平=1-α，检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲＞σ乙，x 甲＞x 乙，由此可推断 ( )