当前位置:文档之家› 统计学复习概念重点-贾俊平

统计学复习概念重点-贾俊平

统计学复习概念重点-贾俊平
统计学复习概念重点-贾俊平

简单样本平均数

n

' X i

i丄

X 二

n

总体均值的置信区间(正

态总体,◎已知)

总体均值的置信区间(a 未

知,大样本)

CT _ s

—2「亠{

几何平

均数

总体比例的置信区间

异众比

V r

f m

f i

f m

f i

总体方差的置信区间

简单加

平均差M d

k

S |Mi -x|fi

i 4

n

估计总体均值时的样本容

简单样本方差标准方s2

n

' (X i -x)2

i =4

n —1

n

'(X -X)2

i -1

n —1

估计总体比例时的样本容

加权样

k

2

(M i -x) f i

i A

n —1

总体均值检验的统计量

(正态总体,匚已

知)

加权样本标准差

’ (M i -X)2f i

『广n—1 总体比例检验的统计量

判定系数

相关系数检验的统计量

标准分数

指数平滑法预测

移动平均法预测

R2

SSR「(?i -y)2

SST「、⑶-y)2

总体方差检验的统计量

t ~ t(n - 2)

-X

S

Xi

-

?系

F t 1 T t (1 -〉)F t

拉氏

q

1

P1q

Y* 丫一 2 ?…匕Y t

F t 1 二Y t

k

I P

P(1 -

P)

1」

N

2 2 (n -1)s 岂_2 岂(n -1)s

P-乙.2

' pg ' qp o

P0q0q' q°P0

q

P1

z

q1

1

p

P1

2

//_2

估计标准

误差

线性关系

检验的统

计量

2 2

(乙2)二

n = _______

E2

(Z-.2)2二(1 -

二)

—E2

X _ J

匚/Jn

x

z 二

s/\ n

t _ X _ "0

s/\Tn

兀0(1一兀0)

n

Z2(n-1)s2

2 -0

p 0

I q

2 pg

瓦P°q1

q1

P1

q°P1

q

M

o

O

q o p

SSR1

SSE n-2

~ F (n - 2) MSA=SSA/k-1

MSE=SSE/n-k

统计学:收集处理分析解释数据并从数据中得出结论的科学。

1. 描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。

2. 推断统计:研究如何利用样本数据来推断总体特征的统计方法。

3. 分类数据:只能归于某一类别的非数字型数据。

4. 顺序数据:只能归于某一有序类别的非数字型数据。

5. 数值型数据:按数字尺度测量的观察值。

6. 观测数据:通过调查或观测而收集到的数据。

7. 实验数据:在实验中控制实验对象而收集到的数据。

8. 截面数据:在相同或近似相同的时间点上收集的数据。

9. 时间序列数据:在不同时间上收集到的数据,这类数据按时间顺序收集到的。

10. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,根据样本调查结果来推断总体特征的数据

收集方法。

11. 普查:为特定目的而专门组织的全面调查。

12. 总体:包含所研究的全部个体(数据)的集合。

13. 样本:从总体中抽取的一部分元素的集合。

14. 样本容量:也称样本量,是构成样本的元素数目。

15. 参数:用来描述总体特征的概括性数字度量。

16. 统计量:用来描述样本特征的概括性数字度量。

17. 变量:说明现象某种特征的概念。

18. 分类变量:说明事物类别的一个名称。

19. 顺序变量:说明事物有序类别的一个名称。

20. 数值型变量:说明事物数字特征的一个名称。

21. 离散型变量:只能取可数值的变量。

22. 连续型变量:可以在一个或多个区间中取任何值的变量。

23. 调查数据:通过调查方法获得的数据

24. 实验数据:通过实验方法获得的数据

25. 概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

26. 非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调

查。

27. 简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概

论。

28. 抽样框:用于抽选样本的总体单位信息,是概率抽样中所不可缺

29. 分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样

本。

30. 整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调

查。

31. 系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一单位作为初始单位,然后按事先规则

确定其它样本单位。

32. 多阶段抽样:首先抽取群,再进一步抽样,从选中的群中抽取出若干个单位进行计查,二阶段抽样。

33. 方便抽样:依据方便原则,自行确定入抽样本的单位。

34. 判段抽样:研究人员根据经验,判断研究对象的了解,有目的选择一些单位作为样本。

35. 自愿样本:被调查者自愿参加,成为样本中一分子,向调查人员提供有关信息

36. 滚雪球抽样:对稀少群体调查中,首选选择一组调查单位,调查后,请他们提供另外属于研究总体的调

查对象,调查人员根据所提供的线索,进行此后调查。

37. 配额抽样:将总体中所有单位按一定的标志分若干类,然后每类采用方便抽样或判断抽样的方案选取样

本单位。

38. 自填式:没有调查员协助,被调查者自已填写,完成调查问卷。

39. 面访式:面对面,调查员提问,被调查者回答。

40. 电话式:打电话方式调查。

41. 抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误差。

42. 非抽样误差:相对抽样误差而言,除抽样误差之外的,由于其它原因引起的样本观察结果与总体真值之

间的差异。

43. 抽样框误差:统计推论的错误是由于抽样框不完善造成的

44. 频数:落在某一特定类别或组中的数据个数。

45. 频数分布:各个类别及其相应的频数形成的分布。

46. 比例:一个样本(或总体)中各个部分的数据占全部数据比值。

47. 比率:一个样本(或总体)中各不同类别数据之间的比值。

48. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。

49. 累积频率或累积百分比:将有序类别或组百分比逐级累加起来。

50. 数据分组:根据统计研究需要,将原始数据按某种标准化分成不同的组别,。

51. 组距是一个组的上限与下限的差

52. 组距分组是将全部变量依次划分为若干个区间,将这一区间的变量值作为一组。

53. 等距分组,在组距分组时,如果各组的组距相等。

54. 组中值二下限值+上限值/2上下限的中间值

55. 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。

56. 茎叶图:由茎和叶两部分组成的、反应原始数据分布的图形。

57. 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始

数据分布图形。

58. 集中趋势:指一组数据向某一中心值靠拢的程度,反映一组数据中心点的位置所在。

59. 众数:一组数据中出现频数最多的数值

60. 中位数:一组数据排序后处于中间位置上的数值。

61. 四分位数:一组数据排序后处在25%5 75%位置上的数值。

62. 平均数:又称均值,是全部数据的算术平均值

63. 简单平均数:未经分组数据计算的平均数称为简单平均数。根据分组。oo加权平均数。

64. 几何平均数:是n个变量值乘积的n次方根。常用于比例数据的平均。

65. 异众比率:指非众数组的频数占总频数的比例.

66. 四分位差:75%位置上的四分位数与25%位置上的四分位数之差。顺序数据。

67. 极差:也称全距,一组数据的最大值与最小值之差。

68. 平均差:也称平均绝对离差,它是各变量值与其平均数离差的绝对值的平均数。

69. 方差:各数据与其平均数离差平方的平均数。

70. 标准差:方差的平方根。

71. 标准分数:也称标准化值或z分数,某个数据与其平均数的离差除以标准差后的值。

72. 离散系数:一组数据的标准差与其相应的平均数之比。

73. 偏态:对数据分布对称性的测度。测度偏态的统计量偏态系数。

74. 偏态系数:对数据分布不对称性的度量值。

75. 峰态:对数据分布平峰或尖峰程度的测度,测度峰态的统计量则是峰态系数。

76. 峰态系数:对数据分布峰态的度量值。

77. 随机事件:在同一组条件下,每次试验可能出现也可能不出现的事件,也叫偶然事件

78. 必然事件:在同一组条件下,每次试验一定出现的事件。

79. 不可能事件:在同一组条件下,每次试验一定不出现的事件。

80. 基本事件:如果一个事件不能分解成两个或更多个事件,则这个事件称为基本事件。

81. 概率:对事件发生的可能性大小的度量值。

82. 主观概率:对一些无法重复的试验,确定其结果的概率只能根据经验,人为确定这个事件的概率。

83. 条件概率:当某事件B已发生,求事件A发生的概率,称为事件B发生条件下事件A发生的条件概率。

84. 独立事件:两个事件中不论哪一个事件发生与否并不影响另一个事件发生的概率。

85. 随机变量:事先不能确定其取值的变量。

86. 离散型随机变量:只能取有限个值的随机变量。

87. 连续型随机变量:可以取一个或多个区间中任何值的随机变量。

88. 期望值、数学期望:随机变量的平均取值,各可能值与对应概率乘积之和。 89. 方差:随机变量的每一取值与期望值的离差平方的期望值。

90. 泊松分布:用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的个数的分布。 91. 概率密度函数:对连续型随机变量用函数 f(x)来表示。大于等于0,全积分为1

92. 统计量:对样本特征的某个概括性度量,是样本的函数。

93. 充分统计量:统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。

94. 抽样分布:样本统计量的概率分布,是由样本统计量的所有可能取值形成相对频数分布。 95. 渐近分布:当n 比较大时,用极限分布作为抽样分布的一种近似,这种极限分布常称为 96. 自由度:独立变量的个数。

97. 估计量:用来估计总体参数的统计量的名称

98. 估计值:估计总体参数时计算出来的估计量的具体数值

99. 点估计:用样本估计量的取值直接作为总体参数0的估计值

100. 区间估计:在点估计的基础上,给出总体参数估计的一个估计区间,该区间通常由样本统计量 加减估

计误差组成

102. 置信水平:也称为置信度或置信系数,在重复构造的总体参数的多个置信区间中包含总体参数 真值的次数所占的比例。 103. 无偏性:估计量抽样分布的期望值等于被估计的总体参数

104. 有效性:对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。 105. 一致性:随着样本量的增大,估计量的值越来越接近总体参数。 106. 独立样本:一个样本中的元素与另一个样本中的元素相互独立。

107.

匹配样本: 又称配对数据,一个样本中的数据与另一个样本中的数据相对应。

^8~~假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程 109. 原假设:也称零假设,是研究者想收集证据予以反对的假设,用 H 。表示。

备择假设:也称研究假设,是研究者想收集证据予以支持的假设,用 H 1或H a 表示。 第I 类错误:原假设正确时拒绝原假设,犯第I 类错误概率记 :?。

第U 类错误:当原假设为错误时没有拒绝原假设,犯第U 类错误的概率通常记为 -

显著性水平:假设检验中发生第I 类错误的概率,记为 〉。

小概率原理:进行假设检验利用,指发生概率很小的随机事件在一次试验中是几乎不可能发生 115. 检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本

统计量 116. 拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合 117.

临界值:根据给定的显著性水平确定的拒绝域的边界值。

118. P 值:也称观察到的显著性水平,如果原假设 H 。是正确的,那么所得的样本结果出现实际观测 结果

或更极端结果出现的概率。P 值很小说明发生概率很小,拒绝原假设,P 越小,拒绝原假设的理 由就越充分。双侧PvO.025单侧p<0.05拒绝原假设。

119. 单侧检验:也称单尾检验,是指备择假设具有特定的方向性,并含有符号“ >”或“<”的假设

检验。

120. 双侧检验:也称双尾检验,是指备择假设没有特定的方向性,并含有符号“ ”的假设检验。 列联表:由两个以上的变量进行交叉分类的频数分布表。

122. 条件分布、频数:列联表中的观察值分布称为条件分布,每个具体观察值就是条件频数。

123.

拟合优度检验:如果样本是从总体的不同类别中分别抽取,研究目的是对不同类别的目标量之 间是否

110. 111. 112.

113.

114.

存在显著性差异进行检验,我们就把它称为拟合优度检验或一致性检验。

124. ~~独立性检验:判断两个分类变量之间是否存在联系的问题,两组或多组的资料是否相互关联, 如果不关联,就称为独立。这类问题的处理称为独立性检验。

125. 方差分析:通过检验各总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。126. 因素:也称因子,是方差分析中所要检验的对象。

127. 处理:因素的不同表现称为水平或处理

128. 组内误差:来自水平内部的数据误差。

129. 组间误差:来自不同水平之间的数据误差。

130. 总平方和:反映全部数据误差大小的平方和,记为SST自变量效应加残差效应。n-1

131. 组内平方和:反映组内误差大小的平方和,记为SSE残差变量,残差效应;n-k

132. 组间平方和:反映组间误差大小的平方和,记为SSA自变量效应或因子效应;k-1

133. 单因素方差分析:只涉及一个分类型自变量的方差分析。

134. 组内方差:组内平方和除以相应的自由度。

135. 组间方差:组间平方和除以相应的自由度。

136. 双因素方差分析:方差分析中涉及两个分类型自变量时,称为~

137. 试验:收集样本数据的过程

138. 试验设计:收集样本数据的计划

139. 完全随机化设计:将k种处理随机地指派给试验单元的设计。

140. 处理指可控制的因素的各个水平

141. 试验单元:接受处理的对象或实体称为试验单元或抽样单元。

142. 随机化区组设计:先按一定规则将试验单元划分为若干同质组,区组,然后再将各种处理随机地指派给各个区组。

143. 因子设计:考虑两个因素搭配的试验设计称为因子设计。

144. 函数关系:设两变量x,y,变量y随x 一起变化,并完全依赖于x,当变量x取某数值时,y依确定关系取相应的值,则称y是x的函数,记为y=f(x).

145. 相关关系:变量之间存在的不确定的数量关系。

146. 相关分析:分析变量之间是否存在相关关系,明确其相关关系的类型,计算其相关关系的密切程度的统计分析方法

147. 相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

148. 回归模型:描述因变量y如何依赖于自变量x和误差项;的方程。

149. 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。

150. 估计的回归方程:用样本统计量代替回归方程中的未知参数,根据样本数据求出的回归方程的估计。151. 因变量、自变量:被预测或被解释的变量称为因变量,用来预测或用来解释因变量的一个或多个变量称为自变量。

152. 最小二乘法:也称最小平方法,使因变量的观察值y i与估计值?之间的离差平方和达到最小来求得?0和?的方法。

153. 回归平方和:y的总变差中由于x与y之间的线性关系引起的y的变化部分,它是可以由回归直线来解释的yi变差部分。

154. 残差平方和:除了x对y的线性影响之外的其它因素对y变差的作用,是不能由回归直线解释的yi 的变差部分。

155. 判定系数:回归平方和占总平方和的比例,记为R2

156. 估计量的标准误差:均方残差(MSE的平方根,用S e来表示。实际意义反映了用估计的回归方程预测因变量y时的预测误差的大小。越小,各观测点的代表性就越好,预测越准确,从另一个角度说明了回归直线的拟合优度。

157. 平均值的点估计:利用估计的回归方程,对于x的一个特定值X。,求出y的平均值的一个估计值E(y o)。

应用统计学复习提纲 梦翔儿 https://www.doczj.com/doc/4f5794964.html,

158. 个别值的估计值:

值?0。

利用估计的回归方程,对于x 的一个特定值X 0,求出y 的一个个别值的估计

159. 平均值的置信区间估计: 对x 的一个给定值X 。,求出y 的平均值的区间估计。 160.

个别值的预测区间估计: 对x 的一个给定值x 0,求出y 的一个个别值的区间估计。

161. 残差:因变量的观测值yi 与根据估计的回归方程求出的预测值 yP 之差,用e 表示。 162. 标准化残差:残差除以它的标准差后得到的数值用 Ze 表示。

163. 异常值:在散点图中,如果某一个点与其它点所呈现的趋势不相吻合

164. 有影响的观测值:如果某一个点或某一些观测值对回归的结果有强烈的影响,那么该观测值或 这些观

测值就是~

165. 多元线性回归模型:描述因变量 y 如何依赖于自变量X 1,X 2/,X k 和误差项;的方程。 166. 多元线性回归方程:描述y 的期望值如何依赖于X 1, X 2/,X k 的方程。

167. 估计的多元线性回归方程:根据样本数据得到的多元线性回归方程的估计。 168. 多重判定系数:在多元回归中,回归平方和占总平方和的比例。

169.

修正的多重判定系数:用模型中自变量的个数和样本量进行调整的多重判定系数,记为

R ;

170. 多重共线性:当回归模型中两个或两个以上的变量彼此相关时,则称回归模型中存在 ~

171. 虚拟变量:变量的取值本身用文字来描述,要把它们放进回归模型,必须先将其文字型数据用 数字代

码来表示,这种代码化的定性自变量称为虚拟变量。 172. 时间序列:同一现象在不同时间上的相继观察值排列而成的序列

173. 平稳序列:基本上不存在趋势的序列。

174. 非平稳序列:包含趋势性、季节性或周期性的序列

175. 趋势:也称长期趋势,指时间序列在长时期内呈现出某种持续向上或持续下降的变动。 季节变动,是指时间序列在一年内重复出现的周期性波动。

循环波动,是指时间序列中呈现出的围绕长期趋势的一种波浪形或振荡式变动。 不规则波动,是指时间序列中除去趋势、周期性和季节性之后的偶然性波动。 也称增长速度,是指时间序列中报告期观察值与基期观察值之比减 1后的结果,用%表

180. 环比增长率:报告期观察值与前一时期观察值之比减 1,说明现象逐期增长变化的程度。

181. 定基增长率:报告期观察值与某一固定时期观察值之比减 1,说明现象在整个观察期内总的增长 变化

程度。

182. 平均增长率:也称平均发展速度,是指时间序列中各逐期环比值(也称环比发展速度)的几何 平均数

减1后结果。 183. 增长1%色对值:增长率每增长一个百分点而增加的绝对数量。

184. 简单平均法预测:根据过去已有的t 期观察值通过简单平均来预测下一期的数值。 185. 移动平均法预测:通过对时间序列逐期递移求得平均数作为预测值的一种预测方法。 186. 指数平滑法预测:对过去的观察值加权平均进行预测的一种方法,该方法使得第 t + 1期的预测

值等于t 期的实际观察值与第t 期指数预测值的加权平均值。

187. 线性趋势:指现象随着时间的推移而呈现稳定增长或下降的线性变化规律。

188. 指数曲线:描述以几何级数递增或递减的现象即时间序列的观察值按指数规律变化或说时间序 列逐期

观察值按一定增长率增长衰减。

189. 在一般指数曲线的基础上增加一个常数 K,初期增长迅速,随后增长率逐渐降低,最终以 K 为增 长极

限。 190. 指数:测定多个项目在不同场合下综合变动的相对数。

191. 加权综合指数:通过加权来测定一组商品价格的综合变动状况的指数。

192. 拉氏价格指数:计算综合指数时,把作为权数的销售量固定在基期。单纯反映价格的变动水平, 不能

反映出消费结构的变化。

193. 帕氏价格指数:把作为权数的销售量固定在报告期,不同时期的指数缺乏可比性,可以同时反 映出价

176. 季节性 177. 周期性 178. 随机性 179.

增长率

格和消费结构的变化。

194~~加权平均指数:以某一时期的价值总量为权数对个体指数加权平均计算的指数。

195. 零售价格指数:反映城乡商品零售价格变动趋势的一种经济指数。

196. 消费价格指数:反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度一种相对数。

197. 股票价格指数:是反映某一股票市场上多种股票价格变动趋势的一种相对数。

统计学课后习题答案(第四版)贾俊平(第4、5、7、10章)

《统计学》第四版 第四章练习题答案 众数:M o =1O;中位数:中位数位置=n+1/2=5.5 , M e =10 ;平均数: (2) Q L 位置=n/4=2.5, Q L =4+7/2=5.5 ; Q u 位置=3n/4=7.5 , Q u =12 (4) 4.2 和 M O =23。 将原始数据排序后,计算中位数的位置为:中位数位置 =n+1/2=13,第13个位置上的数 值为23,所以中位数为 M e =23 (2)Q L 位置=n/4=6.25, Q L ==19 ; Q u 位置=3n/4=18.75,Q u =26.5 茎 叶 频数 5 5 1 6 6 7 8 3 7 1 3 4 8 8 5 (3) 第一种排队方式: 离散程度大于第二种排队方式。 (4 )选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方 式。 _ Z X i 4.4 ( 1)X 8223/30=274.1 4.1 ( 1 ) 二 X i X = n 96.9,6 10 2 ' (X i-X ) _ 156 .4 42 n -1 , 9 由于平均数小于中位数和众数,所以汽车销售量为左偏分布。 (1)从表中数据可以看出,年龄出现频数最多的是 19和23,故有个众数,即 M O =19 (3) ⑶平均数-A =600/25=24,标准差— (XLX) \ n —1 2 1062 6.65 25-1 n (4) 偏态系数SK=1.08,峰态系数K=0.77 (5) 分析:从众数、中位数和平均数来看,网民年龄在 23-24岁的人数占多数。由于标准 差较大,说明网民年龄之间有较大差异。 从偏态系数来看,年龄分布为右偏,由于偏态系数 1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。 (1)茎叶图如下: 大于 4.3 —2 '(X 一 X ) 4.08 0.714 n n -1 ■ 8 由于两种排队方式的平均数不同,所以用离散系数进行比较。 (2) X 二一^ =63/9=7, S = ■■

统计学(贾俊平,第四版)第五章习题答案

《统计原理》第五章练习题答案 5.1 (1)平均分数是范围在0-100之间的连续变量,Ω=[0,100] (2)已经遇到的绿灯次数是从0开始的任意自然数,Ω=N (3)之前生产的产品中可能无次品也可能有任意多个次品,Ω=[10,11,12,13…….] 5.2 设订日报的集合为A ,订晚报的集合为B ,至少订一种报的集合为A ∪B ,同时订两种报的集合为A ∩B 。 P(A ∩B)=P(A)+ P(B)-P(A ∪B)=0.5+0.65-0.85=0.3 5.3 P(A ∪B)=1/3,P(A ∩B )=1/9, P(B)= P(A ∪B)- P(A ∩B )=2/9 5.4 P(AB)= P(B)P(A ∣B)=1/3*1/6=1/18 P(A ∪B )=P(B A )=1- P(AB)=17/18 P(B )=1- P(B)=2/3 P(A B )=P(A )+ P(B )- P(A ∪B )=7/18 P(A ∣B )= P(B A )/P(B )=7/12 5.5 设甲发芽为事件A ,乙发芽为事件B 。 (1)由于是两批种子,所以两个事件相互独立,所以有:P(AB)= P(B)P(B)=0.56 (2)P(A ∪B)=P(A)+P(B)-P(A ∩B)=0.94 (3)P(A B )+ P(B A )= P(A)P(B )+P(B)P(A )=0.38 5.6 设合格为事件A ,合格品中一级品为事件B P(AB)= P(A)P(B ∣A)=0.96*0.75=0.72 5.7 设前5000小时未坏为事件A ,后5000小时未坏为事件B 。 P(A)=1/3,P(AB)=1/2, P(B ∣A)= P(AB)/ P(A)=2/3 5.8 设职工文化程度小学为事件A ,职工文化程度初中为事件B ,职工文化程度高中为事件C ,职工年龄25岁以下为事件D 。 P(A)=0.1 P(B)=0.5, P(C)=0.4 P(D ∣A)=0.2, P(D ∣B)=0.5, P(D ∣C)=0.7 P(A ∣D)=2/55)C P(C)P(D )B P(B)P(D )A P(A)P(D ) A P(A)P(D =++ 同理P(B ∣D)=5/11, P(C ∣D)=28/55 5.9 设次品为D ,由贝叶斯公式有: P(A ∣D)=)C P(C)P(D )B P(B)P(D )A P(A)P(D ) A P(A)P(D ++=0.249 同理P(B ∣D)=0.112 5.10 由二项式分布可得:P (x=0)=0.25, P (x=1)=0.5, P (x=2)=0.25 5.11 (1) P (x=100)=0.001, P (x=10)=0.01, P (x=1)=0.2, P (x=0)=0.789

统计学(第五版)贾俊平期末考试模拟试题二

模拟试题二 一. 单项选择题(每小题 2分,共 20 分) 一辆新购买的轿车,在正常行使条件下,一年内发生故障的次数及相应的概率如下表所示: 故障次数()0123 概率() 0.050.250.400.30 正好发生 1次故障的概率为() A . 0.05 B. 0.25 C. 0.40 D . 0.30 要观察 200 名消费者每月手机话费支出的分布状况,最适合的图形是() A.饼图 B.条形图 C.箱线图 D.直方图 从某种瓶装饮料中随机抽取 10 瓶,测得每瓶的平均净含量为 355 毫升。已知该种饮料的净含 量服从正态分布,且标准差为 5 毫升。则该种饮料平均净含量的 90%的置信区间为()

A. B. C. D. 根据最小二乘法拟合线性回归方程是使() A. D. 一项调查表明,大学生中因对课程不感兴趣而逃课的比例为 20%。随机抽取由 200 名学生组 成的一个随机样本,检验假设,,得到样本比例为。检验统计量的值为() A. D. 在实验设计中,将种“处理”随机地指派给试验单元的设计称为() A.试验单元 B.完全随机化设计

C.随机化区组设计 D.因子设计 某时间序列各期观测值依次为 10、24、37、53、65、81,对这一时间序列进行预测适合的模型是() A.直线模型 B.二次曲线模型 C.指数曲线模型 D.修正指数曲线模型 在因子分析中,变量的共同度量反映的是() A .第个公因子被变量的解释的程度 B.第个公因子的相对重要程度 C.第个变量对公因子的相对重要程度 D.变量的信息能够被第个公因子所解释的程度 如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是() A . Mann-Whitney检验 B. Wilcoxon 符号秩检验 C. Kruskal-Wallis检验 D . Spearman 秩相关及其检验 在二元线性回归方程中,偏回归系数的含义是()A.变动一个单位时,的平均变动值为 B.变动一个单位时,因变量的平均变动值为 C.在不变的条件下,变动一个单位时,的平均变动值为

统计学人教版第五版课后题答案

统计学 第五版贾俊平版课后题答案(部分) 第三章数据的图表展示 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作:

(4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表: 接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 100 5101520253035C D B A E 20406080100120 3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求: (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数: ()l g 40l g () 1.60206 111 6.32l g (2)l g 20.30103 n K =+ =+=+=,取k=6 2、确定组距: 组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3

统计学历年试卷小抄

统计学原理 一、单选题(每小题1分,共10分) 1.对某城市工业企业未安装设备进行普查,总体单位是(B)。 A.工业企业全部未安装设备B.工业企业每一台未安装设备C每个工业企业的未安装设备D.每一个工业企业 2.在组距分组时,对于连续型变量,相邻两组的组限( A)。 A.必须是重叠的B.必须是间断的 C.可以是重叠的,也可以是间断的D.必须取整数 3.在什么条件下,简单算术平均数和加权算术平均数计算结果相同( B)。 A.权数不等 B.权数相等 C.变量值相同 D.变量值不同 4.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为 原来的(C)。 A. 2倍 B. 3倍 C. 4倍 D. 1/4倍 5.当所有的观察值y都落在直线y,=o十bz上时,则x与y之间的相关系数为(B)。 A. r=0 B.ㄧγㄧ=1 C. 一1

统计学第四版答案(贾俊平)知识分享

统计学第四版答案(贾 俊平)

请举出统计应用的几个例子: 1、用统计识别作者:对于存在争议的论文,通过统计量推出作者 2、用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的 3、挑战者航天飞机失事预测 请举出应用统计的几个领域: 1、在企业发展战略中的应用 2、在产品质量管理中的应用 3、在市场研究中的应用④在财务分析中的应用⑤在经济预测中的应用 你怎么理解统计的研究内容: 1、统计学研究的基本内容包括统计对象、统计方法和统计规律。 2、统计对象就是统计研究的课题,称谓统计总体。 3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。④统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。 举例说明分类变量、顺序变量和数值变量: 分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等 顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。这里的“考试成绩等级”、“态度”等就是顺序变量。

数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。 定性数据和定量数据的图示方法各有哪些: 1、定性数据的图示:条形图、帕累托图、饼图、环形图 2、定量数据的图示: a、分组数据看分布:直方图 b、未分组数据看分布:茎叶图、箱线图、垂线图、误差图 c、两个变量间的关系:散点图 d、比较多个样本的相似性:雷达图和轮廓图 直方图与条形图有何区别: 1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距。 2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。 3、条形图主要用于展示定性数据,而直方图则主要用于展示定量数据。 一组数据的分布特征可以从哪几个方面进行描述: 1、数据的水平,反映数据的集中程度 2、数据的差异,反映各数据的离散程度 3、分布的形状,反映数据分布的偏态和峰态 说明平均数、中位数和众数的特点及应用场合: 平均数也称为均值,它是一组数据相加后除以数据的个数而得到的结果。平均数是度量数据水平的常用统计量,在参数估计以及假设检验中经常用到。

统计学期末考试复习建议 (贾俊平)

统计学期末考试复习提纲 一、简答题举例(20选4) 1.分别解释分类数据、顺序数据和数值型数据的含义。 2.分别解释抽样误差和非抽样误差的概念。 3.简述假设检验中可能犯的两类错误,并分析这两类错误的关系。 4.简述平稳序列和非平稳序列的含义。 5.解释描述统计和推断统计。 6.假设检验的基本流程包括哪些? 7.什么是统计量? 8. 相关分析主要解决哪些问题? 9.一组数据的特征可以从哪几个方面进行测度?73 10.解释多重共线性的含义306 11.什么是判定系数?它在回归分析中的主要作用是什么?279 12. 简述时间序列的预测程序。327 13. 结合你的专业学习,写出2个应用统计学知识解决实际问题的例子。 14.方差分析中有哪些基本假定?237 15.简述总体与样本、参数和统计量的含义。6 16.简述假设检验中p值的含义。188 17. 影响样本容量的因素有哪些? 18.多重共线性对回归分析有哪些影响?306 19.解释方差分析的基本思想。235 20.简述评价估计量好坏的标准156 二、计算题举例 题目1:计算分组数据的平均数、标准差、离散系数;能够画出分组数据的直方图,能够对分组数据的平均数的代表性进行比较。能够采用合适的统计量来比较不同组别的差异。 题目2:计算总体比例,总体平均数的置信区间;计算样本容量。 题目3:根据方差分析表能够写出因素个数和水平的个数,能够写出方差分析的原假设和备择假设,完成方差分析表,并能够判断不同水平对因素的影响是否显著。 题目4:根据回归结果:能够写出回归模型,解释回归系数的实际意义,检验线性关系的显著性,检验回归系数的显著性,计算出相关系数,计算出判定系数,根据实际情况对判定系数的意义进行解释,对回归模型进行评价,能够解释截距项和斜率项的含义,并且能够根据回归模型来预测因变量的平均值。

统计学第四章习题答案-贾俊平

第四章统计数据的概括性度量 4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15 要求: (1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。 解: Statistics 10 Missing0 Mean9.60 Median10.00 Mode10 Std. Deviation 4.169 Percentiles25 6.25 5010.00 75 单位:周岁1915292524 2321382218 3020191916 2327223424 4120311723 要求; (1)计算众数、中位数: 排序形成单变量分值的频数分布和累计频数分布:

网络用户的年龄 (2)根据定义公式计算四分位数。 Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析: 分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103 n K =+ =+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5 3、分组频数表 网络用户的年龄 (Binned) 分组后的直方图:

统计学贾俊平期末考试模拟试题二

模拟试题二 一. 单项选择题(每小题2分,共20分) 一辆新购买的轿车,在正常行使条件下,一年内发生故障的次数及相应的概率如下表所示: 故障次数()0 123 概率() 正好发生1次故障的概率为() A. B. C. D. 要观察200名消费者每月手机话费支出的分布状况,最适合的图形是() A.饼图 B.条形图 C.箱线图 D.直方图 从某种瓶装饮料中随机抽取10瓶,测得每瓶的平均净含量为355毫升。已知该种饮料的净含量服从正态分布,且标准差为5毫升。则该种饮料平均净含量的90%的置信区间为()

A. B. C. D. 根据最小二乘法拟合线性回归方程是使() A. B. C. D. 一项调查表明,大学生中因对课程不感兴趣而逃课的比例为20%。随机抽取由200名学生组成的一个随机样本,检验假设,,得到样本比例为。检验统计量的值为() A. B. C. D. 在实验设计中,将种“处理”随机地指派给试验单元的设计称为() A.试验单元 B.完全随机化设计

C.随机化区组设计 D.因子设计 某时间序列各期观测值依次为10、24、37、53、65、81,对这一时间序列进行预测适合的模型是() A.直线模型 B.二次曲线模型 C.指数曲线模型 D.修正指数曲线模型 在因子分析中,变量的共同度量反映的是() A.第个公因子被变量的解释的程度 B.第个公因子的相对重要程度 C.第个变量对公因子的相对重要程度 D.变量的信息能够被第个公因子所解释的程度 如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是() A.Mann-Whitney检验 B.Wilcoxon符号秩检验 C.Kruskal-Wallis检验 D.Spearman秩相关及其检验 在二元线性回归方程中,偏回归系数的含义是() A.变动一个单位时,的平均变动值为 B.变动一个单位时,因变量的平均变动值为 C.在不变的条件下,变动一个单位时,的平均变动值为

统计学试卷及答案

统计学试卷及答案 一、判断题 1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识。() 2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。 () 3.统计数据误差分为抽样误差和非抽样误差。() 4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据() 5.用来描述样本特征的概括性数字度量称为参数。() 6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数< 众数。() 7.通过散点图可以判断两个变量之间有无相关关系。() 8.所有可能样本均值的数学期望等于总体均值。() 9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变 动四种。() 10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一 种特殊相对数。() 二、单项选择题 1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是()。 A 100所中学 B 20个城市 C 全国的高中生 D 100所中学的高中生 2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。 A 分类数据 B 顺序数据 C 截面数据 D 时间序列数据

3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为() A 24 B 25 C 26 D 27 4.两组数据相比较()。 A 标准差大的离散程度也就大 B 标准差大的离散程度就小 C 离散系数大的离散程度也就大 D 离散系数大的离散程度就小 5.在下列指数中,属于质量指数的是()。 A 产量指数 B 单位产品成本指数 C 生产工时指数 D 销售量指数 6.定基增长速度与环比增长速度的关系为()。 A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积 C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1 D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%) 7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。 A 1.8% B 2.5% C 20% D 18% 8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。 A 2倍 B 3倍 C 4倍 D 5倍 9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。 A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关 10.合理施肥量与农作物亩产量之间的关系是()。 A 函数关系 B 相关关系 C 没有关系 D 正比例关系 11.在回归分析中,描述因变量y如何依赖自变量x和误差项 的方程称为()。 A 回归方程 B 回归模型 C 估计的回归方程 D 理论回归方程 12.平均指标是用来反映一组数据分布的()的指标。

统计学考试题贾俊平高等教育出版社

模拟试题一 单项选择题(每小题2分,共20分) 1.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( A ) A. 1000个消费者 B. 所有在网上购物的消费者 C. 所有在网上购物的消费者的平均花费额 D. 1000个消费者的平均花费金额 2.为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法属于( D ) A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样 3.某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在70到90分之间的学生大约占( C ) A. 95% B. 89% C. 68% D. 99% 4.已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的数学期望和抽样分布的标准误差分别为( ) A. 50,8 B. 50,1 C. 50,4 D. 8,8 5.根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生平均考试分数的置信区间为75分~85分。全班学生的平均分数( D ) A .肯定在这一区间内 B .有95%的可能性在这一区间内 C .有5%的可能性在这一区间内 D .要么在这一区间内,要么不在这一区间内 6.一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所作的一项调查中,随机抽取120个新车主中有57人为女性,在05.0=α的显着性水平下,检验2005年新车主中女性的比例是否有显着增加,建立的原假设和备择假设为( C ) A . %40:,%40:10≠=ππH H B . %40:,%40:10<≥ππH H C .% 40:,%40:10>≤ππH H D .% 40:,%40:10 ≥<ππH H 7.在回归分析中,因变量的预测区间估计是指( B ) A. 对于自变量x 的一个给定值0x ,求出因变量y 的平均值的区间 B. 对于自变量x 的一个给定值0x ,求出因变量y 的个别值的区间 C. 对于因变量y 的一个给定值 0y ,求出自变量x 的平均值的区间 D. 对于因变量y 的一个给定值0y ,求出自变量x 的平均值的区间 8.在多元线性回归分析中,如果F 检验表明线性关系显着,则意味着( A ) A. 在多个自变量中至少有一个自变量与因变量之间的线性相关系着 B. 所有的自变量与因变量之间的线性关系都显着 C. 在多个自变量中至少有一个自变量与因变量之间的线性关系不显着 D. 所有的自变量与因变量之间的线性关系都不显着 9.如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是( D ) A. 移动平均模型 B. 指数平滑模型 C. 线性模型 D. 指数模型 10.设p 为商品价格,q 销售量,则指数∑ ∑0 10q p q p 的实际意义是综合反映( B ) A. 商品销售额的变动程度 B. 商品价格变动对销售额影响程度 C. 商品销售量变动对销售额影响程度 D. 商品价格和销售量变动对销售额影响程度 二、简要回答下列问题(每小题5分,共15分) 1、简述直方图和茎叶图的区别。 2、简述假设检验中P 值的含义。 3、解释指数平滑法。 4、(15分)甲、乙两个班参加同一学科考试,甲班的平均考试成绩为86分,标准差为12分。乙班考试成绩的

统计学(第五版)贾俊平 课后思考题和练习题答案(最终完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版) 整理by__kiss-ahuang 第一部分思考题 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。

统计学期末考试试卷及答案

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质和量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容和数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降 7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以( )为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100 的样本,则可采用( )。 A Z 检验法 B t 检验法 C 2 检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小,说明( )。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%,为了对下一批产品的合格率 进行抽样检验,确定抽样数目时P 应选( )。

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

第一章: 1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特 征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数 值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学(第五版)贾俊平期末考试模拟试题

一 要从 ((

A. B. C. D. 根据最小二乘法拟合线性回归方程是使() A. B. C. D. 一项调查表明,大学生中因对课程不感兴趣而逃课的比例为20%。随机抽取由200名学生组 成的一个随机样本,检验假设,,得到样本比例为。检验统计量的值为() A. B. C. D. 在实验设计中,将种“处理”随机地指派给试验单元的设计称为() A.试验单元 B.完全随机化设计

C.随机化区组设计 D.因子设计 某时间序列各期观测值依次为10、24、37、53、65、81,对这一时间序列进行预测适合的模型是() A.直线模型 B.二次曲线模型 C.指数曲线模型 D.修正指数曲线模型 在因子分析中,变量的共同度量反映的是() A.第个公因子被变量的解释的程度 B.第个公因子的相对重要程度 C.第个变量对公因子的相对重要程度 D.变量的信息能够被第个公因子所解释的程度 如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是() A.Mann-Whitney检验 B.Wilcoxon符号秩检验 C.Kruskal-Wallis检验 D.Spearman秩相关及其检验 在二元线性回归方程中,偏回归系数的含义是() A.变动一个单位时,的平均变动值为 B.变动一个单位时,因变量的平均变动值为 C.在不变的条件下,变动一个单位时,的平均变动值为

在不,变,的为 画 简 假 :,,,一

为 :,对

模拟试题二解答 一、单项选择题(每小题2分,共20分) 1.B; 2. D; 3. C; 4. B; 5. A; 6. B; 7. C; 8. D; 9. A;10. C。 二、简要回答下列问题(每小题10分,共20分) 1. 框图如下: 2. (1)对数据进行检验,以判断手头的数据是否适合作因子分析。用于因子分析的变量必须是相关的。一般来说,相关矩阵中的大部分相关系数小于0.3,就不适合作因子分析了。 (2)因子提取。根据原始变量提取出少数几个因子,使得少数几个因子能够反映原始变量的绝大部分信息,从而达到变量降维的目的。 (3)因子命名。一个因子往往包含了多个原始变量的信息,它究竟反映了原始变量的哪些共同信息?因子分析得到的因子的含义是模糊的,需要重新命名,以便对研究的问题做出合理解释。 (4)根据因子得分函数计算因子在每个样本上的具体取值,以便对各样本进行综合评价和排序。 三、计算与分析各题(每小题15分,共60分)

统计学贾俊平第五版课后习题答案完整版

亲爱的,一章一章来,肯定能弄完的,你是最棒的! 统计学(第五版)贾俊平课后习题答案(完整版) 第一章思考题 i.i什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得岀结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域经济分析和政府分析还有物理,生物等等各个领域。 第二章思考题 2.1什么是二手资料?使用二手资料应注意什么问题 与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。 2.2 比较概率抽样和非概率抽样的特点,指出各自适用情况概率抽样:抽样时按一定的概率以随机原则抽取样本。每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

统计学试卷及参考答案

本试卷共四大题,考试时间为100 分钟。 一、单项选择题:(本大题共15 小题,每小题 2 分,共计30 分) 1. 下列变量中属于离散变量的是:() A 身高 B 体重 C 人数 D 利润 2. 某班主任想了解本班学生月生活费支出的内容,用抽签形式抽取本班10 名 同学进行调查。这种调查方式属于:() A 典型调查 B 抽样调查 C 统计报表制度 D 重点调查 3.2009 年某市生产总值7450.27 亿元,按可比价格计算,比上年增长13.6% ,达到自1996 年以来的最高水平。则() A 生产总值7450.27 亿元是数量指标,增长速度13.6% 是质量指标 B 生产总值7450.27 亿元是质量指标,增长速度13.6% 是数量指标 C 两者都是数量指标 D 两者都是质量指标 4.某企业计划规定单位生产成本比上年下降10% ,实际比上年降低15% ,则 单位生产成本计划完成相对数为:() A (1+15% )/(1+10% ) B (1-15% )/(1-10% ) C (1+15% )/(1-10% ) D 15% / 10% 5.某班同学进行的《统计学原理》期末考试中,平均分是78 分,标准差是 10 分,中位数是80 分,则该班同学本门课程成绩分布形状是() A 对称 B 右偏 C 左偏 D 无法确定 6.下列情况的统计调查,哪一种属于一次性调查() A 商品库存量 B 商品购进额 C 商品销售量 D 商品销售额 7.按人口平均计算的钢产量是() A 算术平均数 B 比例相对数 C 比较相对数 D 强度相对数

8.第六次全国人口普查的标准时点为2010 年11 月1 日0 点,11 月1 日调查

相关主题
文本预览
相关文档 最新文档