当前位置:文档之家› 统计学课后思考练习汇编

统计学课后思考练习汇编

统计学课后思考练习汇编
统计学课后思考练习汇编

医学统计学思考练习

第1章绪论思考与练习参考答案

一、最佳选择题

1. 研究中的基本单位是指 ( D )。

A.样本 B. 全部对象C.影响因素 D. 个体 E. 总体

2. 从总体中抽取样本的目的是(B )。

A.研究样本统计量 B. 由样本统计量推断总体参数

C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指(B )。

A.参与个体数 B. 描述总体特征的统计指标

C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。

A.白细胞计数 B.住院天数

C.门急诊就诊人数 D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。

A.受测量精密度限制 B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小

第2章统计描述思考与练习参考答案

一、最佳选择题

1. 编制频数表时错误的作法是(E )。

A. 用最大值减去最小值求全距

B. 组距常取等组距,一般分为10~15组

C. 第一个组段须包括最小值

D. 最后一个组段须包括最大值

E. 写组段,如“1.5~3,3~5, 5~6.5,…”

2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是(A)。

A. 中位数

B. 几何均数

C. 调和均数

D. 算术均数

E. 众数

3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用(A)。

A. 变异系数

B. 全距

C. 标准差

D. 四分位数间距

E. 百分位数P2.5与P97.5的间距4. 均数和标准差S的关系是(A)。

A. S越小,对样本中其他个体的代表性越好

B. S越大,对样本中其他个体的代表性越好

C.越小,S越大

D.越大,S越小

E.必小于

5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为(B)。

A. 阳转人数

B. 疫苗接种人数

C. 乙肝患者数

D. 乙肝病毒携带者数

E. 易感人数

6. 某医院的院内感染率为5.2人/千人日,则这个相对数指标属于(C)。

A. 频率

B. 频率分布

C. 强度

D. 相对比

E. 算术均数

7. 纵坐标可以不从0开始的图形为(D)。

A. 直方图

B. 单式条图

C. 复式条图

D. 箱式图

E. 以上均不可

第3章概率分布思考与练习参考答案

一、最佳选择题

1. 某资料的观察值呈正态分布,理论上有(C)的观察值落在范围内。

A. 68.27%

B. 90%

C. 95%

D. 99%

E. 45%

2. 正态曲线下,从均数到的面积为(A)。

A. 45%

B. 90%

C. 95%

D. 47.5%

E. 99%

3. 若正常人的血铅含量X近似服从对数正态分布,则制定X的95%参考值范围,最好采用(其中,为Y的标准差)(C)。

A. B. C. D. E. 4. 在样本例数不变的情况下,若(D),则二项分布越接近对称分布。

A. 总体率越大

B. 样本率p越大

C. 总体率越小

D. 总体率越接近0.5

E. 总体率接近0.1或0.5

5. 铅作业工人周围血象点彩红细胞在血片上的出现数近似服从(D)。

A. 二项分布

B. 正态分布

C. 偏态分布

D. Poisson分布

E. 对称分布

6. Poisson分布的均数与标准差的关系是(E)。

A. B. C. D. E.

第4章参数估计

一、最佳选择题

1.关于以0为中心的t分布,错误的是(E)

A. t分布的概率密度图是一簇曲线

B.t分布的概率密度图是单峰分布

C. 当ν→∞时,t分布→Z分布

D.t分布的概率密度图以0为中心,左右对称

E. ν相同时,值越大,P值越大

2.某指标的均数为,标准差为S,由公式计算出来的区间常称为(B)。

A. 99%参考值范围

B. 95%参考值范围

C. 99%置信区间

D. 95%置信区间

E. 90%置信区间

3.样本频率与总体概率均已知时,计算样本频率p的抽样误差的公式为(C)。

A. B. C. D. E.

4.在已知均数为, 标准差为的正态总体中随机抽样,(B)的概率为5%。

A. B. C. D. E.

5. (C)小,表示用样本均数估计总体均数的精确度高。

A. CV

B. S

C.

D. R

E. 四分位数间距

6.95%置信区间的含义为(C):

A. 此区间包含总体参数的概率是95%

B. 此区间包含总体参数的可能性是95%

C. “此区间包含总体参数”这句话可信的程度是95%

D. 此区间包含样本统计量的概率是95%

E. 此区间包含样本统计量的可能性是95%

第5章假设检验思考与练习参考答案

一、最佳选择题

1. 样本均数比较作t检验时,分别取以下检验水准,以( E )所取Ⅱ类错误最小。

A. B. C. D. E.

2. 在单组样本均数与一个已知的总体均数比较的假设检验中,结果t=

3.24,t0.05,v =2.086,t0.01,v =2.845。正确的结论是(E )。

A. 此样本均数与该已知总体均数不同

B. 此样本均数与该已知总体均数差异很大

C. 此样本均数所对应的总体均数与该已知总体均数差异很大

D. 此样本均数所对应的总体均数与该已知总体均数相同

E. 此样本均数所对应的总体均数与该已知总体均数不同

3. 假设检验的步骤是(A )。

A. 建立假设,选择和计算统计量,确定P值和判断结果

B. 建立无效假设,建立备择假设,确定检验水准

C. 确定单侧检验或双侧检验,选择t检验或Z检验,估计Ⅰ类错误和Ⅱ类错误

D. 计算统计量,确定P值,作出推断结论

E. 以上都不对

4. 作单组样本均数与一个已知的总体均数比较的t检验时,正确的理解是

( C )。

A. 统计量t越大,说明两总体均数差别越大

B. 统计量t越大,说明两总体均数差别越小

C. 统计量t越大,越有理由认为两总体均数不相等

D. P值就是α

E. P值不是α,且总是比α小5. 下列(E )不是检验功效的影响因素的是:

A. 总体标准差

B. 容许误差

C. 样本含量n

D. Ⅰ类错误

E. Ⅱ类错误

第6章两样本定量资料的比较思考与练习参考答案

一、最佳选择题

1. 正态性检验,按α =0.10检验水准,认为其总体服从正态分布,此时若推断有错,其错误的概率为(D )。

A. 大于0.10

B. 等于0.10

C. 小于0.10

D. 等于β,而β未知

E. 等于1-β,而β未知

2. 甲、乙两人分别从同一随机数字表抽取30个(各取两位数字)随机数字作为两个样本,求得、,则理论上( C )。

A. B.

C. 由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0

D. 作两样本均数比较的t检验,必然得出无统计学意义的结论

E. 作两样本方差比较的F检验,必然方差齐

3. 两样本均数比较时,能用来说明两组总体均数间差别大小的是(D)。

A. t值

B. P值

C. F值

D. 两总体均数之差的95%置信区间

E. 上述答案均不正确

4. 两小样本均数比较,方差不齐时,下列说法不正确的是( C )。

A. 采用秩和检验

B. 采用t′检验

C. 仍用t检验

D. 变量变换后再作决定

E. 要结合正态性检验结果方能作出决定

5. 两样本秩和检验的是( B)。

A. 两样本秩和相等

B. 两总体分布相同

C. 两样本分布相同

D. 两总体秩和相等

E. 两总体均数相等

6. 在统计检验中是否选用非参数统计方法( A )。

A. 要根据研究目的和数据特征作决定

B. 可在算出几个统计量和得出初步结论后进行选择

C. 要看哪个统计结论符合专业理论

D. 要看哪个值更小

E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用

7. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是( D )。

A. T越大,P值越小

B.T越大,P值越大

C. T值在界值范围内,P值小于相应的α

D. T值>界值,P值大于相应的α值

E. T值在界值范围上,P值大于相应的α

8. 成组设计两样本比较的秩和检验,其检验统计量T是(C )。

A. 为了查T界值表方便,一般以秩和较小者为T

B. 为了查T界值表方便,一般以秩和较大者为T

C. 为了查T界值表方便,一般以例数较小者秩和为T

D. 为了查T界值表方便,一般以例数较大者秩和为T

E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表

第7章多组定量资料的比较思考与练习参考答案

一、最佳选择题

1. 完全随机设计资料的方差分析中,必然有(C)。

A. >

B.

C. =+

D.

E.

2. 定量资料两样本均数的比较,可采用(D)。 A.检验 B.检验 C. Bonferroni检验 D.检验与检验均可 E. LSD检验

3. 当组数等于2时,对于同一资料,方差分析结果与检验结果相比,(C )。

A.检验结果更为准确

B. 方差分析结果更为准确

C. 完全等价且

D. 完全等价且

E. 两者结果可能出现矛盾

4. 若单因素方差分析结果为,则统计推断是(D )。

A. 各样本均数都不相等

B. 各样本均数不全相等

C. 各总体均数都不相等

D. 各总体均数不全相等

E. 各总体均数全相等

5. 完全随机设计资料的方差分析中,组间均方表示(C )。

A. 抽样误差的大小

B. 处理效应的大小

C. 处理效应和抽样误差综合结果

D.个数据的离散程度

E. 随机因素的效应大小

6. 多样本定量资料比较,当分布类型不清时应选择(D)。

A. 方差分析

B.检验

C. Z检验

D. Kruskal-Wallis检验

E. Wilcoxon检验

7. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用值而不用校正后的值,则会(C)。

A.提高检验的灵敏度

B.把一些无差别的总体推断成有差别

C. 把一些有差别的总体推断成无差别

D.Ⅰ、Ⅱ类错误概率不变

E. 以上说法均不对

第8章定性资料的比较思考与练习参考答案

一、最佳选择题

1. 定性资料的统计推断常用( D )。

A.检验

B. 正态检验

C.检验

D.检验

E. t′检验

2. 两组二分类资料发生率比较,样本总例数100,则检验自由度为(A)。A.

1 B. 4 C. 95 D. 99 E. 100

3. 四格表检验中, <,可以认为(B)。

A. 两总体率不同

B. 不能认为两总体率不同

C. 两样本率不同

D. 不能认为两样本率不同

E. 以上都不对4.等级资料比较宜采用(E)。

A.检验

B.检验

C.检验

D. 正态检验

E. 秩和检验

5. 为比较治疗某病的新疗法与常规方法,试验者将100名患者按性别、年龄等情况配成对子,分别接受两疗法治疗。观察得到有28对患者同时有效,5对患者同时无效,11对患者新药有效常规治疗无效。欲比较两种疗法的有效率是否相同,应选择的统计分析方法为( D)。

A. 独立的两组二分类资料比较检验

B. 独立的两组二分类资料比较校正检验

C. 配对的两组二分类资料比较检验

D.配对的两组二分类资料比较校正检验

E. Fisher确切概率法

第9章关联性分析思考与练习参考答案

一、最佳选择题

1. 对简单相关系数作假设检验,,统计结论为(B )。

A. 两变量不相关

B. 两变量有线性关系

C. 两变量无线性关系

D. 两变量不会是曲线关系,一定是线性关系

E. 上述说法都不准确

2. 计算积矩相关系数要求(C)。

A.是正态变量,可以不满足正态的要求

B.是正态变量,可以不满足正态的要求

C. 两变量都要求满足正态分布规律

D. 两变量只要是测量指标就行

E.是定量指标,可以是任何类型的数据

3. 对两个分类变量的频数表资料作关联性分析,可用(C)。

A. 积矩相关

B.秩相关

C. 关联系数

D. 线性相关

E.以上均可

4. 由样本算得相关系数,检验结果为<0.01,说明(D )。

A. 两变量之间有高度相关性

B.来自高度相关的总体

C.来自总体相关系数为0的总体

D.来自总体相关系数不为0的总体

E.来自总体相关系数大于0的总体

第10章简单线性回归分析思考与练习参考答案

一、最佳选择题

1.如果两样本的相关系数,样本量,那么(D)。

A. 回归系数 B.回归系数

C. 回归系数D.统计量

E. 以上均错

2.如果相关系数=1,则一定有(C)。

A. = B. =

C. = D.>

E.=3.记为总体相关系数,为样本相关系数,为样本回归系数,下列(D)正确。 A. =0时, =0 B.||>0时,>0

C.>0时,<0 D.<0时,<0 E. ||=1时, =1

4.如果相关系数=0,则一定有(D)。

A.简单线性回归的截距等于0 B.简单线性回归的截距等于或 C.简单线性回归的等于0 D.简单线性回归的等于 E.简单线性回归的等于0 5.用最小二乘法确定直线回归方程的含义是(B)。

A.各观测点距直线的纵向距离相等B各观测点距直线的纵向距离平方和最小C.各观测点距直线的垂直距离相等D各观测点距直线的垂直距离平方和最小E.各观测点距直线的纵向距离等于零

第11章多重线性回归分析思考与练习参考答案

一、最佳选择题

1. 逐步回归分析中,若增加自变量的个数,则(D)。

A. 回归平方和与残差平方和均增大

B. 回归平方和与残差平方和均减小

C. 总平方和与回归平方和均增大

D. 回归平方和增大,残差平方和减小

E. 总平方和与回归平方和均减小

2. 下面关于自变量筛选的统计学标准中错误的是( E)。

A. 残差平方和()缩小

B. 确定系数()增大

C. 残差的均方()缩小

D. 调整确定系数()增大

E.统计量增大

3. 多重线性回归分析中能直接反映自变量解释因变量变异百分比的指标为C

A. 复相关系数

B.简单相关系数

C.确定系数

D. 偏回归系数

E. 偏相关系数4. 多重线性回归分析中的共线性是指( E)。

A.关于各个自变量的回归系数相同

B.关于各个自变量的回归系数与截距都相同

C.变量与各个自变量的相关系数相同

D.与自变量间有较高的复相关

E. 自变量间有较高的相关性

5. 多重线性回归分析中,若对某一自变量的值加上一个不为零的常数,则有(D)。

A. 截距和该偏回归系数值均不变

B. 该偏回归系数值为原有偏回归系数值的倍

C. 该偏回归系数值会改变,但无规律

D. 截距改变,但所有偏回归系数值均不改变

E. 所有偏回归系数值均不会改变

第13章临床试验设计思考与练习参考答案

一、最佳选择题

1. 赫尔辛基宣言问世的年份是(D )。

A. 1961年

B. 1962年

C. 1963年

D. 1964年

E. 1965年

2. 以下未参加ICH的国家是( E )。

A. 美国

B. 日本

C. 加拿大

D. 欧盟

E. 澳大利亚3. 我国《药品注册管理办法》规定,新药Ⅱ期临床试验,试验组病例数不得少于( B )。A. 60 B. 100 C. 200 D. 300 E. 400

4. 在一般临床试验中,通常受试者的服药量在( C )以下,认为依从性比较差。A. 60% B. 70% C. 80% D. 90% E. 95%

5. 在注册药品的临床试验中,盲底可以保存在(A)处。

A.申办者

B.研究者

C.监察员

D.统计人员

E.稽查员

第14章调查设计思考与练习参考答案

一、最佳选择题

1. 为了解某校锡克试验的阳性率,研究者从该校80个班中随机抽取8个班,然后调查这些班中的所有学生。此种抽样方法属于( D )。

A. 单纯随机抽样

B. 系统抽样

C. 分层抽样

D.整群抽样

E.多阶段抽样2. 在下列研究中,研究者不能人为设置各种处理因素的是( A )。

A. 调查研究

B. 实验研究

C. 临床试验

D. 社区干预试验

E.横断面研究

3. 统计工作的关键步骤是( A )。

A. 调查或实验设计

B. 收集资料

C. 整理资料

D. 分析资料

E.归纳资料

4. 理论而言,在同样条件下,下列抽样方法中抽样误差最大的是( C )。

A. 单纯随机抽样

B. 系统抽样

C. 整群抽样 D .分层抽样E. 多阶段抽样

5. 在相同条件下对同一调查对象重复测量结果的一致性程度称作( C )。

A. 内容效度

B. 结构效度

C. 重测信度

D. 内部信度

E. 分半信度

6. 衡量问卷是否包含足够的反映所测特征的条目的指标是( A )。

A. 内容效度

B. 结构效度

C. 重测信度

D. 内部信度

E. 分半信度

7. 为使调查结果具有更高的可信度,在开展抽样调查工作中,应遵循的原则是( E )。 A. 随机 B. 重复 C. 对照 D. 均衡 E. 以上均是

8. 关于调查表的设计,下列说法不妥的是( D )。

A. 每个项目要具体、明确

B. 要考虑将来数据处理的方法

C. 调查项目的确定取决于调查目的

D. 必须先作大型的预调查

E. 必要的项目一项不少,不必要的项目一项不列

9. 下列( A )不是普查的目的。

A. 验证病因假设

B. 早期发现患者

C. 描述疾病的分布特征

D. 可向群众普及医学知识

E. 可提供病因线索

10. 在调查研究中,保护调查对象隐私的主要方法是( D )。

A. 将调查对象的电话与其他信息分开

B. 将调查对象的家庭住址与其他信息分开

C. 将调查对象的工作单位与其他信息分开

D. 将调查对象的姓名与其他信息分开

E. 将调查对象的性别与其他信息分开

11. 某研究者在对某地区20~25岁所有妇女进行的一项调查中发现,口服避孕药的妇女,其宫颈癌的年发病率为5/10万,而未服用避孕药的妇女,其宫颈癌的年发病率为2/10万,由此作出口服避孕药引起宫颈癌的推论( E )。

A. 正确

B. 不正确,因为未在年龄分布方面可能存在的差异进行调整

C. 不正确,因为没有区分发病率与患病率

D. 不正确,因为需要用率而不是比率来支持这一推论

E. 不正确,因为在其他有关因素上,这两组妇女可能存在差异

12. 为研究吸烟与肺癌的关系,某研究者采取了两种研究方法:一种是将人群分为吸烟组与不吸烟组,然后随访两组发生肺癌的结局;另一种是将吸烟者随机分组,一组采取戒烟干预,而另一组不戒烟,然后盲法观察两组的肺癌结局。这两种研究方法的根本区别是( D )。

A. 是否设立对照组

B. 是否进行统计学检验

C. 是否在现场人群中进行

D. 是否人为控制研究条件

E. 是否检验病因假设

第15章样本含量估计思考与练习参考答案

一、最佳选择题

1. 在假设检验中,样本含量的确定(C)。

A.只与Ⅰ类错误概率有关

B.只与Ⅱ类错误概率有关

C.与、都有关

D. 与、都无关

E. 只与、有关

2. 以下关于检验功效的描述,不正确的是(C)。

A. 假设检验中,若客观上不成立,但根据假设检验的规则,将有大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为,称为检验功效。

B.检验功效受客观事物差异的大小、个体间变异的大小、样本量和值等要素的影响。

C.假设检验的“阴性”结果(>0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。

D.假设检验得出“阴性”结果(>0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。

E.当假设检验出现“阴性”结果(>0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。

3.在调查研究中,计算配对设计均数比较所需样本含量的公式为(A)。

A. B. C. D.

E.

4. 在调查研究中,计算两样本率比较所需样本含量的公式为(E)。

A. B. C. D.

E.

5. 有很多人都认为,只要样本含量大于30就可以称其为大样本,可用大样本条件下推导出来的一切公式进行相应的统计分析。下列说法中(C)最正确。

A题中所说的条件和结论都正确 B.题中所说的条件正确,但结论不正确C.题中所说的条件和结论都不正确 D.题中所说的条件不正确,但结论正确E.题中所说的条件和结论正确概率为70%,错误概率为30%

6.在研究一个因变量依赖多个自变量变化规律时,估计样本含量非常复杂,有人提供了一个经验估算方法,即样本含量N(即拟观测的个体数目)至少应当是自变量个数的10倍。下列说法中(B)最正确。

A此法无任何参考价值 B在没有精确算法时,此法有一定的参考价值 C此法根本不能用D.此法永远是正确的E.此法正确的概率为80%,错误的概率为20%

第16章随机区组设计和析因设计资料的分析思考与练习参考答案

一、选择题

1.对于随机区组设计资料,应用单因素方差分析与用随机区组方差分析的结果相比,( A )。

A. 两种方法适用的资料不同而不可比

B. 检验效果不能确定

C. 两种方法都可以用

D. 两种方法检验效果相同

E. 以上均不对

2.在某项实验中欲研究A、B两因素对某观测指标的影响,A、B两因素分别有2个和3个水平,观测指标为数值型变量,假设检验的方法应选用(D )。A. 随机区组设计资料的方差分析

B. 析因设计资料的方差分析

C. Friedman检验

D. 根据设计类型、资料分布类型、变异情况和研究目的等选择的检验方法。

E. 以上均不对

3. 与完全随机设计及其方差分析相比,随机区组设计及其方差分析可以使其(A )。 A. 变异来源比前者更多 B. 误差一定小于前者

C. 前者的效率高于后者

D. 影响因素的效果得到分析

E. 以上说法都不对

4.下面说法中不正确的是( D )。

A.方差分析可以用于两个样本均数的比较

B.完全随机设计更适合实验对象的混杂影响不太大的资料C.在随机区组设计中,每一个区组内的例数都等于处理数D.在随机区组设计中,区组内及区组间的差异都是越小越好E.以上均不对5.配对t检验可用(B )来替代。

A.完全随机设计资料的方差分析B.随机区组设计资料的方差分析C.A、B两种方差分析都可以

D.析因设计的方差分析

E.以上都不可以

第18章 Logistic回归思考与练习参考答案

一、最佳选择题

1. Logistic回归与多重线性回归比较,(A )。

A.logistic回归的因变量为二分类变量

B.多重线性回归的因变量为二分类变量

C.logistic回归和多重线性回归的因变量都可为二分类变量

D.logistic回归的自变量必须是二分类变量

E.多重线性回归的自变量必须是二分类变量

2. Logistic回归适用于因变量为( E )。

A.二分类变量 B.多分类有序变量 C.多分类无序变量D.连续型定量变量 E.A、B、C均可

3. Logistic回归系数与优势比OR的关系为(E )。

A. 0等价于OR>1 B. 0等价于OR<1 C.=0等价于OR=1

D.<0等价于OR<1 E.A、C、D均正确

4. Logistic回归可用于( E )。

A.影响因素分析 B.校正混杂因素 C.预测

D.仅有A和C E.A、B、C均可

5. Logistic回归中自变量如为多分类变量,宜将其按哑变量处理,与其他变量进行变量筛选时可用(D )。

A.软件自动筛选的前进法 B.软件自动筛选的后退法

C.软件自动筛选的逐步法 D.应将几个哑变量作为一个因素,整体进出回归方程

E.A、B、C均可

第19章生存分析思考与练习参考答案

一、最佳选择题

1. 下列有关生存时间的定义中正确的是(E )。

A.流行病学研究中,从开始接触某危险因素至某病发病所经历的时间B.乳腺增生症妇女治疗后阳性体征消失至首次复发的时间C.肺癌患者从手术治疗开始到死亡的时间D.急性白血病患者从治疗开始到缓解的时间E.以上均正确

2. 教材表19-18表是急性白血病患者药物诱导后缓解至首次复发的随访记录。

教材表19-18 急性白血病患者药物诱导后缓解至首次复发的随访记录

编号缓解日期终止观察日期结局生存时间/天

1 2000.04.01 2000.09.06 复发 158

2 2001.11.05 2002.02.05 死亡 91

3 2000.07.15 2000.12.10 复发 147

4 2001.05.20 2001.08.2

5 失访 96

5 2002.09.03 2002.12.31 缓解 119

……………

生存时间属删失数据的有(C)。

A.1号和3号 B.1号和2号 C.2号、4号和5号 D.2号、3号和4号 E.1号、2号和3号

3. 下列有关log-rank检验的描述中正确的是(A)。

A.log-rank检验是各组生存率的整体比较B.log-rank检验是各组生存率某时间点的比较C.log-rank检验属生存曲线比较的参数法D.log-rank检验中,各组实际死亡数必等于理论死亡数E.log-rank检验的自由度为1

4. Log-rank检验与Breslow检验相比,(B )。

A.log-rank检验对组间死亡近期差异敏感 B.log-rank检验对组间死亡远期差异敏感C.Breslow检验对组间死亡远期差异敏感 D.两者对组间死亡远期差异同样敏感 E.两者对组间死亡近期差异同样敏感

5. Cox回归模型要求两个不同个体在不同时刻的风险函数之比(D)。

A随时间增加而增加 B.随时间增加而减小 C.开始随时间增加而增加,后来随时间增加而减小 D.不随时间改变 E.视具体情况而定

第25章Meta分析思考与练习参考答案

一、最佳选择题

1. Meta分析中,如果异质性检验不拒绝H0,一般采用(B)进行效应合并。A.随机效应模型 B. 固定效应模型 C.混合效应模型

D. 回归模型

E. 贝叶斯模型

2. 关于meta分析,以下(C)说法不正确。

A.meta分析本质上是一种观察性研究,因而可能存在各种偏倚

B.meta分析是用定量的方法综合同类研究结果的一种系统评价

C.采用随机效应模型能使meta分析的结果更加可靠

D.meta分析时,如果研究间异质性很大,应认真考察异质性的来源,并考虑这些研究的可合并性

E.亚组分析能使meta分析的结果更有针对性

3. 对连续型变量资料的meta分析,如果各纳入研究的测量单位不同,应采用(A)作为效应合并指标。

A.标准化均数差 B. 加权均数差 C.均数差

D. 标准化P值

E. 危险度差值

4. 异质性检验采用的统计量是(B)。

A.F统计量B. Q统计量 C.t统计量 D.H统计量 E. Z统计量

5. 关于发表偏移,以下说法(C)不正确。A.通过漏斗图可大致判断是否存在发表偏倚

B.产生发表偏倚的主要原因是作者往往只把统计学上有意义的阳性研究结果拿来写文章并投稿

C.若发表偏倚对meta分析的影响较大,则需要增加很多个研究,才能使meta 分析的结果被逆转

D.尽量搜集未发表的阴性研究结果,可减少发表偏倚

E.漏斗图的基本思想是纳入研究效应的精度随着样本含量的增加而增加

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

统计学基础课后思考题答案(仅供参考)前六章

第一章概论 1、“统计”一词有统计工作、统计资料、统计学三种涵义。统计资料是统计工作的成果,统计工作和统计资料是过程与成果的关系。 2、统计学的研究对象是客观现象(包括社会现象和自然现象)总体的数量方面。它具有数量性、总体性、变异性、具体性、社会性的特点。 3、统计学的性质是属于方法论学科,统计学是一门研究客观现象总体数量方面的独立的方法论科学。 4、统计学的基本研究方法:大量观察法、统计分组法、综合指标法、统计模型法、归纳推断法。 5、统计学的基本职能有:信息职能、咨询职能、监督职能。 6、统计的基本任务:一方面是以国民经济和社会发展为统计调查的对象,在对其数量方面进行科学的统计分析的基础上,为党和国家制定政策、各部门编制计划,指导经济和社会发展及进行科学管理提供信息和咨询服务;另一方面则是对国民经济和社会的运行状态、国家政策,计划的执行情况等进行统计监督。 7、统计工作的过程包括:统计设计、统计调查、统计整理和统计分析。 8、统计总体是指客观存在的,在同一性质的基础上结合起来的许多个别事物构成的整体,简称总体。总体单位是指构成总体的个别事物,简称个体。总体和总体单位是整体与部分、集合与元素的关系,它们互为存在条件。总体是界定总体单位的前提条件,总体单位是构成总体的基本元素。 9、标志按性质不同可分为品质标志和数量标志,按变异情况可分为不变标志和可变标志。 10、统计指标的特点:数量性、综合性、具体性。统计指标按其说明总体特征的性质不同,可分为数量指标和质量指标;按表现形式不同,可分为总量指标、相对指标,平均指标;按计量单位的不同,可分为实物量指标、价值指标和劳动量指标;按指标功能的不同,可分为描述指标、评价指标和预警指标。 11、(简)指标与标志的联系,具有对应关系、汇总关系、转换关系;指标与标志的区别,说明对象范围的不同,具体表现形式不同。(详)指标与标志有哪些区别及联系? 区别: ①指标和标志的概念明显不同,标志是说明个体特征的,一般不具有综合的特征:指标是说明总体特征的,具有综合的性质。 ②统计指标分为数量指标和质量指标,它们都是可以用数量来表示的;标志分为数量标志和品质标志,它们不是都可以用数量来表示,品质标志只能用文字表示。 联系: ③统计指标是建立在标志值的基础之上的,它是各个总体单位的数量标志值的汇总,没有总体单位的标志值 也就不可能有总体的指标值。 ④随研究目的不同,指标与标志之间可以互相转化。两者体现这样的关系,指标在标志的基础上形成,指标又是确定标志的依据。 12、变量的分类:按变量值是否连续,可分为连续型变量和离散型变量;按照其性质不同,可分为确定性变量和随机变量。13、统计指标体系分为基本统计指标体系和 专题统计指标体系两大类。 第二章统计调查 1、统计调查是根据统计研究的目的、要求和 任务,采用科学的调查方法,有计划、有组 织地搜集统计资料的工作过程。统计调查在 统计工作的整个过程中,担负着提供基础资 料的任务,所有的统计计算和统计研究都是 在原始资料搜集的基础上建立起来的。 2、统计调查的基本要求: (1)准确性。即统计调查得到的资料应 该是真实可靠的、符合客观实际,不受人的 主观偏见和错误意识的影响。 (2)及时性。即统计调查要按时完成资 料的搜集和上报任务,以及充分发挥统计资 料的时间价值。 (3)完整性。统计调查搜集的资料,一 是要调查单位的完整、做到调查单位不重复、 不遗漏,以保证反映被研究对象整体的面貌; 二是要做到搜集的项目齐全,调查项目不仅 具有层次性,而且是紧密链接、赋予逻辑联 系,齐全的调查项目才能实现调查研究的目 的和任务。 3、一份完整的统计调查方案,应包括: (1)确定调查目的; (2)确定调查对象、调查单位和报告单位; (3)拟定调查项目、制定调查表; (4)规定调查时间和调查期限、调查地点 和方法; (5)制定调查工作的组织实施计划。 4、调查表的内容有:表头、表体和表脚。 调查表分无记名调查反馈表和记名调查 反馈表。 5、统计调查的组织形式有统计报表、普查、 重点调查、典型调查和抽样调查。 6、重点调查与典型调查有何异同? 相同点: 都是非全面调查;调查单位少,可节省 人力、物力、时间;灵活性强;属于有部分 到全面的调查方式。 区别: (1)定义不同 重点调查是一门专门组织的非全面调 查,它是在调查对象的全部单位中只选择一 小部分重点单位进行调查,以了解总体的基 本情况。 典型调查是一种十分重要的,行之有效 的非全面调查方法。它是根据调查目的和要 求,在对被研究对象做全面分析的基础上, 有意识地从中选择少数具有代表性的典型单 位进行深入细致地调查研究,以便认识事物 的本质及其规律性的一种非全面调查。 (2)特点不同 重点调查的主要特点是:投入少、调查 速度快、所反映的主要情况或基本趋势比较 准确。 典型调查的主要特点是:调查单位少、 机动灵活、典型单位的选择带有一定的主观 性、典型单位可以注重于现象数量方面的分 析。 (3)组织形式不同 重点调查既可以是一次性调查性调查, 也可以用于经常性调查。其组织形式可以是 组织专门调查,也可以颁发统计报表,由选 中重点单位填报。 典型调查一般有两种方式:“解剖麻雀” 式和“化类选典”式。 (4)调查方式的优缺点不同 重点调查:优点:调查单位少,可调查 较多的项目和指标,了解较详细的效果,能 使党政领导尽快的掌握基本情况,发现问题, 采取措施,以指导工作。 缺点:因为重点调查单位与一般单位的 差别较大,通常不能用重点调查结果来推算 调查总体的指标 典型调查:优点:是补充全面调查资料 的缺口,利用典型调查资料,可以分析全面 调查不能认识清楚地一些具体问题,还可以 深入研究新生事物,找出事物变化发展的规 律,用来推断总体的指标数值。 缺点:主要是针对问题的普遍性研究, 不够深入 根本区别在于选取调查单位的方法不同。 典型调查单位的选择取决于调查者的主 观判断,因此具有主观性。重点调查单位的 选择取决于某一标志总量在总体所占比重, 因此具有客观性。 典型调查虽然在一定条件下,能根据典 型单位估计推断总体。但由于无法合理估计 其误差,因此不能根据典型单位的数量特征, 推断总体单位的数量特征。不过,可以利用 典型调查得到的具体、详细事例,补充分析 抽样调查无法获得具体、详细事例的不足。 7、统计调查的方法有:观察法、询问法、报 告法、网络调查法和问卷调查法。 观察法:优点是取得的资料比较准确; 缺点是花费的人力、物力、财力和时间都较 多,而且具有局限性。 询问法:优点是调查者能按统计口径逐 项询问,对统计项目有统一的理解,可保证 调查资料的准确性;缺点是花费大量的人力 和时间。 报告法:优点是准确性不亚于观察法; 缺点是花费较多的人力和物力。 网络调查法:优点是速度快、费用低、 易获得联系性数据、调研内容设置灵活、调 研群体大和可视性强;缺点是代表性问题、 安全性问题和无限制样本问题。 问卷调查法:优点是节省时间、经费和 人力;调查结果容易量化、便于统计处理与 分析;现在的电子问卷克服了纸质问卷的一 些缺点,方便实施与调整;可以进行大规模 的调查。 缺点是面向设计的问题问卷调查比较 难;调查结果广而不深;问卷调查经常采用 由用户自己填答问卷的方式,所以其调查结 果的质量常常得不到保证。;问卷调查的回 收率难以保证。 8、调查问卷的结构由卷首语(开场白)、正 文和结尾组成。 问卷的设计形式有开放式和封闭式。 第三章统计数据的整理与显示 1、统计数据整理的主要内容(步骤)是:(1) 统计资料整理方案的设计;(2)对调查资料 的审核;(3)对调查资料进行科学的分组、 汇总;(4)数据资料的显示——编制和绘制 统计表(图);(5)统计资料的保管与积累。 2、统计分组就是根据统计研究的目的和被研 究现象总体的内在特征,将统计整体按照一 定的标志划分为若干性质不同的部分或组的 一种统计方法。统计分组的关键在于确定分 组标志和组距。

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核B.编制统计表 C.统计汇总问题D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性B.正确性 C.全面性D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组B.60在第二组,80在第五组 C.70在第四组,80在第五组D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列B.单项式分布数列 C.开口式数列D.异距式数列 5.组距式分布数列多适用于() A.随机变量B.确定型变量 C.连续型变量D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数B.下限以上的累计次数 C.各组分布的次数D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线B.J型分布曲线 C.右偏分布曲线D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉B.不等 C.重叠D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组B.逻辑检查 C.数据录入D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类B.组限 C.组距D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布B.χ型分布 C.U型分布D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列B.品质数列 C.单项数列D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有()

统计学思考题答案

4.1一组数据的分布特征可以从哪几个方面进行测度? 数据分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集中的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2. 4.5简述众数、中位数和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受极端值的影响。当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。 平均数对数值型数据计算的,而且利用了全部数据信息,在实际应用中最广泛。当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但平均数易受极端值的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。 4.7标准分数有哪些用途? 标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。 7.3怎样理解置信区间? 置信区间:由样本统计量所构造的总体参数的估计区间 7.4解释95%的置信区间。 95%的置信区间指用某种方法构造的所有区间中有95%的区间包含总体参数的真值。 7.5 Za/2的含义是什么 含义:Za/2是标准正态分布上侧面积为a/2的z值,公式是统计总体均值时的边际误差。 7.6 解释独立样本和匹配样本的含义。 独立样本:如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立。 匹配样本:一个样本中的数据与另一个样本中的数据相对应。 7.8简述样本量与置信水平、总体方差、边际误差的关系。 样本量越大置信水平越高,总体方差和边际误差越小 10.1什么是方差分析?它研究的是什么? 答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。 10.4方差分析中有哪些基本假定? 答:方差分析中有三个基本假定: (1)每个总体都应服从正态分布 (2)各个总体的方差σ2必须相同 (3)观测值是独立的

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

统计学原理课后简答题答案

统计学原理简答题 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 2.2比较概率抽样和非概率抽样的特点,指出各自适用情况 概率抽样:抽样时按一定的概率以随机原则抽取样本。每个单位别抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽到的概率。技术含量和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参数的置信区间,就使用概率抽样。

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: 40个企业按产品销售收入分组表 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学(第三版)李金昌课后简答题----个人整理版汇总

《统计学》简答题 第一章 1.统计的含义与本质是什么? 含义:1、统计工作:调查研究。资料收集、整理和分析。 2、统计资料:工作成果。包括统计数据和分析报告。 3、统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。 本质:就是关于为何统计,统计什么和如何统计的思想。 2.什么是统计学?有哪些性质? 统计学是关于如何收集、整理和分析统计数据的科学。统计学就其研究对象而言,具有数量性、总体性和差异性的特点;就其学科范畴而言,具有方法型、层次性和通用性的特点;就其研究方式而言,具有描述性和推断性的特点。 3.统计学数据可分为哪几种类型,不同类型数据各有什么特点? 1)按照所采用的计量尺度,可分为定性数据和定量数据 定性数据是只能用文字或数字代码来表现事物的品质特征或属性特征的数据,具体分为定序数据和定类数据。定量数据是只能用数值来表现事物数量特征的数据,具体分为定距数据和定比数据。 2)按照表现形式不同,可以分为绝对数、相对数和平均数 绝对数是用以反映现象或事物绝对数量特征的数据。以最直观、最基本的形式体现现象或事物的外在数量特征,有明确的计量单位,是表示直接数量标志或总量标志的形式。 相对数是用以反映现象或事物相对数量特征的数据。通过另外两个相关统计数据的对比来体现现象或事物之间的联系关系,其结果主要表现为没有明确计量单位的无名数。 平均数是用以反映现象或事物平均数量特征的数据。体现现象或事物某一方面的一般数量水平。 3)按收集方法,可分为观测的数据和实验的数据 观测数据:数据是在没有对事物进行人为控制的条件下得到的。 实验数据:数据是在实验中控制实验对象而收集到的。 4)按照被描述的对象和时间的关系,可分为截面数据和时间序列数据 截面数据:描述的是现象在某一时刻的变化情况。 时间序列数据:描述的是现象随时间而变化的情况。 5)按照加工程度不同,可以分为原始数据和次级数据 原始数据是指直接向调查对象收集的、尚待加工整理、只反映个体特征的数据,或通过实验采集的原始记录数据。 次级数据是指已经经过加工整理、能反映总体数量特征的各种非原始数据。 4.如何正确理解描述统计与推断统计的关系? 描述统计和推断统计是统计方法的两个组成部分。描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容。描述统计对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。推断统计是和假设检验联系在一起的,这只是简单的描述现象,并没有进行假设,再利用数据检验,得出推断的结果。 5.统计研究的基本过程如何?常用的统计方法有哪些? 统计设计,数据搜集,数据整理,数据分析与解释(核心、最终目的) 常用的统计方法:大量观察发、统计分组法、综合指标法、统计推断法、统计模型法

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章 统计描述 【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成%。 成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成%。 劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成%。 【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%, 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【】我国1991年和1994年工业总产值资料如下表:

要求: (1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ (3) %37.25 1%) 451(2824851353 ≈-+ 即,94年实际比计划增长%。 【】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。

贾俊平 统计学(第六版)思考题答案

第一章: 1、什么是统计学 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

相关主题
文本预览
相关文档 最新文档