当前位置:文档之家› 最新第4章-参数估计思考与练习参考答案

最新第4章-参数估计思考与练习参考答案

最新第4章-参数估计思考与练习参考答案
最新第4章-参数估计思考与练习参考答案

第4章 参数估计 思考与练习参考答案

一、最佳选择题

1.关于以0为中心的t 分布,错误的是( E )

A. t 分布的概率密度图是一簇曲线

B. t 分布的概率密度图是单峰分布

C. 当ν→∞时,t 分布→Z 分布

D. t 分布的概率密度图以0为中心,左右对称

E. ν相同时,t 值越大,P 值越大

2.某指标的均数为X ,标准差为S ,由公式()

1.96, 1.96X S X S -+计算出来的区间常称为( B )。

A. 99%参考值范围

B. 95%参考值范围

C. 99%置信区间

D. 95%置信区间

E. 90%置信区间

3.样本频率p 与总体概率π均已知时,计算样本频率p 的抽样误差的公式为( C )。

4.在已知均数为μ, 标准差为 σ 的正态总体中随机抽样, X μ->( B )的概率为5%。

A.1.96σ

B.1.96X σ

C.0.05/2,t S ν

D.0.05/2,X t S ν

E.0.05/2,X t νσ

5. ( C )小,表示用样本均数估计总体均数的精确度高。

A. CV

B. S

C. X σ

D. R

E. 四分位数间距 6. 95%置信区间的含义为( C ):

A. 此区间包含总体参数的概率是95%

B. 此区间包含总体参数的可能性是95%

C. “此区间包含总体参数”这句话可信的程度是95%

D. 此区间包含样本统计量的概率是95%

E. 此区间包含样本统计量的可能性是95%

二、思考题

1. 简述标准误与标准差的区别。

答: 区别在于:

(1)标准差反映个体值散布的程度,即反映个体值彼此之间的差异;标准误反映精确知道总体参数(如总体均数)的程度。

(2)标准误小于标准差。

(3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,但标准差不

随样本含量的改变而有明显方向性改变,随着样本含量的增大,标准差有可能增大,也有可能减小。

2. 什么叫抽样分布的中心极限定理?

答: 样本含量n越大,样本均数所对应的标准差越小,其分布也逐渐逼近正态分布,这种现象统计学上称为中心极限定理(central limit theorem)。

当有足够的样本含量(如30

n≥)时,从任何总体中抽取随机样本的样本均数近似地服从正态分布。样本含量越大,X抽样分布越接近于正态分布。

正态分布的近似程度与总体自身的概率分布和样本含量有关。如果总体原本就是正态分布,那么对于所有n值,抽样分布均为正态分布。如果总体为非正态分布,X仅在n值较大情况下近似服从正态分布。一般说,30

n≥时的X抽样分布近似为正态分布;但是,如

果总体分布极度非正态(如双峰分布、极度偏峰分布),即使有足够大的n值,抽样分布也将为非正态。

3. 简述置信区间与医学参考值范围的区别。

答: 置信区问与医学参考值范围的区别见练习表4-1。

练习表4-1 置信区间与医学参考值范围的区别

区别置信区间参考值范围

含义

用途总体参数的波动范围,即按事先给定的概

率100(1-α)%所确定的包含未知总体参

数的一个波动范围

估计未知总体均数所在范围

σ未知:

/2,X

X t S

αν

±

个体值的波动范围,即按事先给定的

范围100(1-α)%所确定的“正常人”

的解剖、生理、生化指标的波动范

供判断观察个体某项指标是否“正常”

时参考(辅助诊断)

正态分布:

/2

X Z S

α

±

计算公式

σ已知或σ未知但n ≥30,有/2X X Z ασ±或

/2X X Z S α±

偏峰分布:P X ~P 100-X

4. 何谓置信区间准确度与精确度?如何协调两者间的关系。

答:置信区间有准确度(accuracy )与精密度(precision )两个要素。准确度由置信度 (1-α) 的大小确定,即由置信区间包含总体参数的可能性大小来反映。从准确度的角度看,置信度愈接近于1愈好,如置信度99%比95%好。精密度是置信区间宽度的一半(即

2,X t S α

ν

、2,p Z S αν),意指置信区间的两端点值离样本统计量(如X 、p )的距离。从精

密度的角度看,置信区间宽度愈窄愈好。在抽样误差确定的情况下,两者是相互矛盾的。为了同时兼顾置信区间的准确度与精密度,可适当增加样本含量。

三、计算题

1.随机抽取了100名一年级大学生,测得空腹血糖均数为4.5 mmol/L ,标准差为0.61 mmol/L 。试估计一年级大学生空腹血糖总体均数及方差的95%置信区间。

答:总体均数95%置信区间为(4.379,4.621),方差的95%置信区间为(0.286 9, 0.502 1)。

2.调查某地蛲虫感染情况,随机抽样调查了260人,感染人数为100。试估计该地蛲虫感染率的95%置信区间。

答:该地蛲虫感染率的95%置信区间为(32.55%,44.38%)。

(宇传华)

医学统计学名词解释复习资料

1. 总体(population):根据研究目的所确定的同质观察单位的全体。只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。假想的,无时间和空间概念的,称为无限总体(infinite population)。 2. (总体)参数(parameter):总体的统计指标或特征值。总体参数是事物本身固有的、不变的。 3. 样本(sample):从总体中随机抽取的部分个体。 4. 样本含量(sample size):样本中所包含的个体数。 5. 变量(variable):观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。变量的取值称为变量值或观察值(observation)。根据变量的取值特性,分为数值变量和分类变量。 6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。对每个观察单位用定量的方法测定某项指标的数值,组成的资料。 7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。 9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 10. 误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差 。 11. 可信区间(confidence interval, CI):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。 12. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95%和99%,故常用95%和99%的可信区间。 13. 变异(variation):同质事物间的差别。由于观察单位通常即为观察个体,故变异亦称为个体变异(individual variation)。 16. 平均数(average):也叫平均值,是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数(arithmetic mean)、几何平均数(geometric mean)、中位数(median)等。 17. 中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M 表示。适用于偏态分布资料或不规则分布资料和开口资料。所谓“开口”资料,是指数据的一端或两端有不确定值。当n 为奇数时,M=X (n+1)/2;当n 为偶数时,M=[X n/2+ X n/2+1]/2。 18. 百分位数(percentile):是一种位置指标,以P x 表示,一个百分位数Px 将全部观察值分为两个部分,理论上有x%的观察值小于Px 小,有(1-x%)的观察值大于Px 。 19. 变异系数(coefficient of variance, CV):亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。100%X s/CV ?=, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 20. 频率(relative frequency):在n 次随机试验中,事件A 发生了m 次,则比值 22. 概率(probability):在重复试验中,事件A 的频率,随着试验次数的不断增加将愈来愈接近一个常数p ,这个常数p 就称为事件A 出现的概率(probability),记作P(A)或P 。 描述随机事件发生的可能性大小的数值,常用P 来表示。 23. 统计量(statistic):由样本所算出的统计指标或特征值。 24. 相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数(coefficient of product-moment correlation),总体相关系数用希腊字母ρ表示,而样本相关系数用r 表示,取值范围均为[-1, 1]。 25. 回归系数(regression coefficient):直线回归方程Y ?= a+b X 的系数b 称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 26. 参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。绝大多数:可以是90%、95%、99%等等,最常用的是95%。正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。 28. 统计推断(statistic inference):从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。 29. 标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。据此,样本均数的标准差X σ称为标准误。 30. 参数估计(parameter estimation):由样本信息估计总体参数。它包括两种:点估计和区间估计。 点估计:直接用样本统计量作为对应的总体参数的估计值。 区间估计:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间(confidence interval, CI ),又称置信区间。这种估计方法称为区间估计。 33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。 34.Ⅰ类错误(type Ⅰerror):统计学上规定,拒绝了实际上成立的H 0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示。 35.Ⅱ类错误(type Ⅱerror):统计学上规定,不拒绝实际上不成立的H 0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。 36. 检验效能(power of a test):又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。 37. 参数检验:总体分布已知,对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数统计或参数检验。 38. 参数检验:假定比较数据服从某分布,通过参数的估计量(x , s)对比较总体的参数(μ)作检验,统计上称为参数法检验(parametric test)。如t 、u 检验、方差分析。 39. 率(rate):又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。其计算公式为: 40. 构成比(proportion):又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示。 41. 比(ratio):又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百分之几,它是对比的最简单形式。其计算公式为:比=A/B 。 统计学(Statistics ):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。 总体(population ):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample ):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

第八章 参数估计

第八章参数估计 一、思考题 1.什么是参数估计?参数估计有何特点? 2.评价估计量优劣的准则是什么? 3.什么是点估计、区间估计?二者有何联系和区别? 4.确定必要的抽样数目有何意义?必要抽样数目受哪些因素影响? 二、练习题 (一)填空题 1.参数估计的方法有_________和_________。 2.若样本方差(s n21-)的期望值等于总体方差(σ2),则称s n21-为σ2的____________估计量 3.总体参数的估计区间是由_________和_________组成。 4.允许误差是指与的最大绝对误差范围。 5.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是 ______,允许误差是______。 6.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量。 x=5,7.设总体X的方差为1,从总体中随机取容量为100的样本,得样本均值 =2.58) 则总体均值的置信水平为99%的置信区间_____________。(Z 0.005 (二)判断题 1( )参数估计就是用样本统计量去估计总体的参数。 2( )随机抽样是参数估计的前提。 3( )参数估计的抽样误差可以计算和控制。 4( )估计量的数学期望等于相应的总体参数值,则该估计量就被称为相应总体参数的无偏估计量。 5( )区间估计就是根据样本估计量以一定的置信度推断总体参数所在的区间范围。

6( )样本统计量n x x s ∑-=22)(是总体参数2σ的无偏估计量。 7( )估计量的有效性是指估计量的方差比其它估计的方差小。 8( )点估计是以样本估计量的实际值直接作为相应总体参数的估计值。 9( )抽样估计的置信水平就是指在抽样指标与总体参数构造的置信区间中, 包含总体参数真值的区间所占的比重。 10( )样本容量一定时,置信区间的宽度随置信水平的增大而减小。 (三)单选题 1.极限误差是指样本统计量和总体参数之间( )。 A.抽样误差的平均数 B.抽样误差的标准差 C.抽样误差的可靠程度 D.抽样误差的最大可能范围 2.参数估计的主要目的是( )。 A.计算和控制抽样误差 B. 为了深入开展调查研究 C.根据样本统计量的数值来推断总体参数的数值 D. 为了应用概率论 3.参数是指基于( )计算的指标值。 A.样本 B.某一个样本 C.多个样本 D.总体 4.总体参数很多,就某一参数(如均值)而言,它的取值( )。 A.是唯一的 B.不是唯一的 C.随样本的变化而变化 D.随抽样组织形式的变化而变化 5.样本统计量很多,就某一统计量(如均值)而言,它的取值( )。 A.是唯一的 B.随样本的变化而变化 C.由总体确定 D.由抽样的组织形式唯一确定 6.以样本均值x 估计正态总体的均值μ时,如果总体方差2σ已知,这时将会需要查阅( )。 A.正态分布表 B.标准正态分布表 C.t 分布表 D.2χ分布表 7.以样本均值x 估计正态总体的均值μ时,如果总体方差2σ未知,这时将会需要查阅( )。

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

第4章 参数估计思考与练习参考答案

第4章 参数估计 思考与练习参考答案 一、最佳选择题 1.关于以0为中心的t 分布,错误的是( E ) A. t 分布的概率密度图是一簇曲线 B. t 分布的概率密度图是单峰分布 C. 当ν→∞时,t 分布→Z 分布 D. t 分布的概率密度图以0为中心,左右对称 E. ν相同时,t 值越大,P 值越大 2.某指标的均数为X ,标准差为S ,由公式() 1.96, 1.96X S X S -+计算出来的区间常称为( B )。 A. 99%参考值范围 B. 95%参考值范围 C. 99%置信区间 D. 95%置信区间 E. 90%置信区间 3.样本频率p 与总体概率π均已知时,计算样本频率p 的抽样误差的公式为( C )。 4.在已知均数为μ, 标准差为 σ 的正态总体中随机抽样, X μ->( B )的概率为5%。 A.1.96σ B.1.96X σ C.0.05/2,t S ν D.0.05/2,X t S ν E.0.05/2,X t νσ 5. ( C )小,表示用样本均数估计总体均数的精确度高。 A. CV B. S C. X σ D. R E. 四分位数间距 6. 95%置信区间的含义为( C ): A. 此区间包含总体参数的概率是95% B. 此区间包含总体参数的可能性是95% C. “此区间包含总体参数”这句话可信的程度是95% D. 此区间包含样本统计量的概率是95% E. 此区间包含样本统计量的可能性是95%

二、思考题 1. 简述标准误与标准差的区别。 答: 区别在于: (1)标准差反映个体值散布的程度,即反映个体值彼此之间的差异;标准误反映精确知道总体参数(如总体均数)的程度。 (2)标准误小于标准差。 (3)样本含量越大,标准误越小,其样本均数更有可能接近于总体均数,但标准差不 随样本含量的改变而有明显方向性改变,随着样本含量的增大,标准差有可能增大,也有可能减小。 2. 什么叫抽样分布的中心极限定理? 答: 样本含量n越大,样本均数所对应的标准差越小,其分布也逐渐逼近正态分布,这种现象统计学上称为中心极限定理(central limit theorem)。 当有足够的样本含量(如30 n≥)时,从任何总体中抽取随机样本的样本均数近似地服从正态分布。样本含量越大,X抽样分布越接近于正态分布。 正态分布的近似程度与总体自身的概率分布和样本含量有关。如果总体原本就是正态分布,那么对于所有n值,抽样分布均为正态分布。如果总体为非正态分布,X仅在n值较大情况下近似服从正态分布。一般说,30 n≥时的X抽样分布近似为正态分布;但是,如 果总体分布极度非正态(如双峰分布、极度偏峰分布),即使有足够大的n值,抽样分布也将为非正态。 3. 简述置信区间与医学参考值范围的区别。 答: 置信区问与医学参考值范围的区别见练习表4-1。 练习表4-1 置信区间与医学参考值范围的区别 区别置信区间参考值范围 含义 用途计算公式总体参数的波动范围,即按事先给定的概 率100(1-α)%所确定的包含未知总体参 数的一个波动范围 估计未知总体均数所在范围 σ未知: /2,X X t S αν ± σ已知或σ未知但n≥30,有 /2X X Z α σ ±或 /2X X Z S α ± 个体值的波动范围,即按事先给定的 范围100(1-α)%所确定的“正常人” 的解剖、生理、生化指标的波动范 围 供判断观察个体某项指标是否“正常” 时参考(辅助诊断) 正态分布: /2 X Z S α ± 偏峰分布:P X~P100-X

《医学统计学》第5版单选题

《医学统计学》单项选择题 摘自:马斌荣主编.医学统计学.第5版.北京:人民卫生出版社,2008 第一章医学统计中的基本概念 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值B.脉搏数 C.住院天数D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 第二章集中趋势的统计描述 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 B. 几何均数 C. 均数 D. P百分位数 95 E. 频数分布

2. 算术均数与中位数相比,其特点是 A.不易受极端值的影响B.能充分利用数据的信息 C.抽样误差较大D.更适用于偏态分布资料 E.更适用于分布不明确资料 3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧 E. 数值分布不均匀 4. 将一组计量资料整理成频数表的主要目的是 A.化为计数资料 B. 便于计算 C. 形象描述数据的特点 D. 为了能够更精确地检验 E. 提供数据和描述数据的分布特征 5. 6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是 A. 均数 B. 几何均数 C. 中位数 D. 百分位数 E. 倒数的均数 答案: A B D E B 第三章离散程度的统计描述 1. 变异系数主要用于 A.比较不同计量指标的变异程度 B. 衡量正态分布的变异程度 C. 衡量测量的准确度 D. 衡量偏态分布的变异程度 E. 衡量样本抽样误差的大小 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是 A. 变异系数 B. 离均差平方和 C. 极差 D. 四分位数间距 E. 标准差 3. 某项指标95%医学参考值范围表示的是 A. 检测指标在此范围,判断“异常”正确的概率大于或等于95% B. 检测指标在此范围,判断“正常”正确的概率大于或等于95% C. 在“异常”总体中有95%的人在此范围之外 D. 在“正常”总体中有95%的人在此范围 E. 检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”

统计学 第四版 第七章答案

第四章 抽样分布与参数估计 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = =2.143 (2)在95%的置信水平下,求边际误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?2x z ασ=?0.025x z σ=?=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: (),x x x x -?+?=()120 4.2,120 4.2-+=(115.8,124.2) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ??? 或2 ,s x N n μ?? ??? 置信区间为: x z x z αα ?-? +? ? (1)构建μ的90%的置信区间。 2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(79.03,82.97) (2)构建μ的95%的置信区间。 2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(78.65,83.35) (3)构建μ的99%的置信区间。 2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(77.91,84.09) 7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取 36 解:

统计学答案解析最新版本

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

医学统计学 (2)

第一单元概述 1.研究设计应包括那几方面内容? 答:包括:专业设计和统计设计。 专业设计是针对专业问题进行的研究设计,如选题、形成假说等。统计设计是针对统计数据收集和分析进行的设计,如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。 第二单元资料描述性统计 1.描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何? 答:集中趋势的指标有:算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。 描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2.变异系数和标准差有何区别和联系? 答:区别:1.计算公式不同:CV=S/X*100%,标准差是方差的平方根。2.单位不同:变异系数无量纲,标准差量纲和原指标一致。3.用途不同。联系:都是适用于对称分布的资料,尤其是正态分布的资料,并且由公式所知,在均数一定时,CV与s呈正比。 3.频数表的用途有哪些? 答:1.描述资料的频数分布的特征;2.便于发现一些特大或特小的可疑值;3.将频数表作为陈述资料的形式,便于进一步的统计分析和处理;4.当样本量足够大时,可以以频数表作为概率的估计值。 4.用相对数时应注意哪些问题? 答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。3.正确计算频数指标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。 第三单元医学统计推断基础 1.正态分布和标准正态分布的联系和区别? 答:联系:均为连续型随机变量分布。区别:标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4.简述二项的应用条件? 答:条件为:1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变;3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。 5.简述Q-Q图法的基本原理? 答:u-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,u-变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q图法实际上就是首先求的小于某个x的积累频率,再通过该积累频率求得相应的u值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u-变换直线),否则(u,x)不会近似在一条直线上。Q-Q图法正是根据(u,x)是否近似在一条直线上来判断是否为正态分布。 第四单元参数估计与参考值范围的估计 1.均数的标准差和标准误的区别和联系? 答:区别和联系:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能

参数估计习题

第八章 参数估计习题 一、 填空题: 1.设总体),(~2σμN X ,n X X X ,,,21 是来自X 的一个样本,参数2,σμ都是未知的, 则μ的矩估计量为 。2 σ的矩估计量为 。 2.设总体),(~2σμN X ,其中2 σ未知,μ已知,n X X X ,,,21 是来自X 的一个样本, 做样本函数如下①∑=-n i i X n 12)(1μ,②2 1])([∑=-n i i X σμ,③∑=-n i i X X n 12)(1,④ ∑=--n i i X X n 12 )(11,⑤∑=+--n i i i X X n 121)() 1(21,这些样本函数中,是统计量的有 , 统计量中是的无偏估计量的有 。 3.设某总体X 的密度函数为?? ???<<-=其他 ,00, )(2 );(2ααα αx x x f ,对容量为n 的样本, 参数α的矩估计量为 。 4.假设总体)81.0,(~μξN ,n X X X ,,,21 是来自ξ的样本,测得样本均值5=x ,则置 信度是0.99的μ的置信区间是 5.设n X X X ,,,21 是来自总体X 的样本,对总体方差进行估计时,常用的无偏估计量是 。 6.设总体X 在区间],0[θ上服从均匀分布,则未知参数θ的矩法估计量为 。 二、选择题: 1.设n X X X ,,,21 是来自总体X 的样本,2 )(,)(σμ==x D x E ,并且和是未知参数,下面结论中是错误的[ ]。 (A )X =1?μ 是μ的无偏估计; (B )12?X =μ是μ的无偏估计; (C )21??μμ比有效; (C )21 )(1∑=-n i i X n μ是2σ的 极大似然估计量。

医学统计学课后选择题课件.doc

第一章。 1.医学统计学研究的对象是 A.医学中的小概率事件 B.各种类型的数据 C.动物和人的本质 D.有变异的医学事物 E.残疾的预防与治疗 2.用样本推断总体具有代表性的样本,通常指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取的任意一个 C.挑选总体中的有代表性的部分个体 D.用方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3.下列观测结果属于有序数据的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4.随机测量误差指的是 A.有某些固定的因素引起的误差 B.由不可预知的偶然因素引起的误差, C.选择样本不当引起的误差 D.选择总体不当引起的误差 E.由操作失误引起的误差 5.系统误差指的是 A.有某些固定的因素引起的误差, B.由操作失误引起的误差 C.选择样本不当引起的误差 D.样本统计量与总体参数之间的误差 E.由不可预知的偶然因素引起的误差 6.抽样误差指的是 A.有某些固定的因素引起误差 B.由操作失误引起的误差 C.选择样本不当引起的误差 D.样本统计量与总体参数间的误差 E.由不可预知的偶然因素引起的误差 7.收集数据不可避免的误差 A.随机误差 B.系统误差 C.过失误差, D.记录误差 E.仪器故障误差 8.统计学中所谓的总体通常指的

A.自然界中的所有研究对象 B.概括性的研究结果, C.同质观察单位的全体 D.所有的观察数据 E.具有代表性意义的数据 9.统计学中所谓的样本通常是 A.可测量的生物性样品 B.统计量 C.某一变量的测量值 D.数据中有代表性的一部分 E.总体中有代表性的部分观察单位 10.10.医学研究中抽样误差的主要来源是 A.测量仪器不够准确, B.检验出现错误 C.统计设计不合理 D.生物个体的变异 E.样本不够 第二章 1.某医学资料数据大的一端没有确定数值描述其集中趋势适用的统计指标 A.中位数 B.几何均数 C.均数 D.百分位数 E.频数分布 2.算术均数与中位数相比,其特点是。 A.不易受极端数值的影响 B.能充分利用数据的信息, C.抽样误差较大, D.更适用于偏态分布资料, E.更适用于分布不明确资料。 3.将一组计量资料整理成评述表的主要目的是 A.化为计数资料 B.便于计算 C.提供原始数据, D.为能够更精确的检验 E.描述数据的分布特征。 4.六人接种流感疫苗的一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320 求平均滴度应选用的指标是 A.均数 B.几何均数 C.中位数 D.百分位数 E.倒数的均数 5.变异系数主要用于

(抽样检验)第四章抽样理论和参数估计

第四章抽样理论和参数估计 知识引入 1970 年美国首次进行征兵抽签,组织者将19-25岁的适龄青年按年龄分组,使用编号001-366 的等重量塑料球,001代表1月1日出生者,031代表1月31日…,366代表12月31日。然后将所有塑料球放入滚筒中混合抽取号码,每组抽中号码对应生日的青年依次应征,直到人数足够为止。 之后,有记者指出此次抽签产生了严重的偏差,他们注意到,年末生的人似乎倾向于被抽到较前面的征兵顺序。其结果就是一堆12 月份生的人去了越南战场。后来,经过统计学家的分析,发现这种“偏差”确实存在;经过分析终于找到了原因,原来代表生日的号码塑料球是一次按一整个月份装入滚筒中混合的,加上又没有均匀混合;于是1 月份的生日容易在滚筒底下,12 月份的是最后才装进去,容易在上面。 在抽样术语中,经常能够听到“随机抽样”、“随机选择”这样的表述,“随机性”原则其实保证了总体中的每个个体被抽中的概率相等,因而被认为是保证各种抽签、选择过程公平、公正的一个基本手段。上述抽样就没有保证这种随机性。 在本章中,我们还会看到,作为推断的基础,我们直接研究的样本是否“得当”对研究总体十分关键,可以通过一定的抽样设计制定科学、合理、公正的抽样方法。如上述随机性原则可以保证抽样可以使得样本和总体有相同的内部结构,也就是说有最大的可能使总体的某些特征在样本中得以再现。本章在介绍必要的抽样概念和抽样方法基础上,重点介绍抽样分布理论,并对参数估计进行简要介绍。 第一节抽样和常用抽样方法 一、简单随机抽样 抽样(sampling)或取样,在整个研究过程中位于数据收集之前,恰当的抽样设计是保证样本代表性的关键环节,是利用样本对总体进行假设检验或参数估计的基础。抽样涉及到的一些基本概念在绪论中均已介绍。一个合理可行的抽样设计,一方面要求针对调查或实验研究的具体情况选择一种适宜抽样方法;另一方面应该根据调查研究所要求的精确度及经费状况确定样本容量。 一般所说的随机抽样,就是指简单随机抽样,它是最基本的抽样方法,适用范围广,最能体现随机性原则且原理简单。抽取时,总体中每个个体应独立地、等概率地被抽取。常用的实施方法有抽签法和随机数表法。 1、抽签法:是把总体中的每一个个体都编上号并做成签,充分混合后从中随机抽取一部分,这部分签所对应的个体就组成一个样本。 2、随机数表法:所谓随机数表或乱码表,是由一些任意的数毫无规律地排列而的数表。教材附表17即是一万个数字的随机数表。 随机数表的用法

《统计学》课后练习题答案

第一章统计学及基本概念 1 第二章数据的收集与整理 4 第三章统计表与统计图7 第四章数据的描述性分析 9 第五章参数估计 12 第六章假设检验 17 第七章方差分析 21 第八章非参数检验24 第九章相关与回归分析27 第十章多元统计分析 31 第十一章时间序列分析35 第十二章指数38 第十二章指数38 第十三章统计决策42 第十四章统计质量管理45 第一章统计学及基本概念 1.1 统计的涵义(统计工作、统计资料和统计学) 1.2 统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学) 1.3 统计学的发展史(学派与主要代表人物) 1.4 数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数) 1.5 变量:连续与离散;确定与随机 1.6 总体、样本与个体 1.7 标志、指标及指标体系 1.8 统计计算工具 习题 一、单项选择题 1. 推断统计学研究()。(知识点:1.2 答案:D) A.统计数据收集的方法B.数据加工处理的方法 C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法 2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。(知识点:1.3 答案:D) A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派 3. 下列数据中哪个是定比尺度衡量的数据()。(知识点:1.4 答案:B) A.性别B.年龄C.籍贯D.民族 4. 统计对现象总体数量特征的认识是()。(知识点:1.6 答案:C) A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体 5. 调查10个企业职工的工资水平情况,则统计总体是()。(知识点:1.6 答案:C) A.10个企业 B.10个企业职工的全部工资 C.10个企业的全部职工 D.10个企业每个职工的工资

第4章 参数估计

第四章参数估计 一、单项选择题 1.矩估计法要求总体X的()要存在。 A.一阶原点矩E(X) B.二阶中心矩E[X-E(X)]2 C.K阶原点矩E(X K) D.K阶中心矩E[X-E(X)]K 2.一阶原点矩就是指随机变量X的() A.众数 B.数学期望 C.方差 D.标准差 3.二阶中心矩就是指随机变量X的() A.标准差 B.方差 C.数学期望 D.中位数 4.K阶中心矩是以()为中心而定义的。 A.K阶原点矩 B.二阶原点矩 C.二阶中心矩 D.一阶原点矩 5.根据大数定律,当样本容量n充分大时,样本矩依概率收敛于() A.K阶原点矩 B.总体矩 C.二阶中心矩 D.一阶原点矩 6.估计量的无偏性是指() A.某个样本估计值与总体参数之间没有偏差 B.某个样本估计量与总体参数之间没有偏差 C.样本估计量所有可能取值的数学期望等于总体参数的真实值 B.以上答案都不正确 7.进行总体均值区间估计时,抽样极限误差必须满足的条件是() A.正态总体、总体方差已知 B.正态总体、总体方差未知且大样本 C.正态总体、总体方差未知且小样本 D.总体分布未知或非正态总体、总体方差未知且大样本 8.随着自由度的增大,t分布逐渐趋于() A.卡方分布 B.F分布 C.正态分布 D.标准正态分布 9.总体比率的区间估计的抽样极限误差(允许误差)计算公式为( ) A. B. C. D. 10.构造统计量服从() A. B. C. D. 11.两个样本方差比服从() A. B. C. D. 二、多项选择题 1.下列中,属于参数估计的点估计法的是() A.矩估计法 B.最大似然估计法 C.区间估计法 D.顺序统计量法 E.最小二乘估计法

统计学参数估计练习题

统计学参数估计练习题 SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1.参数估计就是用_______ __去估计_______ __。 2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。 5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。 6. 评价估计量的标准包含无偏性、_______ __和_______ __。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。 9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。 10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。 二、选择题(共10题,每题1分,共计10分) 1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2.估计量的含义是指( )。 A. 用来估计总体参数的统计量的名称

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对?为什么?如果是你,用什么? 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么? 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么?你的设计是什么? 6一型错误和二型错误的区别和联系 7什么是抽样误差?举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)

3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况?列出应用条件和公式 3. 数值资料的统计描述指标?公式? 4. 多元回归模型的基本形式?参数含义?回归效果的评价? 5. 什么叫截尾值?产生原因?举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议?若不符合卡方检验的应用条件,你又有什么建议?他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议? 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别?

相关主题
文本预览
相关文档 最新文档