当前位置:文档之家› 第7章参数估计习题与答案

第7章参数估计习题与答案

第7章参数估计习题与答案
第7章参数估计习题与答案

第7章 参数估计 ----点估计

一、填空题

1、设总体X 服从二项分布),(p N B ,10<

计量=p

? X

N

. 2、 设 总 体)p ,1(B ~X

, 其 中 未 知 参 数 01<

本, 则 p 的 矩 估 计 为_∑=n 1i i X n 1_, 样本 的 似 然 函 数 为_i

i X 1n

1

i X )p 1(p -=-∏__。

3、 设 12,,,n X X X L 是 来 自 总 体

),(N ~X 2σμ的 样 本, 则 有 关 于 μ及 σ2

的 似 然 函 数2

12(,,;,)n L X X X μσ=L _2

i 2

)X (21n

1

i e

21

μ-σ

-

=∏

σ

π__。

二、计算题

1、设总体X 具有分布密度(;)(1),01f x x x α

αα=+<<,其中1->α是未知参数,

n X X X Λ,,21为一个样本,试求参数α的矩估计和极大似然估计.

解:因?

?++=+=

10

1

1α1α1αdx x dx x x X E a

)()()(2

α1

α2α1α102++=

++=

+|a x 令2α

++==??)(X X E

X

X --=∴112α

?为α的矩估计 因似然函数1212(,,;)(1)()n n n L x x x x x x α

αα=+L L

∑=++=∴n

i i X n L 1

α1αln )ln(ln ,由∑==++=??n

i i X n

L 101ααln ln 得,

α的极大似量估计量为)ln (?∑=+-=n

i i

X

n

1

2、设总体X 服从指数分布 ,0

()0,

x e x f x λλ-?>=??其他 ,n X X X Λ,,21是来自X 的样本,(1)

求未知参数λ的矩估计;(2)求λ的极大似然估计.

解:(1)由于1

()E X λ

=

,令

1

1X X

λλ

=?=

,故λ的矩估计为1?X λ

= (2)似然函数1

12(,,,)n

i

i x n

n L x x x e

λ

λ=-∑=L

11

1

ln ln ln 0n

i

i n

i n

i i

i L n x d L n n x d x

λλλλλ====-=-=?=∑∑∑

故λ的极大似然估计仍为

1

X

。 3、设总体()2~0,X N σ,12,,,n X X X L 为取自X 的一组简单随机样本,求2

σ的极大似

然估计;

[解] (1)

似然函数2

221

i x n

i L σ-==

()

2

2

1

222

2n

i i x n e

σπσ=-

-∑=?

于是22

2

1ln ln 2ln 222n

i i x n n L πσσ

==---∑ 2

2241

ln 122n i i d L n x d σσσ==-+∑, 令2

ln 0d L d σ=,得2

σ的极大似然估计:2211n i i X n σ∧

==∑.

4、设总体X 服从泊松分布()P λ, 12,,,n X X X L 为取自X 的一组简单随机样本, (1)求未知参数λ的矩估计;(2)求λ的极大似然估计.

解:(1)令?()E X X X λλ

==?=,此为λ的矩估计。 (2)似然函数1

121

(,,,)!

n

i

i x n n n

i

i e L x x x x λ

λ

=-=∑=

∏L

1

1

1

1

ln ln ln !

ln 0n n

i i i i n

n

i

i

i i L x n x x

x

d L n x

d n

λλλλλ

=====--=-=?==∑∑∑∑故λ的极大似然估计仍为X 。

第七章 参数估计 ----点估计的评价标准

一、填空题

1、 设321,,X X X 是取自总体

X 的一个样本,则下面三个均值估计量

32133212321112

1

4331?,1254131?,2110351

?X X X u

X X X u X X X -+=++=++=μ

都是总体均值的无偏估计,则 2?μ

最有效. 2、 设n X X X Λ,,21是取自总体),0(2

σN 的样本,则可以作为2σ的无偏估计量是( A ).

A 、∑=n i i X n 12

1

B 、∑=-n i i X n 12

11 C 、∑=n

i i X n 11

D 、∑=-n

i i X n 1

11 二、计算题

1、设n X X X Λ,,21为从一总体中抽出的一组样本,总体均值μ已知,用∑=--n

i i X n 1

2)(11μ去估计总体方差2

σ,它是否是2

σ的无偏估计,应如何修改,才能成为无偏估计.

解:因∑∑==--=--n i n i i

i X E n X n E 112

2)(11])(11[μμ221

σσ≠-=n n ∑=--∴n

i i X n 12)(11μ不是2σ的无偏估计 但∑=-n i i X n 1

2)(1μ是2

σ的无偏估计 2、设n X X X Λ,,21是来自总体),(2

σμN 的一个样本,若使∑-=+-?

1

1

21

)(n i i i X X

C 为2σ的无

偏估计,求常数C 的值。 解:

11

2

2111

1

1

22111

1

222221

22[()][()]

[2]

[2]

12(1)2(1)

n n i i i i i i n i i i i i n i E C X X C E X X C EX EX EX EX C n C C n μσμσμσσ--++==-++=-=?-=-=+-=+++-=-=?=

-∑∑∑∑

第七章 参数估计 ----区间估计

一、选择题

1、设总体),(~2

σμN X ,2

σ未知,设总体均值μ的置信度α-1的置信区间长度l ,那

么l 与a 的关系为( A ).

A 、a 增大,l 减小

B 、a 增大,l 增大

C 、a 增大,l 不变

D 、a 与l 关系不确定

2、设总体),(~2

σμN X ,且2

σ已知,现在以置信度α~1估计总体均值μ,下列做法中

一定能使估计更精确的是( C ).

A 、提高置信度α-1,增加样本容量

B 、提高置信度α-1,减少样本容量

C 、降低置信度α-1,增加样本容量

D 、降低置信度α-1,减少样本容量

二、计算题

1、设总体)9.0,(~2

μN X ,当样本容量9=n 时,测得5=X ,求未知参数μ的置信度为

0.95的置信区间.

解:μ

的置信区间为2

2

(X Z X Z α

α

-+

05.0=α 9=n 9.0=σ 5X =

0.052

1.96Z =

μ的置信区间为)588.5,412.4(。

2、设总体2

~(,),X N μσ已知0,σσ=要使总体均值μ的置信水平为1α-的置信区间的长度

不大于L ,问需要抽取多大容量的样本。

解:μ

的置信区间为2

2

(X Z X Z αα

-+,

22

2

2

2

42Z Z L n L

αασ≤?≥

3、某车间生产自行车中所用小钢球,从长期生产实践中得知钢球直径),(~2

σμN X ,现

从某批产品里随机抽取6件,测得它们的直径(单位:mm)为:

14.6,15.1,14.9,14.8,15.2,15.1,置信度95.01=-α(即05.0=α)

(1)若06.02

,求μ的置信区间 (2)若2

σ未知,求μ的置信区间

(3)求方差2

σ,均方差σ的置信区间.

解:(1)2

σ

已知,则

μ的置信区间

为2

2

(X Z X Z αα

-+,

2

5,0.05, 1.96n Z αα===

代入则得μ的置信区间)15.15,75.14(

(2)2

σ未知,则μ

的置信区间为2

2

(,X t X t α

α-+,05.0,5==αn 查表得0.052

2.5706t =,代入得μ的置信区间为)19.15,71.14(

(3)

2

22

(1)~(1)n S n χσ

--

2

σ的置信区间22

2212

2

(1)(1)(,)(1)(1)

n S n S n n ααχχ-----

5,05.0==n α 代入得2σ的置信区间为:)3069.0,0199.0(。

均方差σ

的置信区间为(0.1411,0.2627)=

4、 设从正态总体X 中采用了n = 31个相互独立的观察值 , 算得样本均值 61.58=X 及

样本方差 22

)8.5(=S

, 求总体X 的均值和方差的90%的置信区间

解:,8.5s ,31n ,95.02

1,05.02,

9.01===α

-=α=α- 0.05(30) 1.6973t = \m 的 90%的置信区间为 :

2

(((56.84,60.38)X t n α±-= 22

0.050.95(30)43.77(30)18.49χχ== ,S 2 = 33.64

2σ的 (1-a )%的置信区间为 :

222

222

1(1)(1),(1)(1)n s n s n n ααχχ-??

-- ? ?--??

6.541.2349.188

.333077.4364.333022<

\s 2

的 90%的 置 信 区 间 为 : (23.1 , 54.6)

5、 设 某 种 灯 泡 的 寿 命 X 服 从 正 态 分 布 N(μ , s 2 ) , μ , s 2未 知 , 现

从 中 任 取 5个灯 泡 进 行 寿 命 测 试 (单 位 : 1000小 时 ), 得 :

10.5 , 11.0 , 11.2 , 12.5 , 12.8 ,

求 方 差 及 均 方 差 的 90%的 置 信 区 间 .

解:995.0)(41,6.115151

2

251=-===∑∑==i i i i x x S x x

41,95.02

1,05.02

,

9.01=-=-

==-n α

α

α

22

0.050.95(4)9.488,(4)0.711x x ==

598.5711

.0995

.04,419.0488.9995.04=?=?

\ s 2

及 s 的 90%的 置 信 区 间 为 (0.419 , 5.598)

及 )366.2,647.0()598.5,419.0(=

6、 二正态总体N(m 1 , s 12) , N(m 2 , s 22)的参数均未知 ,依次取容量为 n 1=10 , n 2=11的二独立样本 ,测得样本均值分别为121.2, 2.8x x ==,样本方差分别为

29.0,34.02

221==S S ,

(1) 求二总体均值差12μμ-的90%的置信区间。(2)求二总体方差比90%的置信区间。

解:1210.9,0.05,

19,1102

n n α

α-==-=-=

(1)2

90.34100.29

0.313719

w s ?+?=

=,0.05(19) 1.729t =,

12μμ-的90%的置信区间为

(1.2 2.8 1.729 2.8 1.729( 2.0231, 1.1769)

---+=--

(2)0.05(9,10) 3.02F =

0.950.0511(9,10)(10,9) 3.14

F F =

=

17.129

.034

.022

2

1==

S S 2

221/σσ∴的 90%的 置 信 区 间 为 : )67.3,39.0()14.317.1,02

.31

17.1(=??

医学统计学名词解释复习资料

1. 总体(population):根据研究目的所确定的同质观察单位的全体。只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。假想的,无时间和空间概念的,称为无限总体(infinite population)。 2. (总体)参数(parameter):总体的统计指标或特征值。总体参数是事物本身固有的、不变的。 3. 样本(sample):从总体中随机抽取的部分个体。 4. 样本含量(sample size):样本中所包含的个体数。 5. 变量(variable):观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。变量的取值称为变量值或观察值(observation)。根据变量的取值特性,分为数值变量和分类变量。 6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。对每个观察单位用定量的方法测定某项指标的数值,组成的资料。 7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。 9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 10. 误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差 。 11. 可信区间(confidence interval, CI):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。 12. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95%和99%,故常用95%和99%的可信区间。 13. 变异(variation):同质事物间的差别。由于观察单位通常即为观察个体,故变异亦称为个体变异(individual variation)。 16. 平均数(average):也叫平均值,是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数(arithmetic mean)、几何平均数(geometric mean)、中位数(median)等。 17. 中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M 表示。适用于偏态分布资料或不规则分布资料和开口资料。所谓“开口”资料,是指数据的一端或两端有不确定值。当n 为奇数时,M=X (n+1)/2;当n 为偶数时,M=[X n/2+ X n/2+1]/2。 18. 百分位数(percentile):是一种位置指标,以P x 表示,一个百分位数Px 将全部观察值分为两个部分,理论上有x%的观察值小于Px 小,有(1-x%)的观察值大于Px 。 19. 变异系数(coefficient of variance, CV):亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。100%X s/CV ?=, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 20. 频率(relative frequency):在n 次随机试验中,事件A 发生了m 次,则比值 22. 概率(probability):在重复试验中,事件A 的频率,随着试验次数的不断增加将愈来愈接近一个常数p ,这个常数p 就称为事件A 出现的概率(probability),记作P(A)或P 。 描述随机事件发生的可能性大小的数值,常用P 来表示。 23. 统计量(statistic):由样本所算出的统计指标或特征值。 24. 相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数(coefficient of product-moment correlation),总体相关系数用希腊字母ρ表示,而样本相关系数用r 表示,取值范围均为[-1, 1]。 25. 回归系数(regression coefficient):直线回归方程Y ?= a+b X 的系数b 称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 26. 参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。绝大多数:可以是90%、95%、99%等等,最常用的是95%。正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。 28. 统计推断(statistic inference):从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。 29. 标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。据此,样本均数的标准差X σ称为标准误。 30. 参数估计(parameter estimation):由样本信息估计总体参数。它包括两种:点估计和区间估计。 点估计:直接用样本统计量作为对应的总体参数的估计值。 区间估计:按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间(confidence interval, CI ),又称置信区间。这种估计方法称为区间估计。 33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。 34.Ⅰ类错误(type Ⅰerror):统计学上规定,拒绝了实际上成立的H 0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示。 35.Ⅱ类错误(type Ⅱerror):统计学上规定,不拒绝实际上不成立的H 0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。 36. 检验效能(power of a test):又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。 37. 参数检验:总体分布已知,对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数统计或参数检验。 38. 参数检验:假定比较数据服从某分布,通过参数的估计量(x , s)对比较总体的参数(μ)作检验,统计上称为参数法检验(parametric test)。如t 、u 检验、方差分析。 39. 率(rate):又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。其计算公式为: 40. 构成比(proportion):又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示。 41. 比(ratio):又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百分之几,它是对比的最简单形式。其计算公式为:比=A/B 。 统计学(Statistics ):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。 总体(population ):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample ):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。

《医学统计学》第5版单选题

《医学统计学》单项选择题 摘自:马斌荣主编.医学统计学.第5版.北京:人民卫生出版社,2008 第一章医学统计中的基本概念 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值B.脉搏数 C.住院天数D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 第二章集中趋势的统计描述 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 B. 几何均数 C. 均数 D. P百分位数 95 E. 频数分布

2. 算术均数与中位数相比,其特点是 A.不易受极端值的影响B.能充分利用数据的信息 C.抽样误差较大D.更适用于偏态分布资料 E.更适用于分布不明确资料 3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧 E. 数值分布不均匀 4. 将一组计量资料整理成频数表的主要目的是 A.化为计数资料 B. 便于计算 C. 形象描述数据的特点 D. 为了能够更精确地检验 E. 提供数据和描述数据的分布特征 5. 6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是 A. 均数 B. 几何均数 C. 中位数 D. 百分位数 E. 倒数的均数 答案: A B D E B 第三章离散程度的统计描述 1. 变异系数主要用于 A.比较不同计量指标的变异程度 B. 衡量正态分布的变异程度 C. 衡量测量的准确度 D. 衡量偏态分布的变异程度 E. 衡量样本抽样误差的大小 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是 A. 变异系数 B. 离均差平方和 C. 极差 D. 四分位数间距 E. 标准差 3. 某项指标95%医学参考值范围表示的是 A. 检测指标在此范围,判断“异常”正确的概率大于或等于95% B. 检测指标在此范围,判断“正常”正确的概率大于或等于95% C. 在“异常”总体中有95%的人在此范围之外 D. 在“正常”总体中有95%的人在此范围 E. 检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”

医学统计学 (2)

第一单元概述 1.研究设计应包括那几方面内容? 答:包括:专业设计和统计设计。 专业设计是针对专业问题进行的研究设计,如选题、形成假说等。统计设计是针对统计数据收集和分析进行的设计,如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。 第二单元资料描述性统计 1.描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何? 答:集中趋势的指标有:算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。 描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2.变异系数和标准差有何区别和联系? 答:区别:1.计算公式不同:CV=S/X*100%,标准差是方差的平方根。2.单位不同:变异系数无量纲,标准差量纲和原指标一致。3.用途不同。联系:都是适用于对称分布的资料,尤其是正态分布的资料,并且由公式所知,在均数一定时,CV与s呈正比。 3.频数表的用途有哪些? 答:1.描述资料的频数分布的特征;2.便于发现一些特大或特小的可疑值;3.将频数表作为陈述资料的形式,便于进一步的统计分析和处理;4.当样本量足够大时,可以以频数表作为概率的估计值。 4.用相对数时应注意哪些问题? 答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。3.正确计算频数指标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。 第三单元医学统计推断基础 1.正态分布和标准正态分布的联系和区别? 答:联系:均为连续型随机变量分布。区别:标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4.简述二项的应用条件? 答:条件为:1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变;3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。 5.简述Q-Q图法的基本原理? 答:u-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,u-变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q图法实际上就是首先求的小于某个x的积累频率,再通过该积累频率求得相应的u值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u-变换直线),否则(u,x)不会近似在一条直线上。Q-Q图法正是根据(u,x)是否近似在一条直线上来判断是否为正态分布。 第四单元参数估计与参考值范围的估计 1.均数的标准差和标准误的区别和联系? 答:区别和联系:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能

医学统计学课后选择题课件.doc

第一章。 1.医学统计学研究的对象是 A.医学中的小概率事件 B.各种类型的数据 C.动物和人的本质 D.有变异的医学事物 E.残疾的预防与治疗 2.用样本推断总体具有代表性的样本,通常指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取的任意一个 C.挑选总体中的有代表性的部分个体 D.用方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3.下列观测结果属于有序数据的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4.随机测量误差指的是 A.有某些固定的因素引起的误差 B.由不可预知的偶然因素引起的误差, C.选择样本不当引起的误差 D.选择总体不当引起的误差 E.由操作失误引起的误差 5.系统误差指的是 A.有某些固定的因素引起的误差, B.由操作失误引起的误差 C.选择样本不当引起的误差 D.样本统计量与总体参数之间的误差 E.由不可预知的偶然因素引起的误差 6.抽样误差指的是 A.有某些固定的因素引起误差 B.由操作失误引起的误差 C.选择样本不当引起的误差 D.样本统计量与总体参数间的误差 E.由不可预知的偶然因素引起的误差 7.收集数据不可避免的误差 A.随机误差 B.系统误差 C.过失误差, D.记录误差 E.仪器故障误差 8.统计学中所谓的总体通常指的

A.自然界中的所有研究对象 B.概括性的研究结果, C.同质观察单位的全体 D.所有的观察数据 E.具有代表性意义的数据 9.统计学中所谓的样本通常是 A.可测量的生物性样品 B.统计量 C.某一变量的测量值 D.数据中有代表性的一部分 E.总体中有代表性的部分观察单位 10.10.医学研究中抽样误差的主要来源是 A.测量仪器不够准确, B.检验出现错误 C.统计设计不合理 D.生物个体的变异 E.样本不够 第二章 1.某医学资料数据大的一端没有确定数值描述其集中趋势适用的统计指标 A.中位数 B.几何均数 C.均数 D.百分位数 E.频数分布 2.算术均数与中位数相比,其特点是。 A.不易受极端数值的影响 B.能充分利用数据的信息, C.抽样误差较大, D.更适用于偏态分布资料, E.更适用于分布不明确资料。 3.将一组计量资料整理成评述表的主要目的是 A.化为计数资料 B.便于计算 C.提供原始数据, D.为能够更精确的检验 E.描述数据的分布特征。 4.六人接种流感疫苗的一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320 求平均滴度应选用的指标是 A.均数 B.几何均数 C.中位数 D.百分位数 E.倒数的均数 5.变异系数主要用于

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对?为什么?如果是你,用什么? 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么? 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么?你的设计是什么? 6一型错误和二型错误的区别和联系 7什么是抽样误差?举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)

3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况?列出应用条件和公式 3. 数值资料的统计描述指标?公式? 4. 多元回归模型的基本形式?参数含义?回归效果的评价? 5. 什么叫截尾值?产生原因?举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议?若不符合卡方检验的应用条件,你又有什么建议?他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议? 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别?

医学统计学考试

医学统计学基本概念 1.医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门应用科学。 2.统计工作的步骤:(1)设计(2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。 3.定量资料:又称为数值变量资料,特点:(1)各观察值之间有量的差别;(2)数据间有连续性。它是指变量的取值不止是可列个,而是可取某区间[a,b],(-oo,oo) 上的一切值。 4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值之间有质的差别;(2)数据间有离散性。它是指变量的取值有 限的,至多是可列多个。附:无序分类:二项分类、多项分类 5.等级资料:又称为半定量资料,有序分类,指各类之间有程度的差别。特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只有顺序,而无数值 大小,故等级之间不可度量。 6.个体individual:即每个观察单位。 7.总体population:根据研究目的确定的同质观察单位的全体。 8.样本:是从总体中随机抽取部分观察单位,其实测值的集合。样本包含的观察单位数称为样本含量或样本大小。 9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。如总体均数、总体标准差等。特点:参数是未知的,固有的,不变的! 10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。特点:统计量是已知的,变化的,有误差的! 11.概率probability:是描述随机事件发生的可能性大小的数值。常用P表示。它的大小界于0和1之间。 12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。 13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p,频率的这一特性称为频率的稳定性。 14.概率的统计定义:频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性,因而是可以被认识和度量的。这个常数p就称为事件A出现的概 率(probability),记作P(A) 或P。这一定义称为概率的统计定义。它是事件A发生的可能性大小的一个度量。容易看出,频率为一变量,是样本统计量,而概率为常数,是一总体参数。实践中,当试验次数足够多时,可以近似地将频率作为概率的一个估计。 15.小概率原理:当某事件发生的概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能 发生,此即为小概率原理。 16.同质(homogeneity):性质相同的事物称为同质的。 17.变异(variation):同质的事物内个体之间或同一个体重复测量间的差别称为变异。 18.参考值范围(reference interval)又称正常值范围(normal range)。由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、 机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值(normal value)。 19.正常值范围(normal ranges),是指绝大多数正常人的某指标范围。 20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。 21.标准误(standard error):样本统计量的标准差称为标准误。样本均数的标准差称为均数的标准误。 22.参数估计:由样本信息估计总体参数称为参数估计,包括点估计和区间估计。 23.点估计(point estimation):直接用样本统计量作为总体参数的估计值。这种估计方法简单,但未考虑抽样误差的大小。 24.区间估计(interval estimation) :按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度为1-α的可信区间(conf idence interval, CI),又 称置信区间。这种估计方法称为区间估计。 25.可信度为1-α的可信区间的确切涵义是:每100个样本所算得的100(1-α)%可信区间,平均有100(1-α)个包含了总体参数。如取α=0.05,则每100个样本所算得 的100个95%可信区间,平均有95个包含总体参数在内,有5个不包含总体参数。 26.可信区间的两个要素:第一个要素是可靠性,常用可信度1-α的大小表示;第二个要素是精确性,常用可信区间的长度CU-CL衡量。 27.均数95%可信区间,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按(见课本P42)构建可信区间,则在此100个可信区间内, 理论上有95个包含总体均数,而有5个不包含总体均数。 28.可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。这里的95%,指的是方法本身!而不是某个区间! 29.第一类错误(I型错误):拒绝了实际上成立的H0假设,称为“假阳性”, 用α来表示。 30.第二类错误(II型错误):不拒绝实际上不成立的H0,称为“假阴性”,用β来表示。 31.检验效能(power of a test)或检验功效:1-β称检验效能(power of a test),过去称把握度。为当两总体确有差异,按检验水准α所能发现该差异的能力。1-β只取单 尾。 32.完全随机设计:根据某一试验因素,将试验对象完全按随机设计分为若干个组,每个组的样本例数可以相等,也可以不等,分别求出各组试验结果的均数,即为 单因素多个样本均数,单个因素可以有多个水平,R>2 33.随机区组设计又称配伍组设计(Random Block Design):即两因素多个样本均数的比较(或称两因素方差分析,two way analysis of vari ance)。 34.绝对数:在计数资料中,各组的观察数称绝对数。 35.相对数:是两个有联系的指标的比,计数资料的统计描述主要是相对数(relative number)。 36.率(rate):说明某现象发生的频率或强度,常用%、‰、1/万、1/10万等作单位,表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。率的结果常 以保留1-2位整数为宜。

硕士医学统计学知识点总结汇总

第2章统计描述 1.对定量资料进行统计描述时,如何选择适宜的指标? 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平均 数 个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准 差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口 资料;④分布不明 变异系数标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 2. 应用相对数时应注意哪些问题? 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图形适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系 箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数

医学统计学考试必会名词解释

P表示。 ,如总体均数μ,总体率л,总体标准差σ等。 (用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。 ,称为正偏态;若集中位置偏向数值大的一侧(右 x表演示样本均数。 R表示。极差大,说明变异程度大;反之,说明变异程度小。 x百分位置上的数值,用符号表示为P x。 CV),亦称离散系数,为标准差与均数之比。写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离样本均数的标准差称为标准误,其计算公式为。 =0.05。 H0,即“弃真”的错误。Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为 H0,即“存伪”的错误。Ⅱ型错误的概率用β表示。 H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。 N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。 X,它的可能取值是0,1,……n,且相应的取值概率P 叫随机变量服从以n,л为参数的二项分布,记 X,它的可能取值为0,1,……n,,且相应取值概率为称随机变量X服从μ为参数

M-Friedman在符号检验的基础上提出来的,常称为Friedman检验,又称M检验。 SS e表示。 反映组间变异。 b表示,b的统计意义为自变量x改变一个单位时,应变量y平均变化b个单位。 x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中无法用x与y的线性关系所能解释的部分y的随机误差。 x,y间的相互关系。 Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。以符号r表示样本相关系数,ρ表示总体相 r2表示,它反映应变量y的总变异中,可用回归关系解释的比例,其公式为r2= 。

医学统计学复习重点

医学统计学复习重点 统计设计:调查设计、实验设计 第一章绪论 1.基本概念: 总体——根据研究目的确定,所有同质观察单位某种观察值的全体。 样本——总体中抽取的一部分具有代表性的个体组成的集合。 参数——刻画总体特征的统计指标。一般用希腊字母表示、、π 统计量——刻画样本特征的统计指标。抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示X、S、p 抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。抽样误差是不可避免的。属于随机误差,无方向性,重复抽样可以呈现一定的规律性。 小概率事件 P≤0.05 2.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。(用工作实例解释) 第二章调查研究设计 第三章实验研究设计 1.调查研究 (观察性研究): 特点:无人为施加处理因素 调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查 注意:收集的资料要有可比性 *随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样 非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等 2.实验研究 特点:与调查研究最本质的区别:根据研究目的主动施加干预措施

实验设计的三个基本要素:受试对象、处理因素、实验效应

实验设计的基本原则:对照原则、随机化原则、重复原则 第四章定量资料的统计描述 第五章定性资料的统计描述 1.定量资料 (1)定量资料——*频数分布表、直方图、箱式图——判断分布类型—— 集中位置离散趋势(变异程度)*对称分布 (正态分布) X±S均数X标准差S *偏态分布M(P 25~P 75 )中位数M=P 50 四分位数间距Q=P 25 ~P 75 对数正态分布几何均数G对数标准差S lgX (2)描述离散趋势的统计指标: ?极差R=最大值-最小值、 ?四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料 ?方差(总体、样本S2)&标准差(、S):*正态或近似正态分布 ?变异系数 % 100 ? = X S CV (3) (4)正态分布及其应用:**制定医学参考值范围 步骤:判断分布类型——正态分布——*双侧95%参考值范围:X±1.96S、 单侧95%参考值范围:下限为X-1.64S、上限为X+1.64S ——偏态分布——*双侧95%参考值范围:(百分位数法)P 2.5~P 97.5 单侧95%参考值范围:下限为P 5、上限为P 95 2.定性资料 *率:指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比。用以说明该现象发生的频率或强度。

医学统计学重点难点归纳

医学统计学重点难点归纳 第一单元概论 1.基本概念: 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 样本:从总体中随机抽取部分个体的某个变量值的集合。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由

各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。 第二单元实验研究的三要素 1.实验设计三要素:被试因素、受试对象、实验效应 2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。 3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。 4.实验设计方法 有析因设计正交试验设计均匀试验设计 交互作用两组:异体配对设计同体配对设计交叉设计无随机同期对照实验设计(单因素两水平)扩展 多组:单因素多水平配伍组设计拉丁方设计 (两因素多水平)(三因素多水平)配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。 析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。拉丁方设计:用于三因素等水平无交互。

医学统计学名词解释

医学统计学名词解释Prepared on 21 November 2021

【变异系数CV】亦称离散系数,是标准差S与均数X之比,即CV=s/X100%,常用于比较度量衡单位不同的两组或多组资料的变异度,或用于比较均数相差悬殊的两组或多组资料的变异度。P11 【中位数M】指将一组变量值按从小到大的顺序排列,位置居中的观察值水平。在一个数列中,大于和小于中位数的变量值数目相等。P10 【百分位数Px】一种位置指标,一个百分位数可将一组变量值分为两部分,理论上有X%的变量值比它小,有(100-X)%的变量值比它大。P10 【相关关系】指两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。这种既是必然的又是不确定的关系称为相关关系。P107 【决定系数】(相关指数)即相关系数r的平方,表示Y的变异中可由X解释的部分占总变异的比例。P132 【回归系数b】即回归直线的斜率,表示自变量增加一个单位时,应变量的平均该变量。 P121 【标准化率】又称为调整率,实际上是一加权平均。选定一个标准组,各小组观察人数 为N i /N作为加权系数:w 1 、w 2 、……w i ,各组均按改组系数求加权平均率,即标准化 率。 【个体变异】(变异)以具有同质性的观察单位为载体,某项观察指标在其观察单位之间现实的差别。P5 【标准误】将样本统计量的标准差称为统计量的标准误(SE),用来衡量抽样误差的大小。样本均数的标准差称为标准误。 【可信(置信)区间CI】【区间估计】区间估计是按一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度为1-的可信区间。P37 【参考值范围】(正常值范围,正常值)由于正常人的形态、功能、生化等各种指标的数据因人而异,且同一个人的某些指标会随时间、机体内外环境的改变而变化,因此需要确定其波动范围。参考值范围是临床医生判断正常与异常的参考依据。P24 【概率P】随机事件发生可能性大小的一个度量,取值范围为0≤P≤1。P3 【小概率事件】当某事件发生的概率小于等于0.05时,称为小概率事件。 【小概率原理】当某事件发生的概率小于等于0.05时,该事件发生的可能性很小,进而认为在其一次抽样中不可能发生。 【假设检验中的P值】表明以多大的误差拒绝H0,即作出“拒绝H0而接受H1”的结论时冒了P风险。P49 【定性资料】以定性方式表达每个观察单位的某项观察指标。特点:观察单位间或者相同,或者存在质的差别;有质的差别者之间无连续性。P2

医学统计学第七版课后答案及解析

医学统计学第七版课后答案 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析

医学统计学选择题及答案3

对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______. A.有相关关系 B.无任何关系 C.无直线相关关系 D.无因果关系 E.有伴随关系 若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____. A.直线相关分析 B.秩相关分析 C.直线回归分析 D.方差分析 E.病例对照研究 四格表资料的χ2检验应使用校正公式而未使用时,会导致。 A.χ2增大,P值减小 B.χ2减小,P值也减小 C.χ2增大,P值也增大 D.χ2减小,P值增大 E.视数据不同而异 配对设计四格表资料比较两个率有无差别的无效假设为。 A.μ1=μ2 B.π1=π2 C.μ1≠μ2 D.π1≠π2 E.b=c 四格表χ2检验的校正公式应用条件为。 A.n>40且T>5 B.n<40且T>5 C.n>40且1<T<5 D.n<40且1<T<5 E.n>40且T<1 两组设计两样本均数比效的t检验公式中,位于分母位置上的是。 A.两样本均数之差 B.两样本均数之差的方差 C.两样本均数之差的标准误 D.两样本均数方差之差

E.两样本均数标准误之差 两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断 在假设检验中,P值和α的关系为。 A.P值越大,α值就越大 B.P值越大,α值就越小 C.P值和α值均可由研究者事先设定 D.P值和α值都不可以由研究者事先设定 E.P值的大小与α值的大小无关 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 下面关于均数的正确的说法是______. A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值 从同一正态总体中随机抽取多个样本,用样本均数来估计总体均数的可信区间,下列哪一样本得到的估计精度高。 A.均数大的样本 B.均数小的样本 C.标准差小的样本 D.标准误小的样本 E.标准误大的样 以一定概率由样本均数估计总体均数,宜采用。 A.抽样误差估计 B.点估计 C.参考值范围估计 D.区间估计

医学统计学考试重点_1

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学考试重点 考试题型: 名词解释 10 个选择 20 个填空题 20 个简答 4-5 个讨论分析 1-2 题计算 1-2 题绪论 2 选 1 总体:总体(population)指特定研究对象中所有观察单位的测量值。 可分为有限总体和无限总体。 总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本: 从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。 样本应具有代表性。 所谓有代表性的样本,是指用随机抽样方法获得的样本。 3 选 1 小概率事件: 我们把概率很接近于 0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P 值: 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。 p值是将观察结果认为有效即具有总体代表性的犯错概率。 一般结果0.05 被认为是有统计学意义小概率原理: 一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。 1 / 19

统计学中,一般认为等于或小于 0.05或 0.01 的概率为小概率。 资料的类型(3 选 1)(1)计量资料: 对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。 计量资料亦称定量资料、测量资料。 .其变量值是定量的,表现为数值大小,一般有度量衡单位。 如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。 (2)计数资料: 将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。 计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的 A、B、AB、O 四种血型的人数等。 (3)等级资料: 将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。 等级资料又称有序变量。 如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准

相关主题
文本预览
相关文档 最新文档