当前位置:文档之家› 统计学复习要点

统计学复习要点

统计学复习要点
统计学复习要点

绪论

掌握:总体与样本、同质与变异、变量的类型、参数与统计量。

[重点难点]

统计学的若干概念

一、总体与样本

总体(population)是根据研究目的确定的同质研究对象的全体。按研究对象来源又有目标总体和研究总体。样本(sample)是指从研究总体中抽取的一部分有代表性的个体。

二、同质与变异

同质(homogeneity)是指同一总体中个体的性质、影响条件或背景相同或非常相近。变异(variation)是指同质的个体之间存在的差异。

三、变量与资料

计量资料、计数资料、等级资料。

变量类型可以转化:定量→有序→分类→二值。注意转化方向只能由信息量多向信息量少。

四、误差

随机误差、系统误差、非系统误差。参数(parameter)是指反映总体特征的统计指标。由样本观察资料计算出来的反映样本特征的量称为样本统计量(statistic)。统计是依据样本统计量及其来推断总体参数。

五、概率与频率

六、统计步骤

统计设计(design)是医药卫生科研设计不可或缺的部分。统计设计包括抽样方法、统计学原则、统计方法、数据如何收集、样本量多大等统计学内容。设计决定了统计分析的方法。统计设计和统计分析是不可分割的两项内容。

收集资料

整理资料

分析资料:统计描述、统计推断

计量资料的统计描述

掌握:掌握描述定量资料集中趋势的算术均数、几何均数、中位数的计算方法

和适用条件;掌握描述定量资料离散趋势的极差、四分位数间距、方差、标准差和变异系数的计算方法和适用条件;掌握常用统计图表的制作方法。

[重点难点]

频数与频数分布的用途 一、描述集中趋势的统计指标

基本概念:由于同质性,所有实测值趋向同一数值的趋势称为集中趋势。

在应用中,有一些统计量常称为统计指标。

㈠ 算术均数

意义:算术均数简称均数,常用符号X 表示样本均数,μ表示总体均数。均数是描述一组数据集中趋势或平均水平的最常用统计指标。 计算:1.直接法(基于原数据)

n

x

n x n x n x x x X i i

n

i i

n ∑=∑=∑=+++=

=121...

其中, n x x x ,...,,21为观察值。 2. 加权法(基于频数表)

n

fx

f

fx X ∑∑∑=

=

其中, f 为组段的频数,0x 为组段的中值。0x =(组段上限+组段下限)/2。 适用条件:适用于对称分布资料,尤其正态或近似正态分布资料。

㈡ 几何均数

意义:几何均数以符号G 表示,常用来反映一组含多个数量级的数据的集中位置。

计算:1.直接法(基于原数据)

n n x x x G ...21= 或 )log (

log 1

1

n

x

G n

i i

∑=-=

其中, n x x x ,...,,21为观察值。 2. 加权法(基于频数表)

??

????∑=????

?

?∑∑

=--n x f f x f G log log log log 11 适用条件:适用于观察值变化范围跨越多个数量级的资料,尤其对数正态分布资料。

㈢ 中位数

意义:中位数常用符号M 表示,是反映一组数据集中趋势的位置指标,在全部实测值中有一半数值比它小,有一半数值比它大。

百分位数常用符号x P 表示,是排序后的全部实测值的某百等份分割值,即在全部实测值中有x %个数值比它小,有1-x %个数值比它大。中位数就是一个特定的百分位数,即M =P 50。

计算:中位数为全部实测值排序后的中间数值或中间两个数值的算术均数。

1. 直接法(基于原数据)

将n 例数据按升序排列,其第i 个数据用*i X 表示。 n 为奇数时,

*2

1+=n X M

n 为偶数时,

)(2

1*12

*2

++=n n X X M

2. 内插法(基于频数表)

??

?

??-?+

=L x x f n x f i L P 100

其中,L 为欲求的x P 所在组段的下限,i 为该组段的组距,x f 为该组段的频数,n 为总频数,L f 为该组段之前的累计频数。

??

?

??-+

=L M f n f i L M 2

其中,L 为欲求的中位数所在组段的下限,i 为该组段的组距,M f 为该组段的频数,n 为总频数,L f 为该组段之前的累计频数。

频率 L f %50?n M L f f +

区间 ↑ 50 i

[]L M

f n f i -?=

%50?

?50+=l P

适用条件:资料不限,但最常用于非对称分布的资料。

二、描述离散趋势的统计指标

基本概念:离散趋势或变异程度是指观察值之间参差不齐的程度。 ㈠ 极差

意义:极差又称全距,常用符号R 表示。极差反映一组数据的变异范围。用 极差反映数据的变异程度常常比较粗略和不稳定。 计算: R = 最大值-最小值 适用条件:资料不限。

㈡ 四分位数间距

意义:P 75和P 25分别称为上、下四分位数。四分位数间距Q 是全部观察值中居中的一半数值散布的范围。用四分位数间距反映数据的变异程度比极差稳定。 计算: Q = P 75-P 25

其中,P 75和P 25的求法参见前述百分位数求法。 适用条件:资料不限。

㈢ 方差和标准差

意义:总体观测值的离均差平方和的算术均数称为总体方差,用σ2表示。总体方差的平方根称为总体标准差,用σ表示。二者都反映总体中观测值之间的离散趋势或变异程度,数值越小,表明变异程度越小;反之亦然。

实际抽样研究中,常用样本方差S 2和样本标准差S 作为σ2和σ的近似值。 标准差的量纲与原变量一致,故实际应用中常使用标准差。

计算: N

x ∑-=2

2

)(μσ 总体方差

1

)(2

2

-∑-=n X x S 样本方差

N

x ∑-=

2

)

(μσ 总体标准差

1

)(2

-∑-=

n X x S 样本标准差

其中,n -1称为自由度。

适用条件:适用于对称分布资料,尤其正态或近似正态分布资料。

㈣ 变异系数

意义:变异系数常用符号CV 表示。它是标准差与算术均数之比,是一个不带量纲的相对数。 计算: %100?=

X

S

CV 适用条件:适用于量纲不同的变量间,或均数差别较大的变量间变异程度的

比较。

正态分布

一、正态分布的概念

基本概念:正态分布是自然界最常见的一种分布,正态分布的特点是中间频数最多,两边频数渐少且对称。 正态分布的密度函数:

22)(21

)(σμπ

σ--=

X e

X f

其中,μ为总体均数,σ为总体标准差 正态分布密度曲线的特点:

(1)关于x=μ对称。

(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。

(3)曲线下面积为1。

(4)μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。

(5)σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖”’;σ越小, 数据越集中,曲线越‘瘦高’。 二、 正态曲线下面积的分布规律

标准正态分布:总体均数为0、总体标准差为1的正态分布称为标准正态分布,用)1.0(N 表示。

对任意一个服从正态分布),(2σμN 的随机变量X ,经过如下的标准化变换 σ

μ

-=

X Z

可以转变为标准正态分布。

正态曲线下面积的分布规律由标准正态分布曲线下面积分布表给出。标准正态分

布的分布函数值等于标准正态曲线下Z 值左侧的面积,记作)(z Φ。

按正态分布规律,标准正态曲线下面积分布规律为: 单侧:P (Z ≤ -Z α)=α 或P (Z ≥ Z α)=α 双侧:P (Z ≤ -Z α/2)+P (Z ≥ Z α/2)=α

医学参考值范围

基本概念:医学参考值范围是指特定的―正常‖人群(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体取值所在的范围。人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。

计算方法:确定医学参考值范围的方法有两种:

(1)百分位数法 双侧95%医学参考值范围是),(97525P P ,单侧范围是P 95

以下(如血铅、发汞),或P 5以上(如肺活量)。该法适用于任何分布类型的资料。

(2)正态分布法 若X 服从正态分布,医学参考值范围还可以依正态分布规律计算。正态分布资料双侧医学参考值范围一般按下式作近似估计:

其中,X 和S 分别为样本的均数和标准差

总体均数参数估计与假设检验

熟悉:理解抽样误差的概念;熟悉标准误的意义及其应用。 掌握:会计算均数及频率的标准误;掌握总体均数95%和99%置信区间的计算及适用条件;掌握正态近似法计算总体概率的95%和99%置信区间及适用条件;阐述标准差与均数标准误的区别。

[重点难点] 抽样误差与标准误

一、均数(频率)的抽样分布及抽样误差

基本概念:在同一总体中反复多次随机抽取样本含量相同的若干样本,由于个体差异与偶然性的影响,样本统计量之间以及样本统计量与总体参数之间的差异,称为抽样误差。这种由抽样造成的均数之间的差异称为均数的抽样误差,频率之间以及频率与概率之间的差异称为频率的抽样误差。

特点:从正态分布N (μ,σ2)总体中抽样,样本均数X 仍服从正态分布;在抽样研究中,抽样误差是不可避免的。用来表示抽样误差大小的指标称为标准误。

二、标准误 (一)均数标准误

意义:均数标准误用符号X σ表示,也称样本均数的标准差。它反映了样本均数之间、样本均数与总体均数之间的离散程度,也反映了样本均数抽样误差的大小。 计算:可按公式

X σ=

计算。在实际应用中,一般不直接考察

总体,所以总体标准差σ 常常未知,需要用样本标准差s 来估计。此时,均数标准误的估计值为 n

S S x =

由此式可见,若增加样本含量n 可以减小样本均数的抽样误差。

主要应用:①估计总体均数的置信区间;②均数的假设检验。

(二) 频率的标准误

意义:频率的标准误用符号σp 表示,它反映了样本频率与样本频率之间、样本频率与总体率总体概率之间的离散程度,也反映了样本频率抽样误差的大小。

计算:可按公式 σp 计算。在实际应用中,总体概率

π 常常未知,需要用样本频率p 作为总体概率 π 的估计值 ,因此频

率的标准误的估计值为。由此式可见,增加

样本含量n 可以减小样本频率的抽样误差。

主要应用:①估计总体概率的置信区间;②频率指标的假设检验。 t 分布

一、 t 分布的概念

n

S X S X t x /μ

μ-=

-=

服从自由度ν = n - 1的t 分布。 t 分布是总体均数的区间估计及假设检验的理论基础。 二、 t 分布的图形与曲线下面积分布规律

t 分布与标准正态分布相比,其分布密度有如下特征:①单峰分布,以0为中心,左右对称;②自由度ν 越小,则x S 越大,t 值越分散,曲线的峰部越矮,尾部越高;③自由度ν 逐渐增大时,t 分布逐渐逼近标准正态分布;当ν 趋于∞ 时,t 分布就完全成为标准正态分布。

按t 分布的规律,密度曲线下面积分布规律为: 单侧:P (t ≤ -t α, ν)=α 或P (t ≥ t α, ν)=α 双侧:P (t ≤ -t α/2, ν)+P (t ≥ t α/2, ν)=α

总体均数的估计 参数估计的概念

参数估计是指用样本指标(统计量)估计总体指标(参数)。参数估计有点估计和区间估计两种方法。 (一) 点估计 (二) 区间估计

用已知样本统计量和标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间(confidence interval , CI ),这一估计可相信的程度称为置信度或置信水平(如95%或99%)。 若标准差不变,置信度由95%提高到99%,置信区间便由窄变宽,估计的精度下降。 置信区间的计算

(一) 正态分布总体均数的置信区间

总体均数置信区间的基本公式是X ± t α/2, ν x S 。样本量较大时,可以是X ± Z α/2x S 或X ±Z α/2X σ(若总体标准差已知)。

实际工作中,估计总体均数置信区间时,要注意与参考值范围区别。

假设检验的概念与原理

一、假设检验的思维逻辑

基本推断原理:小概率事件在一次随机试验中不(大)可能发生。 特点:从研究总体中抽取大小合适的随机样本,应用假设检验理论和方法,

依据样本提供的有限信息对总体做推断。

假设检验的基本步骤

基本概念:检验水准是假设检验预先规定的一个“较小”的概率值,应用中常

取0.05或0.01等数值,是人为的判断标准。统计量是随机样本的函数;由样本计算出统计量的具体数值,据以决策。如果总体状况和H 0一致,统计量获得现有数值以及更不利于H 0的数值的可能性(概率)就是P 值。

假设检验的基本步骤:

1. 选择检验方法,建立检验假设并确定检验水准

2. 计算检验统计量

3. 确定P 值

4. 做出推断结论

t 检验

t 检验的应用条件:样本取自正态总体。 一、一组样本资料的t 检验 检验统计量:

, 1-=n ν

其中,μ

为已知的总体均数(一般为理论值、标准值或经过大量观察所得的稳

定值等)。

二、配对设计资料的t 检验

基本概念:配对设计是研究者为了控制可能存在的主要非处理因素而采用的

一种试验设计方法。

检验统计量:

, 1-=n ν

其中,d 为差值的均数,d S 为差值的样本标准差, n 是对子数。

三、两组独立样本资料的t 检验 ㈠ 两样本所属总体方差相等

检验统计量:

221-+=n n ν

其中,2c S 是合并方差。

㈡ 两样本所属总体方差不等(t ’检验)

检验统计量:

2

22

121

21'n S n S X X t +-=

,1

1

)(24142222

1

21-+

-+=

n S n S S S x

x x x ν

其中,1x S 和2x S 分别为两组样本均数的标准误。

假设检验与区间估计的关系

1. 置信区间具有假设检验的主要功能。

2. 置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实 际意义。

3. 假设检验可以报告确切的P 值,还可以对检验的功效做出估计。

假设检验的功效

假设检验的两类错误

附表推断结论和两类错误的概率

实际情况

检验结果

拒绝H0不拒绝H0

H0真第Ⅰ类错误(α) 结论正确(1-α)

H0 不真结论正确(1-β) 第Ⅱ类错误(β)

当样本容量n一定时,α越小β越大;α越大β越小;要想同时降低α与β,唯一的方法是增大样本容量。

假设检验的功效

基本概念:1-β称为假设检验的功效,其意义是,当所研究的总体与H0确有差别时,按检验水平α能够发现它(拒绝H0)的概率。

应用假设检验需要注意的问题

方差分析

熟悉:方差分析的前提条件;多个样本均数的两两比较。

掌握:方差分析的基本思想;各种设计方案(完全随机设计、随机区组设计、析因设计、重复测量设计等)变异和自由度的分解方法。

[重点难点]

完全随机设计资料的方差分析

一、方差分析的基本思想

方差分析的基本思想就是把全部观察值间的变异——总变异按设计和需要分解成两个或多个组成部分,总自由度也分解成相应的几个部分,再作分析。分解的每一部分代表不同的含义,其中至少有一部分代表各均数间的变异情况,另一部分代表误差。

全部试验数据大小不同,这种变异称为总变异,该变异既包括了随机误差(含

个体差异和测量误差),也包括了处理效应的作用。各处理组样本均数各不相同,与总均数也不相同,这种变异称为组间变异(variation between groups),它反映了处理的影响,同时也包括了随机误差(含个体差异和测量误差)。各处理组内部观察值大小不同,这种变异称为组内变异(variation within groups),组内变异仅反映随机误差(含个体差异和测量误差)。一般地,

S S S S S S =+总组间

组内 ννν=+总组间组内

(9-1) 二、完全随机设计资料方差分析的基本步骤

完全随机设计资料的方差分析用于成组设计多个样本均数的比较,属单向(因素)方差分析(one-way ANOV A),它将数据按一个方向(即同一处理的不同水平或不同处理)进行分组整理。

方差分析的基本步骤同其它假设检验,也分为三步。 (1) 建立检验假设,确定检验水准 H 0:多个总体均数全相等;

H 1:多个总体均数不全相等,即至少有两个总体均数不等。 α=0.05

(2) 计算检验统计量

表9-1 完全随机设计方差分析的计算公式

变异来源 SS

df MS

F

组间(处理组间)

2()i i i

n X X -∑

k –1

1

SS k -组间

MS MS 组间

组内

组内(误差)

2(1)i i

i

n S

-∑

N –k

SS N k

-组内

2

2

()X X N

-

∑∑ N –1

1

SS N -总

(3) 确定P 值,作出推断结论

以求F 值时分子的自由度ν1=ν组间、分母的自由度ν2=ν组内查F 界值表得P 值,P 和α比较得出推断结论。 随机区组设计资料的方差分析 一、离均差平方和与自由度的分解

随机区组设计资料的变异除了总变异、处理的变异和随机误差外,还存在区组的变异。区组变异是指每一区组的样本均数各不相同,与总均数也不相同。它既反映了区组因素不同的影响,也包括了随机误差(含个体差异和测量误差)。即

S S S S S S S S =++处理

总区组误差

νννν=++处理总区组误差

(9-2) 二、随机区组设计资料方差分析的基本步骤

(1)建立检验假设,确定检验水准 对于处理组,

H 0:多个总体均数全相等,即各处理效果相同 H 1:多个总体均数不全相等,即各处理效果不全相同 对于区组,

H 0:多个总体均数全相等 H 1:多个总体均数不全相等 均取α=0.05

(2)计算检验统计量

表9-2 随机区组设计方差分析的计算公式

变异来源 SS df MS F

处理组

2()i

i

i

n X

X -∑

k –1

1SS k -处理

MS MS 处理

误差

区组

2()j j j

n X X -∑ b –1

1SS b -区组

MS MS 区组

误差

误差

SS SS SS --处理总区组

N –k –b +1或

(k –1)(b –1)

1SS N k b --+组内

2

2

()X X N

-

∑∑

N –1 1

SS N -总

(3)确定P 值,作出推断结论

分别以求F 值时分子的自由度ν处理和ν区组、分母的自由度ν误差查F 界值表得处理效应的P 值和区组效应的P 值,P 和α比较得出推断结论。

多个样本均数的两两比较

若经ANOV A分析得到处理因素的P<0.05,按α=0.05水准,拒绝H0,接受H1时,说明多个总体均数不全相等。但不能得到各处理组总体均数全部不等,还是其中有某两个总体均数不等的结论。若要说明多个总体均数中哪些总体均数不等需进一步作两两比较。两两比较的方法很多,常用的是多重比较,可分为以下两种情形:

(1)在研究设计阶段未预先考虑或预料到,经假设检验得出多个总体均数全不等的提示后,才决定多个均数的两两事后比较,常用于探索性研究,往往涉及到每两个均数的比较。可采用SNK法、Bonfferoni t检验、?idák t检验等等;

(2)在设计阶段就根据研究目的或专业知识而计划好的某些均数间的两两比较,常用于事先有明确假设的证实性研究,如多个处理组与对照组的比较。可采用Dunnett-t检验、LSD-t检验等,也可用Bonfferoni t检验、?idák t检验。

一、SNK法

SNK法也称NK法,属多重极差检验(multiple range test),其检验统计量为q,故又称q检验,具体检验步骤如下:

(1)建立检验假设,确定检验水准

H0:μA=μB,即任两对比组的总体均数相等

H1:μA≠μB,即任两对比组的总体均数不等

α=0.05

(2)计算检验统计量

首先将各样本均数由小到大排列,并编组次,再计算q检验量。

=

A B

A B

X X

X X X X

q

S

νν

-

-

==

误差

(9-5)

(3)确定P值,作出推断结论

以ν

误差

、对比组内包含组数a和q值查q界值表得相应P值,P和α比较得出推断结论。

二、Dunnett法

Dunnett法其检验统计量为t,故又称Dunnett t检验。它适用于k–1个实验组与对照组均数的比较,其具体步骤如下:

(1)建立检验假设,确定检验水准

H0:μT=μC,即任一实验组与对照组的总体均数相等H1:μT≠μC,即任一实验组与对照组的总体均数不等α=0.05

(2)计算检验统计量

=

T C

T C

D

X X

X X X X

t

S

νν

-

-

==

误差

(9-6)

(3)确定P值,作出推断结论

以ν

误差

、实验组数a=k?1 (不含对照组)和t D值查Dunnett t界值表得P值,P 和α比较得出推断结论。

三、Bonfferoni法

又称Bonfferoni t检验,该法是对检验水准进行调整,使多次比较后犯第一类错误的累积概率保持不变或至少不超过原有水准的方法,该法的思想适用于所有的两两比较。基本步骤如下:

(1)建立检验假设,确定检验水准

H0:μA=μB,即任两对比组的总体均数相等

H1:μA≠μB,即任两对比组的总体均数不等

)1

(

2

'

-

=

=

k

k

m

α

α

α

(2)计算检验统计量

=

A B

A B

X X

X X X X

t

S

νν

-

-

==

误差

(9-7)

(3)确定P值,作出推断结论

以上述t值和ν

误差

查t界值表得各对比组的P值,P和α比较得出推断结论。

计数资料的统计描述

掌握:相对数常用指标、应用相对数的注意事项、动态数列常用指标(绝对增长量、发展速度、增长速度、定基比、环比、平均发展速度和平均增长速度)。

常用的相对数指标 (一)强度型指标

意义: 通常近似地反映某一事件出现的机会大小, 如发病概率、死亡概率等。

计算公式

频率型指标无量纲,在0~1范围内取值;K 是比例基数,通常取为100%,也可取为1000‰、1万/1万和10万/10万等,根据习惯用法来决定。

常用指标:频率型指标是最常见的。具体指标参见教材。 (二)结构型指标 意义:说明内部构成或比重。

(三)相对比型指标

意义:相对比型指标是指任何两个相关联的变量A 与B 之比。它表示相对于B 的一个(或十个、百个、千个等)单位,A 有多少个单位。A 和B 可以是绝对数、相对数和平均数,A 和B 的量纲可以不同,也可相同,但A 和B 互不包含。

计算公式: B

A

=

相对比型指标 常用指标:人口学中的男女性别比,反映卫生资源的指标如每千人口的医生数、每千人口的病床数、每医生的门诊工作量以及分析动态数列的指标等都是相对比。

(四)应用相对数应注意的事项 1. 防止概念混淆,如率与构成比 2. 计算相对数时分母应有足够数量 3.正确地合并估计频率(或强度)型指标 4. 相对数间的比较要具备可比性

5. 对相对数的统计推断

率的标准化方法 1、 直接法 2、 间接法

3、注意事项

动态数列及其分析指标

动态数列(dynamic series)是一系列按时间顺序排列起来的统计指标(可以是绝对数、相对数或平均数),用以说明事物在时间上的变化和发展趋势。动态数列分析建立在相对比基础上,采用定基比和环比两种方式;

一、绝对增长量

绝对增长量是说明事物在一定时期增长的绝对值。其中累积增长量是指报告年的指标与某一固定年(基期水平)指标之差;逐年增长量是指报告年的指标与前一年指标之差。

二、发展速度与增长速度

意义:发展速度与增长速度均可按照定基比和环比的方式进行计算。定基发展速度是用报告期的指标与某一时期(固定为基期)指标之比;环比发展速度是用报告期的指标与其上一期指标之比。

计算公式: 定基发展速度=

a a n

式中a n 为报告期指标,a 0为基期指标。

环比发展速度=

1

n n a a

式中a n 为报告期指标,a n-1为报告期的上一期的指标。 定基(环比)增长速度 =定基(环比)发展速度% - 100%

=定基(环比)发展速度– 1

应用:发展速度表示报告期指标的水平相当于基期水平的百分之多少或若

干倍;增长速度表示的是净增加量。

三、平均发展速度和平均增长速度

意义:平均发展速度是各环比发展速度的几何平均数,说明某事物在一个较长时期中逐年平均发展变化的程度。平均增长速度是各环比增长速度的几何均数,说明某事物在一个较长的时期中逐年平均增长的程度。

计算公式: 平均发展速度 =n

n

a a 0

式中:a 0为基期指标;a n 为第n 年指标。

平均增长速度 = 平均发展速度 - 1

二项分布及Poisson 分布

掌握:掌握二项分布及Poisson 分布的概念;二项分布及Poisson 分布

的概率函数与累计概率

[重点难点]

二项分布

一、二项分布的概念与特征

基本概念:如果每个观察对象阳性结果的发生概率均为π,阴性结果的发生概率均为(1-π);而且各个观察对象的结果是相互独立的,那么,重复观察n 个人,发生阳性结果的人数X 的概率分布为二项分布,记作B (n ,π)。 二项分布的概率函数:

X

n X X n C X P --=)1()(ππ

二项分布的特征:

二项分布图的形态取决于π与n ,高峰在μ=n π处。当π接近0.5时,图形是对称的;π离0.5愈远,对称性愈差,但随着n 的增大,分布趋于对称。

二项分布的总体均数为 πμn = 方差为 )1(2ππσ-=n 标准差为 )1(ππσ-=n

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

商务统计学Assignment 2 (附答案)

Assignment 2 1. The amount of bleach a machine pours into bottles has a mean of 36 oz. with a standard deviation of 0.15 oz. Suppose we take a random sample of 36 bottles filled by this machine. What is the probability that the mean of the sample is greater than 35.94 oz? 4.236 15 .03694.35-=-=-=x x X Z σμ )4.2()4.2(Φ=->Φx The area corresponding to Z=2.4 in Table E.2 is 0.9918 Because the probability that the mean of the sample is greater than 35.94 oz,so the value is 0.9918. 2. Page 186-- Answer questions in 7.47 (b),(c) (b)60.150002 .098.098.099.0)1(60.150002 .098.098.097.0)1(2211=?-=--=-=?-=--= n p Z n p Z ππππππ 9452.0)60.1(=Φ 1-2(1-0.9452)=0.8904 Using Table E.2,the area between 97% and 99% with Internet access is 0.8904,only 89.04% of the samples of n=500 would be expected to have sample between 97% and 99% with Internet access. (c))60.1()60.1(60.1500 02.098.098.097.0)1(11>Φ=-<Φ-=?-=--= x x n p Z πππ 9452.0)60.1(=Φ 1-0.9452=0.0548 Using Table E.2,the area less than 97% with Internet access is 0.0548,only 5.48% of the samples of n=500 would be expected to have sample less than 97% with Internet access.

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

生物统计学复习重点137030032

主要统计符号注解
编号 1 2 3 4 5 6 7 8 9 11 12 13 符号 注解 希腊字母符号 统计检验的显著水平,一般 α 取 0.05 或 0.01 总体标准差。用拉丁字母 S 表示样本标准差 总体方差。用拉丁字母 S2 表示样本方差(均方) 样本平均数抽样总体方差 标准误 (样本平均数抽样总体的标准差, 表示平均数抽样误差的大小) S x 。 为标本标准误,是平均数抽样误差的估计值 总体平均数。用拉丁字母 x 表示样本平均数 卡平方值 经连续性矫正的卡平方值 自由度 df 为显著水平为 α 时的卡平方临界值 随机误差;重复内分组设计的参试材料误差 线性模型中的处理效应 表示从第 1 个观测值 xi 累加到第 n 个,观测值 xn,当
i
α
σ σ2
2 σx σx
μ χ2 χ c2 2 χ α ,df
ε τ
n
n
∑x
i=1
∑x
i =1
在意义上已明确
i
时,可简写为 ∑ x 。 ∑ 为求和符号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
T N n SS MS S S2 H0 HA SE DF CV CK O E F LSD LSR x~N(μ, 2) ( ,σ p,q , x~B(n,p) ( , ) a b r c f t u
x
d
d
k
拉丁字母符号 观测值总和 有限总体的总观测值数目 样本的观测值数目或样本容量(样本含量) 平方和 均方 样本标准差,用以估计总体标准差 σ 标准方差(均方) ,用以估计总体方差 σ2 无效假设 备择假设 标准误 自由度,自由度具体数值用 df 表示,如 df=8 变异系数 对照 观测次数 理论次数 F 统计数,F0.05 、F0.01 分别为 0.05、0.01 的临界值 最小显著差数(least significant difference) ( ) 最小显著极差(least significant ranges) 随机变量 x 服从参数 μ 和 σ 的正态分布,μ 为总体平均数,σ 为总体标准差 二项总体成数 p+q =1 随机变量 x 服从参数 n 和 p 的二项分布,n 为试验次数, p 为理论概率 直线回归方程中样本的回归截距 直线回归方程中标本回归系数 样本相关系数;独立性检验中相依表的行数 独立性检验中相依表的列数 观测次数 t 分布的统计数 u 正态分布的统计数;正态标准离差 样本平均数,用以估计总体平均数 μ 成对观测值的差数 成对观测值的差数的平均数 样本数或处理数
第 1 页 共 14 页

商务统计学最新版重点名词解释

1. standard error of the mean The value of the standard deviation of all possible sample means, called the standard error of the mean , expresses how the sample mean varies from sample to sample. n x /σσ= 2.Population A population consists of all of the members of a group about which you want to draw a conclusion. 3.Parameter A parameter is a numerical measure that describes a characteristic of a population. 4. Frequency distribution A frequency distribution is a summary table in which the data are arranged into numerically ordered class groupings. 5.Range The range is the simplest numerical descriptive measure of variation in a set of data. sm allest est l X X Range -=arg 6.conditional probability p 81 conditional probability refers to the probability of event A ,given information about the occurrence of another event B . ()()() B P A a n d B P =B \A P 7. sampling with replacement The sampling with replacement means that after you select an item, you return it to the frame where it has the same probability of being selected again. 8. Sampling distribution To use the sample statistic to estimate the population parameter, you should examine every possible sample that could occur. A sampling distribution is the distribution of the results if you actually selected all possible samples.

初级生物统计学学习心得

高级生物统计学课程学习总结 摘要:经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。本文主 要讲述了本学期学习生物统计之后,我对生物统计学的收获和体会。 关键词:生物统计学 收获 体会 学习了黄老师讲授的《高级生物统计学》这门课程,我觉得自己又收获了不少。经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。虽说我的专业是课程与 教学论,对生物统计学知识的运用较少,但我深信,于我自身,它将起到不可估量的作用。 下面主要谈谈我对这门课程的理解与感悟。 1.对生物统计学的认识 1.1生物统计学的概念 生物统计学是一门以概率理论为基础的,实际应用性非常强的综合性的学科。它运用概率论与数理统计的原理和方法处理生物学中的各种数量资料,从而透过现象揭示生物学 本质的一门科学,是科学研究与实践应用的基础工具。它是研究如何搜集、整理、分析反 映整体信息的数字资料,并以此为依据,推断总体特征,然后用生物学的语言加以描述的 工具。 从生物统计学的概念我们不难看出,生物统计是要我们根据部分所反映出来的性质,推断总体的性质,在推断的过程中,不可避免的会有一定的出错概率,我们只是选择不同 的分析方法将这一概率降到最低。它不仅为我们提供了设计试验,获取资料的方法,还提 供了整理资料,最后得出科学结论的方法。因此,学好生物统计对我们以后设计试验,分 析试验数据,得出科学而精简的结论有很大帮助。 1.2生物统计学的重要性 统计学在生物学中的应用已有长远的历史,许多统计的理论与方法也是自生物上的应用发展而来,而且生物统计是一个极重要的跨生命科学各研究领域的平台。 随着基因组学、蛋白质组学与生物信息学的蓬勃发展,使得生物统计在这些突破性生 物科技领域上扮演着不可或缺的角色。,生物统计学在这些领域被广泛应用,并显得日益重 要。生物统计学是生物领域学生应具备的基本知识和素质,与生命活动有关的各种现象中 普遍存在着随机现象,大到整个生态系统,小到核苷酸序列,均受到许多随机因素的影响, 表现为各种各样的随机现象,而生物统计学正是从数量方面揭示大量随机现象中存在的必 然规律的学科。因此,生物统计学是一门在实践中应用十分广泛的工具学科,它是生物科 管线不仅可以解决吊顶层配卷问题,而且可保障各类路敷设过程中,要加强看料试卷连接管口处理高中资料试卷保护层防腐跨接地线弯曲半径标高中语文电气课件中管壁薄、接利用管线敷设技术。线缆敷设原则不同电压回路交叉时,应采用金属同一线槽内强电回路须同时切根据生产工艺高中资料试卷要求,与带负荷下高中资料试卷调控试使其在正常工况下与过度工作下都于继电保护进行整核对定值,审核杂设备与装置高中资料试卷调试动过程中高中资料试卷电气设备进过关运行高中资料试卷技术指导中资料试卷技术问题,作为调试人图纸资料、设备制造厂家出具高案。 保护高中资料试卷配置技术是指高中资料试卷总体配置时,需要在机组高中资料试卷安全,并且尽可料试卷破坏范围,或者对某些异进行自动处理,尤其要避免错误高然停机。因此,电力高中资料试,要求电力保护装置做到准确灵活置高中资料试卷调试技术是指发电内部故障时,需要进行外部电源

统计学考试要点整理

2010级3班整理生物统计学基础知识整理 生物统计学整理 第一部分名词解释本文档仅供参考,仍有不足,有许多名词没有交待,需自己补充。本资料与课本,课后习题册搭配使用效果更好,有疑问联系大正 1生物统计学:是一门探讨如何从事生物学实验研究的设计,取样,分析,资料整理与推 论的科学.是数理统计在生物学研究中的应用,它是应用数理统计的 原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科, 属于应用统计学的一个分支。 2总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 3个体:构成总体的每个成员称为个体。 4样本:总体的一部分称为样本 5样本含量:样本内包含的个体数目称为样本含量 6抽样:从总体中获得样本的过程。 7连续性数据:与某种标准做比较所得到的数据称为连续型数据,又称为度量数据 8离散型数据:由记录不同类别个体的数目所得到的数据,称为离散型数据 9变量的方法:对连续性数据进行分析的方法,通常称为变量的方法 10属性的方法:对离散型数据进行分析的方法 11对于数据的变异程度,经常使用的度量方法有三中,1 范围或称为极差 2 平均离差 3 标准离差或称为标准差 12概率论:研究偶然现象本身规律性的科学 13统计学:基于实际观测结果,利用概率论得出的规律,揭示偶然性中所寄寓的必然性 的科学 14随机实验:在我们做第一次观测时,并不能准确得知下一次的结果,这样的实验叫做随机实验 随机误差:试验过程中,由于各种无法控制的随机因素所引起统计量与参数之间的偏差,称之为随机误差。 15基本事件:试验的每一最基本结果用小写拉丁字母表示

2.什么叫总体?什么叫样本?为什么要抽样?怎样抽样? 1)总体:统计学研究的全部对象叫做总体,分为无限总体和有限总体。 2)样本:总体的一部分称为样本 3)从总体中获得样本的过程称为抽样,抽样的目的是希望通过对样本的 研究,推断其总体。生物统计学中往往总体数目是无限个,为方便研究总 体特征需要抽样。 4)从总体中抽取样本时,总体中的每一个个体被抽中的机会必须都一样,不能带有偏见,我们得到的样本应该是该市总体的一部分,需要进行随机 抽样。随机抽样的方法很多,例如抽签,拈阄等。最好方法是使用随机数 字表进行抽样。 5)随即数字表抽样步骤:第一步,闭上眼睛用铅笔在随机数字表上任意 点上一点,假若点到奇数,就用第一页表;假若点到偶数,就用第二页表。 第二步,在选定的那一页上,在点一次,决定从那个字开始。决定开始以 后进行读书(例如,总体有 4728 个个体,那就四位数字为一节读下去,

商务统计学笔试复习题

一、The manager of the customer service division of a major consumer electronics company is interested in determining whether the customers who have purchased a videocassette recorder made by the company over the past 12 months are satisfied with their products. 1., the population of interest is a)all the customers who have bought a videocassette recorder made by the company over the past 12 months. b)all the customers who have bought a videocassette recorder made by the company and brought it in for repair over the past 12 months. c)all the customers who have used a videocassette recorder over the past 12 months. d)all the customers who have ever bought a videocassette recorder made by the company. ANSWER: a 2., which of the following will be a good frame for drawing a sample? a)Telephone directory. b)Voting registry. c)The list of customers who returned the registration card. d) A list of potential customers purchased from a database marketing company. ANSWER: c 3.the possible responses to the question "How many videocassette recorders made by other manufacturers have you used?" are values from a a)discrete random variable. b)continuous random variable. c)categorical random variable. d)parameter. ANSWER: a 4.the possible responses to the question "Are you happy, indifferent, or unhappy with the performance per dollar spent on the videocassette recorder?" are values from a a)discrete numerical random variable. b)continuous numerical random variable. c)categorical random variable. d)parameter. ANSWER: c

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 闭卷 说明:1、答题请使用黑色或蓝色的钢笔、圆珠笔在答题纸上书写工整. 2、考生应在答题纸上答题,在此卷上答题作废. 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1 (已知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。 ( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。 A 、[-9.32,11.32] B 、[-4.16,6.16]

商务统计学笔试复习题

一、 The manager of the customer service division of a major consumer electronics company is interested in determining whether the customers who have purchased a videocassette recorder made by the company over the past 12 months are satisfied with their products. 1., the population of interest is a)all the customers who have bought a videocassette recorder made by the company over the past 12 months. b)all the customers who have bought a videocassette recorder made by the company and brought it in for repair over the past 12 months. c)all the customers who have used a videocassette recorder over the past 12 months. d)all the customers who have ever bought a videocassette recorder made by the company. ANSWER: a 2., which of the following will be a good frame for drawing a sample a)Telephone directory. b)Voting registry. c)The list of customers who returned the registration card. d) A list of potential customers purchased from a database marketing company. ANSWER: c 3.the possible responses to the question "How many videocassette recorders made by other manufacturers have you used" are values from a

统计学参考答案

综合指标 1、某企业2006年产值超计划完成8%,比上年增长12%,试问产值计划规定比上期增长多少? 又该企业甲产品单位成本计划在上年230元的水平上降低15元,实际上比上年降低了8%,试计算甲产品单位成本的计划完成程度。 %108% 1% 121=++x %7.31% 108% 121%=-+= x 2 要求计算表中空格数字,并直接填入表中。 3要求:1.计算该工业局的平均劳动生产率; 2.计算该工业局平均每个企业的产值。 该工业局的平均劳动生产率=10600000÷1400=7571.4(元/人)

该工业局平均每个企业的产值=1060÷20=53(万元/人) 5 试分别计算男、女职业人员的总录用率,并比较两组说明各组和总录用率高低不同的原因。 男的总录用率=123÷600=20.5% 女的总录用率=89÷500=17.8% 6、某厂三个分厂同时生产甲产品,第一季度生产情况如下: 一分厂实际产量为500件,刚好完成计划;二分厂实际产量为900件,仅完成计划的90%;三分厂实际产量为1160件,超额完成计划16%。另外,一分厂单位成本为18元/件,二分厂单位成本为16元/件,三分厂单位成本为17元/件。所以全厂超额2%完成甲产品产量计划,即(0+16%-10%)/3=2%;全厂甲产品平均单位成本为17元/件,即(18+16+17)/3=17元/件。 以上平均指标的计算是否正确?为什么?应该如何计算? 全厂计划完成率=%4.1022500 2560 %116/1160%90/9005001160900500==++++ 全厂平均单位成本= 8.162560 43120 1160 9005001711601690018500==++?+?+?(元) 7、2006年某月份A 农贸市场某农产品价格和成交量、成交额资料如下: 试问哪一个市场农产品的平均价格较高?并说明原因。 甲市场平均价格=5.5÷4=1.375(元/斤) 乙市场平均价格=5.3÷4=1.325(元/斤)

商业统计学复习整理

商业统计学考试大纲 一、考试题型 1.选择题(20道小题,每小题2分,共40分) 2.判断题(10道小题,每小题1分,共10分) 3.简答题(2道小题,每小题5分,共10分) 4.案例分析(1道小题,共10分) 5.计算题(3-4道题目,共30分) 二、复习要点 1.第一章绪论 (1)掌握统计、统计资料、统计工作和统计理论的含义。 (2)熟悉3大统计学派,并知道每个学派的创始人。 (3)了解统计学的定义,统计学的分类。 (4)掌握统计工作的4个阶段。 (5)掌握下面与数据相关的概念:总体、个体(总体单位)、标志、统计指标、变异、变量、变量值和观察值。尤其要区分总体和总体单位,标志和统计指标这两对相似的概念。 (6)了解数据的测量尺度。 (7)了解横截面数据和时间数列数据之间的差别 (8)掌握描述统计和统计推断的含义。 2.第二章描述统计学简介 (1)掌握统计分组过程。掌握统计分组。掌握全距、组数和组距三者之间的关系。知道“上限不在内”原则。 (2)掌握频数分析相关的概念。如分配数列、单项数列、组距数列、频数、频率、向上累计频率、组中值等概念。尤其要掌握频率、向上累计频率,开口组组中值的计算。 (3)了解次数分布曲线的含义。掌握次数分布的主要类型,如钟型分布、U型分布,J型分布。 (4)熟悉直方图、连线图、散点图和饼图这几种统计图形的作用。 (5)熟练掌握综合指标的分类,综合指标包括了总量指标、相对指标、平均指标和变异指标。 (6)掌握6种相对指标的含义和计算公式以及注意要点。这6种相对指标包括:结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标和计划完成相对程度指标。 (7)掌握一些常用的宏观经济指标:例如国内生产总值GDP、消费者价格指数CPI,失业率,通货膨胀率的概念。 (8)知道描述数据分布的三个方面:集中趋势、离中趋势和偏度和峰度。(9)知道平均指标的含义和作用。 (10)熟练掌握算术平均数、调和平均数、几何平均数、众数和中位数这几个平均指标的含义、计算公式、适用条件和特点。不要求掌握加权调和平均数、

《生物统计学-2019》复习题

《生物统计学》复习题 1.变量之间的相关关系主要有两大类:(因果关系),(平行关系) 2.在统计学中,常见平均数主要有(算术平均数)、(几何平均数) 3.样本标准差的计算公式( 1 ) (2 --= ∑n X X S ) 4.小概率事件原理是指(某事件发生的概率很小,人为的认为不会发生) 5.在分析变量之间的关系时,一个变量X 确定,Y 是随着X 变化而变化,两变量呈因果关系,则X 称为(自变量),Y 称为(因变量) ADCAA BABCB DADBB ADBCB 1、下列数值属于参数的是: A 、总体平均数 B 、自变量 C 、依变量 D 、样本平均数 2、 下面一组数据中属于计量资料的是 A 、产品合格数 B 、抽样的样品数 C 、病人的治愈数 D 、产品的合格率 3、在一组数据中,如果一个变数10的离均差是2,那么该组数据的平均数是 A 、12 B 、10 C 、8 D 、2 4、变异系数是衡量样本资料 程度的一个统计量。 A 、变异 B 、同一 C 、集中 D 、分布 5、方差分析适合于, 数据资料的均数假设检验。 A 、两组以上 B 、两组 C 、一组 D 、任何 6、在t 检验时,如果t = t 0、01 ,此差异是: A 、显著水平 B 、极显著水平 C 、无显著差异 D 、没法判断 7、 生物统计中t 检验常用来检验 A 、两均数差异比较 B 、两个数差异比较 C 、两总体差异比较 D 、多组数据差异比较 8、平均数是反映数据资料 性的代表值。 A 、变异性 B 、集中性 C 、差异性 D 、独立性 9、在假设检验中,是以 为前提。 A 、 肯定假设 B 、备择假设 C 、 无效假设 D 、有效假设 10、抽取样本的基本首要原则是 A 、统一性原则 B 、随机性原则 C 、完全性原则 D 、重复性原则 11、统计学研究的事件属于 事件。 A 、不可能事件 B 、必然事件 C 、小概率事件 D 、随机事件 12、下列属于大样本的是 A 、40 B 、30 C 、20 D 、10 13、一组数据有9个样本,其样本标准差是0.96,该组数据的标本标准误(差)是 A 、0.11 B 、8.64 C 、2.88 D 、0.32 14、在假设检验中,计算的统计量与事件发生的概率之间存在的关系是 。 A 、正比关系 B 、反比关系 C 、加减关系 D 、没有关系 15、在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是 A 、18 B 、12 C 、10 D 、5 16、已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是 A 、9、1和8 B 、1、8和9 C 、8、1和9 D 、 9、8和1 18、下列那种措施是减少统计误差的主要方法。 A 、提高准确度 B 、提高精确度 C 、减少样本容量 D 、增加样本容量 19、相关系数显著性检验常用的方法是

商务统计学 2015期中考试卷

《商务统计》期中考试试题 Part I: 单选题(每题2分,共60分) 1.The universe or "totality of items or things" under consideration is called a) a sample、 b) a population、 c) a parameter、 d) a statistic、 2.Which of the following is most likely a population as opposed to a sample? a)respondents to a newspaper survey、 b)the first 5 students completing an assignment、 c)every third person to arrive at the bank、 d)registered voters in a county、 3. A study is under way in Yosemite National Forest to determine the adult height of American pine trees、Specifically, the study is attempting to determine what factors aid a tree in reaching heights greater than 60 feet tall、It is estimated that the forest contains 25,000 adult American pines、The study involves collecting heights from 250 randomly selected adult American pine trees and analyzing the results、Identify the variable of interest in the study、 a)The age of an American pine tree in Yosemite National Forest、 b)The height of an American pine tree in Yosemite National Forest、 c)The number of American pine trees in Yosemite National Forest、 d)The species of trees in Yosemite National Forest、 4.The British Airways Internet site provides a questionnaire instrument that can be answered electronically、Which of the 4 methods of data collection is involved when people complete the questionnaire? a)Published sources b)Experimentation c)Surveying d)Observation 5.To monitor campus security, the campus police office is taking a survey of the number of students in a parking lot each 30 minutes of a 24-hour period with the goal of determining when patrols of the lot would serve the most students、If X is the number of students in the lot each period of time, then X is an example of a) a categorical random variable、 b) a discrete random variable、 c) a continuous random variable、 d) a statistic、

生物统计学期末考试题

生物统计学期末考试题 一名词解释(每题2分,共10分) 1.生物统计学期末考试题 2.样本:从总体中抽出的若干个体所构成的集合称为样本 3.方差:用样本容量n来除离均差平方和,得到的平方和,称为方差 4.标准差:方差的平方根就是标准差 5.标准误:即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度, 反映的是样本均数之间的变异。 6.变异系数:将样本标准差除以样本平均数,得出的百分比就是变异系数 7.抽样:通常按相等的时间间隔对信号抽取样值的过程。 8.总体参数:所谓总体参数是指总体中对某变量的概括性描述。 9.样本统计量:样本统计量的概念很宽泛(譬如样本均值、样本中位数、样本方差等等),到现在 为止,不是所有的样本统计量和总体分布的关系都能被确认,只是常见的一些统计量和总体分布之间 的关系已经被证明了。 10.正态分布:若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布, 正态分布又名 高斯分布 11.假设测验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完全知道的总 体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该 接受的那种假设的推断。 12.方差分析:又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。 13.小概率原理:一个事件如果发生的概率很小的话,那么它在一次试验中是几乎不可能发生的,但 在多次重复试验中几乎是必然发生的,数学上称之小概率原理。 15.决定系数:决定系数定义为相关系数r的平方 16.随机误差:在实际相同条件下,多次测量同一量值时,其绝对值和符号无法预计的测量误差。 17.系统误差:它是在一定的测量条件下,对同一个被测尺寸进行多次重复测量时,误差值的大小和 符号(正值或负值)保持不变;或者在条件变化时,按一定规律变化的误差 二. 判断题(每题2分,共10分) 1. 在正态分布N(μ ;σ)中,如果σ相等而μ不等,则曲线平移, ( ) 2. 如果两个玉米品种的植株高度的平均数相同,我们可以认为这两个玉米品种是来自同一总体() 3. 当我们说两个处理平均数有显著差异时,则我们有99%的把握肯定它们来自不同总体. 4小概率原理是指小概率事件在一次试验中可以认为不可能发生() 5 激素处理水稻种子具有增产效应,现在在5个试验区内种植经过高、中、低三种剂量的激素处理的水稻种此试验称为三处理五重复试验() 6.系统误差是不可避免的,并且可以用来计算试验精度。() 7.精确度就是指观察值与真值之间的差异。() 8. 实验设计的三个基本原则是重复、随机、局部控制。() 9. 正交试验设计就是从全部组合的处理中随机选取部分组合进行试验。() 10.如果回归方程Y=3+1.5X的R2=0.64,则表明Y的总变异80%是X造成。() 三. 简答题(每题5分共20分) 1. 完全随机试验设计与随机区组试验设计有什么不同? 2. 什么是小概率原理?在统计推断中有何 作用? 3. 什么是多重比较中的FISHER氏保护测验?4. 样本的方差计算中,为什么要离均差平方和 除以n-1而不是除以n? 5. 如果两个变量X和Y的相关系数小于0.5,是否它们就没有显著相关性? 6. 单尾测验与双尾测验有何异同?

相关主题
文本预览
相关文档 最新文档