生物统计学复习重点

  • 格式:doc
  • 大小:54.00 KB
  • 文档页数:6

下载文档原格式

  / 9
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生物统计学复习纲领

一填空(红色为重点)

1统计资料一般分为计数资料、计量资料和等级资料三类。

2各种抽样方法的抽样误差一般是:整群抽样≥单纯随机抽样≥系统抽样≥分层抽样。

3处理因素、受试对象和实验效应是实验设计的三个基本要素

4在实验设计中,应当严格遵守对照、随机、重复三个基本原则。

5可信区间两个要素:

(1)准确度:反映在可信度(1-α)的大小。1-α越接近1,越准确。

如可信度99%比95%准确。

(2)精确度:反映在区间范围宽窄。范围越摘越好。

95%可信区间精度优于99%。

在n确定的情况下,准确度↑,精确度↓;

在兼顾准确度和精确度时,一般取95%可信区间;

在可信度确定的情况下,增加样本例数,可提高精确度。

6 描述平均水平的指标:算数均数,几何均数,中位数,众数。

7 描述变异程度的指标:极差,四分位数间距,方差,标准差,变异系数

8 假设检验的功效为1-β,影响检验效能的主要因素: 总体参数,个体差异,样本量,和检验水准α。当总体参数的差异越大,个体差异越小,样本量越大,检验水准越松,检验效能越大。

9 正态性检验的方法:图示法,分别为PP图法,QQ图;统计检验法:W检验,D检验。

10 非参数检验适合于分布类型未知、一端或两端无界、出现少量异常值的小样本数据、以及等级做记录的资料分析。

11 为了满足统计方法的应用条件有时需要对原始发量迚行一定形式的数据发换其目的是偏态正态化、曲线直线化、方差齐性。

12反映原始测定数据对其均值离散程度的统计量用标准差,表达样本统计量对其参数随机偏离程度的统计量是标准误。

13 对一对同质的计量资料通常可以从集中趋势和离散程度两个方面来全面描述其数字特征。

14对于一份统计资料通常从统计描述,统计推断两个方面进行分析其中统计推断包括参数估计和假设检验两个方面癿内容。

15 对计数资料进行统计描述通常采用相对数指标常用的相对数指标有率、构成比和相对比。

16医学统计工作的内容是实验设计、收集资料、整理资料、分析资料。统计分析常分为统计描述与统计推断两个阶段。

17常用的制定医学正常值范围(参考值范围)的方法有百分位数法和正态分布法两种。一般前者适用于偏态分布资料后者适用于正态分布资料。

18计量资料作假设检验要求资料必须满足正态性和方差齐性如果数据不能满足方差齐性要求,一般可以通过t’检验数据变换和秩和检验三条途径来处理资料。

19估计总体参数的方法有点估计和区间估计其中以区间估计最常用。20总体均数可信区间估计的理论基础是样本均数的抽样分布规律。

21欲了解两个发量之间相互关系的密切程度和方向性一般常计算的统计量是相关系数r。

22对于一组明显偏态的观察数据描述平均水平常用的指标为中位数标准差S反映一组实测数据的变异大小,标准误反映一个样本抽样误差的大小。23直线回归分析中的最小二乘法原理指散点到直线纵向距离的平方和达到最小。

24 统计假设检验的基本原理是小概率事件原理,其中拟定的假设检验概率水平P值癿含义是从原假设成立的总体随机抽样获得大于等于或小于等于现有样本信息统计量的概率。

25变异系数常用于比较单位不同或均数相差较大情况下两组资料的变异度。

26相关分析侧重于考察变量之间相关关系密切程度,回归分析则侧重于考察变量之间数量发化规律。

27常用相对数有率、构成比和相对比。

28成组t检验的自由度为,χ2检验的自由度为(R-1)

(C-1)。

29、随机区组设计的方差分析,可将总变异分解为

30 比较某地区某时期三种疾病的发病率在各年度的发展速度,应该绘制半对数线图。

31某地1980年~1990年结核病死亡率变动趋势应绘制___普通线图_,表示两种现象间的相关关系绘制__散点__图。

32 表示总体率的95%可信区间

33两个样本均数比较的t检验,其应用条件为:两样本来自正态分布的总体、两总体方差相等或齐性。

34相关系数r的假设检验,H0表示为

35回归系数b的假设检验,H0表示为

36t检验的应用条件随机性、正态性、方差齐性

37对于多个样本的秩和检验,当R=3,ni>5时,应查____表。

38非参数检验较参数检验的检验效能___低___。符合参数检验条件的资料,如采用非参数检验方法,一般情况下,犯第__2___类错误的概率增大。

二名词解释

1总体(population):根据研究目的所确定的同质观察单位的全体。分为有限总体和无限总体。

样本(sample):从总体中随机抽取的部分观察单位。

2. 频率(frequency)与概率(probability)

频率:事件实际发生次数与可能发生次数的比率,设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f / n。

概率:度量随机事件发生可能性大小的一个数值,用大写的P表示;取值[0,1]。

6单纯随机抽样(simple random sampling):将调查总体全部观察单位编号,再用抽签法或随机数字表随机抽取部分观察单位组成样本。

系统抽样(systematic sampling)又称机械抽样、等距抽样,即先将总体的观察单位按某一顺序号分成n个部分,再从第一部分随机抽取第k号观察单位,依次用相等间距,从每一部分各抽取一个观察单位组成样本。

整群抽样(cluster sampling)总体分群,再随机抽取几个群组成样本,群内全部调查。

分层抽样(stratified sampling)先按对观察指标影响较大的某种特征,将总体分为若干个类别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。有按比例分配和最优分配两种方案。

8 医学参考值范围:同质观察单位某项测定指标按一定标准确定的波动范围称参考值范围(range of reference value)

9 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的区间,该范围即为总体参数的置信区间(confidential interval)

10 P值:在零假设成立的条件下,出现统计量目前只及更不利于零假设数值的概率。

11均数的抽样误差(sampling error)

由于总体中存在个体变异,所以由抽样得到的样本均数与总体均数之间存在差异,这种差异称均数的抽样误差。

标准误(standard error of mean):样本均数的标准差。

意义:说明均数抽样误差大小的指标,用σx表示。σx越大,均数抽样误差越大;反之,σx越小,均数抽样误差越小。

12随机区组设计(randomized block design)又称配伍组设计,通常是将受试对象按性质(如动物的窝别。体重等非实验因素)相同或相近者组成b个区组(配