医学统计学(期末总复习)
- 格式:ppt
- 大小:3.68 MB
- 文档页数:101
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
一、最佳选择题1.卫生统计工作的步骤为 CA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有 DA.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括EA.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指 BA.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指 BA.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用 DA.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是 CA.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用 AA.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是 CA.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有 BA.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为 DA.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 D A.s x μ- B.σμ-x C. x s x μ- D.xx σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指 CA.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布e A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ-15.统计推断的主要内容为 BA.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指 BA.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大CA.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明 CA.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小 DA.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高DA.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为 EA. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与 值的大小无关22.假设检验中的第二类错误是指 DA.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.多组均数的两两比较中,若不用q 检验而用t 检验,则 CA. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对24.说明某现象发生强度的指标为 EA.构成比B.相对比C.定基比D.环比E. 率25.对计数资料进行统计描述的主要指标是 BA.平均数B.相对数C.标准差D.变异系数E.中位数26.构成比用来反映CA.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对27.下列哪一指标为相对比EA. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数28.两个样本率差别的假设检验,其目的是BA.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同29.用正态近似法进行总体率的区间估计时,应满足DA. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求30.由两样本率的差别推断两总体率的差别,若P 〈0.05,则DA. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义31.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为DA. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u32.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为EA. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4033.三个样本率比较得到2χ>2)2(01.0χ,可以为AA.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同34.四格表2χ检验的校正公式应用条件为CA. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<135.下述哪项不是非参数统计的优点DA.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料36.秩和检验和t 检验相比,其优点是AA. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小37.等级资料比较宜用CA. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验38.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为CA.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大39.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用AA.普通线图B.直方图C.统计地图D.半对数线图E.圆形图40.调查某地高血压患者情况,以舒张压≥90mmHg为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:BA.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料41. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
《医学统计学》期末考试试卷附答案一、单项选择题(每小题3分,共20小题,共60分)1、根据某医院对急性白血病患者构成调查所获得的资料应绘制()A 条图B 百分条图或圆图C线图D直方图2、均数和标准差可全面描述( )资料的特征A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是()A 用该市五岁男孩的身高的95%或99%正常值范围来评价B 用身高差别的假设检验来评价C 用身高均数的95%或99%的可信区间来评价D 不能作评价4、比较身高与体重两组数据变异大小宜采用()A 变异系数B 方差C 标准差D 四分位间距5、产生均数有抽样误差的根本原因是()A.个体差异B. 群体差异C. 样本均数不同D. 总体均数不同6.男性吸烟率是女性的10倍,该指标为()A.相对比B.构成比C.定基比D.率7.统计推断的内容为()A.用样本指标估计相应的总体指标B.检验统计上的“检验假设”C. A和B均不是D. A和B均是8、两样本均数比较用t检验,其目的是检验()A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是()A.n1+ n2B. n1+ n2 –1C. n1+ n2 +1D. n1+ n2 -210、标准误反映()A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度11、最小二乘法是指各实测点到回归直线的( )A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。
令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?()A.tr>tbB. tr<tbC. tr= tbD. 二者大小关系不能肯定13、设配对资料的变量值为x1和x2,则配对资料的秩和检验()A分别按x1和x2从小到大编秩B把x1和x2综合从小到大编秩C把x1和x2综合按绝对值从小到大编秩D把x1和x2的差数按绝对值从小到大编秩14、四个样本率作比较,χ2>χ20.05,ν可认为()A各总体率不同或不全相同B各总体率均不相同C各样本率均不相同D各样本率不同或不全相同15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。
统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
医学统计学复习题一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
医学统计学总复习1、几种集中趋势指标的适用条件均数—正态分布或近似正态分布;几何均数—呈正偏态分布,但数据经过对数变换后呈正态分布的资料,也可用于观察值之间呈倍数或近似倍数变化(等比关系)的资料;中位数—偏态分布资料以及频数分布的一端或两端无确切数据资料。
几种离散程度指标的适用条件:极差(全距)—常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料。
四分位数间距—常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。
方差和标准差—正态分布和近似正态分布。
变异系数—比较计量单位不同以及均数相差悬殊的几组资料。
21.标准正态分布(u分布)与t分布的异同:相同点;集中位置都是0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)。
不同点:t分布是一簇分布曲线,t分布的曲线形态是随自由度的变化而变化,标准正态分布的曲线的形态不变,是固定不变的,因为它的形状参数为1。
3.为什么不可以说“总体均数有95%的概率落在这个区间里”?样调查的成本会更高5.t检验的应用条件为:▪①在单样本检验中,总体标准差未知且样本含量较小(n<50)时,要求样本来自正态分布总体;▪②成组检验要求两组资料相应的总体分别服从正态分布且方差齐。
当不满足这些条件时可使用变量变换将数据转换成正态或者近似正态分布,或使用秩和检验。
两小样本均数比较时,若两总体方差不相等,还可使用t’检验。
6.假设检验中的注意事项▪要保证组间的可比性▪要根据研究目的、设计类型和资料类型选用适当的检验方法▪正确理解假设检验中概率P值的含义▪结论不能绝对化▪单、双侧检验应事先确定7.方差分析的基本思想把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。
8.方差分析的应用条件▪ 1. 各样本是相互独立的随机样本,均服从正态分布▪ 2. 各样本的总体方差相等,即方差齐性独立、正态、方差齐性如果方差不齐时,可采用F’检验或秩和检验。
一.单选题(每题Label 分)1 .体重指数(kg/m2)是()。
A.观察单位B.数值变量C.名义变量D.等级变量E.研究个体正确答案:B2 .统计量()。
A.是统计总体数据得到的量B.反映总体统计特征的量C.是根据总体的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标正确答案:E3 .血压(Kpa)是()。
A.观察单位B.数值变量C.名义变量D.等级变量E.研究个体正确答案:B4 .小概率事件在统计学上的含义是()。
A.指发生概率P≥0.5的随机事件B.指一次实验或者观察中绝对不发生的事件C.在一次实验或者观察中发生的可能性很小的事件,一般指P≤0.05D.在一次实验或者观察中发生的可能性较大的事件,一般指P>0.05E.以上说法均不正确正确答案:C5 .某次研究进行随机抽样,测量得到该市110名健康成年男子的血清总胆固醇值,则研究的总体是()。
A.所有成年男子的血清总胆固醇值B.该市所有成年男子的血清总胆固醇值C.该市所有健康成年男子的血清总胆固醇值D.110名健康成年男子的血清总胆固醇值E.所有男子的血清总胆固醇值正确答案:C6 .搞好统计工作,达到预期目标,最主要的是:()。
A.原始资料要多B.原始资料要准确C.整理资料要细D.分析资料要先进E.以上都不是正确答案:B7 .下面的变量中,属于定量变量的是()。
A.性别B.体重C.血型D.职业E.民族正确答案:B8 .表示血型(A.B.AB.O型)的资料,该资料为()。
A.观察单位B.数值变量C.分类变量D.等级变量E.研究个体正确答案:C9 .若要通过样本作统计推断,样本应是()。
A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分正确答案:C10 .脉搏数(次/分)是:()。
A.观察单位B.数值变量C.名义变量D.等级变量E.研究个体正确答案:B11 .下列关于概率的说法,错误的是()。
医学统计学期末复习(第1-8章版)医学统计工作的步骤:统计设计、收集资料、整理资料、资料分析总体:根据研究目的确定的研究对象全体样本:从总体中抽取的具有代表性的部分个体,具有代表性的称为个体,个体组成样本同质:总体中个体大同的性质变异:个体之间的小异统计学任务:在变异的背景下描述同一总体的同质性,揭示不同总体的异质性定性变量(分类变量):无序、有序(等级、半定量)定量变量:离散型、连续型参数:描述总体特征的指标统计量:反映样本特征的量误差:实测值与真实值之差抽样误差:因个体差异由于抽样原因引起的样本指标与总体指标间的差异(n大,抽样误差小;个体间变异大,抽样误差大;抽样误差无法避免)f次,f/n为A出现的频率A出现的概率=极差/预计组段数)3.确定组段:不重叠,第一组段含min,最后一组段含上限值;下限闭、上限开4.列表:三线表,上下粗、中间细频数分布图:更直观形象,可能存在潜在异常值1.描述频数分布类型:正态分布、正偏态分布(高峰左移、长尾右伸)、负偏态分布(高峰右移、长尾左伸)2.描述频数分布特征:集中趋势、离散趋势3.便于发现可疑值4.便于进一步分析处理描述集中位置的统计指标:1.算术均数:适用对称分布,尤其是正态分布 直接法:X X n=∑频数表法:fX X f =∑∑,为近似均值,f 起加权作用,X 为各段中值 2.几何均数:适用对数正态分布,或数据呈倍数变化直接法:G =,或lg 10XnG ∑=,X 存在负值?X X k '=+,G G k '=−频数表法:lg 10f X fG ∑∑=,为近似均值,f 起加权作用,X 为各段中值3.中位数、百分位数:适用于任何分布 直接法:分奇偶,略 频数表法:()%XX X L Xi P L n X f f =+⋅−∑,其中,Lx 为Px 所在组段下限,ix 为对应组距,fx 为对应频数,∑fL 为小于L 各组段的频数累计描述离散程度的统计指标:为自由度ν4.标准差:适用对称分布,尤其正态分布方差开平方根,标准差小,离散程度小,观察值多在均数周围,代表性好5.变异系数:适用比较均数相差较大/度量单位不同的资料又称离散系数,标准差与均数之比,即100%SCV X=⨯,没有单位正态分布的特征:①曲线在横轴上方均数处最高;②以均数为中心,左右对称;③两个参数,均数μ(位置参数)、标准差σ(形状参数);μ大右移,σ大分散Z 变换:转变为μ=0,σ=1的标准正态分布,=X Z μσ−从而()Z φ为 -∞到Z 的面积(单侧!)正态曲线下面积分布规律: 总面积为1±1,68.27%;±1.645,90.00% ±1.96,95.00%;±2.58,99.00% 可用于参考值范围确定,(±)双侧界限,(-)单侧下界,(+)单侧上界 (*过高、过低都不正常的,双侧;仅过高或过低才异常的,单侧)正态分布应用:估计频数分布、确定参考值范围、质量控制、理论基础中心极限定理:正态分布总体中抽n 个样本,样本均数服从正态分布;即使总体偏态分布,n 足够大时,样本均数也近似服从正态分布 样本均数标准差:X σ均数的抽样误差:抽样过程中产生的样本均数与总体均数之间的差异/样本均数之间的差异σ常未知,常用标准误代替样本均数标准差,标准误:X S σ常未知,因此采用的不是Z 变换,而是t 变换,X t =结果为t 分布,自由度为n-1,t 分布的特征: 1.以0为中心,左右对称,单峰2.相似于正态分布曲线,但更矮胖(变异大)3.为一簇曲线,形态变化与自由度有关,自由度越小,t 值越分散,曲线越低平4.自由度为正无穷时,与正态分布曲线吻合统计推断:参数估计、假设检验总体均数参数估计: 1.点估计(误差大):样本均数估计总体均数;样本标准差估计总体标准差 2.区间估计:1α−的置信区间CI 为:/2,X X t S αν±假设检验:样本均数与总体均数不同,原因可能是:①抽样误差;②本质差别0μμ=,仅抽样误差;0μμ≠,存在本质差别,如何判断?假设检验假设检验的基本步骤:1.建立假设检验0H (*需为保守假设,如相等、无效、无变化、无区别) 相应1H 为反面,根据实际情况选择单双侧检验,检验水准α常取小概率,也即0.05或0.012.选定检验方法,计算检验统计量选用t 检验、方差分析、卡方检验、秩和检验等检验方法… 以t 检验为例,则计算t 值,X t =3.确定P 值,作出推断结论 查附表(t 界值表等),根据自由度,得出P 值P α≤,差异有统计学意义,拒绝0H ,接受1HP α>,差异无统计学意义,不拒绝0H ,也即暂不能认为有差别 假设检验结论可能错误:0H 真实:拒绝0H ,接受1H →Ⅰ类错误(拒绝正确,假阳性)0H 不真实:不拒绝0H →Ⅱ类错误(不拒绝错误,假阴性)(Ⅱ类错误更严重)t 检验:1.单样本资料t 检验:样本均数与已知总体均数比较目的:推断样本是否来自某总体(通常为被接受的指标)2.配对样本t 检验:自身配对:同一对象的不同处理/处理前后比较异体配对:条件相同或近似的对象接受不同处理后进行比较 目的:推断某处理因素有无作用/两种处理因素有无差别(应先计算出前后的差值d ,应用条件是d 值服从正态分布;无差别时,理论上差值d 的总体均数应该为0)3.两独立样本t 检验:两组完全随机设计计量资料的统计推断目的:检验两个样本所代表的两总体均数是否相等t 检验适用的【前提】:1.各个体的独立性;2.正态性:两组样本来自正态分布总体(配对样本的差值d 要求服从正态分布);3.方差齐性:来自的正态总体方差相等。
医学统计复习资料一、名词解释[1].总体:根据研究目得确定得同质观察单位得全体。
就是同质所有观察单位得某种变量值得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
[2].样本:从总体中随机抽取部分观察单位,其实测值得集合。
[3].计量资料:又称定量资料或数值变量资料。
为观测每个观察单位得某项指标得大小,而获得得资料。
其变量值就是定量得,表现为数值大小,一般有度量衡单位。
根据其观测值取值就是否连续,又可分为连续型或离散型两类。
[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,就是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到得资料。
其变量值就是定性得,表现为互不相容得性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
[5].等级资料:又称半定量资料或有序分类变量资料,就是将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到得资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
[6].随机误差(偶然误差):就是一类不恒定得、随机变化得误差,由多种尚无法控制得因素引起,观察值不按方向性与系统性变化,在大量重复测量中,它可呈现或大或小,或正或负得规律性变化。
[7].概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
[8].平均数:描述一组变量值得集中位置或水平。
常用得平均数有算术平均数、几何平均数与中位数。
[9].算术均数(arithmetic mean)描述一组数据在数量上得平均水平。
医学统计学期末试卷四A题型:A11.关于率的标准化,以下错误的是A.两个率相等时,其标化后的标化率也一定相等B.比较两个内部构成不同的率时,要做标化处理C.标化率只是相对水平,不能代表实际水平D.标准不同,标化率也不同E.两个率相等时,其标化后的标化率不一定相等2.由于仪器未进行归零校正,所引起的误差是A.系统误差B.随机测量误差C.抽样误差D.偶然误差E.相对误差3.从正态分布资料中随机抽样,变量值位于μ-2.58σ到μ+1.96σ间的概率是A.95%B.97%C.99.5%D.视均数而定E.视标准差而定4.描述某地300名健康成人发汞含量的分布,宜绘制的统计图是A.直条图B.直方图C.线图D.散点图E.百分条图5.在下列均数多重比较的方法中,最为保守的是A.LSD法B.SNK法C.Dunnett法D.Bonfferoni法E.z检验6.在总体方差相等的条件下,由两个独立样本计算两个总体均数之差的可信区间包含了0,则A.可认为两样本均数差别无统计学意义B.可认为两样本均数差别有统计学意义C.可认为两总体均数差别无统计学意义D.可认为两总体均数差别有统计学意义E.可认为两总体均数和样本均数差别都有统计学意义7.一般地,方差分析适用的变量类型的资料为A.定性变量B.有序变量C.定量变量D.二分类变量E.多分类变量8.在统计检验中,是否选用非参数统计方法,正确的是A.根据研究目的和数据特征确定B.可在算出几个统计量和得出初步结论后进行选择C.要看哪个统计结论更符合专业理论D.要看哪个P值更小E.基于研究目的9.当两总体方差不等时,适用于两样本均数比较的方法是A.t检验B.t'检验C.Z检验D.方差齐性F检验E.方差分析10.利用一次横断面调查资料,描述职业和肝炎患病率关系应该用A.散点图B.直方图C.直条图D.圆图E.箱式图11.直方图可用于A.某现象的内部构成B.各现象的比较C.某现象随另一现象的伴随变化趋势D.某现象的频数分布E.某现象的发展速度12.百分条图可用于A.某现象的内部构成B.各现象的比较C.某现象随另一现象的伴随变化趋势D.某现象的频数分布E.某现象的发展速度13.观察意外死亡在不同年份的变化趋势,宜选择的图形A.直条图B.线图C.圆图D.半对数线图E.直方图14.描述婴儿和成人的体重变异度大小,宜选择的指标是A.变异系数B.方差C.标准差D.标准误E.全距15.从正态分布资料中随机抽样,变量值位于μ-1.96σ到μ+1.96σ间的概率是A.95%B.92.5%C.99%D.视均数而定E.视标准差而定16.计算相对数的目的是A.为了进行显著性检验B.为了便于比较C.为了表示绝对水平D.为了表示实际水平E.为了表示相对水平17.关于随机抽样,下列说法正确的是A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.随机抽样即随意抽取个体C.研究者在抽样时应精心挑选个体,以使样本更能代表总体D.通过统计设计可以消除抽样误差E.为确保样本具有更好的代表性,样本量应越大越好18.20个人每人抽取一个样本量为50的随机样本并计算80%可信区间。