医学统计学(假设检验)复习
- 格式:ppt
- 大小:727.00 KB
- 文档页数:5
整理分析和2.计描述4.(集合)。
1.抽样随机2.分组随机3.实验顺序随机。
称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。
系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。
参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。
②方差齐性:两样本均数比较时,要求两总体方差相等。
U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。
8、★.描述分类变量常用的指标有率、构成比、相对数。
9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。
10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。
第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学复习题 Revised by BETTY on December 25,2020预防医学复习题(统计部分)复习重点(及简答题)1. 医学统计学的基本概念如:总体与样本的联系区别2. 资料的分类如:请列举资料的类型并举例说明3. 定量资料统计描述的指标(集中与离散趋势)如:定量统计描述指标有哪些?如:正态分布与偏态分布资料统计描述方法有何区别4. 定性资料统计描述的指标5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律如:正态分布、标准正态分布与t分布的区别联系6. 小概率事件在医学统计学的应用(P值的含义)如:P值的含义是什么,对统计结论有何意义7. 假设检验的基本原理与步骤8. 四种主要统计假设检验方法及其应用场合9. 统计表的绘制选择题1.样本是总体中:2.A、任意一部分 B、典型部分 C、有意义的部分D、有代表性的部分E、有价值的部分2、参数是指:A、参与个体数B、研究个体数C、总体的统计指标D、样本的总和E、样本的统计指标3、抽样的目的是:A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数4、脉搏数(次/分)是:A、观察单位B、数值变量C、名义变量 D.等级变量 E.研究个体5、疗效是:A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体6、统计学常将P≤或P≤的事件称A、必然事件B、不可能事件C、随机事件D、小概率事件E、偶然事件7.统计中所说的总体是指:A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体8.概率P=0,则表示A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大 E以上均不对9.总体应该由A.研究对象组成B.研究变量组成C.研究目的而定 D.同质个体组成E.个体组成10. 在统计学中,参数的含义是A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本12.统计学中的小概率事件,下面说法正确的是:A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于的事件D.发生概率小于的事件 E.发生概率小于的事件13、统计上所说的样本是指:A、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体14、以舒张压≥为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。
第1题:下列有关等级相关系数ts的描述中不正确的是A。
不服从双变量正态分布的资料宜计算rSB。
等级数据宜计算rsC。
rs值-1~+1之间D.查rs界值表时, rs值越大,所对应的概率P值也越大E。
当变量中相同秩次较多时,宜计算校正rs值,使rs值减小第2题:对某样本的相关系数r和0的差别进行检验,结果t1A。
两变量的差别无统计意义B.两变量存在直线相关的可能性小于5%C。
两变量肯定不存在相关关系D.两变量间存在相关关系E。
就本资料尚不能认为两变量存在直线相关关系第3题:总体率95%可信区间的意义是。
A.95%的正常值在此范围B。
95%的样本率在此范围C.95%的总体率在此范围D.总体率在此范围内的可能性为95%E。
样本率在此范围内的可能性为95%第4题:样本含量的确定下面哪种说法合理。
A。
样本越大越好B.样本越小越好C。
保证一定检验效能条件下尽量增大样本含量D.保证一定检验效能条件下尽量减少样本含量E.越易于组织实施的样本含量越好第5题:直线相关与回归分析中,下列描述不正确的是。
A.r值的范围在—1~+1之间B.已知r来自ρ≠0的总体,则r〉0表示正相关, r<0表示负相关C。
已知Y和X相关,则必可计算其直线回归方程D。
回归描述两变量的依存关系,相关描述其相互关系E.r无单位第6题:四格表χ2检验的自由度为1,是因为四格表的四个理论频数( )A.受一个独立条件限制B。
受二个独立条件限制C。
受三个独立条件限制D。
受四个独立条件限制E.不受任何限制第7题:对同一双变量(X,Y)的样本进行样本相关系数的tr检验和样本回归系数的tb检验,有。
A. tb≠trB. tb=trC. tb〉trD。
tbE。
视具体情况而定第8题:为了由样本推断总体,样本应该是。
A。
总体中任意的一部分B.总体中的典型部分C。
总体中有意义的一部分D。
总体中有价值的一部分E。
总体中有代表性的一部分第9题:以下检验方法属非参数法的是。
预防医学复习题(统计部分)复习重点(及简答题)1. 医学统计学的基本概念如:总体与样本的联系区别2. 资料的分类如:请列举资料的类型并举例说明3. 定量资料统计描述的指标(集中与离散趋势)如:定量统计描述指标有哪些?如:正态分布与偏态分布资料统计描述方法有何区别4. 定性资料统计描述的指标5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律如:正态分布、标准正态分布与t分布的区别联系6. 小概率事件在医学统计学的应用(P值的含义)如:P值的含义是什么,对统计结论有何意义7. 假设检验的基本原理与步骤8. 四种主要统计假设检验方法及其应用场合9. 统计表的绘制选择题1.样本是总体中:A、任意一部分B、典型部分C、有意义的部分D、有代表性的部分E、有价值的部分2、参数是指:A、参与个体数B、研究个体数C、总体的统计指标D、样本的总和E、样本的统计指标3、抽样的目的是:A、研究样本统计量B、研究总体统计量C、研究典型案例D、研究误差E、样本推断总体参数4、脉搏数(次/分)是:A、观察单位B、数值变量C、名义变量 D.等级变量 E.研究个体5、疗效是:A、观察单位B、数值变量C、名义变量D、等级变量E、研究个体6、统计学常将P≤0.05或P≤0.01的事件称A、必然事件B、不可能事件C、随机事件D、小概率事件E、偶然事件7.统计中所说的总体是指:A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体8.概率P=0,则表示A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对9.总体应该由A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成10. 在统计学中,参数的含义是A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本12.统计学中的小概率事件,下面说法正确的是:A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件C.发生概率小于0.1的事件D.发生概率小于0.001的事件 E.发生概率小于0.1的事件13、统计上所说的样本是指:A、按照研究者要求抽取总体中有意义的部分B、随意抽取总体中任意部分C、有意识的抽取总体中有典型部分D、按照随机原则抽取总体中有代表性部分E、总体中的每一个个体14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。
医学统计学复习资料(名解+简答)一、名词解释1.统计量 (statistic):统计量是统计理论中用来对数据进行分析、检验的变量。
2.同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。
3. 抽样误差 (sampling error):由于随机抽样造成的样本均数与总体均数的差别。
4. 总体 (population):根据研究目的而确定的同质观察单位的全体称为总体,更确切的说,它是同质的所有观察单位某种观察值的集合。
5. 变异 (variation):变异就是标志在同一总体不同总体单位之间的差别。
6. 参数 (parameter):参数,也叫参变量,是一种变量。
7. 样本 (sample):研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体。
8. 概率 (probability):概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。
越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。
1. 正态分布 (normal distribution):靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布2. 中位数 (median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)3. 方差 (variance):是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。
4. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小。
5. 正偏态分布 (positively skewed distribution):为统计学概念,即统计数据峰值与平均值不相等的频率分布。
如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。
统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
医学统计学复习题一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。