医学统计课程理论复习
- 格式:ppt
- 大小:8.00 MB
- 文档页数:61
第一至五章统计学是研究数据及其存在规律的科学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。
统计学的总体是指根据研究目的确定的、全部同质个体的某个(或某些)变量值。
这里的个体又称观察单位(或研究单位),可以是一个社区、一个特定的人群、一个人、一个血样、一个细胞、一个基因、一个蛋白质等。
样本:总体中有代表性的一部分。
根据研究目的,对研究对象的某个或某些特征(亦称研究指标或项目)实施观测,这些特征(指标或项目)称为变量。
变量的测得值叫变量值(也叫观察值或资料)统计工作的步骤 一研究设计,二收集资料;三整理资料;四 分析资料。
计量资料定义通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。
如:体重与身高,特点:有度量衡单位;多为连续性资料(通过测量得到)计数资料定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
特点:没有度量衡单位;多为间断性资料(通过枚举或记数得来)等级资料定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
特点:每一个观察单位没有确切值;各组之间有性质上的差别或程度上的不同。
总体:根据研究目的确定的同质的、观察单位的全体。
同质与变异研究对象具有的相同的状况或属性等共性称同质或同质性;对于同质的各观察单位,其某变量值之间的差异,称为变异。
误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。
主要有二种:系统误差;随机误差。
系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小。
特点:具有累加性。
随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
特点:随测量次数参加而减小。
抽样误差:由于抽样原因造成的样本指标与总体指标之间的差别。
特点:有抽样发生抽样误差就不可避免。
减少抽样误差的方法:(1)增加样本的代表性。
样本量 n 相等的情况下:整群抽样>单纯随机抽样>系统抽样>分层抽样(2) 增加样本量n (3)选择变异程度较小的研究指标。
医学统计学基础医学统计学是一门研究医学中数据的收集、分析和解释的科学。
它在医学研究中扮演着至关重要的角色,并且对医学实践和决策具有深远影响。
本文将介绍医学统计学的基本概念、常用的统计方法以及其在医学领域的应用。
一、基本概念1.1 总体与样本在医学统计学中,我们常常需要研究某个感兴趣的群体,这个群体被称为总体。
总体可以是人群中的所有个体,也可以是其他单位,如医院、地区等。
由于总体往往很大,我们无法对其进行全面的研究,因此我们从总体中选取一部分个体进行研究,这部分个体称为样本。
1.2 数据类型医学研究中常见的数据类型包括定性数据和定量数据。
定性数据是描述性质或属性的数据,如性别、病情分类等;定量数据是可度量或计数的数据,如年龄、生命体征等。
了解数据类型对选择合适的统计方法至关重要。
1.3 描述统计学与推断统计学描述统计学用于总结和描述已有数据的特征,如均值、中位数、标准差等。
推断统计学则是通过对样本进行分析,推断总体的特征,并对结果进行估计和推断。
推断统计学可通过假设检验和置信区间来实现。
二、常用统计方法2.1 均值与标准差均值是用来描述一组数据集中趋势的指标,一般用于定量数据。
标准差则衡量了数据的离散程度,即数据的波动情况。
2.2 相关分析相关分析用于研究两个变量之间的关系。
通过计算相关系数,可以了解两个变量是正相关、负相关还是无关。
2.3 生存分析生存分析是用来研究事件发生和持续时间的统计方法。
在医学中,生存分析常用于研究患者的生存时间、复发时间等。
2.4 方差分析方差分析用于比较两个或多个组的均值是否存在显著差异。
它适用于一组分类变量和一个连续变量的比较。
三、医学统计学的应用3.1 临床试验设计与分析临床试验是评价药物疗效的重要手段。
医学统计学在临床试验的设计和分析中起到关键作用,如确定样本量、随机分组、双盲试验等。
3.2 流行病学研究流行病学研究可以揭示疾病的发病原因、预后以及控制策略。
医学统计学的方法可以帮助研究者分析大量数据,确定疾病的危险因素和相关性。
《医学统计学》课程考试试题(A卷)(评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V闭卷)注意:选择题,判断题和分析题的答案全部涂到答题卡上。
一、名词解释及写出下列符号的名称(每题1分,共10分)1、总体2、变量3、概率4、R5、M6、S7、CV8、π 9、 b 10、 r二、选择题(每题1分,共40分)1、定量资料频数表编制时,组段数的多少与()A.样本例数的大小有关 B.样本例数的大小无关C.组距的大小有关 D.组距的大小无关2、下列观测结果属于多分类变量资料的是()A.红细胞计数 B.血型 C.血压的测量结果 D.乙肝表面抗原阳性与阴性3、总体是由()组成A.部分个体 B.全部个体 C.相同的观察指标 D.同质个体的所有变量值4、定量资料分析中,计算中位数一般要求资料()A.服从正态分布 B.无超限值数据 C.呈等比级的资料D.服从偏态分布或有超限值数据5、9名食物中毒的病人潜伏时间(小时)分别为4,5,3,2,5.5,8,2.5,6,6.5其中位数是()A.5 B.5.5 C.3 D.26、调查一组成年女性血红蛋白的含量,如果资料属于正态分布,描述这组资料集中趋势最理想的指标为()A.中位数 B.算术均数 C.几何均数 D.变异系数7、若要用标准差描述资料的离散趋势,对资料的要求是()A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料D.正态分布资料8、下列关于变异系数的说法,其正确的是()A.比较均数相差较大的两组或多组资料的变异程度 B.描述一组资料的离散趋势C.其度量横单位与均数的度量衡单位一致 D.其度量横单位与标准差的度量衡单位一致9、正态分布转换为标准正态分布时,其两者()A. 均数相等,标准差相等 B.均数相等,标准差不等C.均数不等,标准差不等D.均数不等,标准差相等10、确定某市一成年男性血小板数过低或过高,其评价依据是()A.作血小板数差别的显著性检验B.用该市成年男性血小板数的95%医学参考值范围来评价 C.用该市成年男性血小板数的均数来评D.用该市成年男性血小板数可信区间来评价11.测定一组人群血液中汞的含量,已知汞含量过高为异常,若制定其医学参考值范围,应选择()A.单侧上限 B.单侧下限C.双侧 D.单侧12、已知健康成年男子的血压服从正态分布,若制定其医学参考值范围,应选择()A.双侧 B.单侧 C.单侧上限 D.单侧下限13、有关样本均数的标准误,下列说法不正确的是()A.与样本例数的大小有关B.表示样本均数离散趋势的大小C.表示样本均数抽样误差的大小 D.与样本所代表的总体变量值的离散趋势无关14、t分布曲线的自由度减小时()A、曲线下的总面积变大B.曲线的中心位置向右移C.曲线的高峰变低,尾部翘得较高D.曲线的高峰变高,尾部翘得较低15、总体均数95%的可信区间主要是用于()A.估计总体均数有95%的可能性在此区间内 B.反映某指标的可能取值范围C. 95%的样本均数在此范围内 D.确定医学参考值范围16、单样本t检验假设检验的目的是()A、推断未知总体均数是否小于零 B.推断已知总体均数与未知总体均数是否相等C.推断样本均数与未知总体均数是否相等 D.推断未知总体均数是否为负数17、确定医学参考值时,选择不同的百分界限所计算的参考值范围()A.相同 B.不同 C.上限相同 D.下限相同18、完全随机设计的单因素方差分析中,哪一项是正确的()A、MS组内>MS组间B、MS总= MS组内+MS组间C、SS总= SS组内+ SS组间D、n总>n组内+ n组间19、某医师给某地全部的流感易感儿童进行免疫接种,共有2000人,一个月后,从中随机抽取500人进行抗体水平的测定,其中阳性人数是300人,若计算该疫苗接种的阳性率,其数值为()A.15% B.25% C.40% D.60%20、某市共有15万人,乙脑的发病的人数为300人,其中工人100人,干部50人,农民60人,学生90人,该市乙脑的发病率为()A.75/10万 B.20/万 C.300/10万 D.50%21、A、B两地进行高血压发病率的比较,需要进行率的标准化的情况有()A.年龄内部构成不同 B.年龄内部构成相同C.两地的发病率相差太大 D.两地各年龄组的发病率相差不大22、某医师从工人与干部两个总体中进行高血压发病情况的抽样研究,样本例数为n1、n2 ,高血压的患病人数为x1、x2 ,则两样本合计的高血压发病率为()A.x1/ n1 B.x2 / n2 C.x1 / n1+ x2 / n2 D.(x1+x2) / (n1+n2)23、某医师用甲乙两种药物治疗胃炎,甲药治疗后,有效120人,无效30人,乙药治疗后,有效140人,无效10人,若将此资料列为四格表,两个行合计为()A.260,40 B.150,150 C.40,170 D.130,17024、1000名乳腺癌患者,有50例是孕妇,故可以认为()A.孕妇偶患乳腺癌 B.妊娠可诱发乳腺癌C.乳腺癌与妇女妊娠有关 D.该组病人中有5%为孕妇25、下列不影响值大小的是()A.实际频数与理论频数的差B.格子数的多少 C.自由度的大小D.样本例数的大小26、对于同一资料的直线相关系数和直线回归系数,下列论断正确的是()A.相关系数与回归系数的正负号一致 B.相关系数与回归系数的正负号不一致 C.回归系数无单位,相关系数有单位 D.样本相关系数为0时,样本回归系数也为027、下列关于直线回归和直线相关的说法,正确的是()A.直线回归分析的两变量地位是平等的B.直线相关分析的假设检验可以代替直线回归分析的假设检验C.回归系数没有度量衡单位D.具有直线相关关系的两变量间一定有因果关系28、拒绝了实际上成立的H0所犯的错误为()A.第一类错误 B.第二类错误 C.不允许的错误 D.把握度的错误29、五个样本率作比较,> 0..01,4 ,可认为()A.各样本率不全相同 B.各样本率相同 C.各总体率不全相同D.各总体率相同30、相关系数假设检验的备择假设是()A.ρ≠0 B.ρ=0 C.r≠0 D.r=0 31、要想同时减少第一类错误和第二类错误,最好的方法是()A.将变量值的数值增大 B.将变量值的数值减小C.将变量值的个数增大 D.将变量值的个数减小32、下列不属于非参数检验的资料类型是()A.任何分布类型的资料 B.有超限值的资料 C.等级资料 D.呈倍数关系的资料33、下列指标中,不属于集中趋势指标的是()A、算术均数 B.中位数 C.变异系数 D.几何均数34、关于医学参考值范围的制定,下列说法不正确的是()A.样本例数不能太少 B、只能选95%的百分界限C.资料分布类型不同时,所选的方法不同 D.选择单侧和双侧的计算结果不同35、随着样本例数的增大,样本标准差()A.增大 B.减小 C.不变 D.与总体标准差更加接近36、抽样误差产生的原因是()A.资料不是正态分布 B.个体变异 C.仪器测量不准确 D.观察对象不纯37、某地某年男性人口数是女性人口数的1.05倍,这一结果为()A.构成比 B.率 C.相对比 D.发病率38、关于回归系数b,下列说法错误的是()A.是直线回归方程的斜率 B.同一资料x作自变量与y作自变量计算的b相等C.取值范围为 (-∞,+∞) D.b>0时,随x的增大y也增大39、相关系数r假设检验的自由度为()A.n-1B.2n-1C.2(n-1)D.n-240、四格表资料的检验,理论频数T的计算是根据()A.π1 =π2 B.π1≠π2 C.π1<π2 D.π1 >π2二、判断题(若正确,请在答题卡上涂A,若错误,请在答题卡上涂B,每题1分,共30分)41、医学参考值范围制定时,选不同的样本例数,其计算结果一定是相同的。
医学统计复习资料一、引言医学统计学是医学研究中非常重要的一门学科,它通过收集、整理和分析医学数据,帮助医学研究者更好地了解和解释医学现象。
本文将为您提供一份医学统计复习资料,帮助您系统地复习医学统计学的基本概念、方法和应用。
二、医学统计学的基本概念1. 统计学的定义:统计学是一门研究数据收集、整理、分析和解释的学科,它可以帮助我们从大量的数据中发现规律和趋势。
2. 研究设计与样本选择:在医学研究中,合理的研究设计和样本选择是确保研究结果准确性的关键。
常见的研究设计包括前瞻性研究、回顾性研究和随机对照试验等。
3. 变量类型与测量:医学研究中常见的变量类型包括定性变量和定量变量。
定性变量是指描述性质或特征的变量,如性别、病情等;定量变量是指能够用数字表示的变量,如年龄、血压等。
4. 描述统计学:描述统计学是对收集到的数据进行整理、总结和描述的方法。
常用的描述统计学方法包括频数分布表、直方图、均值和标准差等。
5. 推断统计学:推断统计学是通过对样本数据进行分析,从而对总体进行推断的方法。
常用的推断统计学方法包括假设检验、置信区间和相关分析等。
三、医学统计学的常用方法1. 假设检验:假设检验是用来判断样本数据是否支持某个假设的方法。
它包括设立原假设和备择假设、选择适当的检验统计量、计算P值并进行决策等步骤。
2. 置信区间:置信区间是用来估计总体参数的范围的方法。
它通常以一个区间来表示,如95%的置信区间表示有95%的把握总体参数落在该区间内。
3. 相关分析:相关分析用来研究两个变量之间的关系。
常见的相关分析方法包括皮尔逊相关系数和斯皮尔曼等级相关系数。
4. 方差分析:方差分析是用来比较两个或多个样本均值之间差异的方法。
它可以判断不同因素对样本均值的影响是否显著。
5. 生存分析:生存分析是用来研究时间至某一事件发生的概率的方法。
它常用于医学研究中的生存分析和生存率比较。
四、医学统计学的应用1. 流行病学研究:医学统计学在流行病学研究中起着重要作用,可以帮助研究者确定疾病的发病率、死亡率和风险因素等。
中南大学现代远程教育课程考试复习题及参考答案《卫生统计学》一、名词解释1.计量资料2.计数资料3.等级资料4.总体5.样本6.抽样误差7.频数表8.算术均数9.中位数10.极差11.方差12.标准差13.变异系数14.正态分布15.标准正态分布16.统计推断17.抽样误差18.标准误19.可信区间20.参数估计21.假设检验中P的含义22.I型和II型错误23.检验效能24.检验水准25.方差分析26.随机区组设计27.相对数28.标准化法29.二项分布30.Yates校正31.非参数统计32.直线回归33.直线相关34.相关系数35.回归系数36.人口总数37.老年人口系数38.围产儿死亡率39.新生儿死亡率40.婴儿死亡率41.孕产妇死亡率42.死因顺位43.人口金字塔二、单项选择题1.观察单位为研究中的( )。
A.样本B.全部对象C.影响因素D.个体2.总体是由()。
A.个体组成B.研究对象组成C.同质个体组成D.研究指标组成3.抽样的目的是()。
A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量4.参数是指()。
A.参与个体数B.总体的统计指标C .样本的统计指标D . 样本的总和 5.关于随机抽样,下列那一项说法是正确的( )。
A .抽样时应使得总体中的每一个个体都有同等的机会被抽取 B .研究者在抽样时应精心挑选个体,以使样本更能代表总体 C .随机抽样即随意抽取个体D .为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( )。
A .均数不变,标准差改变B .均数改变,标准差不变C .两者均不变D .两者均改变 7.比较身高和体重两组数据变异度大小宜采用( )。
A .变异系数 B .方差 C .极差 D .标准差8.以下指标中( )可用来描述计量资料的离散程度。
A .算术均数 B .几何均数 C .中位数 D .标准差9.血清学滴度资料最常用来表示其平均水平的指标是( )。
医学统计学知识点1.数据类型:医学研究中使用的数据包括定类数据和定量数据。
定类数据是非数值型的数据,例如性别、种族等;定量数据是数值型的数据,例如年龄、体重等。
了解数据类型是分析数据的第一步。
2.数据收集:医学研究中的数据可以通过不同的方式收集,例如问卷调查、实验研究、观察等。
在数据收集过程中,需要注意样本的选择、数据的完整性和准确性。
3.描述统计学:描述统计学包括对数据的整体特征进行描述和总结。
常用的描述统计学方法包括中心趋势度量(例如均值、中位数、众数)、离散程度度量(例如标准差、方差)和数据分布描述等。
4.推断统计学:推断统计学是从样本数据推断总体特征的一种方法。
通过推断统计学,可以根据样本数据的统计量(例如样本均值、样本比例)来推断总体参数的区间估计或假设检验。
5.假设检验:假设检验是根据样本数据对总体参数提出假设,并通过计算概率值来判断是否接受或拒绝该假设。
常用的假设检验方法包括t检验、卡方检验、方差分析等。
6.相关分析:相关分析用于研究两个或多个变量之间的关系。
常见的相关分析方法有皮尔逊相关系数、斯皮尔曼相关系数等。
相关分析可以帮助研究者了解变量之间的线性关系和方向。
7. 回归分析:回归分析用于研究因变量与自变量之间的关系,并可用于预测因变量的数值。
常用的回归分析方法有简单线性回归分析、多元线性回归分析和 logistic 回归分析等。
8. 生存分析:生存分析用于研究时间相关的数据,例如疾病患者的生存时间或事件发生的时间。
生存分析方法包括 Kaplan-Meier 曲线、Cox 比例风险模型等。
9.双盲试验和随机分组:在医学研究中,双盲试验和随机分组是常用的研究设计方法。
双盲试验是指研究中既不知道接受治疗的病人,也不知道给予治疗的医生;随机分组是指将研究对象随机分配到不同的治疗组和对照组。
10.统计软件:为了进行医学统计分析,研究者可以使用专业的统计软件,例如SPSS、SAS、R等。
《卫生统计学》期末复习指导一、期末考试有关问题的说明(一)出题的指导思想全面考核学生对本课程的基本概念、基木方法、基木技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。
出题难度适中但覆盖面较广,基木知识占85%左右。
(二)题目类型及答题要求名词解释:15分。
要求按统计术语准确叙述概念。
是非题:10分。
要求对题目的叙述判断正确与否,不说明理由。
填空题:25分。
要求按划线的根数准确填写内容,不得似是而非。
选择题:2()分。
要求选择无误,每题只选择一个最佳答案。
简答题:10-15分。
根据问题的不同提问方式回答问题。
一种是直接根据问题进行叙述;另一种是根据问题说明正确与否,若否,需说明错误所在及正确的解决方法。
注意答出要点及答题的逻辑性。
问答题:15・20分。
包括对资料的计算和进行分析。
计算要求写出完整的步骤(包括计算公式),对计算所得结果做出和应的分析结论。
二、期末复习范围和重点第一章绪论一、重点复习的内容名词:总体、样本、数值变量资料、分类变量资料、变异、抽样误差、概率问题:1. 正确识别统计资料的类型。
2. 统计工作的步骤。
3. 抽样研究的原因及目的,产生抽样误差的原因。
二、一般复习的内容名词:变量、抽样硏究、同质、频率、小概率事件问题:1. 学习卫生统计学的童义。
2. 卫生统计学包括的基本内容。
3. 卫生统计工作各个步骤的基本内容和关系。
三、习题(-)判断题1. 统计工作的步骤中,设计是最关键的一步,搜集资料是基础。
2. 抽样研究的目的是为了描述样本的分布特征。
3. 某医师用国产异搏定治疗心率失常的临床疗效观察,共治疗8例病人,其中4例冇效,故冇效率为50% o(二)选择题1. 对某地200名16岁中学生口腔检查,发现54人患有踊齿,该资料属于。
A.数值变量资料B.分类变量资料C.分类变量资料频数表D.数值变量资料频数表2. 欲研究某药治疗高血压病的疗效,临床观察了80名高血压病人的血压值,其研究的总体是OA.这80名高血压病患者B.所冇高血压病患者C.所有高血压病患者的血压值D.用该药治疗的所有高血压病患者的血压值(三)填空题1. 统计工作的基本步骤包括___________ 、_____________ 、____________ 、___________ 。
医学统计复习资料一、名词解释[1].总体:根据研究目得确定得同质观察单位得全体。
就是同质所有观察单位得某种变量值得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
[2].样本:从总体中随机抽取部分观察单位,其实测值得集合。
[3].计量资料:又称定量资料或数值变量资料。
为观测每个观察单位得某项指标得大小,而获得得资料。
其变量值就是定量得,表现为数值大小,一般有度量衡单位。
根据其观测值取值就是否连续,又可分为连续型或离散型两类。
[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,就是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到得资料。
其变量值就是定性得,表现为互不相容得性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
[5].等级资料:又称半定量资料或有序分类变量资料,就是将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到得资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
[6].随机误差(偶然误差):就是一类不恒定得、随机变化得误差,由多种尚无法控制得因素引起,观察值不按方向性与系统性变化,在大量重复测量中,它可呈现或大或小,或正或负得规律性变化。
[7].概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
[8].平均数:描述一组变量值得集中位置或水平。
常用得平均数有算术平均数、几何平均数与中位数。
[9].算术均数(arithmetic mean)描述一组数据在数量上得平均水平。
《医学统计学》课程考试试题(B卷)(评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷)注意:第1-80小题的答案全部涂到答题卡上。
一、选择题(每题1分,共55分,只选一个正确答案)1、下列指标中不属于离散趋势的指标()A.样本均数 B.方差 C.全距 D.离均差平方和2、计量资料编制频数表时,组段数的选择()A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关3、比较一组人群身高与体重的变异度应选()A.极差 B.方差 C.标准差 D.变异系数4、若要用标准差描述资料的离散趋势,对资料的要求是()A.未知分布类型的资料 B.等级资料C.呈倍数关系的资料 D.正态分布资料5、频数分布两端有超限值时,描述其集中趋势的指标是()A.标准差 B.几何均数 C.相关系数 D.中位数6、医学统计工作的步骤是()A、研究设计、收集资料、整理资料和分析资料B、计量资料、计数资料、等级资料和统计推断C、研究设计、统计分析,统计描述和统计推断D、选择对象、计算均数、参数估计和假设检验7、下列关于变异系数的说法,其正确的是()A.比较均数相差较大的两组或多组资料的变异程度B.描述一组资料的离散趋势C.其度量横单位与均数的度量衡单位一致 D.其度量横单位与标准差的度量衡单位一致8、10名食物中毒的病人潜伏时间(小时)分别为3,4,5,3,2,5.5,2.5,6,6.5,7,其中位数是()A.4 B.4.5 C.3 D.2 9、调查一组正常成人的白细胞数,如果资料属于正态分布,描述这组资料集中趋势的指标为()A.中位数 B.算术均数 C.二者均不可 D.二者均可10、正态分布曲线下,当μ不变,σ变大时,()A.曲线形态不变,中心位置向左移 B.曲线形态不变,中心位置向右移C.曲线形态变的矮胖,中心位置不变 D.曲线形态变的瘦高,中心位置不变11、用于描述一组对称分布资料全部观察值变异程度大小的指标是()A.S B.R C. D.CV12、下列指标中,不属于集中趋势指标的是()A.算术均数 B.中位数 C.变异系数 D.几何均数13、总体是由()组成A.部分个体 B.全部个体 C.相同的观察指标 D.同质个体的所有变量值14、随着样本例数的增大,样本标准差()A.增大 B.减小 C.不变 D.与总体标准差更加接近15、抽样误差产生的原因是()A.资料不是正态分布 B.个体变异 C.仪器测量不准确D.观察对象不纯16、观察单位为研究中的()A.样本 B.全部对象 C.个体 D.观察指标17、变异系数CV是()A.构成比 B.率 C.标准差 D.相对比18、各观察值同加上一个不等于0的常数后,()不变A、算术均数B、标准差C、几何均数D、变异系数19、下列资料()为等级资料A、体重B、血型C、某病发病率D、病人的病情分级20、标准正态分布曲线下,0到2.58的面积为()A.90% B.95% C.49.5% D.50%21、测定一组人群的听力,已知听力过低为异常,若制定其医学参考值范围,应选择()A.单侧上限 B.单侧下限 C.双侧 D.单侧22、关于医学参考值范围的制定,下列说法正确的是()A.样本例数不能太少 B.只能选95%的百分界限C.不受资料分布类型的限制 D.选择单侧和双侧的结果是一样的23、正常成年男子收缩压的医学参考值范围一般指()A、所有正常成年男子收缩压的最小值到最大值范围B、绝大多数正常成年男子收缩压的波动范围C、所有正常成年男子收缩压的波动范围D、少部分正常成年男子收缩压的波动范围24、有关样本均数的标准误,下列说法正确的是()A.与样本例数的大小无关 B.表示样本均数离散趋势的大小C.表示样本变量值差异的大小 D.与样本所代表的总体变量值的离散趋势无关25、下列哪项不是样本均数标准误的用途()A.可用来计算总体均数的可信区间 B.可表示样本均数抽样误差的大小C.可用来计算医学参考值范围 D. 可用于均数假设检验的计算.26.t分布曲线随自由度的增大()A.曲线下的总面积变小 B.曲线的中心位置向左移C.曲线的高峰变低,尾部翘得较高 D.曲线的高峰变高,尾部翘得较低27.自由度一定的t分布曲,当t值增大时,其尾部面积()A.变小 B.变大 C.不变 D.不清楚28、总体均数95%的可信区间主要是用于()A.估计总体均数有95%的可能性在此区间内 B.反映某指标的可能取值范围C.95%的样本均数在此范围内 D.确定医学参考值范围29、要提高总体均数可信区间的把握度与精确度,最好的方法是()A.改变计算公式 B.减小样本例数 C.增加样本例数 D.样本例数保持不变30、假设检验中,确定单双侧的依据是()A.资料的类型B.计算出统计量后再作决定C.专业知识或研究目的D.检验水准的大小31.样本均数与已知总体均数比较的目的是()A.推断未知总体均数是否小于零 B.推断已知总体均数与未知总体均数是否相等C.推断样本均数与未知总体均数是否相等 D.推断未知总体均数是否为负数32、配对设计的目的是()A.提高组间可比性 B.计算简便 C.易于理解 D.为了使用t检验33、配对设计t检验的目的是()A.推断差数的总体均数是否等于零.B.推断差数的样本均数是否等于零.C.推断差数的总体均数是否大于1. D.推断差数的样本均数是否大于1.34、两样本均数t检验的目的是()A.推断两总体均数是否相等.B.推断两样本均数是否相等.C.推断两总体例数是否相等. D.推断两样本例数是否相等.35、甲乙两人分别从同一总体中抽得30个变量值作为两个样本,求得、S12,、S22,则有()A、做两样本t检验,必然得差别无统计学意义的结论B、做两样本t检验,必然得差别有统计学意义的结论C、分别有甲、乙两样本求出的总体均数的95%的可信区间,必然有重叠D、分别有甲、乙两样本求出的总体均数的95%的可信区间,很可能有重叠36、两样本均数的t检验,若两样本例数分别为n1和n2,自由度为()A.n1+n2 B.n1+n2-1 C.n1+n2+1 D.n1+n2-237、反映某现象发生的频率或者强度的指标宜采用()A.构成比 B.率 C.相对比 D.标准化率38、某地某年冠心病的发病人数占同年心血管疾病病人数的15%,该指标为()A.构成比 B.率 C.相对比 D.发病率39、甲乙两地进行高血压发病率的比较,需要进行率的标准化的情况有()A.年龄内部构成不同 B.年龄内部构成相同C.两地的发病率相差太大 D.两地各年龄组的发病率相差不大40、甲、乙两组资料进行率的标准化时,选择标准人口数或选择该标准人口数换算成相应的标准人口构成比,两方法得出的结论()A.相同 B.甲组标化率大于乙组标化率C.不同 D.甲组标化率小于乙组标化率41、某医师给某地全部的麻疹易感儿童进行免疫接种,共有3000人,一个月后,从中随机抽取400人进行抗体水平的测定,其中阳性人数是200人,若计算该疫苗接种的阳性率,其数值为()A.10% B.25% C.50% D.60%42、某医师从工人与干部两个总体中进行高血压发病情况的抽样研究,样本例数为n1、n2 ,高血压的患病人数为x1、x2 ,则两样本合计的高血压发病率为()A.x1/ n1 B.x2 / n2 C.x1 / n1+ x2 / n2 D.(x1+x2)/ (n1+n2)43、有关样本率的标准误,下例错误的是()A.表示样本率围绕总体率的离散趋势B.表示样本率相互之间的离散趋势C.表示样本率抽样误差的大小D.表示样本阳性率与样本阴性率之间的差异44、总体率估计的最佳方法是()A.点值估计 B.区间估计 C.概率估计 D.频率估计45、值是反映实际频数与理论频数()A.相差多少的指标 B.吻合程度的指标 C.是否相等的指标D.以上均不对46、四格表检验时,不需要进行连续性校正的条件是()A.n≥40, T≥5 B.n<40,1≤T<5 C.n≥40,T<1 D.n ≥40,1≤T<547、四格表资料的检验,理论频数T的计算是根据()A.π1 =π2 B.π1≠π2 C.π1<π2 D.π1 >π248、用甲乙两种方法检查已确诊的鼻咽癌患者100名,甲法阳性者80名,乙法阳性者60名,两法均为阳性者50名,欲检验两法结果有无差别,宜选用()A.行X列表资料的检验 B.配对设计四格表检验C.t检验 D.两样本率比较的四格表检验49、4个样本率作比较,< 0.05,3,则在α=0.05检验水准下,可认为()A.各总体率不等或不全相等 B.各总体率均相等C.各样本率均相等 D.各样本率不全等50、相关系数是表示两变量x与y之间()A .有无数量关系的指标 B.那个变量较大的指标 C.有无依存关系的指标 D.相关关系的密切程度与相关方向的指标51、相关系数假设检验的备择假设是()A .ρ≠0 B.ρ=0 C.β≠0 D.β=052、相关系数假设检验的自由度为()A.n - 1 B.n - 2 C.n D.n + 1 53.最小二乘法原理是()A.各实测点距所求直线的纵向距离最小B.各实测点距所求直线的纵向距离相等C.各实测点距所求直线的纵向距离平方和最小D.各实测点距所求直线的垂直距离平方和最小54、对于同一资料的直线相关系数和直线回归系数,下列论断正确的是()A.相关系数越小,回归系数也越小 B.相关系数与回归系数无关系C.回归系数有单位,相关系数没有单位 D.样本相关系数为0时,样本回归系数也为055、关于回归系数b,下列说法错误的是()A.是直线回归方程的斜率 B.同一资料x作自变量与y作自变量计算的b相等C.取值范围为 (-∞,+∞) D.b>0时,随x的增大y也增大二、判断题(若正确,请在答题卡上涂A,若错误,请在答题卡上涂B,每题1分,共17分)56、绘制计量资料的频数表时,各组段的组距可以相等,也可以不等。
医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质:统计研究中,给观察单位规定一些相同的因素情况。
如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。
变异:同质的基础上个体间的差异。
“同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的二、总体与样本1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。
2、样本:是从总体中随机抽取的部分观察单位变量值的集合。
三、参数与统计量总体参数:根据总体个体值统计计算出来的描述总体的特征量。
用希腊字母表示。
口. S . n样本统计量:根据样本个体值统计计算出来的描述样本的特征量。
用拉丁字母表示总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验四、误差:实测值与真值之差★1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。
随机测量误差、抽样误差。
2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的3.非系统误差:过失误差,可以避免或清除。
五、概率是用来描述事件发生可能性大小的一个量值,常用P 表示。
概率取值0~1。
统计上一般将P V或P V的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。
第二节统计资料的类型★ 变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。
一、数值变量资料又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。
表现为数值大小,带有度、量、衡单位。
如身高(cm)、体重(kg)、血红蛋白(g)等。
二、无序分类变量资料又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。
分类:二分类:+-;有效,无效;多分类:ABO血型系统特点:没有度量衡单位,多为间断性资料【例题单选】某地A、B、O AB血型人数分布的数据资料是()A.定量资料B.计量资料C. 计数资料D. 等级资料【答案】C【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。
医学统计知识点总结在医学领域中,统计学的应用非常广泛,它可以帮助医生和研究人员分析和解释医学数据,研究疾病的发病机制以及评估治疗方法的有效性。
本文将重点总结医学统计学中的重要知识点,包括描述统计学和推论统计学。
描述统计学描述统计学是研究数据集中各变量的集中趋势和离散程度的方法。
主要包括以下几个方面的内容。
1. 数据的整理和呈现在医学研究中,首先需要对收集到的数据进行整理和呈现。
常用的方法包括频数分布表、直方图、饼图、条形图等,这些方法可以直观地展示各变量的分布情况。
2. 中心趋势的度量中心趋势代表着数据集中值的位置,主要包括均值、中位数和众数。
均值是各观测值之和除以观测次数,中位数是按数值大小排列后位于中间位置的值,众数是出现次数最多的值。
3. 离散程度的度量离散程度描述了数据集中值的分散程度,通过方差和标准差进行度量。
方差是各观测值与均值之差的平方和的平均值,标准差是方差的平方根。
推论统计学推论统计学可以根据样本数据推断总体的特征,包括参数估计和假设检验两个方面。
1. 参数估计参数估计是根据样本数据估计总体特征的值,主要包括点估计和区间估计。
点估计是用样本数据求得总体参数的估计值,例如用样本均值估计总体均值。
区间估计是用样本数据求得总体参数的估计区间,例如用置信区间估计总体均值。
2. 假设检验假设检验是通过样本数据推断总体参数是否符合某种假设,主要包括参数检验和非参数检验。
参数检验是对总体参数进行检验,例如对总体均值或总体比例进行检验。
非参数检验是不对总体参数进行具体假设的检验,例如对数据分布进行检验。
医学研究设计医学研究设计是医学统计学中非常重要的一部分,它关系到研究的可靠性和准确性。
主要包括以下几种设计。
1. 随机化对照试验随机化对照试验是医学研究设计中最可靠的一种设计,它可以有效地减少随机误差和系统误差。
研究对象被随机分配到不同的处理组中,其中一个组作为对照组,另一个组接受实验处理。
2. 横断面研究横断面研究是在特定时间点对研究对象进行一次观察,了解其疾病或特征的分布情况。
1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。
≤6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P 25 P 50 P 75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。