实验一 计量资料的统计描述、参考值范围、可信区间
- 格式:ppt
- 大小:741.50 KB
- 文档页数:25
整理分析和2.计描述4.(集合)。
1.抽样随机2.分组随机3.实验顺序随机。
称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。
系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。
参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。
②方差齐性:两样本均数比较时,要求两总体方差相等。
U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。
8、★.描述分类变量常用的指标有率、构成比、相对数。
9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。
10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。
实习二计量资料的统计描述名词解释1. 均数答:均数是能反映全部观察值的平均水平的统计指标,适用于对称分布尤其是正态分布资料。
2. 标准差答:标准差是用于描述资料离散趋势的统计指标,适用于对称分布资料,尤其正态分布资料的。
标准差大,表明资料的变异度大,组内数据参差不齐的程度较明显。
填空题1 计量资料的分布特征有____和____。
答:集中趋势和离散趋势。
2 描述计量资料集中趋势的常用指标有____ 、____和____答:均数、几何均数和中位数。
3 描述计量资料离散趋势的常用指标有____ 、_______和____答:极差、方差与标准差和变异系数是非题1. 频数表中组数越多越好。
(⨯)解释:频数表中组数不宜过多也不宜过少。
2. 对称分布资料理论上均数和中位数一致(∨)解释:对于对称分布的资料,两者的计算结果在理论上是相同的。
但在实际计算中往往也会存在一定偏差。
选择题1 有5人的血清滴度为:1:20,1:40,1:80,1:160,1:320则平均滴度是A.1:40B.1:80C.1:160D.1:320答:应选B。
描述平均滴度宜用几何均数。
2.一组变量值,其大小分别为10,12,9,7,11,其中位数是A.9B.7C.10D.11答:应选C。
先将观察值由小到大顺序排列,7,9,10,11,12。
n为奇数时,M=X3=103.一组变量值,其大小分别为10,12,9,7,11,39,其中位数是A.9B.7C.10.5D.11答:应选C。
先将观察值由小到大顺序排列,7,9,10,11,12,39。
n为偶数时,M=( X3 +X4)/2 =(10+11)/2=10.54. 某组资料共5例, ∑X2=190, ∑X=30, 则均数和标准差分别是1A.6 和1.29B.6.33和2.5C.3和6.78D.6和1.58答:应选D,计算步骤是先用 X除以5求得均数,数值为6。
再代入直接法求标准差公式,求得标准差为1.58。
误差:观测值与真实值、样本计量与总体参数之间的差别。
相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。
相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。
统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。
统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
同质:指根据研究目的所确定的观察单位其性质应大致相同。
变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。
定量数据:也称计量资料。
变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。
根据变量的取值特征可分为连续型数据和离散型数据。
有序数据:也称半定量数据或等级资料。
变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。
总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。
样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。
参数:描述总体特征的指标称为参数。
统计量:描述样本特征的指标称为统计量。
概率:描述某事件发生可能性大小的度量。
小概率事件:习惯上将P≤0.05的事件称为小概率事件。
平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。
率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。
构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
线性相关的概念:研究两个变量之间是否具有直线相关关系。
相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。
研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。
处理因素:根据研究目而欲施研究对象的干预措施。
第一部分 计量资料的统计描述、最佳选择题1、描述一组偏态分布资料的变异度,以( )指标较好。
A 、全距B 、标准差C 、变异系数D 、四分位数间距E 、方差2.用均数和标准差可以全面描述( )资料的特征。
A .正偏态分布B .负偏态分布C .正态分布D .对称分布E .对数正态分布3.各观察值均加(或减)同一数后( )。
A .均数不变,标准差改变B .均数改变,标准差不变9.最小组段无下限或最大组段无上限的频数分布资料,可用( )描述其集中趋势。
A .均数B .标准差C .中位数D .四分位数间距E .几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A .算术平均数B .中位数C .几何均数D .变异系数E .标准差二、简答题1、对于一组近似正态分布的资料,除样本含量 n 外,还可计算 ,S 和 ,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的 联系和区别。
3、说明频数分布表的用途。
4、变异系数的用途是什么?5、试述正态分布的面积分布规律。
三、计算分析题1、根据 1999 年某地某单位的体检资料, 116 名正常 成年女子的血清甘油三酯( mmol/L )测量结果如右表, 请据此资料: (1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
( 3)求该地正常成年女子血清甘油三酯的 95%参考值范围。
( 4)试估计该地正常成年女子血清甘油三酯在 0.8mmol/L 以下者及 1.5mmol/L 以下者各占正常女子总人数的百分比。
2、某些微丝蚴血症者 42 例治疗后 7 年用间接荧火抗体试验得抗体滴度如下。
求平均抗体滴度。
C .两者均不变D .两者均改变4.比较身高和体重两组数据变异度大小宜采用(A .变异系数B 5.偏态分布宜用( A .算术均数 B.方差 C .极差 D )描述其分布的集中趋势。
.标准差 C .中位数0 的常数后,(B .标准差C .几何均数 )分布的资料,均数等于中位数。
第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。
总体包括有限总体和无限总体。
样本:从总体中随机抽取的部分观察单位,其实测值的集合。
获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。
资料的类型计量资料、计数资料和等级资料。
误差包括随机误差、系统误差和非系统误差。
抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。
概率:是描述随机事件发生可能性大小的一个度量。
取值范围0≤P ≤1。
小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。
P ≤0.05或P ≤0.01。
医学统计学的步骤:设计、收集资料、整理资料和分析资料。
统计分析包括:统计描述和统计推断。
统计推断包括:参数估计和假设检验。
第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。
对称分布:集中位置在中间,左右两侧頻数基本对称。
偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。
(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。
计量资料集中趋势包括算术均数、几何均数和中位数。
算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。
中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。
实习一计量资料的统计描述1、某省农村120例6-7岁正常男童胸围(cm)测量结果如表所示。
120例6-7岁正常男童胸围(cm)测量结果51.6 54.1 51.3 56.6 51.2 53.6 56.0 58.354.0 56.9 55.5 57.7 56.0 57.4 55.2 53.657.7 55.5 57.4 53.5 56.3 54.0 57.5 55.458.3 55.4 55.9 53.3 54.1 55.9 57.2 56.153.8 57.7 56.0 58.6 57.6 56.0 58.1 49.151.3 53.8 50.5 53.8 56.8 56.0 54.5 51.757.3 54.8 58.1 56.5 51.3 50.2 55.5 53.652.1 55.3 58.3 53.5 53.1 56.8 54.5 56.154.8 54.7 56.2 53.7 52.4 58.1 56.6 56.753.4 57.1 54.4 53.7 54.1 59.0 56.2 55.753.1 55.9 56.6 56.4 50.4 53.3 56.7 50.851.4 54.6 56.1 58.0 54.2 53.8 55.3 55.956.1 61.8 56.7 52.7 52.4 51.4 53.5 56.659.3 56.8 58.1 59.0 53.1 54.2 54.0 54.759.8 53.9 52.6 54.6 52.7 56.4 55.5 54.4(1)试编制胸围数据的频数表,绘制直方图,分析其分布特征。
(2)用合适的统计量描述胸围数据的集中趋势、变异趋势。
(3)计算P25、P50、P75。
2、根据2010年某地某单位的体检资料,116名正常成年女子的血清甘油三酯(mmol/L)测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
医学统计学笔记一、绪论及基本概念1. 资料类型①计量资料(定量资料、数值变量资料):连续型、离散型②计数资料(定性资料、无序分类变量、名义变量):二分类、多分类③等级资料(半定量资料、有序分类变量)信息量:计量资料>等级资料>计数资料2.误差类型①过失误差:可避免②系统误差:具有明确的方向性,可避免③随机误差:分为随机测量误差和随机抽样误差,没有固定的大小和方向,不可避免3.核心概念参数:u、σ;固定的常数,总体的统计指标,参数大小客观存在,但往往未知。
统计量:X̅,S,P;样本的统计指标,参数附近波动的随机变量。
概率为参数,频率为统计量。
4.医学统计工作的基本步骤:设计、收集资料、整理资料、分析资料二、计量资料的统计描述1.集中趋势的描述a.算术均数,简称均数(mean):主要适用于对称分布或偏度不大的资料,尤其适合正态分布资料。
不能用于开口型资料。
u(总体均数),X(样本均数)。
b.几何均数(geometric mean,G):适用于经对数转换后呈对称分布。
观察值不能为0 、不能同时有正有负。
同一资料算得的几何均数小于算术均数。
c.中位数(median, M)和百分位数(precentile, Px):适用于各种分布类型资料。
当计量资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。
用频数表法计算百分位数时,组距不一定要相等。
P x=L x+i x(n∗x%−∑f L)f xL x:第x百分位数所在组段的下限i x:第x百分位数所在组段的组距f x:第x百分位数所在组段的频数∑f L:第x百分位数所在组段上一组段累计频数d.调和均数(harmonic mean,H):适用于表达呈极严重的正偏态分布资料的平均水平。
计算方法为求倒数的均值后再取其倒数。
SPSS:在Transform中输入公式。
2.离散(dispersion)趋势的描述a.极差(range,R):也称为全距。
b.四分位数间距(quartile range,Q):即统计图中箱子的高度,常用于偏态资料离散度的描述,多与M 合用。
《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三酯的95%参考值范围。
(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。
(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。
Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。
(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。
某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。
计算过程根据公式s x 96.1±,即1.16±1.96×0.20。
该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。
上海交通大学网络教育学院医学院分院医学统计学课程练习册第一章绪论一、单选题1. 小概率事件是指P ( B )A.P>0.05 B.P<0.05 C. P >0.01 D. P <0.12. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是( A )A总体中个体值存在差别B样本中个体值存在差别C样本只含总体的一部分D总体均数不等于03. 调查中国放射科医生接触射线情况,全国放射科医生的全部组成为( A )A.研究总体B.目标总体C.研究样本D.目标样本4. 若以舒张压90mmHg、收缩压130 mmHg为高血压阳性临界点,调查3000人中有300名血压超过临界值,这份资料属于:( B )A. 定量资料B. 分类资料C. 等级资料D. 离散型变量5. 下列属于统计量的指标是( C )A 总体均数B 总体标准差C 样本标准差D 总体率6. 调查某地区高血压的患病情况,抽样调查了2000名居民,得到了2000对舒张压与收缩压的数据,请问此资料是:( C )A 分类资料B等级资料 C 定量资料D分析后才知7. 下列属于参数的指标是( D )A 样本均数B 样本率C 样本标准差D总体标准差8. 用样本做统计推断,样本应是( B )A. 总体中典型一部分B. 总体中有代表性一部分C. 总体中任意一部分D. 总体中信息明确一部分9. 统计推断的内容为( D )A. 用样本指标估计相应的总体指标B. 检验统计上的“检验假设”C. A和B均不是D. A和B均是10. 随机调查社区2000人,得到平均体重为60公斤,则该资料属于( A )A. 计量资料B. 总体资料C. 计数资料D. 等级资料二、名词解释1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标。
样本指标与总体指标的差异称为抽样误差。
2.总体:根据研究目的性质相同的观察单位的全体3.分类变量:用定性方法测得,表现为互不相容的类别或属性,如性别等4.数值变量:用定量方法测量得到,表现为数值大小,一般有计量单位,如身高、体重。