医学统计学-析因分析
- 格式:ppt
- 大小:239.50 KB
- 文档页数:27
●【抽样误差】由抽样引起的样本统计量与总体参数间的差别。
原因:个体变异+抽样 表现:样本统计量与总体参数间的差别、不同样本统计量间的差别。
抽样误差是有规律的 ●【可信区间CI 】区间估计是按一定的概率或者可信度1-α,用一个区间估计总体参数所在的范围CI ,这个范围成为可信度为1-α的可信区间,置信区间。
影响:可信度、个体差异、样本含量 两要素:可信度1-α、可靠性;精确性可信度为95%的CI 涵义:每100个样本计算95%的CI ,平均有95%的CI 包含了总体参数。
95%,指方法本身,而非某个区间。
该区间包含总体参数,可信度为95%●【总体和样本】根据研究目的确定的同质的所有观察单位的某种变量值的集合。
样本是指在研究总体中随机抽出一部分个体进行观察或测量,这些个体的测量值构成的集 ●【参数和统计量】描述总体特征的指标,不变的,固定的,未知的统计量:描述样本特征的指标,变化的,已知的,有误差的●【概率和小概率原理】描述某随机事件发生可能性大小的度量,记做P ,取值0<P <1 小概率原理:P ≤0.05,该事件发生的可能性很小,进而认为在一次抽样中不可能发生 ●【随机】机会均等、随机抽样、随机分组、实验顺序随机●【变异系数CV 】离散系数,标准差S 、均数之比。
用来衡量单位不同的多组资料的变异度、比较均数相差悬殊的多组资料的变异度●【相关系数】两个有直线关系的变量间相关关系的密切程度与相关方向的指标,记做r ,-1≤r ≤1,正、负相关,其绝对值越大表示关系越密切,越接近于0相关越不密切 ●【回归系数】b 回归直线的斜率,自变量增加一个单位,应变量的平均改变量●【标准误】样本统计量的标准差,衡量抽样误差的大小 ●【偏倚】实验中某些非实验因素的干扰所形成的系统误差,歪曲了处理因素的真实效应 ●【一类错误、二类错误】【检验效能】1-β 就是对真实的H 1作出肯定结论之概率●【假设检验中的P 值】从 H0 总体中随机获得等于或大于现有统计量值的概率。
1、抽样误差:有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异,称之。
2、标准误:将样本统计量的标准差称为标准误。
3、均数的标准误:样本均数的标准差也称为均数的标准误(SEM),它反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,因而说明了均数抽样误差的大小。
4、u分布:若某一随机变量X服从总体均数为υ、总体标准差为σ的正态分布N(υ,σ2),则通过u变换(X-u/σ)可将一般正态分布转化为标准正态分布N(0,1 2),即u分布。
5、t分布:在实际工作中,由于σ-X未知,用S-X代替,则-X-υ/S-X不再服从标准正态分布,而服从t分布。
6、可信区间:是按照预先给定的概率(1-α)所确定的包含总体均数的区间估计范围。
其确切含义为:如果能够进行重复抽样试验,平均有1-α(如95%)的可信区间包含了总体均数,而不是总体均数落在该可信区间。
7、假设检验:也称为显著性检验,是利用小概率反证法思想,从问题的对立面(Ho)出发间接判定要解决的问题(H1)是否成立。
然后在Ho成立的条件下计算检验统计量,最后获得P值来判断。
8、Ⅰ型错误:拒绝了实际上成立的Ho,这类“弃真”的错误称之。
Ⅱ型错误:“接受”了实际上不成立的Ho,这样的“取伪”的错误称之。
9、检验效能:1-β,即把握度,指当两总体确有差异,按规定检验水准α所能发现该差异的能力。
10、变量转换:是指原始数据作某种函数转换,如转换为对数值等。
1、方差分析:又称变异数分析或 F检验,适用于对多个平均值进行总体的假设检验,以检验实验所得的多个平均值是否来自相同总体。
2、单向方差分析(one way analysis of variance)是指处理因素只有一个。
这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体。
3均方:每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(mean square,MS)4、LSD-t检验:即最小显著性差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。
医学统计学(安徽中医药大学)智慧树知到课后章节答案2023年下安徽中医药大学第一章测试1.医学统计工作的步骤为( )A:统计研究调查、统计描述、统计推断、统计图表B:统计资料收集、整理资料、统计描述、统计推断 C:统计研究设计、统计描述、统计推断、统计图表 D:统计研究调查、搜集资料、整理资料、分析资料 E:统计研究设计、搜集资料、整理资料、分析资料答案:统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有( )A:区间估计与假设检验 B:统计图表和统计报告 C:统计描述和统计推断 D:统计描述和统计图表 E:统计描述和统计学检验答案:统计描述和统计推断3.医学统计学研究的对象是( )A:医学中的小概率事件 B:疾病的预防与治疗 C:动物和人的本质 D:有变异的医学事件 E:各种类型的数据答案:疾病的预防与治疗4.用样本推论总体,具有代表性的样本指的是( )A:总体中最容易获得的部分个体 B:在总体中随意抽取任意个体 C:用配对方法抽取的部分个体 D:依照随机原则抽取总体中的部分个体 E:挑选总体中的有代表性的部分个体答案:依照随机原则抽取总体中的部分个体5.下列观测结果属于等级资料的是( )A:病情程度 B:四种血型 C:住院天数 D:脉搏数 E:收缩压测量值答案:收缩压测量值6.对于无限总体我们采用抽样方式进行研究,而对于有限总体,不用抽样()A:对 B:错答案:错7.统计量是随机的,会随着抽样方法、样本量和测量方法而发生变化()A:对B:错答案:对8.系统误差不可以避免,也没有倾向性()A:错 B:对答案:错9.随机误差因为随机而没有规律,因此无法估计和控制()A:错 B:对答案:对10.小概率事件原理是统计推断的基础,基于其推断的结果,依然会出错的可能性()A:错 B:对答案:对11.同一变量的不同数据类型是可以转换的()A:对 B:错答案:对12.只要进行随机化抽样,得到的样本统计量就有很好的代表性A:对 B:错答案:对第二章测试1.从偏态总体抽样,当n足够大时(比如n > 60),样本均数的分布()A:近似正态分布 B: 近似对称分布 C:仍为偏态分布 D: 近似对数正态分布答案:仍为偏态分布2.医学中确定参考值范围时应注意()A:正态分布资料不能用均数标准差法 B:偏态分布资料不能用百分位数法 C:正态分布资料不能用百分位数法 D:偏态分布资料不能用均数标准差法答案:偏态分布资料不能用百分位数法3.计算样本资料的标准差这个指标()A:不会比均数小 B:不会比均数大 C:决定于均数 D:不决定于均数答案:决定于均数4.中位数永远等于均数A:错 B:对答案:对5.中位数永远等于P50A:对 B:错答案:错6.标准差大于标准误A:对 B:错答案:错7.标准误大,则抽样误差大A:错 B:对答案:对8.数值变量分布包括集中趋势和离散趋势两方面A:对 B:错答案:错第三章测试1.影响总体率估计的抽样误差大小的因素是()A: 检验的把握度和样本含量 B:总体率估计的容许误差 C:总体率和样本含量 D: 样本率估计的容许误差 E: 检验水准和样本含量答案: 检验的把握度和样本含量2.检验效能是指如果总体间确实存在差异,按照检验水准α能够发现该差异的能力()A:错 B:对答案:错3.如果H0假设为μ1=μ2,那么H1假设可能为( )A:μ1 B:μ1>μ2 C:μ1≠μ2D:μ1≥μ2 E:μ1≤μ2 答案:μ1;μ1≠μ2;μ1≥μ24.假设检验中α和β是跷跷板的关系A:错 B:对答案:错5.参数估计和假设检验均可以进行总体参数是否有差异的判定方法()A:对 B:错答案:错6.总体率参数估计肯定可以用正态分布法A:对 B:错答案:错7.在抽样研究中,当样本例数逐渐增多时()A:标准误逐渐减小 B:标准误逐渐加大 C:标准差逐渐加大 D:标准差逐渐减小答案:标准误逐渐减小8.当n足够大,且np和n(1-p)均大于5时,总体率的95%可信区间用()式求出。
生物统计学析因设计的方差分析两因素方差分析析因设计(factorial design):在一批试验中可以研究多个因素(或处理)。
两因素随机效应型(random-effect model)固定效应型(fixed-effect model)混合效应型(mixed-effect model)1.单独效应单独效应(simple effect)是指其他因素的水平固定时,同一因素不同水平间的差别。
2.主效应主效应(main effect)指某一因素各水平间的平均差别。
它与单独效应的区别是,主效应所指的某因素各水平间的平均差别是综合了其他因素各水平与该因素每一水平所有组合的情况。
3.交互效应(interaction)如果一个处理因素的单独效应随另一因素水平变化而变化,而且变化的幅度超出随即波动的程度,则称两因素间存在交互作用。
一、固定效应型两因素两水平的析因分析固定效应型∑∑∑∑∑∑∑=====⋅⋅⋅⋅⋅⋅⋅⋅=⋅⋅⋅⋅⋅=⋅⋅⋅⋅⋅-=+--=-=-=ai bj nk ij ijk e ai bj j i ij AB b j j B ai i A x x SS x x x x n SS x x an SS x x bn SS 11121121212)()()()(SS T =SS A + SS B + SS AB + SS e1-=a SS MS AA 1-=b SS MS BB )1)(1(--=b a SS MS ABAB)1(-=n ab SS MS ee ν= a-1ν= b-1ν= (a-1)(b-1)ν= ab (n-1)固定模型方差分析表(A B固定)变异来源平方和自由度均方FA因素SS A a-1 MS A MS A /MS e (6-20)B因素SS B b-1 MS B MS B/MS e (6-21)AB交互作用SS AB (a-1)(b-1) MS AB MS AB /MS eab(n-1) MS e误差SSeabn-1总和SST若A、B无交互作用,F= MS A /MS W (6-22)AF B= MS A /MS W (6-23)MS W=(SSe+ SS AB)/ (νe+ νAB) (6-19)例 6.1 将20只家兔随机等分4组,每组5只,进行神经损伤后的缝合试验。
absolute frequency频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。
age-sexpyramid人口金字塔:是将人口的性别和年龄资料结合起来,以图形的方式表达人口的性别和年龄构成。
它以年龄为纵轴,人口数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以分析过去人口的出生死亡情况以及今后人口的发展趋势。
Analysis of Variance,简称ANOVA方差分析:又称F检验,是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同,用于比较两个或两个以上均数的差别。
binomial distribution二项分布:对只有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。
Coefficient of variation变异系数:是衡量资料中各观测值变异程度的一个统计量,用标准差与平均数的比值来表示。
confidence interval可信区间:按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围,该范围通常称为参数的可信区间或者置信区间。
constituent ratio构成比:是指事物内部某一组成部分观察单位数与事物内部各组成部分观察单位总数之比,常用百分数表示。
Correlation coefficient相关系数:又称Pearson积距相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标。
dependent variable因变量:指实验中由于实验变量而引起的变化和结果。
Dynamic Series动态数列:按时间顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势Error误差:观察值与真实值之间的差,一般偏差也称误差。
experimental effect实验效应:处理因素作用于受试对象长生的反应或结局。
factor analysis析因分析:是将两个或多个实验因素的各水平进行全面组合的实验,能够分析各实验因素的单独效应、主效应和因素间的交相呼应geometricmean几何均数:变量对数值的算数均数的反对数。
一、SPSS 基本功能SPSS基本功能数据管理统计分析图表分析:条图、直方图、饼图、线图、散点图等输出管理:对输出结果复制、编辑等描述性分析均数比较一般线性模型相关与回归分析非参数检验生存分析FrequenciesDescriptivesExploreCrosstabs 统计资料的类型资料类型定量资料:用定量的方法获得的数值资料计数资料:按性质或类别分组后清点各组个数等级资料:半定量资料定量资料的统计推断正态分布两组均数比较单样本设计t检验配对设计t检验成组设计t检验三组及以上均数比较完全随机设计方差分析随机区组设计方差分析重复测量方差分析析因设计方差分析偏态分布配对设计秩和检验单样本设计秩和检验成组设计秩和检验资料类型定量资料计数资料等级资料统计分析统计描述统计推断相对数总体率的估计假设检验u检验卡方检验4假设检验参数检验非参数检验正态分布等级资料偏态分布资料分布类型未知方差不齐,且不易变换达到齐性数据一端或两端不确定的资料1.参数检验:已知总体分布类型,对未知的总体参数做推断的假设检验方法。
故参数检验依赖于特定的分布类型,比较的是总体参数2.非参数检验:不依赖于总体分布类型、不针对总体参数的检验方法。
故非参数检验对总体的分布类型不做任何要求,不受总体参数的影响,比较的是分布或分布位置。
适用范围广,可适用于任何类型资料 参数检验➢ 优点:资料信息利用充分;检验效能较高 ➢ 缺点:对资料的要求高;适用范围有限 2.非参数检验➢ 优点:适用范围广,可适用于任何类型的资料 ➢ 缺点:检验效能低,易犯Ⅱ型错误 凡适合参数检验的资料,应首选参数检验对于符合参数检验条件者,采用非参数检验,其 检验效能低,易犯Ⅱ型错误研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。