《中医统计学》练习题62页PPT
- 格式:ppt
- 大小:6.95 MB
- 文档页数:62
《中医统计学》练习题第一部分绪论一、最佳选择题1.抽样研究是一种科学、高效的方法,目的是研究( B )A.样本B.总体C.抽样误差D.概率2.由样本推断总体,样本应该是( D )A.总体中的典型部分B.总体中有意义的部分C.总体中有价值的部分D.总体中有代表性的部分3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中( C )A.四种误差都不可避免B.过失误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免4.统计描述是指( C )A.比较指标的差别有无显著性B.估计参数C.用统计指标描述事物的特征D.判断无效假设是否成立5.统计推断是指( D )A.从总体推断样本特征B.从总体推断总体特征C.从样本推断样本特征D.从样本推断总体特征6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A )A.系统误差B.随机测量误差C.抽样误差D.过失误差7.随机抽样的目的是( D )A.消除系统误差B.消除测量误差C.消除抽样误差D.减小样本偏性8.对某地200名16岁中学生口腔检查,发现患龋齿的人数为54人,该资料属于( B )A.数值变量资料B.无序分类变量资料C.有序分类变量资料D.三个都不是9.数值变量资料是( C )A.用仪器测量出来的资料B.按观察单位的类别,清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级,清点各等级观察单位数的资料10.无序分类变量资料是( B )A.用仪器测量出来的资料B.按观察单位的类别,清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级,清点各等级观察单位数的资料11.有序分类变量资料是( D )A.用仪器测量出来的资料B.按观察单位的类别,清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级,清点各等级观察单位数的资料12.下列哪种不属于数值变量资料( C )A.红细胞数B.血钙浓度C.阳性人数D.脉搏13.下列哪种属于有序分类变量资料( A )A.治疗痊愈、有效、无效人数B.各血型人数C.白细胞分类百分比D.贫血和不贫血人数二、判断题1.统计工作的主要内容是对资料进行统计分析。
1.中医统计学:处理中医理论与实践中的同质性和变异性的科学与艺术.以概率论和数理统计原理为基础,以中医理论与实践为主体,通过对数据的搜集、整理、分析和推断,从而达到探讨中医理论与方法内在规律的目的.2.总体:根据研究目的确定的同质观测单位的集合. (无限总体和有限总体)3.样本:从统计总体中随机抽取的、具有代表性的部分观测单位的集合.4.同质:构成总体的各个观测单位在某一方面或某几方面的性质相同或基本相同.5.变异:在同质基础上各观察单位(或个体)之间的差异.6.事件:泛指事物发生的某种情况或在调查、观察和实验中获得的某种结果.(确定性事件和随机事件)8.频率:某种现象在重复随机试验中发生的比例.9.概率:某随机事件A发生的可能性大小,记为P(A).10.频数:指研究对象安某属性进行分组后,各组中观测值的个数.11.众数:一群数据中出现次数(频数)最多的值.12.随机:在抽样、分组、实验/试验顺序安排过程中,每个观测单位都不受研究者主观意愿驱使,具有同等的机会被抽中、分配或安排,目的是保证样本具有代表性.13.随机变量:随机事件各种不同的结果.(离散型变量和连续型变量)14.量值:随机事件各种具体的观测值.15.误差:实际观测值与真值之差个差或样本指标与总体指标之差.(非随机误差(粗差、系统误差)和随机误差(测量误差、抽样误差))16.分布:随机变量取值的变化及相应的频率变化的规律性.17.频数分布:指观测值按大小分组,各个组段内观测值个数(频数)的分布,是了解数据分布形态特征和规律的基础.18.正态分布:(高斯分布)一种常见的、最重要的连续型对称分布标准正态分布:期望值μ=0,标准差σ=1的正态分布19.医学参考值范围:为了减小变异的影响,提高参考值作为为判断正常或异常的可靠性所确定的绝大多数正常人医学参考值的波动范围.20.构成比:事物内部各组成部分所占整体的比重或分布,常用百分数表示.构成比=(某现象内部某一部分的个体数/某现象内部个体数之和)×100%21.相对比:描述两个有关指标的比例关系(通常以倍数或百分数表示).率:表示某现象发生的频率或强度,是频率指标.22.抽样误差:由个体差异和随机抽样造成的样本和总体、样本与样本相应统计指标之间的差异.23.区间估计:结合样本统计量和标准误确定一个具有较大可信度的包含总体参数的区间,该区间称为总体参数的1-可信区间(CI)24.无效假设:记为,表示差别由抽样误差引起,无统计学意义.备择假设: 记为,表示差别为处理因素所致,有统计学意义.分为单侧和双侧两种形式25.检验水准:(显著性水准)符号为,事先规定的对假设成立与否作出判断的依据,常取0.05或0.0126.P值:在检验假设所规定的总体中作随机抽样,获得等于及大于/小于现有样本统计量的概率,即各样本统计量的差异来自抽样误差的概率,是判断成立与否的依据.确定P值的方法有查表法和计算法27.I型错误:统计推断结果拒绝了实际上成立的,犯了”弃真”的错误.指组间差异实际上不存在,统计推断结果却错误地认为存在组间差异,故称为以假为真的错误为阳性错误,其概率用表示II性错误:统计推断结果不拒绝实际上是不成立的,犯了”存伪”的错误. 指组间确实存在差异,统计推断结果却未检查出该差异,故称为以真为假的错误为阴性错误,其概率用表示28.检验效能:(把握度)符号为,当组间确实存在差异时,按所规定的水平能发现组间差异的能力,或当不成立时拒绝的概率29.秩次:全部观测值按顺序排列的位序. 秩和:同组秩次之和秩和检验:用于总体为非正态或不易确定的分布资料、不能或未加精确测量资料等效率较高的非参数检验方法30.相关:指一个变量增大,另一个变量也随之增大或减少的共变现象相关关系:两个变量有共变现象直线相关:判断两个变量之间有无直线相关关系并回答相关的方向和相关程度如何的统计分析方法相关系数:符号为r,说明具有相关关系的两个变量间相关关系的密切程度与相关方向的指标.31.直线回归:用直线回归方程或数学模型描述两个变量间线性依存关系的一种统计分析方法回归系数:回归方程中表示自变量x对因变量y影响大小的参数,在直线回归方程中中x每改变一个单位,y变动b个单位.32.无序资料:(名义资料)取值通常是具有某种特征或属性的个数,特点是可在非数字中取值,各类之间具有性质上的差异;有序资料:(等级资料或半定量资料),特点是各等级间有程度或量的差异,即可按数量的相对大小或程度的高低排出顺序.1.统计学的主要内容:研究设计(专业设计和统计学设计)、统计描述、统计推断(参数估计和假设检验)2.假设检验的步骤:1)建立检验假设、确定检验水准2)选择检验方法、计算统计量3)确定P值、做出推论3.专业设计的基本要素:受试对象、处理因素和试验效应4.统计设计的基本原则:对照(空白、实验、安慰剂、标准、历史、自身、相互和复合处理对照)、随机(单纯、系统、整群和分层随机抽样)、均衡、重复5.受试对象的选择需满足:对处理因素有较强的敏感性和特异性、对处理因素有较稳定的反应性、可行性6.数值变量的统计描述:1)集中趋势描述:描述一组观测值集中趋势的指标,是对同质基础上的样本或总体一般特征的指标.主要作用是①作为一组观测值的代表,表明该组观测值集中趋势的特征②便与同类研究对象进行对比分析.常用的平均数有算数平均数(总体均数μ、样本均数)、几何平均数G和中位数M;2)离散趋势描述:及变异性指标,描述一组同质观测值变异程度大小(、标准差s、变异系.常用的变异性指标有极差R、四分位数间距QR数CV、标准误SE.7.中医统计资料类型:1)计量资料:由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所获得的资料.特点是变量值大多有单位,其具体取值通常是正实数(零、正实数和小数); 2)计数资料:由分类变量产生的资料,即对每个观察单位按某种属性分组计数而得的资料.特点是变量值表现为互不相容的属性或类别,无度量衡单位.分为二分类资料(按互不相容的属性分类)和多分类资料(按不同类别分类(无序资料和有序资料))8.直线相关的注意事项:1)线性相关表示两个变量间的关系是双向的,当散点图出现直线趋势时再做分析2)相关系数的计算只适用于两个变量都服从正态分布的资料3)样本相关系数r是总体相关系数的一个估计值,r与间存在抽样误差,必须作假设检验4)相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系9.应用相对数的注意事项:1)计算时分母不宜太小,若观察单位数较小,宜直接用绝对数表示;2)观察单位数不等的几个率不能直接相加求其合计率;3)资料对比时应注意可比性;4)资料分析时不能已构成比代替10.直线回归注意的问题:1)作回归分析要有实际意义,不能把毫无关联的两种现象做回归分析.2)在进行直线回归分析前应先绘制散点图,观察点的分布有直线趋势时才适宜作直线回归分析,若呈曲线趋势宜直线化后再分析3)适用范围一般以自变量的取值范围为限,在此范围内求出的估计值称为内插,超过此范围的值称为外延,应避免外延.11.应用检验假设注意事项:1)事先进行严密的统计学设计:除对比的主要因素外,其他可能影响结果的因素在对比的组间应相同或相近2)单侧检验和双侧检验的选择:双侧检验的检验思路比单侧宽且无限制条件,较为常用,适用于对预试验结果分析,双侧的接受域位于某一特定分布的中部,拒绝域分布在两侧,而单侧检验的接受域和拒绝域各占某一特定分布的一侧,同一检验水准下单侧比双侧界值小、拒绝域大、更易得出拒绝3)灵活确定水准:根据实际工作中对不同分析目的和要求,选用的往往有一定的灵活性4)选择正确地统计方法:应根据分析目的、不同的资料类型及分布、设计方案的种类、样本量的大小等选用适当的检验方法5)正确理解统计推断的意义:统计推断结论是依据现有的设计、研究方法与条件、资料及分析目的和要求所取的水准,采用的统计分析方法等做出具有相应概率的解释,不宜将结论的意义扩大或缩小6)假设检验的结论不能绝对化:统计学结论是具有概率性质的推论,不能使用”肯定”、”证明”、”一定”、”说明”等词,此外有统计学意义时不一定有专业意义.(假设检验是否具有统计学意义取决于被研究事物有无本质差异、抽样误差的大小、所选用的高低及死单侧还是双侧)7)结合专业知识作出推论:假设检验可帮助研究者作出合理的推断,不能代替研究者做出专业结论8)CI与假设检验的区别与联系:CI推断参考值的范围(量的大小),假设检验判断各参数间有无质的不同12.统计表的结构:1)表号:位于顶线上方、标题的左侧,与标题之间的空2个字符,以阿拉伯数字表示2)标题:位于顶线上方、标号之后,简明扼要地说明表的内容;3)标目:横标目是统计表的主语,表示被说明事物的主要标志, 纵标目是统计表的谓语,说明主语的各项指标.对标目的要求是文字简明、层次清楚,一张表内不要安排过多标目;4)线条:一般只出现顶线、标目线和底线3条等长线;5)数字:一律采用阿拉伯数字,同一指标的小数位数应一致,位次对齐;6)备注:一般不列入表中,必要时可用’*’表示率和构成比的区别区别率构成比概念表示某现象发生的频率或强度表示事物内部各组成部分所占比重或分布特点某一分率的改变对其他无影响任一部分比重的增减都会影响其他部分意义反映事物的普遍性及严重程度事物按一个特征分类时,反映事物内部组成的结构特征事物按两个特征分类时,反映两个特征之间的关联关系合计各个率不能直接相加一定为100%标准差和均数标准误的区别标准差均数标准误意义描述个体观测值间的变异程度大小描述同一总体中随机抽出n相同的多个样本均属建德离散性公式与n的关系随着n的增大逐渐趋于稳定随着n的增大逐渐减小,与n的平方根成反比用途表示观测值变异大小结合均数描述正态分布的特征在正态分布时做参考值范围的估计计算变异系数和均数的标准误表示样本抽样误差的大小描述样本均数的可靠性结合均数估计总体均数的CI 进行均数间差别的假设检验区别总体均数的可信区间参考值范围的区别涵义根据抽样分布原理,按预先规定的概率(1-)给出被估计总体均数肯德数值范围.表示某总体均数的可能范围表示某项解剖、生理、生化等指标绝大多数个体观测值可能出现的范围计算已知:(未知:() 正态分布:(双侧)非正态分布:(双侧)与n的关系n越大,CI越小;n无穷大,CI趋近0 n越大,参考值范围越稳定用途估计总体均数估计某项指标绝大多数观测单位的波动范围直线相关直线回归联系(1) 反映应变量y与自变量x的互依关系,双向变化的关系体现应变量y随自变量x变化的依存关系,单向的关系(2)对两个变量间的关系进行描述,看是否有关系、关系是否密切及关系的性质对两个变量做定量描述,研究两个变量的数量关系(3) 只适用x,y服从双变量正态分布资料既适用于x,y服从双变量正态分布资料,也适用于y服从双变量正态分布,x是可以精确测量和严格控制的变量(4) r无单位,r的绝对值越大,两变量的关系越密切,相关程度越高b有单位,b的绝对值越大,回归直线越陡,y的平均变化越大(5) 两事物或现象间存在相关关系,不一定是因果关系两事物或现象间存在因果关系,则必然相关区别(1) 同时计算r和b,r与b同正负,r为正说明两变量间的相互关系是同向变化的;b为正说明x增(减)一个单位,y平均增(减)b个单位(2) r和b的假设检验等价,即对同一样本两者的t值相等,故简单的r的假设检验可代替对b的假设检验(3) 相关回归可以互相解释,称为确定系数,其可以从回归的角度了解相关程度设计方案水平特点完全随机设计单因素,两水平、多水平,不考虑混杂因素简单方便,应用广泛,容易进行统计分析,只能分析一个因素的作用,效率相对较低配对设计单因素,两水平,考虑混杂因素能缩小受试对象间的个体差异,从而减少实验误差,提高实验效率随机区组设计单因素,多水平,不考虑混杂因素各随机区组的受试对象数目相等,生物学特点较均衡,缩小了组间差别,实验效率较高SPSS电脑实验1.单样本t检验:1)用Explore正态性检验:选择Alnalyze→Descriptive statistics→Explore(Dependent:测量值, plots按钮:Normality plots with test)2)用One-Sample T Test单样本检测:选择Alnalyze→Compare Means→One-SampleT Test(右侧上面的Test框:测量值, 修改下面的Test框默认值(总体均数))2.配对t检验1)计算差值d: 选择Transform→Compute Variable(Target Variable:d,Numeric expession:方法一,单击运算键“-”,Numeric expession:法二)2)对差值d用Explore正态性检验: (Dependent:d,同上)3)配对t检验: 选择Alnalyze→Compare Means→Paired-Sample T Test (Paired Variable:方法一、方法二)3.方差齐性检验1)用Explore正态性检验,Spread vs.level with levene test→Untransformed 4.独立样本t检验1)选择Alnalyze→Compare Means→Independent-Samples T Test (Test框:测量值d,grouping:组别,Define groups:1、2等)1.完全随机设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :组别,Option视窗中Estimated Marginal Means→Display Means for:组别,Display: Descriptive statistics和Homogeneity tests→Continue→OK)2.随机区组设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :方法、药物;Model视窗中选择Custom→Model:方法、药物,Sum of Squares:Type III, →Include intercept inmodel→Continue;Post Hoc视窗中,Post Hoc Test for:方法,S-N-K →Continue ;Option视窗中Display Means for:组别,Display: Descriptivestatistics→Continue→OK)1.成组设计四格表检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2)检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”对话框→statistics→Chi-square→Continue→OK2.配对设计四格表检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2)检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”新法→Row(s)”以及”旧法→Column(s)”→statistics→McNemar→Continue→OK3.R×C表检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2)检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”→statistics→Chi-square→Continue→OK1.直线相关分析:1)选择Alnalyze→Correlate→Bivariate→在Bivariate Correlations的视窗中,将进食量、增重量两变量同时选中,从左边源变量框中移置到由框中→OK2.直线回归分析:1)选择Alnalyze→Regession→Linear→在Linear Regession的视窗中,将左边“收缩压“变量送入右边Dependent框中,左边”年龄”变量送入右边单样本t检验配对设计资料的t检验独立样本t检验完全随机F 检验计算均差平方和计算自由度计算均方计算F值随机区组F 检计算均差平方和计算自由度计算均方计算F值相关系数,,相关系数假设检验:成组设计四格表T≥5n≥40 nnnT CRRC=,()∑-=TTA22χ或()()()()()dbcadcbanbcad++++-=22χ1≤T<5n≥40nnnT CRRC=,()∑--=TTA225.0χ或()()()()()dbcadcbannbcad++++--=222χ配对设计四格表b+c≥40b+c<4行×列表T>1或1<T<5少于1/51.率的标准化法: 采用统一标准计算各率的标准化率,使率具有可比性,目的是在比较总率时消除混杂因素的影响.2.相对数:两个有联系的绝对数、相对数或平均数之比.(常用的相对数有率、构成比和相对比3.非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法,称非参数检验.4.等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料5.参数统计:在统计推断中 ,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知, 统计推断的目的就是对这些未知参数进行估计或检验.6.参数估计:用样本统计量来估计总体参数,包括点值估计和区间估计.7.可信区间:在参数估计时,按一定可信度估计所得的总体参数所在的范围.8.假设检验:根据研究目的, 对样本所属总体特征提出一个假设, 然后用适当方法根据样本提供的信息, 推断此假设应当拒绝或不拒绝, 以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析.9.中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值.10.影响的因素是:1)与样本量成正比:n越大,标准误越小,减小,发现组间差异的能力越强2)与参数的差值成正比:参数间的差值越大,样本指标间的差值就越大,越易获得拒绝的结论3)与个体差异成反比:标准差越小,标准误就越小,统计量就越大,越高4)与设计类型有关:配对设计和配伍设计比完全设计的高5)与检验方法有关:①参数检验所含的信息量比非参数检验多,高;②与检验方法要求的条件的多少成正比: 参数检验比非参数检验的高;③检验水准的大小成正比:与呈反比11.假设检验的目的和意义是什么?答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。
1.某中药厂用旧设备生产的六味地黄丸,丸重的均数为8.9克,更新了设备后,从所生产的产品中随机抽取9丸,其重量为:9.2,10,9.6,9.8,8.6,10.3,9.9,9.1,8.9。
问设备更新前后药丸的平均重量是否有变化?2.在探讨硫酸氧钒降糖作用的实验中,测得两组动物每日进食量如表,试问两组动物每日进食量是否相同?12345678910糖尿病加钒组 26.46 25.19 28.70 23.70 24.48 25.19 28.10 23.70 26.10 24.62 糖尿病组46.89 47.21 42.42 47.70 40.75 41.03 45.98 43.46 44.34 45.323.对两组小白鼠分别用青蒿素用溶媒进行耐缺氧试验研究,测得生存时间如表所示,判断两组的耐缺氧生存时间有无不同。
分组 1 2 3 4 5 6 7 8 9 10 青蒿素组 94 94 10 99 61 27 37 33 16 26 溶媒组171727332220723433624.某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物(具体分配结果见例4-3),以肉瘤的重量为指标,试验结果见表4-9。
问三种不同的药物的抑瘤效果有无差别?表4-9 不同药物作用后小白鼠肉瘤重量(g ) 区组 A 药 B 药 C 药 1 0.82 0.65 0.51 2 0.73 0.54 0.23 3 0.43 0.34 0.28 4 0.41 0.21 0.31 50.680.430.245.表中是某湖水中不同季节的氯化物含量测定值,请问在不同季节该湖水中氯化物的含量有无差别? 某湖水中不同季节氯化物含量测定值春 夏 秋 冬 1 22.6 19.1 18.9 19.0 2 22.8 22.8 13.6 16.9 3 21.0 24.5 17.2 17.6 4 16.9 18.0 15.1 14.8 5 20.0 15.2 16.6 13.1 6 21.9 18.4 14.2 16.9 7 21.5 20.1 16.7 16.2 8 21.2 21.2 19.6 14.86、某研究者为比较耳垂血和手指血的白细胞数,调查12名成年人,同时采取耳垂血和手指血见下表,试比较两者的白细胞数有无不同。
《中医药统计学》习题解答1 总体分布题解习题1.1解答1. 对三人做舌诊算一次试验。
设A ={3人正常}、B ={至少1人不正常}、C ={只有1人正常}、D ={只有1人不正常}。
分析这四个事件中的互斥事件、对立事件,描述事件A +D 、BD 各表示什么意思?解 设A i ={第i 人正常},用A i 表示A 、B 、C 、D 得到A ={三人正常}=321A A AB ={至少一人不正常}=321321321321321321321A A A A A A A A A A A A A A A A A A A A A ++++++ C ={只有一人正常}=321321321A A A A A A A A A ++ D ={只有一人不正常}=321321321A A A A A A A A A ++可以看出,互斥事件有A 与B ,A 与C ,A 与D ,C 与D ,A 与C 、D ;对立事件有A 与B 。
A +D =321A A A +321321321A A A A A A A A A ++={至少2人正常}={至多1人不正常}BD =321321321A A A A A A A A A ++={只有1人不正常}={只有2人正常}=D2. 我国四个地区一年的生育情况如表1-2所示,求生男孩的概率。
解 设A ={生男孩},计算得到)()(A f A P n ≈9645731022811994101990993496986528072514765513654++++++==0.51693. 在40个药丸中有3丸失效,任取5丸,求其中有2丸失效的概率。
解 这是古典概率模型。
在40个药丸中任取5丸,每一个药丸均可能被取到,且被取到表1-2 四个地区生育情况 地区编号生育总数 生男孩数 1 990 993 513 654 2 994 101 514 765 3 1 022 811 528 072 4964 573496 986的可能性相等,可能结果有540C 个基本事件。