计数资料的统计推断
- 格式:ppt
- 大小:273.00 KB
- 文档页数:32
统计描述与统计推断统计的主要工作就是对统计数据进行统计描述和统计推断。
统计描述是统计分析的最基本内容,是指应用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。
(一)统计描述1.计量资料的统计描述计量资料的统计描述主要通过编制频数分布表、计算集中趋势指标和离散趁势指标以及统计图表来进行。
(1)集中趋势。
指频数表中频数分布表现为频数向某一位置集中的趋势。
集中趋势的描述指标:1)算术平均数。
直接法:x为观察值,n为个数加权法又称频数表法,适用于频数表资料,当观察例数较多时用。
f为各组段的频数。
2)几何平均数(geometric mean)。
几何平均数用符号G表示。
用于反映一组经对数转换后呈对称分布的变量值在数学上的平均水平。
直接法:加权法又称频数表法,当观察例数n较大时,可先编制频数分布表,用此法算几何平均数:3)百分位数(percentile )与中位数(median )。
百分位数是一种位置坐标,用符号x P 表示常用的百分位数有 2.5P 、5P 、50P 、75P 、95P 、97.5P 等,其中25P 、50P 、75P 又称为四分位数。
百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位结合使用,可更全面地描述资料的分布特征。
中位数是一个特定的百分位数即50P ,用符号M 表示。
把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。
中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。
中位数理论上可以用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资料。
其计算方法有直接法和频数表法两种。
直接法:当观察例数n 不大时,此法常用,先将观察值按大小次序排列,选用下列公式求M 。
《医学统计学》课程教学大纲(Medical Statistics)一、课程基本信息课程编号:14232080课程类别:专业必修课适用专业:医学检验技术学分:理论教学学分:2学分,实验学分:0.5学分总学时:40学时(其中讲授学时:24学时;实验(上机)学时:16学时)先修课程:医学基础课程后续课程:医学检验、预防医学选用教材:李康主编:医学统计学(第6版)[M].北京:人民卫生出版社,2013必读书目:[1]方积乾主编.医学统计学(第7版)[M].北京:人民卫生出版社,2013[2]袁兆康.医学统计学[M].北京:人民军医出版社.2013[3]张文彤主编.SPSS统计分析基础教程(第2版)[M].北京:高等教育出版社,2011选读书目:[1] 颜虹, 医学统计学[M]. 北京:人民卫生出版社,2005[2] 康晓平,实用卫生统计学 [M].北京:北京大学医学出版社,2002[3] Belinda Barton,Medical Statistics: A Guide to SPSS, Data Analysis and Critical Appraisal [M].美国:WILEY Blackwell,2014二、课程教学目标通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会数值变量和分类变量资料的分析,配对资料的分析,直线相关和直线回归,非参数统计方法,病例随访资料分析。
其目的使大家具备新的推理思维,结合专业问题合理设计试验,科学获取资料,提高科研素质。
本课程教学的主要方法有理论讲授、课堂讨论、实验实习、课堂演算、统计软件SPSS上机等。
通过实验实习,使学生加深对理论的理解。
三、课程教学内容与教学要求1.绪论教学要求:掌握:同质与变异,总体、个体和样本,变量的分类,统计量与参数,抽样误差,频率与概率等基本概念。
理解:统计工作的基本步骤,医学统计学的主要内容。
了解:学习统计学的目的和要求。
一、判断题:1.研究人员测量了100例患者外周血的红细胞计数,所得资料为计数资料。
(×)2.统计分析包括统计描述和统计推断。
(√)3.计量资料、计数资料和等级资料可根据分析需要相互转化。
(√)1. 为了了解某地20~29岁健康女性血红蛋白的正常值范围,现随机调查了该地2000名20~29岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是:A.该地所有20~29的健康女性B.该地所有20~29的健康女性的血红蛋白测量值C.抽取的这2000名20~29岁女性D.抽取的这2000名20~29岁女性的血红蛋白测量值2.抽样的目的是:A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量3.参数是指:A.参与个体数B.总体的统计指标C.样本的统计指标D.样本的总和4.关于随机抽样,下列那一项说法是正确的:A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好5.总体的要求是:A.大量的B.同质的C.随机的D.固定的6.统计学上说的系统误差、测量误差和抽样误差三种误差,在实际工作中有:A.三种误差都不可避免B.系统误差和抽样误差不可避免C.系统误差和测量误差不可避免D.测量误差和抽样误差不可避免7.同性三胞胎的身长、体重均有不同,这是:A.变异B.同质C.系统误差D.抽样误差8.某医生对100名高血压病人采用某新疗法进行治疗,该研究的总体是:A.全院收治的高血压病人B.这100名高血压病人C.该医生收治的所有病人D.接受该新疗法的所有高血压病人E.所有高血压病人生物信息学-统计原理统计检验•(statistical test)也称假设检验。
利用样本信息,根据一定概率,对某一总体参数的假设经检验后作出拒绝或接受的决断。
对某一总体参数作出假设(nullhypothesis H)搜集样本数据产生样本统计量确定对假设拒绝还是接受•若某一随机变量X 服从总体均数为μ、总体标准差为σ的正态分布N(μ,σ2))1,0(~2N X u σμ-=由于样本均数服从总体均数为μ、总体标准差为的正态分布N( μ, σ2) )1,0(~2N X u Xσμ-=σμXX u -=,1X X X t n S S nμμν--===-n mν=-n 为计算某一统计量用到的数据个数,m 为计算该统计量用到其它独立统计量的个数。
统计学简答题汇总1、标准正态分布(u分布)与t分布有何异同?相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(⾃由度是⽆限⼤时)不同点:t分布是⼀簇分布曲线,t 分布的曲线的形状是随⾃由度的变化⽽变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。
3、简述直线回归与直线相关的区别。
1资料要求上不同:直线回归分析适⽤于应变量是服从正态分布的随机变量,⾃变量是选定变量;直线相关分析适⽤于服从双变量正态分布的资料。
2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越⼤回归直线越陡峭,表⽰应变量随⾃变量变化越快;相关系数是表明两个变量之间相关的⽅向和紧密程度的,相关系数越⼤,两个变量的关联程度越⼤。
第⼀章医学统计中的基本概念2、抽样中要求每⼀个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
(1)代表性: 就是要求样本中的每⼀个个体必须符合总体的规定。
(2)随机性: 就是要保证总体中的每个个体均有相同的⼏率被抽作样本。
(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较⼤的可信度。
由于个体之间存在差异, 只有观察⼀定数量的个体⽅能体现出其客观规律性。
每个样本的含量越多,可靠性会越⼤,但是例数增加,⼈⼒、物⼒都会发⽣困难,所以应以“⾜够”为准。
需要作“样本例数估计”。
3、什么是两个样本之间的可⽐性?可⽐性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对⽐原则。
实习⼀统计研究⼯作的基本步骤1、什么叫医学统计学?医学统计学与统计学、卫⽣统计学、⽣物统计学有何联系与区别?医学统计学:是运⽤统计学原理和⽅法研究⽣物医学资料的搜索、整理、分析和推断的⼀门学科统计学:是研究数据的收集、整理、分析与推断的科学。
专升本统计复习题汇总目录:第一部分:统计绪论习题一、名解1、总体2、样本3、变量4、同质5、参数6、统计量7、误差8、小概率事件二、选择题1、若要通过样本作统计推断,样本应是A.总体中典型的一部分 B. 总体中任一部分C. 总体中随机抽取的一部分D. 总体中选取的有意义的一部分E. 总体中信息明确的一部分2、统计量A. 是统计总体数据得到的量B. 反映总体统计特征的量C. 是根据总体中的全部数据计算出的统计指标D. 是用参数估计出来的E. 是由样本数据计算出的统计量3、抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.由于抽样产生观察值之间的差别D.样本中每个个体之间的差别E.随机测量误差和过失误差的总称4、教材中提及美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。
有180万儿童参与,约有1/4参与者得到了随机化。
这180万儿童是。
A.目标总体B.研究总体C.1份样本D. 1份随机样本E. 180万份样本上述试验最终肯定了索尔克疫苗的效果。
请问系结论是针对(E)而言。
A.180万儿童B.每个儿童C.所有使用索尔克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/45、概率是描述某随机事件发生的可能性大小的数值,以下对概率的描述哪项是正确的A.其值的大小在0和1之间B.当样本含量n充分大时,我们有理由将频率近似为概率C.随机事件发生的概率小于0.05或0.01时,可认为在一次抽样中它不可能发生D.必然事件发生的概率为1E.其值必须由某一统计量对应的概率分布表中得到6、统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据时间划分的研究对象的全体D.根据人群划分的研究对象的全体E.根据地区划分的研究对象的全体三、是非题1、定量变量、分类变量和有序变量可以相互转换。
2、同质的个体间不存在变异。
《医学统计学》复习资料广西医科大学流行病与卫生统计学教研室2013.1.52012年留学生总复习练习题Part A理论考试题型一、单选题(每题1.5分,共45分。
请在答题卡上将正确答案对应的字母涂黑二、辨析题(每题3分,共15分。
判断对错,并给出理由)三、简答题(每题5分,共10分)四、分析应用题(共30分+10分)Part B练习题一、单选题(每题1.5分,共45分。
请在答题卡上将正确答案对应的字母涂黑)(一)计量资料统计描述1.卫生统计工作的步骤为________。
A.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表2.某病患者5人的潜伏期(天)分别为6,8,5,10,>13,则平均潜伏期为________。
A.5天B.8天C.6~13天D.11天3.算术均数与中位数相比,。
A.抽样误差更大B.不易受极端值的影响C.更充分利用数据信息D.更适用于分布不明及偏态分布资料值为。
4.标准正态分布中,单侧u0.05A.1.96B.0.05C.1.64D.0.0255.统计分析的主要内容有________。
A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表6.统计资料的类型包括________。
A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料7.抽样误差是指________。
A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称8.统计学中所说的总体是指________。
A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体9.描述一组偏态分布资料的变异度,宜用________。