医学统计学 孙振球 第十章 统计表与统计图
- 格式:ppt
- 大小:414.50 KB
- 文档页数:54
--- 真谛唯一靠谱的标准就是永久自相切合公卫执业助理医师《医学统计学》指导:统计表统计表与统计图是整理、表达和剖析数字资料的重要工具。
运用统计表可防止冗长的方案表达。
能把相关的数字列在一同,既便于计算比较,又易于发现错误和遗漏。
绘制统计图可使数字资料形象化、平常易懂,并能把资料的变化趋向和各样现象间的关系明确地表示再现,使读者在短时间内获取清晰的印象。
统计图只好表示概数,要想认识正确的数字,仍需看统计表。
统计表统计表可从广义或狭义上看。
广义的统计表包含检查表、登记表、过渡表及表达最后结果的统计表在内。
狭义的统计表是指表达统计结果的统计表。
下边简述狭义统计表的构造和编制。
一、统计表的组成从统计表的外形看,可分为标题、标目、线条和数字等;从表的内容上看,又可分为主辞和宾辞两部分。
统计表中被说明的事物称为表的主辞,用来说明主辞的统计指标称为表的宾辞,统计表的基本格式以下:表号标题(包含何时、何地、何事)备注:--- 真谛唯一靠谱的标准就是永久自相切合比如:表 2.1 是某医院用五种检查方法,对上消化道恶性肿瘤的检出率。
此中五种检查方法是统计表的主辞,放在表的左边横标目地点:而检查数、检出数和检出率是统计指标,为宾辞,放在表的右边,即纵标目地点。
一张设计比较好的统计表,将主辞和宾辞联合起来,可读成一句完好而通畅的话。
如:胃镜检查 48 例,检出 44 例,检出率为 91.7%等。
表 2.1 各样方法对上消化道恶性肿瘤检出率治愈3,79580.1 好转 67614.2 无变化 .3 转他院 180.4 死亡 501.0 共计 4,745100.0(三)复合表主辞按两个或两个以上标记联合起来分组的统计表称为复合表。
如:表2.3 是将心绞痛病人按病情严重程度及疗效联合起来分组的,故为复合表。
表 2.3 某医院用“725―1治”疗心绞痛病人的疗效,表 2.5 两组病例(各 34 例)主要症状与体征恢复正常均匀日数症状与体征例数恢复正常的均匀日数化疗组归并组化疗组归并组相差咳嗽咳痰嘲热 81140.026.613.4 肺部湿罗音 7963.130.133.0 血沉大于20 毫米痰结核菌阳性。
一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
《医学统计学》习题解答(最佳选择题和简答题)孙振球主编.医学统计学习题解答. 第2版. 北京:人民卫生出版社2005目录第二章计量资料的统计描述 (2)第三章总体均数的估计与假设检验 (3)第四章多个样本均数比较的方差分析 (6)第五章计数资料的统计描述 (7)第六章二项分布与Poisson分布 (9)第七章χ2检验 (11)第八章秩和检验 (13)第九章回归与相关 (14)第十章统计表与统计图 (17)第十一章多因素试验资料的方差分析 (19)第十二章重复测量设计资料的方差分析 (19)第十五章多元线性回归分析 (20)第十六章logistic回归分析 (22)第十七章生存分析 (23)第二十五章医学科学研究设计概述 (26)第二十六章观察性研究设计 (26)第二十七章实验研究设计 (28)第二十七章临床试验研究设计 (29)第二章 计量资料的统计描述(注:题号上有“方框” 的简答题为基本概念,下同)第三章总体均数的估计与假设检验简答题:第四章多个样本均数比较的方差分析简答题:第五章计数资料的统计描述简答题:第六章二项分布与Poisson分布简答题:第七章χ2检验简答题:1. 说明χ2检验的用途2. 两个样本率比较的u检验与χ2检验有何异同?3. 对于四格表资料,如何正确选用检验方法?4. 说明行×列表资料χ2检验应注意的事项?5. 说明R×C表的分类及其检验方法的选择。
第八章秩和检验简答题:5. 两独立样本比较的Wilcoxon秩和检验,当n1>10或n2-n1>10时用u检验,这时检验是属于参数检验还是非参数检验,为什么?6. 随机区组设计多个样本比较的Friedman M 检验,备择假设H1如何写?为什么?第九章回归与相关简答题:第十章统计表与统计图简答题:5. 统计表与统计图有何联系和区别?6. 茎叶图与频数分布图相比有何区别,有何优点?第十一章多因素试验资料的方差分析一、简答题1. 简述析因试验与正交试验的联系与区别。
《医学统计学》最佳选择题和计算分析题答案教材:孙振球,徐勇勇主编. 医学统计学. 第4版. 北京:人民卫生出版社,2014最佳选择题答案第二章计量资料的统计描述(第20-21页)(1)D (2)C (3)D (4)D (5)C (6)E (7)E (8)D (9)E (10)B第三章总体均数的估计与假设检验(第43-44页)(1)E (2)C (3)E (4)E (5)B (6)E (7)D (8)E (9)D (10)C第四章多个样本均数比较的方差分析(第63-64页)(1)D (2)C (3)D (4)A (5)C (6)A (7)A第五章计数资料的统计描述(第20-21页)(1)B (2)D (3)A (4)A (5)E (6)D (7)C (8)E (9)B (10)D第六章几种离散型变量的分布及其应用(第94页)(1)A (2) 不要求(3) 不要求(4)E (5)不要求(6)不要求第七章c2检验(第112-113页)(1)D (2)C (3)C (4)A (5)不要求(6)A (7)不要求第八章秩转换的非参数检验(第128页)(1)E (2)D (3)D (4)D (5)A (6)C第九章双变量回归与相关(第151-152页)(1)B (2)E (3)C (4)C (5)不要求(6)D (7)B (8) 不要求第十章统计表与统计图(第163-164页)(1)B (2)D (3)B (4)E (5)选项有误 (6)D (7)E (8)D (9)C (10)C 注:第(5)题的选项是(箱式图),但5个选项中没有“箱式图”。
第十九章生存分析(第300页)(1)A (2) E (3)B (4)D (5)D第三十四章观察性研究设计(第544-545页)(1)C (2)C (3)C (4)C (5)D (6)C (7)A (8)D (9)D (10)A (11)E (12)E (13)B (14)A (15)B第三十六章试验研究设计(第582页)(1)D (2)D (3)D (4)E (5)A (6)D第三十七章临床试验研究设计(第603-604页)(1)C (2)C (3)C (4)D计算分析题参考答案第二章计量资料的统计描述计算分析题(P21)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
统计图定义与作用定义统计图是利用几何图形、符号、线条、颜色等视觉元素来表示统计数据的一种图形化表达方式。
作用使数据更直观、易于理解,便于比较和分析数据间的关系和趋势。
用条形的长度表示数据的大小,适用于表示离散型数据。
条形图用折线的升降表示数据的变化趋势,适用于表示连续性数据。
折线图用扇形的面积表示部分在总体中所占的比例,适用于表示数据的构成情况。
饼图用点的分布表示两个变量之间的关系,适用于表示两个变量之间的相关性和分布规律。
散点图常见类型及其特点适用场景与选择依据适用场景医学研究中常用于描述数据的分布规律、比较不同组别数据的差异、分析数据间的相关性和趋势等。
选择依据根据数据类型、数据特点和分析目的选择合适的统计图类型。
例如,对于离散型数据,可以选择条形图或饼图;对于连续性数据,可以选择折线图或散点图。
同时,还需要考虑图形的直观性、易读性和美观性等因素。
直方图与条形图直方图用于展示连续变量的分布情况,横轴为变量分组,纵轴为频数或频率。
在医学研究中,常用于描述身高、体重等连续变量的分布。
条形图用于比较不同分类变量之间的差异,横轴为分类变量,纵轴为统计量(如均数、百分比等)。
在医学研究中,常用于比较不同组别(如性别、疾病类型等)之间的差异。
折线图与散点图折线图用于展示一个或多个变量随时间或其他连续变量的变化趋势,通过连接各数据点形成折线。
在医学研究中,常用于描述疾病发病率、死亡率等随时间的变化趋势。
散点图用于展示两个连续变量之间的关系,每个点代表一个观测值,横轴和纵轴分别为两个变量。
在医学研究中,常用于探索两个指标(如身高与体重、血压与年龄等)之间的相关性。
箱线图与小提琴图箱线图用于展示一组数据的分布情况,包括中位数、四分位数、异常值等。
在医学研究中,常用于比较不同组别数据的分布情况,如不同治疗方法下的疗效比较。
小提琴图结合了箱线图和核密度估计的优点,既能展示数据的分布形状,又能展示数据的概率密度。
在医学研究中,常用于更细致地比较不同组别数据的分布情况。
11-多因素实验资料的方差分析11-3(1)本题为4个处理组的2×2析因涉及,因分成3天进行,若将每天的实验结果设为一个区组,先进行随机区组的方差分析:方差分析表1变异来源df SS MS F Sig.总变异11 818.369区组间 2 3.762 1.881 .230 .801处理组间 3 765.529 255.176 31.196 .000误差 6 49.078 8.180从上表可以看出,各区组间差异无统计学意义,即各天的实验结果间无差异。
(3)依据完全随机设计析因试验方法进行方差分析方差齐性检验表F df1 df2 Sig.1.429 3 8 0.304P值大于0.05,尚不能认为方差不齐。
方差分析表2变异来源df SS MS F Sig.总变异11 818.37试样处理方式(A) 1 716.11 716.11 108.42 0.000试样重量(B) 1 36.40 36.40 5.51 0.047AB 1 13.02 13.02 1.97 0.198误差8 52.84 6.605结局:可以认为高锰酸盐处理及试样重量均会对甘蓝叶核黄素浓度测定产生影响,尚不能认为高猛酸盐及试样重量的交互作用会对甘蓝叶核黄素浓度测量有影响。
11-4假定不存在高阶交互作用,仅对A、B、C、D、E5个因素的主效应进行分析,采用正交设计的方差分析法:正交设计的方差分析变异来源df SS MS F Sig.总变异15 3495.366A 1 540.911 540.911 21.714 .001B 1 1743.689 1743.689 69.998 .000C 1 787.223 787.223 31.602 .000D 1 82.038 82.038 3.293 .100E 1 92.400 92.400 3.709 .083误差10 249.104 24.910从上表可以看出,A、B、C三个因素的主效应有统计学意义(P<0.05),即A、B、C三个参数对高频呼吸机的通气量有影响。