当前位置:文档之家› 医学统计学实验报告

医学统计学实验报告

医学统计学实验报告
医学统计学实验报告

研究题目:

心脏在人体解剖方位上的不对称性与左右手血压的测量值

之间的关系

研究方法和研究条件:

通过对10名男生在相同条件下左右手血压值的统计测量以及数据分析来研究此课题。

1.测试对象必须惯用右手,既不能是俗称的“左撇子”。

2.统一在中午饭过后的静息条件下采集数据。

3.考虑到腕式血压计误差较大,对偏大或偏小的血压测量值应该舍去重测。

4.由于设备以及研究人员的条件限制,无法采集到大样本的数据,结合数据自身特点,将使用t检验和f检验对数据进行分析。

测量数据及分析:

表1 10位男生(惯用右手)在相同条件下左右手收缩压测量的结果

编号左手收缩压平均(

i

x

1

) 右手收缩压平均(

i

x

2

) 差(=

i

x

2

-

i

x

1

)

1 119 125 125 123 117 12

2 124 121 -2 4

2 10

3 108 103 104.67 99 100 100 99.67 -5 25

3 113 107 103 107.67 108 10

4 101 104.3 -3.67 13.47

4 114 112 114 113.3 107 112 113 110.67 -2.6 6.76

5 102 10

6 105 104.3 100 100 106 102 -2.3 5.29

6 10

7 111 109 109 104 109 107 106.67 -2.33 2.33

7 101 114 100 105 94 96 88 92.67 -12.33 152.03

8 108 126 113 115.67 113 113 117 114.3 -1.37 1.88

9 124 117 118 119.67 120 117 119 118.67 -1 1

10 115 115 110 113.3 112 112 110 111.3 -2 4

合计1115.581081.25-34.6 215.76

一、从表1中可以看出,左手的收缩压高于右手的收缩压,即

i

d<0,是否具有统计学意义有待于进一步检验。分析男生左右手收缩

压是否有明显区别。

解:

检验方差齐性:

左手的收缩压均数

1

x=1115.58/10=111.558,右手的收缩压均数2

x=1081.25 /10=108.125。

则:2

1

S=

()

1

2

1

1

ν

∑-x

x

i=42.72

2

2

S=

()

2

2

2

2

ν

∑-x

x

i=76.89

1、建立假设,确定检验水准α。

H:21σ=22σ(两总体方差相同)

2

2

2

1

1

σ≠

H(两总体方差不同)

05

.0

=

α(双侧检验)

2、计算检验统计量。

2

1

2

2

S

S

F==

72

.

42

89

.

76=1.80,

=

1

ν9 ,

2

ν=9

武大医学统计学 期末题

医学统计学试题(A )卷(闭卷) 2009--2010学年第一学期 学号: 姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面得括号里(每小题1分,共30分)。 1、流行病学研究内容得三个层次就是指( ) A.疾病、伤害与健康 B.传染病、寄生虫病与地方病 C.传染性疾病、非传染病疾病与意外伤害 D.疾病分布、危险因素与预防控制措施 E.人群分布、时间分布与地区分布 2、提出由于维生素C缺乏引起身体虚弱得坏血病病因假说并开创了流行病学临床试验先河得医生就是:( ) A、希波克拉底(Hippocrates) B、詹姆士·林德(James Lind) C、约翰斯诺(John Snow) D、路易斯(PCA Louis) E、葛郎特(John Graunt) 3、流行病学研究方法得核心思想就是( ) A.预防为主得思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4、流行病学任务得三个阶段就是( ) A.观察性研究、实验性研究与理论性研究 B.揭示现象、找出原因与提供措施 C.描述分布、提出假设与验证假设 D.整理资料、分析资料与得出结论 E.早期发现、早期诊断与早期恰当治疗 5、关于率与比得描述,下列哪项就是不正确得( ) A.大多数率就是构成比,分子就是分母得一部分 B.比表示分子与分母得数量关系,而不考虑分子与分母所来自得总体如何 C.比得分子就是分母得一部分 D.率也就是比,但比不一定就是率 E.率就是用来描述变量随时间变化得动态指标 6、某单位发生一起食物中毒,为尽快查明原因,调查中应该使用得主要指标就是( ) A.发病率 B.患病率 C.罹患率 D.病死率 E.期间患病率 7、关于发病率得描述,下列哪项就是不正确得( ) A.发病率可用来描述疾病得分布 B.发病率得变化意味着并因因素得变化 C.发病率得高低取决于疾病报告、登记制度以及诊断得正确 D.发病率得准确性取决于疾病报告、登记制度以及诊断得正确 E.发病率可用来探讨发病因素,提出病因假设,评价防治措施效果

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

医学统计学试卷-2

《医学统计学》期末试卷(考查) 姓 名: 学 号: 班 级: ---------------------------------------- 说明:本试卷总计100分,全试卷共3页,完成答卷时间2小时。 ---------------------------------------- 一、判断题(本大题共10题,每题1分,共10分,对的打“√”,错的打“×”) 1、 参数(parameter )是根据总体分布的特征而计算的总体数值,如:总体均数用μ表示。( ) 2、 将一组观察值按大小顺序排列,位次居中的数值即算术均数,统计符号为X 。( ) 3、 标准差可以反映抽样误差的大小。( ) 4、 假设检验有两类错误,其中,拒绝了实际上是成立的0H ,为第一类错误。( ) 5、 两样本均数比较,经t 检验差别有统计学意义时,P 越小,说明两总体均数差别越大。( ) 6、 方差分析后,各总体均数不等,要想分析多个试验组与对照组均数比较,需用SNK-q 检验。( ) 7、 拉丁方设计可用来进行因素间的交互作用分析。( ) 8、 正交表48(42)L ? ,表示最多可观察5个因素,其中1个因素为4水平,4个因素为2水平。( ) 9、 分类资料常用率表示某一事物内部各组成部分所占的比重或分布。( ) 10、有序分类资料不是等级资料( )。 二、填空题(本大题共10题,每题1分,共10分) 1、四分位数间距与 可用来描述偏态分布资料的分布特征。 2、当均数相差很大或单位不同时,比较多个样本资料的离散趋势指标应选 。 3、总体服从正态分布的数值资料,常用 与 来描述其集中趋势与离散趋势。 4、标准正态分布的均数和标准差分别为 。 5、t 曲线是以 为中心,左右对称的一簇曲线。 6、已知一个样本来自正态分布的总体,样本均数为x ,样本含量为n ,总体标准差为σ,试估计总体均数的99%可信区间: 。 7、完全随机化设计的方差分析,根据方差分析的基本思想,可将总变异分解为两部分:

医学统计学(第六版)期末复习

统计 一绪论 第一节: 统计学: 重要作用:在于能够透过偶然现象来探测其规律性。 研究对象:具有不确定性结果的事物。 第二节: 基本内容: 1 .统计设计 2 .数据整理 3.统计描述 4.统计推断 第三节: 统计学的基本概念 同质:根据研究目的所确定的观察单位其性质大致相同。变异:各观察单位存在差异,这种差异称为变异。

变量与数据类型 总体和样本 总体:根据研究目的所确定的同质观察单位的全体。 参数:μ率:μ/π 样本:从研究总体中抽取部分有代表性的观察单位。 统计量:率/ P X X 第二章 第一节频数分布 频数表 1.求全距:max—min=R 2.确定组数:1/10*全距 3.确定组距:

4.确定组限: 第一组下限≤min 最后一组上限≥max 偶数比奇数好 5.确定频数 6.归纳分析 第二节 一、算术均数 适用:正态分布 用于说明一组观察值的平均水平或集中趋势。 (一)直接法(小样本) = / :样本均数 n :样本观察例数 (二)加权法 (大样本) n ∑= X f X =(各组中值*组频数)/n 组中值=1.(本组下限+第二组下限)/2 2.本组下限值+组距/2 二、几何均数 适用:1.等比资料 2.对数正态分布 小样本:n ∑-= X lg lg G 1 X X X

大样本:n ∑-=M 1 X lg f lg G 三、中位数 小样本:奇数:M=X (N+1)/2 偶数:M=1/2[X n /2+X (n/2+1)] 大样本:i f f n 5.0L M M L M ?-+=)( M :中位数; L M :M 所在组的上限; f L :M 所在组之前积累的频数 ;f M :M 所在组的频数; i :组距。 四、百分位数 i f f x%n L P x L x X ?-?+=)( L x :X 所在组的上限; f X :X 所在组之前积累的频数 ;f L :X 所在组的频数; i :组距 第三节变异程度的统计指标 一、极差 极差(R ):即全距=max –min 二、四分位数间距 (越大则数据变异越大。适用于偏态分布。) Q=P 75 - P 25 三、方差

生物统计学考试试卷及答案

考试轮次:2017-2018学年第一学期期末考试试卷编号 考试课程:[120770] 生物统计与实验设计命题负责人曾汉元 适用对象:生物与食品工程学院生物科学专业2015级审查人签字 考核方式:上机考试试卷类型:A卷时量:150分钟总分:100分 注意:答案中要求保留必要的计算和推理过程,全部答案保存为一个Word文档,文件名 为学号最后两位数+姓名。考试结束后不要关机。提交答卷后,请到主机看一下是否提交成功。第1题12分,第3题5分,第10题13分,其余的题各10分。 1、下表为某大学96位男生的体重测定结果(单位:kg),请根据资料分别计算以下指标:(1)算术平均数;(2)几何平均数;(3)中位数;(4)众数;(5)极差;(6)方差;(7)标准差;(8)变异系数;(9)标准误。(10) 绘制各体重分布柱形图。 66 69 64 65 64 66 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 66 68 64 65 71 61 62 69 70 68 65 63 66 65 67 66 74 64 70 64 59 67 66 66 60 66 65 61 61 66 67 68 62 63 70 65 64 66 68 64 63 60 60 66 65 61 61 66 59 66 65 63 58 66 2、已知1000株水稻的株高服从正态分布N(97,3 2),求: (1)株高在94cm以上的概率? (2)株高在90~99cm之间的概率? (3)株高在多少cm之间的中间概率占全体的99%? 3.已知某批30个小麦样品的平均蛋白质含量为14.5%,σ=2.50%,试进行95%置信度下的蛋白质含量的区间估计和点估计。 4、有一大麦杂交组合,F2代的芒性状表型有钩芒、长芒和短芒三种,观察计得其株数依次分别为348、11 5、157,试检验其比率是否符合9:3:4的理论比率。 5、某医院用某种中药治疗7例再生障碍性贫血患者,现将血红蛋白含量(g/L)变化的数据列在下面,假定资料满足各种假设测验所要求的前提条件,问:治疗前后之间的差别有无显著性意义? 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白含量65 75 50 76 65 72 68 治疗后血红蛋白含量82 112 125 85 80 105 128

《医学统计学》期末模拟考试题(四)

《医学统计学》期末模拟考试题(四) 一、是非题(每题1分,共20分) 1. 预试验的样本标准差s越小,所需样本含量越大。() 2. 等级相关系数的大小不可以反映两个现象间关系的密切程度。() 3. 在配对资料秩和检验中,两组数据统一从小到大编秩次。() 4. 对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可直接作χ2检验。() 5. 总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。() 6. 双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。() 7. 随机区组方差分析中,只有当区组间差别的F检验结果P>0.05时,处理组间差别的F检验才是真正有意义的。() 8. 完全随机设计资料方差分析中要求各组均数相差不大。() 9. 两次t检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次P<0.05,就表明前者两样本均数差别大,后者两样本均数相差小。() 10. 如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组SS+误差SS等于后者的组内SS。() 11. 两分类Logistic回归模型的一般定义中,因变量(Y)是0~1变量。()

12. 作两样本均数差别的比较,当P<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。()<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。() 13. 方差分析的目的是分析各组总体方差是否不同。() 14. 在两组资料比较的秩和检验中,T值在界值范围内则P值小于相应的概率。()值在界值范围内则P值小于相应的概率。() 15. 无论什么资料,秩和检验的检验效率均低于t检验。()检验。() 16. 分类资料的相关分析中,检验的P值越小,说明两变量的关联性越强。() 17. 析因设计既可以研究各因素的主效应作用,又可以研究各因素间的交互作用。( ) 18. 当Logistic回归系数为正值时,说明该因素是保护因素;为负值时,说明该因素是危险因素。() 19. 常见病是指发病率高的疾病。( ) 20. 用某新药治疗高血压病,治疗前与治疗后病人的收缩压之差的平均数,经t检验,P<0.01。按a=0.05水准,可以认为该药治疗高血压病有效,可以推广应用。( ) 二、选择题(每题1分,共20分) 1.多重回归中要很好地考虑各因素的交互作用,最好选用________。 a. 最优子集法 b. 逐步法 c. 前进法 d. 后退法 e. 强制法 2.t r

医学统计学论文

医学统计学论文 【摘要】大学生是当今社会中的新鲜血液,是新生代的力量。当代大学生的道德素质的层次会直接左右我们的身心健康水平,同时也影响到社会的前进发展。对于当代大学生道德现状的分析调查可以直接的反映出当今社会所存在的问题。大学生的道德取向则是一个社会道德的风向标。所以,提高当代大学生道德素质是当今社会刻不容缓的问题,同时对于社会主义现代化建设也有很重要的意义。本文基于调查问卷所得出的严谨数据,对学校内的大学生道德现状进行客观分析,并得出相应数据。 一、调查目的 1了解现在大学生的社会道德水平。 2关注大学生的发展,以总结现大学生存在的问题。 3分析原因,找到相关的原因。 二、调查设计 1调查对象:郑州大学继续教育学院 2调查时间:2016年9月—2016年10月 3调查方法:采用问卷调查(问卷共30题) 4问卷:发放出书面问卷200份,回收问卷179份 三、数据分析 数据经整理后,采用SPSS17.0统计软件包录入数据并运用独立样本t检验、方差分析和卡方检验进行数据分析。 四、影响因素的分析 为了能更好的来参照男女性别以及年级的不同,从而对调查问卷涉及的问题所给出的不同回答,我们做了诸多的关于性别差异,年纪差异的数据分析。其中也包括了T检验,交叉表等形式,当然,对于道德素质的选材,我们也没有一个硬性的指标来衡量乃至划分层次的高低。一方面,这给我们的调查统计造成了难以精准的障碍,另一方面,在我们的论文阐述中也不易找到相似的文献资料供以参考。尽管有这些不可避免的问题存在,我们小组还是尽量在数据统计分析出的结果中找到相关性。 1,年级差异对道德水平的影响 针对我们调查问卷主要涉及大学生群体的三个年级、大一、大二、大三,我们采用了不同的交叉表等形式来进行分析。

生物统计学期末复习题库及答案

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A. 正态分布的算术平均数和几何平均数相等. B. 正态分布的算术平均数和中位数相等. C. 正态分布的中位数和几何平均数相等. D. 正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a ,其标准差( D )。 A. 扩大√a 倍 B.扩大a 倍 C.扩大a 2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是( C )。 A. 标准差 B.方差 C.变异系数 D.平均数 第三章 12 2--∑∑n n x x )(

医学统计学01护理学(本科)期末考试试卷A卷

山东中医药大学 专业 年级(本科) 《医学统计学01》期末考试试卷(A 卷) 姓 名: 学 号: 班 级: 考试时间:2010.6 补(重)考:(是、否) 题号 一 二 三 四 五 六 七 八 总分 核分人 得分 ---------------------------------------- 说明:本试卷总计100分,全试卷共3页,完成答卷时间90分钟。 ---------------------------------------- 一、单项选择题(本大题共5题,每题2分,共10分) 1、某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下: 年龄(岁) 10~ 20~ 30~ 40~ 50~ 60~ 人数 6 40 50 85 20 1 为了形象表达该资料,适合选用:() A 、线图 B 条图 C 直方图 D 圆图 2、成组设计的两样本比较的秩和检验,其检验统计量是( )。 A 、 以例数较小者为 B 、以例数较大者为 C 、以秩和较小者为 D 、以秩和较大者为。 3、当组数等于 2 时,对于同一资料,方差分析与 t 检验的关系是____ 。 A .完全等价且 F=t B.方差分析结果更准确 C.t 检验结果更准确 D.完全等价且 t 2=F 4、Poisson 分布独有的特征是______。 A. 离散型分布 B. 参数是总体均数 C. 方差等于均数 D. 当样本较小时是偏倚分布 5、甲、乙两个医院某传染病各型治愈率 病 型 患者数 治愈率(%) 甲 乙 甲 乙 普通型 300 100 60.0 65.0 重 型 100 300 40.0 45.0 暴发型 100 100 20.0 25.0 合 计 500 500 48.0 45.0 由于各型疾病的人数在两个医院的内部构成不同,从内部看,乙医院各型治愈率都高于甲医院,但根据栏的结果恰好相反,纠正这种矛盾现象的统计方法是:() A 、重新计算,多保留几位小数 B 、对率进行标准化 C 、对各医院分别求平均 D 、增大样本含量,重新计算 得分 阅卷人 (签全名)

南医大医学统计学期末题目

1.下列变量中,不属于数值变量的是____ A .坐高 B .胸围 C .血型 D .身高 2.正态分布曲线下,横轴上从均数到(μ + 1.96σ)的面积为:_____ A .95% B .45% C .47.5% D .90% 3.5人的血清滴度为:1:2,1:4,1:8,1:16,1:32,平均滴度为_____ A .1:8 B .1:lg8 C .lg (1/8) D .1:12.4 4.为了比较一组乳腺癌患者化疗后血清肌酐和血清尿素氮两指标的变异程度,可选用____ A. 标准差 B. 标准误 C. 变异系数 D. 极差 5.在同一总体随机抽样,其他条件不变,样本含量越大,则_____ A. 样本标准差越大 B. 样本标准差越小 C. 总体均数的95%可性区间越窄 D. 总体均数的95%可性区间越宽 6.连续性变量x 呈偏态分布,从该总体中反复随机抽样,随样本含量n 增大,下列哪个选项将趋向正态分布_____ A. x x μ σ- B. C. x x x s - D. x s μ- 7.下面关于标准误的四种说法中,哪一种最不正确?________ A. 标准误是样本统计量的标准差 B. 标准误反映重复试验准确度的高低 C. 标准误反映总体参数的波动大小 D. 标准误反映抽样误差的大小 8.统计推断的主要内容为_____ A. 统计描述与统计图表 B. 参数估计和假设检验 C. 区间估计和点估计 D. 统计预测与统计控制 9. 有两个独立随机样本,样本含量分别为n 1和n 2,在进行成组设计资料的t σ μ -x

检验时,自由度是_______ A .n 1+ n 2 B .(n 1+ n 2)-1 C .(n 1-1)+( n 2-1)-1 D .(n 1-1)+( n 2-1) 10.样本均数比较的t 检验,差别有统计学意义时,P 值越小说明______ A .两样本均数差别越大 B .越有理由认为两总体均数不同 C .两总体均数差别越大 D .越有理由认为两样本均数不同 11.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小_______ A. α=0.05 B. α=0.01 C. α=0.10 D. α=0.20 12. 各观察值均加(或减)同一数后,_____ A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均改变 D.两者均不变 13. 在假设检验中,P 值和α的关系为 _______ A. P 值越大,α值就越大 B. P 值越大,α值就越小 C. P 值和α值由研究者事先设定 D. P 值与α值的大小无关 14 . 作两均数比较,已知n 1、n 2均小于30,总体方差不齐且分布呈极度偏态,宜用______ A. t 检验 B. 秩和检验 C. F 检验 D. 2χ检验 15. 三个率的比较的卡方检验,P 值小于0.01,则结论为_____ A.三个总体率均不相等; B.三个样本率均不相等; C.三个总体率之间肯定不等或不全相等; D.三个总体率之间不等或不全相等。 16.配对设计的目的是_____ A.提高测量精度 B.操作方便 C.为使用t 检验 D.提高组间可比性 17 . 从文献中得到同类研究的两个率比较的四格表资料,其2 χ检验结果为:甲 文 ) 1(01.02χχ>,乙文 2 ) 1(05.02χχ>,可认为______ A. 两文结果有矛盾 B.两文结果基本一致 C.甲文结果更可信 D.乙文结果更可信

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

医学统计学期末考试模拟题(三)

《医学统计学》期末模拟考试题(三)一.是非题(每题1分,共20分)1.评价某人的某项指标是否正常,所用的范围是。()t2.配对资料若用成组检验处理,就降低了统计效率。() 3.因为两类错误的存在,所以不能凭假设检验的结果下结论。() 4.随机区组设计的区组变异和误差两部分相当于完全随机设计方差分析的组内变异。()P5.抗体滴度资料经对数转换后可做方差分析,若方差分析得<0.05,则可认为实测数据的各总体算术均数不全相等。() 6.五个百分率的差别的假设检验,>,可认为各组总体率都不相同。() ZZZ4.在两样本均数比较的检验中,若≥,则在α=0.05水平上可认为两总体均数不等。0.05()P5.在t检验中,若拒绝H, 值越小,则说明两总体均数差别越大。()06.对三个地区 血型构成(A、B、O、AB型),作抽样调查后比较,若有一个 理论频数小于5大于1且n>40,必须作校正检验。() 7.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。() 8.Ⅱ期临床试验是指采用随机盲法对照实验,评价新药的有效性及安全性,推荐临床给药剂量。()9.临床试验中,为了避免人为主观因素的影响,保证结果的真实性,通常不让受试者及其家属知道他参与这项试验。()10.假定变量X与Y的相关系数r是0.8,P<0.05;变量M与N的相关系数r为-0.9,P<0.05,1122则X与Y的相关密切程度较高。与Y的相关系数r是0.8,P<0.05;变量M与N

的相关系11数r为-0.9,P<0.05,则X与Y的相关密切程度较 高。()2211.临床试验必须符合《赫尔辛基宣言》和国际医 学科学组织委员会颁布的《人体生物医学研究国际道德指南》 的道德原则。() 12.当直线相关系数r=0时,说明变量之 间不存在任何相关关系。=0时,说明变量之间不存在任何相 关关系。() 13.偏回归系数表示在除X以外的自变量固定 不变的条件下,X每改变一个单位的平均变ii化。以外的自变 量固定不变的条件下,X每改变一个单位的平均变化。()i 14.单盲法是让病人知道自己在实验组或对照组,但不知道用 什么处理。() 15.重复原则是指少选择样本例数。()16.越小,所需样本含量越大。() 17.在相同条件下完全 随机设计比随机区组设计更节约样本含量。() 18.配对符号 秩和检验中,有差值绝对值相等时,可不计算平均秩次。()19.非参数统计的检验效能总是低于参数检验。() nTnTT20.两样本比较的秩和检验,现=15,=153,=10,=126,则 检验统计量=126。()1122二.选择题(每题1分,共20分)1.一种新药可以控制某病,延长寿命,但不能治愈其病,如果 某地采用该药则该地。a.该病发病率将增加 b.该病 发病率将减少c.该病患病率将增加 d.该病患病率将减少e.以上都不对2.用触诊和X摄片对100名妇女作乳癌检查, 触诊有40名阳性,X摄片有70名阴性,两种方法均阳性者10 名,两种方法检查均为阴性的人数是。 a.20 b.30

武大医学统计学期末题

医学统计学试题(A )卷(闭卷) 2009--2010学年第一学期 学号:姓名: 一、A型题:请从备选答案中选出1个最佳答案并填在后面的括号里(每小题1分,共30分)。 1.流行病学研究内容的三个层次是指() A.疾病、伤害和健康 B.传染病、寄生虫病和地方病 C.传染性疾病、非传染病疾病和意外伤害 D.疾病分布、危险因素和预防控制措施 E.人群分布、时间分布和地区分布 2.提出由于维生素C缺乏引起身体虚弱的坏血病病因假说并开创了流行病学临床试验先河的医生是:() A.希波克拉底(Hippocrates) B.詹姆士·林德(James Lind) C.约翰斯诺(John Snow) D.路易斯(PCA Louis) E.葛郎特(John Graunt) 3.流行病学研究方法的核心思想是() A.预防为主的思想 B.研究对象为人群 C.对比思想 D.社会医学观念 E.生态学思想 4.流行病学任务的三个阶段是() A.观察性研究、实验性研究和理论性研究 B.揭示现象、找出原因和提供措施 C.描述分布、提出假设和验证假设 D.整理资料、分析资料和得出结论 E.早期发现、早期诊断和早期恰当治疗 5.关于率和比的描述,下列哪项是不正确的() A.大多数率是构成比,分子是分母的一部分 B.比表示分子和分母的数量关系,而不考虑分子和分母所来自的总体如何C.比的分子是分母的一部分 D.率也是比,但比不一定是率 E.率是用来描述变量随时间变化的动态指标 6.某单位发生一起食物中毒,为尽快查明原因,调查中应该使用的主要指标是() A.发病率 B.患病率C.罹患率D.病死率E.期间患病率 7.关于发病率的描述,下列哪项是不正确的() A.发病率可用来描述疾病的分布

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对为什么如果是你,用什么 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么你的设计是什么 6一型错误和二型错误的区别和联系 7什么是抽样误差举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)

3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况列出应用条件和公式 3. 数值资料的统计描述指标公式 4. 多元回归模型的基本形式参数含义回归效果的评价 5. 什么叫截尾值产生原因举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议若不符合卡方检验的应用条件,你又有什么建议他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别

医学统计学问答题(含答案)

简答题 0. 算术均数、几何均数和中位数各有什么适用条件? 答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。 (2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。 (3)中位数:适用各种类型的资料,尤其以下情况: A 资料分布呈明显偏态; B 资料一端或两端存在不确定数值(开口资料或无界资料); C 资料分布不明。 1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么? (1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势 (2)S 为标准差,说明正态分布或近似正态分布的离散趋势 (3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。 2.试述正态分布、标准正态分布的联系和区别。 正态分布 标准正态分布

原始值X无需转换作u=(X-μ)/σ转换 分布类型对称对称 集中趋势μμ=0 均数与中位数的关系μ=Mμ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。 3.说明频数分布表的用途。 1)描述频数分布的类型2)描述频数分布的特征3)便于发现一些特大或特小的可疑值4)便于进一步做统计分析和处理 4.变异系数的用途是什么? 多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。 5.试述正态分布的面积分布规律。 (1)X轴与正态曲线所夹的面积恒等于1或100%;

医学统计学SPSS生存分析实例

将生存时间按从小到大顺序排列如下: 表1 BCG治疗组生存情况 *死亡=1;删失=0

*死亡=1;删失=0 按上述二表将数据输入SPSS软件,其中数据编号为i,列(1)即时间为t,列(3)即生存结局为status,表1为group1,表2为group2。 选择Analyze中的Survival里的Kaplan-Meier分析,将Time,Status,Factor依次选定,option 和Compare Factor依次设定完成后,得到输出结果,结果分析如下: Survival Table中: 1为BCG治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。2为药物与BCG结合治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。 Overall Comparisons

Log Rank (Mantel-Cox) .057 1 .811 Breslow (Generalized Wilcoxon) .658 1 .417 Tarone-Ware .336 1 .562 Test of equality of survival distributions for the different levels of group. 两组生存率的log-rank 检验 H 0:两种疗法患者生存率相同 H 1:两种疗法患者的生存率不同 α =0.05 采用SPSS 软件对两组生存率进行检验,得到上面Overall Comparisons 表,其中第一行为LogRank 检验结果。即X 2=0.057,P=0.811。按α=0.05水准,不拒绝H 0,还不能认为用BCG 疗法和用药物与BCG 结合疗法治疗黑色素瘤患者的生存率有差别。 生存曲线如上图所示,其中生存时间为横轴,生存率为纵轴。

《生物统计学》试卷与参考答案

《生物统计学》试卷 一.判断题(正确的打“√”错误的打“×”,每题2分,共10分) 1. 分组时,组距和组数成反比。( ) 2. 粮食总产量属于离散型数据。 ( ) 3. 样本标准差的数学期望是总体标准差。 ( ) 4. F 分布的概率密度曲线是对称曲线。 ( ) 5. 在配对数据资料用t 检验比较时,若对数n=13,则查t 表的自由度为12。 ( ) 二. 选择题(每题2分,共10分) 1. x ~N (1,9),x 1,x 2,…,x 9是X 的样本,则有( ) A. 31 -x ~N (0,1) B.11-x ~N (0,1) C.91-x ~N (0,1) D.以上答案均不正确 2. 假定我国和美国的居民年龄的方差相同。现在各自用重复抽样方法抽取本国人口的1% 计算平均年龄,则平均年龄的标准误( ) A.两者相等 B.前者比后者大 C.前者比后者小 D.不能确定大小 3. 设容量为16人的简单随机样本,平均完成工作需时13分钟。已知总体标准差为3分钟。若想对完成工作所需时间总体构造一个90%置信区间,则( ) A.应用标准正态概率表查出u 值 B.应用t 分布表查出t 值 C.应用卡方分布表查出卡方值 D.应用F 分布表查出F 值 4. 1-α是( ) A.置信限 B.置信区间 C.置信距 D.置信水平 5. 如检验k (k=3)个样本方差s i 2 (i=1,2,3)是否来源于方差相等的总体,这种检验在统计上称为( )。 A.方差的齐性检验 B. t 检验 C. F 检验 D. u 检验 三. 填空题(每题1分,共10分) 1、统计学的3个基本特点: 、 、 。 2、统计资料的特点: 、 、 。 3、统计资料可分为 、和 、两类,后者又可分为 、和 。 4、统计表由 、 、 、 、 组成,通常分为 和 。 5、显著性检验又称 ,是统计学的核心内容。 6、随机实验的每一个可能的结果称为 。 7、通常把α称为显著性水平或置信系数,常用显著性水平有两个,它们是 和 。 8、数据资料按其性质不同各分为 资料和 资料两种。 9、小概率事件原理判定的基础是 。 10、试验设计的三大基本原则是设置重复、 和 。 四、名词解释(每题4分,共40分) 1、样本: 2、随机抽样: 3、总体: 4、随机误差: 5、参数: 6、概率事件原理: 7、平均数: 8、准确性: 密 线 封 层次 报读学校 专业 姓名

武大医学统计学期末复习总结(名解和简答)

医学统计学期末复习总结 名词解释 参数Patameter:是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可以通过随机抽样抽取具有代表性的样本,用算得的样本统计量估计未知的总体参数。 统计量statistic:是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量实在总体参数附近波动的随机变量。 系统误差systematic error:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是克制的或可能掌握的。 随机误差random error:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。I型错误type I error:拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α来表示。 II型错误type II error:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误,其概率大小用β来表示。 P值P-value:在H0成立的前提下,用样本数据获得的样本统计量及比样本统计量总计更极端的区间下的面积。 置信区间confidence bound / confidence interval, CI:按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。 多重共线性Multicollinearity:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。 哑变量dummy variable:如果是多分类指标,假定有g类,则用g-1个取值为0,1或-1的变量,称为哑变量。 偏相关系数partial correletion coefficient:表示在一组变量中,任一两个变量在其它变量固定不变时,他们之间相关的密切程度和方向。或者说,扣除其它变量对它们的影响后,两个变量之间的线性相关情况。 决定系数coefficient of determination:回归平方与总平方和之比,其数值反映了回归贡献的相对程度,其值约接近1,说明模型对数据的拟合程度越好。 随机对照试验Randomized Controlled Trial,RCT:将研究对象随机分组,对不同组实施不同的干预,以对照效果的不同。 接受者工作特征曲线receiver operator characteristic,ROC曲线:以不同截断点时的(1-特异度)为横轴,灵敏度为纵轴,作的真阳性率与假阳性率曲线。 简答题: 1. 标准差与标准误的区别与联系。√ 区别:(1)含义不同:①标准差描述个体变量值x之间变异度的大小,S越大,变量值x 越分散;反之变量越集中,均数的代表性就越强;②标准误是描述样本均数之间变异度的大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n关系不同:n增大时,①S-σ(恒定);②标准误减少并趋于0(不存在抽样误差); (3)用途不同:①标准差表示x变异度的大小,计算CV,估计正常值范围,计算标准误

相关主题
文本预览
相关文档 最新文档