生物医学研究统计方法 第15章 样本含量估计思考与练习参考答案
- 格式:doc
- 大小:322.50 KB
- 文档页数:8
《生物统计学》习题集总参考答案第一章绪论一、名词解释1、总体:根据研究目的确定的研究对象的全体称为总体。
2、个体:总体中的一个研究单位称为个体。
3、样本:总体的一部分称为样本。
4、样本含量:样本中所包含的个体数目称为样本含量(容量)或大小。
5、随机样本:从总体中随机抽取的样本称为随机样本,而随机抽取是指总体中的每一个个体都有同等的机会被抽取组成样本。
6、参数:由总体计算的特征数叫参数。
7、统计量:由样本计算的特征数叫统计量。
8、随机误差:也叫抽样误差,是由于许多无法控制的内在和外在的偶然因素所造成,带有偶然性质,影响试验的精确性。
9、系统误差:也叫片面误差,是由于一些能控制但未加控制的因素造成的,其影响试验的准确性。
10、准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与真值接近的程度。
11、精确性:也叫精确度,指调查或试验研究中同一试验指标或性状的重复观测值彼此接近的程度。
二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?答:(1)生物统计是数理统计的原理和方法在生物科学研究中的应用,是一门应用数学。
(2)生物统计在畜牧、水产科学研究中的作用主要体现在两个方面:一是提供试验或调查设计的方法,二是提供整理、分析资料的方法。
2、统计分析的两个特点是什么?答:统计分析的两个特点是:①通过样本来推断总体。
②有很大的可靠性但也有一定的错误率。
3、如何提高试验的准确性与精确性?答:在调查或试验中应严格按照调查或试验计划进行,准确地进行观察记载,力求避免认为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试畜禽的初始条件如品种、性别、年龄、健康状况、饲养条件、管理措施等尽量控制一致,并通过合理的调查或试验设计,努力提高试验的准确性和精确性。
4、如何控制、降低随机误差,避免系统误差?答:随机误差是由于一些无法控制的偶然因素造成的,难以消除,只能尽量控制和降低;主要是试验动物的初始条件、饲养条件、管理措施等在试验中要力求一致,尽量降低差异。
第一章绪论1.举例说明总体和样本的概念。
研究人员通常需要了解和研究某一类个体,这个类就是总体。
总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。
但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。
例如在一项关于 2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地 2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取 2000人,分别测的其红细胞数,组成样本,其样本含量为 2000人。
2.简述误差的概念。
误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。
随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。
3.举例说明参数和统计量的概念。
某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。
根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。
统计量是研究人员能够知道的,而参数是他们想知道的。
一般情况下,这些参数是难以测定的,仅能够根据样本估计。
显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。
4.简述小概率事件原理。
当某事件发生的概率小于或等于 0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。
第二章调查研究设计1.调查研究主要特点是什么?调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。
第1章绪论案例辨析及参考答案案例1-1某研究者的论文题目为“大学生身心健康状况及其影响因素研究”,以某地职业技术学院理、工、文、医学生(三年制)为研究对象,理、工、文、医学生分别挑选了60、38、19和46人,以问卷方式调查每位学生的一般健康状况、焦虑程度、抑郁程度等。
得出的结论是:“大学生身心健康状况不容乐观,学业问题、就业压力、身体状况差、人际交往不良、社会支持不力为主要影响因素”。
请问其结论合理吗?为什么?应该如何?案例辨析①样本不能代表总体。
总体是“大学生”,而样本仅为某地三年制职业技术学院学生;②社会学调查的样本含量显得不足;③“理、工、文、医学生分别挑选……”这种说法中隐含人为“挑选"的意思,不符合统计学要求.正确做法应在论文的题目中明确调查的时间范围和地点,还应给“大学生"下一个明确的定义,以便确定此次调查的“总体”;对“大学生身心健康状况”可能有影响的因素很多,应结合具体问题拟定出少数最可能有影响的因素(如学科、在学年限等)进行分层随机抽样,以保证样本有较好的代表性;还应根据已知条件找到估计样本含量的计算公式,不可随意确定各学科仅调查几十人;当然,调查表中项目的设置也是十分重要的,此处从略。
案例1—2两种药用于同一种病,A药治疗5例,4例好转;B药治疗50例,36例好转。
结论是:A药优于B药.请问其结论合理吗?为什么?应该如何?案例辨析①A药样本仅5例,样本含量太少;②得出“A药优于B药”没有交待是否采用了统计学推断方法,若用目测法得出结论,则结论没有说服力;③未明确研究目的和研究结果将被使用的范围.正确做法①应明确研究目的和研究结果将被使用的范围,若是个别研究者或临床医生想了解这两种药的大致疗效,属于小规模的临床观察,其结论仅供少数人在今后临床实践中参考,其样本含量可能不需要很大,因为观察指标是定性的(有效、无效),一般来说,每个药物组也需要几十例(以不少于20例为宜);若属于新药的Ⅱ期临床试验,那就要严格按有关规定,比较准确地估计出所需要的样本含量,不仅如此,还有很多严格的要求,详见本书中临床试验设计一章;②从明确定义的总体中随机抽样进行实验研究,得到的实验结果不能仅凭数据大小作出判断,应进行假设检验,以提高结论的可信度.案例1-3某研究者为了探讨原发性高血压患者肾小管早期损害的监控指标,选取尿常规、蛋白定性检查阴性,血肌酐、尿素氮均在正常范围内的原发性高血压患者74例作为病例组,其中男43例,女31例,平均年龄61岁(40 73岁)。
第15章样本含量估计案例辨析及参考答案案例15-1某研究者为了证明A(HP-1000型超声诊断仪)、B(研究者自制的成像系统)两台仪器测定的结果无差别,作了如下的实验设计:选一个健康人作为受试对象,用A、B 两台仪器前后两次(间隔为1个月)对此人分别重复测定4次,其数据格式如教材表15-9所示。
观测的定量指标分别是:①二尖瓣前叶EC幅度;②左室后壁运动幅度;③ R-R间期。
数据处理方法是:每个指标下有4组数据,既作了方差齐性检验,又作了配对比较的t 检验,P值均大于0.1。
结论:两台仪器的测定结果无差别,可用自制的成像系统取代费用很高的同类进口仪器。
教材表15-9 对一名健康人某一项指标(如二尖瓣前叶EC幅度)测定的结果重复测定顺序号二尖瓣前叶EC幅度A仪器第1次测B仪器第1次测A仪器第2次测B仪器第2次测1 X X X X2 X X X X3 X X X X4 X X X X注:“X”代表各次测定的具体值。
请辨析下列问题:(1)根据研究者的实验实施情况及对实验数据的处理,判断研究者采用的实验设计有何不妥?你认为应该如何设计?(2)按照你的设计,如何确定应选取对象的数量?案例辨析(1)根据研究者的实验实施情况及对实验数据的处理(既作了方差齐性检验,又作了配对比较的t检验),可以判断研究者自己认为其所采用的实验设计类型为配对设计,即对同一个指标,A、B两台仪器每一次测定的结果配成一对。
但是,采用配对设计时,不能考察受试对象接受A、B两台仪器对各项指标的测量的先后顺序对测量结果有无影响。
本研究涉及3个因素,其中1个是实验因素(即仪器),另外两个是区组因素(即测定时间和受试对象),因此,为了实现研究者的实验目的,最好采用交叉设计来安排实验。
采用交叉设计时,选足够数量的健康人,将其随机分为两组,其中一组先接受A 仪器测量后接受B 仪器测量,另一组则按相反顺序接受测量。
(2)研究者在实施实验时仅选一个健康人,用A 、B 两台仪器前后两次(间隔为1个月)对此人分别重复测定4次,从研究者的角度来看,他认为每次每台仪器都作了4次独立重复实验,其实不然。
生物统计学习题集参考答案Document number【980KGB-6898YT-769T8CB-246UT-18GG08】生物统计学习题集参考答案第一章概论一、填空1 变量按其性质可以分为连续变量和非连续变量。
2 样本统计数是总体参数的估计量。
3 生物统计学是研究生命过程中以样本来推断总体的一门学科。
4 生物统计学的基本内容包括_试验设置、统计分析_两大部分。
5 统计学的发展过程经历了古典记录统计学、近代描述统计学现代推断统计学 3个阶段。
6 生物学研究中,一般将样本容量 n大于等于 30称为大样本。
7 试验误差可以分为__随机误差、系统误差两类。
二、判断(-)1 对于有限总体不必用统计推断方法。
(-)2 资料的精确性高,其准确性也一定高。
(+) 3 在试验设计中,随机误差只能减少,而不可能完全消除。
(+)4 统计学上的试验误差,通常指随机误差。
三、名词解释样本:从总体中抽出的若干个体所构成的集合称为样本。
总体:具有相同的个体所构成的集合称为总体。
连续变量:是指在变量范围内可抽出某一范围的所有值。
非连续变量:也称离散型变量,表示变量数列中仅能取得固定数值并且通常是整数。
准确性:也称准确度指在调查或试验中某一试验指标或性状的观测值与真实值接近的程度。
精确性:也称精确度指在调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章试验资料的整理与特征数的计算一、填空1 资料按生物的性状特征可分为___数量性状资料_变量和__变量性状资料_变量。
2 直方图适合于表示__计量、连续变量_资料的次数分布。
3 变量的分布具有两个明显基本特征,即_集中性_和__离散性_。
4 反映变量集中性的特征数是__平均数__,反映变量离散性的特征数是__变异数(标准差)_。
5 样本标准差的计算公式s= √∑(x-x横杆)平方/(n-1)。
二、判断( - ) 1 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。
第15章样本含量估计思考与练习参考答案一、最佳选择题1. 在假设检验中,样本含量的确定(C)。
A.只与Ⅰ类错误概率有关B.只与Ⅱ类错误概率有关C.与、都有关D. 与、都无关E. 只与、有关2. 以下关于检验功效的描述,不正确的是(C)。
A. 假设检验中,若客观上不成立,但根据假设检验的规则,将有大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为,称为检验功效。
B.检验功效受客观事物差异的大小、个体间变异的大小、样本量和值等要素的影响。
C.假设检验的“阴性”结果(>0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。
D.假设检验得出“阴性”结果(>0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。
E.当假设检验出现“阴性”结果(>0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。
3.在调查研究中,计算配对设计均数比较所需样本含量的公式为(A)。
A. B.C. D.E.4. 在调查研究中,计算两样本率比较所需样本含量的公式为(E)。
A. B.C. D.E.5. 有很多人都认为,只要样本含量大于30就可以称其为大样本,可用大样本条件下推导出来的一切公式进行相应的统计分析。
下列说法中(C)最正确。
A.题中所说的条件和结论都正确B.题中所说的条件正确,但结论不正确C.题中所说的条件和结论都不正确D.题中所说的条件不正确,但结论正确E.题中所说的条件和结论正确概率为70%,错误概率为30%6.在研究一个因变量依赖多个自变量变化规律时,估计样本含量非常复杂,有人提供了一个经验估算方法,即样本含量N(即拟观测的个体数目)至少应当是自变量个数的10倍。
下列说法中(B)最正确。
A.此法无任何参考价值B.在没有精确算法时,此法有一定的参考价值C.此法根本不能用D.此法永远是正确的E.此法正确的概率为80%,错误的概率为20%二、思考题1. 决定样本含量的依据有哪些?答:决定样本含量的依据有:①犯Ⅰ类错误的概率,即检验水准。
思考与练习参考答案第1章绪论一、选择题1. 研究中的基本单位是指( D)。
A.样本 B. 全部对象C.影响因素D. 个体E. 总体2. 从总体中抽取样本的目的是( B )。
A.研究样本统计量 B. 由样本统计量推断总体参数C.研究典型案例 D. 研究总体统计量E. 计算统计指标3. 参数是指( B )。
A.参与个体数 B. 描述总体特征的统计指标C.描述样本特征的统计指标 D. 样本的总和 E. 参与变量数4. 下列资料属名义变量的是(E)。
A.白细胞计数B.住院天数C.门急诊就诊人数D.患者的病情分级 E. ABO血型5.关于随机误差下列不正确的是(C)。
A.受测量精密度限制B.无方向性 C. 也称为偏倚D.不可避免 E. 增加样本含量可降低其大小二、名称解释(答案略)1. 变量与随机变量2. 同质与变异3. 总体与样本4. 参数与统计量5. 误差6. 随机事件7. 频率与概率三、思考题1. 生物统计学与其他统计学有什么区别和联系?答:统计学可细分为数理统计学、经济统计学、生物统计学、卫生统计学、医学统计学等,都是关于数据的学问,是从数据中提取信息、知识的一门科学与艺术。
而生物统计学是统计学原理与方法应用于生物学、医学的一门科学,与医学统计学和卫生统计学很相似,其不同之处在于医学统计学侧重于介绍医学研究中的统计学原理与方法,而卫生统计学更侧重于介绍社会、人群健康研究中的统计学原理与方法。
2. 某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?答:不能。
因为,从甲、乙两班分别抽取的10人,测量其身高,得到的分别是甲、乙两班的一个样本。
样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。
即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。
因此,不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断,而应通过统计分析,进行统计推断,才能作出判断。
生物统计学课后习题解答李春喜生物统计学课后习题解答生物统计学是一门研究生物学数据分析和统计推断的学科,它在现代生物学研究中发挥着重要作用。
作为生物统计学的学习者,我们不仅需要掌握基本的统计概念和方法,还需要通过课后习题进行巩固和实践。
本文将对一些典型的生物统计学习题进行解答,帮助您更好地理解和应用生物统计学知识。
一、描述性统计解答1. 样本均值、中位数和众数有何区别?样本均值是指一组数据各个观测值之和除以观测值的个数,它代表了数据的集中趋势。
中位数是将数据按照大小排列后的中间值,它反映了数据的中间位置。
众数是指在一组数据中出现次数最多的数值,它表示数据的主要模式。
2. 什么是标准差?如何计算?标准差是衡量数据离散程度的一种统计量,它表示各个观测值与均值之间的差异程度。
标准差越大,表示数据的离散程度越大。
计算标准差的方法如下:a) 计算每个观测值与均值的差值;b) 将每个差值平方;c) 求平方和;d) 将平方和除以观测值的个数,再开平方。
二、参数估计解答1. 什么是参数估计?请举例说明。
参数估计是根据样本数据对总体参数进行估计的方法。
总体参数是指总体的均值、方差、比例等。
例如,我们想要估计某种药物的治疗成功率,可以通过从总体中取得一部分样本,计算样本中治愈的比例,然后以样本中的比例作为总体治愈成功率的估计值。
2. 什么是置信区间?如何计算?置信区间是用来估计总体参数真实值的范围。
置信区间由一个下限和一个上限组成,表示了总体参数估计值的可能范围。
计算置信区间的方法依赖于参数类型和样本大小,常用的方法有正态分布的置信区间和t分布的置信区间。
三、假设检验解答1. 什么是假设检验?请举例说明。
假设检验是一种统计方法,用于判断样本数据是否支持某个关于总体的假设。
假设检验首先假设一个原始假设(即零假设)和一个备择假设,然后通过计算样本数据得到的统计量和理论分布进行比较,判断是否拒绝原始假设。
例如,我们可以通过假设检验来判断某个新药物的疗效是否显著,原始假设可以是该药物无疗效,备择假设可以是该药物有疗效。
人卫第七版医学统计学课后答案李康、贺佳主编第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D11、E 12、C 13、E 14、A 15、C二、简答题1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。
2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。
统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。
统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。
3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。
4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。
5答系统误差、随机测量误差、抽样误差。
系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。
第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 11、D 12、E 13、E 14、C 15、E二、计算与分析第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A11、E 12、C 13、C 14、B 15、A二、计算与分析2[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。
第15章 样本含量估计思考与练习参考答案一、最佳选择题1. 在假设检验中,样本含量的确定( C )。
A. 只与Ⅰ类错误概率α有关B. 只与Ⅱ类错误概率β有关C. 与α、β都有关D. 与α、β都无关E. 只与α、β有关2. 以下关于检验功效的描述,不正确的是( C )。
A. 假设检验中,若0H 客观上不成立,但根据假设检验的规则,将有β大小的概率错误地得出“差异无统计学意义”的推断结论,这种错误称为Ⅱ类错误,相应地,推断正确的概率为β-1,称为检验功效。
B. 检验功效受客观事物差异的大小、个体间变异的大小、样本量和α值等要素的影响。
C. 假设检验的“阴性”结果(P >0.05)可以作为“总体参数之间的差异无统计学意义”这一结论的证据。
D. 假设检验得出“阴性”结果(P >0.05)是“总体参数之间的差异无统计学意义”这一结论的必要条件而非充分条件。
E. 当假设检验出现“阴性”结果(P >0.05)时,有必要复核样本含量和检验功效是/否偏低,以便正确分析假设检验“阴性”结论的正确性。
3.在调查研究中,计算配对设计均数比较所需样本含量的公式为( A )。
A. 2])([δβαSt t n += B. 2])([2δβαSt t n +⨯= C. 2])([δβαSt t N += D. 2221)())(1(2p p Z Z p p n -+-=βαE. =n 22212211)(])1()1()1(2[p p p p p p Z p p Z --+-+-βα4. 在调查研究中,计算两样本率比较所需样本含量的公式为( E )。
A. 2])([δβαSt t n += B. 2])([2δβαSt t n +⨯= C. 2])([δβαSt t N += D. 2221)())(1(2p p Z Z p p n -+-=βαE. 22212211)(])1()1()1(2[p p p p p p Z p p Z n --+-+-=βα5. 有很多人都认为,只要样本含量大于30就可以称其为大样本,可用大样本条件下推导出来的一切公式进行相应的统计分析。
下列说法中( C )最正确。
A. 题中所说的条件和结论都正确B. 题中所说的条件正确,但结论不正确C. 题中所说的条件和结论都不正确D. 题中所说的条件不正确,但结论正确E. 题中所说的条件和结论正确概率为70%,错误概率为30%6.在研究一个因变量依赖多个自变量变化规律时,估计样本含量非常复杂,有人提供了一个经验估算方法,即样本含量N (即拟观测的个体数目)至少应当是自变量个数的10倍。
下列说法中( B )最正确。
A. 此法无任何参考价值B. 在没有精确算法时,此法有一定的参考价值C. 此法根本不能用D. 此法永远是正确的E. 此法正确的概率为80%,错误的概率为20%二、思考题1. 决定样本含量的依据有哪些?答:决定样本含量的依据有:① 犯Ⅰ类错误的概率α,即检验水准。
② 犯Ⅱ类错误的概率β。
③ 总体平均数μ(或总体概率π)、总体标准差σ。
μ(π)、σ一般未知,通常以样本的)(p X 、S 作为估计值,多由预实验、查阅文献、经验估计而获得。
④ 处理组间的差别δ(所比较的两个总体参数间的差别δ),如21μμδ-=或12μμδ-=。
若研究者无法得到总体参数的信息,可作预实验来估计,也可根据专业要求由研究者规定。
2. 当假设检验的结果为“阴性”(P >0.05)时,对样本含量和检验功效进行复核有何意义?答:当假设检验的结果为“阴性”(P >0.05)时,对样本含量和检验功效进行复核具有重要意义。
通过对样本含量和检验功效进行复核(主要是计算检验功效),可以检查样本含量和检验功效是否偏低,以便正确认识假设检验的结果,避免得出错误的研究结论。
若检验功效偏低,则说明样本含量不足,应加大样本含量,重新进行实验。
三、计算题1. 据说某民族正常人体温平均高于37℃,为了进行核实,拟进行抽样调查。
如果就总体而言平均高出0.1℃便不可忽略,而已知正常人体温的标准差约为0.2℃,那么,为了将Ⅰ、Ⅱ类错误的概率控制在05.0=α和05.0=β,试估计样本含量。
解:据题意,要核实某民族正常人平均体温是否高于37℃,就是要通过抽样对该民族正常人的平均体温作出估计,并检验该平均体温是否高于37℃。
很显然,应采用单侧检验。
又已知δ=0.10,σ=0.20,05.0=α,05.0=β,先取∞=df ,则)(05.0)(∞∞=t t α=1.645,)(05.0)(∞∞=t t β=1.645,将数据代入公式(15-1),得2)1()(⎥⎦⎤⎢⎣⎡+=δβαS t t n =21.02.0)645.1645.1(⎥⎦⎤⎢⎣⎡⨯+=43.3≈44取431)1(=-=n df ,则 (43)0.05(43) 1.681t t α==,(43)0.05(43) 1.681t t β==,代入公式算得:2)2()(⎥⎦⎤⎢⎣⎡+=δβαS t t n =2(1.681 1.681)0.20.1+⨯⎡⎤⎢⎥⎣⎦=45.2≈46取(1)145df n =-=,则 (45)0.05(45) 1.679t t α==,(45)0.05(45) 1.679t t β==,代入公式计算得:2)2()(⎥⎦⎤⎢⎣⎡+=δβαS t t n =2(1.679 1.679)0.20.1+⨯⎡⎤⎢⎥⎣⎦=45.1≈46可取46=n ,即需从该民族的正常人群中随机抽取46人进行调查。
2. 某人在进行上述调查之前未经估算便人为决定取样本量25=n 。
试估计检验功效。
解:据题意,有25=n ,δ=0.10,σ=0.20,05.0=α,645.105.0==Z Z α,将数据代入公式(15-20),得855.0645.12.0251.0=-=-=αβσδZ n Z 查表,得检验功效 21805.03802.01+≈-β=0.803 7。
3. 为了比较两类片剂的溶解速率,决定各随机抽取10片,测定 5 min 溶解量,然后作05.0=α水平的检验。
据预实验,两类片剂的变异性相同,标准差约为6个单位,均数之差也约为6个单位,问该项研究的功效有多大?欲使功效达到95%,样本量应当多大?解:已知101=n ,102=n ,6=δ,6=σ,双侧05.0=α,96.12/05.02/==Z Z α,将数据代入公式(15-23),得2/21/1/1αβσδZ n n Z -+==96.110/110/166-+=0.276 1查表,得检验功效4608.02)3610.04606.0(1=+≈-β 要使功效达到95%,需重新估计样本含量:将数据6=δ,6=σ,96.1)(2/05.0)(2/==∞∞t t α,)(05.0)(∞∞=t t β=1.645代入公式(15-6),得5298.5166)645.196.1(4)(42222222/)1(≈=⨯+=+=δβαS t t N 取502)1(=-=N df ,则()5010.22/)000.2021.2()60(2/05.0)40(2/05.0)50(2/05.0)50(2/=+=+≈=t t t t α()5677.12/)671.1684.1()60(05.0)40(05.0)50(05.0)50(=+=+≈=t t t t β将有关数据代入公式(15-6),得5641.5466)5 677.15 010.2(4)(42222222/)2(≈=⨯+=+=δβαS t t N (取比计算结果稍大的偶数)取542)2(=-=N df ,则000.2)60(2/05.0)54(2/05.0)54(2/=≈=t t t α671.1)60(05.0)54(05.0)54(=≈=t t t β将有关数据代入公式(15-6),得5490.5366)671.1000.2(4)(42222222/)3(≈=⨯+=+=δβαS t t N 至此,可取54=N ,即2721==n n 。
也就是说,欲使功效达到95%,当双侧05.0=α,单侧05.0=β时,样本含量应为每类片剂各27片。
4. 甲、乙两医院的内科分别随机调查了30名住院患者,甲医院中对医疗服务表示满意者有20名,乙医院中表示满意者有23名。
经统计检验,尚不能认为两医院内科住院患者的满意率不等。
如想考查两医院内科住院患者的满意率是否相差10%以上,至少应当各调查多少患者?解:667.030/201≈=p ,767.030/232≈=p ,100.0%10==δ,取双侧05.0=α,单侧10.0=β,960.12/05.0=Z ,282.110.0=Z ,取1/12==n n c ,则717.02/)767.0667.0(2/)(21=+=+=p p p ,将数据代入公式(15-9),得221222112/1)(]/)1()1(/)1)(1([p p c p p p p Z c c p p Z n --+-++-=βα =22)100.0(]1/)767.01(767.0)667.01(667.0282.11/)11)(717.01(717.0960.1[-+-++-=424.46≈42512cn n ==1n =425因此,可以认为在双侧05.0=α,单侧10.0=β,两医院随机调查的病例数相等的条件下,想考查两医院内科住院患者的满意率是否相差10%以上,至少应当各调查425例患者。
5. 第4题样本中满意率分别为20/30=67%和23/30=77%,相差10%,差别似乎不小,但统计检验却不能拒绝总体满意率相等的假设。
如果调查人数和满意人数均为现在的10倍,样本中满意率仍分别为67%和77%,再作统计检验却能够拒绝总体满意率相等的假设。
如何解释这种现象?从以上现象中可以得到什么启示?(提示:试从检验功效的角度予以解释。
)解:取双侧05.0=α,960.12/05.0=Z ,当3021==n n ,6021=+=n n N 时,67.01=p ,77.02=p ,72.02/)(21=+=p p p ,将有关数据代入公式(15-27),得)]1()1([2)1(2||22112/21ππππππππαβ-+----=Z N Z)].(.).(.[).(..|..|77017706701670272017209601260770670-+--⨯--=≈-1.10查表,得检验功效β-1=0.135 7。
此时,检验功效非常低,犯Ⅱ型错误(即假阴性错误)的概率非常大(38640.=β),导致总体参数本来存在的差异未能检测出来,出现非真实的阴性结果。
当调查人数和满意人数均为现在的10倍,即30021==n n ,60021=+=n n N 时,仍取双侧050.=α,960.12/05.0=Z ,保持67.01=p ,77.02=p ,72.02/)(21=+=p p p 不变,将有关数据代入公式(15-27),得)]1()1([2)1(2||22112/21ππππππππαβ-+----=Z N Z)].(.).(.[).(..|..|770177067016702720172096012600770670-+--⨯--=≈0.77查表,得检验功效β-1=0.779 4。