【最新】医学统计习题分析
- 格式:ppt
- 大小:10.47 MB
- 文档页数:10
医学统计学习题解答在医学领域中,统计学是一种重要的工具,用于收集、处理和分析医学数据以获得有关疾病、治疗和其他相关问题的信息。
统计学习题是用于培养医学专业学生对统计学概念和方法应用能力的一种重要练习。
在本文档中,我们将回答一些医学统计学习题,帮助读者更好地理解和应用统计学在医学领域中的重要性。
1. 假设检验题目:一项研究想要验证一种新的药物是否对患者的生存率有显著影响。
研究人员将100名患者随机分成两组,一组接受旧药物,另一组接受新药物。
经过观察,旧药物组中有30名患者存活,新药物组中有40名患者存活。
使用α=0.05的水平进行假设检验,判断新药物是否对患者的生存率有显著影响。
解答:这是一个关于两个比例的假设检验问题。
我们可以使用临界值法进行假设检验。
Step 1: 建立假设 - 零假设(H0):新药物对患者的生存率没有显著影响,即两组患者的存活率相等。
- 备择假设(H1):新药物对患者的生存率有显著影响,即两组患者的存活率不相等。
Step 2: 计算检验统计量我们可以使用比例的差异作为检验统计量。
在这个例子中,旧药物组的存活率为30%(30/100),新药物组的存活率为40%(40/100)。
因此,检验统计量为40% - 30% = 10%。
Step 3: 确定临界值由于我们使用α=0.05的水平进行假设检验,我们需要找到临界值。
由于这是一个双侧检验,我们需要考虑两个尾部,因此我们需要查找α / 2 = 0.025的上下临界值。
Step 4: 做出决策根据计算的检验统计量和临界值,我们可以做出决策。
如果检验统计量落在临界值范围内,则我们会拒绝零假设,认为新药物对患者的生存率有显著影响。
否则,我们无法拒绝零假设,即认为新药物对患者的生存率没有显著影响。
在这个例子中,我们计算的检验统计量为10%,而临界值为-1.96%和1.96%。
由于检验统计量不在临界值范围内,我们无法拒绝零假设,即认为新药物对患者的生存率没有显著影响。
第二单元计量资料的统计推断分析计算题2.1某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4某年某地健康成年人的红细胞数和血红蛋白含量指标性另U例数均数标准差标准值*红细胞数/1012L-1男360 4.660.58 4.84女255 4.180.29 4.33血红蛋白/g L-1男360134.57.1140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大?(2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)?2.1 解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。
女性红细胞数的变异系数CV S100%0.29100% 6.94%X 4.18女性血红蛋白含量的变异系数CV 4 100%100% 8.67%X117.6由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误S X来表示,由表4计算各项指标的标准误120.031 (10/L) .360男性红细胞数的标准误S X男性血红蛋白含量的标准误S X0.374 (g/L)女性红细胞数的标准误S X 0.29-255120.018(10 /L) S 7.1(3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本 未知,但n 足够大,故总体均数的区间估计按(X u /2S X ,X u /2S X )计算。
该地男性红细胞数总体均数的 95%可信区间为:(4.66- 1.96 @031 , 4.66+ 1.96 @031),即(4.60,4.72)10%。
该地女性红细胞数总体均数的 95%可信区间为:(4.18 - 1.96 0.018,4.18+ 1.96 0.018), 即卩(4.14,4.22)1012/L 。
五、分析应用题(4题,共40分)1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下:某病西医治疗及中西医结合治疗疗效比较疗法例数治愈数治愈率(%)西医治疗70 50 74.29中西医治疗60 22 36.67X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。
你认为如何?请说出理由(6分)1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。
2、24名志愿者完全随机地分成两组,接受降胆固醇试验。
甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表,甲组乙组受试者试验前试验后受试者试验前试验后1 6.11 6.00 1 6.90 6.932 6.81 6.83 2 6.40 6.353 6.48 6.49 3 6.48 6.414 7.59 7.28 4 7.00 7.105 6.42 6.30 5 6.53 6.416 6.94 6.64 6 6.70 6.687 9.17 8.42 7 9.10 9.058 7.33 7.00 8 7.31 6.839 6.94 6.58 9 6.96 6.9110 7.67 7.22 10 6.81 6.7311 8.15 6.57 11 8.16 7.6512 6.60 6.17 12 6.98 6.52(1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分)(2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分)2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t 检验(3分)。
(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。
3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。
现用甲、乙两法检测相同的血液样品,所得结果如下表。
WORD文档下载可编辑第二单元计量资料的统计推断分析计算题2.1某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4某年某地健康成年人的红细胞数和血红蛋白含量指标性另IJ例数均数标准差标准值* 红细胞数/1012.L-1男360 4.660.58 4.84女255 4.180.29 4.33-1血红蛋白/g-L男360134.57.1140.2女255117.610.2124.7请就上表资料:(1)说明女性的红细胞数与血红蛋白的变异程度何者为大?(2)分别计算男、女两项指标的抽样误差。
(3)试估计该地健康成年男、女红细胞数的均数。
(4)该地健康成年男、女血红蛋白含量有无差别?(5)该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)?解:(1)红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。
女性红细胞数的变异系数CV-S100%029100%6.94%X4.18S102女性血红蛋白含量的变异系数CV=100%一一100%8.67%X117.6由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
专业技术资料分享u X1X222S 1S 2 mn 2134.5117.6 ।二22.829 7.12 36010.22 255(2)抽样误差的大小用标准误S X 来表示,由表4计算各项指标的标准误(Xu /2SX >Xu /2$又)计算。
该地男性红细胞数总体均数的95%M 信区间为:(4.66-1.96X0.031,4.66+1.96X0.031),即(4.60,4.72)1012/L 。
该地女性红细胞数总体均数的95%M 信区间为:(4.18-1.96X0.018,4.18+1.96X0.018),即(4.14,4.22)1012/L 。
(4)两成组大样本均数的比较,用u 检验。
1)建立检验假设,确定检验水准0.052)计算检验统计量男性红细胞数的标准误S 又0.580.031(1012/L ) ,360男性血红蛋白含量的标准误SXS71 0.374(g /L) 、n.360女性红细胞数的标准误S X0.290.018(1012/L ) .255女性血红蛋白含量的标准误SXS1020.639(g/L )、、n.255(3)本题采用区间估计法估计男、 女红细胞数的均数。
1. 0101. 医学统计学研究的对象是:A.医学中的小概率事件B.各种类型的数据C.疾病的预防与治疗D.有变异的医学现象2. 0102. 用样本推论总体,具有代表性的样本通常指的是:A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.依照随机原则抽取总体中的部分个体3. 0103.下列观测结果属于有序数据的是:A.收缩压测量值B.脉搏数C.住院天数D.病情程度4. 0104.随机误差指的是:A. 由某些固定因素引起的误差B. 由不可预知的偶然因素引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差5. 0105.系统误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差6. 0106.抽样误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差7. 0107.收集资料不可避免的误差是:A.随机误差B.系统误差C.过失误差D.记录误差8. 0108.统计学中所谓的总体通常指的是:A.自然界中的所有研究对象B.概括性的研究结果C.同质观察单位的全体D.所有的观察数据9. 0109.统计学中所谓的样本通常指的是:A.可测量的生物样品B.统计量C.数据中有代表性的一部分D.总体中有代表性的部分观察单位10. 0111统计学的主要作用是:A. 使分析更为简单B. 避免计算出现错误C. 改善数据质量D.探测随机现象的规律11. 0112概率描述的是:A.总体具有的特征B.数据具有的特征C.随机事件发生的可能性D.随机现象的规律性12. 0114.统计描述结果的主要表达方式是:A.统计指标、统计表和统计图B.描述数据特征C.概率分布D.抽样误差13. 0201.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A中位数 B.几何均数 C.均数 D.P百分位数9514. 0202.算术均数与中位数相比,其特点是:A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料15. 0203.将一组定量资料整理成频数表的主要目的是A.化为计数资料B.便于计算C.能够更精确地检验D. 描述数据的分布特征16. 0205. 变异系数主要用:A.比较不同计量指标的变异程度 B衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度17. 0206.对于正态或近似正态分布的资料,描述其变异程度应选用的指标A.变异系数B. 离均差平方和C.极差D. 标准差18. 0207.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应用:A. 四分位数间距B.标准差C.变异系数D.方差19. 0208.一组原始数据的分布呈正偏态分布,其数据的特点是:A.数值离散度大B.数值离散度小C.数值偏向较大的方向D.数值偏向较小的方向20. 0210在衡量数据的变异度时,标准差与方差相比,其主要特点是:A.标准差小于方差 C.标准差更容易计算C.标准差更为准确D. 标准差的计量单位与原始数据相同21. 0213.比较健康人群血肌酐和尿素氮的变异水平,应采用的指标是:A.标准差B.百分位数C.极差D. 变异系数22. 0214.中位数与算数均数相比,其特点是:A.容易计算B.计算出的结果更为可靠C.不易受异常值影响D.更适合对称分布的数据23. 0301.正态曲线拐点所对应的横坐标为:A.⎺X±SB. μ±σC. X±2SD. μ±1.96σ24. 0302.标准正态分布的形状参数和位置参数分别为:A 0,1B 1,0C μ,σD σ,μ25. 0303.正态分布N(μ,σ2),当μ恒定时,σ越大则:A.曲线沿横轴越向左移动B. 曲线形状和位置不变C.曲线越“瘦高”D.曲线越“矮胖”26. 0305.正态曲线下,横轴上从均数到+∞的面积为A.50%B.95%C.97.5%D.99%27. 0306. 若随机变量X服从N(μ,σ2 )的正态分布,则X的第97.5百分位数等于()A. μ+1.96σB.μ-1.64σC.μ-σD.μ+1.64σ28. 0308.某项指标95%医学参考值范围表示的是:A.在此范围“异常"的概率大于或等于95%B.在此范围“正常"的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围29. 0309.确定某项指标的医学参考值范围时,“正常人”指的是:A.从未患过疾病的人B.患过疾病但不影响研究指标的人C.排除了患过某种疾病的人D.排除了影响研究指标的疾病或因素的人30. 0311.要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是:A.用均数来评价 B 用参考值范围来评价C.用几何均数来评价D.用变异系数来评价31. 0401 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是( )A.该病患病率增加B.该病患病率减少C.该病的发病率增加D.该病的发病率减少32. 0402.计算乙肝疫苗接种后血清学检查的阳转率,分母为( )A.乙肝易感人数B.平均人口数C.乙肝疫苗接种人数D.乙肝患者人数33. 0403.计算标准化死亡率的目的是( )A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响34. 0406.相对危险度RR的计算方法是( )A.两个标准化率之比B.两种不同疾病的发病人数之比C.两种不同疾病患病率之比D.两种不同条件下某疾病发生的概率之比35. 0407.比数比OR值表示的是( )A.两个标准化率的差别大小B.两种不同疾病的发病率差别程度C.两种不同疾病患病率差别程度D.两种不同条件下某疾病发生的危险性程度36. 0408.计算患病率时的平均人口数的计算方法是( )A.年初人口数和年末人口数的平均值B.全年年初的人口数C.全年年末的人口数D.生活满一年的总人口数37. 0409.死因构成比反映的是( )A.各种疾病发生的严重程度B.疾病发生的主要原因C.疾病在人群的分布情况D.各种死因的相对重要性38. 0410.患病率与发病率的区别是( )A.患病率高于发病率B.患病率低于发病率C.计算患病率不包括新发病例D.患病率与病程有关39. 0412.某地某年肝炎发病人数占同年传染病人数的10.1%,该指标属于( )A.相对比B.构成比C.发病率D.传染率40. 0413.某医师对其所在科室近5年某病住院患者进行了统计,结果发现该病患者农村人口200人,城镇人口50人,分别占80%与20%,则结论为( )A.农村人容易患该病B.城镇人容易患该病C农村城镇都易患该病 D.尚不能得出结论41. 0501统计表的主要作用是()A.便于形象描述和表达结果B.客表达验的原始数据C. 代替冗长的文字述和便于分析对比D.容易进行统计述和推断42. 0502.述某疾病患者年龄(岁)的分布,采用的统计图是()A.线图B.条图C.百分条图D.直方图43. 0503.高血压临床试验分为试验组和对照组分析考治疗0周、2周、4周6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数图B.线图C.条图D.直方图44. 0505.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A.直方图B.箱式图C.线图D.散点图45. 0506.下列统计图适用于构成比关系的()A.直方图B.箱式图C.误差条图、条图D.圆图、圆百分条46. 0507.对有些资料构造统计表时下列可以省略的是()A.标题B.标目 C线条 D.备注47. 0509.描述某现象频数分布情况应选择的是( )A.圆图B.百分条图C.箱式图D.直方图48. 0601.样本均数的标准误越小说明A.观察个体的变异越小B.由样本均数估计总体均数的可靠性越大C.由样本均数估计总体均数的可靠性越小D.抽样误差越大49. 0602抽样误差产生的原因是A.样本不是随机抽取B.测量不准确C资料不是正态分布 D.个体差异及抽样50. 0603.要减少抽样误差,通常的做法是A.减小系统误差B.将个体变异控制在一定范围内C减小标准差 D.适当增加样本含量51. 0604.对于正偏态分布的总体,当样本含量足够大时,样本均数的分布近似为A.正偏态分布B.负偏态分布C.正态分布D.t分布52. 0606.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109-9.1×109/L,其含义是A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C. 该区间包含总体均数的可能性为95%D.该区间包含样本均数的可能性为95%53. 0607.某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L该地正常成年人血清胆固醇均数95%的可信区间是A.3.64±1.96×1.20B.3.64±1.20C.3.64±1.96×1.20/√200D.3.64±2.58×1.20/√20054. 0609.假设检验差别有统计学意义时,P越小,说明A.样本均数差别越大B.总体均数差别越大C认为样本之间有差别的统计学证据越充分 D.认为总体之间有差别的统计学证据越充分55. 0610.关于假设检验,正确的说法是A检验水准必须设为0.05 B必须根据样本大小选择检验水准C必须采用双侧检验 D.必须建立无效假设56. 0611假设检验水准a指的是A.检验的置信度B.控制Ⅱ类错误的概率C.控制1类错误的概率D.无效假设的概率57. 0613.假设检验中的P值的含义是A.总体间有差别时出现现有样本及极端情况的概率B.总体间无差别时出现现有样本及极端情况的概率C.总体间有差别时H成立的概率D.总体间无差别时H成立的概率58. 0701.两样本均数之差的标准误反映的是A.两样本数据集中趋势的差别B. 两样本数据的变异程度C. 两样本均数之差的变异程度D. 数据的分布特征59. 0702. 两样本均数比较,检验结果P>0.05说明A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论60. 0706.增加t检验的检验效能,应该使用的方法是A.减小I类错误B.减小测量的系统误差C.减小测量的随机误差D. 增加样本量61. 0707. 以下不能用配对t检验方法的是(C)A比较15名肝癌患者癌组织和癌旁组织中Sirt1基因的表达量B.比较两种检测方法测量15名肝癌患者癌组织中Sirt1基因的表达量C.比较早期和晚期肝癌患者各15例癌组织中Sirt1基因的表达量D.比较糖尿病患者经某种药物治疗前后后糖化血红蛋白的变化62. 0709. 对于配对设计的t检验,其检验假设H0是A. 两样本均数相同B. 配对数据的差值总体均数为0C.两总体均数相同D.两总体均数不同63. 0801.方差分析的基本思想是A.组间均方大于组内均方B.组内均方大于组件均方C.不同来源的方差必须相等D.总变异及其自由度可按不同来源分解64. 0802.方差分析的应用条件之一是方差齐性,它是指A.各比较组相应的样本方差相等B.各比较组相应的总体方差相等C.组内方差等于组间方差D.总方差等于各组方差之和65. 0803.完全随机设计方差分析中的组间均方反映的是A.某因素效应大小B.随机测量误差大小C.全部数据的离散度D.处理因素效应与随机误差综合结果66. 0806 完全随机设计的多个样本均数比较,经方差分析,若P<0.05,则结论为:A 各样本均数全相等B 各样本均数全不相等C 至少有两个样本均数不等D 至少有两个总体均数不等67. 0814 在完全随机设计资料的方差分析中,已知总样本量为60,分为4个不同的处理组,则组内变异的自由度为A 3B 56C 57D 5968. 0901. 两样本率比较,差别具有统计学意义时,P值越小说明A.两样本率差别越大B.两总体率差别越大C.越有理由认为两样本率不同D.越有理由认为两总体率不同69. 0907当四个表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是A 增大B 减小C 不变D 不确定70. 0911. 卡方检验的基本思想是A. 对总变异进行分解计算X2值B.根据总体间差别的大小计算X2值C.根据样本配对的情况计算X2值D.根据实际频数和理论频数的差异计算X2值71. 0912. 对三行四列表资料作X2检验,自由度为A. 1B. 2C. 6D. 372. 1001.对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是(A)A.适用范围广B.检验效能高C.检验结果更准确D.充分利用资料信息73. 1010 两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次为A 0.2B 1.0C 5.0D 3.074. 1011. 两样本比较的秩和检验,其应用条件是A. 两样本服从正态分布B. 两总体服从正态分布C. 两样本方差齐同D. 不受任何条件限制75. 1013.配对资料的符号秩和检验的无效假设是A. 两组配对的差值中位数为零B.两总体均数相同C.两总体分布位置相同D.两组配对的差值均数为零76. 1101,两数值变量的相关关系越强,对应的是A 相关系数越大B 回归系数越大C 相关系数的绝对值越大D 回归系数的绝对值越大77. 1105,1~17岁儿童可以用年龄(岁)估计体重(市斤)回归方程为y ^=14+4x,若将体重换成国际单位kg,则此方程A 常数项改变B 回归系数改变C 常数项和回归系数都改变D 常数项和回归系数都不改变78. 1106,对同一资料进行线性回归与相关分析时,下列正确的情形是A ρ=0时,r=0B ρ>0时,b>0C r>0时,b<0D r<0时,b<079. 1107下列双变量中,适用于进行线性相关分析的是A年龄与体重 B民族与血型C体重与体表面积D母亲文化水平与子女的智商80. 1108 若直线回归系数的假设检验结果p<0.05,则可认为两变量间A有密切的关系 B有一定的因果关系C相关关系密切D存在数量依存关系81. 1111用最小二乘法建立线性回归方程的原则是保证各实测点到回归直线的(B)A纵向距离的离均差最小B纵向距离的平方和最小C垂直距离相等 D垂直距离的平方和最小82. 1112,进行线性回归分析,合理的直观分析方法是A计算回归系数 B做回归直线C计算截距或常数项D绘制散点图83. 1501实验性研究随机化分组的目的是A.减少抽样误差B.减少实验例数C.提高检验效能D.保持各组的非处理因素均衡一致84. 1502.关于实验指标的准确度和精密度,正确的说法是A.精密度较准确度更重要B.准确度较精密度更重要C.精密度主要受随机误差的影响D.准确度主要受随机误差的影响85. 1503.在临床试验设计选择对照时,最高效的对照形式是(D)A.历史对照B.空白对照C.标准对照D.安慰剂对照86. 1504.实验没计的三大原则是A.随机、对照、自法B.随机、均衡、重复C.随机、对照、均衡D. 随机、对照、重复87. 1505.某医师研究某新药治疗缺血性脑卒中恢复期的临床疗效,对照组采用阳性药物溶栓胶囊,这属于A.空白对照B.历史对照C.标准对照D.安慰剂对照88. 1509.临床试验需要在设计阶段确定主要指标的目的是A.便于试验实施B.减少测量的随机误差C.减少非处理因素的影响D.避免结果的任意性89. 1511.观察性研究与实验性研究的主要区别是A.是否设立对照组B.是否以人为研究对象C.是否是抽样研究D.是否主动施加干预措施90. 1514.诊断试验中的灵敏度指的是(B)A.检测仪器的敏感性B.对患病的人检出的概率C.对未患病人检出的概率D.阳性预测值。
医学统计学习题及答案医学统计学是一门应用广泛的学科,它在医学研究和临床实践中扮演着重要的角色。
以下是一些医学统计学的基础习题及答案,供学习者参考。
习题一:描述性统计问题:某医院对100名患者的体重进行了测量,测得的平均体重为70公斤,标准差为10公斤。
请计算该组数据的变异系数。
答案:变异系数(Coefficient of Variation, CV)的计算公式为:\[ CV = \frac{标准差}{平均值} \times 100\% \]代入数据得:\[ CV = \frac{10}{70} \times 100\% \approx 14.29\% \]习题二:概率分布问题:假设某疾病的发病率为0.01,即每1000人中有1人患病。
如果随机抽取100人,求至少有1人患病的概率。
答案:使用二项分布的补数原理,计算没有人患病的概率,然后求其补数。
没有人患病的概率为:\[ P(0) = (1 - 0.01)^{100} \]至少有1人患病的概率为:\[ P(\geq 1) = 1 - P(0) \]习题三:假设检验问题:某药物对降低血压有显著效果。
在一项研究中,研究人员将100名高血压患者随机分为两组,每组50人。
一组接受药物治疗,另一组接受安慰剂。
治疗后,药物治疗组的平均血压降低了10毫米汞柱,而安慰剂组的平均血压降低了2毫米汞柱。
假设两组的血压降低量服从正态分布,标准差均为5毫米汞柱。
请问药物治疗是否显著优于安慰剂?答案:使用独立样本t检验来比较两组的血压降低量。
首先计算t值:\[ t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s^2}{n_1} +\frac{s^2}{n_2}}} \]其中,\(\bar{X}_1\) 和 \(\bar{X}_2\) 分别是两组的平均血压降低量,\(s\) 是标准差,\(n_1\) 和 \(n_2\) 是样本大小。
代入数据得:\[ t = \frac{10 - 2}{\sqrt{\frac{5^2}{50} + \frac{5^2}{50}}} \]计算t值后,与t分布的临界值进行比较,如果t值大于临界值,则拒绝原假设,认为药物治疗显著优于安慰剂。
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学练习及参考答案《医学统计学》练习题及参考答案一、填空题:1、频数分布通常具有集中趋势、离散趋势两个基本特征。
P412、统计表一般需有标题、线条(横线)、标目、数字四个基本结构。
3、四格表应用基本公式进行卡方检验的条件是:n≥40 、T≥5 。
4、正态分布的两个决定参数是:位置参数μ、形状参数。
P535、正态分布中央95%的观察值的分布区间是(μ-1.96σ,μ+1.96 σ)。
P536、概率抽样三个基本原则是:随机化原则、同质性原则、 n足够大。
7、实验设计的三大原则是对照、随机化、重复。
P20二、单项选择题:1.下面的变量中,属于分类变量的是---B--.A.脉搏 B.血型 C.肺活量 D.血压2. 已知我国部分县1988年死因构成比资料如下:心脏疾病11.41%,损伤与中毒11.56%,恶性肿瘤15.04%,脑血管病16.07%,呼吸系统病25.70%,其他20.22%.为表达上述死因的构成的大小,根据此资料应绘制统计图为--D---.A.线图 B.直方图 C.直条图 D.百分条图 E.统计地图 3. 在一项研究的最初检查中,人们发现30~40岁男女两组人群的冠心病患病率均为4%,于是,认为该年龄组男女两性发生冠心病的危险相同.这个结论是---C--. A.正确的B. 不正确的,因为没有可识别的队列人群 C.不正确的,因为没有区分发病率与患病率D.不正确的,因为用百分比代替率来支持该结论 E.不正确的,因为没有设立对照组 4. sx表示---C--.A.总体均数 B. 总体均数离散程度 C. 样本均数的标准差 D.变量值x的离散程度 E.变量值x的可靠程度5.做两个总体均数比较t检验,计算t>t0.01,(n1+n2-2时,可以认为-B----.A.反复随机抽样时,出现这种大小的均数差异的可能性大于0.01B.样本均数差异是由随机抽样误差所致的可能性小于0.01,可认为两总体有差别。
医学统计学课后习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值 B.脉搏数C.住院天数 D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
WORD文档下载可编辑第二单元计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值*红细胞数/1012·L-1男360 4.66 0.58 4.84女255 4.18 0.29 4.33血红蛋白/g·L-1男360 134.5 7.1 140.2女255 117.6 10.2 124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大?(2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)?2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。
女性红细胞数的变异系数0.29100%100% 6.94%4.18SCVX=⨯=⨯=女性血红蛋白含量的变异系数10.2100%100%8.67%117.6SCVX=⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。
男性红细胞数的标准误0.031X S ===(1210/L )男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本。
σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。
该地男性红细胞数总体均数的95%可信区间为:(4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。
医学统计学课后习题答案在医学统计学课程中,课后习题是帮助学生巩固和应用课堂所学知识的重要环节。
以下是一些可能的课后习题及其答案,供学习参考。
习题1:某医院对100名患者进行了治疗效果的评估,其中70名患者病情有所改善。
请计算该治疗的有效率。
答案:有效率 = (改善的患者数 / 总患者数) × 100%有效率= (70 / 100) × 100% = 70%习题2:假设某研究中,有200名受试者,其中100名为实验组,接受新药治疗;另外100名为对照组,接受安慰剂。
研究结束时,实验组有30人出现副作用,对照组有10人出现副作用。
请计算两组的副作用发生率,并进行卡方检验,判断两组副作用发生率是否有显著差异。
答案:实验组副作用发生率= (30 / 100) × 100% = 30%对照组副作用发生率= (10 / 100) × 100% = 10%卡方检验计算:期望值 = (总人数× 总副作用数) / 总人数= (200 × 40) / 200 = 40实验组期望值= 40 × (100 / 200) = 20对照组期望值= 40 × (100 / 200) = 20卡方值 = [(30 - 20)^2 / 20] + [(10 - 20)^2 / 20] = 50自由度 = (组数 - 1) = 1卡方分布表中查得,自由度为1时,显著性水平为0.05的卡方临界值为3.841。
由于50 > 3.841,所以拒绝原假设,认为两组副作用发生率有显著差异。
习题3:某研究中,对50名高血压患者进行了血压测量,测量结果如下(单位:mmHg):- 收缩压:120, 130, 140, 150, 160, 170, 180, 190- 舒张压:80, 85, 90, 95, 100, 105, 110, 115请计算收缩压和舒张压的平均值和标准差。
一、最佳选择题1.卫生统计工作的步骤为 cA.统计研究调查、搜集资料、整理资料、分析资料B.统计资料收集、整理资料、统计描述、统计推断C.统计研究设计、搜集资料、整理资料、分析资料D.统计研究调查、统计描述、统计推断、统计图表E.统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有A.统计描述和统计学检验B.区间估计与假设检验C.统计图表和统计报告D.统计描述和统计推断E.统计描述和统计图表3.统计资料的类型包括A.频数分布资料和等级分类资料B.多项分类资料和二项分类资料C.正态分布资料和频数分布资料D.数值变量资料和等级资料E.数值变量资料和分类变量资料4.抽样误差是指A.不同样本指标之间的差别B.样本指标与总体指标之间由于抽样产生的差别C.样本中每个体之间的差别D.由于抽样产生的观测值之间的差别E.测量误差与过失误差的总称5.统计学中所说的总体是指A.任意想象的研究对象的全体B.根据研究目的确定的研究对象的全体C.根据地区划分的研究对象的全体D.根据时间划分的研究对象的全体E.根据人群划分的研究对象的全体6.描述一组偏态分布资料的变异度,宜用A.全距B.标准差C.变异系数D.四分位数间距E.方差7.用均数与标准差可全面描述其资料分布特点的是A.正偏态分布B.负偏态分布C.正态分布和近似正态分布D.对称分布E.任何分布8.比较身高和体重两组数据变异度大小宜采用A.变异系数B.方差C.极差D.标准差E.四分位数间距9.频数分布的两个重要特征是A.统计量与参数B.样本均数与总体均数C.集中趋势与离散趋势D.样本标准差与总体标准差E.样本与总体10.正态分布的特点有A.算术均数=几何均数B.算术均数=中位数C.几何均数=中位数D.算术均数=几何均数=中位数E.以上都没有11.正态分布曲线下右侧5%对应的分位点为A.μ+1.96σB.μ-1.96σC.μ+2.58σD.μ+1.64σE.μ-2.58σ12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指A.该指标在所有人中的波动范围B.该指标在所有正常人中的波动范围C.该指标在绝大部分正常人中的波动范围D.该指标在少部分正常人中的波动范围E.该指标在一个人不同时间的波动范围14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. xs x μ- 15.统计推断的主要内容为A.统计描述与统计图表B.参数估计和假设检验C.区间估计和点估计D.统计预测与统计控制E.参数估计与统计预测16.可信区间估计的可信度是指A.αB.1-αC.βD.1-βE.估计误差的自由度17.下面哪一指标较小时可说明用样本均数估计总体均数的可靠性大A.变异系数B.标准差C.标准误D.极差E.四分位数间距18.两样本比较作t 检验,差别有显著性时,P 值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E. I 型错误越大19.两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.α=0.05B.α=0.01C.α=0.10D.α=0.20E.α=0.0220.当样本含量n 固定时,选择下列哪个检验水准得到的检验效能最高A.α=0.01B.α=0.10C.α=0.05D.α=0.20E.α=0.0221.在假设检验中,P 值和α的关系为A. P 值越大,α值就越大B. P 值越大,α值就越小C. P 值和α值均可由研究者事先设定D. P 值和α值都不可以由研究者事先设定E. P 值的大小与α值的大小无关22.假设检验中的第二类错误是指A.拒绝了实际上成立的0HB.不拒绝实际上成立的0HC.拒绝了实际上成立的1HD.不拒绝实际上不成立的0HE.拒绝0H 时所犯的错误23.方差分析中,组内变异反映的是A. 测量误差B. 个体差异C. 随机误差,包括个体差异及测量误差D. 抽样误差E. 系统误差24.方差分析中,组间变异主要反映A. 随机误差B. 处理因素的作用C. 抽样误差D. 测量误差E. 个体差异25.多组均数的两两比较中,若不用q 检验而用t 检验,则A. 结果更合理B. 结果会一样C. 会把一些无差别的总体判断有差别的概率加大D. 会把一些有差别的总体判断无差别的概率加大E. 以上都不对26.说明某现象发生强度的指标为A.构成比B.相对比C.定基比D.环比E. 率27.对计数资料进行统计描述的主要指标是A.平均数B.相对数C.标准差D.变异系数E.中位数28.构成比用来反映A.某现象发生的强度B.表示两个同类指标的比C.反映某事物内部各部分占全部的比重D.表示某一现象在时间顺序的排列E.上述A 与C 都对29. 样本含量分别为1n 和2n 的两样本率分别为1p 和2p ,则其合并平均率c p 为A. 1p +2pB. (1p +2p )/2C. 21p p ⨯D.212211n n p n p n ++ E.2)1()1(212211-+-+-n n p n p n 30.下列哪一指标为相对比A. 中位数B. 几何均数C. 均数D. 标准差E. 变异系数31.发展速度和增长速度的关系为A. 发展速度=增长速度一1B. 增长速度=发展速度一1C.发展速度=增长速度一100D.增长速度=发展速度一100E.增长速度=(发展速度一1)/10032.SMR 表示A.标化组实际死亡数与预期死亡数之比B.标化组预期死亡数与实际死亡数之比C.被标化组实际死亡数与预期死亡数之比D.被标化组预期死亡数与实际死亡数之比E.标准组与被标化组预期死亡数之比33.两个样本率差别的假设检验,其目的是A.推断两个样本率有无差别B.推断两个总体率有无差别C.推断两个样本率和两个总体率有无差别D.推断两个样本率和两个总体率的差别有无统计意义E.推断两个总体分布是否相同34.用正态近似法进行总体率的区间估计时,应满足A. n 足够大B. p 或(1-p )不太小C. np 或n(1-p)均大于5D. 以上均要求E. 以上均不要求35.由两样本率的差别推断两总体率的差别,若P 〈0.05,则A. 两样本率相差很大B. 两总体率相差很大C. 两样本率和两总体率差别有统计意义D. 两总体率相差有统计意义E. 其中一个样本率和总体率的差别有统计意义36.假设对两个率差别的显著性检验同时用u 检验和2χ检验,则所得到的统计量u 与2χ的关系为A. u 值较2χ值准确B. 2χ值较u 值准确C. u=2χD. u=2χE. 2χ=u37.四格表资料中的实际数与理论数分别用A 与T 表示,其基本公式与专用公式求2χ的条件为A. A ≥5B. T ≥5C. A ≥5 且 T ≥5D. A ≥5 且n ≥40E. T ≥5 且n ≥4038.三个样本率比较得到2χ>2)2(01.0χ,可以为A.三个总体率不同或不全相同B.三个总体率都不相同C.三个样本率都不相同D.三个样本率不同或不全相同E.三个总体率中有两个不同39.四格表2χ检验的校正公式应用条件为A. n>40 且T>5B. n<40 且T>5C. n>40 且 1<T<5D. n<40 且1<T<5E. n>40 且T<140.下述哪项不是非参数统计的优点A.不受总体分布的限定B.简便、易掌握C.适用于等级资料D.检验效能高于参数检验E.适用于未知分布型资料41.秩和检验和t 检验相比,其优点是A. 计算简便,不受分布限制B.公式更为合理C.检验效能高D.抽样误差小E.第二类错误概率小42.等级资料比较宜用A. t 检验B. u 检验C.秩和检验D. 2χ检验E. F 检验43.作两均数比较,已知1n 、2n 均小于30,总体方差不齐且分布呈极度偏态,宜用A. t 检验B. u 检验C.秩和检验D. F 检验E.2χ检验44.从文献中得到同类研究的两个率比较的四格表资料,其2χ检验结果为:甲文)1(01.02χχ>,乙文2)1(05.02χχ>,可认为A.两文结果有矛盾B.两文结果基本一致C.甲文结果更可信D.乙文结果更可信E.甲文说明总体间的差别更大45.欲比较某地区1980年以来三种疾病的发病率在各年度的发展速度,宜绘制A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图46.拟以图示某市1990~1994年三种传染病发病率随时间的变化,宜采用A.普通线图B.直方图C.统计地图D.半对数线图E.圆形图47.调查某地高血压患者情况,以舒张压≥90mmHg 为高血压,结果在1000人中有10名高血压患者,99名非高血压患者,整理后的资料是:A.计量资料B.计数资料C.多项分类资料D.等级资料E.既是计量资料又是分类资料48. 某医师检测了60例链球菌咽炎患者的潜伏期,结果如下。
第二单元 计量资料的统计推断分析计算题2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4 某年某地健康成年人的红细胞数和血红蛋白含量指 标性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。
女性红细胞数的变异系数0.29100%100% 6.94%4.18S CV X =⨯=⨯= 女性血红蛋白含量的变异系数10.2100%100%8.67%117.6S CV X =⨯=⨯=由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。
男性红细胞数的标准误0.031X S ===(1210/L ) 男性血红蛋白含量的标准误0.374X S ===(g/L )女性红细胞数的标准误0.018X S ===(1210/L )女性血红蛋白含量的标准误0.639X S ===(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本。
σ未知,但n 足够大 ,故总体均数的区间估计按(/2/2X X X u S X u S αα-+, )计算。