【最新】医学统计习题分析
- 格式:ppt
- 大小:10.47 MB
- 文档页数:10
医学统计学习题解答在医学领域中,统计学是一种重要的工具,用于收集、处理和分析医学数据以获得有关疾病、治疗和其他相关问题的信息。
统计学习题是用于培养医学专业学生对统计学概念和方法应用能力的一种重要练习。
在本文档中,我们将回答一些医学统计学习题,帮助读者更好地理解和应用统计学在医学领域中的重要性。
1. 假设检验题目:一项研究想要验证一种新的药物是否对患者的生存率有显著影响。
研究人员将100名患者随机分成两组,一组接受旧药物,另一组接受新药物。
经过观察,旧药物组中有30名患者存活,新药物组中有40名患者存活。
使用α=0.05的水平进行假设检验,判断新药物是否对患者的生存率有显著影响。
解答:这是一个关于两个比例的假设检验问题。
我们可以使用临界值法进行假设检验。
Step 1: 建立假设 - 零假设(H0):新药物对患者的生存率没有显著影响,即两组患者的存活率相等。
- 备择假设(H1):新药物对患者的生存率有显著影响,即两组患者的存活率不相等。
Step 2: 计算检验统计量我们可以使用比例的差异作为检验统计量。
在这个例子中,旧药物组的存活率为30%(30/100),新药物组的存活率为40%(40/100)。
因此,检验统计量为40% - 30% = 10%。
Step 3: 确定临界值由于我们使用α=0.05的水平进行假设检验,我们需要找到临界值。
由于这是一个双侧检验,我们需要考虑两个尾部,因此我们需要查找α / 2 = 0.025的上下临界值。
Step 4: 做出决策根据计算的检验统计量和临界值,我们可以做出决策。
如果检验统计量落在临界值范围内,则我们会拒绝零假设,认为新药物对患者的生存率有显著影响。
否则,我们无法拒绝零假设,即认为新药物对患者的生存率没有显著影响。
在这个例子中,我们计算的检验统计量为10%,而临界值为-1.96%和1.96%。
由于检验统计量不在临界值范围内,我们无法拒绝零假设,即认为新药物对患者的生存率没有显著影响。
第二单元计量资料的统计推断分析计算题2.1某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4某年某地健康成年人的红细胞数和血红蛋白含量指标性另U例数均数标准差标准值*红细胞数/1012L-1男360 4.660.58 4.84女255 4.180.29 4.33血红蛋白/g L-1男360134.57.1140.2女255117.610.2124.7请就上表资料:(1) 说明女性的红细胞数与血红蛋白的变异程度何者为大?(2) 分别计算男、女两项指标的抽样误差。
(3) 试估计该地健康成年男、女红细胞数的均数。
(4) 该地健康成年男、女血红蛋白含量有无差别?(5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)?2.1 解:(1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。
女性红细胞数的变异系数CV S100%0.29100% 6.94%X 4.18女性血红蛋白含量的变异系数CV 4 100%100% 8.67%X117.6由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
(2) 抽样误差的大小用标准误S X来表示,由表4计算各项指标的标准误120.031 (10/L) .360男性红细胞数的标准误S X男性血红蛋白含量的标准误S X0.374 (g/L)女性红细胞数的标准误S X 0.29-255120.018(10 /L) S 7.1(3) 本题采用区间估计法估计男、女红细胞数的均数。
样本含量均超过100,可视为大样本 未知,但n 足够大,故总体均数的区间估计按(X u /2S X ,X u /2S X )计算。
该地男性红细胞数总体均数的 95%可信区间为:(4.66- 1.96 @031 , 4.66+ 1.96 @031),即(4.60,4.72)10%。
该地女性红细胞数总体均数的 95%可信区间为:(4.18 - 1.96 0.018,4.18+ 1.96 0.018), 即卩(4.14,4.22)1012/L 。
五、分析应用题(4题,共40分)1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下:某病西医治疗及中西医结合治疗疗效比较疗法例数治愈数治愈率(%)西医治疗70 50 74.29中西医治疗60 22 36.67X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。
你认为如何?请说出理由(6分)1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。
2、24名志愿者完全随机地分成两组,接受降胆固醇试验。
甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表,甲组乙组受试者试验前试验后受试者试验前试验后1 6.11 6.00 1 6.90 6.932 6.81 6.83 2 6.40 6.353 6.48 6.49 3 6.48 6.414 7.59 7.28 4 7.00 7.105 6.42 6.30 5 6.53 6.416 6.94 6.64 6 6.70 6.687 9.17 8.42 7 9.10 9.058 7.33 7.00 8 7.31 6.839 6.94 6.58 9 6.96 6.9110 7.67 7.22 10 6.81 6.7311 8.15 6.57 11 8.16 7.6512 6.60 6.17 12 6.98 6.52(1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分)(2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分)2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t 检验(3分)。
(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。
3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。
现用甲、乙两法检测相同的血液样品,所得结果如下表。
WORD文档下载可编辑第二单元计量资料的统计推断分析计算题2.1某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4:表4某年某地健康成年人的红细胞数和血红蛋白含量指标性另IJ例数均数标准差标准值* 红细胞数/1012.L-1男360 4.660.58 4.84女255 4.180.29 4.33-1血红蛋白/g-L男360134.57.1140.2女255117.610.2124.7请就上表资料:(1)说明女性的红细胞数与血红蛋白的变异程度何者为大?(2)分别计算男、女两项指标的抽样误差。
(3)试估计该地健康成年男、女红细胞数的均数。
(4)该地健康成年男、女血红蛋白含量有无差别?(5)该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)?解:(1)红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。
女性红细胞数的变异系数CV-S100%029100%6.94%X4.18S102女性血红蛋白含量的变异系数CV=100%一一100%8.67%X117.6由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。
专业技术资料分享u X1X222S 1S 2 mn 2134.5117.6 ।二22.829 7.12 36010.22 255(2)抽样误差的大小用标准误S X 来表示,由表4计算各项指标的标准误(Xu /2SX >Xu /2$又)计算。
该地男性红细胞数总体均数的95%M 信区间为:(4.66-1.96X0.031,4.66+1.96X0.031),即(4.60,4.72)1012/L 。
该地女性红细胞数总体均数的95%M 信区间为:(4.18-1.96X0.018,4.18+1.96X0.018),即(4.14,4.22)1012/L 。
(4)两成组大样本均数的比较,用u 检验。
1)建立检验假设,确定检验水准0.052)计算检验统计量男性红细胞数的标准误S 又0.580.031(1012/L ) ,360男性血红蛋白含量的标准误SXS71 0.374(g /L) 、n.360女性红细胞数的标准误S X0.290.018(1012/L ) .255女性血红蛋白含量的标准误SXS1020.639(g/L )、、n.255(3)本题采用区间估计法估计男、 女红细胞数的均数。
1. 0101. 医学统计学研究的对象是:A.医学中的小概率事件B.各种类型的数据C.疾病的预防与治疗D.有变异的医学现象2. 0102. 用样本推论总体,具有代表性的样本通常指的是:A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.依照随机原则抽取总体中的部分个体3. 0103.下列观测结果属于有序数据的是:A.收缩压测量值B.脉搏数C.住院天数D.病情程度4. 0104.随机误差指的是:A. 由某些固定因素引起的误差B. 由不可预知的偶然因素引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差5. 0105.系统误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差6. 0106.抽样误差指的是:A.由某些固定因素引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.样本统计量与总体参数间的误差7. 0107.收集资料不可避免的误差是:A.随机误差B.系统误差C.过失误差D.记录误差8. 0108.统计学中所谓的总体通常指的是:A.自然界中的所有研究对象B.概括性的研究结果C.同质观察单位的全体D.所有的观察数据9. 0109.统计学中所谓的样本通常指的是:A.可测量的生物样品B.统计量C.数据中有代表性的一部分D.总体中有代表性的部分观察单位10. 0111统计学的主要作用是:A. 使分析更为简单B. 避免计算出现错误C. 改善数据质量D.探测随机现象的规律11. 0112概率描述的是:A.总体具有的特征B.数据具有的特征C.随机事件发生的可能性D.随机现象的规律性12. 0114.统计描述结果的主要表达方式是:A.统计指标、统计表和统计图B.描述数据特征C.概率分布D.抽样误差13. 0201.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A中位数 B.几何均数 C.均数 D.P百分位数9514. 0202.算术均数与中位数相比,其特点是:A.不易受极端值的影响B.能充分利用数据的信息C.抽样误差较大D.更适用于偏态分布资料15. 0203.将一组定量资料整理成频数表的主要目的是A.化为计数资料B.便于计算C.能够更精确地检验D. 描述数据的分布特征16. 0205. 变异系数主要用:A.比较不同计量指标的变异程度 B衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度17. 0206.对于正态或近似正态分布的资料,描述其变异程度应选用的指标A.变异系数B. 离均差平方和C.极差D. 标准差18. 0207.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应用:A. 四分位数间距B.标准差C.变异系数D.方差19. 0208.一组原始数据的分布呈正偏态分布,其数据的特点是:A.数值离散度大B.数值离散度小C.数值偏向较大的方向D.数值偏向较小的方向20. 0210在衡量数据的变异度时,标准差与方差相比,其主要特点是:A.标准差小于方差 C.标准差更容易计算C.标准差更为准确D. 标准差的计量单位与原始数据相同21. 0213.比较健康人群血肌酐和尿素氮的变异水平,应采用的指标是:A.标准差B.百分位数C.极差D. 变异系数22. 0214.中位数与算数均数相比,其特点是:A.容易计算B.计算出的结果更为可靠C.不易受异常值影响D.更适合对称分布的数据23. 0301.正态曲线拐点所对应的横坐标为:A.⎺X±SB. μ±σC. X±2SD. μ±1.96σ24. 0302.标准正态分布的形状参数和位置参数分别为:A 0,1B 1,0C μ,σD σ,μ25. 0303.正态分布N(μ,σ2),当μ恒定时,σ越大则:A.曲线沿横轴越向左移动B. 曲线形状和位置不变C.曲线越“瘦高”D.曲线越“矮胖”26. 0305.正态曲线下,横轴上从均数到+∞的面积为A.50%B.95%C.97.5%D.99%27. 0306. 若随机变量X服从N(μ,σ2 )的正态分布,则X的第97.5百分位数等于()A. μ+1.96σB.μ-1.64σC.μ-σD.μ+1.64σ28. 0308.某项指标95%医学参考值范围表示的是:A.在此范围“异常"的概率大于或等于95%B.在此范围“正常"的概率大于或等于95%C.在“异常”总体中有95%的人在此范围之外D.在“正常”总体中有95%的人在此范围29. 0309.确定某项指标的医学参考值范围时,“正常人”指的是:A.从未患过疾病的人B.患过疾病但不影响研究指标的人C.排除了患过某种疾病的人D.排除了影响研究指标的疾病或因素的人30. 0311.要评价某地区一名5岁男孩的身高是否偏高,其统计学方法是:A.用均数来评价 B 用参考值范围来评价C.用几何均数来评价D.用变异系数来评价31. 0401 如果一种新的治疗方法能够使不能治愈的疾病得到缓解并延长生命,则应发生的情况是( )A.该病患病率增加B.该病患病率减少C.该病的发病率增加D.该病的发病率减少32. 0402.计算乙肝疫苗接种后血清学检查的阳转率,分母为( )A.乙肝易感人数B.平均人口数C.乙肝疫苗接种人数D.乙肝患者人数33. 0403.计算标准化死亡率的目的是( )A.减少死亡率估计的偏倚B.减少死亡率估计的抽样误差C.便于进行不同地区死亡率的比较D.消除各地区内部构成不同的影响34. 0406.相对危险度RR的计算方法是( )A.两个标准化率之比B.两种不同疾病的发病人数之比C.两种不同疾病患病率之比D.两种不同条件下某疾病发生的概率之比35. 0407.比数比OR值表示的是( )A.两个标准化率的差别大小B.两种不同疾病的发病率差别程度C.两种不同疾病患病率差别程度D.两种不同条件下某疾病发生的危险性程度36. 0408.计算患病率时的平均人口数的计算方法是( )A.年初人口数和年末人口数的平均值B.全年年初的人口数C.全年年末的人口数D.生活满一年的总人口数37. 0409.死因构成比反映的是( )A.各种疾病发生的严重程度B.疾病发生的主要原因C.疾病在人群的分布情况D.各种死因的相对重要性38. 0410.患病率与发病率的区别是( )A.患病率高于发病率B.患病率低于发病率C.计算患病率不包括新发病例D.患病率与病程有关39. 0412.某地某年肝炎发病人数占同年传染病人数的10.1%,该指标属于( )A.相对比B.构成比C.发病率D.传染率40. 0413.某医师对其所在科室近5年某病住院患者进行了统计,结果发现该病患者农村人口200人,城镇人口50人,分别占80%与20%,则结论为( )A.农村人容易患该病B.城镇人容易患该病C农村城镇都易患该病 D.尚不能得出结论41. 0501统计表的主要作用是()A.便于形象描述和表达结果B.客表达验的原始数据C. 代替冗长的文字述和便于分析对比D.容易进行统计述和推断42. 0502.述某疾病患者年龄(岁)的分布,采用的统计图是()A.线图B.条图C.百分条图D.直方图43. 0503.高血压临床试验分为试验组和对照组分析考治疗0周、2周、4周6周、8周血压的动态变化和改善情况,为了直观显示出两组血压平均变动情况,宜选用的统计图是()A.半对数图B.线图C.条图D.直方图44. 0505.研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系,应绘制的图形是()A.直方图B.箱式图C.线图D.散点图45. 0506.下列统计图适用于构成比关系的()A.直方图B.箱式图C.误差条图、条图D.圆图、圆百分条46. 0507.对有些资料构造统计表时下列可以省略的是()A.标题B.标目 C线条 D.备注47. 0509.描述某现象频数分布情况应选择的是( )A.圆图B.百分条图C.箱式图D.直方图48. 0601.样本均数的标准误越小说明A.观察个体的变异越小B.由样本均数估计总体均数的可靠性越大C.由样本均数估计总体均数的可靠性越小D.抽样误差越大49. 0602抽样误差产生的原因是A.样本不是随机抽取B.测量不准确C资料不是正态分布 D.个体差异及抽样50. 0603.要减少抽样误差,通常的做法是A.减小系统误差B.将个体变异控制在一定范围内C减小标准差 D.适当增加样本含量51. 0604.对于正偏态分布的总体,当样本含量足够大时,样本均数的分布近似为A.正偏态分布B.负偏态分布C.正态分布D.t分布52. 0606.根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109-9.1×109/L,其含义是A.估计总体中有95%的观察值在此范围内B.总体均数在该区间的概率为95%C. 该区间包含总体均数的可能性为95%D.该区间包含样本均数的可能性为95%53. 0607.某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L该地正常成年人血清胆固醇均数95%的可信区间是A.3.64±1.96×1.20B.3.64±1.20C.3.64±1.96×1.20/√200D.3.64±2.58×1.20/√20054. 0609.假设检验差别有统计学意义时,P越小,说明A.样本均数差别越大B.总体均数差别越大C认为样本之间有差别的统计学证据越充分 D.认为总体之间有差别的统计学证据越充分55. 0610.关于假设检验,正确的说法是A检验水准必须设为0.05 B必须根据样本大小选择检验水准C必须采用双侧检验 D.必须建立无效假设56. 0611假设检验水准a指的是A.检验的置信度B.控制Ⅱ类错误的概率C.控制1类错误的概率D.无效假设的概率57. 0613.假设检验中的P值的含义是A.总体间有差别时出现现有样本及极端情况的概率B.总体间无差别时出现现有样本及极端情况的概率C.总体间有差别时H成立的概率D.总体间无差别时H成立的概率58. 0701.两样本均数之差的标准误反映的是A.两样本数据集中趋势的差别B. 两样本数据的变异程度C. 两样本均数之差的变异程度D. 数据的分布特征59. 0702. 两样本均数比较,检验结果P>0.05说明A.两总体均数的差别较小B.两总体均数的差别较大C.支持两总体无差别的结论D.不支持两总体有差别的结论60. 0706.增加t检验的检验效能,应该使用的方法是A.减小I类错误B.减小测量的系统误差C.减小测量的随机误差D. 增加样本量61. 0707. 以下不能用配对t检验方法的是(C)A比较15名肝癌患者癌组织和癌旁组织中Sirt1基因的表达量B.比较两种检测方法测量15名肝癌患者癌组织中Sirt1基因的表达量C.比较早期和晚期肝癌患者各15例癌组织中Sirt1基因的表达量D.比较糖尿病患者经某种药物治疗前后后糖化血红蛋白的变化62. 0709. 对于配对设计的t检验,其检验假设H0是A. 两样本均数相同B. 配对数据的差值总体均数为0C.两总体均数相同D.两总体均数不同63. 0801.方差分析的基本思想是A.组间均方大于组内均方B.组内均方大于组件均方C.不同来源的方差必须相等D.总变异及其自由度可按不同来源分解64. 0802.方差分析的应用条件之一是方差齐性,它是指A.各比较组相应的样本方差相等B.各比较组相应的总体方差相等C.组内方差等于组间方差D.总方差等于各组方差之和65. 0803.完全随机设计方差分析中的组间均方反映的是A.某因素效应大小B.随机测量误差大小C.全部数据的离散度D.处理因素效应与随机误差综合结果66. 0806 完全随机设计的多个样本均数比较,经方差分析,若P<0.05,则结论为:A 各样本均数全相等B 各样本均数全不相等C 至少有两个样本均数不等D 至少有两个总体均数不等67. 0814 在完全随机设计资料的方差分析中,已知总样本量为60,分为4个不同的处理组,则组内变异的自由度为A 3B 56C 57D 5968. 0901. 两样本率比较,差别具有统计学意义时,P值越小说明A.两样本率差别越大B.两总体率差别越大C.越有理由认为两样本率不同D.越有理由认为两总体率不同69. 0907当四个表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数是A 增大B 减小C 不变D 不确定70. 0911. 卡方检验的基本思想是A. 对总变异进行分解计算X2值B.根据总体间差别的大小计算X2值C.根据样本配对的情况计算X2值D.根据实际频数和理论频数的差异计算X2值71. 0912. 对三行四列表资料作X2检验,自由度为A. 1B. 2C. 6D. 372. 1001.对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是(A)A.适用范围广B.检验效能高C.检验结果更准确D.充分利用资料信息73. 1010 两样本比较的秩和检验中,甲组中最小数据有2个0.2,乙组中最小数据有3个0.2,则数据0.2对应的秩次为A 0.2B 1.0C 5.0D 3.074. 1011. 两样本比较的秩和检验,其应用条件是A. 两样本服从正态分布B. 两总体服从正态分布C. 两样本方差齐同D. 不受任何条件限制75. 1013.配对资料的符号秩和检验的无效假设是A. 两组配对的差值中位数为零B.两总体均数相同C.两总体分布位置相同D.两组配对的差值均数为零76. 1101,两数值变量的相关关系越强,对应的是A 相关系数越大B 回归系数越大C 相关系数的绝对值越大D 回归系数的绝对值越大77. 1105,1~17岁儿童可以用年龄(岁)估计体重(市斤)回归方程为y ^=14+4x,若将体重换成国际单位kg,则此方程A 常数项改变B 回归系数改变C 常数项和回归系数都改变D 常数项和回归系数都不改变78. 1106,对同一资料进行线性回归与相关分析时,下列正确的情形是A ρ=0时,r=0B ρ>0时,b>0C r>0时,b<0D r<0时,b<079. 1107下列双变量中,适用于进行线性相关分析的是A年龄与体重 B民族与血型C体重与体表面积D母亲文化水平与子女的智商80. 1108 若直线回归系数的假设检验结果p<0.05,则可认为两变量间A有密切的关系 B有一定的因果关系C相关关系密切D存在数量依存关系81. 1111用最小二乘法建立线性回归方程的原则是保证各实测点到回归直线的(B)A纵向距离的离均差最小B纵向距离的平方和最小C垂直距离相等 D垂直距离的平方和最小82. 1112,进行线性回归分析,合理的直观分析方法是A计算回归系数 B做回归直线C计算截距或常数项D绘制散点图83. 1501实验性研究随机化分组的目的是A.减少抽样误差B.减少实验例数C.提高检验效能D.保持各组的非处理因素均衡一致84. 1502.关于实验指标的准确度和精密度,正确的说法是A.精密度较准确度更重要B.准确度较精密度更重要C.精密度主要受随机误差的影响D.准确度主要受随机误差的影响85. 1503.在临床试验设计选择对照时,最高效的对照形式是(D)A.历史对照B.空白对照C.标准对照D.安慰剂对照86. 1504.实验没计的三大原则是A.随机、对照、自法B.随机、均衡、重复C.随机、对照、均衡D. 随机、对照、重复87. 1505.某医师研究某新药治疗缺血性脑卒中恢复期的临床疗效,对照组采用阳性药物溶栓胶囊,这属于A.空白对照B.历史对照C.标准对照D.安慰剂对照88. 1509.临床试验需要在设计阶段确定主要指标的目的是A.便于试验实施B.减少测量的随机误差C.减少非处理因素的影响D.避免结果的任意性89. 1511.观察性研究与实验性研究的主要区别是A.是否设立对照组B.是否以人为研究对象C.是否是抽样研究D.是否主动施加干预措施90. 1514.诊断试验中的灵敏度指的是(B)A.检测仪器的敏感性B.对患病的人检出的概率C.对未患病人检出的概率D.阳性预测值。
医学统计学习题及答案医学统计学是一门应用广泛的学科,它在医学研究和临床实践中扮演着重要的角色。
以下是一些医学统计学的基础习题及答案,供学习者参考。
习题一:描述性统计问题:某医院对100名患者的体重进行了测量,测得的平均体重为70公斤,标准差为10公斤。
请计算该组数据的变异系数。
答案:变异系数(Coefficient of Variation, CV)的计算公式为:\[ CV = \frac{标准差}{平均值} \times 100\% \]代入数据得:\[ CV = \frac{10}{70} \times 100\% \approx 14.29\% \]习题二:概率分布问题:假设某疾病的发病率为0.01,即每1000人中有1人患病。
如果随机抽取100人,求至少有1人患病的概率。
答案:使用二项分布的补数原理,计算没有人患病的概率,然后求其补数。
没有人患病的概率为:\[ P(0) = (1 - 0.01)^{100} \]至少有1人患病的概率为:\[ P(\geq 1) = 1 - P(0) \]习题三:假设检验问题:某药物对降低血压有显著效果。
在一项研究中,研究人员将100名高血压患者随机分为两组,每组50人。
一组接受药物治疗,另一组接受安慰剂。
治疗后,药物治疗组的平均血压降低了10毫米汞柱,而安慰剂组的平均血压降低了2毫米汞柱。
假设两组的血压降低量服从正态分布,标准差均为5毫米汞柱。
请问药物治疗是否显著优于安慰剂?答案:使用独立样本t检验来比较两组的血压降低量。
首先计算t值:\[ t = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s^2}{n_1} +\frac{s^2}{n_2}}} \]其中,\(\bar{X}_1\) 和 \(\bar{X}_2\) 分别是两组的平均血压降低量,\(s\) 是标准差,\(n_1\) 和 \(n_2\) 是样本大小。
代入数据得:\[ t = \frac{10 - 2}{\sqrt{\frac{5^2}{50} + \frac{5^2}{50}}} \]计算t值后,与t分布的临界值进行比较,如果t值大于临界值,则拒绝原假设,认为药物治疗显著优于安慰剂。
医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学练习及参考答案《医学统计学》练习题及参考答案一、填空题:1、频数分布通常具有集中趋势、离散趋势两个基本特征。
P412、统计表一般需有标题、线条(横线)、标目、数字四个基本结构。
3、四格表应用基本公式进行卡方检验的条件是:n≥40 、T≥5 。
4、正态分布的两个决定参数是:位置参数μ、形状参数。
P535、正态分布中央95%的观察值的分布区间是(μ-1.96σ,μ+1.96 σ)。
P536、概率抽样三个基本原则是:随机化原则、同质性原则、 n足够大。
7、实验设计的三大原则是对照、随机化、重复。
P20二、单项选择题:1.下面的变量中,属于分类变量的是---B--.A.脉搏 B.血型 C.肺活量 D.血压2. 已知我国部分县1988年死因构成比资料如下:心脏疾病11.41%,损伤与中毒11.56%,恶性肿瘤15.04%,脑血管病16.07%,呼吸系统病25.70%,其他20.22%.为表达上述死因的构成的大小,根据此资料应绘制统计图为--D---.A.线图 B.直方图 C.直条图 D.百分条图 E.统计地图 3. 在一项研究的最初检查中,人们发现30~40岁男女两组人群的冠心病患病率均为4%,于是,认为该年龄组男女两性发生冠心病的危险相同.这个结论是---C--. A.正确的B. 不正确的,因为没有可识别的队列人群 C.不正确的,因为没有区分发病率与患病率D.不正确的,因为用百分比代替率来支持该结论 E.不正确的,因为没有设立对照组 4. sx表示---C--.A.总体均数 B. 总体均数离散程度 C. 样本均数的标准差 D.变量值x的离散程度 E.变量值x的可靠程度5.做两个总体均数比较t检验,计算t>t0.01,(n1+n2-2时,可以认为-B----.A.反复随机抽样时,出现这种大小的均数差异的可能性大于0.01B.样本均数差异是由随机抽样误差所致的可能性小于0.01,可认为两总体有差别。