中医药统计学题解
- 格式:doc
- 大小:309.50 KB
- 文档页数:6
医学统计学练习题与答案⼀、单向选择题1. 医学统计学研究的对象是 E.有变异的医学事件2. ⽤样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是 D.病情程度4. 随机误差指的是 E. 由偶然因素引起的误差5. 收集资料不可避免的误差是 A.随机误差1.某医学资料数据⼤的⼀端没有确定数值,描述其集中趋势适⽤的统计指标是A. 中位数2. 算术均数与中位数相⽐,其特点是 B.能充分利⽤数据的信息3. ⼀组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较⼩⼀侧4. 将⼀组计量资料整理成频数表的主要⽬的是E.提供数据和描述数据的分布特征1. 变异系数主要⽤于 A .⽐较不同计量指标的变异程度2. 对于近似正态分布的资料,描述其变异程度应选⽤的指标是E. 标准差3.某项指标95%医学参考值范围表⽰的是D.在“正常”总体中有95%的⼈在此范围4.应⽤百分位数法估计参考值范围的条件是B .数据服从偏态分布5.已知动脉硬化患者载脂蛋⽩B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使⽤ E .四分位数间距1.样本均数的标准误越⼩说明 E.由样本均数估计总体均数的可靠性越⼤2. 抽样误差产⽣的原因是D.个体差异3.对于正偏态分布的的总体,当样本含量⾜够⼤时,样本均数的分布近似为C.正态分布4. 假设检验的⽬的是 D.检验总体参数是否不同5. 根据样本资料算得健康成⼈⽩细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是 E.该区间包含总体均数的可能性为95%1. 两样本均数⽐较,检验结果05.0 P 说明 D.不⽀持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指E. 有理由认为两总体均数有差别3. 两样本均数⽐较,差别具有统计学意义时,P 值越⼩说明 D.越有理由认为两总体均数不同4. 减少假设检验的Ⅱ类误差,应该使⽤的⽅法是 E.增加样本含量5.两样本均数⽐较的t 检验和u 检验的主要差别是B.u 检验要求⼤样本资料1. 利⽤2χ检验公式不适合解决的实际问题是C.两组有序试验结果的药物疗效2.欲⽐较两组阳性反应率, 在样本量⾮常⼩的情况下(如1210,10n n <<), 应采⽤C.Fisher 确切概率法⼆、简答题1.抽样中要求每⼀个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
一、单向选择题1。
医学统计学研究的对象是 E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是E 。
依照随机原则抽取总体中的部分个体3。
下列观测结果属于等级资料的是 D.病情程度4. 随机误差指的是 E 。
由偶然因素引起的误差5. 收集资料不可避免的误差是 A.随机误差1。
某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是A 。
中位数2. 算术均数与中位数相比,其特点是 B 。
能充分利用数据的信息3. 一组原始数据呈正偏态分布,其数据的特点是 D 。
数值分布偏向较小一侧4. 将一组计量资料整理成频数表的主要目的是E 。
提供数据和描述数据的分布特征1. 变异系数主要用于 A .比较不同计量指标的变异程度2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差3.某项指标95%医学参考值范围表示的是D 。
在“正常"总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl )呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距1.样本均数的标准误越小说明 E 。
由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是D 。
个体差异3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布4。
假设检验的目的是 D 。
检验总体参数是否不同5。
根据样本资料算得健康成人白细胞计数的95%可信区间为7。
2×109/L ~9。
1×109/L ,其含义是 E 。
该区间包含总体均数的可能性为95%1. 两样本均数比较,检验结果05.0 P 说明 D 。
不支持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指E. 有理由认为两总体均数有差别3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同4。
表1-1 ××病感染按性别、年龄整理表(问题表) 性别 年龄(岁) 合计 男 女 0~ 5~ 10~ 15~ 调查人数感染人数表1-2 ××病感染按性别、年龄整理表(正确表) 年龄组 男 女 调查人数 感染人数 调查人数 感染人数0~ 5~ 10~ 15~ 合计 第一节 中医药统计学的意义和内容中医药统计学(Statistics for Traditional Chinese Medicine )是将数理统计的原理和方法应用于生物医药特别是中医中药科研,收集、整理和分析资料,推断和表达不确定现象客观数量规律的一门应用学科。
中医药统计学的主要内容包括统计学基本理论和统计分析方法,统计分析方法包括统计设计(statistical design )、统计描述(statistical description )和统计推断(statistical inference ),表达因素间的关系、生存分析、多元分析等。
例如,表1-1,由于将性别与年龄这两个有联系的项目分割开来,计算不出不同性别、年龄的感染率,丧失了有价值的信息,为了克服上述缺点,应采用表1-2的整理表。
又如,第六章例6-1表6-2两种疗法的疗效资料,治愈率按治愈数/治疗数计算,从病情重、中、轻三种情形来看,都是甲疗法治愈率低于乙疗法。
但是,合计起来却是乙疗法治愈率低于甲疗法。
不作统计处理,就不能得到正确的疗效结论。
再如,第九章例9- 表9- 资料,怎样判断降压宁的疗效,需要一定的理论和方法,才能从表9- 的观测数据推理到任何高血压患者服用降压宁后的疗效。
因此,国家中医药管理局规定,未经统计处理的数据是无效数据。
中医药科研的基本步骤包括立题,设计,实施试验,收集整理分析试验所得信息和资料,均需用到中医药统计学的思维和方法。
我国的《药品注册管理办法》规定,新药临床试验必须自始至终有统计学人员参与;生物医药实验室研究、临床研究和医药公共事业管理都要寻求统计学家的帮助。
精心整理实习一统计学基础?一、是非题1.统计学是一门研究数据的设计、收集、整理、分析和表达的科学。
() 2.概率是描述随机事件发生可能性大小的一个度量。
() 3.设计是影响研究成功与否的最关键环节。
()4.对5.6.7.8.()1.A .2A C .研究对象之间个体差异很小D .研究对象的测量指标变异很小 E .以上都不对3.从总体中随机抽取样本的目的是。
A .研究样本统计量B .研究总体参数C .研究抽样误差D .由样本统计量推断总体参数E .计算样本统计指标 4.抽样误差是指。
A.个体指标值与参数值之差B.个体指标值与样本统计量值之差C.样本统计量值与参数值之差D.个体指标值与个体指标值之差E.以上都对5.欲研究某地成年男性血红蛋白的参考值范围,现随机调查了该地12000名健康成年男性的血红蛋白,那么本次调查的总体是。
A.该地所有成年男性B.该地所有成年男性的血红蛋白值C.E.6.A.C.7.A.C.E.8.A.C.测量误差和抽样误差不可避免D.三种误差都不可避免E.三种误差都可以避免9.统计分析的主要内容有。
A.统计描述和正常值范围的估计B.统计描述和可信区间的估计C.统计图表和与假设检验D.统计描述和统计推断E.统计预测与统计控制10.统计工作的步骤为。
A.研究设计、调查、整理资料、分析资料B.研究设计、试验、整理资料、统计推断C.研究设计、搜集资料、整理资料、分析资料D.研究设计、调查和试验、统计描述、统计推断E.研究设计、统计描述、统计推断、统计图表三、简答题1.医学统计工作的基本步骤是什么?2.中医药院校学生为什么要学习统计学?123451.关于统计表的制作,不正确的叙述是。
A.统计表不用竖线或斜线分隔纵标目和数据B.统计表的标题放在表的上方C.统计表包含的内容越多越好D.统计表中的数字按小数点位次对齐E.用横标目和纵标目说明数字的意义和单位2.关于统计表的列表原则,错误的是。
A.标题在表的上端,“简要说明表的内容”B.横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧C.线条主要有顶线、底线和纵标目下的横线,不宜有斜线和竖线DE3AD4ACE.以对数的1/2值作纵横轴尺度5.半对数线图。
中医药统计学与软件应用笔记重点绪论统计学家C.R。
劳先生在《统计与真理-—怎样运用偶然性》中指出:在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学.一、统计学的概念、发展简史及主要内容1。
统计学:是以概率论和数理统计为基础,对研究对象的数据进行搜集、整理和分析,揭示事物总体特征和规律的方法论科学。
2。
中医统计学:是以概率论和数理统计的原理和方法为基础,以中医理论与实践为主体,通过对数据的搜集、整理和分析,达到探讨中医理论与方法内在规律的目的。
3.统计学的发展趋势:①依赖数学.②与计算机技术结合。
③与实质性学科、统计软件、现代信息相结合,所发挥的功效日益增强。
④从描述事物现状、反映事物规律,向抽样推断、预测未来变化方向发展.4.统计学的主要内容⑴研究设计:专业设计、统计学设计⑵统计学的基本概念、原理和思维方法⑶统计描述:统计指标、统计图表⑷统计推断:参数估计、假设检验二、统计工作的基本步骤和特点1。
统计工作的基本步骤(1)统计学设计(2)搜集资料:①常规保存的记录;②现场调查记录;③实验/试验记录;④医学文献/网络信息.(3)整理资料:①检查;②审核;③计算机检查;④分组。
(4)分析资料2。
统计学认识现象的特点24347 5F1B 弛25964 656C 敬{cMW(1)数量性:(2)群体性:(3)具体性:(4)概率性:三、统计学中常用的概念1.总体(population):是根据研究目的确定的同质观察单位的集合。
例①河北省18岁男性的身高和体重分布②某性红地2005年健康成年男细胞数③河北省18岁身高在170-175cm男性的体重分布⑴有限总体:指总体限定于特定的空间、时间范围内有限个观察单位。
⑵无限总体:指没有空间和时间范围限制的总体.2.样本(sample):从总体中随机抽取的有代表性的一部分观察单位的集合。
样本的可靠性:指总体确定后,样本中的每一个观察单位确属预先规定的同质总体。
一、单向选择题1. 医学统计学研究的对象是 E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是 D.病情程度4. 随机误差指的是 E. 由偶然因素引起的误差5. 收集资料不可避免的误差是 A.随机误差1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大2. 抽样误差产生的原因是D.个体差异3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布4. 假设检验的目的是 D.检验总体参数是否不同5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L ~9.1×109/L ,其含义是 E.该区间包含总体均数的可能性为95%1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料 1. 利用2χ检验公式不适合解决的实际问题是C.两组有序试验结果的药物疗效 2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用C.Fisher 确切概率法 二、简答题1.抽样中要求每一个样本应该具有哪三性?从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。
医 学 统 计 练 习 题第一章 医学统计中的基本概念一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗 E .有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A .总体中最容易获得的部分个体B .在总体中随意抽取任意个体C .挑选总体中的有代表性的部分个体D .用配对方法抽取的部分个体E .依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是A .收缩压测量值B .脉搏数C .住院天数D .病情程度E .四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差第二章 计量资料的统计描述一、单项选择题1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 B. 几何均数 C. 均数 D.95P 百分位数E. 频数分布2. 算术均数与中位数相比,其特点是A .不易受极端值的影响B .能充分利用数据的信息C .抽样误差较大D .更适用于偏态分布资料E .更适用于分布不明确资料3. 6人接种流感疫苗一个月后测定抗体滴度为 1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是A. 均数B. 几何均数C. 中位数D. 百分位数E. 倒数的均数4. 变异系数主要用于A .比较不同计量指标的变异程度 B. 衡量正态分布的变异程度 C. 衡量测量的准确度 D. 衡量偏态分布的变异程度 E. 衡量样本抽样误差的大小5. 对于近似正态分布的资料,描述其变异程度应选用的指标是 A. 变异系数 B. 离均差平方和 C. 极差 D. 四分位数间距E. 标准差6. 某项指标95%医学参考值范围表示的是A. 检测指标在此范围,判断“异常”正确的概率大于或等于95%B. 检测指标在此范围,判断“正常”正确的概率大于或等于95%C. 在“异常”总体中有95%的人在此范围之外D. 在“正常”总体中有95%的人在此范围E. 检测指标若超出此范围,则有95%的把握说明诊断对象为“异常” 7.应用百分位数法估计参考值范围的条件是A .数据服从正态分布B .数据服从偏态分布C .有大样本数据D .数据服从对称分布E .数据变异不能太大8.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用A .全距B .标准差C .变异系数D .方差E .四分位数间距二、计算与分析1. 某地100例30-40岁健康男子血清总胆固醇值(mg/dl )测定结果如下:202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174 228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149 159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224 221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182 234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156 (1)编制频数分布表;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;(3)计算标准差和百分位数25P、75P 。
山东中医药大学医学统计学期末考试复习题在线作业、在线考试题库(复制快捷键:Ctrl+C 查找快捷键:Ctrl+F)一、单选题1.(1分)下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型参考答案:D2.(1分)两样本均数比较,差别具有统计学意义时,P值越小说明A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两样本均数不同D.越有理由认为两总体均数不同E.越有理由认为两样本均数相同参考答案:D3.(1分)收集资料不可避免的误差是A.随机误差B.系统误差C.过失误差D.记录误差E.仪器故障误差参考答案:A4.(1分)减少假设检验的Ⅱ类误差,应该使用的方法是A.减少Ⅰ类错误B.减少测量的系统误差C.减少测量的随机误差D.提高检验界值E.增加样本含量参考答案:E5.(1分)对于近似正态分布的资料,描述其变异程度应选用的指标是A.变异系数B.离均差平方和C.极差D.四分位数间距E.标准差参考答案:E6.(1分)方差分析的应用条件之一是方差齐性,它是指A.各比较组相应的样本方差相等B.各比较组相应的总体方差相等C.组内方差=组间方差D.总方差=各组方差之和E.总方差=组内方差+组间方差参考答案:B7.(1分)两样本均数比较的t检验和u检验的主要差别是A.t检验只能用于小样本资料B.u检验要求大样本资料C.t检验要求数据方差相同D.u检验要求数据方差相同E.u检验能用于两大样本均数比较参考答案:B8.(1分)变异系数主要用于A.比较不同计量指标的变异程度B.衡量正态分布的变异程度C.衡量测量的准确度D.衡量偏态分布的变异程度E.衡量样本抽样误差的大小参考答案:A9.(1分)由两样本均数的差别推断两总体均数的差别,其差别有统计学意义是指A.两样本均数的差别具有实际意义B.两总体均数的差别具有实际意义C.两样本和两总体均数的差别都具有实际意义D.有理由认为两样本均数有差别E.有理由认为两总体均数有差别参考答案:E10.(1分)随机误差指的是A.测量不准引起的误差B.由操作失误引起的误差C.选择样本不当引起的误差D.选择总体不当引起的误差E.由偶然因素引起的误差参考答案:E11.(1分)卡方检验中自由度的计算公式是A.行数×列数B.n-1C.N-kD.(行数-1)(列数-1)E.行数×列数-1参考答案:D12.(1分)某种新疗法治疗某病患者41人,治疗结果如下:治疗结果治愈显效好转恶化死亡治疗人数823631该资料的类型是:A.计数资料B.计量资料C.无序分类资料D.有序分类资料E.数值变量资料参考答案:D13.(1分)统计工作的步骤正确的是A.收集资料、设计、整理资料、分析资料B.收集资料、整理资料、设计、统计推断C.设计、收集资料、整理资料、分析资料D.收集资料、整理资料、核对、分析资料E.搜集资料、整理资料、分析资料、进行推断参考答案:C14.(1分)标准差越大的意义,下列认识中错误的是A.观察个体之间变异越大B.观察个体之间变异越小C.样本的抽样误差可能越大D.样本对总体的代表性可能越差E.以上均不对参考答案:B15.(1分)作四格表卡方检验,当N>40,且__________时,应该使用校正公式A.T<5B.T>5C.T>1D.T<1E.1<T<5参考答案:E16.(1分)统计资料的类型包括。
医学统计学(安徽中医药大学)智慧树知到课后章节答案2023年下安徽中医药大学第一章测试1.医学统计工作的步骤为( )A:统计研究调查、统计描述、统计推断、统计图表B:统计资料收集、整理资料、统计描述、统计推断 C:统计研究设计、统计描述、统计推断、统计图表 D:统计研究调查、搜集资料、整理资料、分析资料 E:统计研究设计、搜集资料、整理资料、分析资料答案:统计研究设计、统计描述、统计推断、统计图表2.统计分析的主要内容有( )A:区间估计与假设检验 B:统计图表和统计报告 C:统计描述和统计推断 D:统计描述和统计图表 E:统计描述和统计学检验答案:统计描述和统计推断3.医学统计学研究的对象是( )A:医学中的小概率事件 B:疾病的预防与治疗 C:动物和人的本质 D:有变异的医学事件 E:各种类型的数据答案:疾病的预防与治疗4.用样本推论总体,具有代表性的样本指的是( )A:总体中最容易获得的部分个体 B:在总体中随意抽取任意个体 C:用配对方法抽取的部分个体 D:依照随机原则抽取总体中的部分个体 E:挑选总体中的有代表性的部分个体答案:依照随机原则抽取总体中的部分个体5.下列观测结果属于等级资料的是( )A:病情程度 B:四种血型 C:住院天数 D:脉搏数 E:收缩压测量值答案:收缩压测量值6.对于无限总体我们采用抽样方式进行研究,而对于有限总体,不用抽样()A:对 B:错答案:错7.统计量是随机的,会随着抽样方法、样本量和测量方法而发生变化()A:对B:错答案:对8.系统误差不可以避免,也没有倾向性()A:错 B:对答案:错9.随机误差因为随机而没有规律,因此无法估计和控制()A:错 B:对答案:对10.小概率事件原理是统计推断的基础,基于其推断的结果,依然会出错的可能性()A:错 B:对答案:对11.同一变量的不同数据类型是可以转换的()A:对 B:错答案:对12.只要进行随机化抽样,得到的样本统计量就有很好的代表性A:对 B:错答案:对第二章测试1.从偏态总体抽样,当n足够大时(比如n > 60),样本均数的分布()A:近似正态分布 B: 近似对称分布 C:仍为偏态分布 D: 近似对数正态分布答案:仍为偏态分布2.医学中确定参考值范围时应注意()A:正态分布资料不能用均数标准差法 B:偏态分布资料不能用百分位数法 C:正态分布资料不能用百分位数法 D:偏态分布资料不能用均数标准差法答案:偏态分布资料不能用百分位数法3.计算样本资料的标准差这个指标()A:不会比均数小 B:不会比均数大 C:决定于均数 D:不决定于均数答案:决定于均数4.中位数永远等于均数A:错 B:对答案:对5.中位数永远等于P50A:对 B:错答案:错6.标准差大于标准误A:对 B:错答案:错7.标准误大,则抽样误差大A:错 B:对答案:对8.数值变量分布包括集中趋势和离散趋势两方面A:对 B:错答案:错第三章测试1.影响总体率估计的抽样误差大小的因素是()A: 检验的把握度和样本含量 B:总体率估计的容许误差 C:总体率和样本含量 D: 样本率估计的容许误差 E: 检验水准和样本含量答案: 检验的把握度和样本含量2.检验效能是指如果总体间确实存在差异,按照检验水准α能够发现该差异的能力()A:错 B:对答案:错3.如果H0假设为μ1=μ2,那么H1假设可能为( )A:μ1 B:μ1>μ2 C:μ1≠μ2D:μ1≥μ2 E:μ1≤μ2 答案:μ1;μ1≠μ2;μ1≥μ24.假设检验中α和β是跷跷板的关系A:错 B:对答案:错5.参数估计和假设检验均可以进行总体参数是否有差异的判定方法()A:对 B:错答案:错6.总体率参数估计肯定可以用正态分布法A:对 B:错答案:错7.在抽样研究中,当样本例数逐渐增多时()A:标准误逐渐减小 B:标准误逐渐加大 C:标准差逐渐加大 D:标准差逐渐减小答案:标准误逐渐减小8.当n足够大,且np和n(1-p)均大于5时,总体率的95%可信区间用()式求出。
山东中医药大学医药数理统计学期末考试复习题一、单选题1. (1分)若随机事件A,B的概率分别为0.6和0.7,则A与B一定A. 相互对立B. 相互独立C. 互不相容D. 相容参考答案: D2. (1分)设随机变量X服从参数为3的泊松分布,则D(2X+1)等于A. 12B. 13C. 7D. 6参考答案: A3. (1分)要检验两个正态总体均值是否相等,小样本时,我们应做A. t检验B. u检验C. 卡方检验D. F检验参考答案: A4. (1分)设随机变量X~N(1,4),已知Φ(1)=0.8413,为使P{X<a}<0.8413,则常数a<A. 1B. 3C. -2D. -3参考答案: B5. (1分)要检验两个正态总体均值是否相等,大样本时,我们应做A. t检验B. u检验C. 卡方检验D. F检验参考答案: B6. (1分)利用四格表检验两个总体率是否相等,n大于40且存在理论值Eij大于1但小于5时,我们应用A. Pearson卡方检验B. 校正的Pearson卡方检验C. Fisher确切概率法D. Ridit分析参考答案: B7. (1分)要检验正态总体的方差是否发生改变,我们应做A. t检验B. u检验C. 卡方检验D. F检验参考答案: C8. (1分)设P(A)=0.4,设P(B)=0.3,设P(A+B)=0.6,求P(A-B)A. 0.4B. 0.3C. 0.6D. 0.7参考答案: B解析先求P(AB)9. (1分)若要以小样本检验正态总体均值是否为某常数,应选择统计量A. tB. uC. 卡方D. F参考答案: A10. (1分)在假设检验问题中,犯第一类错误的概率α的意义是A. 在H0不成立的条件下,经检验H0被拒绝的概率B. 在H0不成立的条件下,经检验H0被接受的概率C. 在H0成立的条件下,经检验H0被拒绝的概率D. 在H0成立的条件下,经检验H0被接受的概率参考答案: C11. (1分)什么条件下使用泊松近似计算二项分布中的随机事件的概率较为合适A. n很小,p很小B. n很大,p很小C. n很大,p很大D. n很小,p很大参考答案: B。
表1-1 ××病感染按性别、年龄整理表(问题表) 性别 年龄(岁) 合计 男 女 0~ 5~ 10~ 15~ 调查人数感染人数表1-2 ××病感染按性别、年龄整理表(正确表) 年龄组 男 女 调查人数 感染人数 调查人数 感染人数0~ 5~ 10~ 15~ 合计 第一节 中医药统计学的意义和内容中医药统计学(Statistics for Traditional Chinese Medicine )是将数理统计的原理和方法应用于生物医药特别是中医中药科研,收集、整理和分析资料,推断和表达不确定现象客观数量规律的一门应用学科。
中医药统计学的主要内容包括统计学基本理论和统计分析方法,统计分析方法包括统计设计(statistical design )、统计描述(statistical description )和统计推断(statistical inference ),表达因素间的关系、生存分析、多元分析等。
例如,表1-1,由于将性别与年龄这两个有联系的项目分割开来,计算不出不同性别、年龄的感染率,丧失了有价值的信息,为了克服上述缺点,应采用表1-2的整理表。
又如,第六章例6-1表6-2两种疗法的疗效资料,治愈率按治愈数/治疗数计算,从病情重、中、轻三种情形来看,都是甲疗法治愈率低于乙疗法。
但是,合计起来却是乙疗法治愈率低于甲疗法。
不作统计处理,就不能得到正确的疗效结论。
再如,第九章例9- 表9- 资料,怎样判断降压宁的疗效,需要一定的理论和方法,才能从表9- 的观测数据推理到任何高血压患者服用降压宁后的疗效。
因此,国家中医药管理局规定,未经统计处理的数据是无效数据。
中医药科研的基本步骤包括立题,设计,实施试验,收集整理分析试验所得信息和资料,均需用到中医药统计学的思维和方法。
我国的《药品注册管理办法》规定,新药临床试验必须自始至终有统计学人员参与;生物医药实验室研究、临床研究和医药公共事业管理都要寻求统计学家的帮助。
实习一统计学基础一、是非题1.统计学是一门研究数据的设计、收集、整理、分析和表达的科学。
( )2.概率是描述随机事件发生可能性大小的一个度量。
( )3.设计是影响研究成功与否的最关键环节。
( )4.对200例患者外周血的红细胞进行计数所得的资料为计数资料。
( )5.统计分析包括统计描述和统计推断。
( )6.计量资料、计数资料和等级资料可根据研究目的和分析的需要而相互转化。
( ) 7.欲了解中国40岁以上人口的高血压患病率,现对某地40岁以上人口进行调查,所得到的患病率是一个统计量。
( )8.统计推断的目的是由样本信息推断总体特征,因此,样本应该是有代表性的一部分。
( )二、最正确选择题1.统计学中对总体的要求是。
A.有限的B.同质的C.随机的D.典型的E.大量的2.统计中所说的同质是指。
A.研究指标的可控制的主要影响因素相同B.研究指标的不可控制的主要影响因素相同C.研究对象之间个体差异很小D.研究对象的测量指标变异很小E.以上都不对3.从总体中随机抽取样本的目的是。
A.研究样本统计量B.研究总体参数C.研究抽样误差D.由样本统计量推断总体参数E.计算样本统计指标4.抽样误差是指。
A.个体指标值与参数值之差B.个体指标值与样本统计量值之差C.样本统计量值与参数值之差D.个体指标值与个体指标值之差E.以上都对5.欲研究某地成年男性血红蛋白的参考值范围,现随机调查了该地12000名健康成年男性的血红蛋白,那么本次调查的总体是。
A.该地所有成年男性B.该地所有成年男性的血红蛋白值C.该地所有健康成年男性的血红蛋白值D.抽取的这12000名健康成年男性E.抽取的这12000名健康成年男性的血红蛋白值6.某医生对200名糖尿病患者采用某新疗法进行治疗,该研究的总体是。
A.全院收治的糖尿病患者B.该医生收治的所有糖尿病患者C.接受该新疗法的所有糖尿病患者D.所有糖尿病患者E.这200名糖尿病患者7.以下对概率描述错误的选项是。
实习一统计学基础一、是非题1.统计学是一门研究数据的设计、收集、整理、分析和表达的科学。
( )2.概率是描述随机事件发生可能性大小的一个度量。
( )3.设计是影响研究成功与否的最关键环节。
( )4.对200例患者外周血的红细胞进行计数所得的资料为计数资料。
( )5.统计分析包括统计描述和统计推断。
( )6.计量资料、计数资料和等级资料可根据研究目的和分析的需要而相互转化。
( ) 7.欲了解中国40岁以上人口的高血压患病率,现对某地40岁以上人口进行调查,所得到的患病率是一个统计量。
( )8.统计推断的目的是由样本信息推断总体特征,因此,样本应该是有代表性的一部分。
( )二、最佳选择题1.统计学中对总体的要求是。
A.有限的 B.同质的 C.随机的 D.典型的E.大量的2.统计中所说的同质是指。
A.研究指标的可控制的主要影响因素相同 B.研究指标的不可控制的主要影响因素相同C.研究对象之间个体差异很小 D.研究对象的测量指标变异很小E.以上都不对3.从总体中随机抽取样本的目的是。
A.研究样本统计量 B.研究总体参数C.研究抽样误差D.由样本统计量推断总体参数 E.计算样本统计指标4.抽样误差是指。
A.个体指标值与参数值之差 B.个体指标值与样本统计量值之差C.样本统计量值与参数值之差 D.个体指标值与个体指标值之差E.以上都对5.欲研究某地成年男性血红蛋白的参考值范围,现随机调查了该地12000名健康成年男性的血红蛋白,那么本次调查的总体是。
A.该地所有成年男性B.该地所有成年男性的血红蛋白值C.该地所有健康成年男性的血红蛋白值 D.抽取的这12000名健康成年男性E.抽取的这12000名健康成年男性的血红蛋白值6.某医生对200名糖尿病患者采用某新疗法进行治疗,该研究的总体是。
A.全院收治的糖尿病患者 B.该医生收治的所有糖尿病患者C.接受该新疗法的所有糖尿病患者 D.所有糖尿病患者E.这200名糖尿病患者7.以下对概率描述错误的是。
第一章测试1.参数是指总体的统计指标。
()A:对B:错答案:A2.概率的取值范围为[-1,1]。
()A:对B:错答案:B3.统计学中资料类型包括()A:离散型资料B:等级资料C:计数资料D:计量资料E:连续型资料答案:BCD4.医学统计学的研究内容包括研究设计和研究分析两个方面。
()A:对B:错答案:A5.样本应该对总体具有代表性。
()A:对B:错答案:A第二章测试1.抽样单位的数目越大,抽样误差越大。
()A:对B:错答案:B2.以下不属于概率抽样的是()A:分层抽样B:简单随机抽样C:整群抽样D:雪球抽样E:多阶段抽样答案:D3.整群抽样的优点()A:抽样误差大B:易于理解,简单易行C:节省经费,容易控制调查质量D:均数及标准差计算简便E:减少抽样误差答案:B4.概率抽样主要包括简单随机抽样、分层抽样、系统抽样、整群抽样和便利抽样。
()A:对B:错答案:B5.进行分层抽样时要求()A:各群内差异相同B:无要求C:群间差异越小越好D:各群内差异越小越好E:群间差异越大越好答案:D第三章测试1.在正态性检验中,P>0.05时可认为资料服从正态分布。
()A:错B:对答案:B2.在两样本均数比较的t检验中,无效假设是()A:两样本均数相等B:两总体均数相等C:样本均数等于总体均数D:两样本均数不等E:两总体均数不等答案:B3.在两样本率比较的卡方检验中,无效假设是()A:样本率等于总体率B:两总体率不等C:两样本率相等D:两总体率相等E:两样本率不等答案:D4.配对设计资料,若满足正态性和方差齐性。
要对两样本均数的差别作比较,可选择()A:秩和检验B:完全随机设计方差分析C:u检验D:配对t检验E:卡方检验答案:D5.用最小二乘法确定直线回归方程的原则是各观测点距直线纵向距离平方和最小。
()A:对B:错答案:A第四章测试1.定量数据即计量资料()A:对B:错答案:A2.定量数据的统计描述包括集中趋势、离散趋势和频数分布特征。
中医药统计学与软件应用笔记重点绪论统计学家 C.R.劳先生在《统计与真理——怎样运用偶然性》中指出:在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。
一、统计学的概念、发展简史及主要内容1.统计学:是以概率论和数理统计为基础,对研究对象的数据进行搜集、整理和分析,揭示事物总体特征和规律的方法论科学。
2.中医统计学:是以概率论和数理统计的原理和方法为基础,以中医理论与实践为主体,通过对数据的搜集、整理和分析,达到探讨中医理论与方法内在规律的目的。
3.统计学的发展趋势:①依赖数学。
②与计算机技术结合。
③与实质性学科、统计软件、现代信息相结合,所发挥的功效日益增强。
④从描述事物现状、反映事物规律,向抽样推断、预测未来变化方向发展。
4.统计学的主要内容⑴研究设计:专业设计、统计学设计⑵统计学的基本概念、原理和思维方法⑶统计描述:统计指标、统计图表⑷统计推断:参数估计、假设检验二、统计工作的基本步骤和特点1.统计工作的基本步骤(1)统计学设计(2)搜集资料:①常规保存的记录;②现场调查记录;③实验/试验记录;④医学文献/网络信息。
(3)整理资料:①检查;②审核;③计算机检查;④分组。
(4)分析资料2.统计学认识现象的特点(1)数量性:(2)群体性:(3)具体性:(4)概率性:三、统计学中常用的概念1.总体(population):是根据研究目的确定的同质观察单位的集合。
例①河北省18岁男性的身高和体重分布②某性红地2005年健康成年男细胞数③河北省18岁身高在170-175cm男性的体重分布⑴有限总体:指总体限定于特定的空间、时间范围内有限个观察单位。
⑵无限总体:指没有空间和时间范围限制的总体。
2.样本(sample):从总体中随机抽取的有代表性的一部分观察单位的集合。
样本的可靠性:指总体确定后,样本中的每一个观察单位确属预先规定的同质总体。
样本的代表性:即样本能够充分反映总体的真实情况。
统计描述1. 分析→描述统计→频率→统计量N Valid 20Missing 0Mean 均数475.3500Std. Error of Mean 均数的标准误13.76748Median 中位数485.5000Mode 众数334.00aStd. Deviation 标准差61.57005Variance 方差3790.871Skewness 偏度系数-.321Std. Error of Skewness .512Kurtosis 峰度系数.054Std. Error of Kurtosis .992Range 极差,全距251.00Minimum 最小值334.00Maximum 最大值585. 0Sum 合计9507.00Percentiles 25 435.500050 485.500075 523.5000a. Multiple modes exist. The smallest value is shown2. 分析→描述统计→探索→绘制带检验的正态图Tests of NormalityKolmogorov-Smirnov a(大样本)Shapiro-Wilk(n≤50,小样本)Statistic df Sig. Statistic df Sig.VAR 0001 .099 20 .200*.982 20 .958a. Lilliefors Significance Correction*. This is a lower bound of the true significance.一、统计量n=20,均数x_=475.35 ,中位数M=485.50,众数M o= 334.00,P25= 435.50 , P75=523.50 , X max=585.00, X min=224.00,R=251.00,方差S2=3790.87,标准差S=61.57二、正态检验①假设:H0:数据分布与正态分布无差异,H1:数据分布与正态分布有差异,α=0.05,双侧检验。
《中医药统计学》习题解答1 总体分布题解习题1.1解答1. 对三人做舌诊算一次试验。
设A ={3人正常}、B ={至少1人不正常}、C ={只有1人正常}、D ={只有1人不正常}。
分析这四个事件中的互斥事件、对立事件,描述事件A +D 、BD 各表示什么意思?解 设A i ={第i 人正常},用A i 表示A 、B 、C 、D 得到A ={三人正常}=321A A AB ={至少一人不正常}=321321321321321321321A A A A A A A A A A A A A A A A A A A A A ++++++ C ={只有一人正常}=321321321A A A A A A A A A ++ D ={只有一人不正常}=321321321A A A A A A A A A ++可以看出,互斥事件有A 与B ,A 与C ,A 与D ,C 与D ,A 与C 、D ;对立事件有A 与B 。
A +D =321A A A +321321321A A A A A A A A A ++={至少2人正常}={至多1人不正常}BD =321321321A A A A A A A A A ++={只有1人不正常}={只有2人正常}=D2. 我国四个地区一年的生育情况如表1-2所示,求生男孩的概率。
解 设A ={生男孩},计算得到)()(A f A P n ≈9645731022811994101990993496986528072514765513654++++++==0.51693. 在40个药丸中有3丸失效,任取5丸,求其中有2丸失效的概率。
解 这是古典概率模型。
在40个药丸中任取5丸,每一个药丸均可能被取到,且被取到表1-2 四个地区生育情况 地区编号生育总数 生男孩数 1 990 993 513 654 2 994 101 514 765 3 1 022 811 528 072 4964 573496 986的可能性相等,可能结果有540C 个基本事件。
设A ={5丸取到2丸失效},则A 包含33723C C 个基本事件,由古典定义得到54033723)(C C C A P ==0.0354 4. 在100支针剂中有10支次品,任取5支,求全是次品的概率及有2支次品的概率。
解 这是古典概率模型。
在100支针剂中任取5支,可能结果有5100C 个基本事件。
设A ={5支全次品}、B ={5支取2支次品},则A 、B 包含510C 、390210C C 个基本事件,得5100510)(C C A P ==0.000003,5100390210)(C C C B P ==0.0702 5. 药房有包装相同的六味地黄丸100盒,其中5盒为去年产品、95盒为今年产品。
随机取出4盒,求有1盒或2盒陈药的概率,再求有陈药的概率。
解 这是古典概率模型。
在100盒六味地黄丸中任取4盒,可能结果有4100C 个基本事件。
设A k ={有k 盒陈药},A ={取4盒有1或2盒陈药}、B ={取4盒有陈药},得到4100295254100395152121)()()()(C CC C C C A P A P A A P A P +=+=+==0.1879 51004950501)(1)(C CC A P B P -=-==0.18816. 某人有两盒火柴,吸烟时从任一盒中取一根火柴。
经过若干时间以后发现一盒火柴已经用完。
如果最初两盒中各有n 根火柴,求这时另一盒中还有r 根火柴的概率。
解 这是古典概率模型。
在两盒2n 根火柴中,每次从任一盒中取一根火柴,取2n -r 次可能结果有r n -22个基本事件。
设A ={1盒用完另1盒有r 根火柴},则A 包含nr n C -2个基本事件,得到P (A )=rn nrn C --222习题1.2解答1. 上海虚证患者中气虚型占30%,抽查20名患者,分别求有0名、5名气虚型的概率。
解 设A ={气虚型患者},则)(A P =0.30,20名患者的气虚型人数X ~)30.0,20;(k B , 查统计用表1,得到20名患者有0名气虚型的概率为P (X =0)=)0(F =0.000820名患者有5名气虚型的概率为P (X =5)=)4()5(F F -=0.4164-0.2375=0.17892. 若一批出厂半年的人参营养丸的潮解率为 8%,抽取 20 丸,分别求恰有一丸潮解的概率、不超过一丸潮解的概率、有1~5丸潮解的概率。
解 设A ={潮解},则)(A P =0.08, 20 丸中潮解数X ~)08.0,20;(k B 。
查统计用表1,得到20 丸有一丸潮解的概率为P (X =1)=)0()1(F F -=0.5169-0.1887=0.328220 丸不超过一丸潮解的概率为P (X ≤1)=)1(F =0.516920 丸有1~5丸潮解的概率为P (1≤X ≤5)=)0()5(F F -=0.9962-0.1887=0.80753. 某种疾病自然痊愈率为 0.3,20 个病人服用一种新药后,若有半数以上痊愈,试说明可以认为这种药有效。
解 设这种药无效,A ={痊愈},则)(A P =0.3, 20 人中痊愈人数X ~)3.0,20;(k B 。
查统计用表1,得到20 个病人服用新药后半数以上痊愈的概率为P (X >10)=1-)10(F =1-0.9829=0.0171概率0.0171很小,说明事件{X >10}出现的可能性很小。
但现在事件{X >10}出现,则可以认为这种药无效的假定是值得怀疑的。
4. 若200 ml 当归浸液含某种颗粒 300 个,分别求 1 ml 浸液含 2 个、超过 2 个颗粒的概率。
解 由于200 ml 当归浸液平均每1 ml 含颗粒 300 /200=1.5个, 1 ml 浸液含颗粒的个数服从泊松分布,X ~)5.1;(k P 。
查统计用表2,得到1 ml 浸液含 2 个颗粒的概率为P (X =2)=)1()2(F F -=0.8088-0.5578=0.25101 ml 浸液超过2 个颗粒的概率为P (X >2)=1-)2(F =1-0.8088=0.19125. 150颗花粉孢子随机落入大小相同的 500 个格子里,分别计算约有多少个格子中没有孢子、有2个孢子、有多于2个的孢子。
解 由于500 个格子平均每1个格子落入 花粉孢子150 /500=0.3颗,1 个格子落入 花粉孢子的颗数服从泊松分布,X ~)3.0;(k P 。
查统计用表2,得到落入 零颗花粉孢子的概率及格子个数为P (X =0)=)0(F =0.7408,500 P (X =0)=370.4落入 2颗花粉孢子的概率及格子个数为P (X =2)=)1()2(F F -=0.9964-0.9631=0.0333,500P (X =2)=16.65落入 多于2颗花粉孢子的概率及格子个数为P (X >2)=1-)2(F =1-0.9964=0.0036,500P (X >2)=1.86. 甲乙两个篮球运动员,投篮命中率分别为0.7及0.6,每人投篮三次,求:⑴ 两人进球次数相等的概率;⑵ 运动员甲比乙进球数多的概率。
解 这是贝努里试验。
设A k ={两人进球相等},B k ={乙进球k 次}。
⑴ 设C ={两人进球次数相等},则得到P (C )=P (A 0B 0+A 1B 1+A 2B 2+A 3B 3)=P (A 0)P (B 0)+P (A 1)P (B 1)+P (A 2)P (B 2)+P (A 3)P (B 3)=0.33×0.43+(2133.07.0⨯⨯C )(2134.06.0⨯⨯C ) +(3.07.0223⨯⨯C )(4.06.0223⨯⨯C )+0.73×0.63=0.3208 ⑵ 设D ={甲比乙进球次数多},则得到P (D )=P (A 1B 0+A 2B 0+A 2B 1+A 3B 0+A 3B 1+A 3B 2)=P (A 1)P (B 0)+P (A 2)P (B 0)+P (A 2)P (B 1) +P (A 3)P (B 0)+P (A 3)P (B 1)+P (A 3)P (B 2)=(2133.07.0⨯⨯C )(34.0)+(3.07.0223⨯⨯C )(34.0) +(3.07.0223⨯⨯C )(2134.06.0⨯⨯C )+(37.0)(34.0) +(37.0)(2134.06.0⨯⨯C )+(37.0)(4.06.0223⨯⨯C )=0.4362 习题1.3解答1. X ~)2,5.0(N ,求)24.1(F 、)67.1(-F 、P (-0.02<X <2.43)。
解 μ=0.5、σ=2,查统计用表3得到)24.1(F =)37.0(25.024.1ΦΦ=⎪⎭⎫⎝⎛-=0.6443)67.1(-F =)085.1(25.067.1-=⎪⎭⎫⎝⎛--ΦΦ=2/)8621.08599.0(1+-=0.1390P (-0.02<X <2.43)=⎪⎭⎫⎝⎛---⎪⎭⎫ ⎝⎛-25.002.025.043.2ΦΦ)26.0()965.0(--=ΦΦ=)6026.01(2/)8340.08315.0(--+=0.43532. 某市12岁男孩身高X (cm )~)67.5,10.143(N ,求X 的99%参考值范围并说明这范围的实际意义,再求身高在 140 cm ~145 cm 之间男孩所占百分比。
解 X 的99%参考值范围为143.10 2.58×5.67=)7286.157,4714.128((cm )若某12岁男孩身高在这个范围之外,则可怀疑此男孩身高异常,判断失误的概率不超过1%。
身高在 140 cm ~145 cm 之间男孩所占百分比为 P (140<X <145)=⎪⎭⎫⎝⎛--⎪⎭⎫ ⎝⎛-67.51.14314067.51.143145ΦΦ)547.0()335.0(--=ΦΦ=]}10/)7054.07088.0(77054.0[1{2/)6331.06293.0(-+--+ =0.3390=33. 90%3. 某地 101 例 30~39 岁健康男子血清胆固醇测定结果如表1-8所示,试作样本直方图及样本分布函数曲线。
解 这是随机误差概型。
⑴ 血清胆固醇数据最大值为278.8,最小值为104.2,区间]279,99(包含所有数据; ⑵ 把区间等分为10个左开右闭小区间,如表1-9的①、②列所示;⑶ 记录各小区间内血糖数据的频数,计算频率及频率密度填入表1-9的③、④、⑤列;⑷ 以小区间长为底、相应频率密度为高作矩形,绘制样本直方图及样本分布函数曲线,如图1-10所示。