统计学2数值变量的统计描述
- 格式:ppt
- 大小:390.13 KB
- 文档页数:1
《中医统计学》练习题第一部分绪论一、最佳选择题1.抽样研究是一种科学、高效的方法,目的是研究( B )A.样本B.总体C.抽样误差D.概率2.由样本推断总体,样本应该是( D )A.总体中的典型部分B.总体中有意义的部分C.总体中有价值的部分D.总体中有代表性的部分3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中( C )A.四种误差都不可避免B.过失误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免4.统计描述是指( C )A.比较指标的差别有无显著性B.估计参数C.用统计指标描述事物的特征D.判断无效假设是否成立5.统计推断是指( D )A.从总体推断样本特征B.从总体推断总体特征C.从样本推断样本特征D.从样本推断总体特征6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A )A.系统误差B.随机测量误差C.抽样误差D.过失误差7.随机抽样的目的是( D )A.消除系统误差B.消除测量误差C.消除抽样误差D.减小样本偏性8.对某地200名16岁中学生口腔检查,发现患龋齿的人数为54人,该资料属于( B )A.数值变量资料B.无序分类变量资料C.有序分类变量资料D.三个都不是9.数值变量资料是( C )A.用仪器测量出来的资料B.按观察单位的类别,清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级,清点各等级观察单位数的资料10.无序分类变量资料是( B )A.用仪器测量出来的资料B.按观察单位的类别,清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级,清点各等级观察单位数的资料11.有序分类变量资料是( D )A.用仪器测量出来的资料B.按观察单位的类别,清点各类观察单位数的资料C.用定量方法测定观察单位某个变量的大小的资料D.按观察单位的等级,清点各等级观察单位数的资料12.下列哪种不属于数值变量资料( C )A.红细胞数B.血钙浓度C.阳性人数D.脉搏13.下列哪种属于有序分类变量资料( A )A.治疗痊愈、有效、无效人数B.各血型人数C.白细胞分类百分比D.贫血和不贫血人数二、判断题1.统计工作的主要内容是对资料进行统计分析。
数值变量资料名词解释
数值变量是统计学中常用的一种变量类型,它可以以数字形式表示观察单位的数量或度量。
数值变量可以分为连续变量和离散变量两种类型。
连续变量是一种可以取到任何数值的变量,其取值范围在某一区间内,通常用来度量量化的特性。
例如,身高、体重、温度等都是连续变量。
这些变量可以通过测量的方式获得,通常可以是任意的实数值。
连续变量之间可以进行加减乘除等数学运算来推导出更多的信息,可以进行进一步的分析和统计。
离散变量是一种只能取有限数值或特定数值的变量,通常用来度量类别或分类的特性。
例如,年龄、性别、学历等都是离散变量。
这些变量通常以字母、符号或数字表示,且取值有限且可数。
离散变量有时也可以进行比较和排序,但不能进行数学运算。
数值变量在统计学中起着重要的作用,提供了一种量化观测单位的方式,使得数据更易于组织、分析和解释。
数值变量可以通过描述统计方法进行总体和样本的摘要统计量计算,如平均值、中位数、标准差等,帮助了解数据的特征和分布。
同时,数值变量还可以进行推断统计,如假设检验、置信区间估计等,从而对总体做出相应的推断。
对于不同类型的数值变量,需要采用不同的分析方法和统计模型。
对于连续变量,可以用回归分析、方差分析等方法进行预测和比较;对于离散变量,可以采用卡方检验、二项式回归等
方法进行相关分析。
总之,数值变量是一种重要的变量类型,通过数值的表示和计算,可以对观测单位的特征进行量化和分析,为统计学中的数据分析和推断提供基础。
第一章数值变量资料的统计描述统计描述(statistical description)即利用原始数据,选择适宜的统计指标及统计图表,简明准确地探察数据的分布类型和数量特征,以便研究者根据样本信息,正确地推论其总体规律的统计分析方法。
统计指标(statistical index)是表示数据分布特征的一个或一组数值,是统计分析的基本依据.第一节频数分布的概念与应用对获取的数据进行统计学分析之前,了解数据的分布特征是至关重要的。
因为很多参数分析方法都要求样本数据来自某种已知分布的总体,否则,就应对数据实施合适的数据转换,或者采用非参数分析方法。
对频数表及频数图进行分析是描述性统计学分析的基本内容,也是表达或探索数据分布特征的基本手段.一、频数分布1.频数分布(frequency distribution)的概念频数(frequency)是相同观察值或观察结果出现的次数;分布(distribution)指随着随机变量取值的变化,其相应的概率变化的规律性。
频数分布即观察值(变量值)按大小分组,各个组段内观察值个数(频数)的分布,它是了解数据分布形态特征与规律的基础.2.频数分布的特征(1)集中趋势(central tendency):指一组变量值的集中倾向或中心位置.(2)离散趋势(tendency of dispersion):指一组变量值的分散倾向。
3.频数分布的类型⑴对称分布:指集中位置居中、左右两侧的频数分布基本对称的频数分布。
又可分为正态分布(normal distribution)和非正态分布(non-normal distribution).⑵偏态分布:是集中位置偏倚、两侧频数的分布不对称的频数分布,可分为两类:①正偏态:亦称右偏态,特点是峰偏左,此时均数与众数之差为正值,长尾向右侧(即观察值较大一端)伸延;②负偏态:亦称左偏态,特点为峰偏右,此时均数与众数之差为负值,长尾向左侧(即观察值较小一端)伸延。
医学统计方法概述l .统计中所说的总体是指: A 根据研究目的确定的同质的研究对象的全体2 •概率P=0,则表示B某事件必然不发生3.抽签的方法属于 D 单纯随机抽样4 .测量身高、体重等指标的原始资料叫:B计量资料5•某种新疗法治疗某病患者41人,治疗结果如下:该资料的类型是:D有序分类资料治疗结果治愈显效好转恶化死亡治疗人数8 23 6 3 16•样本是总体的C有代表性的部分7•将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C整理资料&统计工作的步骤正确的是C设计、收集资料、整理资料、分析资料9•良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B系统误差10•以下何者不是实验设计应遵循的原则D交叉的原则11•表示血清学滴度资料平均水平最常计算 B 几何均数12•某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C M13.各观察值均加(或减)同一数后:B均数改变,标准差不变14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问该食物中毒的平均潜伏期为多少小时 C 615•比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D变异系数16•下列哪个公式可用于估计医学95%正常值范围 A X±1.96S17•标准差越大的意义,下列认识中错误的是B观察个体之间变异越小18.正态分布是以E均数为中心的频数分布19•确定正常人的某项指标的正常范围时,调查对象是B排除影响研究指标的疾病和因素的人20•均数与标准差之间的关系是E标准差越小,均数代表性越大21•从一个总体中抽取样本,产生抽样误差的原因是A总体中个体之间存在变异22•两样本均数比较的t检验中,结果为 P<0.05,有统计意义。
P愈小则 E愈有理由认为两总体均数不同23.由10对(20个)数据组成的资料作配对 t检验,其自由度等于 C 924• t检验结果,P>0.05,可以认为B两样本均数差别无显着性25.下列哪项不是t检验的注意事项 D分母不宜过小26.在一项抽样研究中,当样本量逐渐增大时B标准误逐渐减少27. tV t0.05(v),统计上可认为C两样本均数,差别无显着性28.两样本均数的t检验中,检验假设(H0)是 B 仁(1229.同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠 A. Sx30.标准差与标准误的关系是:C前者大于后者31在同一正态总体中随机抽取含量为n的样本,理论上有 95%的总体均数在何者范围内 C均数加减1.96 倍的标准误32 .同一自由度下,P值增大C t值减小33.两样本作均数差别的 t检验,要求资料分布近似正态,还要求D两样本总体方差相等34.构成比的重要特点是各组成部分的百分比之和 C 一定等于135 .计算相对数的目的是 C为了便于比较36.某医院某日门诊病人数 1000 人,其中内科病人 400 人,求得 40%,这 40%是 B 构成比 37.四个样本率作比较,x2>x20.01(3),可以认为 A 各总体率不同或不全相同 38.卡方检验中自由度的计算公式是D (行数 -1)(列数 -1)39.作四格表卡方检验,当 N>40 ,且 _______________ 时,应该使用校正公式 E1<T<540 .若 X2> X2 0.05(贝V)A P<0 05 41.相对数使用时要注意以下几点,其中哪一项是不正确的 B 注意离散程度的影响42.反映某一事件发生强度的指标应选用 D 率43.反映事物内部组成部分的比重大小应选用 A 构成比44.计算标化率的目的是 D 消除资料内部构成不同的影响,使率具有可比性45.在两样本率比较的 X2检验中,无效假设(H0)的正确表达应为 C n 1= n2 46.四格表中四个格子基本数字是 D 两对实测阳性绝对数和阴性绝对数47 .比较某地1990~1997年肝炎发病率宜绘制C普通线图48.关于统计资料的列表原贝,错误的是 B 线条主要有顶线,底线及纵标目下面的横线,分析指标后有斜线和竖线49.比较甲、乙、丙三地区某年度某种疾病的发病率情况,可用 A 直条图50.描述某地某地 210 名健康成人发汞含量的分布,宜绘制 B 直方图 l 、统计中所说的总体是指: A 根据研究目的确定的同质的研究对象的全体。
医学统计学概述数值变量医学统计学是医学领域中的重要学科,它为医学研究提供了有力的工具和方法。
在医学统计学中,数值变量是一种常见的数据类型,用于描述和分析各种医学现象和指标。
本文将概述医学统计学中的数值变量概念、分类、测量和分析方法等内容。
一、数值变量的概念数值变量是指在统计分析中,用数值表示且具有可比性的变量。
它可以分为连续变量和离散变量两种类型。
连续变量是指取值可以是任意实数的变量,通常用于描述血压、体重、身高等连续性的生理指标。
这些指标可以在一定范围内连续变动,其取值可以是小数或整数。
离散变量是指取值只能是整数的变量,通常用于描述计数或计算次数的指标,比如病例数、手术次数等。
离散变量的取值通常是有限的,而且不可分割。
二、数值变量的测量为了能够准确地描述和分析数值变量,需要采用相应的测量方法。
数值变量的测量方法包括直接测量和间接测量。
直接测量是指通过测量工具直接获得变量的数值,比如使用体重秤来测量体重、使用血压计来测量血压等。
直接测量可以精确地得到数值变量的具体数值。
间接测量是指通过其他指标或计算方法得到数值变量的数值,比如通过身高和体重计算体质指数(BMI)。
间接测量可以在一定程度上估计数值变量的数值,但精确度不如直接测量高。
三、数值变量的描述统计分析在医学统计学中,常用的数值变量的描述统计方法包括均值、中位数、标准差和百分位数等。
均值是指将所有观察值相加后除以观察次数,用来表示数值变量的平均水平。
均值可以反映一组数据的集中趋势,但容易受到极端值的影响。
中位数是指将一组数据按大小顺序排列后的中间值,用来表示数值变量的中间位置。
中位数不容易受到极端值的影响,更适合用于描绘有偏分布的数据。
标准差是指一组数据与其均值的偏离程度,用来表示数值变量的离散程度。
标准差越大,数据的离散程度越大。
百分位数是指将一组数据按大小顺序排列后,某一特定百分比所对应的数值。
常用的百分位数有25%分位数(第一四分位数)、50%分位数(中位数)和75%分位数(第三四分位数)等。