医学统计学重点简答题和名词解释
- 格式:doc
- 大小:18.50 KB
- 文档页数:6
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval,CI)。
它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。
参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围 描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间 揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
参数(parameter):描述总体特征的统计指标。
统计量(statistic):描述样本特征的统计指标。
实验设计的基本原则对照 (control) 对受试对象不施加处理因素的状态。
在确定接受处理因素的实验组时,要同时设立对照组重复 (replication)相同实验条件下进行多次实验或多次观察。
整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。
样本:从研究总体中随机抽得的有代表性的一部分个体的实测值的集合参数:是统计模型的特征指标,其大小是客观存在的,然而往往是未知的抽样:从研究总体中抽取一部分有代表性的个体的方法正态分布:指中间频数多两边频数渐少的连续型对称分布抽样误差:由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称。
表现为样本统计量之间、样本统计量与总体参数间的差异标准误:样本均数的标准差,反映抽样误差的大小,即样本均数与样本均数之间差异的大小假设检验:指对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设统计推断的方法第1类错误:指拒绝正确的零假设时所犯的错误:“实际无差别,但下了有差别的结论(假阳性错误)”犯这种错误的概率是α第2类错误:不拒绝原本不正确的零假设时所犯的错误:“实际有差别,但下了无差别的结论”(假阴性错误)犯这种错误的概率是β方差分析;是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同,用于比较两个或两个以上均数的差别随机区组设计:又称配伍组设计,将受试对象按性质相同或相近者组成b个区组,每个区组中的受试对象分别随机分配到k个处理组中去参数检验:指以特定的总体分布为前提,对未知的总体参数做推断的假设检验方法非参数检验:指不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断的假设检验方法线性相关:又称简单相关,是指两个随机变量X、Y之间呈线性趋势的关系线性相关系数:又称pearson积矩相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标回归:表示变量之间某种数量依存关系的统计学术语回归分析:研究一个变量如何随另一些变量变化的常用方法线性回归:又称简单回归,研究两个连续型变量之间线性依存关系的统计方法标准化残差:将每个残差值减去所有残差值的均数,再除以所有残差值的标准差后所得的值异常值:又称离群值,指大于1.5倍四分位数间距的数值,在箱式图中常用圆圈’o”表示统计表的组成:标题、标目、线条、数字、备注统计图的组成:标题、标目、图域、尺度、比例三类相对数:频率强度相对比实验设计的三个基本要素:受试对象处理因素实验效应实验设计的基本原则:对照随机重复描述集中趋势的统计指标:均数几何均数中位数众数描述离散趋势的统计指标:极差四分位数间距方差标准差变异系数简述二项分布、Poisson分布、正态分布的区别与联系二项分布、Poisson分布是离散型分布,用概率函数描述其分布状况,而正态分布是连续性概率分布,用密度函数和分布函数描述其分布状况。
一、名解:1、定量资料:以定量值表达每个观察单位的某项观察指标2、定性资料:以定性方式表达每个观察单位的某项观察指标3、等级资料:以等级方式表达每个观察单位的某项观察指标4、总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
5、样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
6、参数:描述某总体特征的指标称为总体参数。
7、统计量:描述某样本特征的指标称为样本统计量。
8、小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件9、小概率原理:其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。
小概率原理是进行统计推断的依据。
(8&9常写在一起)10∙变异,是以具有同质性的观察单位为载体,某项观察指标在其单位之间显示的差别。
11标准化率:用统一的标准对内部构成不同的各组频率进行调整和对比,对比后的率为标准化率。
12参考值范围:又称正常值范围,大多数人正常人某观察指标所在的范围。
由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值。
13、抽样误差:由抽样引起的样本统计量与总体参数间的差别。
14、中心极限定理:①从均数为U,标准差为。
的总体中独立随机抽样,当样本含量?增加时,样本均数的分布将趋于正态分布,均数为标准差为。
X②从非正态分布的总体中随机抽样,只要样本含量足够大,样本均数趋于正态分布。
15、统计推断:就是根据样本所提供的信息,以一定的概率推断总体的性质。
16、区间估计/参数估计/可信区间:包括点估计和区间估计,由样本信息估计总体参数。
按一定的概率或可信度(La)用一个区间估计总体参数所在范围。
这个范围称作可信度为l-α的可信区间(ConfidenCeinterval,Cl),又称置信区间。
医学统计学名词解释与简答题第一章一、名词解释总体样本变异概率与频率随机误差系统误差参数统计量随机变量二、问答题1. 医学统计学的研究步骤是什么?2. 调查到A、B两种药物治疗同一种疾病的有效率分别为90%、70%,能否认为A药的有效率高于B药?3. 有研究者说:“统计学并不能证明事物,但它可以进行推断,发现线索,提供信息,使得人们有根据去改善事物”。
谈谈你的理解。
第二章一、简答题1. 请简述统计表的基本结构及制表的注意事项。
2. 请简述统计图的基本结构及绘制统计图的注意事项。
第三章一、简答题1. 统计描述主要包括哪几个方面来发现和描述数据的基本特征?2. 频数分布表的主要用途有哪些?3. 正态分布的主要应用有哪些?4. 变异系统与标准差有何异同?第四章一、名词解释结构相对数强度相对数相对比定基比环比平均增长速度二、简答题1. 简述结构相对数和强度相对数的区别。
2. 简述发病率与患病率、死亡率与病死率的不同。
3. 应用相对数时应注意哪些问题?第五章一、名词解释抽样误差 均数的标准误 率的标准误 参数估计 置信区间第六章一、名词解释P 值 I 类错误 II 类错误 检验水准 检验效能二、简答题1. 简述假设检验的基本思想与步骤。
2. 简述假设检验与置信区间的关系。
第八章一、名词解释组间变异 误差变异 均方 方差齐性二、简答题1. 方差分析的基本思想及应用条件?2. 在随机区组设计的方差分析中,误区组处理总及、、MS MS MS MS 的含义?3. 多组均数间差别有统计学意义时,其两两比较的检验方法同两均数t 检验有何不同?第九章一、简答题1. 简述2χ的基本原理。
2. 对于四格表资料,如何正确选用检验方法?3. 简述行⨯列表资料的2χ检验应注意的事项?第十章一、简答题1. 请简述参数检验与非参数检验的区别,各自的优缺点。
2. 请简述非参数检验适用范围。
3. 两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2χ检验?4. 对同一资料,出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以哪种方法为准?第十一章一、名词解释Pearson相关系数回归系数决定系数二、简答题1. 请简述简单线性相关和简单线性回归的区别和联系。
医学统计学复习资料(名解+简答)一、名词解释1.统计量 (statistic):统计量是统计理论中用来对数据进行分析、检验的变量。
2.同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。
3. 抽样误差 (sampling error):由于随机抽样造成的样本均数与总体均数的差别。
4. 总体 (population):根据研究目的而确定的同质观察单位的全体称为总体,更确切的说,它是同质的所有观察单位某种观察值的集合。
5. 变异 (variation):变异就是标志在同一总体不同总体单位之间的差别。
6. 参数 (parameter):参数,也叫参变量,是一种变量。
7. 样本 (sample):研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体。
8. 概率 (probability):概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。
越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。
1. 正态分布 (normal distribution):靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布2. 中位数 (median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)3. 方差 (variance):是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。
4. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小。
5. 正偏态分布 (positively skewed distribution):为统计学概念,即统计数据峰值与平均值不相等的频率分布。
如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。
医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。
2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。
3、样本:从总体中随机抽取的部分研究对象。
4、随机:总体中每个个体有同等的机会进入样本。
5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。
8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。
10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。
通俗讲一次抽样是不可能发生的事件。
11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
最常用的是95%参考值范围。
13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。
二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
【临床】医学统计学--名词解释+问答题医学统计学1、应用相对数时应注意的事项①计算相对数时分母不能太小;②分析时不能以构成比代替率;③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均;④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近;⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。
2、正态分布的特点及其应用性质:①两头低中间高,略呈钟形;②只有一个高峰,在X=μ,总体中位数亦为μ;③以均数为中心,左右对称;④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;⑤对于任何服从正态分布N(μ,σ2)的随概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。
参考值范围是绝大多数正常人的某指标范围。
所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。
计算公式:可信区间①②③参考值范围①正态分布②偏态分布用途:可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围3、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散;标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与样本例数的关系:随着样本量的增加,样本标准差稳定于总体标准差;随着样本量的增加,样本标准误减少并趋于0。
医学统计学方法重点简答题和定义解释本文档旨在提供医学统计学方法的重点简答题和定义解释,帮助读者加深对这一领域的理解。
1. 什么是假设检验?定义解释:假设检验是一种统计推断方法,用于判断样本数据是否支持或反对某个假设。
它涉及两个互补的假设:零假设和备择假设。
通过计算样本数据与零假设之间的距离,以及确定这种距离在统计上的显著性,可以得出结论是否拒绝零假设。
假设检验是一种统计推断方法,用于判断样本数据是否支持或反对某个假设。
它涉及两个互补的假设:零假设和备择假设。
通过计算样本数据与零假设之间的距离,以及确定这种距离在统计上的显著性,可以得出结论是否拒绝零假设。
2. 请解释一下T检验和Z检验的区别是什么?定义解释: T检验和Z检验都是假设检验方法,用于比较两个样本均值的差异。
它们的区别在于所依赖的假设和参数。
T检验和Z检验都是假设检验方法,用于比较两个样本均值的差异。
它们的区别在于所依赖的假设和参数。
T检验适用于小样本(样本量较小)情况,它假设样本数据服从正态分布,并使用样本标准差来估计总体标准差。
T检验通常用于实践中,当总体标准差未知时。
Z检验适用于大样本(样本量较大)情况,它假设样本数据和总体数据都服从正态分布,并使用总体标准差。
Z检验通常用于理论研究中,当总体标准差已知时。
3. 请解释一下卡方检验的用途是什么?定义解释:卡方检验是一种统计检验方法,用于判断两个或多个分类变量之间的关联性。
它通过比较观察到的频数和期望频数之间的差异来评估分类变量之间的独立性。
卡方检验常用于分析有序或无序分类变量之间的关联,例如研究治疗方法对疾病治愈率的影响。
卡方检验是一种统计检验方法,用于判断两个或多个分类变量之间的关联性。
它通过比较观察到的频数和期望频数之间的差异来评估分类变量之间的独立性。
卡方检验常用于分析有序或无序分类变量之间的关联,例如研究治疗方法对疾病治愈率的影响。
4. 请解释一下相关系数是什么?定义解释:相关系数是一种用于衡量两个变量之间关联程度的统计量。
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大臵信度的包含总体参数的范围,该范围称为臵信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常t臵信区间揭示的是按一定臵信度估计总体参数所在的范围。
分布法、正态分布法(标准
误)、二项分布法。
臵信区间估计总体参数所在范围
参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要
假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。
参数(parameter):描述总体特征的统计指标。
统计量(statistic):描述样本特征的统计指标。
实验设计的基本原则
对照 (control) 对受试对象不施加处理因素的状态。
在
确定接受处理因素的实验组时,要同时设立对照组重复 (replication)相同实验条件下进行多次实验或多次观察。
整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。
作用是估计变异大小和降低变异随机化(randomization) 采用随机的方式,使每个受
试对象都有同等的机会被抽取或分配到试验组和对照组。
HH I类错误(假阳性错误)真实情况为0是成立的,但检验结果为0不成立,这样的错误称为I类错误。
其发生的概率用表示。
在假设检验中作为检验水准。
一般取0.05或0.01。
HH II类错误(假阴性错误)真实情况为1是成立的,但检验结果为1不成立,H 这样的错误称为II类错误。
其发生的概率用表示。
由于其取值取决于1 ,因此在假设检验中无法确定。
变异指标是用于描述一组观察值围绕中心位臵散布的范围,即描述离散趋势的统计指标。
数值越大,说明数据越离散,反之越集中。
极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。
算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode)单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。
每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。
按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。
最常用的方法是等距抽样分层抽样先将总
体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。
分层特征与研究目的有关。
按各层比例抽样。
为减少抽样误差,要求层内误差最小,层间误差最大。
整群抽样先将总体分成若干“群”,从中随机抽取几个群,抽取群内的所有观察
单位组成调查样本。
“群”的确定与研究目的无关。
为减少抽样误差,需多抽几个“群”。
一、统计表有哪些要素构成的?制表的注意事项有哪些?一般来说,统计表由标题、标目、线条和数字、备注五部分组成。
但备注并不是必需的内容,可以根据需要出现。
1简明扼要,重点突出:最好一张表突出一个中心,不易太多中心,如果需要说明多个中心,可分成多张统计表。
2
合理安排主语和谓语的位臵:对于表中任意一行,从左至右,通过简短的连接词,可连成成一句通顺的句子。
3表中数据要认真核对,保证准确可靠 t 二、为什么不宜用检验对多组均数进行比较? tI 如果用检验进行多个样本均数的两两比较,则会增加犯类错误的概率。
HI经检验得到拒绝0 ,认为两组之间有差别的结论可能犯类错误的概率为,IIkk不犯类错误的概率为1- .每次判断均不犯类错误的概率为(1- ), k=为比较的次数,上例=0.05, 3,则均不犯错误的概率为( 1- 0.05)3 =0.86. Ik 至少有一次判断犯类错误的概率为1-(1-
) 三、方差分析的基本思想是什么?按实验设计的类型,将全部观察值间的变异分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较(每个部分的变异可由某因素的作用来解释),以判断各部分的变异是否具有统计学意义,从而推断不同样本所代表的总体均数是否相同。
四、简述标准差与标准误的区别与联系均数标准误大小与样本标准差大小成正比,与样本含量的平方根成反比。
标准误越小,说明样本均数作为总体均数估计值的准确性越大。
均数的标准误标准差意义反映样本均数抽样误差的大小反映一组个体值的变异程度S,总体标准差 ,样本标准差 S符号XX
2X XnN计算S公式
2X XS S Xnn1控制方个体差异或自然变异不能通过统计增大样本含量可减小标准误法方法来控制五、简述直线相关与回归的区别与联系区别:1.回归说明依存关系,直线回归用于说明两变量间数量依存变化的关系,描述y如何依赖于x而变化;相关说明相关关系,直线相关用于说明两变量间的直线相关关系,此时两变量的关系是平等的 2.r与b有区别:r说明具有直线关系的两个变量间相关的密切程度与相关方向; b表示x每改变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量y是来自正态总体的随机变量,而x可以是来自正态总体的随机变量,也可以是严密控制、精确测量的变量,相关分析则要求x,y是来自双变量正态分布总体的随机变量。
4.取值范围:-
∞<b<+∞;-1≤r≤1.单位:b有单位;r无单位。
联系:1.对同一样本,若同时计算b和r,其正负号是一致的。
2.对同一样本,b和r的假设检验是等价的,二者的t值相等,t=t。
br2
3. 回归可解释相关。
相关系数的平方r(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。
六、简述实验设计的基本要素 1.处理因素(study factor,treatment) • 研究者根据研究目的欲施加或欲观察的能作用于受试对象并引起直接或间接效应的因素。
• 处理因素可以是主动施加的某种外部干预或措施,也可以是客观存在的因素。
非处理因素• 与处理因素同时出现、也能使受试对象产生效应的因素。
• 当非处理因素夸大或缩小了处理因素与实验效应间的真实联系时,称为混杂因素 2.受试对象/试验单位
(object/experiment unit) • 处理因素作用的客体,是根据研究目的而确定的观察目标总体。
可以是人、动物,
也可以是生物材料,试验单位的基本条件 3.处理/试验效应(experimental effect) • 处理因素作用于试验单位的反应和结果,通过观察指标来表达。
• 选择指标的依据:客观性、特异性和敏感性。