医学统计学名词解释及问答题
- 格式:doc
- 大小:65.50 KB
- 文档页数:4
第一章绪论(一)名词解释1.总体与样本2. 随机抽样3. 变异4. 等级资料5. 概率与频率6. 随机误差7. 系统误差8. 随机变量9.参数10. 统计量(二)单项选择题1.观察单位为研究中的( )。
A.样本B. 全部对象C.影响因素D. 个体2.总体是由()。
A.个体组成B. 研究对象组成C.同质个体组成D. 研究指标组成3.抽样的目的是()。
A.研究样本统计量B. 由样本统计量推断总体参数C.研究典型案例研究误差D. 研究总体统计量4.参数是指()。
A.参与个体数B. 总体的统计指标C.样本的统计指标D. 样本的总和5.关于随机抽样,下列那一项说法是正确的()。
A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体D.为确保样本具有更好的代表性,样本量应越大越好(三)是非题1.研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。
2.统计分析包括统计描述和统计推断。
3.计量资料、计数资料和等级资料可根据分析需要相互转化。
(四)简答题某年级甲班、乙班各有男生50人。
从两个班各抽取10人测量身高,并求其平均身高。
如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什麽?第二章计量资料的统计描述(一)名词解释1.频数表2.算术均数3.几何均数4.中位数5.极差6.百分位数7.四分位数间距8.方差9.标准差10.变异系数(二)单项选择题1.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变2.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.差C.极差D.标准差3.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差4.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距5.各观察值同乘以一个不等于0的常数后,()不变。
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval,CI)。
它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。
参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学期末考试--名词解释10、测定某地 107 名正常人尿铅含量(mol/L)如下表,该资料是计量资料,呈正偏态分布,欲表示该资料的集中趋势和离散趋势,宜选用的指标分别是中位数和四分位数间距。
12、算术均数常用于描述对称分布资料和正态分态资料的平均水平。
13、描述正态分布或对称分布资料离散程度常用的指标是标准差,而反映偏态分布资料离散程度用四分位数间距。
16、中位数一般用于描述偏态分布、分布型不明或开口资料的平均水平。
19、正态分布是以为中心左右对称,正态曲线在均数位置最高,离中心越远,观察值分布越少。
25、正态分布的形态由决定,t 分布的形态由自由度决定。
20、正态分布和 t 分布都呈单峰和对称分布,但是曲线下相同的面积所对应的界值是不同的,t 界值比 u 界值大,而且自由度越小,二者相差越大。
22、计算正态分布资料 95%正常值范围的公式是 X X 1.96S ;估计总体均数 95%可信区间的公式是 X X 1.96Sx 。
26、在抽样研究中,当样本含量趋向无穷大时,X 趋向等于,Sx 趋向于 0 ,t (0.05,v) 趋向于 1.96 。
1 / 18① 选有代表性的、较稳定的、数量较大的人群做标准;② 将相互比较的各组数据合并作标准;③ 选择相互比较的各组中的一组作为标准。
一、名词解释 1、、定量资料:又称计量资料,是用定量的方法测定观察单位某项指标数值的大小,所得到的资料称为定量资料。
根据变量的取值特征,可分为连续型数据(身高、体重)和离散型数据(家庭成员数、白细胞计数)。
2、、定性资料:又称计数资料,是将观察单位按照某种属性或类别分组,清点各组的观察单位数,所得的资料称为定性资料。
医学统计学习题二一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
医学统计学名词解释及问答题统计学(Statistics):运⽤概率论、数理统计的原理与⽅法,研究数据的搜集;分析;解释;表达的科学。
总体(population):⼤同⼩异的研究对象全体。
更确切的说,总体是指根据研究⽬的确定的、同质的全部研究单位的观测值。
样本(sample):来⾃总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利⽤样本信息可以对总体特征进⾏推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性⽽出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可⽤标准误描述其⼤⼩。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的⼤⼩。
样本均数的标准差称为均数的标准误。
均数标准误⼤⼩与标准差呈正⽐,与样本例数的平⽅根呈反⽐,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定⼀个具有较⼤置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),⼜称可信区间。
参考值范围描述绝⼤多数正常⼈的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围⽤于判断某项指标是否正常置信区间揭⽰的是按⼀定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、⼆项分布法。
置信区间估计总体参数所在范围参数统计(parametric statistics)⾮参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对⽐较数据(x)的分布进⾏统计检验的⽅法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,⽽相关系数⽆单位β为回归直线的斜率(slope)参数,⼜称回归系数(regression coefficient)。
医学统计学名词解释与简答题第一章一、名词解释总体样本变异概率与频率随机误差系统误差参数统计量随机变量二、问答题1. 医学统计学的研究步骤是什么?2. 调查到A、B两种药物治疗同一种疾病的有效率分别为90%、70%,能否认为A药的有效率高于B药?3. 有研究者说:“统计学并不能证明事物,但它可以进行推断,发现线索,提供信息,使得人们有根据去改善事物”。
谈谈你的理解。
第二章一、简答题1. 请简述统计表的基本结构及制表的注意事项。
2. 请简述统计图的基本结构及绘制统计图的注意事项。
第三章一、简答题1. 统计描述主要包括哪几个方面来发现和描述数据的基本特征?2. 频数分布表的主要用途有哪些?3. 正态分布的主要应用有哪些?4. 变异系统与标准差有何异同?第四章一、名词解释结构相对数强度相对数相对比定基比环比平均增长速度二、简答题1. 简述结构相对数和强度相对数的区别。
2. 简述发病率与患病率、死亡率与病死率的不同。
3. 应用相对数时应注意哪些问题?第五章一、名词解释抽样误差 均数的标准误 率的标准误 参数估计 置信区间第六章一、名词解释P 值 I 类错误 II 类错误 检验水准 检验效能二、简答题1. 简述假设检验的基本思想与步骤。
2. 简述假设检验与置信区间的关系。
第八章一、名词解释组间变异 误差变异 均方 方差齐性二、简答题1. 方差分析的基本思想及应用条件?2. 在随机区组设计的方差分析中,误区组处理总及、、MS MS MS MS 的含义?3. 多组均数间差别有统计学意义时,其两两比较的检验方法同两均数t 检验有何不同?第九章一、简答题1. 简述2χ的基本原理。
2. 对于四格表资料,如何正确选用检验方法?3. 简述行⨯列表资料的2χ检验应注意的事项?第十章一、简答题1. 请简述参数检验与非参数检验的区别,各自的优缺点。
2. 请简述非参数检验适用范围。
3. 两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2χ检验?4. 对同一资料,出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以哪种方法为准?第十一章一、名词解释Pearson相关系数回归系数决定系数二、简答题1. 请简述简单线性相关和简单线性回归的区别和联系。
医学统计学复习题一、名词解释:1、参数2、统计量3、检验水准4、概率5、抽样误差6、医学参考值范围7、统计推断8、标准误9、可信区间10、Ⅰ型错误11、Ⅱ型错误12、标准化死亡比13、非参数检验14、回归系数15、相关系数二、简答题1、医学统计学工作的步骤。
2、正态分布有什么基本特征?有哪几个参数?3、医学正常值范围与可信区间有何区别?4、假设检验中应注意哪些问题?6、应用相对数时应注意的事项?8、非参数检验的适用条件、优缺点?三、是非题1、对数正态分布资料最好计算几何均数以表示其平均水平。
2、不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。
3、理论上只有服从正态分布条件的变量的算术均数等于中位数。
4、随机抽样就是指在抽样研究中不要主观挑选研究个体。
8、同一总体中随机抽样,样本含量越大,则样本标准差越小。
9、只要单位相同,用s和用CV来比较两套变量值的离散度,结论是完全一样的。
10、从同一总体随机抽取的两组数据中,平均数大的组标准差也大。
11、同一批计量数据的标准差不会比标准误大。
12、t检验是对两样本均数的差别作统计检验的方法之一。
13、当总体方差已知时,检验样本均数和某个已知总体均数差别有无统计意义只能用t检验。
14、在配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,作t检验后的结论是相同的。
15、方差分析中均方就是方差。
16、随机区组设计和完全随机设计方差分析的统计效能总是一样的。
17、4个均数作差别的统计检验,可以分别作两两比较的6次t检验以作详细分析。
18、回归系数越大,两变量的数量关系越密切。
19、双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。
20、某事物内部某一部分所占的比重就是比例,患病率也是一种比例。
21、要消除甲乙两地各年龄组死亡率不同的影响而对两总的死亡率作比较,可以计算标准化死亡率后再作比较。
22、非参数统计方法不对特定分布的参数作统计推断,但仍要求数据服从正态分布。
【临床】医学统计学--名词解释+问答题医学统计学1、应用相对数时应注意的事项①计算相对数时分母不能太小;②分析时不能以构成比代替率;③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均;④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近;⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。
2、正态分布的特点及其应用性质:①两头低中间高,略呈钟形;②只有一个高峰,在X=μ,总体中位数亦为μ;③以均数为中心,左右对称;④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动;σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高;⑤对于任何服从正态分布N(μ,σ2)的随概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。
参考值范围是绝大多数正常人的某指标范围。
所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。
计算公式:可信区间①②③参考值范围①正态分布②偏态分布用途:可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围3、标准差与标准误的区别与联系区别:含义:标准差反映观察值在个体中的变异大小,标准差越大,变量值越分散;标准误是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。
计算方法:标准差:总体标准差:样本标准差:标准误:均数的标准误:率的标准误:用途:标准差①用于对称分布,特别是正态分布资料,表示观察值分布的离散程度②结合均数,描述正态分布的特征、估计参考值范围③结合样本统计量,计算均数标准误④计算变异系数⑤反映均数的代表性标准误①衡量样本均数的可靠性②估计总体均数的可信区间③用于均数的假设检验与样本例数的关系:随着样本量的增加,样本标准差稳定于总体标准差;随着样本量的增加,样本标准误减少并趋于0。
医学统计学专题测验一1.名词解释总体:是指根据研究目的确定的研究对象的全体。
误差:测量值与事实真相之间的差值。
抽样研究:是指以样本特征推论总体特征的研究。
极差:又称全距,是所有观察值中最大值和最小值之差。
变异系数:是标准差与均数的比值。
2.下面有关抽样误差的叙述,正确的是( D )。
A.严格设计和严格实施的研究可以避免抽样误差B.样本量越大,抽样误差越大C.抽样误差是由于测量人员测量技术不合格导致的误差D.抽样误差与研究特征的个体差异有关3.“是否吸烟”的变量类型是( D )。
A.数值型变量资料B.多分类变量资料C.等级资料D.二分类变量资料4.下面关于样本量的陈述,正确的是( D )。
A.样本量与总体规模有关B.抽样误差与样本量无关C.样本量与应答率水平无关D.样本量需要专门的公式估计5.下面关于研究对象的陈述,错误的是( C )。
A.研究对象与研究目的有关B.研究对象可以是人,也可以是动物C.研究对象不需要来自研究总体D.研究对象是研究设计的内容6.下面有关总体的叙述,正确的是( A )。
A.总体是由根据研究目的所确定的全部研究对象B.总体与研究目的无关C.总体由样本量决定D.总体由统计分析方法决定7.下列选项中,属于数值变量的是( B )。
A.民族B.体重C.血型D.性别8.数据录入时,部分数据录入有误,误差的类型属于( B )。
A.样本与总体之差B.系统误差C.随机测量误差D.抽样误差9.统计量是( C )。
A.统计总体数据得到的量B.反映总体特征的的量C.使用样本数据计算出来的统计指标D.使用参数估计出来的10.某病房记录了50名病人的护理等级,其中特级护理1名,一级护理3名,二级护理12名,三级护理34名,此资料属于( C )。
A.分类变量资料B.二分类资料C.有序分类变量资料D.数值变量资料11.下面有关误差的叙述,错误的是(D )。
A.随机误差不可以避免B.系统误差一定要避免发生C.抽样误差包含个体差异D.因为样本含量越大,抽样误差越小,所样本含量越大越好12.某药物临床试验数据的两端均没有确定数值,描述其中心位置适用的最佳指标是( A )。
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数
区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常
置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围
参数统计(parametric statistics)
非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异
同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位
β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。
参数(parameter):描述总体特征的统计指标。
统计量(statistic):描述样本特征的统计指标。
实验设计的基本原则
对照 (control) 对受试对象不施加处理因素的状态。
在确定接受处理因素的实验组时,要同时设立对照组
重复 (replication)相同实验条件下进行多次实验或多次观察。
整个实验的重复;观察多个受试对象(样
本量);同一受试对象重复观察。
作用是估计变异大小和降低变异
随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。
I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。
其发生的概率用α表示。
在假设检验中作为检验水准。
一般取0.05或0.01。
II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。
其发生的概率用β表示。
由于其取值取决于H1 ,因此在假设检验中无法确定。
变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。
数值越大,说明数据越离散,反之越集中。
极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation
平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。
算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode)
单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。
每个观察对象都有相同的机会被抽中
系统抽样又称机械抽样。
按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。
最常用的方法是等距抽样分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。
分层特征与研究目的有关。
按各层比例抽样。
为减少抽样误差,要求层内误差最小,层间误差最大。
整群抽样先将总体分成若干“群”,从中随机抽取几个群,抽取群内的所有观察单位组成调查样本。
“群”的确定与研究目的无关。
为减少抽样误差,需多抽几个“群”。
一、统计表有哪些要素构成的?制表的注意事项有哪些?
一般来说,统计表由标题、标目、线条和数字、备注五部分组成。
但备注并不是必需的内容,可以根据需要出现。
1简明扼要,重点突出:最好一张表突出一个中心,不易太多中心,如果需要说明多个中心,可分成多张统计表。
2合理安排主语和谓语的位置:对于表中任意一行,从左至右,通过简短的连接词,可连成成一句通顺的句子。
3表中数据要认真核对,保证准确可靠
二、为什么不宜用t 检验对多组均数进行比较?
如果用t检验进行多个样本均数的两两比较,则会增加犯I 类错误的概率。
经检验得到拒绝H0 ,认为两组之间有差别的结论可能犯I类错误的概率为α,不犯I类错误的概率为1-
α .每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误的
概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I类错误的概率为1-(1- α)k
三、方差分析的基本思想是什么?
按实验设计的类型,将全部观察值间的变异分解成两个或多个组成部分,然后将各部分的变异与随机误
差进行比较(每个部分的变异可由某因素的作用来解释),以判断各部分的变异是否具有统计学意义,从
而推断不同样本所代表的总体均数是否相同。
四、简述标准差与标准误的区别与联系
均数标准误大小与样本标准差大小成正比,与样本含量的平方根成反比。
标准误越小,说明样本均数作
为总体均数估计值的准确性越大。
S
五、简述直线相关与回归的区别与联系
区别:1.回归说明依存关系,直线回归用于说明两变量间数量依存变化的关系,描述y如何依赖于x而
变化;相关说明相关关系,直线相关用于说明两变量间的直线相关关系,此时两变量的关系是平等的2.r与b有区别:r说明具有直线关系的两个变量间相关的密切程度与相关方向; b表示x每改变
一个单位,y平均增(减)多少个单位;
3.资料要求不同:直线回归要求应变量y是来自正态总体的随机变量,而x可以是来自正态总体
的随机变量,也可以是严密控制、精确测量的变量,相关分析则要求x,y是来自双变量正态分布总体的
随机变量。
4.取值范围:-∞<b<+∞;-1≤r≤1.单位:b有单位;r无单位。
联系:1.对同一样本,若同时计算b和r,其正负号是一致的。
2.对同一样本,b和r的假设检验是等价的,二者的t值相等,t b=t r。
3. 回归可解释相关。
相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,
故回归平方和是引入相关变量后总平方和减少的部分。
六、简述实验设计的基本要素
1.处理因素(study factor,treatment)
•研究者根据研究目的欲施加或欲观察的能作用于受试对象并引起直接或间接效应的因素。
•处理因素可以是主动施加的某种外部干预或措施,也可以是客观存在的因素。
非处理因素
•与处理因素同时出现、也能使受试对象产生效应的因素。
•当非处理因素夸大或缩小了处理因素与实验效应间的真实联系时,称为混杂因素
2.受试对象/试验单位(object/experiment unit)
•处理因素作用的客体,是根据研究目的而确定的观察目标总体。
可以是人、动物,也可以是生物材料,试验单位的基本条件
3.处理/试验效应(experimental effect)
•处理因素作用于试验单位的反应和结果,通过观察指标来表达。
•选择指标的依据:客观性、特异性和敏感性。