统计学教案习题10直线相关与回归
- 格式:doc
- 大小:344.00 KB
- 文档页数:10
一、选择题1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____.A.b无统计学意义B.b有高度统计学意义C.b有统计学意义D.不能肯定b有无统计学意义E.a有统计学意义【答案】C2.关于基于秩次的非参数检验,下列说法错误的是_____.A.符号秩和检验中,差值为零不参加编秩B.两样本比较的秩和检验方法中的正态近似法为参数检验C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大D.当样本足够大时,秩和分布近似正态E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异【答案】B3.随机事件的概率为______.A.P=1B.P=0C.P=-0.5D.0≤P≤1E.-0.5【答案】D4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______.A.两样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同E.越有理由认为两总体均数相同【答案】C5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率,应用何种统计检验方法来较好地分析此数据_____.A.配对t检验B.成组t检验C.成组秩和检验D.配对秩和检验E.两组方差齐性检验【答案】A6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____.A.T值越大P值越小B.T值越大越有理由拒绝H0C.P值与T值毫无联系D.T值越小P值越小E.以上都不对【答案】D7.方差分析中要求______.A.各个样本均数相等B.各个总体方差相等C.各个总体均数相等D.两样本方差相等E.两个样本来自同一总体【答案】B8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。
A.已知二组患者的白细胞计数均降低B.已知二组患者的白细胞计数均升高C.不清楚哪一组的白细胞计数水平有变化D.已知非典型肺炎患者的白细胞计数不高于普通肺炎E.两组白细胞计数值的总体方差不相等【答案】D9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______.A.男童的肺炎发病率高于女童B.应进行标准化后再做比较C.资料不具可比性,不能直接作比D.应进行假设检验后再下结论E.以上都不对【答案】D10.比较两个率时,不需要进行率的标准化的情况有______.A.内部构成不同B.内部构成相同C.未知各年龄别人口数D.缺乏各年龄别死亡人数E.不易寻找标准人口构成【答案】B11.四格表资料在哪种情况下作χ2检验不必校正______.A.T>1且n>40B.T>5或n>40C.T>5且n>40D.1E.T>5且n<40【答案】C12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______.A.t检验B.方差分析C.χ2检验D.秩和检验E.u检验【答案】D13.下面说法中不正确的是_____.A.没有个体差异就不会有抽样误差B.抽样误差的大小一般用标准误来表示C.好的抽样设计方法,可避免抽样误差的产生D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别【答案】C14.实验设计和调查设计的根本区别是_____.A.实验设计以动物为对象B.调查设计以人为对象C.调查设计可随机分组D.实验设计可人为设置处理因素E.以上都不对【答案】D15.在下述抽样调查方法中,在样本量相同的前提下,抽样误差最小的是_____.A.简单随机抽样B.系统抽样C.分层抽样D.整群抽样E.多阶段整群抽样【答案】C16.对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______.A.有相关关系B.无任何关系C.无直线相关关系D.无因果关系E.有伴随关系【答案】C17.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组无任何处理,这种对照属于______.A.实验对照B.空白对照C.相互对照D.标准对照E.历史对照【答案】B18.在两独立样本比较的秩和检验中,实验组的观察值为0,0,7,14,32,40,对照组的观察值为0,1,2,4,4,8.编秩中零值的秩应分别编为______.A.2,3;1B.1.5,1.5;3C.2,2;2D.2.5,2.5;1E.不参加编秩【答案】C19.两样本比较的秩和检验(两组样本例数相等),如果假设成立,则对样本来说:______.A.两组秩和相等B.两组秩和的绝对值相等C.两组秩和相差很大D.两组秩和相差一般不会很大E.两组秩和的差值相等【答案】D20.在简单线性回归分析中,得到回归系数为-0.30,经检验有统计学意义,说明______.A.X对Y的影响占Y变异的30%B.X增加一个单位,Y平均减少30%C.X增加一个单位,Y平均减少0.30个单位D.Y增加一个单位,X平均减少30%E.Y增加一个单位,X平均减少0.30个单位【答案】C二、多选题在A、B、C、D和E中选出一个最佳答案,将答案的字母填在相应下划线的空格里。
第八章直线回归与相关习题一、选择题1.直线回归中,如果自变量X 乘以一个不为0或1的常数,则有()。
A.截距改变B.回归系数改变C.两者都改变D.两者都不改变E.以上情况都有可能2.如果直线相关系数1=r ,则一定有()。
A.残总SS SS =B.回残=SS SSC.回总=SS SS D.回总SS SS > E.以上都不正确3.相关系数r 与决定系数2r 在含义上是有区别的,下面的几种表述,哪一种最正确?()。
A.r 值的大小反映了两个变量之间是否有密切的关系B.r 值接近于零,表明两变量之间没有任何关系C.r 值接近于零,表明两变量之间有曲线关系D.2r 值接近于零,表明直线回归的贡献很小E.2r 值大小反映了两个变量之间呈直线关系的密切程度和方向4.不同地区水中平均碘含量与地方性甲状腺肿患病率的资料如下:地区编号1234 (17)碘含量(单位)10.0 2.0 2.5 3.5……24.5患病率(%)40.537.739.020.0……0.0研究者欲通过碘含量来预测地方性甲状腺肿的患病率,应选用()。
A.相关分析B.回归分析C.等级相关分析D.2χ检验E.t 检验5.直线回归中X 与Y 的标准差相等时,以下叙述()正确。
A.a b = B.r b = C.1=b D.1=r E.以上都不正确6.利用直线回归估计X 值所对应Y 值的均数可信区间时,()可减小区间长度。
A.增加样本含量B.令X 值接近其均数C.减小剩余标准差D.减小可信度E.以上都可以7.有两组适合于作直线相关分析的实验资料(按专业知识都应取双侧检验),第1组资料:51=n ,857.01=r ;第2组资料:82=n ,712.02=r 。
在没有详细资料和各种统计用表的条件下,可作出的结论是()。
A.缺少作出明确统计推断的依据B.因12n n >,故2r 有显著性意义C.因21r r >,故1r 有显著性意义D.1r 、2r 都有显著性意义E.1r 、2r 都没有显著性意义8.某监测站同时用极谱法和碘量法测定了水中溶解氧的含量,结果如下。
第十章 直线相关与回归一、教学大纲要求(一) 掌握内容⒈ 直线相关与回归的基本概念。
⒉ 相关系数与回归系数的意义及计算。
⒊ 相关系数与回归系数相互的区别与联系。
(二)熟悉内容⒈ 相关系数与回归系数的假设检验。
⒉ 直线回归方程的应用。
⒊ 秩相关与秩回归的意义。
(三)了解内容 曲线直线化。
二、学内容精要(一) 直线回归 1. 基本概念直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。
直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression )。
直线回归方程bX a Y+=ˆ中,a 、b 是决定直线的两个系数,见表10-1。
表10-1 直线回归方程a 、b 两系数对比ab含义回归直线在Y 轴上的截距(intercept )。
表示X 为零时,Y 的平均水平的估计值。
回归系数(regression coefficient ),即直线的斜率。
表示X 每变化一个单位时,Y 的平均变化量的估计值。
系数>0 a >0表示直线与纵轴的交点在原点的上方b >0,表示直线从左下方走向右上方,即Y 随X 增大而增大 系数<0 a <0表示直线与纵轴的交点在原点的下方b <0,表示直线从左上方走向右下方,即Y 随X 增大而减小系数=0 a =0表示回归直线通过原点 b =0,表示直线与X 轴平行,即Y 不随X 的变化而变化计算公式X b Y a -=XX XY l l X X Y Y X X b =---=∑∑2)())(( 2. 样本回归系数b 的假设检验(1)方差分析;(2)t 检验。
3. 直线回归方程的应用(1)描述两变量的依存关系;(2)用回归方程进行预测; (3)用回归方程进行统计控制;(4)用直线回归应注意的问题。
(二) 直线相关 1. 基本概念直线相关(linear correlation )又称简单相关(simple correlation ),用于双变量正态分布资料。
有正相关、负相关和零相关等关系。
直线相关的性质可由散点图直观的说明。
相关系数又称积差相关系数(coefficient of product-moment correlation ),以符号r 表示样本相关系数,ρ表示总体相关系数。
它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。
2.计算公式YYXX XY l l l Y Y X X Y Y X X r =----=∑∑22)()())((相关系数r 没有单位,其值为-1≤r ≤1。
其绝对值愈接近1,两个变量间的直线相关愈密切;愈接近0,相关愈不密切。
r 值为正表示正相关,说明一变量随另一变量增减而增减,方向相同;r 值为负表示负相关,说明一变量增加、另一变量减少,即方向相反;r 的绝对值等于1为完全相关。
3. 样本相关系数r 的假设检验 (1)r 界值表法; (2)t 检验法。
(三)直线回归与相关的区别与联系 1. 区别(1) 资料要求:直线回归要求因变量Y 服从正态分布,X 是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;直线相关要求两个变量X 、Y 服从双变量正态分布。
这种资料若进行回归分析称为Ⅱ型回归。
(2) 应用情况:直线回归是说明两变量依存变化的数量关系;直线相关是说明两变量间的相关关系。
(3) 意义:b 表示X 每增(减)一个单位时,Y 平均改变b 个单位;r 说明具有直线关系的两个变量间关系的密切程度与相关方向。
(4) 计算:b= l xy / l xx ;r = l xy /yy xx l l 。
(5) 取值范围:—∞<b <+∞ ;-1≤r ≤1 。
(6) 单位:b 有单位;r 没有单位。
2. 联系(1) 方向一致:对一组数据若能同时计算b 和r ,它们的符号一致。
(2) 假设检验等价:对同一样本,r 和b 的假设检验得到的t 值相等,即t b =t r 。
(3) 用回归解释相关:决定系数总回SS SS l l l r yyxx xy==22,回归平方和越接近总平方和,则r 2越接近1,说明引入相关的效果越好。
(四)秩相关秩相关,又称等级相关(rank correlation ),是用双变量等级数据作直线相关分析,适用于下列资料: ⒈ 不服从双变量正态分布而不宜作积差相关分析; ⒉ 总体分布型未知; ⒊ 用等级表示的原始数据。
三、典型试题分析1.回归系数的假设检验( )A .只能用r 的检验代替B .只能用t 检验C .只能用F 检验D .三者均可答案:D [评析] 本题考点:回归系数假设检验方法的理解。
回归系数的假设检验常用的方法有:①方差分析;②t 检验。
对同一样本,r 和b 的假设检验等价,r 和b 的假设检验得到的t 值相等,即t b =t r 。
故回归系数的假设检验用三者均可。
2.已知r 1=r 2,那么( )A .b 1=b 2B .t b 1=t b 2C .t r 1=t r 2D .两样本决定系数相等答案: D [评析] 本题考点:直线相关系数与回归系数关系的理解。
因为相关系数r 和回归系数b 的计算公式不同,不能推导出b 1=b 2 ;r 和b 的假设检验等价,即t r 1= t b 1,t r 2=t b 2,而不是t b 1=t b 2,t r 1=t r 2 ;样本决定系数为r 2,已知r 1=r 2,则两样本决定系数相等,即r 12=r 22。
3.|r |>r 0.05( n-2)时,可认为两变量X 与Y 间( )A .有一定关系 B. 有正相关关系 C .一定有直线关系 D. 有直线关系答案: D [评析] 本题考点:直线相关系数假设检验的理解。
因为直线相关系数r 是样本的相关系数,它是相应总体相关系数ρ的估计值。
由于抽样误差的影响,必须进行显著性检验。
r 的假设检验是检验两变量是否有直线相关关系。
|r |>r 0.05( n-2)时,P <0.05,拒绝H 0,接受H 1,认为总体相关系数ρ≠0,因此可认为两变量X 与Y 间有直线关系。
4.相关系数检验的无效假设H 0是( )A .ρ=0 B. ρ≠0 C .ρ>0 D. ρ<0答案: A [评析] 本题考点:直线相关系数显著性检验中检验假设的理解。
因为r 是样本相关系数,它是总体相关系数ρ的估计值。
要判两变量间是否有相关关系,就要检验r 是否来自总体相关系数ρ为零的总体。
因为即使从ρ=0的总体作随机抽样,由于抽样误差的影响,所得r 值也常不等于零。
5.同一双变量资料,进行直线相关与回归分析,有( )。
A .r >0,b <0 B. r >0,b >0C .r <0,b >0 D. r 与b 的符号毫无关系答案: B [评析] 本题考点:直线相关与回归的区别与联系的理解。
因为对同一资料而言直线相关系数与回归系数的方向一致,若能同时计算b 和r ,它们的符号一致。
因此,同一双变量资料,进行直线相关与回归分析,有r >0,b >0。
四、习 题(一) 单项选择题 1.下列( )式可出现负值。
A .∑(X —X )2B .∑Y 2—(∑Y )2/nC .∑(Y —Y ) 2D .∑(X —X )(Y —Y ) 2.Y =14+4X 是1~7岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重换成国际单位kg ,则此方程( )。
A .截距改变B .回归系数改变C .两者都改变D .两者都不改变3.已知r =1,则一定有( )。
A .b =1B .a =1C .S Y. X =0D .S Y. X = S Y4.用最小二乘法确定直线回归方程的原则是各观察点( )。
A .距直线的纵向距离相等 B .距直线的纵向距离的平方和最小 C .与直线的垂直距离相等 D .与直线的垂直距离的平方和最小5.直线回归分析中,X 的影响被扣除后,Y 方面的变异可用指标( )表示。
A .,x y S = B. r S =C. ,y xS = D. b S S =6.直线回归系数假设检验,其自由度为( )。
A .nB .n -1C .n -2D .2n -1 7.应变量Y 的离均差平方和划分,可出现( )。
A .SS 剩=SS 回B .SS 总=SS 剩C .SS 总=SS 回D .以上均可8. 下列计算SS 剩的公式不正确的是( )。
A .YY XY l l b -B . YY XX l bl -C. 2YY XY XX l l l - D .2(1)YY r l - 9. 直线相关系数可用( )计算。
A .YY XX XY l l lB .YY XX YX l l bC .XY YX b bD . 以上均可10. 当r =0时,bX a Y+=ˆ回归方程中有( )。
A .a 必大于零 B. a 必等于X C .a 必等于零 D. a 必等于Y(二) 名词解释1. 直线回归2. 回归系数3. 剩余平方和4. 回归平方和5. 直线相关6. 零相关7. 相关系数8. 决定系数9. 曲线直线化 10.秩相关 (三) 是非题1. 剩余平方和SS 剩1=SS 剩2,则r 1必然等于r 2。
2. 直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。
3. 两变量关系越密切r 值越大。
(四)简答题1. 用什么方法考察回归直线图示是否正确? 2. 剩余标准差的意义和用途?3. 某资料n =100,X 与Y 的相关系数为r =0.1,可否认为X 与Y 有较密切的相关关系? 4. r 与r s 的应用条件有何不同?5. 应用直线回归和相关分析时应注意哪些问题? 6. 举例说明如何用直线回归方程进行预测和控制? 7. 直线回归分析时怎样确定因变量与自变量? (五)计算题1.10名20岁男青年身高与前臂长的数据见表10-2。
⑴计算相关系数并对ρ=0进行假设检验;⑵计算总体ρ的95%可信区间。
表10-2 10名20岁男青年身高与前臂长身 高(cm )170 173 160 155 173 188 178 183 180 165 前臂长(cm )45 42 44 41 47 50 47 46 49 432. 某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量和增加体重的数据见表10-3。
⑴此资料有无可疑的异常点?⑵求直线回归方程并对回归系数作假设检验。
⑶试估计进食量为900g 时,大白鼠的体重平均增加多少,计算其95%的可信区间,并说明其含义。
⑷求进食量为900g 时,个体Y 值的95%容许区间,并解释其意义。