生物统计学 一元回归及简单相关分析
- 格式:ppt
- 大小:1.09 MB
- 文档页数:45
回归分析法概念及原理一(一元线性回归)2009-12-14 14:27最近,在学一门统计学,有点意思。
问题一点一点出现,又一点一点被慢慢解决,慢慢消化~~做为初学者,搞不清的地方还真多。
今天刚好又看了有关相关分析和回归分析的学习资料,感觉不错,闲来与大家分享分享。
一、一元回归分析法,是在考虑预测对象发展变化本质基础上,分析因变量随一个自变量变化而变化的关联形态,借助回归分析建立它们因果关系的回归方程式,描述它们之间的平均变化数量关系,据此进行预测或控制。
1、基本原理假设预测目标因变量为Y,影响它变化的一个自变量为X,因变量随自变量的增(减)方向的变化。
一元线性回归分析就是要依据一定数量的观察样本(Xi,Yi)i=1,2…,n,找出回归直线方程Y=a+bX (1)对应于每一个Xi,根据回归直线方程可以计算出一个因变量估计值Yi。
回归方程估计值Yi 与实际观察值Yj之间的误差记作e-i=Yi-Yi。
显然,n个误差的总和越小,说明回归拟合的直线越能反映两变量间的平均变化线性关系。
据此,回归分析要使拟合所得直线的平均平方离差达到最小,简称最小二乘法将求出的a和b代入式(1)就得到回归直线Y-i =a+bXI 。
那么,只要给定Xi-值,就可以用作因变量Y i的预测值。
2、变量间的关系确定性关系或函数关系:研究的是确定性现象非随机变量间的关系。
统计依赖关系或相关关系:研究的是非确定性现象随机变量间的关系。
几点注意:–不线性相关并不意味着不相关;–有相关关系并不意味着一定有因果关系;–相关分析对称地对待任何(两个)变量,两个变量都被看作是随机的;回归分析对变量的处理方法存在不对称性,即区分因变量(被解释变量)和自变量(解释变量):前者是随机变量,后者不是。
总体回归函数:•给定解释变量X的某个确定值X i,与之统计相关的被解释变量Y的总体均值(期望值)可以表示为:上式说明了被解释变量Y平均地说随解释变量X变化的规律,一般称为总体回归函数或总体回归方程(population regression function,PRF);对应的曲线称为总体回归曲线(population regression curve),它可以是线性的或非线性的。
第十章一元回归及简单相关分析10.1对尿毒症患者采用低蛋白并补加基本氨基酸的食物进行治疗,分析该疗法对患者体内一些成分的影响。
以下数据是在治疗前患者的基本数据[64]:体重(BW)/kg 体内总钾(TBK)/mmol血清尿素(UREA)/(mmol·L-1)73 3 147 1970 3 647 3672 3 266 2553 2 650 2597 3 738 3477 3 982 3663 2 900 4954 3 194 3866 3 930 1653 3 419 3470 3 978 3463 2 747 2665 4 181 4688 3 678 4182 3 540 3969 3 912 1991 4 138 3562 2 896 4374 3 410 5090 3 679 2374 3 855 3871 2 750 5059 3 583 3180 3 268 4766 2 846 45115 4 804 65111 5 290 3864 2 960 4571 3 610 2469 2 905 31计算三者之间的相关系数,并检验相关的显著性。
答:所用程序及计算结果如下:options linesize=76 nodate;data uremia;infile 'e:\data\er10-1e.dat';input bw tbk urea @@;run;proc corr nosimple;var bw tbk urea;run;The SAS SystemCorrelation Analysis3 'VAR' Variables: BW TBK UREAPearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 30BW TBK UREABW 1.00000 0.70594 0.285820.0 0.0001 0.1257TBK 0.70594 1.00000 0.096610.0001 0.0 0.6116UREA 0.28582 0.09661 1.000000.1257 0.6116 0.0三个变量间,只有体重(BW)和体内总钾(TBK)间相关显著,r=0.705 94。