SAS9.0在通径分析中的应用
- 格式:doc
- 大小:80.00 KB
- 文档页数:5
玉米新品种云瑞505 在楚雄地区的产量效应比较研究作者:樊应虎韩学坤张运锋等来源:《中国种业》 2019年第9期樊应虎1 韩学坤1 张运锋1 薛国峰1 陆秀春1 高尚2 侯俊峰2范盼盼2 王会军1 李昌元1 欧阳军1 明博2(1云南省楚雄州农业科学院,楚雄 675000;2中国农业科学院作物科学研究所,北京100081)摘要:云南山区、半山区是玉米的主要种植区域,但长期以来缺乏适应性强的品种,且种植密度偏低、产量水平不高。
本研究以本地选育的云瑞505为研究材料,于2017-2018年在云南省楚雄开展研究,与适应性强的玉米品种郑单958、先玉335进行比较分析,调查了4.5万、6.0万、7.5万、9.0万和10.5万株/hm2等5个种植密度下的生长发育情况和产量指标。
研究发现,种植密度对3个供试玉米品种的生育期和株高均没有明显影响,云南本地选育品种云瑞505在单株生产能力、抗逆性和耐密性上较郑单958和先玉335表现突出;通径分析显示,云瑞505的产量提升主要依赖于种植密度(R2=0.9462)的增加,且在10.5万株/hm2种植密度下产量最高。
研究表明,在云南楚雄,云瑞505是适合当地生态条件的玉米品种,通过适当提高种植密度,能够提高玉米产量水平。
本研究为适宜本地生产条件的玉米品种的筛选和选育提供了借鉴。
关键词:玉米;密度;产量;云南玉米是云南省种植面积第一、总产第二的大田作物,产区主要集中在曲靖、昭通、文山、楚雄、红河、保山等地州市,平均单产4640kg/hm2左右[1-2]。
楚雄州地处滇中高原腹地,玉米种植面积多集中在山区和半山区,平均单产6000kg/hm2左右[3],与我国玉米主产区单产水平存在较大差距。
国内外研究均表明,增加玉米种植密度,提高光温资源利用效率,依靠群体发挥增产潜力是实现玉米高产的重要措施之一[4]。
在云南传统生产中认为,云南地区降水多、湿度大,苗期不利于成苗,植株建成期不利于协调个体与群体的竞争关系,易造成徒长、倒伏等不良后果,因此玉米种植密度偏低,一般不足6万株/hm2[5-6]。
sas精选应用实例
(一)数据分析领域
1、零售行业中心的预测分析
SAS具有强大的数据挖掘,机器学习,数据处理和预测分析的能力,为商业领域提供广泛的数据处理工具。
如在零售行业中,企业可以利用SAS来预测销售额、客流量、会员购买意愿等,从而更深入地了解消费者行为,以此优化未来的销售策略。
2、投资管理仿真
SAS专业提供分析业务流程,可以支持投资管理机构在模拟真实金融市场中实现投资决策,同时利用SAS代码,进行易受干扰的大规模财务数据的处理,实现更精细的数据分析,有效避免投资风险,为机构提供全面的投资管理解决方案。
3、运营管理风险评估
SAS可以帮助企业分析、综合运营管理风险,具体包括:量化预测等级、启动应对措施、优化运营流程、改进安全措施等。
通过运用相关数据,分析此类问题,可以有效改善运营管理风险,降低成本,提高企业运营水平。
(二)营销领域
1、客户分析
SAS的数据分析能力帮助企业发现客户消费规律、忠诚度以及各客户群之间的差异,以此判断客户购买偏好,用以根据不同客户群设计不同的营销方案。
2、促销分析
SAS对促销活动进行实时分析,通过处理大规模实时事件数据,及时识别客户行为,改善企业的营销活动,以达到节约成本、提升企业营销策略的最优化效果。
3、内容营销分析
在数字营销时代,把握客户心理有着重要的影响,SAS的内容分析能力可以帮助企业分析客户对信息、产品和服务的真实反应,优化企业的数字营销方案,从而保障企业线上营销质量。
SAS9.0在通径分析中的应用贵州大学农学院冯跃华搜集变量资料是农业科学研究经常采用的方法,如:搜集作物的产量与其构成因素穗数、粒数、粒重等资料,研究这些变量的目的想知道这些变量之间的关系,许多人往往采用简单回归和相关或多元回归分析。
但是,多元回归分析虽然在一定程度上能反映各个变量的真实关系,然而多元回归在分析偏回归系数时带有单位,使自变量对依变量的效应不能直接进行比较,从而不能比较各自变量的相对重要性。
要解决这个问题,进行通径分析(即为通径系数的分析)是一个比较好的选择。
然而令人感到棘手的是,面对繁杂的计算公式往往感到无从下手,下面从通径系数的概念入手,引出通径系数的求算方法,并利用SAS完成通径分析全过程。
1. 通径和通径系数的概念1.1 通径设依变量y和两个自变量x1、x2之间有如下关系:x1yx2图1 通径图在图1 中“→”中表示变量间存在因果关系,箭头方向是原因到结果,称为通径。
“”表示变量间存在相关关系,称为相关线,x1→y,x2→y为直接通径,由于x1,x2存在相关关系,又产生了两条间接通径,一条是x1是通过x2而作用于Y的通径,记作x1→x2→Y,一条是x2是通过x1而作用于y的通径,记作x2→x1→y。
这种情况可以推广到i个自变量,并记直接通径为i→y(i=1,2,3····m),间接通径为i→j→y(i=1,2,3····m,i≠j ) ,但也可统一记作i→j→y,当i=j时为直接通径,i≠j时为间接通径。
1.2 通径系数表示各条通径,对于改变因变量的相对重要性的统计数就叫通径系数(path coefficient), 记作P i→j→Y 或简写为P ijY。
通径系数的定义可以由偏回归系数导出。
例如水稻单株产量y(kg)与x1(穗数),x2(单穗粒数),x3(粒重)间存在着线性回归关系。
其回归关系为:y=b0+b1x1+b2x2+b3x3,此式中b0为常数,b1、b2、b3分别表示y对x1,y对x2, y对x3的偏回归系数,偏回归系数是带有单位的,如b1,b2的单位分别为:kg/穗,kg/粒。
所以不便于偏回归系数进行直接比较。
所以常常将其标准化之后以便于消去单位,进行直接比较。
下面进行回归方程的标准化:y=b0+b1x1+b1x2+b1x3 (1)由(1)对y求平均数得:y’=b0+b1x’1+b1x’2+b1x’3 (2)用(1)式减(2)得:y- y’= b1(x1- x’1)+ b2(x2- x2’)+ b3(x3- x3’) (3)由(3)式除σy得:(y- y’)/ σy = b1(x1- x1’)/σy + b2(x2- x2’) /σy+ b3(x3- x3’)/σy (4)将(4)式做相应得恒等变换:(y-y’)/σy= b1(σx1/σy)[(x1- x1’)/σx1]+ b2(σx2/σy)[(x2- x2’)/σx2]+ b3(σx3/σy)[(x3- x3’)/σx3] (5)其中σy,σx1,σx2,σx3分别为y,x1,x2,x3的标准差,并令:∆y=(y-y’)/σy,∆x1= (x1- x1’)/σx1,∆x 2 = (x 2- x 2’)/σx2,∆x 3 = (x 3- x 3’)/σx3 ,∆y 、∆x 1、∆x 2、∆x 3即为变量y 、x 1、x 2、x 3的标准化,将(5)式 改写成下式:∆y =b 1(σx1/σy )∙ ∆x 1+ b 2(σx2/σy ) ∙ ∆x 2 + b3(σx3/σy ) ∙ ∆x 3则b 1∙(σx1/σy ),b 2∙(σx2/σy ),b 3∙(σx3/σy )为变量标准化后的偏回归系数,它是不带单位的相对数,这样就可以用以估计∆x 1,∆x 2,∆x 3对∆y 直接影响效应的大小,并比较其重要性。
因此通径系数的定义:若相关变量y 与x 1、x 2 ······x k 间存在着直线回归关系,其回归方程为: y=b 0+b 1x 1+b 1x 2+ ······+b k x k ,则变量标准化后的各偏回归系数b 1∙(σx1/σy ),b 2∙(σx2/σy ),···,b k ∙(σxk /σy )分别为自变量x 1 x 2 ··· x k 对依变量的直接通径系数,即:P 1y = b 1∙(σx1/σy ),P 2y = b 2∙(σx2/σy ), ···, P ky = b k ∙(σxk /σy ),简言之,通径系数是变量标准化的各偏回归系数,用以表示相关变量因果关系的一个统计量。
2. 通径系数的类型通径系数包括直接通径系数和间接通径系数两种类型。
2.1 直接通径系数对于回归方程y= b 0+b 1x 1+b 2x 2+b 3x 3+…+b k x k ,则有x 1对y 的直接通径系数为P 1y =b1*δx 1/δy, x 2对y 的直接通径系数为P 2y =b1*δx 2/δy,x k 对y 的接通径系数为P ky =b1*δx k /δy,其中δx1、δx2、δy 分别为x 1 、x 2、 x k 的方差。
2.2 间接通径系数由许多自变量影响着依变量,但是它们的重要性是不同的,其中一个自变量可能通过其它自变量对依变量起作用,这时可用间接通径系数来表示它。
如x i 通过x j 对y 起作用,间接通径系数为:r ij P jy ,r ij 表示x i 和x j 之间的相关系数,P jy 表示x j 对y 的直接通径系数。
2.3 直接、间接通径系数和相关系数的关系依据回归系数和通径系数的定义以及最小二乘法原理可得到:r ij = P iy + ∑r ij P jy (i ≠j ,i 、j=1,2,3….K ) 即:一个自变量对因变量的直接通径系数和间接通径系数的总和等于这个自变量与因变量之间的相关系数。
例如:对多元回归方程y=bo+b 1x 1+b 2x 2+b 3x 3, 有r 1y =P 1y +r 12P 2y +r 13P 3y, r 2y =P 2y +r 21P 1y +r 23P 3y , r 3y =P 3y +r 3P 1y +r 32P 2y 。
并可以得到表1:表1 直接通径系数和间接通径系数表注:斜体部分为直接通径系数,其它为间接通径系数。
3. 通径系数的性质通径系数有以下几个性质:1)一个具有k 个自变量的反应系统,共有m 个直接通径系数和m(m-1)个间接通径系数。
2)进行通径分析的基础是Y 和X i 都具有线性关系,而且Y 可以被线性分解。
3)通径系数是具有向量的。
如:X i 和Y 不可以互换,即:Piy ≠Pyi 。
它的取值在实数范围内可以大于1或小于-1。
4)通径系数是变量标准化的偏回归系数,它能够表示变量间的因果关系,故具有回归系数性质。
5)通径系数不带具体单位,因而又具有相关系数的性质,表示原因与结果的相关关系。
所以通径系数是介于回归系数和相关系数之间的一种统计量。
6)通径系数可以表示某个自变量的相对重要性。
4. 应用SAS 进行通径分析的具体过程SAS 是美国使用的最为广泛的三大著名统计分析软件(SAS, SPSS 和SYSTAT )之一,是目前国际上最为流行的一种大型的统计分析系统,被誉为统计分析的标准软件。
对于通径系数,如采用其它常规的统计方法,往往颇费周折。
如采用SAS 软件,往往比较简单,较快的完成分析过程。
下面通过一个X1 X2 X3 Y X1 X2 X3r11P1y r21P1y r31P1yr12P2y r22P2y r32P2yr13P3y r23P3y r33P3yr1y r2y r3y实例,介绍应用SAS进行通径分析的基本作法。
例:测定"丰产3号"小麦的每株穗数(X1),每穗结实小穗数(X2,主茎),百粒重(X3,克),和每株籽粒产量(Y,克)的关系,得结果于表1,试求Y依Xi的最优线性回归方程,并作通径分析.表1 "丰产3号"小麦的每株穗数(X1)、每穗结实小穗数(X2)、百粒重(X3)、株高(X4)和每株籽粒产量(Y)的关系X1 X2 X3 y10 9 10 13 10 10 8 10 10 10 10 8 6 8 9 2320222122232324202123212321223.63.63.73.73.63.53.33.43.43.43.93.53.23.73.615.714.517.522.515.516.98.617.013.713.420.310.27.411.612.34.1 直接通径系数的求法在sas的程序窗口中输入以下程序:DM"log;clear;output;clear;";ods rtf file='D:\sas2003\tongjing.rtf';PROC IMPORT OUT= MYSAS.tongjingDATAFILE= "D:\sas2003\tongjing.xls"DBMS=EXCEL2000 REPLACE;SHEET="Sheet1$";GETNAMES=YES;RUN;proc reg corr;model y=x1-x3/selection=stepwise sls=.05sle=.05STB;run;quit;ods rtf close;此段程序中,new表示临时数据集;proc reg corr 语句表示调用reg和corr程序,进行回归分析和相关分析;model语句表示选用逐步回归法进行分析,sls= 和sle=定义选入和剔除自变量的限制水平(0.05),STB给出直接通径系数。
运行可以得到以下部分结果:SAS 系统11:02 Tuesday, June 4, 2002 1The REG ProcedureCorrelationVariable Label X1 X2 X3 yX1 X1 1.0000 -0.1357 0.5007 0.8973X2 X2 -0.1357 1.0000 -0.1489 0.0462X3 X3 0.5007 -0.1489 1.0000 0.6890y y 0.8973 0.0462 0.6890 1.0000SAS 系统11:02 Tuesday, June 4, 2002 2The REG ProcedureModel: MODEL1Dependent Variable: y yStepwise Selection: Step 1Variable X1 Entered: R-Square = 0.8052 and C(p) = 15.9479Analysis of VarianceSum of MeanSource DF Squares Square F Value Pr > FModel 1 193.15219 193.15219 53.73 <.0001Error 13 46.73714 3.59516Corrected Total 14 239.88933Parameter StandardVariable Estimate Error Type II SS F Value Pr > FIntercept -8.06429 3.11354 24.11809 6.71 0.0224X1 2.39762 0.32711 193.15219 53.73 <.0001Bounds on condition number: 1, 1---------------------------------------------------------------------------------------------------Stepwise Selection: Step 2Variable X3 Entered: R-Square = 0.8818 and C(p) = 7.3443Analysis of VarianceSum of MeanSource DF Squares Square F Value Pr > FModel 2 211.54256 105.77128 44.78 <.0001Error 12 28.34677 2.36223Corrected Total 14 239.88933Parameter StandardVariable Estimate Error Type II SS F Value Pr > FIntercept -30.01290 8.26129 31.17756 13.20 0.0034X1 1.96965 0.30632 97.66880 41.35 <.0001X3 7.33659 2.62942 18.39037 7.79 0.0163Bounds on condition number: 1.3346, 5.3385---------------------------------------------------------------------------------------------------Stepwise Selection: Step 3Variable X2 Entered: R-Square = 0.9205 and C(p) = 4.0000Analysis of VarianceSum of MeanSource DF Squares Square F Value Pr > F Model 3 220.81143 73.60381 42.44 <.0001 Error 11 19.07790 1.73435 Corrected Total 14 239.88933Parameter StandardVariable Estimate Error Type II SS F Value Pr > FIntercept -46.96636 10.19262 36.82480 21.23 0.0008 X1 2.01314 0.26314 101.50782 58.53 <.0001 X2 0.67464 0.29183 9.26887 5.34 0.0412X3 7.83023 2.26313 20.76193 11.97 0.0053以上结果给出了四个变量(x1,x2,x3,y)间的相关系数,并经逐步回归,三个变量全部保留在回归方程中,可以建立如下回归方程:y=-46.966359 + 2.013139X 1+ 0.674644X 2 + 7.830227X 3 ,三个自变量全部达到0.05显著水平,还可以达到许多信息,如:回归平方和及均方,剩余平方和及均方,总平方和,决定系数(R2),自变量和回归截距标准误(standard error),重要的是给出了直接通径系数(standardized Estimate).P1y = 0.7534 P2y = 0.1993 P3y = 0.3414 4.2 间接通径系数的求法由通径系数的定义可得:P12y = r12*P2y = -0.1357*0.1993 = -0.02705 P13y = r13*P3y = 0.5007*0.03414= 0.01709,同理,可以算出P21y,P23y,P31y,P32y, 最后得到表3:表3 直接通径系数和间接通径系数表 注:斜体部分为直接通径系数,其它为间接通径系数。