应用统计学 第12章例题分析
- 格式:doc
- 大小:420.50 KB
- 文档页数:9
《应用统计学》习题解答第一章绪论【1.1】指出下列变量的类型:(1)汽车销售量;(2)产品等级;(3)到某地出差乘坐的交通工具(汽车、轮船、飞机);(4)年龄;(5)性别;(6)对某种社会现象的看法(赞成、中立、反对)。
【解】(1)数值型变量(2)顺序变量(3)分类变量(4)数值型变量(5)分类变量(6)顺序变量【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
(3)这里涉及到的统计指标是什么?【解】(1)总体:某大学所有的大学生样本:从某大学抽取的200名大学生(2)参数:某大学大学生的月平均消费水平统计量:从某大学抽取的200名大学生的月平均消费水平(3)200名大学生的总消费,平均消费水平【1.3】下面是社会经济生活中常用的统计指标:①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。
在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤质量指标有:③、④、⑥、⑦、⑧数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。
而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。
【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。
回答以下问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)对居住环境的满意程度是什么变量?【解】(1)这一研究的总体是某小区的所有居民。
(2)月收入是数值型变量(3)对居住环境的满意程度是顺序变量。
第二章统计数据的搜集【2.1】从统计调查对象包括的范围、调查登记时间是否连续、搜集资料的方法是否相同等方面,对以下统计调查实例分类,并指出各属于那种统计调查方式。
应用统计学课后习题与参考答案第一章一、选择题1.一个统计总体(D)。
A.只能有一个标志 B.只能有一个指标C.可以有多个标志 D.可以有多个指标2.对100名职工的工资收入情况进行调查,则总体单位是(D)。
A.100名职工 B.100名职工的工资总额C.每一名职工 D.每一名职工的工资 3.某班学生统计学考试成绩分别为65分、72分、81分和87分,这4个数字是(D)。
A.指标 B.标志C.变量 D.标志值4.下列属于品质标志的是(B)。
A.工人年龄 B.工人性别C.工人体重 D.工人工资5.某工业企业的职工数、商品销售额是(C)。
A.连续变量 B.离散变量C.前者是离散变量,后者是连续变量 D.前者是连续变量,后者是离散变量 6.下面指标中,属于质量指标的是(C)。
A.全国人口数 B.国内生产总值C.劳动生产率 D.工人工资7.以下指标中属于质量指标的是(C)。
A.播种面积 B.销售量C.单位成本 D.产量8.下列各项中属于数量指标的是(B)。
A.劳动生产率 B.产量C.人口密度 D.资金利税率二、简答题1.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?总体是“所有的网上购物者”。
(2)“消费者在网上购物的原因”是定类变量、定序变量还是数值型变量?分类变量。
(3)研究者所关心的参数是什么?所有的网上购物者的月平均花费。
(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?统计量。
(5)研究者所使用的主要是描述统计方法还是推断统计方法?推断统计方法。
2.要调查某商场销售的全部冰箱情况,试指出总体、个体是什么?试举若干品质标志、数量标志、数量指标和质量指标。
总体:该商店销售的所有冰箱。
总体单位:该商店销售的每一台冰箱。
品质标志:型号、产地、颜色。
数量标志:容量、外形尺寸;数量指标:销售量、销售额。
质量指标:不合格率、平均每天销售量、每小时电消耗量。
第12章群落参数统计分析群落生态学家在解释和测度动植物群落特征特性时面对的是一类特殊的统计问题。
有些群落研究,例如能量分析,只需要使用一般的统计学方法、原理,就可以对群落内物种的丰富度进行估计。
但是,有些群落研究,需要使用一些新的参数,在群落水平来度量各个群落之间的相似性(similarity)。
DPS系统提供了常用的群落相似性参数估计,包括二项分布系数和距离系数。
前者可根据定性或定量调查资料通过计算各个生物群落间的相似系数和不相似(距离)系数来描述各个样本间的相似性测度;后者则根据定量资料,对群落的相似性进行测度。
植物生态学家为分析群落格局与环境关系,使用了大量的多变量统计分析技术。
如聚类分析、非线性映射分析、对应分析、主成分分析、因子分析及典型相关分析等。
这些分析技术将在后面章节中介绍。
本章仅介绍极点排序分析技术和对排序效果进行检验的方法。
群落物种多样性(diversity)是群落最直观的特征。
目前描述群落特征,比较群落之间差异时,一般都是使用多样性指数。
因此多样性指数在当今群落生态学中的应用十分广泛。
为检验群落的异质性所设计的多样性指数,多年来沿着两个不同途径发展,一是应用统计抽样理论方法观察分析群落结构如何发生发展变化的, 如对数序列模型(Fisher et al.,1943)和对数正态分布模型(Preston, 1948)。
二是应用信息理论来评价群落结构的多样性,如Simpson 指数、Shannon指数。
两种方法的可应用性一直在争论之中,但都由于理论依据不够充分而谁也说服不了谁。
因此两大类方法目前都在应用着。
我们在此也都进行介绍。
生态位理论,自从MacArthur(1967)开拓性的工作以来,目前已是分析群落结构最有力的方法之一。
群落结构的分析,以及群落内竞争物种之间动态的互作的描述都离不开物种生态位参数的度量。
在DPS 数据处理平台上,我们提供了生态位宽度(niche breadth)和生态位重叠(niche overlap)指标的估计技术。
第十二章实验设计12.1一项关于在干旱地区生长的一种杨树(Populus euphratica),在土壤中的水分逐渐丧失后,其基因表达、蛋白谱、生态生理学及生长性能等方面产生可逆性改变的研究。
作者在本实验的5个时间点上(H5为对照),用qPCR方法度量了该杨树叶子中的三个基因的转录丰度比[83],表中给出的为阵列数据:GenBank ID 基因H1H2H3H4H5AJ 780 423 半胱氨酸蛋白酶0.7 1.0 2.3 13.1 1.9AJ 780 698 环核苷酸和钙调节的离子通道 1.5 1.2 3.0 4.3 1.5AJ 777 362 核糖体蛋白 1.1 1.1 1.0 0.9 1.2借用上述数据,以三个基因作为三个区组,计算在5个时间点上转录丰度比差异是否显著?答:随机化完全区组实验设计方差分析的程序,类似于两因素交叉分组实验设计。
以下是本题的程序和结果:options linesize=76 nodate;data poplar;do block=1 to 3;do time=1 to 5;input trans @@;output;end;end;cards;0.7 1.0 2.3 13.1 1.91.5 1.2 3.0 4.3 1.51.1 1.1 1.0 0.9 1.2;proc anova;class block time;model trans=block time;run;The SAS SystemThe ANOVA ProcedureClass Level InformationClass Levels Valuesblock 3 1 2 3time 5 1 2 3 4 5Number of observations 15The SAS SystemThe ANOVA ProcedureDependent Variable: transSum ofSource DF Squares Mean Square F Value Pr > F Model 6 72.5560000 12.0926667 1.53 0.2809Error 8 63.1013333 7.8876667Corrected Total 14 135.6573333R-Square Coeff Var Root MSE trans Mean0.534848 117.6745 2.808499 2.386667Source DF Anova SS Mean Square F Value Pr > F block 2 18.82533333 9.41266667 1.19 0.3519 time 4 53.73066667 13.43266667 1.70 0.2416从上表中的结果可以看出,如果按随机化完全区组设计进行分析,不同时间点之间的差异不显著。
第12章例题分析(课本340页)(1)相关分析各变量之间的相关关系矩阵(包括自变量和因变量)不良贷款(亿元)各项贷款余额(亿元)本年累计应收贷款(亿元)贷款项目个数(个)本年固定资产投资额(亿元)不良贷款(亿元) 1各项贷款余额(亿元)0.84357136 1本年累计应收贷款(亿元)0.73150501 0.678771764 1贷款项目个数(个)0.70028149 0.848416404 0.58583149 1本年固定资产投资额(亿元)0.51851809 0.779702158 0.47243096 0.746646 1 各变量之间的相关关系矩阵(各个自变量之间的相关关系)各项贷款余额(亿元)本年累计应收贷款(亿元)贷款项目个数(个)本年固定资产投资额(亿元)各项贷款余额(亿元) 1本年累计应收贷款(亿元)0.67877176 1贷款项目个数(个)0.8484164 0.585831 1本年固定资产投资额(亿元)0.77970216 0.472431 0.746646 1 结论:各自变量不仅仅跟因变量存在较强的线性相关关系,而且自变量彼此之间也存在较强的相关关系。
(2)回归分析SUMMARY OUTPUT回归统计Multiple R 0.893086776R Square 0.797603989Adjusted R Square 0.757124787标准误差 1.778752284观测值25方差分析df SS MS F Significance F回归分析 4 249.371206 62.3428 19.70404 1.04E-06残差20 63.2791938 3.16396总计24 312.6504Coefficients 标准误差t StatP-valueLower 95%Upper 95%Intercept-1.021639763 0.78237236 -1.30582292 0.206433969 -2.653639903 0.61036038 各项贷款余额(亿元) 0.0400393530.010433723.83749534 0.0010284640.018274994 0.06180371本年累计应收贷款(亿元)0.148033891 0.078794333 1.8787377980.07493542 -0.016328206 0.31239599贷款项目个数(个) 0.014529353 0.083033158 0.174982537 0.862852686-0.15867478 0.18773349本年固定资产投资额(亿元)-0.029192866 0.015072973 -1.93676892 0.067030076 -0.0606345370.0022488结论:(一)估计的多元线性回归方程为:=i Y-1.021639763+0.040039353x i 1+0.148033891x i 2+0.014529353x i 3-0.029192866x i 4 或者如下写亦可:=Y-1.021639763+0.040039353x 1+0.148033891x 2+0.014529353x 3-0.029192866x 4 (二)拟合优度检验:。
第12章例题分析(课本340页)(1)相关分析各变量之间的相关关系矩阵(包括自变量和因变量)不良贷款(亿元)各项贷款余额(亿元)本年累计应收贷款(亿元)贷款项目个数(个)本年固定资产投资额(亿元)不良贷款(亿元) 1各项贷款余额(亿元)0.84357136 1本年累计应收贷款(亿元)0.73150501 0.678771764 1贷款项目个数(个)0.70028149 0.848416404 0.58583149 1本年固定资产投资额(亿元)0.51851809 0.779702158 0.47243096 0.746646 1 各变量之间的相关关系矩阵(各个自变量之间的相关关系)各项贷款余额(亿元)本年累计应收贷款(亿元)贷款项目个数(个)本年固定资产投资额(亿元)各项贷款余额(亿元) 1本年累计应收贷款(亿元)0.67877176 1贷款项目个数(个)0.8484164 0.585831 1本年固定资产投资额(亿元)0.77970216 0.472431 0.746646 1 结论:各自变量不仅仅跟因变量存在较强的线性相关关系,而且自变量彼此之间也存在较强的相关关系。
(2)回归分析SUMMARY OUTPUT回归统计Multiple R 0.893086776R Square 0.797603989Adjusted R Square 0.757124787标准误差 1.778752284观测值25方差分析df SS MS F Significance F回归分析 4 249.371206 62.3428 19.70404 1.04E-06残差20 63.2791938 3.16396总计24 312.6504Coefficients 标准误差t StatP-valueLower 95%Upper 95%Intercept-1.021639763 0.78237236 -1.30582292 0.206433969 -2.653639903 0.61036038 各项贷款余额(亿元) 0.0400393530.010433723.83749534 0.0010284640.018274994 0.06180371本年累计应收贷款(亿元)0.148033891 0.078794333 1.8787377980.07493542 -0.016328206 0.31239599贷款项目个数(个) 0.014529353 0.083033158 0.174982537 0.862852686-0.15867478 0.18773349本年固定资产投资额(亿元)-0.029192866 0.015072973 -1.93676892 0.067030076 -0.0606345370.0022488结论:(一)估计的多元线性回归方程为:=i Y-1.021639763+0.040039353x i 1+0.148033891x i 2+0.014529353x i 3-0.029192866x i 4 或者如下写亦可:=Y-1.021639763+0.040039353x 1+0.148033891x 2+0.014529353x 3-0.029192866x 4 (二)拟合优度检验:。
程所解释的比例为产投资额的多元回归方贷款项目个数、固定资本年累计应收贷款、不良贷款与贷款余额、款取值的变差中,能被进行调整后,在不良贷的自变量的个数:在用样本量和模型中实际意义,即修正后的。
所解释的比例为投资额的多元回归方程款项目个数、固定资产本年累计应收贷款、贷贷款余额、差中,能被不良贷款与:在不良贷款取值的变实际意义%76.79 75.71%70.75712478R R %76.79 79.76%90.79760398R a 222====(三)显著性检验(1) 总体的线性关系是否显著(线性关系的显著性检验)Significance F =1.04E-06<0.05,表明总体中因变量Y (不良贷款)与自变量X 1-X4(贷款余额、累计应收贷款、贷款项目个数、固定资产投资额)有显著的线性关系。
(2) 总体中各个变量对Y是否影响显著(回归系数的显著性检验)各项贷款余额(亿元) 0.001028464 本年累计应收贷款(亿元)0.07493542贷款项目个数(个)0.862852686本年固定资产投资额(亿元)0.067030076P-value=0.001028464<0.05,总体中各项贷款余额对不良贷款有显著影响;P-value=0.07493542>0.05,总体中本年累计应收贷款对不良贷款没有显著影响;P-value=0.862852686>0.05,总体中贷款项目个数对不良贷款没有显著影响;P-value=0.067030076>0.05,总体中固定资产投资额对不良贷款没有显著影响;对于以上回归方程的结果,可以通过假设检验判断,总体中只有各项贷款余额一个变量对不良贷款影响显著,其他对不良贷款影响不大。
但是由于相关分析中可以看出,各个变量彼此之间相关关系也很强,那么本回归方程需进一步分析:(逐步回归法)(1)分别做各个自变量与因变量的一元线性回归方程,记录各个判定系数和F 值如下:SUMMARYOUTPUT回归统计Multiple R 0.843571364R Square 0.711612647Adjusted RSquare0.699074066标准误差 1.979947533观测值25方差分析df SS MS F Significance F回归分析 1 222.4859787222.485978756.753844061.18349E-07残差23 90.164421343.920192232总计24 312.6504Coefficients标准误差t Stat P-value Lower 95% Upper 95%Intercept -0.8295206170.723043295-1.1472627190.263067597-2.3252496230.66620839各项贷款余额(亿元)0.037894707 0.00503015 7.5335147221.18349E-070.027489050.048300364SUMMARYOUTPUT回归统计Multiple R 0.731505008 R Square 0.535099577 Adjusted RSquare0.514886515 标准误差 2.513885813 观测值25 方差分析df SS MS F Significance F回归分析 1 167.2990967167.2990967 26.4729599 3.25638E-05残差23 145.35130336.319621883总计24 312.6504Coefficients标准误差t Stat P-value Lower 95% Upper 95%Intercept -0.3181430680.933380849-0.3408502210.736310273-2.2489884531.612702317本年累计应收贷款(亿元)0.416784412 0.0810047 5.1451880333.25638E-050.2492134240.584355399SUMMARYOUTPUT回归统计MultipleR0.700281491 R Square 0.490394166 AdjustedR Square0.468237391 标准误差 2.631981134观测值25 方差分析df SS MS F Significance F回归分析 1 153.3219322153.321932222.132921319.72063E-05残差23 159.32846786.927324688总计24 312.6504Coefficients 标准误差t Stat P-value Lower 95% Upper 95%Intercep t -0.7230952811.082700971-0.6678624120.510868137-2.9628328721.516642309贷款项目个数(个)0.295165470.0627402414.7045638819.72063E-050.1653773940.424953545SUMMARYOUTPUT回归统计Multiple R 0.51851809 R Square 0.26886101 Adjusted RSquare0.237072358 标准误差 3.152575881 观测值25 方差分析df SS MS F Significance F回归分析 1 84.0595022484.059502248.457767 0.007918887残差23 228.59089789.938734685总计24 312.6504Coefficients 标准误差t Stat P-value Lower 95% Upper 95%Intercept 0.979961164 1.1359678940.8626662510.397227184-1.3699674513.329889779本年固定资产投资额(亿元)0.046586405 0.016018852.9082240280.0079188870.0134488890.079723921(2)根据判定系数和F值的大小,选取判定系数(或者F值)最大的方程作为基础方程,然后按照决定系数的大小来逐个添加变量,逐步回归。
(将每个建立的新模型,与原来模型比较,若决定系数(R^2)或其他统计量与原来相比有所改善,则让该变量留在模型中,若无改善,则不留该变量在模型中。
)根据判定系数,先添加X2到基础方程中,即做X1、X2与Y的回归方程如下:回归统计Multiple R 0.870885326R Square 0.758441251Adjusted R Square 0.736481365标准误差1.852804256观测值25 方差分析df SS MS F Significance F回归分析 2 237.1269605118.563480334.537576481.63399E-07残差22 75.523439463.432883612总计24 312.6504Coefficients标准误差t Stat P-value Lower 95% Upper 95%Intercept -1.3788341360.727018066-1.8965610340.071093573-2.8865773160.128909045各项贷款余额(亿元)0.028909390.0064099424.5100861590.0001735440.0156159840.042202795本年累计应收贷款(亿元)0.1678986050.0813001832.0651688320.050887882-0.0007076550.336504864虽然判定系数有所增加,但是由于X2的P-value=0.050887882>0.05,所以对不良贷款影响不显著,所以不能保留X2在模型中。