回归分析测试题
- 格式:doc
- 大小:337.50 KB
- 文档页数:14
第一章测试1【多选题】(2分)当一个经济问题的回归模型通过了各种统计检验,且模型具有合理的经济意义时,该回归模型就可用于A.经济变量的因素分析B.模型的显著性检验C.进行经济预测D.给定被解释变量值来控制解释变量值2【判断题】(2分)常用的样本数据有时间序列数据和横截面数据。
A.错B.对3【多选题】(2分)随机误差项主要包括以下哪些因素的影响?A.其他随机因素B.样本采集过程中的测量误差C.由于人们认识的局限性或时间、费用、数据质量等的约束未引入回归模型但又对回归被解释变量有影响的因素D.理论模型的设定误差4【判断题】(2分)变量间具有密切关联而又不能由某一个或某一些变量确定另外一个变量的关系称为变量间的统计关系。
A.对B.错5【单选题】(2分)进行回归分析时,假定相关的两个变量()。
A.都不是随机变量B.一个是随机变量,一个不是随机变量C.都是随机变量D.随机或非随机都可以第二章测试1【单选题】(2分)总体平方和SST、残差平方和SSE、回归平方和SSR三者之间的关系是()。
A.SSE=SSR-SSTB.SST=SSR+SSEC.SSR=SST+SSED.SSE=SSR+SST2【单选题】(2分)反映由模型中解释变量所解释的那部分离差大小的是()。
A.残差平方和B.总体平方和C.回归平方和D.样本平方和3【多选题】(2分)古典线性回归模型的普通最小二乘估计量的特性有()。
A.无偏性B.不一致性C.最小方差D.线性4【判断题】(2分)一元线性回归分析中的回归平方和SSR的自由度是1。
A.错B.。
中级经济师基础知识第 1题:单选题(本题1分)某公司产品当产量为1000单位时,其总成本为4000元;当产量为2000单位时,其总成本为5000,则设产量为x,总成本为y,正确的一元回归方程表达式应该是( )。
A、y = 3000 + xB、y = 4000 + 4xC、y = 4000 + xD、y = 3000 + 4x【正确答案】:A【答案解析】:本题可列方程组:设该方程为y = a + bx,则由题意可得:4000 = a + 1000b5000 = a + 2000b 解该方程,得b=1,a=3000,所以方程为y = 3000 + x第 2题:单选题(本题1分)在回归分析中,估计回归系数的最小二乘法的原理是( )。
A、使得因变量观测值与均值之间的离差平方和最小B、使得因变量估计值与均值之间的离差平方和最小C、使得观测值与估计值之间的乘积和最小D、使得因变量观测值与估计值之间的离差平方和最小【正确答案】:D【答案解析】:较偏较难的一道题目。
最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计参数的一种方法第 3题:多选题(本题2分)关于相关分析和回归分析的说法,正确的的有()A、相关分析可以从一个变量的变化来推测另一个变量的变化B、相关分析研究变量间相关的方向和相关的程度C、相关分析中需要明确自变量和因变量D、回归分析研究变量间相互关系的具体形式E、相关分析和回归分析在研究方法和研究目的有明显区别【正确答案】:BDE【答案解析】:相关分析与回归分析在研究目的和方法上具有明显的区别。
(1)、相关分析研究变量之间相关的方向和相关的程度,无法从一个变量的变化来推测另一变量的变化情况。
(2)、回归分析是研究变量之间相关关系的具体形式第 4题:多选题(本题2分)相关分析与回归分析的区别在于( )。
A、二者的研究对象是不同的B、相关分析无法从一个变量的变化来推测另一个变量的变化情况C、二者的研究目的不同D、相关分析不能指出变量间相互关系的具体形式E、二者的研究方法不同【正确答案】:BCDE【答案解析】:回归分析与相关分析的关系: (一)联系(1)它们具有共同的研究对象。
相关与回归分析试题一、单项选择题1、自然界和人类社会中的诸多关系基本上可归纳为两种类型,这就是( )A.函数关系和相关关系B.因果关系和非因果关系C.随机关系和非随机关系D.简单关系和复杂关系 2、相关关系是指变量间的( )A.严格的函数关系B.简单关系和复杂关系C.严格的依存关系D.不严格的依存关系3.具有相关关系的两个变量的关系是()A.一个变量的取值不能由另一个变量唯一确定B.一个变量的取值由另一个变量唯一决定C.变量之间的一种确定性的数量关系D.变量之间存在的一种函数关系 4.当变量x 的值增加时,变量y 的值也随之增加,那么变量x 和变量y 之间存在着()。
A.正相关系 B.负相关系C.不确定关系D.非线性相关关系 5.下列相关系数的取值不正确的是()A. 0B. -0.96C.0.87D.1.066.两个变量之间的线性相关关系越不密切,相关系数r 值就越接近() A.-1 B.+1D.0 D.大于-1或小于+1 7.相关系数的值越接近-1,表明两个变量间()A.正线性相关关系越弱B.负线性相关关系越强C.负线性相关关系越弱D.正线性相关关系越强 8.回归分析中,被解释的变量称为()A.自变量B.因变量C.随机变量D.非随机变量 9.根据最小二乘法配合线性回归方程是使()A.最小)(=∑2y ˆ-y B.最小)(=∑y ˆ-yC.最小)(=∑2y -y D.最小)(=∑y -y10.回归方程 1.5x 123yˆ+=中回归系数的意思是,当自变量每增加一个单位时,因变量()A.增加1.5个单位B.平均增加1.5个单位C.增加123个单位D.平均增加123个单位11.若回归系数b 大于0,表明回归直线是上升的,此时相关系数r 的值() A.一定大于0 B.一定小于0 C.等于0 D.无法判断 12.在回归分析中,F 检验主要用来检验()A.相关系数的显著性B.回归系数的显著性C.线性关系的显著性D.估计标准误差的显著性13.在多元线性回归方程k k 22110x b x b x b b yˆ++++= 中,回归系数i b 表示() A.自变量i x 每变动一个单位因变量y 的平均变动量 B.自变量i x 每变动一个单位因变量y 的变动总量C.在其他条件不变的情况下,自变量i x 每变动一个单位因变量y 的平均变动量D.在其他条件不变的情况下,自变量i x 每变动一个单位因变量y 的变动总量 14.在多元线性回归分析中,t 检验用来检验()A.总体线性关系的显著性B.各回归系数的显著性C.样本线性关系的显著性D.各相关系数的显著性15.在多元线性回归分析中,如果F 检验表明线性关系显著,则意味着() A.至少有一个自变量与因变量之间的线性关系是显著的 B.所有自变量与因变量之间的线性关系都是显著的C.至少有一个自变量与因变量之间的线性关系是不显著的D.所有自变量与因变量之间的线性关系都是不显著的16.在多元线性回归分析中,若自变量i x 对因变量y 的影响很小,则回归系数i b () A.可能接近0 B.可能接近1 C.可能小于0 D.可能大于1 二、多项选择题1.下列关系中属于相关关系的是()A.家庭收入与消费支出的关系B.商品价格与商品需求量的关系C.速度不变,路程与时间的关系D.肥胖程度和死亡率的关系E.利率变动与居民储蓄存款额的关系2.判断变量之间相关关系形态及密切程度的方法有() A.回归方程 B.散点图 C.相关系数 D.回归系数3.回归方程可用于()A.根据自变量预测因变量B.根据给定因变量推算自变量C.确定两个变量之间的相关程度D.解释自变量与因变量的数量依存关系 4.在回归分析中要建立有意义的线性回归方程,应该满足的条件是() A.现象间存在着显著性的线性相关关系 B.相关系数必须等于1C.在两个变量中须确定自变量和因变量D.相关数列的项数应足够多 5.对于简单线性回归方程的回归系数b ,下列说法中正确的是()A.b 是回归直线的斜率B.b 的绝对值介于0~1之间C.b 接近0表明自变量对因变量的影响不大D.b 与r 有相同的符号三、计算题1、为探讨某产品的耗电量x (单位:度)与日产量y (单位:件)的相关关系,随机抽选了10个企业,经计算得到:,,,,要求:①计算相关系数;②建立直线回归方程,解释回归系数的经济意义。
一元和多元回归测试题一、单项选择题(每小题1分,共41分)1.计量经济学是下列哪门学科的分支学科( )。
A .统计学B .数学C .经济学D .数理统计学 2.横截面数据是指( )。
A .同一时点上不同统计单位相同统计指标组成的数据B .同一时点上相同统计单位相同统计指标组成的数据C .同一时点上相同统计单位不同统计指标组成的数据D .同一时点上不同统计单位不同统计指标组成的数据3.同一统计指标,同一统计单位按时间顺序记录形成的数据列是( )。
A .时期数据B .混合数据C .时间序列数据D .横截面数据 4.描述微观主体经济活动中的变量关系的计量经济模型是( )。
A .微观计量经济模型B .宏观计量经济模型C .理论计量经济模型D .应用计量经济模型5.经济计量模型的被解释变量一定是( )。
A .控制变量B .政策变量C .内生变量D .外生变量 6.下面属于横截面数据的是( )。
A .1991-2003年各年某地区20个乡镇企业的平均工业产值B .1991-2003年各年某地区20个乡镇企业各镇的工业产值C .某年某地区20个乡镇工业产值的合计数D .某年某地区20个乡镇各镇的工业产值 7.经济计量分析工作的基本步骤是( )。
A .设定理论模型→收集样本资料→估计模型参数→检验模型B .设定模型→估计参数→检验模型→应用模型C .个体设计→总体估计→估计模型→应用模型D .确定模型导向→确定变量及方程式→估计模型→应用模型8.计量经济模型的基本应用领域有( )。
A .结构分析、经济预测、政策评价B .弹性分析、乘数分析、政策模拟C .消费需求分析、生产技术分析、D .季度分析、年度分析、中长期分析 9.变量之间的关系可以分为两大类,它们是( )。
A .函数关系与相关关系B .线性相关关系和非线性相关关系C .正相关关系和负相关关系D .简单相关关系和复杂相关关系 10.进行相关分析时的两个变量( )。
CPDA考试真题与答案-410.时间序列若无季节变动,则其各月(季)季节指数为0.正确答案:×11.一个硬币掷10 次,其中5 次正面向上的概率是0.5。
正确答案:×12.DBSCAN算法对异常值敏感,因此要在聚类前进行异常值分析。
正确答案:×13.在假设检验中,当我们做出拒绝原假设而接受备择假设的结论时,表示原假设是错误的。
正确答案:×14.召回率(recall)指预测为正的样本中实际为正的样本所占比例。
正确答案:×15.逻辑回归只能用于二分类问题,即输出只有两种,分别代表两个类别。
正确答案:×二、单选题1.Apriori算法用下列哪个做项目集(Itemset)的筛选?A、最小信赖度(Minimum Confidence)B、最小支持度(Minimum Support)C、交易编号(TransactionID)D、购买数量正确答案:B2.为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为 3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着()A、南方和北方女婴出生体重的差别无统计学意义B、南方和北方女婴出生体重差别很大C、由于P值太小,南方和北方女婴出生体重差别无意义D、南方和北方女婴出生体重差别有统计学意义但无实际意义正确答案:D3.预测分析中将原始数据分为训练数据集和测试数据集等,其中训练数据集的作用在于()A、用于对模型的效果进行无偏的评估B、用于比较不同模型的预测准确度C、用于构造预测模型D、用于选择模型正确答案:C4.一个射手连续射靶22次,其中3次射中10环,7次射中9环,9次射中8环,3次射中7环.则射中环数的中位数和众数分别为()A、8,9B、8,8C、8.5,8D、8.5,9正确答案:B5.一般来说,当居民收入减少时,居民储蓄存款也会相应减少,二者之间的关系是()A、负相关B、正相关C、零相关D、曲线相关正确答案:B6.下表为一交易数据库,请问A → C 的信赖度(Confidence)为()A、75%B、50%C、60%D、66.7%正确答案:D7.如何利用「体重」以简单贝式分类(Naive Bayes)预测「性别」?A、选取另一条件属性B、将体重正规化为到0~1 之间C、将体重离散化D、无法预测正确答案:C8.以下哪个属于时间序列的问题?()A、信用卡发卡银行侦测潜在的卡奴B、基金经理人针对个股做出未来价格预测C、电信公司将人户区分为数个群体D、以上皆是正确答案:B9.数据缺失(Null Value)处理方法可分为人工填补法及自动填补法,下列哪种填补法可得到较准确的结果?A、填入一个通用的常数值,例如填入"未知/UnknownB、把填补遗缺值的问题当作是分类或预测的问题C、填入该属性的整体平均值D、填入该属性的整体中位数正确答案:B10.某市有各类书店500家,其中大型50家,中型150家,小型300家。
安徽省2024年下半年内审师《内部审计基础》:回来分析考试试题一、单项选择题(共25题,每题2分,每题的备选项中,只有1个事最符合题意)1、3、“在个人经济方面遇到了困难”是一种A:行为征兆。
B:事态压力。
C:合理理由。
D:犯罪机会。
2、某计算机应用程序已在公司内部审计的每个工作站得到实施,以便在系统开发人员供应更新版本的状况下,促进更新版本的安装。
由于安装系统跟新版本须要得到行政特许,该计算机应用程序在每个工作站均已获得行政访问许可。
对此,审计师应当A:核实该计算机应用程序在正常工作时间结束之后能接受更新版本,以防止干扰工作。
B:确保该计算机应用程序已就是否应当接受更新版本询问全部用户。
C:确保该计算机应用程序无法用于在工作站执行安装更新版本以外的其他吩咐。
D:核实该计算机应用程序只接受最新的更新版本。
3、为削减与实物资产相关的潜在财务损失,资产应当按一个数额保险,这个数额是A:依据定期的评估确定B:由董事会确定C:依据经济指数例如消费价格指数自动调整D:等于单个资产的账面价值4、平行模拟是一种适合于以下哪项的审计方法A:测试文件上合法的签名;B:总结应收账款确认的结果;C:计算加速折旧费用的数额;D:扫描总分类账文件,以检查非正常交易。
5、某当地银行聘请地区银行的内部审计师供职于该银行的董事会。
这家银行与地区银行在很多同类市场上都存在竞争关系,但更关注消费者的理财业务,而非商业理财。
在接受这个职位时,内部审计师Ⅰ.会违反IIA的道德规范,因为供职于当地银行的董事会可能会与内部审计师所在银行的最佳利益发生冲突。
Ⅱ.会违反IIA的道德规范,因为在供职于当地银行的董事会时所取得的信息可能会影响有关潜在的购并建议。
A:仅有Ⅱ;B:仅有Ⅰ;C:Ⅰ和Ⅱ;D:既非Ⅰ,也非Ⅱ。
6、审计师安排对公司投保状况进行评价。
以下哪项是规划具体的投保进度可利用的最有可能的信息来源?A:现金支出日记账纪录,由相关支票支持的日记分录B:描述保险人员工作目标、职责的公司章程C:当前年度预提保险费用预算以及该账户年初余额D:各类包含保险政策的文件7、某内部审计师正依据《专业实务框架》,评估机构风险管理程序的充分性。
线性回归方程检测试题(附答案)高中苏教数学③ 2. 4线性回归方程测试题一、选择题 1.下列关系属于线性负相关的是()A.父母的身高与子女身高的关系B.身高与手长C.吸烟与健康的关系D.数学成绩与物理成绩的关系答案:C2.由一组数据得到的回归直线方程,那么下面说法不正确的是()A.直线必经过点B.直线至少经过点中的一个点C.直线 a 的斜率为D.直线和各点的总离差平方和是该坐标平面上所有直线与这些点的离差平方和中最小的直线答案:B3.实验测得四组的值为,则y与x之间的回归直线方程为()A.B.C.D.答案:A4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是,那么下列说法正确的是()A.直线和一定有公共点B.直线和相交,但交点不一定是C.必有直线D.和必定重合答案:A二、填空题 5.有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系(2)曲线上的点与该点的坐标之间的关系(3)苹果的产量与气候之间的关系(4)森林中的同一种树木,其断面直径与高度之间的关系(5)学生与他(她)的学号之间的关系其中,具有相关关系的是.答案:(1)(3)(4)6.对具有相关关系的两个变量进行的方法叫做回归分析.用直角坐标系中的坐标分别表示具有的两个变量,将数据表中的各对数据在直角坐标系中描点得到的表示具有相关关系的两个变量的一组数据的图形,叫做.答案:统计分析;相关关系;散点图7.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数、方差分别为,则新数据的平均数是,方差是,标准差是.答案:;;8.已知回归直线方程为,则可估计x与y增长速度之比约为.答案:三、解答题 9.某商店统计了近6个月某商品的进价x与售价y(单位:元)的对应数据如下:3 5 2 8 9 124 6 3 9 12 14求y对x的回归直线方程.解:,,,,,,回归直线方程为.10.已知10只狗的血球体积及红血球的测量值如下: 45 42 46 48 426.53 6.30 9.257.580 6.99 35 58 40 39 50 5.90 9.49 6.20 6.557.72x(血球体积,ml),y(红血球数,百万)(1)画出上表的散点图;(2)求出y对x的回归直线方程并且画出图形.解:(1)见下图(2),,,设回归直线方程为,则,.图形如下:11.某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:尿汞含量:2 4 6 8 10 消光系数 64 134 205 285 360 (1)画出散点图;(2)如果y与x之间具有线性相关关系,求回归直线方程;(3)估计尿汞含量为9毫克/升时的消光系数.解:(1)(2)由散点图可知与线性相关,设回归直线方程为.列表: 1 2 3 4 5 2 4 6 8 10 64 134 205 285 360 128 536 1230 2280 3600 ,.回归直线方程为.(3)当时,.。
测试题1.下列说法中错误的是()A.如果变量x与y之间存在着线性相关关系,则我们根据试验数据得到的点(i=1,2,3,…,n)将散布在一条直线附近B.如果两个变量x与y之间不存在线性相关关系,那么根据试验数据不能写出一个线性方程。
C.设x,y是具有线性相关关系的两个变量,且回归直线方程是,则叫回归系数D.为使求出的回归直线方程有意义,可用线性相关性检验的方法判断变量x与y之间是否存在线性相关关系2.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程是()A.B.C.D.3.回归直线必过点()A.(0,0)B.C.D.4.在画两个变量的散点图时,下面叙述正确的是()A.预报变量在轴上,解释变量在轴上B.解释变量在轴上,预报变量在轴上C.可以选择两个变量中任意一个变量在轴上D.可以选择两个变量中任意一个变量在轴上5.两个变量相关性越强,相关系数r()A.越接近于0B.越接近于1C.越接近于-1 D.绝对值越接近1 6.若散点图中所有样本点都在一条直线上,解释变量与预报变量的相关系数为()A.0B.1 C.-1 D.-1或1由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是()A.她儿子10岁时的身高一定是145.83B.她儿子10岁时的身高在145.83以上C.她儿子10岁时的身高在145.83左右D.她儿子10岁时的身高在145.83以下8.两个变量有线性相关关系且正相关,则回归直线方程中,的系数()A.B.C.D.能力提升:(1)画出散点图;(2)求每月产品的总成本y与该月产量x之间的回归直线方程。
10.某工业部门进行一项研究,分析该部分的产量与生产费用之间的关系,从这个工业(1)计算x与y的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为,求系数,。
综合探究:11.一只红铃虫的产卵数y和温度x有关。
现收集了7对观测数据列于表中,试建立y参考答案:基础达标:1.B尽管两个变量x与y之间不存在线性相关关系,但是由试验数据仍可求出回归直线方程中的和,从而可写出一个回归直线方程。
2.A由回归直线经过样本点的中心,由题中所给出的数据,将,代入中适合,故选A。
3.D回归直线,必然经过样本点的中心,其坐标为,故选D。
4.B5.D6.B7.C8.A9.解析:(1)画出的散点图如图所示:(2),,,∴,。
所以所求回归直线方程为。
10.解析:,,,,∴,即x与y的相关系数r≈0.808。
(2)因为,所以可以认为x与y之间具有很强的线性相关关系。
(3),。
综合探究:11.解析:散点图如图所示:由散点图可以看出:这些点分布在某一条指数函数的图象的周围。
现在,问题变为如何估计待定参数c1和c2,我们可以通过对数变换把指数关系变为线性关系。
令,则变换后样本点应该分布在直线(,)的周围。
这样,就可以利用线性回归模型来建立y和x之间的非线性回归方程了。
由图可看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程来拟合。
计算得,,,。
设所示的线性回归方程为,则有,,得到线性回归方程,因此红铃虫的产卵数对温度的非线性回归方程为。
总结升华:(1)在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系。
根据已有的函数知识,可以发现样本点分布在一条指数函数曲线的周围,其中c1和c2是待定参数。
(2)选择适当的非线性回归方程。
然后通过变量代换,将非线性回归方程化为线性回归方程,并由此来确定非线性回归方程中的未知参数。
(3)由散点图来挑选一种跟数据拟合得最好的函数时,往往有回归分析撰稿吕宝珠审稿谷丹责编:严春梅课程标准的要求回归分析的基本思想及其初步应用:(1)理解回归分析是对具有相关关系的两个变量进行统计分析的一种常用的方法;理解解释变量与预报变量的相关关系是一种非确定性关系;(2)能读或画出两个变量的散点图,并能根据散点图来粗略判断两个变量是否线性相关;(3)理解线性回归模型;(4)理解样本相关系数是衡量两个变量之间线性相关性强弱的参数的意义,了解样本相关系数的具体计算公式.(5)了解解释变量和随机变量的组合效应的含义及表示总的效应的参数:总偏差平方和;了解样本的数据点和它在回归直线上相应位置的残差是随机误差的效应的意义及随机误差的效应(即各个样本的各个点的随机误差的效应的平方和)的参数:残差平方和;了解表示解释变量效应的参数:回归平方和;了解刻画回归效果的相关指数的含义及计算公式。
(有关计算公式只要求了解含义,不须记忆下来,考试时会给出相关公式的).(6)了解残差分析的方法及意义,会读或会作残差图.重点和难点分析回归分析的基本思想及其初步应用。
内容精讲1.相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系相关关系与函数关系的异同点如下:相同点:均是指两个变量的关系。
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.2.回归分析:一元线性回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。
通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性。
对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。
两个变量具有相关关系是回归分析的前提。
(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。
(3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义。
3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度。
粗略地看,散点分布具有一定的规律。
4. 回归直线设所求的直线方程为,其中a、b是待定系数.,,相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析。
5.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把=叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.6.相关系数的性质:≤1,且越接近1,相关程度越大;且越接近0,相关程度越小.7.显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。
它必须在每一次统计检验之前确定。
8.显著性检验:由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0.05或r0.01;例如n=7时,r0.05=0.754,r0.01=0.874 求得的相关系数r和临界值r0.05比较,若r>r0.05,上面y与x是线性相关的,当≤r0.05或r0.01,认为线性关系不显著。
典型例题:1.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程.,,,,1)画出散点图:2)在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r0.05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系。
3)设回归直线方程,利用,计算a,b,得b≈1.215, ,∴回归直线方程为:2.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程。
解析:1)画出散点图如下:,,,,,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值r0.05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系。
3)设回归直线方程,利用计算a,b,得a=399.3-4.75×30≈257,则回归直线方程3.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平均产量(1)求x与y之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量y与使用氮肥量之间的回归直线方程,并估计每单位面积施肥150kg时,每单位面积蔬菜的年平均产量。
分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性水平0.05与自由度15-2相应的相关系数临界比较,若则线性相关,否则不线性相关。
解析:,,,,。
故蔬菜产量与放用氮肥量的相关系数。
由于n=15,故自由度15-2=13。
由相关系数检验的临界值表查出与显著水平0.05及自由度13相关系数临界值,则,从而说明蔬菜产量与氮肥量之间存在着线性相关关系。
(2)设所求的回归直线方程为,则,,∴回归直线方程为。
点评:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算。
如果会使用含统计的科学计算器,能简单得到,,,,这些量,也就无需有制表这一步,直接算出结果就行了。
另外,利用计算机中有关应用程序也可以对这些数据进行处理。
4.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计若由资料可知y对x呈线性相关关系。
试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?分析:本题为了降低难度,告诉了y与x间呈线性相关关系,目的是训练公式的使用。
解析:,,,于是,。
∴线性回归方程为:。
(2)当x=10时,(万元)即估计使用10年时维修费用是12.38万元。
点评:本题若没有告诉我们y与x间是呈线性相关的,应首先进行相关性检验。
如果本身两个变量不具备线性相关关系,或者说它们之间相关关系不显著时,即使求出回归方程也是没有意义的,而且其估计与预测也是不可信的。