统计学第七章(2)
- 格式:ppt
- 大小:473.00 KB
- 文档页数:32
第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
统计学复习笔记第七章 参数估计一、 思考题1. 解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2. 简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌.在公布调查结果时给出被调查人数是负责任的表现.这样则可以由此推算出置信度(由后面给出的公式),反之亦然.4. 解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率.也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0。
95的概率覆盖总体参数.5. 简述样本量与置信水平、总体方差、估计误差的关系。
1. 估计总体均值时样本量n 为2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为其中: 2222)(E z n σα=n z E σα2=▪与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
统计学第七章相关与回归分析试题及答案第七章相关与回归分析(⼆) 单项选择题1、当⾃变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( B )A 、相关关系B 、函数关系C 、回归关系D 、随机关系2、测定变量之间相关密切程度的代表性指标是(C )A 、估计标准误B 、两个变量的协⽅差C 、相关系数D 、两个变量的标准差3、现象之间的相互关系可以归纳为两种类型,即( A )A 、相关关系和函数关系B 、相关关系和因果关系C 、相关关系和随机关系D 、函数关系和因果关系4、相关系数的取值范围是( C )A 、10≤≤γB 、11<<-γC 、11≤≤-γD 、01≤≤-γ5、变量之间的相关程度越低,则相关系数的数值(B )A 、越⼩B 、越接近于0C 、越接近于-1D 、越接近于16、在价格不变的条件下,商品销售额和销售量之间存在着( D )A 、不完全的依存关系B 、不完全的随机关系C 、完全的随机关系D 、完全的依存关系7、下列哪两个变量之间的相关程度⾼( C )A 、商品销售额和商品销售量的相关系数是0.9;B 、商品销售额与商业利润率的相关系数是0.84;C 、平均流通费⽤率与商业利润率的相关系数是-0.94;D 、商品销售价格与销售量的相关系数是-0.918、回归分析中的两个变量(D )A 、都是随机变量B 、关系是对等的C 、都是给定的量D 、⼀个是⾃变量,⼀个是因变量9、每⼀吨铸铁成本(元)倚铸件废品率(%)变动的回归⽅程为:x y c 856+=,这意味着( C )A 、废品率每增加1%,成本每吨增加64元B 、废品率每增加1%,成本每吨增加8%C 、废品率每增加1%,成本每吨增加8元D 、如果废品率增加1%,则每吨成本为56元。
10、某校对学⽣的考试成绩和学习时间的关系进⾏测定,建⽴了考试成绩倚学习时间的直线回归⽅程为:x y c 5180-=,该⽅程明显有错,错误在于( C )A 、a 值的计算有误,b 值是对的B 、b 值的计算有误,a 值是对的C 、a 值和b 值的计算都有误D 、⾃变量和因变量的关系搞错了11、配合回归⽅程对资料的要求是(B )A 、因变量是给定的数值,⾃变量是随机的B 、⾃变量是给定的数值,因变量是随机的C 、⾃变量和因变量都是随机的D 、⾃变量和因变量都不是随机的。