贾俊平统计学第7版
- 格式:docx
- 大小:130.38 KB
- 文档页数:17
第7章参数估计7.1 考点归纳【知识框架】【考点提示】(1)置信区间的含义理解(选择题、简答题考点);(2)估计量的三个评价标准(判断题、填空题、简答题考点);(3)区间估计的步骤(简答题考点)、总体参数的区间估计选择恰当的统计量(计算题考点);(4)必要样本容量的影响因素、计算(简答题、计算题考点)。
【核心考点】考点一:参数估计的基本原理1.置信区间(1)置信水平为95%的置信区间的含义:用某种方法构造的所有区间中有95%的区间包含总体参数的真值。
(2)置信度愈高(即估计的可靠性愈高),则置信区间相应也愈宽(即估计准确性愈低)。
(3)置信区间的特点:置信区间受样本影响,具有随机性,总体参数的真值是固定的。
一个特定的置信区间“总是包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题。
2.评价估计量的标准(1)无偏性:估计量抽样分布的期望值等于被估计的总体参数,即E(θ∧)=θ。
(2)有效性:估计量的方差尽可能小。
(3)一致性:随着样本量的增大,估计量的值越来越接近被估计总体的参数。
【提示】本考点常见考查方式:①直接考查置信水平为95%的置信区间的含义;②置信度、估计可靠性、置信区间的关系及应用;③置信区间的特点;④给出估计量的具体含义,判断体现了什么标准;⑤直接回答估计量的三个评价标准及具体含义(简答题)。
考点二:一个总体参数的区间估计表7-1 一个总体参数的区间估计【总结】一个总体参数的估计及所使用的分布见图7-1:图7-1 一个总体参数的估计及所使用的分布【真题精选】设总体X~N(μ,σ2),σ2已知,样本容量和置信水平固定,对不同的样本观测值,μ的置信区间的长度()。
[对外经济贸易大学2018研]A.变长B .变短C .保持不变D .不能确定 【答案】C【解析】在正态总体方差已知的条件下,μ的置信区间为/2x z ±ασ所以置信区间长度为/22Z α,当样本容量和置信水平固定时,置信区间长度保持不变。
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。
2.解释描述统计与推断统计。
描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计研究的是如何利用样本数据来推断总体特征的统计方法。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。
4.解释分类数据、顺序数据和数值型数据的含义。
分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。
5.举例说明总体、样本、参数、统计量、变量这几个概念。
总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。
6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。
分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。
7.举例说明离散型变量和连续型变量。
离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。
使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。
2.比较概率抽样和非概率抽样的特点。
举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
第11章一元线性回归11.1 考点归纳【知识框架】【考点提示】(1)变量间关系的度量,包括相关系数的计算公式、性质,相关关系的显著性检验(简答题、计算题考点);(2)一元线性回归,包括回归模型的假定(简答题考点),回归方程、估计的回归方程的建立(选择题、计算题考点);(3)最小二乘法的含义、性质,回归系数的计算(选择题、简答题、计算题考点);(4)回归直线的拟合优度及显著性检验(计算题考点);(5)点估计和区间估计,包括置信区间和预测区间(判断题、计算题考点)。
【核心考点】考点一:变量间关系的度量1.相关系数(线性相关系数,或Pearson 相关系数)总体相关系数ρ,样本相关系数r 。
(1)计算公式n xy x y r ∑-∑∑=(2)性质 ①r 的取值范围为-1≤r≤1。
|r|→1说明两个变量之间的线性关系越强。
②r 具有对称性,即r xy =r yx 。
③r 取值大小与x 和y 的原点及尺度无关。
④r 仅用于度量线性关系,不能用于描述非线性关系⑤r 只是度量数量关系,但不意味着因果关系。
⑥r 取值可以解释两个变量之间的相关程度。
但需要先对相关系数的显著性进行检验。
【真题精选】如果变量X 与变量Y 之间的相关系数为0,说明这两个变量之间是( )。
[浙江财经大学2019研]A .完全相关关系B .完全不相关C .没有线性关系D .低度相关关系【答案】C 【解析】相关系数r 仅仅是变量X 与Y 之间线性关系的一个度量,r =0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。
因此当r =0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图作出合理的解释。
2.相关关系的显著性检验——t 检验(小样本或大样本) 检验的统计量(2)t r t n =-若|t|>t α/2,则拒绝原假设H 0,表明总体的两个变量之间存在显著的线性关系。
第4章数据的概括性度量4.1考点归纳【知识框架】【考点提示】(1)集中趋势、离散趋势的度量指标,包括每个指标的含义、计算公式、特点、意义、适用范围(选择题、简答题、计算题考点);(2)众数、中位数和平均数三个指标的特点和应用场合,偏态分布下三个指标的关系(选择题、简答题、计算题考点);(3)分布形状的测度指标:偏态系数和峰态系数的数值含义(选择题、简答题考点)。
(4)标准分数的计算公式及应用(选择题、简答题、计算题考点);(5)经验法则、切比雪夫不等式的具体应用(选择题考点)。
【核心考点】考点一:集中趋势的度量表4-1集中趋势度量指标【注意】不同偏态程度的分布中集中趋势度量指标的关系:①对称分布中,众数、中位数和平均数相等;②左偏分布中,数据存在极小值,拉动平均数向极小值一方靠,而众数和中位数不受极值的影响,有_x<M e<M o;③右偏分布中,数据存在极大值,必然拉动平均数向极大值一方靠,因此M o<M e<_x。
【知识拓展】不同的教材分位数的计算公式不同,除了表中的计算公式,一种比较精确的计算公式:下四分位数Q L的位置=(n+1)/4,上四分位数Q U的位置=(3n+1)/4。
【真题精选】假定标志值所对应的权数都缩小1/10,则算术平均数()。
[浙江财经大学2019研]A.不变B.无法判断C.缩小百分之一D.扩大十倍【答案】A【解析】假设标志值为x,其对应的权数为f,则算术平均数为_x=∑xf/∑f;若各权数都缩小1/10,则新的算术平均数为110110xf xf x x f f '===∑∑∑∑考点二:离散程度的度量数据的离散程度反映了各变量值远离其中心值的程度,离散程度越小,代表性就越好。
表4-2离散程度的度量指标【注意】①表中方差和标准差的计算公式均为样本数据的方差和标准差。
若为总体数据,则分母应为n。
②标准差系数,也称变异系数或离散系数。
③表中平均差、样本方差、样本标准差仅给出了未分组数据的计算公式,分组数据的计算公式实质是等于未分组数据的计算公式,会运用即可。
2023统计学第七版贾俊平课后习题答案第一章1.1 习题答案1.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市,而纽约市占比是 5%,所以答案应为 $60 \\times 0.05 = 3$2.答案:根据题意,我们需要求得这 60 个挑选出来的人中有多少个人来自纽约市并且是女性,而纽约市总体中女性的占比是 53%,所以答案应为 $60 \\times 0.05 \\times 0.53 = 1.59$1.2 习题答案1.答案:根据题意,我们需要求得这家电视公司进入市场的概率。
已知电视公司市场占有率为 10%,而市场占有率的补集为失败率,所以电视公司进入市场的概率为1−0.10=0.902.答案:根据题意,我们需要求得这两家公司都进入市场的概率。
已知电视公司进入市场的概率为 0.90,而两家公司都进入市场的概率为两者概率相乘,所以两家公司都进入市场的概率为 $0.90 \\times 0.90 = 0.81$第二章2.1 习题答案1.答案:根据题意,我们需要求得两次抛掷硬币都为正面向上的概率。
已知硬币正面朝上的概率为 0.5,而两次抛掷硬币都为正面向上的概率为两者概率相乘,所以两次抛掷硬币都为正面向上的概率为 $0.5 \\times 0.5 = 0.25$2.答案:根据题意,我们需要求得至少一次抛掷硬币为正面向上的概率。
已知硬币正面朝上的概率为 0.5,而至少一次抛掷硬币为正面向上的概率为 1 减去两次都为背面向上的概率,所以至少一次抛掷硬币为正面向上的概率为 $1 - (0.5 \\times 0.5) = 0.75$2.2 习题答案1.答案:根据题意,我们需要求得至少一辆汽车需要检测两次才能检查到故障的概率。
已知单次检测不到故障的概率为 0.1,而至少一辆汽车需要检测两次才能检查到故障的概率为 1 减去两次都未检测到故障的概率,所以至少一辆汽车需要检测两次才能检查到故障的概率为 $1 - (0.1 \\times 0.1) = 0.99$2.答案:根据题意,我们需要求得两辆车都不需要检测两次才能检查到故障的概率。
第3章数据的图表展示一、单项选择题1.对于大批量的数据,最适合描述其分布的图形是()。
[中国海洋大学2018研] A.条形图B.茎叶图C.直方图D.饼图【答案】C【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。
2.下面哪个图形保留了原始数据的信息?()[对外经济贸易大学2015研]A.直方图B.茎叶图C.条形图D.箱线图【答案】B【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。
ACD三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
3.用于显示时间序列数值型数据,以反映事物发展变化的规律和趋势的图是()。
[重庆大学2013研]A.直方图B.箱线图C.茎叶图D.线图【答案】D【解析】如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图。
线图主要用于反映现象随时间变化的特征。
4.雷达图的主要用途是()。
[浙江工商大学2011研、安徽财经大学2012样题] A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性【答案】D【解析】雷达图在显示或对比各变量的数值总和时十分有用。
假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。
此外,利用雷达图也可以研究多个样本之间的相似程度。
5.美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下展示数据的图表中,哪一种不适合用来处理这一样本数据?()[中山大学2011研]A.散点图B.饼图C.条形图D.频数图【答案】A【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。
贾俊平《统计学》(第7版)考点归纳和课后习题详解(含考研真题)(第12章多元线性回归)【圣才出品】第12章多元线性回归12.1 考点归纳【知识框架】【考点提⽰】(1)多元线性回归模型,包括回归模型的基本假定(简答题考点),最⼩⼆乘估计(选择题、计算题考点);(2)回归模型的拟合优度评价(简答题、计算题考点);(3)显著性检验(计算题考点);(4)多重共线性的含义、产⽣的问题、判别及处理⽅式(简答题考点)。
【核⼼考点】考点⼀:多元线性回归模型1.回归模型假定(1)E (ε)=0;(2)D (ε)=σ2;(3)()2cov ,0i j i j i j σεε?==?≠?2.参数的最⼩⼆乘估计使残差平⽅和Q =∑(y i -y ∧i )2=∑(y ∧i =β∧0-β∧1x 1-β∧2x 2-…-β∧k x k )2达到最⼩的β∧0,β∧1,β∧2,…,β∧k 。
由此可以得到求解β∧0,β∧1,β∧2,…,β∧k 的标准⽅程组为:00?0?00,1,2,,i i ββi ββQ βQ i k β==??===???多元线性回归的最⼩⼆乘估计是最优线性⽆偏估计。
考点⼆:回归⽅程的拟合优度表12-1 多元线性回归⽅程的评价【提⽰】实际应⽤中,采⽤调整的判定系数来评价多元回归⽅程的拟合优度。
【真题精选】多元线性回归模型的调整的多重判定系数取值范围在0⾄1之间。
[对外经济贸易⼤学2018研]【答案】√【解析】多重判定系数R2=SSR/SST是多元回归中的回归平⽅和占总平⽅和的⽐例,它是度量多元回归⽅程拟合程度的⼀个统计量,反映了在因变量y的变差中被估计的回归⽅程所解释的⽐例,取值为0~1。
调整的多重判定系数R a2与多重判定系数R2不同之处在于:R a2同时考虑了样本量n和模型中⾃变量的个数k的影响,这就使得R a2的值永远⼩于R2,⽽且R a2的值不会由于模型中⾃变量个数的增加⽽越来越接近1,因此R a2的取值也为0~1。
贾俊平《统计学基础》(第7版)简介一、作者介绍贾俊平,美国统计学家,现任美国加州大学尔湾分校终身教授。
毕业于纽约州立大学布法罗分校,分别获得统计学硕士和博士学位。
贾俊平教授在统计学领域有着丰富的教学和研究经验,曾多次在国际统计学会议上做学术报告,并发表了多篇在国际统计学期刊上发表的高水平学术论文。
二、书籍概述《统计学基础》(第7版) 是贾俊平教授的代表作之一,本书主要面向大学本科生、研究生以及从事统计学研究的相关人员。
该书涵盖了统计学的基本理论、应用方法以及最新进展,具有较强的全面性和权威性。
本书在国内外享有很高的声誉,被广泛用作统计学教材及专业参考书。
三、内容概要《统计学基础》(第7版)主要由以下几个部分组成:1. 统计学基础知识:介绍了统计学的起源、发展历程以及基本概念,帮助读者建立对统计学的整体认识。
2. 描述统计学:系统介绍了数据的整理、分类和总结方法,包括数据的表示形式、测度和图形展示等内容,旨在帮助读者理解数据的特征和规律。
3. 推断统计学:详细讲解了参数估计、假设检验以及方差分析等内容,帮助读者掌握统计推断的基本原理和方法。
4. 回归分析:介绍了简单线性回归、多元线性回归以及逻辑回归等内容,帮助读者理解变量之间的相互关系和预测模型的构建。
5. 随机过程:涵盖了随机变量、概率分布、数理统计以及统计推断等内容,建立了统计学的基本框架。
四、书籍特色《统计学基础》(第7版)具有以下几个显著特色:1. 理论联系实际:书中的内容理论与实际案例相结合,通过大量的真实数据和案例,使抽象的统计学理论更加具体和易懂。
2. 方法全面权威:本书不仅包括了统计学的基本概念和方法,还涵盖了最新的发展趋势和前沿技术,具有较强的时效性和全面性。
3. 学习辅助工具:书中配有大量的习题和案例分析,帮助读者加深对统计学知识的理解,还提供了实用的学习辅助工具和网上资源,方便读者进一步深造。
五、总结《统计学基础》(第7版)是一部权威、系统、全面的统计学专著,具有较强的教学和参考价值。
第1章导论1.1考点归纳【知识框架】【考点提示】(1)统计学的目的(选择题考点);(2)描述统计和推断统计的区分、参数估计和假设检验的区分(选择题考点);(3)统计数据类型、分类、各自特点及其具体应用(选择题、简答题考点)(非常重要);(4)统计学中的基本概念(选择题、简答题考点)。
【核心考点】考点一:统计数据的类型(见表1-1)表1-1统计数据的类型【注意】①分类数据和顺序数据说明的是事物的品质特征,其结果均表现为类别,因而也统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,因此也称为定量数据或数量数据。
②对不同类型的数据采用不同的统计方法来处理和分析。
对分类数据可以计算出各类别的频率,而数值型数据则可以进行数学运算。
【真题精选】1.在对数据进行汇总时,往往将男性用“1”来表示,女性用“0”来表示,所以将性别视为数值型变量。
[对外经济贸易大学2018研]【答案】×【解析】数值型变量是说明事物数字特征的一个名称,其取值是数值型数据,数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值;分类变量是说明事物类别的一个名称,其取值是分类数据,分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。
性别是分类变量,为便于统计处理,对于分类变量可以用数字代码来表示各个类别。
2.下列数据不属于时间序列数据的是()。
[四川大学2016研]A.1990~2014年我国每年进出口总额B.2014年某品牌手机在中国各个省市的销售量C.成都市2014年每个月的PM2.5月平均浓度D.某股票在2015年1月的日收盘价【答案】B【解析】时间序列数据是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
本题中B项是在相同的时间点、不同的空间上获得的数据,属于截面数据。
考点二:统计中的基本概念1.总体和样本(1)总体、个体(2)样本、样本量2.参数和统计量(1)参数:用于描述总体特征,是未知的常数。
贾俊平第二版和第7版的区别
贾俊平第二版和第七版的区别主要体现在以下几个方面:
1. 内容更新:第七版相对于第二版在内容上进行了更新和扩充。
随着时间的推移,学术界对某些领域的认识和研究成果有了进一步的深入,第七版相应地更新了这些内容,以确保读者能够了解最新的理论和知识。
2. 结构调整:第七版可能对书籍的结构进行了调整,以提高读者的学习效果和参考价值。
结构调整可能包括章节的重新排列、新增章节或删除一些内容等,以更好地组织和呈现书籍的主题和内容。
3. 知识框架变化:由于学术研究的发展和新的理论观点的提出,第七版可能会对相关领域的知识框架进行了调整。
这些调整可能包括对某些理论的完善、修改或替换,以及增加或删除一些概念和模型等。
4. 实例和案例选择:第七版可能会更新书中用作实例和案例的具体内容。
这些实例和案例的变化可能涉及到行业、技术、应用领域等方面的更新,以反映当前的实际情况和最新的发展趋势。
需要注意的是,实际的区别可能会因具体的书籍而有所不同。
每个版本的更新和调整都是根据当时的学术研究和市场需求而进行的,目的是提供更好的教学和学习体验。
因此,如果你对贾俊平第二版和第七版的区别感兴趣,最好参考具体的书籍目
录、前言或者对比两个版本的内容摘要来获取更准确和详细的信息。
贾俊平第二版和第7版的区别
(最新版)
目录
1.贾俊平及其著作背景
2.贾俊平第五版和第七版的主要区别
3.习题精选及解答特点
4.建议及适用人群
正文
贾俊平,我国著名的统计学家,其所著的《统计学》教材深受广大师生的欢迎。
如今,该教材已经更新至第七版,那么,贾俊平第五版和第七版的区别是什么呢?
首先,贾俊平第五版和第七版的主要区别在于内容的更新和完善。
第七版在第五版的基础上,对部分章节进行了调整和优化,增加了一些新的内容,如数据挖掘、大数据分析等领域的知识。
同时,根据当前计算机技术的发展,对部分统计方法的实现进行了更新和优化。
其次,贾俊平第五版和第七版的习题精选也有所不同。
第七版的习题精选了 40 余所高校的历年考研真题,名校题库以及众多教材和相关资料改变而成。
这些习题解答相近,条理清晰,能够帮助学生更好地理解和掌握统计学的相关知识。
此外,贾俊平第七版教材的解答特点也值得关注。
该教材的解答部分采用了简洁明了的格式,步骤清晰,便于学生学习和参考。
同时,教材还提供了一些扩展性的思考题,以激发学生的思维和创新能力。
针对不同的需求和适用人群,贾俊平第五版和第七版教材都有其优势。
对于初学者,第五版教材的内容较为基础,适合打好统计学的基础。
而对于有一定基础,希望在统计学领域深入学习的学生,第七版教材则提供了
更多前沿知识和实践应用。
综上所述,贾俊平第五版和第七版教材各有特点和优势,适用于不同需求的学生。
贾俊平统计学第七八版区别【原创实用版】目录1.贾俊平《统计学》第七版和第八版的区别概述2.第七版和第八版的主要不同之处3.更新版本的优点4.对学生的影响和建议正文贾俊平的《统计学》是一本非常受欢迎的统计学教材,目前已经更新到第八版。
本文将概述第七版和第八版的主要区别,并分析更新版本的优点以及对学生的影响和建议。
一、贾俊平《统计学》第七版和第八版的区别概述贾俊平的《统计学》第七版和第八版在统计学基本概念、数据类型、数据收集和整理等方面都有所不同。
其中,最主要的区别在于数据类型的分类。
第七版将数据类型分为分类数据、顺序数据和数值型数据,而第八版将顺序数据归为分类数据下,将两大类数据合并为分类数据和数值型数据。
这种调整使得数据类型的分类更加规范和科学。
二、第七版和第八版的主要不同之处1.数据类型分类的不同:如前所述,第七版将数据类型分为分类数据、顺序数据和数值型数据,而第八版将顺序数据归为分类数据下,将两大类数据合并为分类数据和数值型数据。
2.顺序数据与分类数据的区别:在第七版中,顺序数据被视为一种独立的数据类型。
而在第八版中,顺序数据被归为分类数据。
这样的调整使得分类更加规范和科学。
3.变量分类和数据分类原则的变化:在第八版中,不再将顺序型数据单独列出,而是将其与分类数据合并。
这种调整有助于提高数据分类的准确性和一致性。
三、更新版本的优点1.数据类型分类更加规范和科学:第八版将顺序数据归为分类数据下,使得数据类型的分类更加规范和科学。
2.提高数据分类的准确性和一致性:第八版不再将顺序型数据单独列出,而是将其与分类数据合并。
这种调整有助于提高数据分类的准确性和一致性。
3.更加注重实用性:第八版在数据收集和整理方面更加注重实用性,使得学生更容易理解和应用。
四、对学生的影响和建议1.理解数据类型的分类:学生应该理解第八版中数据类型的分类,即分类数据和数值型数据。
这有助于学生更好地理解统计学概念和方法。
2.关注数据收集和整理:学生应该关注数据收集和整理的方法,以便更好地应用统计学知识解决实际问题。
贾俊平第二版和第7版的区别
【实用版】
目录
1.贾俊平及其著作背景
2.第二版与第七版的主要区别
3.习题精选及解答情况
4.建议与结论
正文
贾俊平,我国著名的统计学家,曾出版过多本统计学相关教材。
其中,《统计学》第五版和第七版是他所著的两个版本,广受读者欢迎。
那么,这两版本之间存在哪些区别呢?
首先,第二版与第七版的主要区别在于内容的更新与补充。
第七版在第二版的基础上,增加了更多的实例和练习题,以帮助读者更好地理解和掌握统计学知识。
此外,第七版还对一些概念和方法进行了修订和完善,使内容更加严谨。
其次,习题精选是这两个版本的一大特色。
习题精选汇集了 40 余所高校的历年考研真题、名校题库以及众多教材和相关资料改编而成,解答相近,条理清晰。
这些习题对于学习者来说,具有很高的参考价值和实战意义。
那么,对于学习者来说,如何选择这两个版本呢?建议根据自己的需求和实际情况来选择。
如果基础较好,可以直接阅读第七版,掌握更全面的知识。
如果基础较弱,可以先从第二版入手,逐步构建知识体系。
当然,也可以两个版本相互对照学习,以达到更好的学习效果。
总之,贾俊平的《统计学》第二版和第七版在内容上有所区别,但无论哪个版本,都具有较高的学术价值和实用价值。
选择哪个版本,关键在
于学习者的自身需求和实际基础。
第8章假设检验例题8.1由统计资料得知,1989年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显★解:从调查结果看,1990年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。
—种情况是,1990年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。
上述问题的关键点是,20克的差异说明了什么?这个差异能不能用抽样的随机性来解释为了回答这个问题,我们可以采取假设的方法。
假设1989年和1990年新生儿的体重没有显著差异,如果用卩o表示1989年新生儿的平均体重,□表示1990年新生儿的平均体重,我们的假设可以表示为卩=□或□心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。
如果成立,说明这两年新生儿的体重没有显著差异;如果不成立,说明1990年新生儿的体重有了明显增加。
在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。
所以假设检验的实质是检验我们关心的参数一1990年的新生儿总体平均体重是否等于某个我们感兴趣的数值。
例8.2某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于 1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。
在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?★解:这是一个单侧检验问题。
显然,如果灯泡的燃烧寿命超过了 1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。
因此,如果样本均值超过1000小时,他会购进这批灯泡。
问题在于样本均值为960小时他是否应当购进。
因为即便总体均值为1000小时,由于抽样的随机性,样本均值略小于1000小时的情况也会经常出现。
在这种场合下,批发商更为关注可以容忍的下限,即当灯泡寿命低于什么水平时拒绝。
于是检验的形式为:100(1例8.3某种大量生产的袋装食品按规定重量不得少于250克。
今从一批该食品中随机抽取50袋,发现有6袋重量低于250克,若规定不符合标准的比例达到5%,食品就不得出厂,问该批食品能否出厂?★解:显然,不符合标准的比例越小越好。
在这个产品质量检验的问题中,我们比较关心次品率的上限,即不合标准的比例达到多少就要拒绝。
由于采用的是产品质量抽查,即使总体不合标准的比例没有超过5%,属于合格围,但由F抽样的随机性,样本中不合标准的比例略大于5%的情况也会经常发生。
如果采用右单侧检验,确定拒绝的上限临界点,那么检验的形式可以写为:右单侧检验如图8- 6所示(a=0. 05).也可以把右单侧检验称为上限检验。
例8.4某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0. 076mm,样本标准差为0.025mm,问新机床加工零件的椭圆度总体均值与以前有无显著差别?★解:在这个例题中,我们所关心的是新机床加工零件的椭圆度总体均值与老机床加工零件的椭圆度均值0. 081mm是否有所不同,于是可以假设宁八卜沁杯没有显著差别心申"加呦有显著差别这是一个双侧检验问题,所以只要卜二或. 二者之间有一个成立,就可以拒绝原假设。
由题意可知,怀"朋怖也“°砒血儿x = 因为2 30,故选用z统计量。
丘「“0 0,076-0,081z —----- = ----------------- =i 2.03S/x/n 0.025/血而通常把称为显著性水平。
显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这既是前面假设检验中犯弃真错误的概率,它是人们根据检验的要求确定的。
通常取- 或,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。
此时不妨取查表可以得到临界值:Z a/2=- I ®丘Z的下标表示双侧检验。
因为因为0>|蛊昨|,根据决策准则,拒绝心可以认为新老机床加工零件椭圆度的均值有显著差别。
例8.5★解:根据前面的分析,采用左单侧检验。
在该例中已知= S = 9(i00. <7 = 200. n = 100t,并假定显著性水平k ■- 由图8- 5可知拒绝域在左侧,所以临界值为负,即―'汩&,z的下标a表示单侧检验。
进行检验的过程为:云一佝960-1000Z_ a/<n _2OO/v ion __由于|z|>|力叫,即z的值位于拒绝域,所以拒绝⑷,即这批灯泡的使用寿命低于 1 000小时,批发商不应购买。
如果使用P值检验,按照前述方法,找到NORMSDISTBz值框录人样本统计量z的绝对值2,与之相对的承数值为0.97725,由于这是单侧检验,故P值为:P=1-0.977 250=0.022 75在单侧检验中,用P值直接与a比较,由于P(O. 022 75)<a(0. 05),故拒绝「』但如果在此例的假设检验中,取显著性水平a=0.02,则有P>a,这时就不能拒绝这进一步说明,检验的结论是建立在概率的基础上的。
不能拒绝H并不一定保证H为真,只是在规定的显著性水平上不能拒绝原假设。
上面的例子说明能在0.95的置信水平上拒绝原假设,却不能在0.98的置信水平上拒绝原假设。
例8.6其电子元件批量生产的质量标准为平均使用寿命1200小时,标准差为150小时。
某厂宣称它采用一种新工艺生产的元件质量大大超过规定标准。
为了进行验证,随机抽取20件作为样本,测得平均使用寿命为1245小时。
能否说该厂的元件质量显著高于规定标准?★解:首先需要规定检验的方向。
在本例中某厂称其产品质量大大超过规定标准1200小时,要检验这个宣称是否可信,因而是单侧检验。
从逻辑上看,如果样本均值低于1 200小时,则元件厂的宣称会被拒绝,即使略高于 1 200小时,也会被拒绝。
只有当样本均值大大超过1 200小时,以至于用抽样的随机性也难以解释时,才能认为该厂产品质量确实超过规定标准。
所以用右单侧检验更为适宜。
由题意可知,曲.- 」心瓷- - '::■-并规定注=工詞,虽然* 30,但由于已知,5cm 上下波动,过薄或过厚都不符合产品 t 统计量。
a =可以使用z 统计量。
进行检验的过程为: H 州壬1200^,^^1200_丘「旳_ 1245-1200 -(J/^n __150/嗣因为这是右单侧检验,由图8-6可知拒绝域在右侧,查表得到临界值由于Z=1.34在非拒绝域,所以不能拒绝’,即还不能说该厂产品质量显著高于规定标准。
若用P 值检验,方法与前面相同,在Z 值框输入1.34,得到函数值为0.9099,由于是单侧检 验,故P 值为:P= 1 - 0,9099 = 0.0901由于P M ,故不能拒绝lf o ,新产品与老产品质量未表现出显著差别。
8.7某机器制造出的肥皂厚度为5cm ,今欲了解机器性能是否良好,随机抽取10块肥皂作为样本,测得平均厚度为 5.3cm ,标准差为0.3cm ,试以0.05的显著性水平检验机器性能良好的 假设。
★解:如果机器性能良好,生产出的肥皂厚度将在 质量标准,所以,根据题意这是双侧检验问题。
由于总体 未知,且样本量n 较小,所以应采用 已知条件为."'-川—二」-'、:--f-・ 认—::匸 ”刊=5 "[屮丰5并一幽 5.3-5t 兰 -- —= ------- ■== = 3.1603/V10当=0.05,自由度n-1=9时,查表得J 疗込1匸出:・因为t> ,样本统计量落入拒绝域, 故拒绝"。
,接受"1,说明该机器的性能不好。
8.8一项统计结果声称, 某市老年人口(年龄在65岁以上)所占的比例为14.7%,该市老年人口 研究会为了检验该项统计是否可靠,随机抽选了 400名居民,发现其中有 57人年龄在65岁以上。
调查结果是否支持该市老年人口比例为 14. 7%的看法(a=0. 05)?★解147%57 r 「o = 一 = 0,1+25 = 14.25%这是一个双侧检验,当汕厂有I沁右由于|z|<| |,不能拒绝林」,可以认为调查结果支持了该市老年人口所占比例为14. 7%的看法。
思考与联系思考题8.1假设检验和参数估计有什么相同点和不同点?答:参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数□在估计前是未知的。
而在参数假设检验中,则是先对卩的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
8.2什么是假设检验中的显著性水平?统计显著是什么意思?答:显著性水平是一一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险。
统计显著等价拒绝H0指求出的值落在小概率的区间上,一般是落在0.05或比0.05更小的显著水平上。
8.3什么是假设检验中的两类错误?答:假设检验的结果可能是错误的,所犯的错误有两种类型,-.类错误是原假设HO为真却被我们拒绝了,犯这种错误的概率用a表示,所以也称a错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用B表示,所以也称B错误或取伪错误。
8.4 两类错误之间存在什么样的数量关系答:在假设检验中,a与B是此消彼长的关系。
如果减小a错误,就会增大犯B错误的机会,若减小B错误,也会增大犯a错误的机会。
8.5解释假设检验中的P值答:P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
(它的大小取决于三个因素,一个是样本数据与原假设之间的差异,一个是样本量,再一个是被假设参数的总体分布。
)8.6显著性水平与P值有何区别答:显著性水平是原假设为真时,拒绝原假设的概率,是一个概率值,被称为抽样分布的拒绝域,大小由研究者事先确定,一般为0.05。
而P只是原假设为真时所得到的样本观察结果或更极端结果出现的概率,被称为观察到的(或实测的)显著性水平8.7 假设检验依据的基本原理是什么?假设检验的理论依据是概率论中的小概率原理 , 该原理认为小概率事件在一次观察中是不可能出现的。
换言之,如果在一次调查(即观察)中发现了小概率事件,就应当作出这样的判断 : 这种事件本身就不是一个小概率事件,而是一个大概率事件。