张敏强《教育与心理统计学》【课后习题】(抽样理论与参数估计)【圣才出品】
- 格式:pdf
- 大小:220.74 KB
- 文档页数:2
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第13章聚类分析【本章重点】☆Q型与R型聚类☆聚类分析中距离的六种定义13.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是分类学与多元统计分析相结合的一种方法。
它将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。
其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。
2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。
(2)入选的指标需满足的要求:①指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。
②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。
③指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。
如果分类指标间还具有直交性,那么还可提高聚类的效率。
若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。
空间N个样本点的所有测值可以矩阵X记之:(13.1)④在聚类分析中,要求入选的所有指标变量有统一的量纲。
(3)常用的整理原始数据的方法有以下几种:①数据中心化变换。
如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。
二、多项选择题1.描述数据离中趋势的统计量有()。
[统考2007年研]A.方差B.标准差C.平均差D.四分位差【答案】ABCD【解析】描述数据离中趋势的统计量称为差异量数,差异量数包括平均差、方差与标准差、四分位差、全距、百分位差等。
2.方差分析需要满足的前提条件有()。
[统考2008年研]A.总体正态分布B.各处理方差齐性C.总体方差已知D.各组样本容量相同【答案】AB【解析】方差分析的前提是总体正态、方差齐性、变异可加。
3.某次高考分数呈正态分布,以此为基础可以()。
[统考2009年研]A.计算考生的标准分数B.由P值,计算Z值C.确定某一分数界限内的考生比例D.知道计划录取人数后确定录取分数线【答案】ABCD【解析】正态分布的应用主要有四方面:①计算标准分数;②根据概率计算Z;③确定某一分数范围内的人数比率;④根据计划录取人数来确定录取分数线。
4.散点图的形状为一条直线,且两个变量方差均不为0,它们之间的相关系数可能为()。
[统考2010年研]A.1B.0.5C.OD.-l【答案】AD【解析】散点图的形状为一条直线,它们之间的相关系数可能为1或者-1。
5.线性回归分析的前提假设有()。
[统考2011年研]A.变量总体服从正态分布B.个体间随机误差相互独立C.自变量的个数多于因变量的个数D.因变量和自变量之间存在线性关系【答案】ABD【解析】线性回归的基本假设有四点:线性关系假设,X与Y在总体上存在线性关系,正态性假设,回归分析中的Y服从正态分布。
独立性假设,一是指与某一个X值对应的一组Y值和与另一个X值对应的一组Y值间没有关系,二是误差项独立,不同的X所产生的误差之间应相互独立。
误差等分散性假设。
6.下列关于χ2分布的特点描述,正确的有()。
[统考2012年研]A.χ2取值均为正值B.χ2分布是正偏态分布C.χ2分布为非连续性分布D.χ2分布的标准差与自由度相同【答案】AB【解析】卡方分布的特点:①χ2值是正值;②χ2分布呈正偏态,随着参数n 的增大,χ2分布趋近于正态分布;③χ2分布具有可加性,χ2分布的和也是χ2分布;④χ2分布是连续分布,但有些离散分布也服从χ2分布,尤其在次数统计上非常广泛。
第2章 常用统计参数1.某班学生的心理学平均成绩为75分,标准差为l0分,学生总数为43人。
根据这些信息,无法计算出的统计量有( )。
A .差异系数B .分数总和C .中数D .方差【答案】C【解析】中数计算方法:①首先确定中数在数据序列中的位置:dn M n =12n ,式中:dn M n 表示中数在数列中的位置;n 表示数列数据个数。
②然后再求数列中位于dn M n 位置上的那个数Mdn 。
题中没有具体数据序列,因此无法计算得到中数。
2.已知一组数据为2,5,13,10,8,21,则它们的中位数为( )。
A .8B .9C .10D .不存在【答案】B【解析】中位数又称中数,符号记为Mdn ,计算方法:①确定中数在数据序列中的位置:dn M n =12n +,式中,nMdn 表示中数在数列中的位置;n 表示数列数据个数。
②求数列中位于dn M n 位置上的那个数Mdn 。
由题可知,数据排序后为:2,5,8,10,13,21。
因为数据个数为偶数,则其中数为第(6+1)/2=3.5个数,即Mdn 应在8、10之间,因此答案为9。
3.某班30名学生的平均成绩是75分,其中10名女生的平均成绩是85分,那么该班男生的平均成绩是多少分?( ) A .65分B .70分C .75分D .68分【答案】B【解析】此题为加权平均数的变形,加权平均数的计算公式为:。
由公式可知,75=10852030X ⨯+⨯,X=70。
4.在教育与心理研究中,求平均增长率或对心理物理学中的等距与等比量表实验的数据处理,应当使用的统计量是( )。
A .算术平均数B .加权平均数C .几何平均数D.方差或标准差【答案】C【解析】几何平均数的应用:①心理物理学中等距与等比量表实验的数据处理;②教育与心理研究中平均增长率的计算。
5.如果把某班所有学生的分数都减少5分,则该班成绩的均值和方差会如何变化?()A.均值变小,方差不变B.均值不变,方差变小C.均值方差同时变小D.均值变小,方差变大【答案】A【解析】由方差的性质可知,每一个观测值都加或减一个相同常数c后,计算得到的方差等于原方差;由平均数的性质可知,每一个观测值都加上或减去一个相同常数c后,计算得到的平均数等于原平均数加上或减去这个常数c。
第7章回归分析1.线性回归分析中,下列哪个表述是不正确的?()A.自变量是可控制量,因变量是随机的B.两个变量不是对等的关系C.利用一个回归方程,两个变量可以互相推算D.根据回归系数可判定相关的方向【答案】C【解析】回归分析主要是通过自变量的值去估计和预测因变量的发展变化,因此不能互相推算。
2.进行回归分析,因变量y和自变量X()。
A.X是连续变量,y是称名变量B.X是称名变量,y是连续变量C.X是连续变量,y也是连续变量D.X是连续变量,y是顺序变量【答案】C【解析】回归分析是借助数学模型对事物间不确定关系的一种数量化描述,是相关关系的延伸,因此,自变量和因变量都为连续变量。
3.在回归直线,表示()。
A.当X增加一个单位时,Y增加中的数量B.当Y增加一个单位时,X增加的数量C.当X增加一个单位时,Y的平均增加量D.当Y增加一个单位时,X的平均增加量【答案】C【解析】一元线性回归方程记为y=α+βx,称为变量y对变量x的一元线性回归方程,α是这条直线在y轴上的截距,系数β是这条直线的斜率,实际上也是y的变化率,它表示当x增加1个单位时y的平均增加或减少的数量,即当x变化一个单位时,y将变化b 个单位。
4.估计标准误差说明回归直线的代表性,因此()。
A.估计标准误差数值越大,说明回归直线的代表性越大B.估计标准误差数值越大,说明回归直线的代表性越小C.估计标准误差数值越小,说明回归直线的代表性越小D.估计标准误差数值越小,说明回归直线的实用价值越小【答案】B【解析】估计标准误差是说明实际值与其估计值之间相对偏离的程度的指标,主要用来衡量回归方程的代表性。
估计标准误差的值越大,则估计量与其真实值的近似误差越大,回归直线的代表性就越小。
5.回归估计的估计标准误差的计算单位与()。
A.自变量相同B.因变量相同C.自变量及因变量相同D.相关系数相同【答案】C【解析】回归分析中称为回归估计标准误差,简记为:,由公式可看出,回归估计的估计标准误差的计算单位与自变量及因变量相同。
第11章主成分分析1.试述主成分分析的主要作用。
答:主成分分析主要是用以寻找判断某种事物或现象的主要综合指标,它是在不损失或很小损失原有信息的前提下,将原来多个彼此相关的指标转换为新的少数几个彼此独立的综合指标的一种多元统计分析方法。
概括来讲,主成分分析主要包括以下几个方面的作用。
(1)主成分分析能降低所研究的数据空间的维数。
(2)有时可通过因子负荷的结论,弄清X变量间的某些关系。
(3)它是多维数据的一种图形表示方法。
经过主成分分析后,可以选取前两个主成分或其中某两个主成分,根据主成分的得分,画出n个样本在二维平面上的分布情况,由图形可直观地看出各样本在主分量中的地位,进而还可以对样本进行分类处理,可以由图形发现远离大多数样本点的离群点。
(4)由主成分分析法构造回归模型。
(5)用主成分分析筛选回归变量。
回归变量的选择有着重的实际意义,为了使模型本身易于做结构分析、控制和预报,好从原始变量所构成的子集合中选择最佳变量,构成最佳变量集合。
用主成分分析筛选变量,可以用较少的计算量来选择量,获得选择最佳变量子集合的效果。
2.试述主成分分析与推断统计的主要异同。
答:主成分分析主要是用以寻找判断某种事物或现象的主要综合指标,它是在不损失或很小损失原有信息的前提下,将原来多个彼此相关的指标转换为新的少数几个彼此独立的综合指标的一种多元统计分析方法。
推断统计是研究如何利用样本数据来推断总体特征的统计方法。
二者的异同主要表现为:(1)相同点主成分分析和推断统计都是用观测的数据来对所研究的问题进行推断。
主成分分析的贡献率至少达85%,而推断统计中的假设检验和参数估计也是在一定的置信度下来推断总体的数据,如常用的置信度水平为95%或者99%。
(2)不同点①基本原理主成分分析是一种通过降维技术把多个变量化为少数几个主成分的统计分析方法。
这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线形组合。
当原来p个变量的总变差能够由少数几个线形组合来概括,那么这些线形组合中包含的信息与原来p个变量几乎一样多,可以用这些线形组合替代原来的p个变量,这样使观测数据从高维降到低维,简化了数据。
第1章常用的统计表与图1.对组限的规范写法本书有何规定?答:组限是每个组的起始点界限。
可以用几种不同的表述方式,见下表。
表1 组限的五种表述方法(i=5)对于连续变量,尽管表中的五种表述方法形式不同,但它们所包含的意义与传统“教育与心理统计学”中的规定却是一致的。
为了避免这种人为造成的误解并统一与规范关于组限的表述方法,本书建议并一贯采用表中的第三种、第四种或第五种这三种表述方法。
对此,作几点说明如下:(1)表述组限与实际组限是两个不同的概念,但它们之间有规律性的联系。
(2)当各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限统一起来,且不管这里表述组限中的实下限与实上限是整数还是小数。
(3)按照本书上述规定的组限表述方法即可形成规范的组限表述方式,并与其他学科中的区间表达法统一起来。
2.列举次数直方图或多边图的一些应用。
答:次数直方图是由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形,而次数多边图是利用闭合的折线构成多边形以反映次数变化的情况的一种图示方法。
他们都适合连续性的数据。
应用举例:如学生考试成绩的分布,商场一年12个月的销售额情况,学生去学校所花费的时间,某班学生的身高情况,某班学生的体重情况,体育课上学生一分钟内跳绳的次数,居民月平均用水量的情况等。
3.试比较简单条形图与简单次数直方图在制作和应用方面的异同点。
答:简单条形图是以若干平行而等宽的长条来表示离散型数据的对比关系的图形;次数直方图是指由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。
(1)相同点①简单条形图与简单次数直方图都是统计学中常用的分布图。
②简单条形图与简单次数直方图都含有长条。
(2)不同点①简单条形图的长条是紧密相连的,而简单次数直方图的长条是分开的。
②简单条形图适合用来描述离散型变量(如属性变量)的统计数据,而简单次数直方图则是用来刻划连续性变量的观测数据。
4.简述散点图、折线图、条形图和圆形图这四种统计分析图的应用特点。
第8章x2检验1.检验一个因素多项分类的实际观察与某理论次数是否接近,这种卡方检验是()。
A.配合度检验B.独立性检验C.同质性检验D.符号检验【答案】A【解析】配合度检验是应用2χ检验方法的一种,主要用于实际观察次数分布与某理论次数是否有差别的分析。
它适用于一个因素多项分类的计数资料。
配合度检验的研究假设是实际观察数与某理论次数之间差异显著,原假设则为实计数与理论次数之间无差异或相等。
2.用2χ分布进行拟合优度检验时,要求各组的理论次数()。
A.可任意取值B.大于0C.不小于10D.不小于5【答案】D【解析】为了使χ2分布成为χ2值合理准确的近似估计,每一个单元格中的期望次数应该至少在5个以上。
3.独立检验与拟合优度检验相比较,其特点是()。
A.检验用的分布不同B.检验用的理论频数导出方法不同C.检验用的自由度不同D.检验结果的判断方向不同【答案】B【解析】独立检验理论次数的计算直接利用列联表提供的数据推算出来的。
拟合优度检验理论次数的计算,一般是根据某种理论,按一定的概率通过实际观察次数计算。
某种理论有经验概率,也有理论概率,如二项分布、正态分布等理论概率。
4.在3×4列联表分析中,自由度为()。
A.11B.7C.6D.3【答案】C【解析】两因素列联表自由度与两因素各自的分类项数有关,设R为每一行的分类项数,C为每一列的分类项数,则自由度为:df=(R-1)(C-1)。
因此,可得df=(3-1)(4-1)=6。
5.判断按等级来评定的某科成绩是否存在性别差异时,应采用的统计假设检验方法是()。
A.F检验B.Z检验C.t检验D.2χ检验【答案】D【解析】按等级来评定的某科成绩和性别都是非连续型变量,是等级变量,用非参数检验的统计方法,如2χ检验,可以采用,F检验、Z检验、t检验都是参数检验。
6.2χ检验用于连续变量(分为k组)的正态性检验,当虚无假设为“观察数据的次数分布与正态分布没有显著差异”时,其自由度为()。
第2章常用统计参数【学习目标】1.了解各种集中量数、差异量数和地位量数的概念、性质和作用,理解各种量数的适用条件及特点。
2.识记相关、散点图及相关系数的概念与彼此之间的关系。
3.掌握各种量数的计算方法,并能够熟练使用各种量数对测量数据的数据特征进行描述。
4.掌握各种常见相关分析方法的适用条件及计算方法。
2.1复习笔记一组变量的次数分布,一般至少有以下两个方面的基本特征:中心位置:用以度量一组数据的集中趋势,描述它们的中心位于何处,故对其数量化描述称为位置度量数或集中量数。
离散性:反映一组数据的分散程度,即次数分布的离散程度。
对其数量化描述称为次数分布变异特性的度量或差异量数。
中心位置相同的次数分布,其离散程度不一定相同。
对任何一个已知的次数分布,均可以计算出反映上述统计特征的量数。
在教育与心理统计中,总体统计特征的量数称为参数,用希腊字母表示,如μ,σ2,ρ等;样本统计特征的量数称为统计量,用英文字母表示,如X,S2,r等。
一、集中量数集中量数是指描述数据集中趋势的统计量,包括算术平均数、加权平均数、几何平均数、中数,等等,其作用都是用于度量次数分布的集中趋势。
(一)算术平均数算术平均数(简称平均数、均数)是用以度量连续变量次数分布集中趋势的最常用的集中量数。
1.总体平均数与样本平均数(1)总体平均数如果一个总体X 包含N 个元素,x i 是这个总体中的第i 个元素,则称x i 为第i 次观测值,那么对x 来讲,该总体的算术平均数被定义为:11=Nii x N μ=∑式中:μ——总体算术平均数;N——总体容量;i x ——第i 次观测值。
(2)样本平均数当无法对总体进行全面观测时,对于样本X ,其算术平均数被定义为:11n i i X x n =∑式中:X ——样本平均数;n ——样本容量。
2.加权平均数若已知各组平均数和各组人数,要求总的平均数时,则要用加权平均数的方法,其计算公式为:式中:——总平均数(或加权平均数);12,,,k n n n …——各组人数;12,k ,X X X …,——各组平均数;12t k n n n n =+++…——总人数。
第10章主成分分析与因素分析1.主成分分析的主要作用有哪些?答:主成分分析是用以寻找判断某种事物或现象的主要综合指标,它是在不损失或很小损失原有信息的前提下,将原来多个彼此相关的指标转换为新的少数几个彼此独立的综合指标的一种多元统计分析方法。
主成分分析的作用主要有:(1)主成分分析能降低所研究的数据空间的维数。
(2)可通过因子负荷的结论,弄清X变量间的某些关系。
(3)它是多维数据的一种图形表示方法。
经过主成分分析后,可以选取前两个主成分或其中某两个主成分,根据主成分的得分,画出n个样本在二维平面上的分布情况,由图形可直观地看出各样本在主分量中的地位,进而还可以对样本进行分类处理,可以由图形发现远离大多数样本点的离群点。
(4)可以用来构造回归模型。
(5)可筛选回归变量。
可以用较少的计算量来选择变量,获得选择最佳变量子集合的效果。
2.什么是贡献率和累计贡献率?其意义何在?答:(1)贡献率和累计贡献率的含义主成分的贡献率和累计贡献率度量了F1、F2,…,Fm分别从原始变量x1,x2,…,x p 中提取了多少信息。
①贡献率第i个主成分方差在全部方差中所占的比重称为贡献率,在主成分分析中,比值为。
②累积贡献率累积贡献率是指前k个主成分所代表的原始变量信息的百分比。
公式为,k≤p。
(2)两者的意义①贡献率第i个共因素对变量x提供的方差总和,反映第i个共因素的相对重要程度。
这个值越i大表明第i个主成分综合信息的能力较强。
②累积贡献率累计贡献率反映了前k个主成分共有多大的综合能力,用这k个主成分的方差和全部方差中所占的比重来描述,表明取前几个成分基本包含了全部测量指标所具有信息的百分率。
实际应用中,根据问题的需要选取主成分的个数,一般要求累积贡献率不小于85%。
也可依据问题的需要适当提高或降低累计贡献率。
由于主成分的方差λj一般下降较快,所以只要取为数不多的主成分,就足以反映p个原始变量的变化情况,从而达到主成分分析的目的。
第4章抽样理论与参数估计一、单项选择题1.下列关于F分布的表述,错误的是()。
A.负偏态分布B.随着分子和分母的自由度的变化而变化的一簇曲线C.F总为正值D.分母和分子的自由度越大,F分布越接近正态分布【答案】A【解析】F分布形态是一个正偏态分布,其分布曲线随分子和分母自由度的不同而不同,随分子和分母的自由度的增加而渐趋正态分布。
F总为正值,因为F是两个方差的比率。
2.在抽样时,将要抽取的对象进行编号排序,然后每隔若干个抽取一个,这种方法是()。
A.简单随机抽样B.系统抽样C.分层随机抽样D.两阶段随机抽样【答案】B【解析】系统抽样,也称机械抽样或等距抽样,首先将个体编号排序,之后每隔若干个号码抽取一个。
3.用统计量估计参数时,当多个样本的统计量与参数的差值的平均数是0时,说明该统计量具有()。
A.无偏性B.有效性C.一致性D.充分性【答案】A【解析】用统计量估计总体参数一定会有误差,不可能恰恰相等。
因此,好的估计量应该是一个无偏估计量,即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。
4.当一个统计量是总体参数的无偏估计量时,其方差越小越好,这种估计量的特性是()。
A.无偏性B.有效性C.一致性D.充分性【答案】B【解析】当总体参数的无偏估计的参数不止一个时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好。
5.充分性最高的总体平均数的估计量是()。
A.样本平均数B.样本众数C.样本中位数D.样本平均差【答案】A【解析】样本统计量的充分性指一个容量为n的样本统计量是否充分地反映了全部n 个数据所反映总体的信息。
样本平均数的充分性高,因为样本平均数能够反映所有数据所代表的总体信息。
6.根据估计量以一定可靠程度推断总体参数所在的区间范围时,总体参数所在的区域距离是()。
A.置信界限B.置信区间C.置信水平D.显著性水平【答案】B【解析】区间估计是指根据估计量以一定可靠程度推断总体参数所在的区间范围,这一区间范围就是置信区间,或称置信间距。
第3章概率与分布1.下面描述的现象是随机现象的是()。
A.股市在休息日的变化情况B.花粉随溪水流动时,沿溪水流动方向的轨迹C.小明某次语文期中考试的成绩D.导体通电时发热【答案】C【解析】随机现象是指在一定条件下,事先不能断言会出现哪种结果的现象。
小明的某次语文考试成绩不能断言会出现什么结果,因此为随机现象。
2.某学校对其200名高三应届生做摸底测试,根据成绩推算这200名学生能上重点线的概率为0.8,能上清华大学分数线的概率为0.03,从该学生团体随机抽取一名学生,该生能上重点并考上清华大学的概率是多少?()A.0.8×0.03B.0.03C.(1/200)×0.03D.(1/200)×0.8×0.03【答案】B【解析】当且仅当B⊃A时,P(AB)=P(A)。
题中,上重点线⊃上清华大学分数线,所以P(上重点线的概率上清华大学分数线的概率)=P(上清华大学分数线的概率)=0.03。
3.某生下定决心考公务员,打算拼搏3次。
3次都不行则不再言考,问该考生如愿的机会有多大?(假定公务员录取率在未来10年内都稳定在1:50)()【答案】D【解析】由题干可知,公务员录取率在未来10年内都稳定在1:50,因此第一次考上的概率为1/50,第一次未考上第二次考上的概率为49/50×1/50,前两次未考上第三次考上的概率为49/50×49/50×1/50,该生考试3次,这3次是相互独立的,用加法定率,所以该生如愿的概率为1/50+49/50×1/50+49/50×49/50×1/50。
4.在某随机样本中有10名被试,现需从中选择一人做实验A,若每人被选机会均等,选择被试l或被试2的概率是多少?()A.1/10+1/10B.(1/10)×(9/10)+(9/10)×(1/10)C.1/10+1/10-(1/10)×(1/10)D.1/10+1/10-(9/10)×(9/10)【答案】A【解析】因为每人被选机会均等,从10人中选一个,所以被选中概率为1/10,又因为选择被试l或被试2为两个相互独立的事件,因此用加法定理,答案为1/10+1/10。
第1章常用的统计表与图1.落在某一特定类别或组中的数据个数称为()。
A.次数B.频率C.次数分布表D.累积次数【答案】A【解析】A项,次数是指某一特定类别或组中的数据个数;B项,频率又称相对次数,是各组的次数f与总次数N之间的比值;C项,次数分布表是将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现;D项,累积次数是指某个数值以下或以上的数据的次数。
2.把各个类别及落在其中的相应次数全部列出,并用表格形式表现出来,称为()。
A.次数B.次数分布表C.频率D.累积频率【答案】B【解析】次数分布表是将数据进行分组归类,考察这批数据在量尺上各等距区组内的次数分布情况,并把这种情况用规范的表格形式加以体现。
3.下面哪一个图形最适合描述结构性问题()。
A.条形图B.饼图C.直方图D.多边图【答案】B【解析】饼图又称为圆形图,是以单位圆内各扇形面积所占整个圆形面积百分比来表示各统计事项在其总体中所占相应比例的一种图示方法,特别适用于描述具有百分比结构的分类数据。
A项,条形图一般用于统计各种数量的多少;C项,直方图用于表达一个次数分布的结构形态及特征;D项,多变图是利用闭合的折线构成多边形以反映次数变化情况。
4.下面图形中最适合描述一组数据分布的图形是()。
A.散点图B.直方图C.条形图D.圆形图【答案】B【解析】直方图可以用来描述数据分布的结构形态及特征。
A项,散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。
散点图适合于描述二元变量的观测数据,对于探究两种事物、两种现象之间的关系起着重要作用。
5.为描述身高与体重之间是否有某种关系,适合采用的图形是()。
A.条形图B.线形图C.散点图D.直方图【答案】C【解析】散点图适用于描述二元变量的观测数据,可以探究两种事物、两种现象之间的关系。
用散点图描述身高与体重,可以看出这两种身体特征之间存在的某种相关趋势。
第6章方差分析一、单项选择题1.现要考察三个教学班的平均成绩的差异是否具有统计学意义,应使用的最恰当的统计方法是()。
A.回归分析B.相关分析C.t检验D.方差分析【答案】D【解析】t检验和方差分析都可以用于检验组间差异,但是t检验只能用于检验两组之间的差异,而方差分析可以用于多组比较。
本题涉及的教学班有三个,因此方差分析是最恰当的统计方法。
2.经过31题所进行的检验之后,结果显示在0.05显著性水平上存在差异,下面还需要进行的检验是()。
A.交互作用分析B.事后检验C.t检验D.无需检验【答案】B【解析】本题涉及的是单因素方差分析,因此无需进行交互作用分析。
在进行方差分析之后,若结果表明在相应的显著性水平上存在差异,就要进行事后检验(也称事后多重比较)来进一步分析差异发生在哪两个组之间。
3.方差分析的首先进行检验的是()。
A.综合虚无假设B.部分虚无假设C.综合对立假设D.部分对立假设【答案】A【解析】进行方差分析时,设定的虚无假设为样本所归属的所有总体的平均数都相等,一般把这一假设称为“综合的虚无假设”。
4.在单因素重复测量的方差分析中,有8名被试参加了实验,实验共有四种处理,那么误差的自由度是()。
A.7B.24C.21D.28【答案】C【解析】在单因素重复测量的方差分析中,总变异包括组间变异、区组变异和误差变异。
总变异的自由度为被试数减1,本题中为31。
组间变异为实验处理数减l,本题中为3。
区组变异为区组数减1,本题中为7,剩余的自由度为误差变异的自由度,本题中为21。
5.在两个班级的学生学习基础不同的情况下(实验前测验的平均分有一定差距),若要以这两个班级为实验班研究两种教学方法的差异,下列统计方法中,最恰当的是()。
A.方差分析法B.因素分析法C.回归分析法D.协方差分析法【答案】D【解析】协方差分析是关于如何调节协变量对因变量的影响效应,从而更有效地分析实验处理效应的一种统计分析技术。
第10章常用教育与心理实验设计1.试述教育实验设计的意义及作用。
答:教育实验或心理实验是一种计划好的有控制的教育研究,其目的是为了解答问题,检验假设和估计效果。
(1)教育实验设计的意义教育实验设计的意义主要表现为如下几个方面。
①教育实验设计是教育科学研究计划内关于研究方法与步骤的一项重要内容。
②在教育科研工作中,在制订研究计划时,都应根据实验的目的和条例,结合统计学的要求,针对实验的全过程,认真考虑实验设计问题。
③在教育科研工作中,一个周密而完善的实验设计,能合理地安排各种实验因素,严格地控制实验误差,最大限度地获得丰富而可靠的资料。
总之,教育实验设计是教育研究中实验过程的依据、实验数据处理的前提,也是提高科研成果质量的一个重要保证。
(2)教育实验设计的作用教育实验设计的作用主要包括如下几个方面。
①能够回答教育研究心理研究的某些问题;②安排教育与心理实验,获得实验数据;③节省人力和物力;④获得科学结论。
2.教育实验设计要遵循哪些原则?答:费希尔首先提出实验设计应遵循三个原则:重复、局部控制和随机化。
它们是提高实验精度的最有效的方法。
(1)重复重复是指每一因素的水平(或因素的水平组合)的实验次数不少于2。
重复的作用是为了估计实验误差和减少实验误差。
(2)局部控制局部控制是力求使得非实验的影响尽可能减少的一种做法。
即让非实验条件在多次重复的实验中具有同质性。
(3)随机化随机化是实验设计中能够应用统计方法的保证。
它是指实验对象或实验材料的分配,以及各次实验中的先后次序,等等,都是随机选择和安排的。
其目的是使实验结果尽量避免受到主客观系统因素的影响而出现偏倚性,其作用是正确地估计误差。
3.比较随机区组实验设计和析因实验设计的异同。
答:(1)相同点随机区组实验设计和析因实验设计都是用来考查各实验处理对因变量的影响的实验设计;都可以用在多因素的实验设计中。
(2)不同点①概念不同随机区组设计是指将实验对象按一定的标准划分为数个区组,使得区组内的实验对象的个别差异尽可能小,既保证区组内的同质性,并使每个区组均接受所有实验处理,且各个区组内每个处理仅有一次观测,其顺序是随机决定的。
第4章抽样理论与参数估计
1.试述点估计和区间估计的定义,并叙述其优缺点。
答:(1)点估计
①定义
点估计是指用一个样本值来估计总体参数值的过程。
判断估计量优劣的标准是无偏性、有效性和一致性。
如:通常用样本平均数来作为总体平均数的估计,而总体标准差的估计则要用n-1的标准差来估计。
②优缺点
a.优点:计算简单,容易理解。
b.缺点:因为点估计值是由样本数据计算出的一个单一数值,由于是随机抽样的,因此由计算样本统计量而得到的点估计值,就有可能不是总体参数的真正值。
且当用点估计去估计总体参数的真值时,其误差大小及可靠程度如何都不知道。
(2)区间估计
①定义
区间估计是指在一定的置信度水平下,用置信区间来对总体参数进行估计的过程。
②优缺点
a.优点:克服了点估计的缺点,它不仅告诉了总体参数估计的值范围,而且还给出了可靠程度。
b.缺点:点估计是一个精确的值,但区间估计是一个大致的范围。
2.已知某中学一次数学考试成绩的分布为正态分布,总体标准差为σ=5,从这个总体中抽取n=16,并计算得到81X =,6S =,试问该次考试中全体考生成绩均值μ的95%的置信区间。
解:因为成绩的分布为正态分布,总体标准差已知,置信度为95%, 且题目已知:σ=5,0.052
1.96Z =,n=16,81X =
1.96/81 1.96 1.2578.55X n σ-=-⨯=
1.96/81 1.96 1.2583.45X n σ+=+⨯=
故μ的置信度为0.95时,置信区间是[78.55,83.45]。