《教育和心理统计学》章读书笔记
- 格式:docx
- 大小:2.25 MB
- 文档页数:18
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第13章聚类分析【本章重点】☆Q型与R型聚类☆聚类分析中距离的六种定义13.1复习笔记一、聚类分析的基本原理(一)聚类分析1.聚类分析的概念聚类分析是分类学与多元统计分析相结合的一种方法。
它将分类对象置于一个多维空间中,按照它们空间关系的亲疏程度进行分类。
其与一般分类方法的不同之处在于:(1)一般分类法往往从专业知识出发进行分析归类,而聚类分析先是仅凭变量指标进行定量分析,整理出分类的谱系追踪图,然后再据专业知识确定最终类型数目和类型命名;(2)一般的分类允许在不同层次上有不同的分类依据或分类准则,而聚类分析在所有层次上的分类依据和分类准则都是一样的;(3)一般分类不要求被分对象一次性完备,允许分类后继续补充样品甚至建立新类,而聚类分析要求被分类对象一次性完备,不允许中间插入新样品,否则要重复聚类分析的全过程。
2.聚类分析的分类依据(1)聚类分析作为一种数值分类法,分类依据是数据指标,要进行聚类分析必须建起一个描写事物本质属性的指标体系,或者一个变量组合。
(2)入选的指标需满足的要求:①指标必须能刻画事物属性的某个侧面,所有指标组合起来形成一个完备的指标体系,互相配合共同刻画事物的本质特征。
②要求每一个入选指标都与所研究的问题紧密联系,并且都有较强的分辨能力。
③指标本身还必须可测和稳定,可测是分类得以进行的先决条件,稳定是分类准确的前提。
如果分类指标间还具有直交性,那么还可提高聚类的效率。
若有N个样品、有M个指标,称为M维空间上N个样本点,测值X ik表示第i个样本点在第k维指标上的测量值。
空间N个样本点的所有测值可以矩阵X记之:(13.1)④在聚类分析中,要求入选的所有指标变量有统一的量纲。
(3)常用的整理原始数据的方法有以下几种:①数据中心化变换。
如果一批数据指标由于各自的分布中心有显著差异而导致量纲不一致,可以对数据作中心化变换,新的指标中心皆为0。
第二章常用统计参数第二章常用统计参数用参数来描述一组变量的分布特征,便于我们对数据分布状况进行更好的代表性的描述,也有利于我们更好地了解数据的特点。
常见的统计参数包括三类:集中量数、差异量数、地位量数(相对量数X相关量数。
描述统计的指标通常有五类。
第一类集中量数:用于表示数据的集中趋势,是评定一组数据是否有代表性的综合指标,比如平均数、中数、众数等。
概述[不背]第二类差异量数:用于表示数据的离散趋势,是说明一组数据分散程度的指标,比如方差、标准差、差异系数等。
第三类地位量数:是反映个体观测数据在团体中所处位置的量数,比如百分位数、百分等级和标准分数等。
第四类相关量数:用于表示数据间的相互关系,是说明数据间关联程度的指标,比如积差相关、肯德尔和谐系数、①相关等。
第五类:是反映数据的分布形状,比如偏态量和峰度等(不作介绍I第一节集中量数(一)集中量数的定义(种类、作用)[湖南12名]描述数据集中趋势的统计量数称为集中量数。
集中量数能反映大量数据向某一点集中的情况。
常用的集中量数包括算术平均数、加权平均数、几何平均数、中数、众数等等,它们的作用都是用于度量次数分布的集中趋势。
(二)算术平均数(平均数、均数)(一级)简述算术平均数的定义和优缺点。
(1)平均数的含义算术平均数可简称为平均数或均数,符号可记为M。
算术平均数即数据总和除以数据个数,即所有观察值的总和与总频数之比。
只有在为了与其他几种集中.数洞区别时,如几何平均数、调和平均数、加权平均数,才全称为算术平均数。
如果平均数是由变量计算的,就用相应的变量表示,如又匕算术平均数是用以度量连续变量次数分布集中趋势及位置的最常用的集中量数,在一组数据中如果没有极端值, 平均数就是集中趋势中最有代表性的数字指标,是真值的最佳估计值。
(2)平均数的优缺点简述算术平均数的使用特点[含优缺点]算术平均数优点①反应灵敏。
观测数据中任1可一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反映出来。
《教育统计学》读书笔记(1)第一章绪论第一节1)描述统计:对已获得的数据进行整理、概括并显现其分布特征。
1、集中量表现集中趋势,常用量:算术平均数、中位数、众数2、差异量来反应数据间的离散程度,常用量:全距、标准差3、用偏态量和峰态量来反映分布形态2)推断统计:根据已知的情况,在一定概率意义下估计、推断未知的情况。
1、总体参数检验(总体平均数、总体标准差、总体相关系数等)2、假设检验(总体平均数之差、总体方差之差、总体相关系数之差),总体分布是否服从某种分布的假设检验可以用样本来推测总体的情况,比如用某个班级所有学生的成绩来估计整个学校的学习成绩,用某个学校的成绩来估计整个市的成绩等。
第三节统计学中的基本概念1、总体和样本2、统计量和参数统计量:样本上的数字特征,例如平均数μ、标准差σ、相关系数ρ等参数:总体的数字特征,例如平均数X、标准差S、相关系数等第二章数据的初步整理1、统计表简单频数、累积频数和累积百分比分布表(累积百分比分布表可以用来说明、解释和评价某一测验的原始分数之优劣)2、统计图1)间断变量统计图1、直条图:比较性质相相似的间断性资料2、饼图等:间断性资料构成比的图形2)连续变量统计图(可用图形来初步判断数据是否符合正态分布)1、线形图2、直方图等第三章 集中量第一节 算数平均数(应用最多)iXX n=∑2、算数平均数优点:反应灵敏、简单易懂、受抽样变动影响小,在计算其他统计量时都需要用到他3、缺点:容易受两端极值影响,若数据中存在某个数值模糊时就无法计算。
4、适用条件:一组数据中每个数据都比较精确、可靠,无两端极值的影响,还要通过它计算其他统计量。
一)中位数Md ,各有一半数大于或小于这个数。
2、优点:受两端极值影响小3、缺点:抽样偏差较大,并不是每个数都参与运算,反应不灵敏,不适合代数运算4、适用条件:一组数据中有特大或特小两极端数值时,一组数据中有个别数据不确切、不清楚时,资料属于等级性质时。
《绪论》1.什么是教育与心理统计学教育与心理统计学是应用统计学的一个分支,是数理统计学与教育学、心理学的一门交叉学科,它把统计学的理论方法应用于教育实际工作和各种心理实验、心理测验等科学研究中,通过对所得数据的分析和处理,达到更为准确地掌握情况、探索规律、制订方案、目的,为教育与心理的科学研究提供了一种科学的方法。
2.教育与心理统计学的基本内容及本书体系。
1)描述统计学:这一部分主要是研究和简缩数据和描述这些数据。
例如:计算平均数、中位数、众数等,以这些参数来反映观测数据的集中趋势。
计算标准差、方差等,以这些参数来反映观测数据的离散趋势。
描述统计学主要是描述事务的典型性、波动范围以及相互关系,提示事物的内部规律。
2)推断统计学:这部分内容主要是研究如何利用数据去作出决策的方法。
推断统计学则是一种依据部份数剧去推论全体的一种科学方法,它是进行教育与心理实验、对教育与心理研究或实验作出预测和规划的有力工具。
推断统计学的主要内容有:统计检验、统计分析和非参数统计法。
3)多元统计分析:这部分内容主要是研究超过两个因素的教育与心理的研究和实验。
多元统计分析的主要任务就是寻找出主要的因素,相近或相关的因素合并或归类。
多元统计分析的主要内容有:主成分分析、因素分析、聚类分析、多元方差分析、多元回归分析等。
3.教育与心理统计学的昨天、今天和明天1)与心理统计学的昨天:1904年美国人桑代克写的《心理与社会测量导论》2)教育与心理统计学的今天:叶佩华主编的《教育统计学》,张厚粲主编的《心理与教育统计》等。
4.预备知识1)概念与术语<1>随机变量:教育与心理实验或观测,在相同的条件下,其结果可能不止一个,同实验或观测所得到的数据,事先无法确定,这类现象称为随机现象。
因为可以用数字来表现,则称这些数字为随机变量。
它的特点是:离散性、变异性和规律性。
依其性质可分为:称名变量、顺序变量、等距变量、比率变量四种称名变量:用于说明一事物与其它事物在属性上的不同或类别上的差异,但不说明事物与事物之间差异的大小。
华东师大心理统计学大纲教材:《教育统计学》第一章绪论第一节什么是统计学和心理统计学一、什么是统计学统计学是研究统计原理和方法的科学。
具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
统计学分为两大类。
一类是数理统计学。
它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。
它是数学的一个分支。
另一类是应用统计学。
它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。
应用统计学是与研究对象密切结合的各科专门统计学。
二、统计学和心理统计学的内容统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。
从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。
1.描述统计对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。
2.推断统计根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。
推断统计的内容包括总体参数估计和假设检验两部分。
3.实验设计实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。
其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。
以上三部分内容,不是截然分开,而是相互联系的。
第二节统计学中的几个基本概念一、随机变量具有以下三个特性的现象,成为随机变量。
第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。
随机现象的每一种结果叫做一个随机事件。
我们把能表示随机现象各种结果的变量称为随机变量。
《现代心理与教育统计学》(第4版)笔记和课后习题详解第1章绪论1.1复习笔记本章重点ü心理与教育统计的研究内容ü选择使用统计方法的基本步骤ü统计数据的基本类型ü心理与教育统计的基本概念一、统计方法在心理和教育科学研究中的作用(一)心理与教育统计的定义与性质1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。
2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。
前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。
心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。
类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。
(二)心理与教育科学研究数据的特点1.心理与教育科学研究数据与结果多用数字形式呈现。
2.心理与教育科学研究数据具有随机性和变异性。
3.心理与教育科学研究数据具有规律性。
4.心理与教育科学研究的目标是通过部分数据来推测总体特征。
(三)学习心理与教育统计应注意的事项1.学习心理与教育统计学要注意的几个问题:(1)学习心理与教育统计学时,必须要克服畏难情绪。
心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。
(2)在学习时要注意重点掌握各种统计方法使用的条件。
(3)要做一定的练习。
2.应用心理与教育统计方法时要做到:(1)克服“统计无用”与“统计万能”的思想,注意科研道德。
(2)正确选用统计方法,防止误用和乱用统计。
张敏强《教育与心理统计学》修订本笔记和课后习题(含考研真题)详解第11章主成分分析【本章重点】☆主成分分析的基本原理☆主成分分析的步骤11.1复习笔记一、主成分分析的基本原理主成分分析主要是用来寻找判断某种事物或现象的主要综合指标,它是在不损失或很小损失原有信息的前提下,将原来多个彼此相关的指标转换为新的少数几个彼此独立的综合指标的一种多元统计分析方法。
实际上,主成分分析是一个数据降维的过程,即将反映复杂现象的相关变量用综合变量来代表。
主成分的分析原理是:设有n个观测点(x il,x i2),i=1,2,…,n。
这n个观测点的分布如图11-2。
主成分分析的原理是先对n个观测点(x il,x i2)求出第一条“最佳”拟合直线,使得这n个观测点到该直线的垂直距离的平方和最小,这时称此直线为第一主成分,然后再求与第一主成分相互独立(在此表现为相互垂直)的且与n个观测点(x i1,x i2)的垂直距离平方和最小的第二主成分。
如图11-2所示。
图11-2主成分分析示意图假如有P个变量,共得到n个点(x i1,x i2,x ip),此时,若要求第k个主成分,就必须使它与前k-1个主成分不相关,且使它与n个观测点的垂直距离平方和为最小。
如此继续,直至求出P个主成分。
注意:只有变量间存在一定相关才可以降维,原有的变量数和主成分数相等,并且具体选取几个主成分,应视具体情况而定。
二、主分量的导出主分量的导出是对主成分分析数学模型的讨论。
由主成分分析的基本原理可知,主成分分析,实际上就是分解相关矩阵,从而使P个相关的变量分解成P个独立的分量。
(一)主成分的定义及满足条件设X=(x1,x2,…,x P)'是一个p维随机向量。
并假设X的数学期望E(X)=0,记X的协方差矩阵为E(XX')=∑,令U=(u1,u2,…,u P)'是-P维向量,且满足W'=U'U=I,则X的第i主成分定义为:(11.1)且满足条件:1.第一主成分F1是一切形如中使F的方差达到最大者。
《绪论》1.什么是教育与心理统计学2.教育与心理统计学是应用统计学的一个分支,是数理统计学与教育学、心理学的一门交叉学科,它把统计学的理论方法应用于教育实际工作和各种心理实验、心理测验等科学研究中,通过对所得数据的分析和处理,达到更为准确地掌握情况、探索规律、制订方案、目的,为教育与心理的科学研究提供了一种科学的方法。
3.教育与心理统计学的基本内容及本书体系。
4.1)描述统计学:这一部分主要是研究和简缩数据和描述这些数据。
5.例如:计算平均数、中位数、众数等,以这些参数来反映观测数据的集中趋势。
6.计算标准差、方差等,以这些参数来反映观测数据的离散趋势。
7.描述统计学主要是描述事务的典型性、波动范围以及相互关系,提示事物的内部规律。
8.2)推断统计学:这部分内容主要是研究如何利用数据去作出决策的方法。
推断统计学则是一种依据部份数剧去推论全体的一种科学方法,它是进行教育与心理实验、对教育与心理研究或实验作出预测和规划的有力工具。
推断统计学的主要内容有:统计检验、统计分析和非参数统计法。
9.3)多元统计分析:这部分内容主要是研究超过两个因素的教育与心理的研究和实验。
10.多元统计分析的主要任务就是寻找出主要的因素,相近或相关的因素合并或归类。
11.多元统计分析的主要内容有:主成分分析、因素分析、聚类分析、多元方差分析、多元回归分析等。
12.教育与心理统计学的昨天、今天和明天13.1)与心理统计学的昨天:1904年美国人桑代克写的《心理与社会测量导论》14.2)教育与心理统计学的今天:叶佩华主编的《教育统计学》,张厚粲主编的《心理与教育统计》等。
15.预备知识16.1)概念与术语17.<1> 随机变量:18.教育与心理实验或观测,在相同的条件下,其结果可能不止一个,同实验或观测所得到的数据,事先无法确定,这类现象称为随机现象。
因为可以用数字来表现,则称这些数字为随机变量。
19.它的特点是:离散性、变异性和规律性。
20.依其性质可分为:称名变量、顺序变量、等距变量、比率变量四种21.称名变量:用于说明一事物与其它事物在属性上的不同或类别上的差异,但不说明事物与事物之间差异的大小。
22.顺序变量:指可以按事物的某一属性,把它们按多少或大小顺序加以排列的变量。
23.等距变量:指变量之间具有相等的距离。
它除了有量的大小外,还具有相等的单位。
24.比率变量:除了有量的大小、相等单位之外,还有绝对零点。
25.变量依其相互关系可分为自变量(一般将相互关系中作为原因的称为自变量)与因变量(作为结果的称为因变量)。
函数关系式y=f(x)表示,y为因变量,x为自变量。
26.<2>总体、样本、个体27.总体是指具有某一种特征的一类事物的全体。
28.个体是指构成总体的每一个基本元素。
29.样本是在总体中按一定规则抽取的一部分个体,称为总体的一个样本。
30.2)常用的符号与计算31.<1>连加号及运算法则32.∑表示连加符号,同时表示想加的观测数值共有n个,这些数值的下标编号i从1起至n止。
运算法则如下:33.①若c是一个常数,而xi是观测变量,则常与变量的乘积的连加和等于变量连加和与常数的乘积。
34.②设c是一个常数,则连加和竺于nc.35.③若xI 和yi都是变量,则变量和的连加和等于各个变量连加和的和。
36.<2>几个常用符号。
37.①变量一般以大写英文字母表示,而变量中的元素则以小写英文字母表示。
38.②变量平均数、变量标准差、方差,一般都用大写英文字母表示。
39.第1章第1节次数分布表与图(适用于描述一元连续变量的观测数据)1.次数分布及其表达方式概述2.次数分布指的是一批数据中各个不同数值所出现的次数情况,或者是指一批数据在量各等距区组所出现的次数情况。
3.次数分布表:我们通常是对数据进行分组归类,考察这批数据在量尺上各等距区内的次数分布情况,并把这种情况用规范的表格形式加以体现,这就是次数分布表,若用图形来表达,那就叫做次数分布图。
4.次数分布表的编制5.1)简单次数分布表6.简单次数分布表,通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。
其编制的主要步骤为:7.①求全距,字母R表示。
全距等于最大值减最小值,公式为:R=Max-Min8.②定组数,字母K表示。
把整批数据划分为多少个等距的区组。
公式:K=(N-1)2/59.③定组距,字母i表示。
I=R/K10.④写出组限。
(表述组限与实际两个不同的概念,但它们之间有规律性的联系;当各相邻组的组限已经相互承接而没有间断时,便认为已把表述的组限与实际的组限统一起来,且不管这里表述的实下限与实上限是整数还是小数;按照本书上述规定的组限表述方法即可形成规范的组限表述方式,并与其他学科中的区间表达方法统一起来。
11.⑤求组中值。
组中值=(组实上限+组实下限)/2.12.⑥归类划记13.⑦登记次数14.次数分布图的绘制15.次数分布图有次数直方图和次数多边图两种表达方式。
16.1)次数直方图(是由若干宽度、高度不一的直方条紧密排列在同一基线上构成的图形)17.绘制步骤:18.①以细线条标出横轴和纵轴(取正半轴即可),使其垂直相交;19.②每一直方条的宽度由组距i确定并已体现在横轴的等距刻度上;20.③在直方图横轴下边标上图的编号和图的题目,并检查一下图形结构的完整性。
21.2)次数多边图(利用闭合的折线构成多边形以反映次数变化情况的一种图示方法)22.3)相对次数直方图与多边图23.4)累积次数分布图24.(有直方图式和曲线图式两种,曲线图式常用,它是根据累积次数分布或累积相对次数分布制作而成。
)25.5)累积相对次数曲线图与累积百分数曲线图26.第2节几种常用的统计分析图(散点图、折线图、条形图和圆形图)1.散点图(适合于描述二元变量的观测数据)2.散点图是用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。
3.绘制散点图注意:①在平面直角坐标系中,横轴一般代表自变量,纵轴一般代表因变量;横轴既可作为连续性变量的量尺,也可作为离散性变量的量尺,但纵轴一般均代表连续变量的量尺;②点的描绘依二元观测数据而定,但在具体描绘时应注意用细线画坐标轴,用稍粗黑点描绘各个坐标点,点位置的确定按平面解析几何学中的方法;③注意图形的调和比例和必要的图注说明。
4.线形图(是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。
)5.适用于描述某种事物在时间序列上的变化趋势、描述一种事物随另一事物发展变化的趋势模式、比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系。
6.条形图(是用宽度相同的长条来表示各个统计事项之间的数量关系。
)7.通常用于描述离散性变量的统计事项。
8.1)简单条形图(它适用于统计事项按一种特征进行分类的情况)9.2)复合条形图(用两类或三类不同色调的直方长条来表示多特征分类下的统计事项之间数量关系的一种图示方法)10.圆形图(是以单位圆内各扇形面积所占整个圆形面积的百分比来表示各统计事项在其总体中所占相应比例的一种图示方法。
)特别适用于描述具有百分比结构的分类数据。
11.第1章自测练习【练习1】试比较简单条形图与简单次数直方图在制作和应用方面的异同点。
解答:条形图和直方图都是次数分布图,但前者适用于离散型随机变量的次数分布描述,其所依据的次数分布表是离散型次数分布表。
后者则适用于连续型随机变量的次数分布描述,其所依据的次数分布表是连续型次数分布表。
这一区别决定了它们在制作上的不同。
即相应于不同类型的次数分布表,条形图中的直条对应离散变量各类别,因而直条没有宽度的要求,直条之间是间隔排列的;而直方图的直条则对应连续变量次数分布的各取值区间,宽度即组距,直条比较相连排列。
具体参照教材有关内容。
【练习2】简述散点图、折线图、条形图和圆形图这四种统计分析图的应用特点。
解答:如上题所述,①条形图适用于离散型变量的次数分布,是一种次数分布图;②圆形图的适用条件与之相同。
所不同的是,圆形图使用圆中的扇面弧度来替代直条表达次数或相对次数,所有扇面组成整个圆周。
因而圆形图本身就包含有相对次数信息。
③散点图是专用于分析两个连续变量或至少是等级变量间相关关系的统计图,它用两个相关变量的配对数据分别作为散点的横、纵坐标在平面直角坐标系中描点,根据散点分布的区域的形状就可以大致判断两变量间的相关关系。
例如如果散点区域形状是一个椭圆,则变量为直线性相关,椭圆长轴的方向还可以表达相关的方向。
④折线图在教材中之牵涉到所谓的均值图,即描述某个因变量(指标)在一个离散型自变量的各水平上取值均值的统计图,将指标在自变量各水平上取值的均值作为纵坐标先描出散点,然后用线段连接这些散点构成折线,故而叫折线图。
折线图通常用在组间均值比较中帮助直观分析各均值间的差异。
第2章常用统计参数中心位置:用以度量一级数据的集中趋势,描述它们的中心位于何处,故对其数量化描述称为置度量数或集中量数。
离散性:反映一组数据的分散程度,即次数分布的离散程度。
对其数量化描述称为次数分布变异特性的度量或差异量数。
参数:总体统计特征的量数。
统计量:样本统计特征的量数。
第1节集中量数(描述数据集中趋势的统计量。
包括:算术平均数、加权平均数、几何平均数、中数,等。
它们的作用都是试题次数分布的集中趋势。
)1.算术平均数2.只有在与其他几种集中量数相区别时,才称它为算术平均数。
3.算术平均数是用以度量连续变量次数分布集中趋势的最常用的集中量数。
4.公式:5.6.7.8.1)总体平均数与样本平均数。
9.2)加权平均数10.11.12.13.3)算术平均数具有以下性质:14.①每一个观测值都加上一个相同常数C后,计算得到的平均数等于原平均数加上这个常数;15.16.17.②每一个观测值都乘以一个相同常数C后,计算得到的平均数等于原平均数乘以这个常数;18.19.20.③每一个观测值都乘以一个相同常数C后,再加上一个常数d后,计算得到的平均数等于原平均数乘以这个常数c再加上常数d.21.④观测值与平均数离差的总和为零22.23.⑤观测值与任意常数c的离差平方和,不小于观测值与平均数的离着平方和。
24.25.4)算术平均数的优点:26.反应灵敏、确定严密、简明易解、计算简便并能作进一步的代数演算等优点,是应用最普遍的一种集中量数。
27.5)算术平均数的缺点:28.易受极端数据影响、出现模糊数据和存在不等质数据时无法计算算术平均数的缺点。
29. 几何平均数(Mg)30. 当出现以下两种情况时需用几何平均数:31. ①一组数据中任何两个相邻数据之比接近于常数,即数据按一定的比例关系变化。
在教育与心理研究中,求平均增长率或对心理物理学中的等距与等比量表实验的数据处理;32. ②当一组数据中存在极端数据,分布呈偏态时,算术平均数不能很好的反映数据的33. 公式:34. 35. 公式变形:36. 未来情况的预测数X= x ′·( )n 37. x ′表示预测的基础。