教育与心理统计学 第四章 抽样理论与参数估计考研笔记-精品
- 格式:docx
- 大小:80.40 KB
- 文档页数:3
现代心理与教育统计学复习资料第一章心理与教育统计学基础知识1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据比率数据2、变量、随机变量、观测值变量就是可以挑相同值的量。
统计数据观测的指标都就是具备变异的指标。
当我们用一个量则表示这个指标的观测结果时,这个指标就是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的x或y表示随机变量。
随机变量所取得的值,称为观测值。
一个随机变量可以有许多个观测值。
3、总体、个体和样本须要研究的同质对象的全体,称作总体。
每一个具体内容研究对象,称作一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
通常把容量n≥30的样本称作大样本;而n<30的样本称作大样本。
4、统计数据量和参数统计数据指标平均数标准差相关系数回归系数统计数据量srb参数μσρβ5、统计误差误差就是测量得值与真值之间的差值。
测出数值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于采用的仪器、测量方法、读数方法等问题导致的测出值与真值之间的误差,称作测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章统计图表一、数据的整理在展开整理时,如果没充裕的理由证明某数据就是由实验中的过错导致的,就无法轻而易举将其确定。
对于个别极端数据与否该剔出,应当遵从三个标准差法则。
二、次数原产表中(一)简单次(频)数分布表(二)相对次数分布表将次数原产表各组的实际次数转变为相对次数,即为用频数比率(f/n)或百分比f)去则表示次数,就可以做成相对次数原产表中(?100%n(三)累加次数分布表(四)双列次数分布表双列次数原产表中又称有关次数原产表中,就是对存有联系的两列变量用同一个表中则表示其次数原产。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
冷二之前对心理统计学考点进行了分析,将整个统计归纳为43个知识点(戳蓝字直达→),介于心理统计学分值较大(占13分)且不易记忆,我们来逐章节进行梳理。
心理统计学共分5个章节:①(←戳蓝字进入复习)②了解了这些之后就进入第二章——对数据的分布以及总体参数进行一系列的估计【8个知识点】;③对于数据的操作要严谨,只有估计当然是不行的,所以接下来我们需要对数据进行一些假设并通过各种方法进行检验【16个知识点】;④第四章的各种研究设计的方差分析不是考察重点,我们就不过多浪费时间和精力了【1个知识点】;⑤第五章一元线性回归我们需要对几个名词解释考点进行记忆【4个知识点】。
由于第四章只有1个知识点,且在17年考察过,今年不可能重复考察,同时,第五章只有4个知识点,这篇文章中我们就将第二章、第四章和第五章的知识点一起进行梳理吧!第二章数据的分布及总体参数的估计第一节数据分布的特点【简答题-14、18年真题】正态分布的特点(14年)正态分布及曲线(18年)【选择题】正态分布总体的随机样本的关系:算术平均数±1S=68.26%算术平均数±1.645S=90%算术平均数±1.96S=95%算术平均数±2.58S=99%✔【名词解释】标准正态分布均值=0,方差=1的正态分布【选择题】标准分数的公式、二项分布的平均数、标准差(记住公式,以防计算类选择题)【选择题举例】一个班成绩平均分( ̄X)为90分,标准差(S)为3。
已知一个学生的成绩为97.5分,则该生成绩在班里的半分位是多少?解:带入标准分数公式可得:标准分数=(97.5-90)/3=2.5 2.5接近2.58,即该生的分数接近99.5%(即99%+1%÷2)第二节总体参数的估计✔【名词解释-16年真题】抽样分布样本统计量的概率分布✔【名词解释】样本平均数从正态分布的总体中可无限抽取大小为n的样本,所计算的这无限多个平均数的分布,称为样本平均数的分布。
《心理统计学》总复习要点第一章、第二章基本概念及次数分布表第一节基本概念一、基本概念1.连续变量与离散变量(不连续变量)变量分为连续变量与离散变量(不连续变量)。
连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。
不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。
是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。
2.总体、样本、个体总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。
二、测量水平心理测量的工具一般可以分为四种水平,它们是由测量工具——量尺的水平决定的,量尺也称为尺度。
(一)量尺(Ratio Measurement)用这样的量尺测量出的数据,可以进行加、减、乘和除运算。
这种测量水平的数据特征是有相等单位和绝对零点。
用这种量尺测量得到的数据变量为比率(或等比)变量。
(二)等距量尺(Interval Measurement)只有相等单位,没有绝对零点,这种测量工具称为等距量尺。
等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。
但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。
用这种量尺测量得到的数据变量为等距变量。
(三)顺序量尺(Ordinal Measurement)顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。
用这种量尺对研究对象进行测量,只能给对象排个顺序。
顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。
如有必要的话,只能进行不等式运算。
用这种量尺测量得到的数据变量为顺序变量。
(四)分类量尺(Nominal Measurement)分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。
即无大小之分,也无等级之分。
抽样与估计知识点抽样与估计是统计学中的重要概念,它们在数据分析和统计推断中起着关键作用。
通过合适的抽样方法和有效的估计技术,我们可以从一个总体中获取有关特征的信息,并对未知参数进行推断。
本文将介绍抽样与估计的基本概念和相关知识点。
一、抽样方法1. 简单随机抽样简单随机抽样是最基本的抽样方法之一。
它要求从总体中随机地选择样本,每个样本有相同的机会被选中。
简单随机抽样可以保证样本的代表性和独立性,但其实施过程相对繁琐。
2. 系统抽样系统抽样是指按照一定的规则和顺序从总体中选择样本。
例如,我们可以按照每隔k个元素选取一个样本的原则进行抽样。
系统抽样是一种简便有效的抽样方法,在满足一定条件下可以得到具有代表性的样本。
3. 分层抽样分层抽样是将总体划分为若干个相似的层次,然后分别从每个层次中进行简单随机抽样或系统抽样。
通过分层抽样,我们可以充分考虑总体的异质性,提高估计的准确性和可靠性。
二、估计方法1. 点估计点估计是根据样本数据,通过某种统计量来估计总体参数的值。
常见的点估计方法包括样本均值估计总体均值、样本比率估计总体比率等。
点估计给出了参数的一个具体值,但其估计结果可能存在偏差和不确定性。
2. 区间估计区间估计是利用抽样数据,通过构造一个置信区间来估计总体参数的范围。
置信区间表示总体参数落在一定范围内的概率,通过选择合适的置信水平和估计方法,我们可以得到较为准确的参数估计结果。
3. 假设检验假设检验是根据样本数据,对总体参数的某个假设进行推断和判断。
通过设置假设和选择适当的检验统计量,我们可以判断总体参数的真实情况。
假设检验可用于检验差异、关联和拟合等方面的假设。
三、误差与效应1. 抽样误差抽样误差是指抽取样本所引入的随机误差,它是由样本本身的随机变动和抽样方法的影响所引起的。
抽样误差是不可避免的,但可以通过增大样本容量和改善抽样方法来减小。
2. 非抽样误差非抽样误差是指除抽样误差外的其他误差源所引起的误差。
第四章抽样理论和参数估计(精)第四章抽样理论和参数估计知识引入1970 年美国首次进行征兵抽签,组织者将19-25岁的适龄青年按年龄分组,使用编号001-366 的等重量塑料球,001代表1月1日出生者,031代表1月31日…,366代表12月31日。
然后将所有塑料球放入滚筒中混合抽取号码,每组抽中号码对应生日的青年依次应征,直到人数足够为止。
之后,有记者指出此次抽签产生了严重的偏差,他们注意到,年末生的人似乎倾向于被抽到较前面的征兵顺序。
其结果就是一堆12 月份生的人去了越南战场。
后来,经过统计学家的分析,发现这种“偏差”确实存在;经过分析终于找到了原因,原来代表生日的号码塑料球是一次按一整个月份装入滚筒中混合的,加上又没有均匀混合;于是1 月份的生日容易在滚筒底下,12 月份的是最后才装进去,容易在上面。
在抽样术语中,经常能够听到“随机抽样”、“随机选择”这样的表述,“随机性”原则其实保证了总体中的每个个体被抽中的概率相等,因而被认为是保证各种抽签、选择过程公平、公正的一个基本手段。
上述抽样就没有保证这种随机性。
在本章中,我们还会看到,作为推断的基础,我们直接研究的样本是否“得当”对研究总体十分关键,可以通过一定的抽样设计制定科学、合理、公正的抽样方法。
如上述随机性原则可以保证抽样可以使得样本和总体有相同的内部结构,也就是说有最大的可能使总体的某些特征在样本中得以再现。
本章在介绍必要的抽样概念和抽样方法基础上,重点介绍抽样分布理论,并对参数估计进行简要介绍。
第一节抽样和常用抽样方法一、简单随机抽样抽样(sampling)或取样,在整个研究过程中位于数据收集之前,恰当的抽样设计是保证样本代表性的关键环节,是利用样本对总体进行假设检验或参数估计的基础。
抽样涉及到的一些基本概念在绪论中均已介绍。
一个合理可行的抽样设计,一方面要求针对调查或实验研究的具体情况选择一种适宜抽样方法;另一方面应该根据调查研究所要求的精确度及经费状况确定样本容量。
第四章重点知识本章核心概念:1、差异量数分为:绝对差异量数和相对差异量数2、绝对差异量数:标准差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
方差:标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数四分差:四分差通常用符号Q来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。
3、相对差异量数:差异系数:差异系数,又称变异系数、相对标准差等,使一组数据标准差与平均数的比率。
通常用符号CV表示。
4、另外,本章还讲到相对地位量数:标准分数,百分等级。
标准分数:它是一个数与平均数之差除以标准差所得的商数,它无实际单位。
百分等级:指任意分数在整个分数分布中所处的百分位置。
本章重点难点:差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
知识要点详情:一、标准差1、概念及计算公式方差的平方根,用s或SD表示,若用σ表示,是指总体的标准差。
方差与标准差是最常用的描述次数分布离散程度的差异量数。
2、标准差的适用条件(1)与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合(2)用算术平均数描述时,其离散程度宜用标准差描述;(3)计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;(4)在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
3、标准差的计算方法(1)基本公式法(2)原始数据法(3)分组资料标准差的计算方法(4)由各部分的标准差合成总标准差的计算方法4、方差和标准差的意义方差与标准差是表示一组数据离散程度的最好的指标。
其值越大,说明离散程度大,其值小说明数据比较集中,它是统计描述与统计分析中最常应用的差异量数。
它基本具备一个良好的差异量数应具备的条件:①反应灵敏;②有一定的计算公式严密确定;③容易计算;④适合代数运算;⑤受抽样变动的影响小;⑥简单明了。
第四章抽样理论与参数估计第一节抽样理论的基本知识
分层抽样,又叫分层随机抽样,这种抽样方法是按照总体已有的某些特征,承认总体中已有的差异,按差异将总体分为几个不同的部分,每一部分称为一个层,在每一个层中实行简单随机抽样。
它充分利用了总体的已知信息,因而是一种非常适用的抽样方法,其样本代表性及推论的精确性一般优于简单随机抽样。
分层的原则是层与层之间的变异越大越好,各层内的变异要小。
试述分层抽样的原则和方法?
分层抽样是按照总体上已有的某些特征,将总体分成几个不同部分,在分别在每一部分中随机抽样。
分层的总的原则是:各层内的变异要小,而层与层之间的变异越大越好。
在具体操作中,没有一成不变的标准,研究人员可根据研究需要依照多个分层标准,视具体情况而定。
⑷两阶段随机抽样
两阶段随机抽样首先将总体分成M个部分,每一部分叫做一个"集团"(或"群"),第一步从M个集团中随机抽取m个"集团”作为第一阶段样本,第二步是分别从所选取的m个"集团”中抽取个体(g构成第二阶段样本。
一般而言,两阶段抽样相对于简单随机抽样,标准误要大些,但是,两阶段抽样简便易行,节省经草贼,因而它是大规模调查研究中常被使用的抽样方法。
例如,如果我们要了解全国城市初中二年级学生的身高,第一步我们可以从全国几百个城市中随机抽取几十个城市作为第一阶段的样本。
第二步,在第一阶段随机抽取出来的城市中再随机抽取初中二年级的学生。
(二)非旃抽样
非概率抽样不是完全按随机原则选取样本,有方便抽样、判断抽样。
方便抽样是由调查人员自由、方便地选择被调查者的非随机选样。
判断抽样是通过某些条件过滤,然后选择某些被调查者参与调查的抽样法。
当采取非概率抽样的方法选取样本时,研究者要说明采用此种方取样的原因以及对研究结果可能造成的影响。
第二节抽样分布[统计量分布、基本随机变量函数的分布]
总体:又称母全体、全域,指具有某种特征的一类事物的全体。
总体是所欲研究的某一类对象的全体,总体的大小随研究的问题而改变。
构成总体的个体不限于人或物,也可指心理活动,例如推理能力、学习方法、反应时间等。
样本:从总体中抽取的一部分有代表性的个体,称为总体的一个样本。
在教育与统计心理学研究中,一般只能对样本进行观测和研究,然后推知总体。
这样,就必须保证样本的代表性,使样本在相当程度上能够反映总体的情况。
样本容量(样本大小):通常用n来表示,是指实验中被试的
,或一个观测重复的次数。
在心理与教育统计学中, 把样本容量超过30的样本称为大样本,等于或小于30的样本称为小样本。
样本越大,对总体的代表性就越强。
抽样:见本笔记首页.
统计分布:在统计分组的基础上,把总体的所有单位数按组归并排列,形成各组单位数在总体中的分布,称统计分布。
总体分布:总体分布就是指总体中各元素的观察值所形成的分布。
设X为总体的随机变量,总体分布就是指X的根率分布。
样本分布:是指一个样本中各观察值的分布,它与抽样分布不同。
如果从总体中抽取一个容量为n的样本,那么这n个观察值的分布就是样本分布。
抽样分布:又称为基本随机变量函数的分布,样本统计量的概率分布为抽样分布,是利用各种样本统计量对总体参数进行推断的基础,
它是推论统计的重要依据。
在科学研究中,一般是通过一个样本进行分析,只有知道了样本统计量的分布规律,才能依据样本对总体进行推论,也才能确定推论正确或错误的概率是多少。
常用的样本分布有平均数及方差的分布。
常见的抽样分布如正态分布,T分布,卡方分
一、中心极限定律
当总体服从正态分布N(U.Q2)H.来自该总体的所有容量为n的样本的均值又也服从正态分布,文的数学期望(即平均数)
为H,方差为。
2加。
即x〜N(H,出)。
二.样本平均数分布(一级)。