1基本概念与次数分布
- 格式:ppt
- 大小:145.00 KB
- 文档页数:16
《心理统计学》总复习要点第一章、第二章基本概念及次数分布表第一节基本概念一、基本概念1.连续变量与离散变量(不连续变量)变量分为连续变量与离散变量(不连续变量)。
连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。
不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。
是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。
2.总体、样本、个体总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。
二、测量水平心理测量的工具一般可以分为四种水平,它们是由测量工具——量尺的水平决定的,量尺也称为尺度。
(一)量尺(Ratio Measurement)用这样的量尺测量出的数据,可以进行加、减、乘和除运算。
这种测量水平的数据特征是有相等单位和绝对零点。
用这种量尺测量得到的数据变量为比率(或等比)变量。
(二)等距量尺(Interval Measurement)只有相等单位,没有绝对零点,这种测量工具称为等距量尺。
等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。
但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。
用这种量尺测量得到的数据变量为等距变量。
(三)顺序量尺(Ordinal Measurement)顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。
用这种量尺对研究对象进行测量,只能给对象排个顺序。
顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。
如有必要的话,只能进行不等式运算。
用这种量尺测量得到的数据变量为顺序变量。
(四)分类量尺(Nominal Measurement)分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。
即无大小之分,也无等级之分。
统计学原理一、绪论1、统计学:是一门处理数据的方法和技术的学科,也是一门研究“数据”的科学,任务是如何有效地收集、整理和分析这些数据,探索数据内在的数量规律性,对所观察的现象做出推断或预测,直到为采取决策提供依据。
研究对对象的特点:总体性、数量性、客观性、数据的随机性、范围的广泛性。
2、基本概念:①统计总体和总体单位统计总体:统计所需要研究的客观事物的全体,称为统计总体,简称总体,通常所说的总体,都是以客观存在的实体为单位组成的总体,在推断统计中,又常把所有观察值的集合定义为总体。
统计总体的形成具备三个条件:客观性、同质性、差异性统计总体按总体单位是否有限分为两种:有限总体和无限总体。
总体单位:组成总体的每一个事物,成为总体单位,简称个体。
统计总体与总体单位不是固定不变的,总体与总体单位具有相对性,随研究任务的改变而改变。
②标志和指标标志:说明总体单位特征的名称。
标志按表现形式有品质标志和数量标志两种。
标志的具体表现是在标志名称后面所表明的属性或数值。
数量标志的数值表现称标志值。
指标是统计指标的简称,两种理解:一种认为统计指标是反映总体现象数量特征的概念,这种理解适用于统计理论和统计设计;另一种认为统计指标是反映总体现象数量特征的概念和具体数值,这种理解适用于实际统计工作。
指标和标志的关系:区别:ⅰ指标说明总体特征,标志说明总体单位特征。
ⅱ标志有不能用数值表示的品质标志和能用数值表示的数量标志两种;指标必须是能用数值表示的。
联系:有许多统计指标的数值是直接从总体单位的数量标志值汇总而来的;指标与数量标志间存在转化关系。
③变异与变量变异:可变标志的属性或数值表现在总体各单位间存在的差异,统计上称为变异。
在一个总体中,不管是品质标志或数量标志,当某个标志在每个总体单位上具体表现都相同,称此标志为不变标志。
当某标志在每个单位的具体表现不同时,称为可变标志,又称变异标志。
变量:变异标志又称为变量,即泛指一切可变标志,既包括可变数量标志,也包括可变品质标志。
统计师考试《初级基础》考点:统计分布统计师考试《初级基础》考点:统计分布按照《关于印发《统计专业技术资格考试暂行规定》及其实施办法的通知》(国统字[1995]46号)文件有关规定,从1995年起统计专业技术资格实行全国统一考试制度。
店铺整理了相关的内容,欢迎欣赏与借鉴。
一、统计分布的概念1、概念:(识记)统计分布又称次数分布,也称分配数列。
是在分组基础上,将总体的所有单位按组进行归并排列,形成总体中各个单位在各组间的分布。
统计分布的实质是把总体的全部单位按某标志所分得组进行分配所形成的数列。
2、统计分布的2要素:(1)总体按某标志所分的组。
(2)各组的单位数(次数)。
3、统计分布的种类:(识记)(1)对称分布:集中位置在中间,左右两侧频数大体对称。
(2)偏态分布:集中位置偏向一侧,左右两侧频数不对称。
4、(识记)分配数列分为品质分配数列(按品质标志分组)和变量分配数列。
变量数列分为单项式数列和组距式数列。
组距式数列又分为等距式分组和不等距式分组,还可以分为开口式分组和闭口式分组。
对离散型变量数列,如果变量值数目不多,则可编成单项式;如果变量值数目很多,则应编成组距式。
连续型变量数列一般是组距式的。
二、考点练习题【2011 判断】对于变量值数目很少的离散变量数列应以组距式而非单项式进行编制。
( )【答案】×【例单选】分配数列包含两个组成要素,即( )。
A、分组标志和组距B、分组和次数C、分组标志和次数D、分组和表式【答案】B三、组距式变量数列编制的基本概念(一)组距和组数(识记)组距:是指每个组变量值中最大值与最小值之差。
即组距=组上线-组下限。
组上限:每组变量值中的最大值。
组下限:每组变量值中的最小值。
(识记)组数:组距式变量数列编制过程中分组个数。
组数与组距成反比关系。
同一变量数列中,组数越多,则组距越小;反之,组数越小,则组距越大。
【2011 单选】组距的正确计算公式是( )。
A、组距=上限-下限B、组距=下限-上限C、组距=(上限-下限)∕2D、组距=(上限+下限)∕2【答案】A【2012 判断】在同一变量数列中,组数越多,则组距越大;反之,组数越少,则组距越小,两者成正比关系。
B比例数据——既表明量的大小,也有相等的单位,同时还具有绝对零点。
如身高、体重、反应时等。
可进行加减乘除运算。
变量:是试验、观察、调查中想要获得的数据,是一种特征或条件,其本身是变化的或对不同的个体有不同的值。
统计观察的指标都是具有变异的指标。
当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
标准差:方差的平方根.作为样本统计量用符号s表示,作为总体参数用符号σ表示。
性质①每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差②每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数意义:方差与标准差是表示一组数据离散程度的最好指标,它们是统计描述与统计推断分析中最常用的差异量数优点有:反应灵敏、计算严谨、计算容易、适合代数运算、受抽样变动影响小、意义简单明了变异系数:当遇到下列情况时,不能用绝对差异量来比较不同样本的离散程度,而应当使用相对差异量数,最常用的就是差异系数。
①两个或两个以上样本所使用的观测工具不同,所测的特质相同②两个或两个以上样本使用的是同种观测工具,所测的特质相同,但样本间水平差异较大百分位差:指量尺上的一个点,再次点以下数据的个数占全部数据个数的百分比百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比,所对应的分数.百分位数和百分等级是同一操作定义的两端。
当我们求累计次数占总体的百分比是,所对应的分数和百分比的值分别为百分位数和百分等级。
百分等级:常模团体中低于该分数的人所占总体的百分比.百分等级一定要对应分数区间的精确上限。
百分等级和百分位数都可以由已知数据用差值法求解。
标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z 分数.离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置。
性质①Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量②一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零③原始数据的Z分数的标准差为1④若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布优点①可比性——不同性质的成绩,一经转换为标准分数,就可在同一背景下比较②可加性——不同性质的原始数据具有相同的参照点,因此可相加③明确性——知道了标准分数,利用分布寒暑表就能知道其百分等级④稳定性——转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样应用①比较几个分属性质不同的观测值在各自数据分布中相对位置的高低②计算不同质的观测值得总合或平均值,以表示在团体中的相对位置③若标准分数中有小数、负数等不易被人接受的问题,可通过 Z'=aZ+b 的线性公式将其转化成新的分数(如韦氏成人智力量表)标准误:样本平均数分布的标准差。
一、统计学的性质统计学的概念:以搜集、整理、分析或推断数据,并以此为依据对所研究对象做出判断或决策的方法科学论。
二、统计学的分类理论统计学研究如何对客观现象的数量进行计量、观测、概括和表述,是统计学的基础和统计研究工作的第一步,内容包括统计指标及其设计、统计调查、统计整理、统计图表、集中趋势测度、离散程度测试、统计指数和时间序列常规分析等理论方法。
推断统计学是现代统计学的核心内容,它以概率论为理论依据,利用部分数据对总体数据的某些性质或数量特征进推断和检验。
理论统计学和应用统计学的关系:理论统计学所提出的科学的数量方法为应用统计学研究提供了理论依据和条件,而应用统计学的发展又可进一步改进、完善和发展理论统计学所提出的数量方法。
第二节统计学的基本概念一、总体和个体总体:构成统计活动研究对象的全部事物的整体为总体(有限总体、无限总体)个体:总体中每个个体事物。
总体容量:总体中全部个体事物的数量称为总体的容量。
统计总体根据统计研究的目的来确定。
二、样本样本是指从总体中随机抽取出来,并作为其代表的那一部分个全所组成的子集。
样本的特点:每个个体必须取自于总体的内部,从一个总体可以抽取许多个不同的样本,样本是总体的代表,样本的随机性。
三、变量变量:客观现象的特征取值或类别在一个以上者均为变量四、指标及其测度用来测度研究对象某种特征数量的概念称为统计指标,简称指标。
第三节统计指标体系及其设计一、统计指标体系的概念反映总体及其所含个体的各个方面特征数量的一系列相互联系、相互补充的统计指标所形成的体系,称为统计指标体系。
二、统计指标体系中指标的分类三、统计指标体系设计的内容:1、设置框架2、确定内涵和外延3、确定计量单位4、确定计算方法四、统计指标体系设计的原则统计指标体系设计的原则:目的性、科学性、可行性、联系性第二章数据的调查与整理第一节数据调查的方式与程序一、数据调查的方式数据调查的概念:根据研究目的要求,对总体中个体的相应特征进行观测取得数据的工作过程。
第四节 次数分布的特征上节阐述了统计分组的意义和方法,以及分配数列的编制。
分配数列是反映总体中各总体单位在各组的分配状况。
总体单位在各组的分配,又称为次数分布。
本节将进一步阐述次数分布的特征。
由于社会现象性质不同,各种统计总体都有不同的次数分布,形成各种不同类型的分布特征。
研究各种类型的次数分布特征,对于准确认识不同社会经济性质的变量在形成总体数量表现中的作用,有着重要意义。
一、次数分布的表示方法 (一)表示法即用统计表来表示次数分布,并可列成累计次数。
例如,某班学生统计学考分的次数分布如表3-8所示。
表3-8中:70~80分组的人数11人,比率为27.5%,表示考分在70~80分组的人数为11人,占全班学生人数的27.5%。
向上累计数次数和比率,是将人数和比率由变量值低的组向变量值高的组累计,各累计数的意义为各组上限以下的累计次数或累计比率。
向下累计数次数和比率,是将各组次数和比率由变量值高的组向变量值低的组累计。
各累计数的意义是,各组下限以上的累计次数和累计比率。
表3-8 某班学生统计学考分次数分布 考 分次 数向上累计向下累计人数 (人) 比 率 (%) 人 数 (人) 比 率 (%) 人 数 (人) 比 率 (%)50~60 60~70 70~80 80~90 90~100 2 7 11 12 8 5.0 17.5 27.5 30.0 20.0 2 9 20 32 40 5.0 22.5 50.0 80.0 100.0 40 38 31 20 8 100.0 95.0 77.5 50.0 20.0合 计40100.0------(二)图示即用统计图形来表示次数分布的方法。
常用的有直方图、折线图和曲线图三种。
1.直方图即用直方形的宽度和高度来表示次数分布的图形。
如将上表资料绘制直方图如图3-1。
绘制直方图时,横轴表示各组组距,纵轴表示次数(一般标在左方)和比率(一般标在右方),没有比率的直方图只保留左方次数。
次数分布名词解释次数分布是指在一定时间内某一事件或活动发生的次数的分布情况,它可以帮助我们了解该事件或活动的发生规律和特点。
以下是次数分布相关的名词解释:一、概念解释1. 频次:指某一事件或活动在一定时间内发生的次数。
2. 频数:指某一特定取值在样本中出现的次数。
3. 频率:指某一事件或活动在一定时间内平均每单位时间内发生的次数,可用公式f=n/t计算,其中n为频次,t为时间。
4. 累积频率:指某一取值的频数或频率和先前所有取值的频数或频率的和。
二、常见分布类型1. 均匀分布:指事件或活动在一定时间内发生的次数相对平均,呈直线分布。
2. 正态分布:指事件或活动在一定时间内发生的次数呈钟形曲线分布,且符合正态分布的数学规律。
3. 泊松分布:指在时间或空间单位内事件或活动发生的次数呈随机分布,且发生率很低,不连续或不同步。
4. 二项分布:指在n次伯努利试验中,成功的次数符合二项分布的概率分布规律,成功或失败的概率相等。
5. 伽马分布:指由一系列独立的泊松过程所组成的常见分布类型之一。
三、分布参数解释1. 均值:指次数分布的期望值,即事件或活动在一定时间内平均发生的次数。
2. 方差:指次数分布的离散程度,即事件或活动在一定时间内发生次数与期望次数之差的平方的平均值。
3. 标准差:指次数分布中各次数离均值差的平方和的平均值的算术平方根。
4. 偏度:指次数分布的偏斜程度,反映分布曲线左右对称程度的指标。
5. 峰度:指次数分布的尖顶程度,反映分布曲线的陡峭程度和尖扁程度。
综上所述,次数分布是指在一定时间内某一事件或活动发生的次数的分布情况,它反映了该事件或活动的发生规律和特点。
我们可通过某些分布类型和分布参数,对某一事件或活动的发生进行分析和预测,提高我们对其的认识和 mastery。
第三章次数分布第一节次数分布的编制与显示一、次数分布的概念(识记。
重点)概念:观测变量的各个不同数值及每个不同数值的出现次数的顺序排列,称为变量的次数分布。
列出观测变量的次数分布是展示统计活动所取得数据的分布状况的最基本方法,也是描述观测数据状况的首要方法。
得出次数分布的方法:(1)如果所研究的总体是有限总体,并且对总体中的每个个体都进行了观测,如在现场调查中对所研究总体中的全部个体进行了普查,那么人们就可以得到总体中全部个体的观测变量值,从而就可以列出观测变量总体的次数分布。
(2)如果使用列出总体次数分布的方法,将样本中观测变量的各个不同数值及每个不同数值的出现次数顺序列出,就得到了观测变量的样本次数分布。
观测变量的样本次数分布是其总体次数分布的一个代表,如果总体的次数分布未知,那么就可以用样本次数分布对总体的次数分布进行估计。
次数分布的作用:由于观测变量的次数分布包含了观测变量在所研究总体或所取得样本中取值的全部信息,因此,列出观测变量的次数分布就是进行统计分析推断的基础。
有了观测变量的次数分布,就可以根据这一次数分布对观测变量的各种分布特征进行描述和分析,如分析观测变量取值的分布中心和离散程度,从而揭示出所研究总体或所取得样本的各种特征。
二、次数分布表及其编制概念(识记):观测变量的次数分布通常用统计表来表示,这种表示观测变量的次数分布的统计表就称为次数分布表。
一个次数分布表必须由两列或两行构成,一列或一行是观测变量的各个不同数值;另一列或另一行是观测变量的各个不同数值出现的次数。
顺序一一列出的观测变量的每一个不同取值就形成了一个组,称为次数分布表的组变量值;而每个组变量值的次数则是该组变量值在总体或样本中出现的次数,称为组次数;各组次数与总次数的比值,称为组比重或组频率。
一个次数分布表,可以列出各个组变量值和相应的各组次数,也可以列出各个组变量值和相应的各组频率,还可以同时列出各个组变量值和相应的各组次数以及各组频率。