当前位置:文档之家› 心理统计公式汇总

心理统计公式汇总

心理统计公式汇总
心理统计公式汇总

心理统计公式汇总

心理学考研分为:心理学学硕和心理学专硕(又称“应用心理硕士”、“心理专硕”)。心理学学硕和心理学专硕考试科目不同,但是都会考察到心理学统计,(部分自主命题院校不考察心理学统计,考生需要提前了解院校信息。)无论是对本专业还是跨专业心理学考研的同学而言,心理学统计始终是比较难懂的一块。博仁教育老师为考生分章节整理出心理学统计公式,方便考生进行复习与记忆。

第三章集中量数

1、几个集中量数的公式计算一览表

【组中值的计算】

第四章差异量数

第五章相关关系

ad

;或bc

第六章概率分布

1、几个基本概念

(1)概率:表明随机事件出现的可能性大小的客观指标。

(2)后验概率(统计概率):

先验概率(古典概率):

(3)概率分布:对随机变量取值的概率分布的情况用数学方法(函数)描述。

2、概率的基本性质:

※概率的公理系统:

任何一个随机事件的概率都是非负的;

在一定条件下必然发生的必然事件概率为1;

在一定条件下必然不发生的事件,即不可能事件的概率为0.

※概率的加法定理

※概率的乘法定理

3、概率的分布类型划分

4、几个重要分布

★正态分布

(1)特征:

①正态分布的形式是对称的,对称轴是经过平均数的垂线。

②正态分布的中央点即平均数最高,然后逐渐向两侧下降;曲线形式先向内弯,再向外弯,拐点位于正负1个标准差处,曲线两端向基线无线靠近,但不相交。

③正态曲线下面积为1。

④正态分布是一族分布。平均数决定其位置,标准差决定其形态。标准差越小,曲线越狭高。

⑤正态分布中各差异量数值间有固定比率。

⑥正态曲线下,标准差和概率(面积)有一定的数量关系。

(2)正态分布表的利用

①已知Z分数求概率p,即已知标准分数求面积。

②已知概率P求Z分数。

③已知概率或Z求概率密度y,即曲线的高。【直接查表即可。注意已知的y是位于中间部分,还是两尾。】

(3)次数分布是否为正态的检验方法

(4)正态分布理论在测验中的应用

①化等级评定为测量数据

②标准测验题目的难易度

③在能力分组或等级评定时确定人数

④测验分数的正态化

二项分布(贝努里分布)

(1)几个重要概念理解

二项试验:必须满足几个条件——任何一次实验恰好只有2个结果;共有n 次实验,n 是事先给定的一个正整数;某种结果出现的概率在任何一次实验中都是固定的。

二项分布:试验仅有两种不同性质结果的概率分布。(两个对立事件的概率分布)。

具体定义如下:设有n 次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p ,某事件不出

现的概率都是q,即(1-p ),则对于某事件出现X 次的概率分布为:(,,)x x n x

n b x n p C p q -=;

n !

!()!)

x n C x n x =

-

表示在n 次试验中有X 次成功,成功的概率为p 。 (2)二项分布的性质

① 二项分布是离散型分布,概率直方图是跃阶式。(p=q 与p ≠q ) ② 二项分布的平均数与标准差

当p ﹤q ,np ≥5,二项分布接近正态。此时有,μ=np ,e=npq (3)二项分布的应用

当p ﹤q ,np ≥5,二项分布接近正态。用其概率分布计算 当np <5,直接用二项分布函数计算

5、抽样分布一览表【样本分布:指的是样本统计量的分布。】

第七章 参数估计

1、几个重要概念

点估计、区间估计、置信区间、显著性水平(α)、置信度(置信水平即1-α)、 标准误(平均数的离散程度):X

σ

2、参数估计步骤总结

(1)分析条件,选择方法,计算样本统计量; (2)计算样本平均数的标准误;【是关键!!】

(3)确定显著性水平,求置信区间; (4)查找Z 值或t 值; (5)计算置信区间; (6)结果解释。 正态分布表:/2/2X X X Z X Z αασμσ-?≤≤+?或

(1)/2(1)/2X X X Z X Z αασμσ---?≤≤+?

T 分布表:/2/2X X X t X t αασμσ-?≤≤+?或(1)/2(1)/2t X X X X t αασμσ---?≤≤+? 3、参数估计一览表 2

χ

1122211222/21

2

1n n s F s s

ασσ--??

在1上下一定区间内

/2p SE α?p =x/n ,是总体比率

1122

p p q q +;置信区间为)在多大范围内可以认为是取自比率差为

第八章 假设检验

【假设检验】,即差异显著性的检验,包括总体和样本之间的差异以及样本和样本之间的差异。 1、几个重要概念

假设检验小概率原理、Ⅰ型错误&Ⅱ型错误、统计检验力(1-β)、双侧&单侧检验、 2、假设检验的步骤

①根据问题要求,提出H0和H1; ②选择适当的统计检验量; ③确定显著性水平α; ④计算检验统计量的值;(计算标准误,计算临界的Z 或t 值) ⑤做出决策; 5、假设检验一览表(4种主要的检验方法:Z 检验、t 检验、F 检验、2

χ检验)

5≤,直接查表二项分布置信上下界限1122p p q q +

步骤:①将实验结果整理成四格表,将其中前后两次不一致的项目的格内数字标以

第九章 方差分析

1、几个基本概念

【方差分析】即变异分析。本质仍然是假设检验。主要功能在于分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响。

【方差分析的要求】①总体分布呈正态;②每个实验组的方差齐性;③变异具有可加性;

【方差分析依据的基本原理】即方差(或变异)的可加性原则

【方差分析目的】通过F检验讨论组间变异在总变异中的作用,借以对两组以上的平均数进行差异检验。

【方差分析的步骤】

(1)齐性检验;(哈特莱最大F比率法)

(2)构建综合虚无假设;

(3)计算平方和;

(4)计算自由度;

(5)计算均方;

(6)确定检验统计量(计算F值);

(7)确定显著性水平的临界值(查F值表进行F检验);

(8)做出统计决断;

(9)陈列方差分析表

2、方差分析一览表

第十章 2χ检验

1、相关知识点

【2

χ检验】是对类别数据的检验,对数据总体的分布形态不做任何要求,实际上是一种非参数检验。处理的是一个因素两项或多项分类的【实际观察频数】与【理论频数】(即期望次数)是否一致。

【2χ的假设】

①分类相互排斥,互不包容;②观测值相互独立;(要求每个被试只有一个观测值) ③期望次数的大小;(每一个单元格中的期望次数至少在5个以上)

χ检验一览表2、2

心理统计学公式总结

心理统计学公式总结 一、集中量 1.算术平均数:X??X X??fXNNNi ?n1)2fmd? 2.中位数:Md?Lmd?( 3.众数:M??3Md?2X 4.加权算术平均数:XW? 5.几何平均数:Xg? 6.调和平均数:XH? 二、差异量 1.四分差:QD?N?WX ?W X1X2?XN N1?XQ3?Q1 2 2X?X?2.平均差:MD?N3.标准差:?X?? N24.方差:?2X? ?N5.差异系数:CV??XX100% 6.百分等级分数:PR??Fb???f(X?Lb)?100?N i?7.标准分数:Z? X?X?X 三、相关量1.积差相关系数:r??XY?nXY n?x?y6?D2n(n2?1) 2.斯皮尔曼等级相关系数:rR?1?2?23.肯德尔和谐系数:rW? 式中:SSR??R? 123nK(n?n)12SSR4.点二列相关系数:rpb?Xp?Xq?tpq 5.二列相关系数:

rb?Xp?Xqpq ?tY6.多系列相关系数:rs??[(Y?Y)X] (Y?Y)??pLH2LHt7.四分相关系数:rt?cos(180?bc1?ad) 8.Φ相关系数:r??ad?bc(a?b)(a?c)(b?d)(c?d) 9.列联相关系数:c? 四、推断统计?2 N??2XXn?X1.二项分布概率:P?Cpq n2.二项分布平均数:??np 3.二项分布标准差:??npq Ne12??(X??)22?24.正态分布曲线:Y??2? 5.标准正态分布曲线:Y?e?Z22 6.平均数抽样分布标准误:?X??n??Xn?1 五、总体平均数的显著性检验 1.?已知:Z?X??? nX??2.?未知但n>30:Z??X n?1 3.?未知但n≤30:t?X???Xn?1 六、平均数差异的显著性检验 1.相关大样本:Z?X1?X2?2X1??2X2 ?2r?X1?X2n?1 df?n?1 2.相关小样本:t?X1?X2?2X1??2X2?2r?X1?X2n?13.独立大样本:Z?X1?X2?2X1n14.独立小样本:t???2X2

心理统计学公式

若n为奇数,则Md为第「个数 2 X n X n 1 若n 为偶数,则Md 2- 2 b.有重复数据 b1.重复数没有位于数列中间 方法与无重复数一样 b2.重复数位于数列中间若重复数的个数为奇数若重复个数为偶数 先将数据从小到大(从大到小)排列 三、众数 a.皮尔逊经验公式:分布近似正态探M。:3Md -2X 算术平均数、中位数、众数三者的关系探 在正态分布中:X=Md=M O 四分位差:a未分组数据Q =Q^ Q1 2 b分组数据2 f——Xi Qi = 1* --------- j------ X i 二?平均差— 1. 原始数据计算公式:氷D _》X_X n If Xc-乂2. 次数分布表计算公式:AD = ----------------- n 三.方差和标准差的定义式:探 S2 原始数据导出公式 、算术平均数 1.原始数据计算公式探 X i n 1 X X n 2.简捷公式 1—— X = AM x' n 、中位数(中数) 1.原始数据计算法探 a.无重复数据一.全距R (又称极差):探R = Xmax — Xmin P 百分位数的计算方法:I Pp为所求的第P个百分位数 Lb为百分位数所在组的精确下限 f为百分位数所在组的次数 Fb为小于Lb的各组次数的和 N为总次数 i为组距 百分等级:P R -10°F b f(x 一Lb) R n [ b i 」 在负偏态分布中:X ::: Md ::: M O 四、其它集中量数 1. 加权平均数(Mw)探 W t X, + Xj + - + W,X n 2. 几何平均数(Mg)探 M g 7 X i X2 X n 3、调和平均数 (MH)____________ 1 丄(丄+丄』 N V X1X2X3X4 'X i S2 1X 2 次数分布表计算公式 S2 、fg-X)2 n 导出公式 、2 If X c2代f X c f > = - n i n 丿 If X f(X ci-X)2 n 2 在正偏态分布中: X Md M O

统计学期末复习-公式汇总

统计报表 专门调查 普查 抽样调查 典型调查 重点调查 按调查的组织方式不同分为 按调查时间是否连续分为 按调查单位的范围大小分为 全面调查 非 全面调查 一次性调查 经 常性调查 统计学复习 第一章 1.“统计”的三个涵义:统计工作、统计资料、统计学 2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系; 统计资料和统计学是实践与理论的关系 3.统计学的特点:数量性,总体性,具体性,社会性(广泛性) 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。) 6.标志:总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩 B 数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高 指标:反映社会经济现象总体数量特征的概念及其数值。 指标名称体现事物质的规定性,指标数值体现事物量的规定性 第二章 1.统计调查种类 2.统计调查方案包括六项基本内容: 1)确定调查目的;(为什么调查) 2)确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位) 填报单位——报告调查内容,提交统计资料 3)确定调查项目、拟定调查表格;(调查什么) 4)确定调查时间和调查期限 5)制定调查的组织实施计划; 6)选择调查方法。

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

统计学知识点汇总情况

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。(4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析

描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用 对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 五、统计总体的特点 (1)大量性 大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求; (2)同质性 同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件; (3)变异性 变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。 六、标志与指标的区别与联系 ■区别: 标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。 标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。

应用心理学专业心理统计学作业及答案

《心理统计学》作业 本课程作业由两部分组成。第一部分为“客观题部分”,由15个选择题组成,每题1分,共15分。第二部分为“主观题部分”,由绘制图表题和计算题题组成,共15分。作业总分30分,将作为平时成绩记入课程总成绩。 一、选择题(每题1分) 1 按两个以上品质分组的统计表是:D A 简单表 B 相关表 C 双向表 D 复合表 2 若描述统计事项随时间的变化其总体指标的变化趋势,应该使用:C A 次数分布多边图B依存关系曲线图 C 动态曲线图D次数分布直方图 3 按照数据的获得方式,找出下列数据中与其他不同类型的数据:D A 80斤 B 80升 C 80米D80条 4 测量数据的下实限是:D A B 10.005 C D. 5按测量数据实限的规定, 组限a~b的实际代表范围应是:D A 开区间 B 闭区间C左开右闭 D 左闭右开 6 绘制次数分布多边图时,其横轴的标数是:B A 次数B组中值 C 分数D上实限 7 编制次数分布表最关键的两个步骤是:A A 求全距与定组数 B 求组距与定组限 C 求中值与划记D记录次数与核对 8 将一组数据中的每个数据都加上10,则所得平均数比原平均数:A A 多10 B多,但具体多少无法知道 C 相等D多10 数据个数 9 已知有10个数据的平均数是12,另外20个数据的平均数是9,那么全部数据的平均数应为:B A 9 B 10 C 11 D 12 10 某校1990年在校学生为880人,1992年在校学生为1760人。那么从1990年到1992年在校人数平均增长率为:B

A % B % C 126% D 26% 11 可否用几何平均数求平均下降速度及平均下降率。A A 两者都可以 B 可以求平均下降速度但不能求平均下降率 C两者都不可以D可以求平均下降率但不能求平均下降速度 12 下面哪种情况用差异系数比较数据的离散程度比较适合D A 单位相同,标准差相差较大 B单位相同,标准差相差较小 C单位相同,平均数相差较小 D单位相同,无论平均数相差大小 13 一组数据44,45,48,52,60,64,65,89,83,65,87,66,67,81,80,68,79,72,79,73的四分差为:B A B 8.75 C D 62 14 某班语文期末考试,语文平均成绩为82分,标准差为分;数学平均成绩为75分,标准差为分;外语成绩为66分,标准差为8分,问哪一科成绩的离散程度最大C A 语文 B 数学 C 外语 D 无法比较 15某校抽取45名五年级学生参加市统一组织的数学竞赛,成绩如下表: 问用什么作为起差异量的代表值合适B A 标准差 B 四分差 C 差异量数D标准分数 二、制表绘图题(每题3分)

心理统计学公式

第三章集中量数 一、算术平均数 1.原始数据计算公式※ 121 1n n i i X X X X X n n =+++==∑ 2.简捷公式 二、中位数(中数) 1. 原始数据计算法※ a. 无重复数据 b.有重复数据 b1.重复数没有位于数列中间 方法与无重复数一样 b2.重复数位于数列中间 若重复数的个数为奇数 若重复个数为偶数 先将数据从小到大(从大到小)排列 三、众数 a. 皮尔逊经验公式:分布近似正态※ 算术平均数、中位数、众数三者的关系※ 在正态分布中: 在正偏态分布中: 在负偏态分布中: 四、其它集中量数 1. 加权平均数(Mw)※ 2. 几何平均数(Mg)※ 3、调和平均数(MH) 第四章离散量数 一.全距 R (又称极差):※ R =Xmax -Xmin 百分位数的计算方法: Pp 为所求的第P 个百分位数 Lb 为百分位数所在组的精确下限 f 为百分位数所在组的次数 Fb 为小于Lb 的各组次数的和 N 为总次数 i 为组距 百分等级: 四分位差:a 未分组数据 b 分组数据 二.平均差 1. 原始数据计算公式:※ 2. 次数分布表计算公式: 三.方差和标准差的定义式:※ 原始数据导出公式 次数分布表计算公式 导出公式 个数为第 则为奇数若2 1 ,+n Md n 2 ,1 22 ++= n n X X Md n 则为偶数若X n X ∑=1' 1x n AM X ∑+=X Md M o 23-≈O M Md X ==O M Md X >>O M Md X <

医学统计学分析基本思路指南

医学统计学分析基本思路指南 医学统计学的学习一定要以理解为主。对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。 更实际的分析思路是: (1)先确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t检验、方差分析、χ2检验、非参数检验等。二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。 (2)明确数据您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书类型,根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。 (3)选定统计方法后,需要利用统计软件具体实现统计分析过程。SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。 (4)统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计学结论不同于专业结论,最终还需要结合实际做出合理专业结论。下面是本人简单总结的常用方法的选择,可供读者参考。

心理统计公式汇总

心理统计公式汇总 心理学考研分为:心理学学硕和心理学专硕(又称“应用心理硕士”、“心理专硕”)。心理学学硕和心理学专硕考试科目不同,但是都会考察到心理学统计,(部分自主命题院校不考察心理学统计,考生需要提前了解院校信息。)无论是对本专业还是跨专业心理学考研的同学而言,心理学统计始终是比较难懂的一块。博仁教育老师为考生分章节整理出心理学统计公式,方便考生进行复习与记忆。 第三章集中量数 1、几个集中量数的公式计算一览表

【组中值的计算】 第四章差异量数

第五章相关关系

第六章概率分布 1、几个基本概念 (1)概率:表明随机事件出现的可能性大小的客观指标。 (2)后验概率(统计概率): 先验概率(古典概率): (3)概率分布:对随机变量取值的概率分布的情况用数学方法(函数)描述。 2、概率的基本性质: ※概率的公理系统: 任何一个随机事件的概率都是非负的; 在一定条件下必然发生的必然事件概率为1; 在一定条件下必然不发生的事件,即不可能事件的概率为0. ※概率的加法定理 ※概率的乘法定理 3、概率的分布类型划分

4、几个重要分布 ★正态分布 (1)特征: ①正态分布的形式是对称的,对称轴是经过平均数的垂线。 ②正态分布的中央点即平均数最高,然后逐渐向两侧下降;曲线形式先向内弯,再向外弯,拐点位于正负1个标准差处,曲线两端向基线无线靠近,但不相交。 ③正态曲线下面积为1。 ④正态分布是一族分布。平均数决定其位置,标准差决定其形态。标准差越小,曲线越狭高。 ⑤正态分布中各差异量数值间有固定比率。 ⑥正态曲线下,标准差和概率(面积)有一定的数量关系。 (2)正态分布表的利用 ①已知Z分数求概率p,即已知标准分数求面积。 ②已知概率P求Z分数。 ③已知概率或Z求概率密度y,即曲线的高。【直接查表即可。注意已知的y是位于中间部分,还是两尾。】 (3)次数分布是否为正态的检验方法 (4)正态分布理论在测验中的应用 ①化等级评定为测量数据 ②标准测验题目的难易度 ③在能力分组或等级评定时确定人数 ④测验分数的正态化 二项分布(贝努里分布) (1)几个重要概念理解

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

心理统计公式汇总

心理统计公式汇总 第三章集中量数1、几个集中量数的公式计算一览表 平均数(M) 算术平均数 (M) 未分组:1 = n i i X X n = ∑ 分组数据:i ci i f X M f ? = ∑ ∑ 加权平均数 (单位权重不相 等的情况) i i i W X Mw W ? = ∑ ∑ 几何平均数 (解决增长率的 问题) lg lg i X Mg N = ∑ ;1 1 N N X Mg X - =; 1 ,, N N Mg X X = 调和平均数 (解决速度的问 题) 倒数的算术平均数的倒数: 1 H i N M X = ∑ ; 中数(Md) 未分组: 无重复值 N=奇数:中数即 1 2 N+ 位置的数; N=偶数:中数即中间两个数的平均数; 有重复值 若重复值没有位于中间,则求法与无重复值时 一致; 若重复值位于中间,则(P62): 图示: 思路:①连续性数字,不是一个点,是一个区 间; ②有几个重复的,则将组距除以几; 分组d() 2 b b Md N i M L F f =+-? 众数(Mo) 1、直接观察法。 2、公式法。(皮尔逊经验法&金式插补法) ①皮尔逊经验法:o32 M Md M =-; ②金式插补法:a b a b f Mo L i f f =+? + ; 【组中值的计算】

第四章 差异量数 百分位数(点) 100b p b P N F P L i f ?-=+?; 百分等级 未分组:(10050) 100R R P N -=- 分组:()100 []b R b f X L P F N i -= ?+ 四分位差 31 = 2 Q Q Q -; (Q3与Q1即P25与P75) 平均差 未分组:..i i X A D n n X x -= = ∑∑ 分组:..f x A D n = ∑;(IxI 为各组中点值对平均数离差的绝对值) 方差与 标准差 未分组:① 2 2 2 ()s X X N N x -= = ∑∑; ②原始数据代入:2 2 2 2 2 2 () ()s N N X X X X N N -= -= ∑∑∑∑ 分组: 2 2 2 ()c f X X f N N x s -= = ∑ ∑ 2 2 s ()f i N fd d N = -?∑∑ 总方差与总标准差: 2 2 2;()i i i i T i T i i N s N d s d X X N += =-∑∑∑ 标准差 的应用 差异 系数 100%s CV X = ? 标准 分数 X X x Z s s -= = 第五章 相关关系

统计学常用公式汇总情况

统计学常用公式汇总 项目三 统计数据的整理与显示 组距=上限-下限 a) 组中值=(上限+下限)÷2 b) 缺下限开口组组中值=上限-邻组组距/2 c) 缺上限开口组组中值=下限+1/2邻组组距 例 按完成净产值分组(万元) 10以下 缺下限: 组中值=10—10/2=5 10—20 组中值=(10+20)/2=15 20—30 组中值=(20+30)/2=25 30—40 组中值=(30+40)/2=35 40—70 组中值=(40+70)/2=55 70以上 缺上限:组中值=70+30/2=85 项目四 统计描述 i. 相对指标 1. 结构相对指标=各组(或部分)总量/总体总量 2. 比例相对指标=总体中某一部分数值/总体中另一部分数值 3. 比较相对指标=甲单位某指标值/乙单位同类指标值 4. 动态相对指标=报告期数值/基期数值 5. 强度相对指标=某种现象总量指标/另一个有联系而性质不同的现 象总量指标 6. 计划完成程度相对指标K = 计划数 实际数 =%%计划规定的完成程度实际完成程度 7. 计划完成程度(提高率):K= %10011?++计划提高百分数实际提高百分数 计划完成程度(降低率):K= %10011?--计划提高百分数 实际提高百分数

ii. 平均指标 1.简单算术平均数: 2.加权算术平均数 或 iii. 变异指标 1. 全距=最大标志值-最小标志值 2.标准差: 简单σ= ; 加权 σ= 成数的标准差(1) p p p σ=-3.标准差系数: 项目五 时间序列的构成分析 一、平均发展水平的计算方法: (1)由总量指标动态数列计算序时平均数 ①由时期数列计算 n a a ∑= ②由时点数列计算 在连续时点数列的条件下计算(判断标志按日登记):∑ ∑=f af a 在间断时点数列的条件下计算(判断标志按月/季度/年等登记): 若间断的间隔相等,则采用“首末折半法”计算。公式为: 1 212 11 21-++++=-n a a a a a n n Λ

心理统计常用公式总结

心理统计常用公式总结 1 、组数K (总体分布为正态)(N 为数据个数,K 取近似整数) 2 、算术平均数 3 、中数 4 、众数 5 、加权平均数 ,其中W i 为权数 ,其中为各小组的平均数,n i 为各小组人数 6 、几何平均数

,其中n 为数据个数,X i 为数据的值 7 、调和平均数 8 、方差与标准差 , 其中 9 、变异系数,其中S 为标准差,M 为平均数 10 、标准分数,其中X 为原始数据,为平均数,S 为标准差 11 、全距R =最大数-最小数 12 、平均差

13 、四分差 ,其中L b 为该四分点所在组的精确下限, F b 为该四分点所在组以下的累加次数, 和为该四分点所在组的次数,i 为组距,N 为数据个数 14 、积差相关 基本公式:,其中 , ,N 为成对数据的数目,S x 、S y 分别为X 和Y 的标准差 变形: 差法公式:

用估计平均数计算: 用相关表计算: 15 、斯皮尔曼等级相关 ,其中 D 为各对偶等级之差 直接用等级序数计算:,其中R X 、R Y 分别为二变量各等级数有相同等级时:

16 、肯德尔等级相关 有相同等级: 17 、点二列相关,其中是两个二分变量对偶的连续变量的平均数,p 、q 是二分变量各自所占的比率,p+q=1 ,S t 是连续变量的标准差 18 、二列相关 ,其中S T 与是连续变量的标准差与平均数,y 为P 的正态曲线的高度 19 、多系列相关

,其中P i 为每系列的次数比率,y 1 为每一名义变量下限的正态曲线高度,y h 为每一名义变量上线的正态曲线高度, 为每一名义变量对偶的连续变量的平均数,S t 为连续变量的标准差 20 、总体为正态,σ 2 已知: 21 、总体为正态,σ 2 未知: 22 、 23 、 24 、

心理统计学重要知识点

心理统计学重要知识点 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

《心理统计学》重要知识点 第二章 统计图表 简单次数分布表的编制:Excel 数据透视表 列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表 直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。 圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势; 第三章 集中量数 ● 集中趋势和离中趋势是数据分布的两个基本特征。 ● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。 ● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n x X i ∑ = Excel 统计函数AVERAGE 算术平均数的重要特性: (1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i (2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后, 那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中 位数上下的数据出现次数各占50%。 3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。

统计学公式汇总,推荐文档

第三章统计整理 第四章总量指标和相对指标

第五章平均指标和变异指标

= ∑(x -x)2 n :标准差 p:成数 2 :方差 标准差:开()根号 方差:不开()根号∑(x -x)2 f =∑f =p(1 -p) 2 =∑(x -x) 2 n ∑(x -x)2 f 2 =∑ f V = x V平均差系数

第六章动态数列

第七章统计指数

第八章 抽样调查 公式名称 数学公式 说明 2 n 平均数u = (1- ) x n N 不重复 1、不重置抽样比重置抽样多加个 (1 - n ),此项为修正系数。 N 2、公式中的标准差和成数 P 一般用样本的标准差 s 和成数 p 来代替。 抽样 成数: u = P (1 - P ) (1 - n ) p n N 抽样平均误差 平均数: u = x n 重复 成数: u = P (1 - P ) 抽样 p n 平均数: x - ? ≤ X ≤ x + ? x x 抽样极 重复抽样, ? = t x n ? = t P (1 - P ) ; p n 2 n 不重复抽样, ? = t (1- ) x n N ? = t P (1 - P ) (1 - n ) p n N 区间估计 限误差 成数: x - ? p ≤ X ≤ x + ? p 样本数的确定 平均数: n = t 22 x ? x 2 重复抽样 公式中的标准差和成数 P 一般用样本的标准差 s 和成数 p 来代替。 t 2 P (1 - P ) 成数: n p = ?2p

医学统计学公式总结

医学统计学公式总结-标准化文件发布号:(9556-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

一 资料的描述性统计 (一)算术均数(mean) (1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法): (二)方差(即标准差的平方) (三)变异系数 二 参数估计与参考值范围 (一)均数的标准误 (二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数) (四)总体均数的区间估计 (一 般要求 计算95%或99%的可信区间) (五)总体率的区间估计 n x n x x x x x n ∑= ++++= 321∑∑=++++++++= f fx f f f f x f x f x f x f x k k k 3213322111 ) (22 --=∑n x x s 222()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-= n s x t μ -= x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

(六)参考值范围估计 双侧1-a 参考值范围: s u x a 2/± 单侧1-a 参考值范围:s u x a ->或 s u x a +< (可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书) 三 T 检验与方差分析 (一)T 检验 (1)单样本T 检验 检验假设: (假设样本来自均数为0 u 的正态总体) 统计量t 值的计算: (2)配对T 检验 检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验 检验假设: 统计量t 值的计算: 0μμ=:H 1 ,/00-=-=-=n n s x s x t x νμμ0 210==-μμμ:H d d d t s μ-==1-=n ν2 10μμ=:H 2 1)()(2121x x s x x t ----=μμ221-+=n n ν? ?? ?+= -2 1121s s C x x )()(2 222112∑-∑+-= x x x x s C

现代心理与教育统计学课后题完整版78975

第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学?学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤? 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量?心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体? 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点

最新医学统计学公式总结

一 资料的描述性统计 (一)算术均数(mean) (1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法): (二)方差(即标准差的平方) (三)变异系数 二 参数估计与参考值范围 (一)均数的标准误 (二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数) (四)总体均数的区间估计 (一般要求 计算95%或99%的可信区间) (五)总体率的区间估计 (六)参考值范围估计 双侧1-a 参考值范围: s u x a 2/± 单侧1-a 参考值范围: s u x a ->或s u x a +< (可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书) 三 T 检验与方差分析 (一)T 检验 (1)单样本T 检验 n x n x x x x x n ∑= ++++= 321∑∑= ++++++++=f fx f f f f x f x f x f x f x k k k 3213322111 )(2 2--= ∑n x x s 22 2()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-=n s x t μ-=x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

检验假设: (假设样本来自均数为0 u 的正态总体) 统计量t 值的计算: (2)配对T 检验 检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验 检验假设: 统计量t 值的计算: 其中 两样本方差齐性检验 (即为两样本方差的比值) (二)单因素方差分析 SS MS F SS MS νν= = B B B W W W (1)完全随机设计资料的方差分析 这里 (T 即为该组数据之和) (2)随机单位组设计资料的方差分析 SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差 μμ=:H 1 ,/0 0-=-=-= n n s x s x t x νμμ0210==-μ μμ:H d d t s μ-== 1 -=n ν210μμ=:H 2 1)()(2121x x s x x t ----=μμ2 21-+=n n ν ? ??? ??+=-2121121n n s s C x x 2)()(112222112-+∑-∑+-=n n x x x x s C 2221s s F =111-=n ν1 2 2-=n ν组内组间总SS SS SS +=组内 组间总ννν+=2()/C x N =∑ij j T x = ∑

0272《心理统计学》2016年6-7月期末考试指导.

0272《心理统计学》2016年6-7月期末考试指导 一、考试说明 本课程闭卷考试,满分100分,考试时间90分钟。可能的考试题型包括: 1、单项选择题 2、判断题 3、简答题 4、计算题 5、综合应用题 二、重点复习内容 (一)绪论 1、心理学统计学的内容:描述统计、推论统计、实验设计。其中,描述统计的指标包括数据的集中趋势,数据的离散趋势和数据间的相关 2、数据的种类 按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。 (1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。这类数码并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。 (2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。(3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。例如,测量温度的℃。 (4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。 (二)统计图表 1、次数分布表:各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。 2、编制次数分布表的步骤 (1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。用符号R表示(2)定组数 (3)求组距:指每一组的间距,用符号i表示。 (4)定组限:指各组数据在数值上的起点值和终点值。 (5)求组中值:各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。(6)归类划记:将原始观测值按照一定的顺序逐一归组。 (7)记录各组次数(f)。 (8)核对,抄录新表。 3、连续变量的单位是无限的,例如整数180的实上限和下限分别为179.5和180.5,而测量数据8.35的下实限是8.345。 4、累加次数分布表:如果想知道某个数值以下或以上的数据的数目,就要用累加次数。 5、次数分布图:编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用。由于数据的性质不同,有时实验结果的次数分布图上会出现双峰。 (三)集中量数 集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。 1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。

相关主题
文本预览
相关文档 最新文档