当前位置:文档之家› 心理统计学》重要知识点

心理统计学》重要知识点

心理统计学》重要知识点
心理统计学》重要知识点

《心理统计学》重要知识点

第二章 统计图表

简单次数分布表的编制:Excel 数据透视表

列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表

直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。 条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。 简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。 复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。

圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。 线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;

第三章 集中量数

● 集中趋势和离中趋势是数据分布的两个基本特征。

● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。 ● 集中量数:描述数据分布集中趋势的统计量数。 ● 离中趋势:是指数据分布中数据分散的程度。

● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):n

x X i

∑= Excel 统计函数AVERAGE

算术平均数的重要特性:

(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i

(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,

那么,变量Y 2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据出现

次数各占50%。

3.众数(mode ,M O ):一组数据中出现次数最多的数据。 4.算术平均数、中数、众数之间的关系。 5.加权平均数:i

i

i n n n w w w x w w w w x w x w x M ∑∑=++++++=

212211

6.调和平均数(harmonic mean ,M H ):一组数值倒数的平均数的倒数。

∑=

+???++=

i

n

H x

n

n x x x M 1)111(

1

21 Excel 统计函数HARMEAN (1)用于描述同一个体(或一组个体)不同时间段的平均学习速度、平均工作效率。 (2)用于描述不同能力水平个体的平均学习速度、平均工作效率。 7.几何平均数(geometric mean ,Mg )是指n 个观察值连乘积的n 次方根.

(1)一组数据中少部分偏大(或偏小),数据分布呈偏态时,几何平均数比算术平均数更能反映数据

的集中趋势。

n n g x x x M ??= 21 Excel 统计函数GEOMEAN

(2)用于计算平均学习进步速度、平均发展速度(平均发展倍数),即环比的几何平均数。

11

1

134

2312---=???=n n n n n g x x x x x x x x x x M (n x x x 、、

、 21为各个时间段的成果数据) 平均增长率:1-g M

第四章 差异量数

● 差异量数:描述一组数据离散程度(离中趋势)的统计量数。差异量数较大,说明数据分布得比较分散,数据之间的差异较大;差异量数较小,说明数据分布的比较集中,数据间的差异较小。 ● 差异量数还能反映平均数对一组数据的代表性。差异量数越小,平均数的代表性越好;差异量数越大,平均数的代表性越差。

● 常用的差异量数是标准差、方差、差异系数

标准差s :n X X s i 2

)(∑-=

Excel 统计函数STDEVP (给定样本总体的标准偏差)

标准差s n-1:1

)(2

1--=∑-n X X s i n Excel 统计函数STDEV (给定样本的标准偏差)

方差2s :n

X X s i 22

)(∑-=

Excel 统计函数VARP (给定样本总体的方差)

方差2

1

-n s

:1

)(22

1

--=

∑-n X X s i n Excel 统计函数VAR (给定样本的方差) 差异系数(又称变异系数、离散系数、相对标准差):X

S

CV =

(1)用于比较不同观测工具测量结果(数据单位不同)的离散程度,例如,身高离散程度大,还是体

重离散程度大?

(2)用于比较用同一观测工具测得的、均数差异较大的不同样本数据的离散程度。例如:7岁组儿童

和13组岁儿童的体重离散程度,哪个较大?

● 标准差的重要特性:如果变量X 的标准差为X S ,将变量X 按照公式bx a y +=转换为Y 变量后,

那么,变量Y 的标准差X Y bS S =

● 相对位置量数:反映个体(数据)在团体中相对位置的统计量数。

主要有标准分数及其线性转换分数(Z 分数、T 分数)、百分等级(PR)、正态化标准分数等。 1.标准分数的计算与应用:S X X Z i -=

或:σ

μ

-=i X Z , 5010+=Z T ,500100+=Z CEEB

Z 分数的特点:Z 分数的平均数为0,即0=Z μ,标准差为1,即1Z =σ T 分数的平均数50T =μ,标准差为10T =σ

CEEB 分数的平均数=___________?,标准差=__________?

(1)可用于比较个体各方面水平高低(横向比较,个体内差异评价)。

(2)对被试多方面的测量结果进行综合,如对高考各科成绩的综合,各分测验分数的综合。 (3)可用于对个体或样组某方面水平进行前后比较(纵向比较),判断其水平是提高了,退步了,

还是没有变化。

2.原始分数X 的百分等级的含义与计算

根据简单次数分布表计算:1005.0?+=

N

F f PR b

X 根据分组次数分布表计算:100?+?-=N

F f i L X PR b b

X

第五章 相关关系

● 相关关系的描述方法

(1)相关散点图:适用于直观描述两个连续性数值变量(等距数据、比率数据)之间的关系。可用

Excel 图表向导中的“XY 散点图”绘制。

(2)双向次数分布表(交叉表、列联表):适用于描述两个等级变量(或称名变量、类别变量)之间

的关系。可用Excel 数据透视表编制列联表)。 (3)相关系数(相关关系的特征值)。

● 相关系数:描述两个变量相关关系的统计量数,在-1.00~1.00之间取值,绝对值越大,越接近1,说明两个变量之间的关系程度越密切;绝对值越小,越接近0,说明两个变量的关系程度越低。 ● 常用的相关系数: 1.积差相关:y

x i i s ns y y x x r ∑--=

))(( Excel 统计函数CORREL

适用条件:(1)X 、Y 两个变量都是连续性变量(等距数据或比率数据);

(2)X 、Y 两个变量总体上为正态分布或接近正态分布。

2.斯皮尔曼等级相关:是一对(两列)名次变量的积差相关。对数据变量的分布形态没有要求。

(1)等级积差相关法(名次积差相关法)。

Y

X R R Y Y X X R S NS R R R R r )

)((--∑=

Excel 统计函数CORREL

公式中的R X 和R Y 是分别代表两变量中每个数据在变量中的名次。

(2)等级差数法(名次差数法)。

如果每个等级(即名次)变量中没有相同的等级名次,可用下面公式计算:

等级差数法简化公式:)

1(612

2

-∑-=N N D r R 如果等级(即名次)变量中有相同的等级名次,需用下面校正公式计算: 等级差数法校正公式:)

)((222222y x D y x r RC ∑∑?∑-∑+∑=

,2x ∑、2

y ∑计算方法参见教材125页

3.肯德尔W 系数(肯德尔和谐系数):描述多个名次变量一致性程度的统计量数。

适用于描述和分析不同评价者(如主考、阅卷者)对同一组个体(考生或答卷)评价结果(名次)的一致性程度,在心理测量与教育评价中称为评分信度。例如,5位阅卷老师对10篇论文评分排名的一致性。如果评价者给出的不是个体的水平名次,而是分数(或等第、符号),可先将其转换成名次,然后再计算W 系数。

)(121)(3222

N N K N R R W i i --=

∑∑ 校正公式:∑∑∑---=T N N K N R R W i i )(12

1)(3222

∑∑-=12)

1(2n n T 公式中:n 为每个名次变量中相同名次的数目。 4.点二列相关(point-biserial correlation ):

用于描述一列续性变量和一列真正二分变量(或非正态二分变量)之间的相关。

真正二变量:指按某种性质或标准将个体划分为两种结果的变量,如对、错,男、女等。

pq s X X r t

q

p pb ?-=

Excel 统计函数CORREL

5.二列相关(biserial correlation):用于描述由一个正态连续变量人为划分成的二分变量与另外一个正态

连续变量之间的相关。或者说,用于描述一正态二分变量与一正态连续变量之间的相关。

人为二分变量?是指由连续变量转换而来的二分变量,例如,将测验或考试分数区分为及格和不及

格,80分以上和80分以下;按中考(或高考)成绩,将考生区分为录取、未录取。

正态二分变量?如果二分变量是根据正态连续变量转换而来,那么,可称之为正态二分变量。 y 为将正态分布面积画分为p 、q 两部分的纵线的高度。 y 的计算方法:利用Excel 统计函数计算

标准正态分布区间点函数NORMSINV(p 值) →区间点Z 值 正态分布函数NORMDIST(区间点Z 值,0,1,0) →Z 值的概率密度y 6.Φ相关(Φ系数):)

)()()((|

|d b c a d c b a bc ad r ++++-=

Φ

用于描述两个真正二分变量的相关程度,也用于描述一个人为二分变量和真正二分变量的相关。 注意:Φ相关计算公式是由皮尔逊积差相关计算公式转换来的。因此,如果两列二分变量转换

为0、1(或1、2)的数值变量时,可以用Excel 统计函数CORREL 计算Φ系数。

第六章 概率分布

1.正态分布的特征(见教材)

2.Excel 软件中正态分布函数和正态分布区间点函数的应用

◆标准正态分布函数NORMSDIST 的应用:

(1)P(Z <1.96)=? =NORMSDIST(1.96)=0.9750 (2)P(Z >1.96)=? =1-NORMSDIST(1.96)=0.0250

(3)P(-1.5<X <2.5)=? =NORMSDIST(2.5)-NORMSDIST(-1.5)=0.9270 ◆正态分布函数NORMDIST 的应用

例如:已知某次测验的分数呈正态分布,平均分为75分,标准差为10分,试计算: (1)低于80分的考生占多大比例,P(X <80分)=? (2)80分以上的考生占多大比例,P(X ≥80分)=?

(3)80分以上,低于90分的考生占多大比例,P(80≤X <90)=? P(X <80分):“=NORMDIST (79.5,75,10,1)”=0.6736 P(X ≥80分):“=1-NORMDIST (79.5,75,10,1)”=0.3264

P(80≤X <90):“=NORMDIST (89.5,75,10,1)-NORMDIST (79.5,75,10,1)”=0.2528 ◆标准正态分布区间点函数NORMSINV 的应用

根据给定的向上累积概率P(Z

根据正态变量X 的平均数、标准差和向上累积概率P(X

例:已知某次大规模招聘考试分数呈正态分布,平均分为55分,标准差为12分。现准备录取10%

的考生进行面试,录取分数线大致是多少?

P(X >?)=0.10,即P(X <?)=1-0.10=0.9,=NORMINV(0.9,55,12)=70.38,

最低分数线应为70分。

3.测验分数、测评等级的正态化:

根据被试样本原始分或等级的简单次数分布表,计算各个不同分数或等级的正态标准分数 (1)计算每个不同分数X (或等级)以下累计次数F b ;

(2)计算每个不同分数X (或等级)中点以下累积比率CP :N

F f CP b

X +=

5.0 (3)利用Excel 统计函数NORMSINV ,计算CP 对应的正态Z 分数。 (4)根据需要,将正态Z 分数转为其他标准分数形式:

T 分数、CEEB 分数、托福考试分数、离差智商IQ 等,

5010+=Z T ,500100+=Z CEEB ,50070+=Z TOEFL ,10015+=Z IQ

4.偏态系数(SK )和峰态系数(Kurt )的计算与应用

偏态系数:Excel 统计函数SKEW ; 峰态系数:Excel 统计函数KURT 。 偏态系数SK =0,对称分布;SK >0,正偏态分布;SK <0,负偏态分布。

峰态系数Kurt =0,正态分布的峰态;Kurt >0,次数分布的峰度比正态分布峰度低阔;

Kurt <0,次数分布峰度比正态分布峰度高狭。

偏态系数和峰态系数都等于0或接近0时,变量的分布为正态分布。 5.二项分布的定义

二项分布是二项试验验结果的概率分布。进行n 次二项试验,各次试验彼此独立,每次试验时某事件出现的概率都是p ,该事件不出现的概率为q (=1-p ),则该事件出现x 次的概率分布为:

x

n x x n q p C p n x b x X P -===),,,()(。

二项分布的Excel 统计函数:BINOMDIST 6.二项分布函数BINOMDIST 的应用

对20道四选一的单项选择题,如果完全凭猜测答题,那么 (1)猜对5道题的概率是多少? (2)猜对5题以下概率是多少? (3)猜对6题以上的概率是多少? n =20,每题猜对的概率为p =0.25

(1)猜对5道题的概率P (X =5) =BINOMDIST (5,20,0.25,0)=0.20233 (2)猜对5题以下的概率P (X ≤5) =BINOMDIST (5,20,0.25,1)=0.61717

(3)猜对6题以上的概率P (X ≥6)=1-P (X ≤5) =1-BINOMDIST (5,20,0.25,1)=0.38283 7.二项分布的形态:随n 、p 的变化具有不同的分布形态

(1)当p =q 时,二项分布是对称分布。 (2)当p =q ,np ≥5时,接近正态分布。

(3)当p ≠q ,np <5或nq <5时,二项分布为偏态分布。 (4)当p ≠q ,np ≥5且nq ≥5时,二项分布接近正态分布。 8.二项分布的平均数和标准差

进行n 次二项试验,每次试验时某事件出现的概率都是p ,则该事件出现次数的理论平均数(μ)、 方差(2σ)和标准差σ分别为:npq npq np =

==σσμ,,2。

如果np ≥5且nq ≥5,成功事件出现结果的概率分布接近np =μ、npq =σ的正态分布。

进行投掷100枚硬币试验,如果进行无数次试验,正面向上的硬币数目会在0~100个之间变化。那么,正面向上次数的理论平均数:μ=np =100×0.5=50,标准差为55.05.0100=??==

npq σ。

20道四选一的单项选择题,如果完全凭猜测答题,那么, 猜对题数的平均数为μ=np =20×1/4=5

猜对题数的理论标准差为94.14/34/120=??==npq σ。

第七章 总体参数估计

1.常用的点估计:

总体均数μ的点估计:用样本平均数X ,Excel 统计函数为AVERAGE 总体方差σ2的点估计:用样本标准差2

1-n S ,或12-?

n n

S 。 总体标准差σ的点估计:用样本标准差1-n S ,或1

-?

n n

S 。

2.总体平均数的区间估计

1.若样本均数的抽样分布为正态分布,

总体均数的0.95置信区间为:1

96.105.0-?±=±n S X SE Z X X

总体均数的0.99置信区间为:158.2201.0-?±=±n S X SE Z X X

2.若样本均数的抽样分布为df =n -1的t 分布,那么,

总体均数的0.95置信区间为:12/05.02/05.0-?±=±n S t X SE t X X

总体均数的0.99置信区间为:1

2/01.02/01.0-?

±=±n S t X SE t X X

自由度df =n -1,205.0t =?,205.0t =?,可用Excel 统计函数TINV 计算。 也可查教材453页t 值表

3. 总体方差与标准差的区间估计

总体方差2σ的0.95置信区间为:

2975

.02

2

2025

.02

χσχnS nS <

<,或

2975

.021

2

2025

.021

)1()1(χσχ---<

<-n n S n S n ,

总体方差2σ的0.99置信区间为:

2995

.02

2

2005

.02

χσχnS nS <

<,或

2995

.021

2

2005

.021

)1()1(χσχ---<

<-n n S n S n

自由度df =n -1的2χ分布右侧概率区间点的计算,也可用Excel 统计函数CHIINV 。 也可查教材475页2χ分布数值表

总体标准差σ的置信区间:取总体方差2σ置信区间上、下限的正平方根。 4.总体积差相关系数的区间估计:

(1)将样本相关系数r 转换为费舍Zr 值,转换方法:Excel 统计函数FISHER (2)计算Zr 的标准误SE Zr :3

1-=

n SE Zr

(3)计算总体Z ρ值的1-α置信区间:Zr r SE Z Z 2α±

0.95置信区间为:396.1205.0-±=±n Z SE Z Z r Zr r

0.99置信区间为:3

58.2201.0-±

=±n Z SE Z Z r Zr r

(4)计算总体相关系数ρ值的置信区间:将总体Z ρ值区间上、下限进行费舍逆转换,

转换方法:Excel 统计函数FISHERINV

5.总体比率(比例)的区间估计

5?5?≥≥q n p

n ,时,样本比率p ?的抽样分布渐近正态分布。 总体比率的0.95置信区间为:n

q p

p SE p

p ??96.1?96.1??±=±

总体比率的0.99置信区间为:n

q p

p SE p

p ??58.2?58.2??±=±

第八章 假设检验

在Z 检验中:双侧检验临界值:2/05.0Z =1.96 2/01.0Z =2.58

单侧检验临界值:05.0Z =1.645 01.0Z =2.326 单侧显著性概率P :=1-NORMSDIST (ABS (Z 值)) 双侧显著性概率P :=(1-NORMSDIST(ABS(Z 值)))*2

在t 检验中:单侧显著性概率P :=TDIST (ABS (t 值),df ,1)

双侧显著性概率P :=TDIST (ABS (t 值),df ,2)

1.单个样本Z 检验

主要用途:分析单个样本均数x 与已知的总体均值μ0的有无显著差异, 适用条件:(1)总体呈正态分布,总体方差2σ已知;

(2)总体是正态分布,总体方差2σ虽然未知,但样本容量30≥n ; (3)即使总体非正态分布,总体方差2σ也未知,样本容量30≥n 。

2.单个样本t 检验

主要用途:用于分析单个样本均数x 与已知的总体均数μ0的差异,

适用条件:(1)总体呈正态分布,总体方差2σ未知,样本容量30

(2)总体非正态分布,总体方差2σ未知,样本容量30≥n 的情况下.

3.单个样本比率Z 检验

主要用途:根据一个样本的比率p

?,分析样本所代表的总体比率p 与已知比率0p 有无显著差异。 适用条件:5500≥≥nq np , 4.两独立样本比率差异Z 检验

主要用途:根据两个独立样本的比率21??p p

-,推断两总体比率p 1、p 2有无显著差异 适用条件:两个样本相互独立,22112211????q n q n p n p

n ,,,都≥5 5.两独立样本方差齐性检验

主要用途:根据相互独立的两个样本的方差,推断两个总体的方差是否相等或是否有显著差异。

)

1()

1(222212112

1

2

121--=

=

--n S n n S n S S F n

n

小的大的 分子方差的自由度df=n 1-1,分母方差的自由度df=n 2-1

双侧显著性概率P 值:=FDIST (F 值,分子自由度,分母自由度)*2

6.相关样本t 检验

主要用途:

(1)根据一组被试前、后两次测评结果,推断两次测验结果的总体均数有无显著差异。 (2)根据实验组和配对对照组测评结果,推断实验组和对照组的总体均数有无显著差异。 适用条件:两个样本的数据有一一对应关系,且有可比性;两总体数据呈正态分布。 7.独立样本Z 检验

主要用途:根据两个独立样本的均数差异21X X -,推断两总体均数21μμ、有无显著差异。

适用条件:(1)两总体为正态分布,总体方差21σ、2

2σ已知,不管样本大小

(2)两总体非正态分布,总体方差21σ、2

2σ已知,303021≥≥n n ,时 (3)两总体非正态分布,总体方差2

1σ、2

2σ未知,303021≥≥n n ,时

总体21σ、22σ已知时:2

22

1

2

1

2

1n n X X Z σ

σ

+

-=

; 总体21σ、2

2σ未知时:2

221

2121n s n s X X Z +-=

8.独立样本等方差假设t 检验

主要用途:根据两个独立样本的均数差异21X X -,推断两总体均数21μμ、有无显著差异? 适用条件:(1)两总体为正态分布,总体2

1σ、2

2σ未知,且2

1σ=2

2σ,不管样本大小

(2)两总体非正态分布,总体2

1σ、2

2σ未知,且2

1σ=2

2σ,303021≥≥n n ,时

两总体方差2

1σ、2

2σ是否相等,需要先做方差齐性检验。 注意:大多数情况下,两总体方差基本相等。 9.独立样本异方差假设t 检验

主要用途:根据两个独立样本的均数差异21X X -,推断两总体均数21μμ、有无显著差异? 适用条件:(1)两总体为正态分布,总体2

1σ、2

2σ未知,且2

1σ≠2

2σ,不管样本大小

(2)两总体非正态分布,总体2

1σ、2

2σ未知,且2

1σ≠2

2σ,303021≥≥n n ,时

2

2

212121n s n s X X t +-=

当n n n ==21时,1-=n df ;当21n n ≠时,()1

)(1)(22

12

1121212

22

2121

-+-+=n n s n n s n s n s

df 10.积差相关显著性t 检验

主要用途:根据一对变量的样本数据及其积差相关系数r ,推断两变量有无显著关系。 适用条件:两变量为连续性数值变量,且总上正态分布。

第十四章 抽样原理及方法(参见教材)

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

西南大学《教育与心理统计学》网上作业

1、已知某小学一年级学生的平均体重为26kg,体重的标准差是3.2kg,平均身高2750px,标准差为150px,问体重与身高的离散程度哪个大(a )? A. 体重 B. 身高 C. 离散程度一样 D. 无法比较 2、下列一组数据3,7,2,7,6,8,5,9的中位数是(b) A. 6 B. 6.5 C. 6.83 D. 7 3、设X是正态变量,均值为0,标准差为2,则X的绝对值小于2的概率约为(b )。 A. 5% B. 70% C. 90% D. 95% 4、欲考察考生类型(应届/历届)与研究生录取(录取/不录取)的关系,应该用什么相关方法( d )? A. 二列相关 B. 点二列相关 C. 四分相关 D. Φ相关 5、数值56的精确上下限为(c) A. [55.5-56.5] B. [55.49-56.5] C. [55.5-56.49] D. [55.49-56.49] 6、在假设检验中,同时减少两类错误的最好办法是( b )。 A. 控制β值,使其尽量小 B. 适当加大样本容量 C. 完全随机取样 D. 控制α水平,使其尽量小 7、甲乙两人不知道“本题”的哪一个选项是正确的,只好随机猜测作答。结果两个人答案都正确的概率是( a ) A. 1/16 B. 3/16 C. 1/8 D. 9/16 8、最常用来与中数一起来描述数据特征的差异数量是(d )。 A. 方差 B. 标准差 C. 百分位差 D. 四分位差 9、有一组数据的平均数和标准差分别是8和2。如果给这组数据的每个数都加上2,再乘以3,可以得到一组新数据,那么这组新数据的平均数和标准差分别是(b) A. 30,2 B. 30,6 C. 26,2 D. 26,6 10、设总体服从正态分布,均值是60,标准差是10,有一个样本,容量为100,则样本均值有95%的可能性位于( c )。 A. (40, 80) B. (50, 70) C. (58, 62) D. (57.5, 62.5) 11、当样本容量一定时,置信区间的宽度(c )。 A. 随着显著性水平α的增大而增大 B. 与显著性α无关 C. 随着显著性水平α的增大而减小 D. 与显著性α的平方根成正比 12、用相同大小圆点的多少或疏密来表示统计资料数量大小以及变化趋势的是(d) A. 直方图 B. 线形图 C. 条形图 D. 散点图 13、下列方法中,一定不能用于处理两组均值比较问题的是?(a) A. 中数检验法 B. 方差分析法 C. t检验 D. Z检验 14、下列关于假设检验的描述正确的是?(b) A. 假设检验包括显著性检验与差异显著性检验 B. 非参数检验属于假设检验 C. 假设检验中的α型错误与β型错误两者的概率相加等于1 D. 方差分析不属于假设检验 15、对120位学生家长进行测试得到其家庭教养方式四种类型(如民主型、专制型等)的人数,欲描述其次数分布,应使用的次数分布图是?(c) A. 散点图 B. 线形图 C. 条形图 D. 直方图 16、下列可用于主观题区分度评价的相关系数是?(c) A. 点二列相关 B. 二列相关 C. 皮尔逊相关 D. 斯皮尔曼相关 17、下列描述中,属于零假设的是?(d) A. 少年班大学生的智商高于同龄人 B. 母亲的耐心程度与儿童的问题行为数量呈负相关关系 C. 在高光照条件下的视觉简单反应时优于低光照条件下的视觉简单反应时

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

统计学原理知识点公式

统计学原理知识点及公式 第一章统计总论 ?1.统计一词的三种含义 ?2.统计学的研究对象及特点 ?3.统计学的研究方法 ?4.统计学的几个基本概念:总体与总体单位、标志与标志表现、变异与变量、统计指标的概念、特点及分类。 ?5.国家统计兼有的职能 第二章统计调查 ?1.统计调查的概念和基本要求 ?2.统计调查的种类 ?3.统计调查方案的构成内容 ?4.统计调查方法:普查、抽样调查、重点调查、典型调查 ?5.调查误差的种类 第三章统计整理 ?1.统计整理的概念和方法 ?2.统计分组的概念、种类 ?3.统计分组的关键 ?4.统计分组的方法:品质分组方法、变量分组的方法 ?5.分配数列的概念、构成及编制方法 变量数列的编制基本步骤为: 第一步:将原始资料按数值大小依次排列。 第二步:确定变量的类型和分组方法(单项式分组或组距分组)。 第三步:确定组数和组距。当组数确定后,组距可计算得到:组距= 全距÷组数全距= 最大变量值-最小变量值。 第四步:确定组限。(第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。) 第五步:汇总出各组的单位数(注意:不同方法确定的组限在汇总单位数时的区别),计算频率,并编制统计表。 间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。

重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。 因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。 ?6.统计表的结构和种类 第四章综合指标 ?1.总量指标的概念、种类和计量单位 ?2.相对指标的概念、指标数值的表现形式、相对指标的种类。相对指标包括: 结构相对指标、比例相对指标 比较相对指标、强度相对指标 动态相对指标、计划完成程度相对指标 ●3.平均指标的概念、作用和种类。 算术平均数、调和平均数、众数、中位数

统计学20个重点知识整理

一、统计的含义及其之间的关系 统计一词一般有三种含义,即统计工作、统计资料和统计学。 1、统计工作即统计实践活动,是指按照调查研究的任务,对社会经济现象的数量方面进行搜集资料、整理资料和分析运用资料等一系列调查研究的工作过程。 2、统计资料是指反映社会经济现象特征的各项数字资料以及与之有联系的其他资料,包括调查阶段搜集的原始资料,经过加工整理和分析后的图标和文字资料等系统资料。 3、统计学是研究怎样进行社会经济统计活动的方法论科学,它阐述了统计研究社会经济现象的数量和数量关系时应该遵循的原理、原则和采用的方法等,是系统化的知识体系。 4、关系:统计资料是统计工作的成果,是对社会经济现象进行统计研究的基础;统计学是统计活动经验的科学总结和理论概括,统计学来源于实践,又高于实践,对统计实践起着指导的作用;统计工作要以统计学的理论为指导,并检验和发展统计理论。 二、统计总体和统计单位及其之间的关系 1、统计总体:是由客观存在的、具有某种共同性质的许多个别单位所构成的整体,简称总体。 2、统计总体的特征:大量性、同质性、差异性 3、总体单位:构成统计总体的个别事物 4、例:要研究某一乡镇企业的职工素质情况,则该乡镇企业的全体人员构成一个总体,其中每一个职工就是总体单位。 5、关系:a.总体由总体单位组成; b.组成总体的个体是有差别的; C.根据统计研究目的的不同,总体与总体单位是可以相互转化的。 三、统计指标和统计标志之间的关系 两者之间既有明显的区别,又有密切的联系。主要区别在于: 1、指标说明总体特征;而标志则说明总体单位特征; 2、统计指标必须是可量的;统计标志未必都是可量的; 3、统计指标具有综合性;而统计标志一般不具有综合性; 两者之间的主要联系在于: 1、许多统计指标的指标数值是从总体单位的数量标志值汇总而来; 2、指标与标志之间存在着变换关系; 例如:要了解我国粮食生产状况,则我国的粮食总产量是指标,而某省的粮食总产量是标志。 四、一个完整的统计调查方案包括的内容 1、确定调查目的; 2、确定调查对象和调查单位; 3、确定调查项目,设计调查表; 4、确定调查时间和方法; 5、制定调查工作的组织实施计划 五、统计调查的分类 1、按统计调查方式的不同,可分为定期统计报表和专门调查; 2、按调查总体包括的范围不同,可分为全面调查和非全面调查; 3、按调查登记的时间是否具有连续性,可分为经常性调查和一次性调查; 4、按统计调查是否具有强制性,可分为政府统计调查、民间统计调查和涉外社会调查; 5、按收集资料的方法,可分为直接观察法、报告法、采访法和问卷法

西南大学0062]《教育与心理统计学》网上作业及答案

西南大学[0062]《教育与心理统计学》网上作业及答案 1、设X是正态变量,均值为0,标准差为2,则X的绝对值小于2的概率约为()。 1. 5% 2. 70% 3. 95% 4. 90% 2、欲考察考生类型(应届/历届)与研究生录取(录取/不录取)的关系,应该用什么相关方法(1. B. 点二列相关 2.二列相关 3.Φ相关 4.四分相关 3、在假设检验中,同时减少两类错误的最好办法是()。 1. E. 控制α水平,使其尽量小 2.完全随机取样 3.适当加大样本容量 4.控制β值,使其尽量小 4、甲乙两人不知道“本题”的哪一个选项是正确的,只好随机猜测作答。结果两个人答案都 正确的概率是() 1. 1/8 2. 9/16 3. 3/16 4. 1/16

5、最常用来与中数一起来描述数据特征的差异数量是()。 1.四分位差 2.百分位差 3.标准差 4.方差 6、有一组数据的平均数和标准差分别是 8和 2。如果给这组数据的每个数都加上2,再乘以3,可以得到一组新数据,那么这组新数据的平均数和标准差分别是 1. 30,6 2. 26,2 3. 30,2 4. 26,6 7、设总体服从正态分布,均值是60,标准差是10,有一个样本,容量为100,则样本均值有95%的可能性位于()。 1.(58, 62) 2.(57.5, 62.5) 3.(50, 70) 4.(40, 80) 8、当样本容量一定时,置信区间的宽度()。 1. C. 与显著性α无关 2.随着显著性水平α的增大而减小 3.随着显著性水平α的增大而增大 4.与显著性α的平方根成正比

9、当样本平均数落入已知总体抽样分布的拒绝域时,表示正确拒绝零假设的概率的符号是? 1. 1-α 2.α 3.β 4. 1-β 10、下列关于方差分析与t检验的描述中不正确的是? 1.方差分析用于多组比较,比两两t检验有更好的误差估计 2.方差分析用于多组比较,比两两t检验时,α型错误更小 3.方差分析检验结果显著后,可以使用两两t检验进行多重比较 4.方差分析用于多组比较,比两两t检验的检验次数更少 11、下列关于假设检验的描述正确的是? 1.假设检验包括显著性检验与差异显著性检验 2.非参数检验属于假设检验 3.假设检验中的α型错误与β型错误两者的概率相加等于1 4.方差分析不属于假设检验 12、下列可用于主观题区分度评价的相关系数是? 1.点二列相关 2.二列相关 3.皮尔逊相关 4.斯皮尔曼相关 13、下列统计图形中,不能用于描述变量的次数分布的是? 1.圆形图

生物统计学第四版知识点总结

一、田间试验的特点 1、田间试验具有严格的地区性和季节性,试验周期长。 2、田间试验普遍存在试验误差 3、研究的对象和材料是农作物,以农作物生长发育的反应作为试验指标研 究其生长发育规律、各项栽培技术或栽培条件的效果。 二、田间试验的基本要求 结果重演性、结果可靠性、条件先进代表性、目的明确性 三、单因素试验的处理数就是该因素的水平数。 四、例如:甲、乙、丙三品种与高、中、低三种施肥量的两因素试验处理组 合数是? 3因素3水平的处理组合数是? 多因素试验的处理数是各因素不同水平数的所有组合。 五、如进行一个喷施叶面肥的试验,如果设置两个叶面肥浓度,对照应为 喷施等量清水。 六、简单效应的计算 N 的简单效应为40-30=10 在N1水平下,P2与P1的简单效应为38-30=8;在N2水平下,P2与P1的简单效应为54-40=14。 七、平均效应的计算 P的主效(8+14)/2=11; N的主效(10+16)/2=13; 八、互作的计算 N与P的互作为(16-10)/2=3或(14-8)/2=3 九、田间试验误差可分为系统误差和随机误差两种。(1、系统误差影响试 验的准确性,随机误差影响试验的精确性。2、准确度受系统误差影 响,也受随机误差影响;精确度受随机误差影响。3、若消除系统误 差,则精确度=准确度。) 十、小区面积扩大,误差降低,但扩大到一定程度,误差降低就不明显了。 适当的时候可以考虑增加重复次数来降低误差。小区面积一般在 6-60m2,而示范小区面积不小于330m2 。 十一、通常情况下,狭长小区误差比方形小区误差小。 小区的长边必须与肥力梯度方向平行,即与肥力变化最大的方向平行。一般小区长宽比为3-10:1,甚至达20:1 十二、何时采用方形小区?(1)肥水试验;(2)边际效应值得重视的试验。 十三、一般小区面积较小的试验,重复次数可相应增多,可设3-6次重复; 小区面积较大的试验可设2-4次重复。 十四、将对照或早熟品种种在试验田四周,一般4行以上。目的?(目的是防止外来因素破坏及边际效应的影响。) 十五、算术平均数的主要特征 ?1、样本各观测值与平均数之差的和为零,即离均差之和为0。 2、离均差的平方和最小。 十六、【例3·1】在1、2、3、…、20这20个数字中随机抽取1个,求下列随机事件的概率。 (1)A=“抽得1个数字≤4”;

统计学知识点梳理

型;有下划线的重点记忆!当然整理的知识点都就是重点!都要背与理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料与统计学 统计工作:统计实践活动,搜集,整理,分析与提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料与加工整理资料 统计学:关于认识客观现象总体数量特征与数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理与统计分析三个阶段。 统计调查:第一阶段,就是认识客观经济现象的起点,就是统计整理与统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。

统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,就是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体就是统计认识的对象。 例如:所有的工业企业就就是一个总体,其中的每一个工业企业就就是一个总体单位。 四.标志与指标 标志就是用来说明总体单位特征的名称。 指标,亦称统计指标,就是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称与指标数值两部分。(以上内容理解即可) 1、指标与标志的区别与联系(简答) 指标与标志的区别:(1)指标就是说明总体特征的,而标志就是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,就是用属性表示的;(3)指标数值就是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值就是从总体单位的数量标志值汇总而来的; (2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2、标志与标志值(会区分) 标志分为品质标志与数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3、变异与变量(会什么就是变异,什么就是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄就是42岁,月工资2200元。 4、统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标与质量指标。数量指标指说明总体规模与水平的各种总量指标。质量指标指反应现象总体的社会经济效益与工作质量的各种相对指标与平均指标。 (2)统计指标按其作用与表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一、统计调查的含义 统计调查就是统计工作过程的第一阶段。它就是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查就是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二、统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要与可能确定 ⒉确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位)

《教育与心理统计学》自学指导书(精)

《教育与心理统计学》自学指导书 一、选择题 1、中数在一个分布中的百分等级是() A、50 B、75 C、25 D、50-51 2、平均数是一组数据的() A、平均差 B、平均误 C、平均次数 D、平均值 3、两个N=20的不相关样本的平均数差D=2.55,其自由度为() A、39 B、38 C、18 D、19 4、在大样本平均数差异的显著性检验中,当Z≥2.58时,说明() A、P〈.05 B、P〈.01 C、P〉.01 D、P≤.01 )5、在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z=(X-M B /S 这个公式中X应为() B A、12 B、10 C、9.5 D、10.5 6、当XY间相关程度很小时,从X推测Y的可靠性就() A、很小 B、很大 C、中等 D、大 7、在处理两类刺激实验结果时,在下列哪种情况下不可以用正态分布来表示二 项分布的近似值?() A、N〈10 B、N≥10 C、N〉30 D N〉10 8、在心理实验中,有时安排两组被试分别在不同的条件下做实验,获得的两组 数据是() A、相关的 B、不相关的 C、不一定 D、一半相关,一半不相关 9、运用非参数分析时,要求处理的数据是() A、十分精确的 B、注明单位的 C、大量的 D、等级形式的 10、在X2检验时,遇到下面哪种情况时不宜再用X2检验?() A、F〉10 B、F〈5 C、F〉5 D、F〈10 二、填空题 1、统计是一种(),它要在()正确的前提下才能充分发挥作用 2、用曲线图比较两组的实验结果时,如果两组被试的人数不同,就不能用 ()比较,用()数进行比较 3、在集中趋势的指标中()、()不受极端数值的() 4、当平均数大于中数或()时,曲线向()偏斜 5、当一种变量增加时,另一种变量也随着(增加),说明这两者间有着()关系 6、没有因果关系的事物之间,()系数()等于零 7、正态分布因其M和()不同而各异,M值大,曲线的集中趋势在横轴上越偏() 8、无论总体分布是否正态,从中抽取许多大样本,其平均数的分布都趋于 ()分布 9、统计检验结果的显著与否是()的,它的科学性表现在说明了()可能有多大 10、显著检验要解决的问题是两个()平均数据的差异是否显著地大于()误差 三、名词解释

生物统计学复习重点137030032

主要统计符号注解
编号 1 2 3 4 5 6 7 8 9 11 12 13 符号 注解 希腊字母符号 统计检验的显著水平,一般 α 取 0.05 或 0.01 总体标准差。用拉丁字母 S 表示样本标准差 总体方差。用拉丁字母 S2 表示样本方差(均方) 样本平均数抽样总体方差 标准误 (样本平均数抽样总体的标准差, 表示平均数抽样误差的大小) S x 。 为标本标准误,是平均数抽样误差的估计值 总体平均数。用拉丁字母 x 表示样本平均数 卡平方值 经连续性矫正的卡平方值 自由度 df 为显著水平为 α 时的卡平方临界值 随机误差;重复内分组设计的参试材料误差 线性模型中的处理效应 表示从第 1 个观测值 xi 累加到第 n 个,观测值 xn,当
i
α
σ σ2
2 σx σx
μ χ2 χ c2 2 χ α ,df
ε τ
n
n
∑x
i=1
∑x
i =1
在意义上已明确
i
时,可简写为 ∑ x 。 ∑ 为求和符号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
T N n SS MS S S2 H0 HA SE DF CV CK O E F LSD LSR x~N(μ, 2) ( ,σ p,q , x~B(n,p) ( , ) a b r c f t u
x
d
d
k
拉丁字母符号 观测值总和 有限总体的总观测值数目 样本的观测值数目或样本容量(样本含量) 平方和 均方 样本标准差,用以估计总体标准差 σ 标准方差(均方) ,用以估计总体方差 σ2 无效假设 备择假设 标准误 自由度,自由度具体数值用 df 表示,如 df=8 变异系数 对照 观测次数 理论次数 F 统计数,F0.05 、F0.01 分别为 0.05、0.01 的临界值 最小显著差数(least significant difference) ( ) 最小显著极差(least significant ranges) 随机变量 x 服从参数 μ 和 σ 的正态分布,μ 为总体平均数,σ 为总体标准差 二项总体成数 p+q =1 随机变量 x 服从参数 n 和 p 的二项分布,n 为试验次数, p 为理论概率 直线回归方程中样本的回归截距 直线回归方程中标本回归系数 样本相关系数;独立性检验中相依表的行数 独立性检验中相依表的列数 观测次数 t 分布的统计数 u 正态分布的统计数;正态标准离差 样本平均数,用以估计总体平均数 μ 成对观测值的差数 成对观测值的差数的平均数 样本数或处理数
第 1 页 共 14 页

统计学课程知识点总结

1. 统计的研究对象的特点:数量性,总体性,变异性。 2. 统计研究的基本环节:统计设计,收集数据,整理与分析,统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点:同质性、大量性。 总体可分为有限总体和无限总体。 标志:总体各单位普遍具有的属性或特征。标志分为品质标志(表明单位属性,用文字、语言描述)和数量标志(表明单位数量,用数值表现)。 不变指标:一个总体中各单位有关标志的具体表现都相同。变异指标:在一个总体中,当一个标志在各单位的具体表现有可能都相同。 第二章 1. 统计调查方式:普查,抽样调查,重点调查,定期报表制度。 调查方式按调查的范围划分,可分为全面调查和非全面调查。 按时间标志可分为连续性(经常性)调查和不连续性(一次性)调查 (一) 普查是专门组织的一种全面调查。特点:非经常性调查、最全面调查。 (二) 抽样调查是一种非全面性调查,可分为概率调查和非概率调查。 (三) 重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查,它是一种不连续的调查。 (四) 定期报表制度又称统计报表制度,它是依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系:以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。 4. 统计分组的原则:穷尽原则和互斥原则。 (先分后组) 间断型分组和连续型分组,等距和异距注意事项 第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质: 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差(注意与样本方差的区别)P102: 10,11题 第四章 1. 事件的关系和运算:包含 ,相等 ,和 ,差 ,积 ,逆 ,不相容 。 2. 概率的计算:古典概型 ,几何概型 加法法则 ,乘法公式 条件概率 ,全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

教育与心理统计学自考大纲

Ⅰ课程性质与设置目的 一、课程性质与特点 教育与心理统计学是统计学运用于心理学和教育学领域所产生的一个应用 统计学分支,它的任务就是向心理学和教育学研究者提供分析心理现象和教育现象的数量规律性的统计分析工具。它是为培养和检验考生的教育与心理统计的基本理论知识,基本技能和实际应用能力而设置的专业基础课程,是进一步学习实验心理学、心理测量学、教育测量学等课程的前提。 该课程的特点:(一)逻辑分析性强;(二)概念和公式运用多;(三)运用各种统计分析方法量化地分析、认识教育和心理现象和规律。因此在考生自学及自考命题过程中,应充分地重视本课程的综合性和应用性的特点。 二、课程目的与要求 本课程的设置目的在于使自学应考者理解掌握教育与心理统计的基本概念 与基本原理,培养其描述统计分析能力和推断统计能力,并能用来解决教育教学以及管理研究方面的实际问题。考生应该懂得和掌握一些必要的统计分析方法,以便能独立分析资料、处理数据直至科学决策。 本课程的基本要求是:从总体上把握教育与心理统计学的基本理论,掌握教育与心理统计的基本概念、基本原理和基本方法;能够针对具体的问题按照要求对数据进行描述统计与推断统计分析处理;能够运用统计分析的原理与方法来解决教育、心理方面的实际问题。 三、本课程与相关课程的联系、分工和区别 教育与心理统计学是采用统计学的原理和方法来解决教育学和心理学课程中遇到的问题的一门课程,因此与教育学、心理学和统计学有相对密切的联系。统计学是教育与心理统计学的理论基础,因此具备一些统计学上的预备知识对于学习教育与心理统计学这门课程是必要的。当然,教育与心理统计学在内容上会更注重统计学在教育学和心理学方面的应用,具有更强的针对性和实用性。此课程是一种方法性课程,它为教育学和心理学的学习和研究过程提供了一种很好的工具,而教育学和心理学则为这种方法的学习提供了一种载体,在应用中不断得到理论和方法的完善。 考生在学习本课程应该把握两个要点:一是要全面了解教育与心理统计学的基础知识,以便在具体的应用中选择正确的数据处理方法;二是要注意结合教育学与心理学的理论和实践,在解决问题中理解和掌握数据统计处理的应用条件和操作过程。 《教育与心理统计学》教材的重点是2~8章,介绍教育学与心理学中常采用的数据统计处理方法,第1章是学习相关知识的基础,要求对此有相关的了解;第9~14章是知识的进一步深入,不要求掌握。

数量遗传学知识点总结

第一章绪论 一、基本概念 遗传学:生物学中研究遗传和变异,即研究亲子间异同的分支学科。数量遗传学:采用生物统计学和数学分析方法研究数量性状遗传规律的遗传学分支学科。 二、数量遗传学的研究对象 数量遗传学的研究对象是数量性状的遗传变异。 1.性状的分类 性状:生物体的形态、结构和生理生化特征与特性的统称。如毛色、角型、产奶量、日增重等。 根据性状的表型变异、遗传机制和受环境影响的程度可将性状分为数量性状、质量性状和阈性状3类。 数量性状:遗传上受许多微效基因控制,性状变异连续,表型易受环境因素影响的性状,如生长速度、产肉量、产奶量等。 质量性状:遗传上受一对或少数几对基因控制,性状变异不连续,表型不易受环境因素影响的性状,如毛色、角的有无、血型、某些遗传疾病等。 阈性状:遗传上受许多微效基因控制,性状变异不连续,表型易受或不易受环境因素影响的性状。有或无性状:也称为二分类性状(Binary traits)。如抗病与不抗病、生存与死亡等。分类性状:如产羔数、产仔数、乳头数、肉质评分等。 必须进行度量,要用数值表示,而不是简单地用文字区分; 要用生物统计的方法进行分析和归纳; 要以群体为研究对象; 组成群体某一性状的表型值呈正态分布。 3.决定数量性状的基因不一定都是为数众多的微效基因。有许多数量性状受主基因(major gene)或大效基因(genes with large effect)控制。 果蝇的巨型突变体基因(gt);小鼠的突变型侏儒基因(dwarf, df);鸡的矮脚基因(dw);美利奴绵羊中的Booroola基因(FecB);牛的双肌(double muscling)基因(MSTN);猪的氟烷敏感基因(RYR1)三、数量遗传学的研究内容

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

高校教育与心理统计学试卷附答案

某高校成教学院 教育与心理统计学结业试卷 20XX、X、X 姓名▁▁▁▁▁▁班级▁▁▁▁▁▁学号▁▁▁▁任职单位▁▁▁▁▁▁(说明:以下题目的答案数据一律保留2位小数) 一、4个数据分别为70、60、70、90。填出下表中所缺的统计指标名称、统计学符号、EXCEL函数及计算值。(28分) 注:差异系数以总体标准差为基准。 二、36个学生在一次测验中的得分如下: 606265687071717374757576 767777777879808080808182 828283858586868888888995 请以5分为一组制作简单次数分布表及次数分布多边图。(12分) 三、某年级甲、乙、丙三个班级学生人数分别为50人、55人、55人。期末数学考试各班的平均成绩分别为90分、90分、85分,使用加权平均数求全年级学生的平均成绩,并指出丙班的权数和权重。(10分) 四、在一次测验中,全班学生的成绩平均分为90分,标准差为4分。得94分的学生,他的标准分数为多少?另一个标准分数为-2 的学生,他的原始分数为多少?(6分) 六、分)

1、标准分数的平均数与标准差之和为▁▁▁▁: A、0 B、1 C、2 D、不是一个确定值 2、教育统计学与教育学科其它分支学科相比,其特点之一是通过对教育领域中大量数据进行分析以▁▁▁▁: A、发现其变化规律 B、预测其结局 C、描述相关 D、揭示其原因 3、在统计学书籍中,小写希腊字母一般用来表示▁▁▁▁。 A、集中量数 B、总体参数 C、 差异量数 D、样本统计量 4、下面哪一句话是错误的? A、称名数据即类别数据 B、计数数据是根据称名数据统计出来的 C、比率数据必然是等距数据 D、称名数据是测量水平最高的数据 5、在▁▁▁▁时,中数肯定与某一个原始数据的值相等。 A、原始数据按升序排列 B、原始数据为连续数据 C、原始数据个数为奇数 D、原始数据为顺序数据 6、相关系数的量纲单位▁▁▁▁。 A、与原始数据单位一致 B、无测度单位 C、是原始数据单位的平方 D、以占原始数据总和的百分比来表示 7、在统计分析中应用最为广泛的统计指标是▁▁▁▁。 A、平均数 B、标准分数 C、Z检验 D、相关系数 8、方差属于▁▁▁▁。 A、集中量数 B、差异量数 C、相关系数 D、总体参数 9、使用加权方法计算出来的平均数总是▁▁▁▁不使用加权方法计算出来的平均数。 A、等于 B、大于 C、大于或等于 D、上述答案都不对 10、两极差▁▁▁▁。 A、总是正数 B、总是负数 C、总是非负数 D、总是非零数 11、对几个样本平均数的差异进行统计检验通常使用▁▁▁▁。 A、Z检验B、F检验C、t检验D、Χ2 检验 12、全距为零,意味着全体数据▁▁▁▁。 A、全部相等B全部为零、C、的中数为零D、的平均数为零 13、扇形图又称为▁▁▁▁。 A、象形图 B、圆形图 C、曲线图 D、统计地图 14、几何平均数为零时,▁▁▁▁。 A、变化率为0 B、增长率为0 C、原始数据均为0 D、缺乏实际意义 15、教育统计学包括▁▁▁▁等分支。 A、描述统计B、推断统计C、教育评价D、教育测量

统计学知识点汇总情况

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。(4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析

描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用 对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 五、统计总体的特点 (1)大量性 大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求; (2)同质性 同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件; (3)变异性 变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。 六、标志与指标的区别与联系 ■区别: 标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。 标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。

相关主题
文本预览
相关文档 最新文档