0272《心理统计学》2013年6月期末考试指导
- 格式:doc
- 大小:287.00 KB
- 文档页数:12
2009—2010学年第二学期《教育与心理统计学》期末考试试题A注:2(60)= 2=一、单项选择题(本大题共15小题,每小题2分,共30分)1.当我们按性别差异,将男性指定用数字“1”来代表,女性指定用数字“2”来代表,这里所得到的数据是( )A.称名数据B.顺序数据C.等距数据D.比率数据2.比较不同单位资料的差异程度,可以采用的统计量是( )A.差异系数B.方差C.全距D.标准差3..中数的优点是( )A.不受极端值影响B.灵敏C.适于代数运算D.全部数据都参与运算4.一班32名学生的平均分为72.6,二班40人的平均分为80.2,三班36人的平均分为75,则三个班级总平均分为()A.75.93 B.76.21 C.80.2 D.735.用平面直角坐标系上点的散布图来表示两种事物之间的相关性及联系模式,这种统计图是()A.散点图B.线形图C.条形图D.圆形图6.一组数据中任何两个相邻数据之比接近于常数,表示其集中量数应使用()A.算术平均数B.几何平均数C.中位数D.加权平均数7.随机现象中出现的各种可能的结果称为()A.随机事件B.必然事件C.独立事件D.不可能事件8.进行多个总体平均数差异显著性检验时,一般采用()A.Z检验B.t检验C.χ2检验D.方差分析9.已知P(Z>1)=,P(Z>=,则P(1<Z<等于( )统计学中最常见,应用最广的一种分布是( )A.概率分布分布 C.正态分布分布11.如果相互关联的两变量的变化方向一致(同时增大或同时减小),这表明两变量之间有( )A.完全相关B.负相关C.正相关D.零相关12.假设检验中的犯“取伪”错误的概率是( )A.αB.βαβ13.某实验选取了4个样本,其容量分别是n1=8,n2=9,n3=10,n4=8,用方差分析检验平均数间差异时,其组间自由度是( )=80所表示的含义是( )A.该生考试成绩为80分B.该生考试成绩为20分%的学生成绩高于该生%的学生成绩低于该生15.若将某班每个人的语文考试分数都加上10分,那么与原来相比其平均数和标准差的变化是()A.平均数减少,标准差不变B.平均数增加,标准差增加C.平均数增加,标准差不变D.平均数增加,标准差减少二、填空题(本大题共10小题,每小题1分,共10分)1.已求得算术平均数,中位数Mdn=71,则众数为_______。
统计学考试大纲I 考试目标《统计学》 考试目的是科学、 公平、有效地测试学生是否掌握统计学的基本概念和原理, 是否具备应用统计方法去分析和解决经济管理中实际问题的能力, 考试要求是测试考生掌握 数据收集、处理和分析的一些基本统计方法。
具体来说。
要求考生:理解统计学基本概念。
掌握数据收集和处理的基本方法。
掌握数据分析的基本原理和方法。
具有运用统计方法分析数据和解释数据的基本能力。
1. 2. 3. 4.II 1. 2.3. 4. 5. 6. 7. 8. 9.10. 11. 12. 13. 14. 15. 16. 17. 18.考查内容 统计学的基本概念 调查的组织和实施。
概率抽样与非概率抽样。
用图表展示定性数据。
用图表展示定量数据。
用统计量描述数据的水平:平均数、中位数、分位数和众数。
用统计量描述数据的差异:极差、标准差、样本方差。
抽样分布的概念和基本分布参数估计的基本原理。
一个总体参数的区间估计。
抽样调查中样本量的确定。
假设检验的基本原理。
一个总体参数的检验。
列联分析的基本原理方差分析的基本原理。
单因子方差分析的实现和结果解释。
变量间的关系;相关关系和函数关系的差别。
一元线性回归的估计和检验。
III考试形式和试卷结构 1、 2、 3、 考试形式:闭卷, 考核的重点内容: 试卷题型比例: 客观题 计算与分析题 可以带计算器;考试时间: 教材中的 客观题和计算与分析题40 题,每小题 1 分,共1、4、7、 8、 2 个小时;试卷满分为 100 分。
9、 10、11 章内容为考核重点。
40 分6 题,每小题 10 分,共 60 分x =12级财管统计学期末考试试题类型、单项选择题 (40题,40%)Z M i f ii T第1章5题 第2章5题 第3章3题 第4章4题 第6章3题 第7章4题 第8章5题 第9章3题 第10章4题 第11章4题二、计算与分析题(60%) 1、 集中趋势和离散趋势的计算;,2、 总体平均数及总体成数的区间估计;3、 总体均值的假设检验;4、 列联分析;9.1、9.35、 单变量方差分析; 4.6、4.8、4.117.7、7.11 8.4、8.7 10.6、10.7X =成人:X 1 X 2 +… X nX i127163.55cm i=1X 1 20(X i - X)2-0.09X iX 2X ni=13409 仃0.45cm因为它是一组数据的标准差与其相应的平均数之比,能够消除不同数组高低所产生的影响, 结果相对准确。
心理与教育统计学课后题答案心理统计学试题及答案张厚粲现代心理与教育统计学第一章答案张厚粲现代心理与教育统计学第一章答案第一章1 名词概念(1)随机变量)答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体)答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本)答:样本是从总体中抽取的一部分个体。
(4)个体)答:构成总体的每个基本单元。
(5)次数)是指某一事件在某一类别中出现的数目,又称作频数,用 f 表示。
(6)频率)答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率)答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件 A 在所有试验中发生的可能性大小的量值,称为事件 A 的概率,记为P(A)。
(8)统计量)答:样本的特征值叫做统计量,又称作特征值。
(9)参数)答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值)答:随机变量的取值,一个随机变量可以有多个观测值。
2 何谓心理与教育统计学?学习它有何意义?何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
心理统计学学习通课后章节答案期末考试题库2023年1.一组服从正态分布的数据,平均数为50,标准差为5,则Z值为-2.58的原始数据是( )参考答案:37.102.如果一个数等于平均数,其对应的Z值为( )。
参考答案:零3.当我们按性别差异,将男性指定用数字“1”来代表,女性指定用数字“2”来代表,这里所得到的数据是( )。
参考答案:称名变量4.4、若描述不同性别的儿童在小学入学时和小学毕业时的自尊水平差异,应该使用( )。
参考答案:条形图5.主要用于求解学习速度问题的是( )。
参考答案:调和平均数6.既有相等单位也有绝对零点,可以进行四则运算的数据类型是( )。
参考答案:比率数据7.6、落在某一特定类别或组中的数据个数称为( )。
参考答案:次数8.有相等单位,但无绝对零点,可以进行加减运算,但不能进行乘除运算的数据类型是( )。
参考答案:等距数据9.有一组数据:3,6,2,7,32,4,8,6,5。
要描述这组数据的特征,受极端数据值影响的统计量是( )。
参考答案:平均数10.适用于描述某种心理属性在时间上变化趋势的统计图是( )。
参考答案:线形图11.有一组数据其均值是20,对其中的每一个数据都加上10,那么得到的这组新数据的均值是( )。
参考答案:3012.在一组正态分布的数据中,去掉两端极值后,一定不会受到影响的统计特征值是( )。
参考答案:众数13.下列易受极端数据影响的统计量是( )。
参考答案:算术平均数14.一组数据的分布曲线呈双峰状态,据此可以推测该组数据中可能有两个( )。
参考答案:众数15.某城市调查8岁儿童的身高情况,所用单位为厘米,根据这批数据计算得出的差异系数( )。
参考答案:无单位16.某考生在一项测验中得分60,经换算百分等级为70,这表明在所有考生中,得分低于该考生的人数占总人数的( )。
参考答案:70%17.有组数据:2,3,4,5,6,7,8。
该组数据的平均数和标准差分别是5和2。
东北师范大学22春“心理学”《心理统计学》期末考试高频考点版(带答案)一.综合考核(共50题)1.假设检验的步骤有以下哪些?()A、根据问题要求,提出虚无假设和备择假设B、选择适当的检验统计量C、规定显著性水平D、计算检验统计量E、根据结果进行决策参考答案:ABCDE2.统计中常用的连续分布()A.正态分布B.t分布C.二项分布D.负指数分布E.威布尔分布参考答案:ACDE3.欲比较统一团体中不同观测值的离散程度,最合适的指标是()A.全距B.方差C.四分互差D.变异系数参考答案:C4.在进行心理学研究时,首先要做的是确定研究对象,这就涉及到()。
A、总体的确立B、描述统计C、样本的选取E、方差分析参考答案:AC5.如果两个方差同质性不能满足,对总体进行估计时可靠性会大大降低。
()A.错误B.正确参考答案:B6.从人类学角度,首先发现回归现象的是()A.达尔文B.高尔顿C.高斯D.瑟斯顿参考答案:B7.如果知道了算术平均数,中数与众数的大小,就可以大概知道分布的倾斜情况。
()A、错误B、正确参考答案:B8.T检验是一种推论统计,它考察的是()。
A、根据总体分布来预测样本分布B、根据样本分布来推断总体分布C、已知样本分布和总体分布的差异性D、判断样本分布是否符合总体分布参考答案:B在行为科学研究中,通过尝试拒绝虚无假设来进行假设检验。
()A.错误B.正确参考答案:B10.双侧检验是关于()的检验A.同时强调两者间差异和方向性B.只强调差异而不强调方向性C.只强调方向性而不强调差异D.两者都不强调参考答案:B11.在一定条件下,两样本平均数之差的分布、样本相关系数的分布和回归系数等的分布也服从t分布。
()A、错误B、正确参考答案:A12.描述统计是来描绘或总结的观察量的基本情况的统计总称。
()A.错误B.正确参考答案:B13.有联系的两列变量可采用什么分布表?()A、相对次数分布表B、累加次数分布表C、双列次数分布表D、简单次数分布表参考答案:C14.影响假设检验力的因素主要有以下几种:()A.样本容量大小B.总体方差C.处理效应大小D.显著性水平大小E.检验的方向性参考答案:ACDE15.在统计假设检验中,对α和β错误的描述是()。
上海财经大学浙江学院《统计学》期末考试卷(A 卷)(2013—2014学年第一学期)考试形式 闭卷 使用学生 2011级国际商务学专业 考试时间 120分钟 出卷时间 2013年12月5日说明:考生应将全部答案都写在答题纸上,否则作无效处理。
答题时字迹要清晰。
姓名 学号 班级一、单项选择题(每题1分,共15分)1.在回归分析中,F 检验主要是用来检验( )。
A .相关系数的显著性B .回归系数的显著性C .线性回归方程的显著性D .估计标准误差的显著性2.先对总体各单位按某一主要标志加以分类,再按随机原则从各类中抽取一定的单位进行调查,这种抽样调查形式称为( )。
A .简单随机抽样B .等距抽样C .整群抽样D .类型抽样 3.抽样调查所必须遵循的原则是( )。
A. 准确性原则 B. 随机性原则 C. 可靠性原则 D. 灵活性原则4.其他条件不变时,置信度越高,则置信区间( )。
A .越小B .越大C .不变D .无法判断 5.在假设检验中,显著性水平α是( )。
A .原假设为真时被拒绝的概率B .原假设为真时被接受的概率C .原假设为伪时被拒绝的概率D .原假设为伪时被接受的概率6.用最小二乘法拟和直线回归方程时,其基本思想是使 ( )。
A. ∑-)(y y 最小B. 2)(∑-y y 最小C.∑-)ˆ(yy 最小 D.∑-2)ˆ(y y 最小7.说明回归直线拟合程度的统计量主要是( )。
A .相关系数B .回归系数C .判定系数D .变异系数8.已知两个同类型企业职工平均工资的标准差分别是500元和600元,则两个企业职工平均工资的代表性是( )。
A.甲大于乙 B.乙大于甲 C.一样的 D.无法判断 9.离散程度测定指标中,最容易受极端值影响的是( )。
A .极差B .平均差C .标准差D .四分位差10.某百货公司今年同去年相比,各种商品的价格的综合指数为105%,这说明( )。
A.商品价格平均上涨了5%B.商品销售量平均上涨了5%C.由于价格提高使销售量上涨了5%D.由于价格提高使销售额上涨了5%11.下列相对数中,一般用复名数表示单位的是:()A、计划完成相对数B、比较相对数C、比例相对数D、强度相对数12.以12个月为一个周期的变动,称为()。
共 3 道大题,满分 100 分一、单选题(共 15 道小题,共 30 分)1. 假设检验中两类错误的关系是( )。
(2 分)A. α+β=1B. α=βC. α+β=1/2D. α+β不一定等于1【答案】D【解析】α+β不一定等于1,因为两者是在两个前提下的概率。
α是拒绝H0时犯错误的概率,β时接受H0时犯错误的概率。
2. 下列统计量中对数据变化灵敏性最差的是( )。
(2 分)A. 方差B. 平均差C. 算术平均数D. 众数【答案】D【解析】众数指出现次数最多的数,对数据变化灵敏性差。
3. 在假设检验中,α取值越大,称此假设检验的显著性水平( )。
(2 分)A. 越明显B. 越不明显C. 越高D. 越低【答案】D【解析】在假设检验中,α取值越大,称此假设检验的显著性水平越低4. 某次英语考试的标准差为5.1分,考虑到这次考试的题目太难,评分时给每位应试者都加了10分,加分后成绩的标准差是( )。
(2 分)A. 4.9B. 15.1C. 5.1D. 10【答案】C【解析】标准差计算公式的运用5. 当一个实验( )时,我们才能得到交互作用。
(2 分)A. 自变量多于1个B. 因变量多于1个C. 自变量多余2个水平D. 因变量多于2个水平【答案】A【解析】当一个实验自变量多于1个时,我们才能得到交互作用。
6. 在统计假设检验中,同时减少α和β错误的最好办法是( )。
(2 分)A. 控制α水平,使其尽量小B. 控制β值,使其尽量小C. 适当加大样本容量D. 完全随机取样【答案】C【解析】在统计假设检验中,同时减少α和β错误的最好办法是适当加大样本容量7. 已知某次高考的数学成绩服从正态分布,从这个总体中随机抽取n=36的样本,并计算得其平均分为79,标准差为9,那么下列成绩不在这次考试中全体考生成绩均值μ的0.95的置信区间之内的有( )。
(2 分)A. 81B. 79C. 83D. 77【答案】C【解析】总体平均数估计公式运用8. 已知一组数据服从正态分布,平均数为80,标准差为10。
2009—2010学年第二学期《教育与心理统计学》期末考试试题A注:t0.05/2(60)=2.00 Z0.05/2=1.96一、单项选择题(本大题共15小题,每小题2分,共30分)1.当我们按性别差异,将男性指定用数字“1”来代表,女性指定用数字“2”来代表,这里所得到的数据是( )A.称名数据B.顺序数据C.等距数据D.比率数据2.比较不同单位资料的差异程度,可以采用的统计量是( )A.差异系数B.方差C.全距D.标准差3..中数的优点是( )A.不受极端值影响B.灵敏C.适于代数运算D.全部数据都参与运算4.一班32名学生的平均分为72.6,二班40人的平均分为80.2,三班36人的平均分为75,则三个班级总平均分为()A.75.93 B.76.21 C.80.2 D.735.用平面直角坐标系上点的散布图来表示两种事物之间的相关性及联系模式,这种统计图是()A.散点图 B.线形图 C.条形图 D.圆形图6.一组数据中任何两个相邻数据之比接近于常数,表示其集中量数应使用()A.算术平均数 B.几何平均数 C.中位数 D.加权平均数7.随机现象中出现的各种可能的结果称为()A.随机事件 B.必然事件 C.独立事件 D.不可能事件8.进行多个总体平均数差异显著性检验时,一般采用()A.Z检验 B.t检验 C.χ2检验 D.方差分析9.已知P(Z>1)=0.158,P(Z>1.96)=0.025,则P(1<Z<1.96)等于( )A.0.133B.0.183C.1.58D.3.5810.统计学中最常见,应用最广的一种分布是( )A.概率分布B.t分布C.正态分布D.F分布11.如果相互关联的两变量的变化方向一致(同时增大或同时减小),这表明两变量之间有( )A.完全相关B.负相关C.正相关D.零相关12.假设检验中的犯“取伪”错误的概率是( )A.αB.βC.1-αD.1-β13.某实验选取了4个样本,其容量分别是n1=8,n2=9,n3=10,n4=8,用方差分析检验平均数间差异时,其组间自由度是( )A.3B.8C.31D.3514.PR=80所表示的含义是( )A.该生考试成绩为80分B.该生考试成绩为20分C.80%的学生成绩高于该生D.80%的学生成绩低于该生15.若将某班每个人的语文考试分数都加上10分,那么与原来相比其平均数和标准差的变化是()A.平均数减少,标准差不变 B.平均数增加,标准差增加C.平均数增加,标准差不变 D.平均数增加,标准差减少二、填空题(本大题共10小题,每小题1分,共10分)1.已求得算术平均数,中位数Mdn=71,则众数为_______。
心理统计考试试题及答案分析。
XXXX年第二学期《教育与心理统计学》期末考试试题一注:t0.05/2(60)=2.00 Z0.05/2=1.961.单项选择题(共15题,每题2分,共30分)1。
根据性别差异,当我们用数字“1”代表男性称谓,用数字“2”代表女性称谓时,这里获得的数据是()a .名义数据b .顺序数据c .等距数据d .比率数据2。
比较不同单位数据之间的差异程度。
可以使用的统计数据有:a .差异系数b .方差c .全距离d .标准偏差3.中值的优点是:不受极值影响;敏感;适合代数运算;所有数据都包含在运算中。
一班32名学生的平均人数是72.6,二班40名学生的平均人数是80.2,三班36名学生的平均人数是75。
然后将三类的总平均值分为()a.75.93b.76.21c.80.2d.735。
平面直角坐标系上的点的散点图用来表示两者之间的相关性和联系方式。
这张统计图是散点图,线形图,条形图,圆形图。
一组数据中任意两个相邻数据的比率接近常数。
据说集中量的数量应该用()a .算术平均数b .几何平均数c .中位数d .加权平均数7。
由随机现象产生的各种可能的结果被称为(a)随机事件(b)不可避免事件(c)独立事件(d)不可能事件(8)。
在检验多重总体均值差异的显著性时,一般采用()a.z 检验、b.t检验、c.χ 2检验、d .方差分析9。
如果已知P(Z1)=0.158,P(Z1.96)=0.025,那么P(11.96)等于()a.0.133b.0.183c.1.58d.3.5810。
最广泛使用的分布之一是()a .概率分布B.t分布c .正态分布D.F分布11。
如果两个相互关联的变量的变化方向相同(同时增加或减少),这表明存在(a)完全相关(b)负相关(c)正相关(d)零相关(12)。
假设检验中出现“错误”错误的概率为()a .αb .βc . 1-t 0.05/2(60)=2.00 z 0.05/2=1.961.单项选择题(共15题,每题2分,共30分)1。
0272《心理统计学》2013年6月期末考试指导一、考试说明本课程闭卷考试,满分100分,考试时间90分钟。
考试题型可能有以下几种:1、选择题2、判断题3、名词解释4、填空题5、简答题6、应用计算题二、重点复习内容(一)绪论1、心理学统计学的内容:描述统计、推论统计、实验设计。
描述统计:主要研究如何整理心理学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事件的性质。
推论统计:主要研究如何通过局部数据所提供的信息,推论总体的情况。
实验设计:主要目的在于研究如何科学地、经济地以及更有效地进行实验。
2、心理统计基础概念:计数数据:是指计算个数的数据,一般属性的调查获得的是此类的数据,具有独立的分类单位。
测量数据:是指借助于一定的测量工具或一定的测量标准而获得的数据。
称名数据:只说明某一事物与其他事物在属性上的不同或类别上的差异,只计算个数,并不说明事物之间差异的大小。
顺序数据:指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。
等距数据:具有相等单位,但无绝对零的数据,只能使用加减运算,不能使用乘除运算。
比率数据:即表明量的大小,也有相等单位,同时还具有绝对零点。
连续数据:指任何两个数据点之间都可以细分出无限多个大小不同的数值。
离散数据:又称不连续数据,这一类数据在任何两个数据点之间所取得的数值的个数是有限的。
其他概念:变量、观测值、随机变量、总体、个体、样本、次数、比率、频率、概率、参数。
(二)统计图表1、数据的初步整理:在数据排序和统计分组。
2、次数分布表:各种次数分布的列表形式和图示形式。
次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。
编制分组次数分布表的步骤包括求全距;决定组距与组数;列出分组区间;登记次数;计算次数。
3、次数分布图:常用的次数分布图有直方图、次数多边形图以及累加次数分布图。
直方图:又称等距直方图,以矩形的面积表示连续性随机变量次数分布的图形。
纵轴表示频数,横轴表示数据的等距分组点,即各组区间的上下限,有时用组中值表示。
次数多边形图:一种表示连续性随机变量次数分布的线形图,属于次数分布图。
横坐标是用各组组中值表示的连续变量,纵坐标是数据的频数。
其它常用的统计图:条形图、圆形图、线形图、散点图。
(三)集中量数集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。
1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M 表示。
平均数的计算方法:①未分组数据的计算方法是将所有的数据相加,然后再用数据的个数去除数据总和。
②根据次数分布表计算平均数,需要使用各分组区间的组中值来代表落入该区间的各个原始数据,公式如下:平均数= (∑f Xc) / N 式中:Xc 为各区间的组中值 f 为各区间的次数N 为数据的总次数60,N =∑f 2、中数与众数中数概念:又称中点数,中位数,中值。
符号为Md 或Mdn 。
中数是按一定顺序排列在一起的一组数据中居于中间位置的数。
众数概念:又称为密集数、范数等,常用符号M 0表示,众数是指在次数分布中出现次数最多的那个数的数值。
3、平均数、中数与众数三者之间的关系在正态分布中三者相等,在正偏态分布中,平均数大于中数,中数大于众数。
在负偏态分布中,平均数小于中数,中数小于众数。
M<Md<Mo 。
对于数据较多的资料,其算术平均数与中位数的值不会相差太大。
4、其他集中量数:加权平均数、几何平均数和倒数平均数。
加权平均数适合解决用各个平均数求整体平均数之类的问题,倒数平均数适用于求平均速率一类问题,几何平均数适用于解决求增长比率的平均数一类的问题(四)差异量数差异量数是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。
1、全距与百分位差全距又称两极差,用符号R 表示,用最大值减去最小值就是全距。
百分位差是用百分位数之间的差值来表示离中趋势的一种差异量数。
2、标准差、方差方差:也称变异数,均方。
作为样本统计量,用符号s 2表示,作为总体参数,用σ2表示。
它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。
其基本计算公式如下:2()/s X X N =∑-。
X 表示原始数据,X 表示平均数,N 为数据总数。
标准差:即方差的平方根,用s 或SD 表示,若是总体则用σ表示。
基本计算公式如下:s =f 为各组区间的次数。
N 为总次数。
方差性质:可加性、可分解性标准差特性:每一个观察值都加一个相同常数C 之后,计算得到的标准差等于原标准差。
每一个观察值都乘一个相同常数C ,则所得到的标准差等于原标准差乘以常数C 。
以上两点结合,每一个观察值都乘以一个常数C (C 不等于0),再加上一个常数d ,所得标准差等于原标准差乘以常数C 。
方差、标准差的意义:是表示一组数据离散程度的最好指标。
其值越大,表示数据的离散程度越大,该组数据越分散;其值越小,表示次数分布的数据比较集中,数据的离散程度越小。
3、差异系数:又称变异系数、相对标准差等,是一种相对差异量,用CV 表示,为标准差对平均数的百分比,计算公式:CV=标准差/平均数×100%。
4、标准分数:又称Z 分数,是以标准差为单位表示一个原始分数在团体中所在的位置量数。
离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。
计算公式:Z=(原始分数﹣平均数)/标准差 标准分数的优点:可比性、可加性、明确性、稳定性。
标准分数的应用:用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低;计算不同质的观测值的总和或平均数,以表示在团体中的相对位置;表示标准测验分数。
不同的差异量数适用于描述特定的数据分布的离散程度。
(五)相关系数相关系数用于描述双变量数据相互之间的关系,是两列变量间相关程度的数字表示形式,或者说是用来表示相关强度的指标。
样本相关系数用r 表示,总体一般用ρ表示。
1、相关系数的解释:不能做因果解释,只是表示两个变量之间关系的程度;相关系数取值的大小表示相关的强弱程度,不能用倍数关系来解释,只能说绝对值大者必绝对值小者相关更为密切;可能存在伪相关。
2、积差相关适用的数据资料:要求成对数据,即若干个体中每个个体都有两种不同的观测值;两列变量各自总体的分布都是正态,即正态双变量,至少两个变量服从的分布应是接近正态的单峰分布;两个相关的变量是连续变量(比率或等距数据),也即两列变量都是测量数据;两列变量之间的关系应该是直线性的。
计算公式:x yxyr Ns s ∑=,其中x 、y 为两个变量的离均差,x=X-X ,y Y Y =-。
N 为成对数据的数目,x s 为X 变量的标准差,y s 为Y 变量的标准差。
原始数据公式NY Y N X X NY X XY r 2222)()(∑-∑∙∑-∑∑⋅∑-∑=3、等级相关斯皮尔曼等级相关:适用于两列变量为等级变量性质的具有线性关系的资料,在于要用于解决称名数据和顺序数据的相关问题。
肯德尔等级相关:肯德尔和谐系数,是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量,用符号W 表示。
4、质与量相关,包括点二列相关和二列相关以及多系列相关。
适用于处理的变量中有类别数据。
点二列相关:主要用于处理二分称名数据和一个连续数据之间的相关程度。
二列相关:处理的都是连续性数据资料,但其中一列变量被人为划分成了二分变量。
多列相关:是二列相关的发展,其中一列变量被人为划分成了二个以上的类别。
5、品质相关:处理的数据类型一般是计数数据,而非测量数据,主要有四分相关、φ相关、列联相关。
6、相关系数的选择:主要取决于要处理数据的性质类别以及某一相关系数需要满足的假设条件。
偏相关和部分相关:是研究消除第三变量(或其他多个变量)影响后的两列变量间相关程度的方法。
(六)概率分布 1、概率的基本性质概率的公理系统:任何一个随机事件A 的概率都是非负的;在一定条件下,必然发生的必然事件的概率为1;在一定条件下必然不发生的事件,既不可能事件的概率为0。
任何一个随机事件的概率介于0和1之间。
在统计推断中小概率事件一般被称为不可能发生的事件。
事件的概率仅由事件本身决定,与我们用什么方法去求它无关。
2、正态分布正态分布的特征:正态分布的形式是对称的,它的对称轴是经过平均数点垂线,平均数、中数、众数相等;正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式先向内弯,然后向外弯。
拐点位于负1个标准差处,曲线两端向靠近基线处无限延伸,但不能与基线相交;正态曲线下的面积为1,平均数将其分为左右相等的两部分,各位0.50;正态分布为一族分布。
均值为0,标准差为1的正态分布为标准正态分布。
3、二项分布二项分布是指试验仅有两种不同性质结果的概率分布,即各个变量都可以归结为两个不同性质中的一个,两个观测值是对立的,以因而二项分布也可说是两个对立事件的概率分布。
4、样本分布:是样本统计量的分布,是统计推论的重要依据。
常用的样本分布有平均数及方差的分布。
(1)平均数的样本分布:所谓平均数的样本分布是指从随机变量为正态分布的总体中,采取有放回随机抽样方法,每次从这个总体中抽取大小为n 的一个样本,计算出它的平均数,这样抽取无限多次就将获得无限多个平均数,这无限多个平均数构成的分布就是平均数的样本分布。
当样本足够大时,样本分布与总体分布相同。
正态分布以及渐进正态分布:①样本平均数的分布:总体分布为正态,方差已知,样本平均数的分布是正态分布。
总体分布非正态,但2σ已知,样本容量足够大时(n ≥30),样本平均数的分布为渐进正态分布。
②方差与标准差的分布:自正态总体中抽取容量为n 的样本,当n 足够大时(n ≥30),样本方差及标准差的分布,渐趋于正态分布。
T 分布:①t 分布的特点:平均值为0;以平均值0左右对称的分布,左侧t 为负值,右侧t 为正值;变量取值在-∞-+∞之间;当样本容量趋于∞时,t 分布为正态分布,方差为1;当n-1>30以上时,t 分布接近正态分布,方差大于1,随n-1的增大而方差渐趋于1;当n-1<30时,t 分布于正态分布相差较大,随n-1的减少,离散程度越大,分布图的中间变低但尾部变高。
②样本平均数的分布:总体为正态分布,方差2σ未知时,样本平均数的分布为t 分布;当总体分布为非正态而方差又未知时,若满足n >30这一条件,则样本平均数的分布近似为t 分布。
2χ分布:2χ分布为正偏态分布;2χ值都为正值;2χ分布的和也是2χ分布,即2χ分布具有可加性;2χ分布是连续型分布,但有些离散型的分布也近似2χ分布;若果df 大于2,这是2χ分布的平均数:2x df μ=,方差222x df σ=。