北京师范大学《教育统计学》第十章 卡方检验3 20101129111840359
- 格式:ppt
- 大小:1.33 MB
- 文档页数:6
第十章卡方检验第一节卡方及其分布一.卡方检验的特点卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所做的假设检验,即根据样本的频数分布来推断总体的分布。
它与前面所讲的测量数据的假设检验的不同在于:1.测量数据的假设检验,其数据属于连续变量,而卡方检验的数据属于点计而来的间断变量。
2.测量数据所来自的总体要求呈正态分布,而卡方检验的数据所来自的总体分布是未知的。
3.测量数据的假设检验是对总体参数或几个总体参数之差所进行的假设检验;卡方检验在多数情况下是对总体分布的假设检验。
所以,卡方检验属于自由分布的非参数检验,凡可以应用比率进行检验的资料,都可以用卡方检验。
二.卡方检验统计量1.卡方检验统计量的基本形式为:f0表示实际频数,ft表示理论频数,∑表示总和例题一:从某校随机抽取50个学生,其中男生27人,女生23人,问该校男女生人数是否相同?解:根据男女生人数相同的假设,其理论频数应为50/2=25.于是卡方值就等于各组实际频数和理论频数差的平方与理论频数之比,再求其和。
2.卡方值的特点:可加性;永为正值;值的大小随实际频数与理论频数差的大小而变化(差越小,样本分布与假设理论分布越一致)。
三.的抽样分布一切可能个样本卡方值的频数分布,就形成了一个实验性的卡方抽样分布。
卡方分布的两个特点:呈正偏态,右侧无限延伸,但永不与基线相交;随自由度的变化而形成一簇分布形态。
自由度越小,偏斜度越大,自由度越大,分布形态越趋于对称。
第二节单向表的卡方检验把实得的点计数据按一种分类标准编制成表就是单向表。
卡方检验统计决断原则:一.按一定比率决定理论频数的卡方检验二.一个自由度的卡方检验1.各组ft>=5的情况2某组ft<5的情况当df=1,其中只要有一个组的ft<5,就要用亚茨连续性校正法,即在每一组实际频数与理论频数差数的绝对值平方之前,各减去0.5。
即三.频数分布正态性的卡方检验检验步骤:提出假设计算卡方值统计决断第三节双向表的卡方检验(双因素的卡方检验)把实得的点计数据按两种分类标准编制成的表就是双向表。
华东师大心理统计学大纲教材:《教育统计学》(王孝玲编著,修订版)华东师范大学出版社1993年6月第一版第一章绪论第一节什么是统计学和心理统计学一、什么是统计学统计学是研究统计原理和方法的科学。
具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。
统计学分为两大类。
一类是数理统计学。
它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。
它是数学的一个分支。
另一类是应用统计学。
它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。
应用统计学是与研究对象密切结合的各科专门统计学。
二、统计学和心理统计学的内容统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。
从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。
1.描述统计对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。
2.推断统计根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。
推断统计的内容包括总体参数估计和假设检验两部分。
3.实验设计实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。
其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。
以上三部分内容,不是截然分开,而是相互联系的。
第二节统计学中的几个基本概念一、随机变量具有以下三个特性的现象,成为随机变量。
第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。
0055《教育统计学》2021年6月期末考查说明本课程为考查课程,需要完成课程考查论文,不需要参加期末考试,有疑难问题,请到课程答疑区提问。
考查具体说明如下:·考核形式:在线提交论文·提交要求(1)请认真查看两项考核内容所占分值,并将以上两个考核内容按照顺序整合在一个word文档中,字数要求在2021字左右。
(最终提交一个文档。
)(2)请使用“北京师范大学网络教育课程论文”做为封面;正文使用宋体五号字;标题加粗。
(3)务必在规定时间内,网络学院在平台“课程考试---在线开放式考试”模块中上交,奥鹏平台按管理老师要求提交。
·考核内容一、结合学习或工作实际,简述学习教育统计学的意义和价值(2021以内)。
(10分)二、在给出的四个题目中选择一个完成一篇论文,每一题目的具体要求详见“第四点”。
(90分)1、论文基本框架(2021:本课程考核注重研究问题的价值和意义,学生须着重描述“为什么选择这样的研究方法”,并对“结论”进行解释说明。
原则上学生提交的论文中应该包括以下五个部分内容:一、问题提出二、研究意义三、实验过程四、使用的数据统计分析方法五、结论分析2、论文质量(70分)(1)研究中使用的数据可以采用考生自己虚拟的数据(也可以参考题中所给出的参考数据);(2)论文结构完整,逻辑清晰,内容详实,格式规范,可以结合自己的工作实例进行写作;(3)须独立完成,引用内容不得超过30%。
三、论文考核四个题目(请在以下四个题目中任意选择一个完成论文)1. 请利用课中讲授的卡方检验统计分析方法,结合日常工作实践,做出以下方面的数据统计分析,得出相应的研究结果,并根据研究结果撰写论文。
具体要求:参考如下数据(由于不能在计算机上计算,故仅用作模拟),应用卡方分析方法进行数据统计分析的研究:期望分布1(%) 53 13 11 6 14 3 总计:100%实际分布2(%) 44 11 15 5 16 9 总计:100%2. 请利用课中教授的协方差统计分析方法,结合日常工作实践,做出以下方面的数据统计分析,得出相应的研究结果,并根据研究结果撰写论文:具体要求:(1)应用协方差分析方法进行数据统计分析的研究;(2)在问题提出部分需要说明协变量(至少要有1个)的选择理由。
统计第十章卡方和二项检验一卡方检验下面的数据用什么统计方法?下面的数据用什么统计方法?参数与非参数检验⏹参数检验⏹用于等比/等距型数据⏹对参数的前提:正态分布和方差同质⏹非参数检验⏹不用对参数进行假设⏹对分布较少有要求,也叫distribution-free tests⏹用于类目/顺序型数据⏹没有参数检验敏感,效力低⏹因此在二者都可用时,总是用参数检验卡方匹配度检验⏹定义⏹用样本数据检验关于总体分布的形状或比率假设。
检验样本的分布比率与假设的总体分布的比率匹配度。
⏹是对次数分布的检验⏹研究情境⏹在医生职业中,男的多还是女的多?⏹在三种咖啡中,哪种被国人最喜欢?⏹在北京大学中,各国留学生的比例有代表性吗?卡方匹配度的虚无假设(1)⏹无偏好假设⏹分类之间没有差异⏹例如对保洁公司的洗发水品牌的爱好卡方匹配度的虚无假设(2)⏹与参照群体无差异⏹60%哈佛学生对本部食堂的伙食满意,40%哈佛学生对本部食堂的伙食满意。
⏹哈佛学生对1食堂的伙食的满意度是否与对2食堂的满意度是否有差异?观察次数⏹观察次数⏹样本中分到某一类别的个体的数目。
每个个体只能分到一个类别。
⏹用人格量表对被试施测后将被试分成3类期望次数⏹由虚无假设和样本的大小决定卡方匹配度检验的公式⏹χ2= ∑[(f0-f e)2/ f e]⏹ f e=pn⏹df =C-1⏹F0:观察次数⏹ f e :期望次数⏹C:类目的个数⏹Χ2:统计量卡方分布的性质(1)⏹卡方分布不是一个对称的分布,正偏态⏹随着自由度的增加越来越对称卡方分布的性质(2)⏹卡方的值是0或者是正数,不可能是负数。
⏹自由度(n-1)不同,卡方分布也就不同。
因此,卡方分布是一系列的曲线。
随着自由度的增加越来越接近对称。
卡方值⏹卡方值越小,越接近零,虚无假设正确的可能性越大,观察次数和期望次数之间越接近⏹类别的数量对临界值的影响⏹临界区域(Critical Region)例子1(数据虚构)⏹对保洁公司的洗发水使用者的爱好在品牌上是否有差异?调查了90人例1的解答step1虚无假设H0:保洁公司洗发水的消费者对3种品牌的偏好没有差异。