卡方检验.分类变量资料统计推断
- 格式:ppt
- 大小:4.22 MB
- 文档页数:88
卫生统计学考研试题名词解释总结1、typical survey:典型调查,典型调查就是在调查对象中有意识的选择若干具有典型意义或者代表的单位进行非全面调查。
2、箱式图(box plot):用于多组数据的直观比较分析。
一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制。
3、二项分布(binorminal distribution):若一个随机变量X,它的可能取值是0,1,…,n,而且相应的取值概率为称此随机变量X服从n,π为参数的二项分布。
4、morbidity statistics:疾病统计,是居民健康统计的重要内容之一,它的任务是研究疾病在人群中发生、发展及其流行的规律,为病因学研究、疾病防治和评价疾病防治效果提供科学依据。
5、life expectancy:期望寿命,是指x岁尚存者预期平均尚能存活的年数,它是评价居民健康状况的主要指标。
6、life table:寿命表,又称为生命表,是根据特定人群的年龄组死亡率编制出来的一种统计表。
由于它是根据各年龄组死亡率计算出来的,因此,各项指标不受人口年龄构成的影响,不同人群的寿命表指杯具有良好的可比性。
7、预测(forecast):这是回归方程的重要应用方面。
所谓预测就是把预测因子(自变量X)代入回归方程,对预报量(应变量Y)进行估计,其波动范围可以按照个体Y值容许区间方法计算。
8、standard deviation:标准差,常用来描述数据离散趋势的统计指标,其能反映均数代表性的好坏,以及变量值与均数的平均离散程度。
9、cluster sampling:整群抽样,首先将总体按照某种与研究目的无关的分布特征(如地区范围、不同的团体、病历、格子等)划分为若干个“群”组,每个群包括若干观察单位;然后根据需要随机抽取其中部分“群”,并调查被抽中的各”群”中的全部观察单位。
这种抽样方法称为整群抽样。
10、precision:精密度,是指重复观察时,观察值与其均数的接近程度,其差值属于随机误差11、正交设计(orthogonal design):当实验涉及的因素在三个或三个以上,且因素间可能存在交互作用时,可用正交试验设计。
第九章 2χ检验[教学要求]掌握:单个样本分布的拟合优度检验;独立样本2×2列联表资料的χ2检验;独立样本R ×C 列联表资料的χ2检验;配对2×2列联表资料的χ2检验。
熟悉:配对R × R 列联表资料的χ2检验;四格表资料的Fisher 确切概率法。
了解:连续型随机变量的χ2分布;分类数据χ2检验的基本思想。
[重点难点]第一节2χ分布和拟合优度检验一、χ2分布基本概念:χ2分布是一种连续型随机变量的概率分布,如果12,,,Z Z Z ν 是v 个相互独立的标准正态分布随机变量,则22221νZ Z Z +++ 的分布称为服从自由度为ν的χ2分布。
2χ分布的概率密度曲线的形状依赖于自由度ν的大小。
二、拟合优度χ2检验的基本思想拟合优度检验是根据样本的频率分布检验其总体分布是否符合某给定的理论分布。
2χ值反映了样本实际频率分布与理论分布的符合程度。
三、χ2检验的基本公式大样本时检验统计量∑=-=ki ii i T T A 122)(χ近似地服从χ2分布,自由度为ν= k -1-(计算T i 时利用样本资料估计的参数个数)其中,A i 和T i 分别为实际观察频数和0H 成立时的理论频数,k 为频数分布的类别总数。
四、拟合优度χ2检验注意事项1.分组不同拟合的结果可能不同,一般要求分组时每组中的理论频数不小于5。
2.需要有足够的样本含量,如果样本含量不大,需要经连续性校正,校正的公式为∑=--=ki ii i T T A 122)5.0(χ第二节 独立样本2×2列联表资料的χ2检验一、2×2列联表资料χ2检验目的两独立样本率差异的比较。
即根据两独立样本的频率分布,检验两个样本的总体分布是否相同。
二、统计量计算公式可直接使用χ2检验基本公式也可使用等价的专用公式或校正公式。
专用公式22()()()()()ad bc n a b c d a c b d χ-=++++校正公式22(||/2)()()()()ad bc n n a b c d a c b d χ--=++++自由度ν=1。
卡方检验是一种统计检验方法,用于比较两个或多个分类变量之间的差异是否具有统计学意义。
它主要用于推断两个分类变量之间是否存在关联或独立性。
卡方检验的原理是通过比较实际观察到的频数与期望频数之间的差异来判断两个变量之间是否存在显著的关联。
在卡方检验中,首先计算每个单元格中的实际频数与期望频数之间的差异,然后将这些差异平方后相加,得到卡方值。
最后,根据卡方分布的概率密度函数来确定卡方值是否落在拒绝域内,从而判断两个变量之间的关联是否具有统计学意义。
卡方检验可以用于多种情况,如检验两个分类变量之间是否存在关联、检验多个分类变量之间的独立性、检验频数分布的拟合优度等。
在实际应用中,需要根据具体问题选择合适的卡方检验方法,并结合样本大小和显著性水平来判断结果的可靠性。
需要注意的是,卡方检验的前提是样本必须是随机样本,并且每个单元格中的频数不应过小。
如果样本不满足这些条件,可能会导致卡方检验的结果不准确。
此外,卡方检验只是一种统计推断方法,不能证明因果关系的存在,需要结合实际情况进行综合分析。