当前位置:文档之家› 在列联表分析中的应用

在列联表分析中的应用

在列联表分析中的应用
在列联表分析中的应用

8.4 列联表独立性分析案例(2)

8.4 列联表独立性分析案例(2) 一、教学目标 (一)知识目标 通过对典型案例(如“新药的副作用 ”“秃顶与患心脏病是否有关系”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。 (二)能力目标 让学生经历数据处理的过程,提高探索解决问题的能力。 (三)情感目标 通过独立性检验的基本思想的学习,让学生有真正对统计思维和确定思维差异的理解,体会到统计在现实生活的广泛应用。 二、教学重点 理解独立性检验的实施步骤 三、教学难点 理解独立性检验的实施步骤 四、教学过程 (一)引入课题 1.复习 A :独立性检验 B : () ()()()() 2 2 n ad bc k a b c d a c b d -= ++++ 2.独立性检验的思想(类似反证法) (二)案例讲解 了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50位患者服用安慰剂,得到下列实验数据: 请问服用新药是否可产生副作用? 分析: 假定服用新药与产生副作用没有关联.那么,首先要给“没有关联”下一个“能够操作”的定义。根据直观的经验,在服用新药与产生副作用的情形下,这个定义可以是这样的:如果服用新药与产生副作用没有关联,就意味着,无论服用新药与否,产生副作用的概率都是一样的。就此例题而言: .19.0100 19)(== 全体实验者产生副作用 P , 3.050 15)(== 服用新药产生副作用 P 二者相差较大。由此可以推断,开始的假设是不成立的。也就是说,服用新药与产生副作用是有关联的。

由统计的常识知道,要求等号成立是非常苛刻的条件,实际上一般也是办不到的,我们所能追求的是在概率意义下的可靠性。对于上面的独立性问题,我们应当寻找一个适当的统计量,用它的大小来说明独立性是否成立。在统计中,我们引入下面的量 在前面的例 子中 a =15, b =35, c =4, d =46。注意到独立性要求: P (全体生实验者产生副作用)=P (服用新药产生副作用) 即 b a a n c a += + 这等价于 n a n c a n b a = +? + 因此,可以用n c a n b a n a +? +- 的大小来衡量独立性的好坏。 问题: (1)用 n c a n b a n a +?+- + n d b n b a n b +?+- + n c a n d c n c +? +- + n d b n d c n d +? +- 是不是更好些? (2)用n c a n b a n c a n b a n a +?++?+- | | 比用n c a n b a n a +? +-合理,你认为有道理吗? (3)为了得到统计量的近似的分布,统计学家最终选用了: Q 2 =?? ??? ? ??+?++?+-++?++?+-++?++?+-++?++?+-n d b n d c n d b n d c n d n d c n c a n d c n c a n c n d b n b a n d b n b a n b n c a n b a n c a n b a n a n 2222)()()()( 用它的大小来衡量独立性的大小,你能把它化简得到下式吗? ,) )()()(() (2 2 d b c a d c b a bc ad n Q ++++-= c +

SPSS统计分析教程列联表分析

2 列联表分析(Crosstabs) 列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。其中卡方检验是分析列联表资料常用的假设检验方法。 例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1(℃)分为3级(1级为16.5℃以下,2级为16.6-17.8℃,3级为17.8℃以上),6月上旬平均气温x2(℃)分为3级(1级为20℃以下,2级为20.1-21.5℃,3级为21.5℃以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。数据如下表。 山东烟台历年观测数据分级表() 注:摘自《农业病虫统计测报》 131页。 1) 输入分析数据 在数据编辑器窗口打开“”数据文件。 数据文件中变量格式如下: 2)调用分析过程 在菜单选中“Analyze-Descriptive- Crosstabs”命令,弹出列联表分析对话框,如下图 3)设置分析变量 选择行变量:将“五月气温[x1],六月上气温[x2],六月上降雨[x3],六月中降雨[x4]”

变量选入“Rows:”行变量框中。 选择列变量:将“玉米螟卵高峰发生期[y]”变量选入“Columns:”列变量框中。 4)输出条形图和频数分布表 Display clustered bar charts: 选中显示复式条形图。 Suppress table: 选中则不输出多维频数分布表。。 5)统计量输出 点击“Statistics”按钮,弹出统计分析对话框(如下图)。 Chi-Square: 卡方检验。选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验 (Continuity Correction)及Fisher精确概率检验(Fisher’s Exact test)的结果。 Correlations: 选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。 Nominal: 两分类变量的关联度(Association)测量 Contingency Coefficient: 列联系数,其值越大关联性越强。 Phi and Cramer’s V:Cramer列联系数,其值越大关联性越强。 Lambda: 减少预测误差率,1表示预测效果最好,0表示预测效果最差。 Uncertainty Coefficient: 不定系数 Ordinal: 两有序分类变量(等级变量)的关联度测量 Gamma: 关联度,+1表示完全正关联,-1表示负关联,0表示无联。 Somers’d:列联度,其取值范围和意义同上。 Kendall’s tau-b: Nominal by Interval: 一个定性变量和一个定量变量的关联度

高中数学 8_4 列联表独立性分析案例同步精练 湘教版选修2-31

高中数学 8.4 列联表独立性分析案例同步精练湘教版选修2-3 基础巩固 1在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( ) A.若χ2=6.64,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病 B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病 C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误 D.以上三种说法都不正确 2由下表中的数据计算χ2的值约为( ) A.9.45 B.6.08 C.1.78 D.0.01 3博士生和研究生毕业情况的一个随机样本给出了关于所获取的学位类别与学生性别的分类数据如下表,由表中的数据,可得( )

A .性别与获取学位类别有关 B .性别与获取学位类别无关 C .性别决定获取学位的类别 D .以上说法都不正确 4关于2×2列联表: 下列说法正确的是( ) A .表中的数据n 11,n 12,n 21,n 22可以取任意的正整数 B .n =n +1+n 2+ C .χ2= n n 11n 12-n 21n 222 n 1+n 2+n +1n +2 D .两个因素X ,Y 的值域分别为{A ,A },{B ,B } 5为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表: 药物效果与动物试验列联表 患病 未患病 总计 服用药 10 45 55 没服用药 20 30 50 总计 30 75 105 依据表中的数据求χ2≈________.(精确到0.01)

6为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14小时的结果如下表所示: 列联表独立性分析时的假设是______________________________. 7为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品有982件,次品有8件,甲不在现场时,510件产品中,合格品有493件,次品有17件.试用列联表独立性分析的方法对数据进行分析. 综合过关 8有人发现多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果: 则大约有________的把握认为多看电视与人变冷漠有关系.〔已知P(χ2≥10.828)≈0.001〕9某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:

第七章 列联表分析

第七章列联表分析 7.1 列联表(Crosstabs)分析的过程 7.2 列联表的实例分析 7.1 列联表 (Crosstabs) 分析的过程 列联表分析的过程是对两个变量之间关系的分析方法。被分析的变量可以是定类变量也可以是定序变量。系统是通过生成列联表对两个变量进行列联表分析的。 列联表分析的功能可以通过下述操作来实现。 图7-1 列联表分析对话框 1.打开列联表分析对话框 执行下述操作: Analyze→Descriptive→Crosstabs 打开Crosstabs 对话框如图7-1 所示。 2.确定列联分析的变量 从左侧的源变量窗口中选择两个定类变量或定序变量分别进入Row(s)(行)窗口和Column(s)(列)窗口。进入Row(s)窗口的变量的取值将作为行的标志输出,而进入Column(s)窗口的变量的取值将作为列的标志输出。Display clustered bar charts 是在输出结果中显示聚类条图。Suppress table 是隐藏表格,如果选择此项,将不输出R×C 列联表。 3.选择统计分析内容 单击statistics 按钮,打开statistics 对话框,如图7-2 所示。

图7-2statistics 对话框 下面介绍该对话框中的选项和选项栏的内容: (1)Chi-square 是卡方(X2)值选项,用以检验行变量和列变量之间是否独立。适用于定类变量和定序变量。 (2)Correlations 是皮尔逊(Pearson)相关系数r 的选项。用以测量变量之间的线性相关。适用于定序或数值变量(定距以上变量)。 (3)Nominal 是定类变量选项栏。选项栏中的各项是当分析的两个变量都为定类变量时可以选择的参数。 1)Contingency coefficient:列联相关的C 系数,由卡方系数修正而得。 2) Phi and Cramer's V:列联相关的V 系数,由卡方系数修正而得。 3)Lambda:λ系数。 4)Uncertainty Coefficient:不定系数。 (4)Ordinal 是定序变量选项栏。选项栏中的各项是当分析的两个变量都为定序变量时可以选择的参数。 1)Gramma:Gramma 等级相关系数。 2)Somers’d:Somers 等级相关d 系数。 3)Kendall’s tau-b:肯得尔等级相关tau-b 系数。 4)Kendall’s tau-c:肯得尔等级相关tau-c 系数。 (5)Nominal by Interval 选项栏中的Eta 是当一个变量为定类变量,另一个变量为数值变量时,测量两个变量之间关系的相关比率。 系统默认状态是不输出上述参数。如需要可自行选择。上述选择做完以后,单击Continue 返回到Crosstabs 对话框。 4.确定列联表内单元格值的选项 单击Cells(单元格)按钮,打开Cell Display 对话框,如图7-3 所示。

最新应用SPSS软件进行列联表分析

应用SPSS软件进行列联表分析 在许多调查研究中,所得到的数据大多为定性数据,即名义或定序尺度测量的数据。例如在一项全球教育水平的研究中,调查了400余人的个人信息,包括性别、学历、种族等,对原始资料进行整理就可以得到频数分布表。 定义四个变量:gender(性别)、educat(学历)、minority(种族)、count(人数),其中前三个为分类变量,并且gender变量取值为0、1,标签值定义为:0表示female,1表示male;educat变量取值为1、2、3,标签值定义为:1表示学历低,2表示学历中等,3表示学历高;minority变量值为0、1,标签值定义为:0表示非少数种族,1表示为少数种族。下面做gender、educat、minority的三维列联表分析及其独立性检验。数据文件如图1所示。 图1 第一步:用“count”变量作为权重进行加权分析处理。从菜单上依次选Data--weight Cases 命令,打开对话框,如图2所示。

图2 点选Weight Cases by项,并将变量“count”移入Frequency Variable栏下,之后单击OK按钮。 第二步:从菜单上依次点选Analyze--Deseriptive Statistics--Crosstabs命令,打开列联分析对话框(Crosstabs),如图3所示。 图3 第三步:在Crosstabs对话框中,如图4将变量性别gender从左侧的列表框内移入行变量Row(s)框内,并将受教育年限编码后得到的学历变量educat移入列变量Column(s)框内(若

此时单击OK按钮,则会输出一个2*3的二维列联表)。这里要输出一个三维列联表,将变量种族minority作为分层变量移入Layer框中,并且可以勾选左下方的Display clustered bar charts项,以输出聚集的条形图,如图8图9所示。 图4 第四步:选择统计量,单击Cosstabs对话框下侧的Statistics按钮,打开其对话框,如图5 所示。 图5 在Statistics对话框内,勾选Chi-square项,以输出表2进行独立性检验。这里由于不是定距

上机练习3列联表分析与方差分析

上机练习 3 列联表分析与方差分析 本上机练习的主要目的:熟悉如何利用SPSS与Excel进行列联表分析及方差分析。本练习所使用数据文件为 和“Salary.sav”。“carown.dat”、“fastfood.sav” 1. 列联表分析 Q:如何利用列联表分析考察家庭成员数与家庭所拥有汽车数之间 的关系?(数据文件为“Carown.dat”) 在这之前,我们首先检验各变量是否存在野码(wild code)或异常值 (outlier),这可以通过频数表以及箱形图(boxplot)来判断。 在家庭成员数的频数表中,我们发现,有一个样本的家庭成员数为0,而 ,该样本取值在其范围之外,即为野码(wild 该变量的取值范围为[1, +∞] code)。对于野码的处理,一般可以采用将该样本的此变量设为缺失值或 直接去掉该样本的做法。

在家庭所拥有汽车数的频数表中,我们发现,有一个样本的家庭所拥有汽 车数为9,显然是一个极端值。我们利用boxplot也证实了该样本为一个异常值(outlier)。异常值处于该变量的正常取值范围内,但可能会对该 变量的相关统计结果产生较为严重的影响。对于异常值的处理,一般可以 采用直接去掉该样本的做法或者根据情况进行调整。而对于上述我们发现 的异常值来说,我们可以直接去掉该样本。 在上述数据清理的工作完成之后,我们可以开始进行列联表分析。因为列 联表分析只适用于分类变量,我们需要利用Transform Recode Into Different Variables…对家庭人数以及家庭所拥有汽车数进行分类,分别 定义新变量member1和cars1与之对应。具体对应关系如下: 旧变量新变量新变量类别旧变量新变量新变量类别

第12章 列联表和对应分析

第十二章 列联表和对应分析 我们前面介绍的相关分析可以用来分析定量变量之间的关系,但不能用于定性变量的分析。本章介绍的列联表检验和对应分析方法则可以用来分析定性变量之间的关系。 第一节 列联表与独立性检验 【例12.1】美国的一般社会调查(General Social Survey )是由美国芝加哥大学的民意调查中心进行的一项随机抽样调查,调查对象为18岁以上的成年人。调查中获得了居民的婚姻状况和幸福状况方面的数据。下面我们根据1996年的调查结果来分析两个变量之间的关系(数据文件gss96.sav )。在调查中,婚姻状况的取值为已婚、丧偶、离异、分居和未婚(分别用1-5表示);幸福状况的取值为:非常幸福、比较幸福和不太幸福(分别用1-3表示)。在SPSS 软件中打开数据文件,选择“分析”→“描述统计”→“交叉表”,把“婚姻状况”设为行变量,把“幸福状况”设为列变量,可以得到表12-1所示的列联表。从表中我们可以看出,从婚姻状况看,已婚人员的比重最高;从幸福状况看,比较幸福的人员比重最高。但从表中我们很难直观地看出两个变量之间的内在联系。 表12-1 婚姻状况和幸福状况列联表 幸福状况 合计 非常幸福 比较幸福 不太幸福 婚姻状况 已婚 574 726 82 1382 丧偶 70 149 59 278 离异 83 292 79 454 分居 14 73 30 117 未婚 136 419 99 654 合计 877 1659 349 2885 要研究二维列联表中的两个变量是否相互独立,可以使用我们在非参数检验中讲过χ2 检验。检验的零假设和备择假设为 H 0:婚姻状况和幸福状况这两个变量相互独立;H 1:婚姻状况和幸福状况不相互独立。 假定样本量为n ,列联表有r 行、s 列,表中各行的合计值分别为r i R i ,,2,1,Λ=,各列的合计值分别为s j C j ,2,1,Λ=。每个单元格中的频数为j i O ,。在零假设成立,即行变量和列变量相互独立时,每个单元格频数的期望值可以按照式(12-1)计算: n C R n n C n R E j i j i ij ?= ??= (12-1) 显然,如果期望频数ij E 和观测频数ij O 相差不大,则零假设可能是正确的;如果二者差别很大,则零假设可能不成立。按照式(12-2)构造检验统计量:

《8.4 列联表独立性分析案例》教案

《4.3 列联表独立性分析案例》教案 教学目标 (一)知识与技能:通过本节知识的学习,了解独立性检验的基本思想和初步应用,能对两个分类变量是否有关做出明确的判断。明确对两个分类变量的独立性检验的基本思想具体步骤,会对具体问题作出独立性检验。 (二)过程与方法: 在本节知识的学习中,应使学生从具体问题中认识进行独立性检验的作用及必要性,树立学好本节知识的信心,在此基础上学习三维柱形图和二维柱形图,并认识它们的基本作用和存在的不足,从而为学习下面作好铺垫,进而介绍K的平方的计算公式和K的平方的观测值R的求法,以及它们的实际意义。从中得出判断“X与Y有关系”的一般步骤及利用独立性检验来考察两个分类变量是否有关系,并能较准确地给出这种判断的可靠程度的具体做法和可信程度的大小。最后介绍了独立性检验思想的综合运用 (三)情感、态度与价值观:通过本节知识的学习,首先让学生了解对两个分类博变量进行独立性检验的必要性和作用,并引导学生注意比较与观测值之间的联系与区别,从而引导学生去探索新知识,培养学生全面的观点和辨证地分析问题,不为假想所迷惑,寻求问题的内在联系,培养学生学习数学、应用数学的良好的数学品质。加强与现实生活相联系,从对实际问题的分析中学会利用图形分析、解决问题及用具体的数量来衡量两个变量之间的联系,学习用图形、数据来正确描述两个变量的关系。明确数学在现实生活中的重要作用和实际价值。教学中,应多给学生提供自主学习、独立探究、合作交流的机会。养成严谨的学习态度及实事求是的分析问题、解决问题的科学世界观,并会用所学到的知识来解决实际问题。教学重点: 理解独立性检验的基本思想及实施步骤. 教学难点: K的含义. 了解独立性检验的基本思想、了解随机变量2 教学方法: 诱思探究教学法 学习方法: 自主探究、观察发现、合作交流、归纳总结。

2019年数学2-3讲义+第8章 8.4 列联表独立性分析案例

8.4列联表独立性分析案例 [读教材·填要点] 1.列联表 一般地,对于两个因素X和Y,X的两个水平取值:A和A(如吸烟和不吸烟),Y也有两个水平取值:B和B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表. 2.χ2的求法 公式χ2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) . 3.独立性检验的概念 用随机变量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤 要判断“X与Y有关系”,可按下面的步骤进行: (1)提出假设H0:X与Y无关; (2)根据2×2列联表及χ2公式,计算χ2的值; (3)查对临界值,作出判断. 其中临界值如表所示: 表示在H0成立的情况下,事件“χ2≥x0”发生的概率.5.变量独立性判断的依据

(1)如果χ2 >10.828时,就有99.9%的把握认为“X 与Y 有关系”; (2)如果χ2>6.635时,就有99%的把握认为“X 与Y 有关系”; (3)如果χ2>2.706时,就有90%的把握认为“X 与Y 有关系”; (4)如果χ2≤2.706时,就认为没有充分的证据显示“X 与Y 有关系”,但也不能作出结论“H 0成立”,即X 与Y 没有关系. [小问题·大思维] 1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗? 提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性. 2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P (χ2≥6.64)≈0.01和P (χ2≥7.88)≈0.005,哪种说法是正确的? 提示:两种说法均正确.P (χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P (χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关. [例1] 数据: [解] 由列联表中的数据,得χ2的值为 χ2 =1 633×(30×1 355-224×24)2 254×1 379×54×1 579 ≈68.033>6.635. 因此,有99%的把握认为每一晚打鼾与患心脏病有关系. 解决一般的独立性分析问题,首先由所给2×2列联表确定a ,b ,c ,d ,a +b +c +d 的值,然后代入随机变量的计

8.4 列联表独立性分析案例(3)教学设计

8.4 列联表独立性分析案例(3) 一、教学目标 (一)知识目标 通过对典型案例(如“色弱与性别是否有关”“中学生物理考试成绩和吃早点是否相关”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。 (二)能力目标 让学生经历数据处理的过程,会用所学知识对具体案例进行检验,提高探索解决问题的能力。 (三)情感目标 从实例中发现问题,提高学习兴趣,激发学习积极性和主动性,不断自我完善,养成不断探求知识完善自我的良好态度。 二、教学重点 进一步理解独立性检验的实施步骤 三、教学难点 对临界值的理解作出判断 四、教学过程 (一)引入课题 独立性检验的步骤。 1.若要推断的论述为H1:“X与Y有关系”。可按如下步骤判断H1成立的可能性。 A 通过三维柱形图和二维条形图,粗略判断两个分类变量是否有关系。 B 可以利用独立性检验来考察两个分类变量是否有关系。并能精确判断可靠程度。 2.由观测数据算2 χ,其值越大,说明“X与Y有关系”成立的可能性越大。 3.由临界值表确定可靠程度。 (二)案例讲解 分析:设从表格中提供的统计数据,可以计算得到如下数值: 男性所占百分比:13212 0.48 300 + =;女性所占百分比: 1515 0.52 300 + = 在这300人的样本中,男性色弱患者的百分比:12 0.04 300 ≈;女性色弱的百分比: 5 0.017 300 ≈ 直观上看,300人中男性色弱的比例高于女性(0.040.017 >)。色弱应该与性别有关。下面进一步运用独立性的概念进行检验。

从300人中随机选取一人,设1A 表示男性,2A 表示女性,1B 表示色觉正常,2B 表示色弱。则: 1()0.48P A =,2()0.52P A =,2125 ()0.06300 P B += ≈ P (此人为男性且色弱)=12()0.04P A B = 而12()()0.480.060.028P A P B =?= 显然1212()()()P A B P A P B ≠ P (此人为女性且色弱)=22()0.017P A B =, 22()()0.520.060.031P A P B =?= 显然2222()()()P A B P A P B ≠ 因此,1A 与2B 、2A 与2B 都不是独立的。即色弱与性别有关。 我们用2χ独立性检验的方法计算得: 2 4.006χ≈ 由于220.05 3.84χχ>=,所以认为色弱与性别有关。 (三)巩固练习 为考察高中生的性别与是否喜欢数学课程之关系,在某城市的某校高中生中随机抽取300名学生,如下列联表: 与是否喜欢数学课程之间有关系,为什么? 解:在假设“性别与是否喜欢数学课程之间没有:的前提下,K 2应该很小,并且 P (K 2≥3.841)≈0.05, 而我们所得到的K 2的观察值是≈κ4.513超过3.841,这就意味着“性别与是否喜欢数学课之间有关系”这一结论是错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”. (四)课堂小结 可以按如下步骤判断结论成立的可能性: 1.通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度。

列联表分析

列联表分析 【例1】性别与所喜爱颜色的调查表。 双向列联表:性别×颜色 【程序】 proc freq data=SASUSER.data9_01; tables SEX*COLOR / CHISQ NOPERCENT NOROW; weight F; run; 【例3】下面数据是某个“统计入门”课程的数据,记录了该课程中所有学生的性别和专业 (“是”为统计专业,“非”为其他专业)。对数据进行整理生成列联表并分析。 【操作:解决方案-分析-分析家调入数据统计-表分析】 【程序】 *** Table Analysis ***; proc freq data=SASUSER.data9_03; tables SEX*MAJOR; run;

【例5】雇员情况数据集Employee变量有:性别(gender)、工种(jobcat)、薪水(salary) /薪水等级(salaryrank,分高(=1)100人,中(=2)200人,低(=3)其他人)、初薪(begsalary) /薪水等级(begsalaryrank,分高(=1)100人,中(=2)200人,低(=3)其他人)和受教 育年限。试作三向、四向、五向列联表。 【程序prog9_05_1】三向表:对性别、薪水等级和工种的情况进行统计(生成2张表) *** Table Analysis ***; proc freq data=SASUSER.data9_05; tables GENDER*SALARYRANK*JOBCAT; run; 【程序prog9_05_3】五向表:对性别、薪水等级、初薪等级、受教育年限和工种的情况进 行统计(生成18张表) *** Table Analysis ***; proc freq data=SASUSER.data9_05; tables GENDER*SALARYRANK*BEGSALARYRANK*EDUCATION*JOBCAT; run; 【例6】下表是一个由220名饮酒者组成的随机样本,对饮酒者进行酒类型偏好的调查。检 验性别与饮酒偏好是否有关?(α=0.05) 【程序】 data sasuser.data9_06; input sex wine people; datalines; 1 1 60 2 1 40 1 2 50 2 2 70 ; proc freq; weight people; tables sex*wine/chisq; run;

相关主题
文本预览
相关文档 最新文档