练习题解答:第十章交互分类与卡方检验
- 格式:doc
- 大小:370.50 KB
- 文档页数:11
统计分析与SPSS课后习题课后习题答案汇总(第五版)第⼀章练习题答案1、SPSS的中⽂全名是:社会科学统计软件包(后改名为:统计产品与服务解决⽅案)英⽂全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions)2、SPSS的两个主要窗⼝是数据编辑器窗⼝和结果查看器窗⼝。
数据编辑器窗⼝的主要功能是定义SPSS数据的结构、录⼊编辑和管理待分析的数据;结果查看器窗⼝的主要功能是现实管理SPSS统计分析结果、报表及图形。
3、SPSS的数据集:SPSS运⾏时可同时打开多个数据编辑器窗⼝。
每个数据编辑器窗⼝分别显⽰不同的数据集合(简称数据集)。
活动数据集:其中只有⼀个数据集为当前数据集。
SPSS只对某时刻的当前数据集中的数据进⾏分析。
4、SPSS的三种基本运⾏⽅式:完全窗⼝菜单⽅式、程序运⾏⽅式、混合运⾏⽅式。
完全窗⼝菜单⽅式:是指在使⽤SPSS的过程中,所有的分析操作都通过菜单、按钮、输⼊对话框等⽅式来完成,是⼀种最常见和最普遍的使⽤⽅式,最⼤优点是简洁和直观。
程序运⾏⽅式:是指在使⽤SPSS的过程中,统计分析⼈员根据⾃⼰的需要,⼿⼯编写SPSS命令程序,然后将编写好的程序⼀次性提交给计算机执⾏。
该⽅式适⽤于⼤规模的统计分析⼯作。
混合运⾏⽅式:是前两者的综合。
5、.sav是数据编辑器窗⼝中的SPSS数据⽂件的扩展名.spv是结果查看器窗⼝中的SPSS分析结果⽂件的扩展名.sps是语法窗⼝中的SPSS程序6、SPSS的数据加⼯和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。
7、概率抽样(probability sampling):也称随机抽样,是指按⼀定的概率以随机原则抽取样本,抽取样本时每个单位都有⼀定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。
2018年4月高等教育自学考试教育统计与测量真题(总分0, 做题时间150分钟)单项选择题心理测量跟物理测量相比,其突出差异之处是()。
SSS_SINGLE_SELA直接性B客观性C全面性D间接性该题您未回答:х该问题分值: 0答案:D物理测量是对物理属性的直接测量;心理测量是对心理特质的间接测量。
(2)测量工具:物理测量的工具制作相对简单,精确度高;心理测量的工具是量表,材料组织不易,制作困难。
(3)重复测量:物理测量可以进行并且很容易进行重复测量;心理测量进行重复测量相对比较困难,有时可能做不到。
(4)使用者:物理测量的使用者培训较为容易;心理测量的使用者需要经过专业培训,且有职业道德要求。
(5)误差:物理测量存在误差,但可对误差进行精确估计;心理测量的误差来源难以确认,对误差的估计没有那么精确。
(6)单位与参照点:物理测量的单位与参照点是公认的;心理测量没有零点,评价分数要与平均数或常模比较,单位不可互换。
心理测量跟物理测量相比,其突出差异之处是间接性。
下列数据中,属于顺序变量数据的是()。
SSS_SINGLE_SELA某项能力测试得6分B月工资3000元C羽毛球比赛得第2名D数学成绩为80分该题您未回答:х该问题分值: 0只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,数值一般都是整数形式,只计算个数,并不说明事物之间差异的大小。
不能进行加、减、乘、除运算,只可对每一类别计算次数或个数。
顺序变量亦称“等级变量”,百分等级数值。
心理变量的一种。
其值仅表明事物属性在数量大小、多少上的次序的变量。
可通过顺序量表观测。
其各个数值之间的距离不一定相等,也没有一定的比例关系。
等距变量一译“定距变量”。
变量的一种。
既有测量单位、相对零点的变量。
其取值之间有“相等”、“不等”、“序”及“距离”的关系,数值间可施行加、减法两种运算。
比率变量是具有相等单位和绝对零点的变量,例如身高、体重等。
SPSS学习系列24.-卡方检验D2.【字段】界面,勾选“使用定制字段分配”,将变量“性别”选入【检验字段】框;注意:变量“性别”的度量标准必须改为“名义”类型。
3. 【设置】界面,选择“自定义检验”,勾选“比较观察可能性和假设可能性(卡方检验)”;4. 点【选项】,打开“卡方检验选项”子窗口,本例要检验男女概率都=0.5,勾选“所有类别概率相等”;注:若有类别概率不等,需要勾选“自定义期望概率”,在其表中设置各类别水平及相应概率。
点【确定】回到原窗口,点【运行】得到双击上表,得到更多的描述:结果说明:(1)男生的观察频数为28,理论频数为25,残差=3;女生的观察频数为22,理论频数为25,残差=-3;可以计算卡方值=[32+(-3)2]/25=0.72(2)卡方检验的P值=0.396>0.05, 故接受原假设H0,即认为男女性别人数无差异。
注:卡方检验的P值是近似P值,若用“二项分布检验”计算出精确P值=0.480. 另外,上述卡方检验也可以用:【分析】——【非参数检验】——【旧对话框】——【卡方】得到的结果是一致的。
二、两样本或多样本案例——比较不同类的构成比或发生率的差异问题:两组收入不同的受访家庭其轿车拥有率的比较。
使用【交叉表】的卡方检验来实现,需要注意:若交叉表中存在有序分类变量,则适合用秩和检验而不是卡方检验。
有数据文件:变量O1表示是否拥有轿车:“1=有,2=没有”;变量Ts9表示收入级别:“1=4.8万以上,2=4.8万以上”。
1. 【分析】——【描述统计】——【交叉表】,打开“交叉表”窗口,将变量“Ts9收入级别”选入【行】框,将变量“O1是否拥有轿车”选入【列】框,根据需要勾选“显示复式条形图”;2. 点【统计量】,打开“统计量”子窗口,勾选“卡方”表示进行卡方检验;3. 点【继续】回到原窗口,点【单元格】打开“单元显示”窗口,【计数】输出观察频数和理论频数,默认勾选“观察值”;【百分比】勾选“行”;【非整数权重】设置小数权重问题,保持默认;注:“残差”设置残差的输出方式;“z-检验”对多于两组的数据做两两组间比较;点【继续】回到原窗口,点【确定】得到案例处理摘要案例有效的缺失合计N 百分比N 百分比N 百分比家庭收入2级 * O1. 是否拥有家用轿车989 86.2% 158 13.8% 1147 100.0%家庭收入2级* O1. 是否拥有家用轿车交叉制表O1. 是否拥有家用轿车合计有没有家庭收入2级Below 48,000计数32 303 335家庭收入2级中的 % 9.6% 90.4% 100.0% Over 48,000计数225 429 654家庭收入2级中的 % 34.4% 65.6% 100.0%合计计数257 732 989家庭收入2级中的 % 26.0% 74.0% 100.0% 低收入家庭有9.6%拥有轿车;高收入家庭34.4%拥有轿车。
临床数学试题及答案详解一、单项选择题(每题2分,共20分)1. 在临床研究中,以下哪种统计方法适用于比较两个独立样本的均值差异?A. t检验B. 卡方检验C. 方差分析D. 相关分析答案:A2. 以下哪种情况下,使用配对t检验是合适的?A. 比较两个独立样本的均值B. 比较两个相关样本的均值C. 比较多个独立样本的均值D. 比较多个相关样本的均值答案:B3. 在描述数据集中趋势的统计量中,中位数和众数的主要区别是什么?A. 中位数是数据排序后中间的值,众数是出现次数最多的值B. 中位数是平均值,众数是数据排序后中间的值C. 中位数是数据排序后中间的值,众数是平均值D. 中位数和众数都是出现次数最多的值答案:A4. 以下哪种统计图最适合展示分类数据的分布情况?A. 散点图B. 条形图C. 折线图D. 直方图答案:B5. 以下哪种统计量用于衡量数据的离散程度?A. 平均值B. 中位数C. 标准差D. 众数答案:C6. 在回归分析中,以下哪个指标用于衡量模型的拟合优度?A. R平方B. 均方误差C. 标准差D. 相关系数答案:A7. 以下哪种检验用于评估两个分类变量之间的关联性?A. t检验B. 卡方检验C. 方差分析D. 相关分析答案:B8. 在临床试验中,以下哪种方法用于控制混杂变量的影响?A. 随机化B. 匹配C. 多变量分析D. 所有选项答案:D9. 以下哪种统计方法用于比较三个或更多独立样本的均值差异?A. t检验B. 配对t检验C. 方差分析D. 相关分析答案:C10. 在生存分析中,Kaplan-Meier曲线用于估计什么?A. 均值B. 中位数C. 生存概率D. 标准差答案:C二、多项选择题(每题3分,共15分)11. 在临床研究中,以下哪些因素可能影响样本量的确定?A. 效应大小B. 显著性水平C. 检验效能D. 研究成本答案:ABCD12. 以下哪些统计图可以用于展示变量之间的关系?A. 散点图B. 条形图C. 折线图D. 箱线图答案:AC13. 在描述数据分布的形状时,以下哪些统计量是有用的?A. 偏度B. 峰度C. 平均值D. 中位数答案:AB14. 以下哪些检验用于比较两个独立样本的比例?A. t检验B. 卡方检验C. Fisher精确检验D. 方差分析答案:BC15. 在多元回归分析中,以下哪些因素可能导致多重共线性问题?A. 两个或多个自变量高度相关B. 自变量的数量多于样本量C. 自变量之间存在线性关系D. 样本量过小答案:ABC三、填空题(每题2分,共20分)16. 在临床研究中,样本量计算的目的是为了确保研究具有足够的________来检测效应。
配对四格表卡方检验例题配对四格表卡方检验例题背景介绍配对四格表是一种常见的统计分析方法,用于比较两个分类变量之间的关系。
卡方检验是基于配对四格表的统计方法,用于判断两个分类变量之间是否存在显著关系。
本文将以例题的形式介绍配对四格表卡方检验的步骤和应用。
例题描述假设我们有一组数据,研究了食物种类和消化不良的关系。
我们记录了100个人的饮食习惯和是否有消化不良的情况。
数据如下:| 有消化不良 | 无消化不良 || | |热辣食物 | 30 | 20 |酸味食物 | 10 | 40 |现在我们想要判断食物种类和消化不良之间是否存在显著关系。
步骤一:设置假设我们首先需要设置原假设和备择假设。
在本例中,假设食物种类和消化不良之间是独立的,即两者没有关系。
设置假设如下:•原假设(H0):食物种类和消化不良之间独立。
•备择假设(H1):食物种类和消化不良之间存在关系。
步骤二:计算期望频数根据原假设的设置,我们可以通过计算期望频数来判断观察频数和期望频数之间的差异。
期望频数的计算公式为:期望频数 = (行总和 * 列总和) / 总样本数根据上述公式,我们可以计算得到期望频数如下:| 有消化不良 | 无消化不良 | 行总和 | | | | —— |热辣食物 | 25 | 25 | 50 |酸味食物 | 15 | 35 | 50 |列总和 | 40 | 60 | |步骤三:计算卡方值根据观察频数和期望频数的差异,我们可以计算卡方值来判断两个分类变量之间的关系。
卡方值的计算公式为:卡方值 = sum((观察频数 - 期望频数)^2 / 期望频数)根据上述公式,我们可以计算得到卡方值如下:卡方值 = (30 - 25)^2 / 25 + (20 - 25)^2 / 25 + (10 - 15)^2 / 15 + (40 - 35)^2 / 35 ≈步骤四:查表判断根据卡方值和自由度,我们可以查表来判断卡方值的显著性。
在本例中,自由度为1(df = (行数 - 1) * (列数 - 1) = 1 * 1 = 1),我们选择显著性水平为。
卡方检验,是针对无序分类变量的一种非参数检验,其理论依据是:实际观察频数f 0与理论频数f e (又称期望频数)之差的平方再除以理论频数所得的统计量,近似服从2χ分布,即)(n f f f ee 2202~)(χχ∑-= 卡方检验的一般是用来检验无序分类变量的实际观察频数和理论频数分布之间是否存在显著差异,二者差异越小,2χ值越小。
卡方检验要求:(1)分类相互排斥,互不包容; (2)观察值相互独立;(3) 样本容量不宜太小,理论频数≥5,否则需要进行校正(合并单元格、增加样本数、去除样本法、使用校正公式校正卡方值)。
卡方校正公式为:∑--=ee f f f 202)5.0(χ卡方检验的原假设H 0: 2χ= 0; 备择假设H 1: 2χ≠0; 卡方检验的用途:(1)检验某连续变量的数据是否服从某种分布(拟合优度检验); (2)检验某分类变量各类的出现概率是否等于指定概率; (3)检验两个分类变量是否相互独立(关联性检验); (4)检验控制某几个分类因素之后,其余两个分类变量是否相互独立;(5)检验两种方法的结果是否一致,例如两种方法对同一批人进行诊断,其结果是否一致。
(一)检验单样本某水平概率是否等于某指定概率一、单样本案例例如,检验彩票中奖号码的分布是否服从均匀分布(概率=某常值);检验某产品市场份额是否比以前更大;检验某疾病的发病率是否比以前降低。
有数据文件:检验“性别”的男女比例是否相同(各占1/2)。
1. 【分析】——【非参数检验】——【单样本】,打开“单样本非参数检验”窗口,【目标】界面勾选“自动比较观察数据和假设数据”2.【字段】界面,勾选“使用定制字段分配”,将变量“性别”选入【检验字段】框;注意:变量“性别”的度量标准必须改为“名义”类型。
3. 【设置】界面,选择“自定义检验”,勾选“比较观察可能性和假设可能性(卡方检验)”;4. 点【选项】,打开“卡方检验选项”子窗口,本例要检验男女概率都=,勾选“所有类别概率相等”;注:若有类别概率不等,需要勾选“自定义期望概率”,在其表中设置各类别水平及相应概率。
2019年4月高等教育自学考试护理学研究真题(总分100, 做题时间150分钟)单项选择题通过科学的方法系统地探究现存的或产生新的知识从而直接或间接地指导护理实践的活动过程,称为()。
SSS_SINGLE_SELA护理评估B护理研究C护理计划D护理理论分值: 1答案:B护理研究是指通过科学的方法有系统地探究现存的或产生新的知识从而以直接或间接地指导护理实践的活动过程。
研究者应告知研究对象整个研究的所有事宜,研究对象有权决定是否参加研究,并有权决定在任何时候都有权终止参与,并且不受到治疗和护理上的任何惩罚和歧视,这是研究对象的()。
SSS_SINGLE_SELA免于遭受伤害或不适的权利B不被剥削或利用的权利C自主决定权D充分认知的权利分值: 1答案:C自主决定权:指在研究中,研究对象是自主个体,研究者应告知整个研究的所有事宜,研究对象有权决定是否参加研究,并有权决定在任何时候都有权终止参与,并且不受到治疗和护理上的任何惩罚和歧视。
“中西医结合治疗结石病的疗效观察”这一科研选题存在的最主要问题是()。
SSS_SINGLE_SELA范围过小B不够明确C过于具体D不够深入分值: 1答案:B可经测量取得数值,多有度量衡单位,如身高(cm)、体重(kg)等,此类资料为()。
SSS_SINGLE_SELA分类变量B数值变量C计数资料D等级资料分值: 1答案:B数值变量:其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。
如身高(cm)、体重(b)、血压(mmHg、kPa)、脉搏(次/min)和白细胞计数等。
“自杀率与社会凝聚力成反比”这一研究假设的不足是()。
SSS_SINGLE_SELA不清晰B不具体C不容易被验证D不可以测量分值: 1答案:C“自杀率与社会凝聚力成反比”这个假设清晰、具体,但是不容易被验证。
此假设具有两个变量:“自杀率”及“社会凝聚力”,变量间关系是“反比”,找出自杀率,以及确定关系成反比,相对而言都较容易,但是确定社会凝聚力却是一个比较困难的问题。
山东口腔正畸科模拟题2021年(72)(总分77.22, 做题时间120分钟)A1/A2题型1.保持器应具备的条件不包括SSS_SINGLE_SELA不能妨碍各个牙的正常生理活动B不能妨碍咀嚼、发音等口腔功能C便于清洁D可以移动牙齿E容易调整该题您未回答:х该问题分值: 0.84答案:D2.尖牙向远中倾斜移动时,以下各部位与近中颈部牙周组织承受着同一种性质的矫治力,产生同一种组织变化的是SSS_SINGLE_SELA远中颈部B颊侧颈部C远中根尖区D近中根尖区E舌侧颈部该题您未回答:х该问题分值: 0.67答案:C3.在正畸治疗之后最容易复发的是SSS_SINGLE_SELA旋转B倾斜移动C整体移动D压低E拉伸该题您未回答:х该问题分值: 0.67答案:A4.推上磨牙向远中的非适应证是SSS_SINGLE_SELA磨牙远中关系B磨牙近中关系C无第三恒磨牙D轻度牙列拥挤E上第二恒磨牙未萌该题您未回答:х该问题分值: 0.67答案:B5.关于窝沟封闭剂,以下说法错误的是SSS_SINGLE_SELA窝沟点隙呈V形,封闭剂容易浸润渗透B窝沟点隙呈口小里大,封闭剂容易浸润渗透C窝沟封闭剂黏度太小,会导致固化后体积收缩大D窝沟封闭剂黏度太大,会导致不易浸润渗透入窝沟点隙内E窝沟封闭剂黏度太小,会导致固化强度降低该题您未回答:х该问题分值: 0.67答案:B窝沟点隙呈口小里大,窝沟封闭剂不容易浸润渗透。
6.焊接合金的性能是SSS_SINGLE_SELA流动性好B易被腐蚀C强度很差D熔点较高E流动性差该题您未回答:х该问题分值: 0.67答案:A7.为增加银汞合金的强度,采取的主要措施是SSS_SINGLE_SELA增加锌的含量B增加汞的含量C降低充填压力D控制汞的含量E增加锡的含量该题您未回答:х该问题分值: 0.67答案:D8.牙周炎的主要病理变化为SSS_SINGLE_SELA牙周袋形成和牙槽骨吸收B牙周袋形成和牙龈炎C牙槽骨吸收和牙松动D牙周溢脓和牙松动E龈袋形成和牙槽骨吸收该题您未回答:х该问题分值: 0.67答案:A牙周炎的主要病理变化为牙周袋形成和牙槽骨吸收。
卡方检验及其应用一、卡方检验概述:卡方检验主要应用于计数数据的分析,对于总体的分布不作任何假设,因此它属于非参数检验法中的一种。
它由统计学家皮尔逊推导。
理论证明,实际观察次数(f o )与理论次数(f e ),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为:)(n f f f ee 2202~)(χχ∑-= 这是卡方检验的原始公式,其中当f e 越大,近似效果越好。
显然f o 与f e 相差越大,卡方值就越大;f o 与f e 相差越小,卡方值就越小;因此它能够用来表示f o 与f e 相差的程度。
根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。
一般用卡方检验方法进行统计检验时,要求样本容量不宜太小,理论次数≥5,否则需要进行校正。
如果个别单元格的理论次数小于5,处理方法有以下四种:1、单元格合并法;2、增加样本数;3、去除样本法;4、使用校正公式。
当某一期望次数小于5时,应该利用校正公式计算卡方值。
公式为:∑--=ee f f f 202)5.0(χ二、卡方检验的统计原理:• 卡方检验所检测的是样本观察次数﹙或百分比﹚与理论或总体次数﹙或百分比﹚的差异性。
• 理论或总体的分布状况,可用统计的期望值(理论值)来体现。
• 卡方的统计原理,是取观察值与期望值相比较。
卡方值越大,代表统计量与理论值的差异越大,一旦卡方值大于某一个临界值,即可获得显著的统计结论。
三、卡方检验的主要应用: 1、独立性检验独立性检验主要用于两个或两个以上因素多项分类的计数资料分析,也就是研究两类变量之间的关联性和依存性问题。
如果两变量无关联即相互独立,说明对于其中一个变量而言,另一变量多项分类次数上的变化是在无差范围之内;如果两变量有关联即不独立,说明二者之间有交互作用存在。
独立性检验一般采用列联表的形式记录观察数据, 列联表是由两个以上的变量进行交叉分类的频数分布表,是用于提供基本调查结果的最常用形式,可以清楚地表示定类变量之间是否相互关联。
高等教育自学考试经济类模拟题2020年(531)(总分100, 做题时间150分钟)一、单项选择1.若使用类别量表测量单一变量,进行描述性分析时可以使用 ( )SSS_SINGLE_SELA均值B标准差C频率D中位数该题您未回答:х该问题分值: 3.9答案:C若使用类别量表测量单一变量,进行描述性分析时只能使用众数和频率分别描述数据的集中趋势和离散程度,却不能使用均值、标准差等来描述其集中趋势和离散程度。
2.使用顺序量表进行推断性分析时,可以使用 ( )SSS_SINGLE_SELA卡方检验BZ检验Ct检验D区间估计该题您未回答:х该问题分值: 3.9答案:A若使用顺序量表进行推断性分析时,可以使用K-S检验和卡方检验,而不能使用区间估计、Z检验和t检验。
3.市场调查资料的数据统计分析的第一步是 ( )SSS_SINGLE_SELA整理统计资料B明确数据统计分析目的C计算统计值D统计推论该题您未回答:х该问题分值: 3.9答案:B数据统计分析的步骤:①明确数据统计分析目的;②整理统计资料;③选用统计分析方法;④计算统计值;⑤统计推论。
4.用以描述样本数据集中趋势的指标不包括 ( )SSS_SINGLE_SELA均值B中位数C方差D众数该题您未回答:х该问题分值: 3.9答案:C用以描述样本数据集中趋势的指标包括均值、众数、中位数。
5.描述样本数据集中趋势最基本、最简单、最常用的一个统计量是 ( )SSS_SINGLE_SELA中位数B频率C方差D均值该题您未回答:х该问题分值: 3.9答案:D均值是描述样本数据集中趋势最基本、最简单、最常用的一个统计量,它表示一系列数据或统计总体的平均特征的值。
6.某学生期末各科成绩(单位:分)分别为85、90、93、79、82、84,该学生期末的平均成绩为 ( )SSS_SINGLE_SELAB**C85D93该题您未回答:х该问题分值: 3.9答案:A=(85+90+93+79+82+84)÷6=85.5。
第十章 交互分类与2χ检验练习题:1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示:(1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。
(2) 请根据表10-26的数据完成下面的联合分布的交互分类表。
10-27(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。
解:(1)Y F (从上到下):50;30;100.X F (从左到右):115;65.(2)P 11=15/180;P 21=35/180;1Y F N =50/180;P 12=20/180;P 22=10/180;2Y F N =30/180; P 13=80/180;P 23=20/180;3Y F N =100/180;1X F N =115/180;2X F N =65/180.(3)关于X 的边缘分布:x 分居 不分居 P(x)115/18065/180关于Y 的边缘分布: y 紧张 一般 和睦 P(y)50/18030/180100/180(4)关于X 的条件分布有三个:y=“紧张” x 分居 不分居 P(x) 15/5035/50y=“一般” x 分居 不分居 P(x) 20/3010/30y=“和睦” x 分居 不分居 P(x) 80/10020/100关于y 的条件分布有两个: X=“分居”y紧张 一般 和睦 P(y)15/11520/11580/115X=“不分居”y紧张 一般 和睦 P(y)35/6510/6520/652. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示:10-29。
(2)根据表10-28和表10-29计算2χ,计算公式为2()2o e ef f f χ-=∑。
(3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈 述研究假设1H 和虚无假设0H 。
输血技术相关专业知识-12(总分100, 做题时间90分钟)A1/A2型题1.频数表计算中位数要求SSS_SINGLE_SELA 组距相等B 原始数据分布对称C 原始数据为正态或近似正态分布D 没有条件限制E A和B同时成立该题您未回答:х该问题分值: 2答案:D[解析] 本题考点为百分位数计算。
频数表资料可以计算百分位数,而百分之五十位置上的数就是中位数。
所以利用频数表计算中位数时没有条件限制。
2.何种分布的资料,均数等于中位数SSS_SINGLE_SELA 对称分布B 对数正态分布C 左偏态D 右偏态E 二项分布该题您未回答:х该问题分值: 2答案:A[解析] 本题考点是资料分布特征。
中位数适宜描述各种分布资料,但是对于偏态分布资料集中趋势宜用中位数描述,而当资料为对称分布时,均数与中位数相等。
3.要全面描述正态分布或近似正态分布资料的分布特征,可采用SSS_SINGLE_SELA 均数和标准差B 中位数和极差C 极差和几何均数D 均数和变异系数E 中位数和变异系数该题您未回答:х该问题分值: 2答案:A[解析] 本题考点是资料分布特征。
正态分布和近似正态分布可用均数和标准差描述资料的集中趋势和离散趋势。
而剩下答案不适宜描述正态分布和近似正态分布资料。
4.对数正态分布是SSS_SINGLE_SELA 正态分布B 近似正态分布C 左偏态分布D 右偏态分布E 对称分布该题您未回答:х该问题分值: 2答案:D[解析] 对数正态分布资料是指对原始数据取对数后的资料服从正态分布,一般这类资料属于右偏态资料。
5.以下关于参数估计的说法正确的是SSS_SINGLE_SELA 区间估计等于点估计B 样本含量越大,可信区间范围越大C 样本含量越小,参数估计越精确D 对于一个参数可以有几个估计值E 可信区间与正常值范围一致该题您未回答:х该问题分值: 2答案:D[解析] 本题考点是参数估计定义。
参数估计有点估计和区间估计,区间估计根据估计误差大小又有不同的范围,所以对于一个参数,可以有多种估计方法,可以根据需要选择估计方法和误差大小。
一. 百分比差1.义: 按照因变量Y的属性比较各个自变量的类别(或叫子群),或者说把因变量的条件频率按照自变量的不同类别进行比较。
∆% = P (Y=k∣X=1)- P(Y=k∣X=2)其中,K 表示被观察的Y的属性2.两种极端情况:完全相关和完全不相关:∆% = 0时,完全不相关(条件频率分布是相同的);∆% = ∣100%∣时,完全相关,条件频率分布是完全不同的。
4. 小结:百分比差定义: ∆% = P (Y=k∣X=1)- P(Y=k∣X=2)其中,K 表示被观察的Y的属性取值域: [-1, +1] 或[100%, +100%]优点: 变量间强度和方向性标准化, 对于一般人而言一目了然缺点: 对于大于2 ×2 的相对频率表格来说, 不是很清楚双变量相关分析:1. 相关系数的作用•区分和鉴别两变量X 和Y相关的强度和方向;•简化数据,使一个很大的列联表用一个数字或系数表示出来•使不同的自变量的影响力或影响程度相互之间进行比较2. 一个理想的相关系数应该具备那些条件?1)标准的取值域:- 没有方向性:[0,1],0表示不相关;1:表示完全相关- 有方向性:[+1;-1]:-1 表示完全的负相关,X 越增加,Y越减少;0 表示不相关;+1 表示完全的正相关,X 越增加,Y越增加2)有清楚的内容上的解释3)对于不同的相关强度比较灵敏4)对于不同规模的样本来说是一个常量5)对于X 或Y的不同取值数目来说是一个常量3 . 几个相关概念•假设检验:就是对总体的某一参数做一假设,然后用样本的值去验证,以决定该假设是否为总体所接受。
这里的假设不是一般意义上的理论假设,而是依靠抽样调查的数据进行验证的经验层次的假设。
零假设:表示两个变量之间完全没有关系; 用H0 表示;备责假设(研究假设): 表示两个变量相关(H1).•否定域:就是在抽样分布内一端或两端的小区域,如果样本的统计值在此区域范围内,则否定零假设。
第十章 交互分类与2χ检验练习题:1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示:表10-26(1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。
(2) 请根据表10-26的数据完成下面的联合分布的交互分类表。
110-27 (4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。
解:(1)Y F (从上到下):50;30;100.X F (从左到右):115;65.(2)P 11=15/180;P 21=35/180;1Y F N =50/180;P 12=20/180;P 22=10/180;2Y F N =30/180; P 13=80/180;P 23=20/180;3Y F N =100/180;1X F N =115/180;2X F N =65/180.(3)关于X 的边缘分布:x 分居 不分居关于Y 的边缘分布:y 紧张 一般 和睦 P(y)50/18030/180100/180(4)关于X 的条件分布有三个: y=“紧张”x 分居 不分居 P(x)15/5035/50y=“一般”x 分居 不分居 P(x)20/3010/30y=“和睦”x 分居 不分居 P(x) 80/10020/100关于y 的条件分布有两个: X=“分居”y紧张 一般 和睦 P(y)15/11520/11580/115X=“不分居”y紧张 一般 和睦 P(y)35/6510/6520/652. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行了分析,得到的结果如下表所示: 表10-2810-29。
(2)根据表10-28和表10-29计算2χ,计算公式为2()2o e ef f f χ-=∑。
(3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈述研究假设1H 和虚无假设0H 。
(4)本题目中的自由度为多少若显著性水平为,请查附录的2χ分布表,找出相对应的临界值。
并判断有无宗教信仰的人的利他主义程度有无显著性差异。
(5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C 系数。
解:(1)“信教”一列(从上到下):11918561.67357⨯=;12518564.78357⨯=;11318558.56357⨯=.“不信教”一列(从上到下):11917257.33357⨯=;12517260.22357⨯=;11317254.44357⨯=.(2)2222222()2(9061.67)(6064.78)(3558.56)(2957.33)(6560.22)(7854.44)61.6764.7858.5657.3360.2254.44==47.42o e ef f f χ-------=+++++∑(3)1H :总体中有无宗教信仰的人的利他主义程度有显著性差异。
0H :总体中有无宗教信仰的人的利他主义程度没有显著性差异。
(4)df =(r -1)(c -1)=(3-1)⨯(2-1)=2;显著性水平为时的临界值是。
因为20χ=<2χ=,检验统计值落在否定域中,可以拒绝虚无假设,接受研究假设,即认为总体中有无宗教信仰的人的利他主义程度是有显著性差异的。
(5)0.342C==C 值要利用表“部分交互分类表C 值的上限”中的数值进行修正,本题的表格是3⨯2,对应的C 值上限是,因此:C 0.3420.685新==0.49933. 某英语培训学校为了研究英语四级考试试卷客观选择题正确答案的设置在A 、B 、C 与D 的某一个选项上是否有偏好,对最近三年英语四级考试试卷做了分析,258个单选题的正确答案在A 、B 、C 与D 四个选项上的分布情况如下表所示:答案选项 频次 A 48 B 74 C 50 D 86 合计258(1)请陈述研究假设1H 和虚无假设0H 。
(2)A 、B 、C 与D 四个选项上的期望频次是多少。
(3)根据上表计算2χ值。
(4)若显著性水平为,请判断英语四级考试试卷选择题的正确答案在A 、B 、C 与D 四个选项上的分配是否有显著的倾向。
解:(1)研究假设1H :正确答案在A 、B 、C 与D 四个选项中的设置有偏好。
虚无假设0H :正确答案在A 、B 、C 与D 四个选项中的设置没有偏好。
(2) A 、B 、C 与D 四个选项上的期望频次都是258/4= (3)22222()2(4864.5)(7464.5)(5064.5)(8664.5)64.564.564.564.5=16.05o e ef f f χ-----==+++∑(4) df=4-1=3,显著性水平为时,查2χ分布表可知临界值是,统计量落在否定域内,因此,拒绝虚无假设,接受研究假设,即认为正确答案在A 、B 、C 与D 四个选项上的分配是有偏好的。
4.某个电视节目收视率的商业调查,涉及到了儿童、少年、青年、中年、(1)为了分析5个群体的收视习惯是否有显著差异,请陈述研究假设1H 和虚无假设0H 。
(2)根据上表计算2χ值。
(3)若显著性水平为,请判断不同群体的收视习惯是否有显著性差异。
解:(1) 研究假设1H :5个群体的收视习惯有显著差异。
虚无假设0H :5个群体的收视习惯没有显著差异。
(2)22222222222()2(8961.5)(68.278)(61.556)(9567)(81.678)(39.512)(43.834)(4589)(8989)(52.456)61.568.261.59581.639.543.8458952.457.81o e ef f f χ-----------==+++++++++=∑(3) df =(r -1)(c -1)=(2-1)⨯(5-1)=4,显著性水平下的临界值为,很明显,检验统计值落在否定域内,因此,拒绝虚无假设,接受研究假设,即认为5个群体的收视习惯有显著差异。
5. 根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS 检验是否有自己的房间(C3)以供学习对学生在本班的学习层次(C2)有无显著影响,并计算关系强度系数C 系数、V 系数和φ系数。
(显著性水平0.05α=)解:《武汉市初中生日常行为状况调查问卷》:C2 你的成绩目前在本班大致属于1)上等 2)中上等 3)中等 4)中下等 5)下等 C3 你是否有自己的房间以供学习不被打扰 1)有 2)没有SPSS 的操作步骤如下:○1点击Analyze →Descriptive Statistics →Crosstabs ,打开Crosstabs 对话框,如图10-1(练习)所示。
将变量“是否有自己的房间以供学习不被打扰(c3)”放置在Column(s)框中,将变量“成绩目前在本班的大致层次(c2)”放置在Row (s )框中,如图10-1(练习)所示。
你的成绩目前在本班大致属于 * 你是否有自己的房间以供学习不被打扰 Crosstabu latio n% within 你是否有自己的房间以供学习不被打扰10.6%8.2%10.0%30.6%23.0%28.8%33.8%36.1%34.4%20.7%21.3%20.8%4.3%11.5% 6.0%上等中上等中等中下等下等你的成绩目前在本班大致属于有没有你是否有自己的房间以供学习不被打扰Total图10-1(练习) Crosstabs 对话框○2点击Statistics 按钮,分别点击Chi-square 、Contingency coefficient 、Phi and Cram ér ’s V 复选框,如图10-2(练习)所示。
图10-2(练习) Crosstabs :statistics 对话框○3点击Cells 按钮,对单元格进行设置,如图10-3(练习)所示,选择Column 选项,选择的是在单元格中计算列百分比。
图10-3(练习) Crosstabs :Cell Display 对话框 ○4 Format 采取系统默认格式,点击OK ,提交运行,可得到如下的结果。
表10-1(练习) 是否拥有房间与在班上学习层次的交互分类表表10-2(练习)卡方检验表各相关关系表表10-3(练习)从表10-3(练习)可以看出,列联系数(Contingency coefficient)为,Cramer’s V 系数为,φ系数(Phi系数)为。
6. 根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS检验在本班的学习层次(C2)对自己与母亲关系的好坏(D2)有无显著影响,并计算关系强α=)度系数C系数、V系数和φ系数。
(显著性水平0.05解:初中生学习成绩的层次与自己同母亲的关系存在着相互影响,这个题目假定学习层次(C2)为自变量,自己与母亲关系的好坏(D2)为因变量。
《武汉市初中生日常行为状况调查问卷》:C2你的成绩目前在本班大致属于1)上等 2)中上等 3)中等 4)中下等 5)下等D2 你对自己与母亲的关系1)非常满意 2)比较满意 3)一般 4)不太满意 5)很不满意SPSS的操作步骤如下:○1点击Analyze→Descriptive Statistics→Crosstabs,打开Crosstabs对话框,如图10-4(练习)所示。
将变量“成绩目前在本班的大致层次(c2)”放置在column(s)框中,将变量“自己与母亲的关系(d2)”放置在row(s)框中,如图10-4(练习)所示。
图10-4(练习) Crosstabs对话框○2点击Statistics按钮,分别点击Chi-square、Contingency coefficient、Phi and Cramr’V复选框,如图10-5(练习)所示。
图10-5(练习) Crosstabs:statistics对话框○3点击Cells按钮,对单元格进行设置,如下图所示,选择Column,设置的是在单元格中计算列百分比。
图10-6(练习) Crosstabs:Cell Display对话框○4Format采取系统默认格式,点击OK,提交运行,SPSS输出如下的结果。
表10-4(练习)成绩在班上的层次与自己同母亲的关系的交互分类表你对自己与母亲的关系 * 你的成绩目前在本班大致属于 Crosstabulation % within 你的成绩目前在本班大致属于46.2%50.3%46.3%33.9%26.7%43.7%32.7%36.2%31.1%38.5%23.3%33.8%17.3%10.7%15.8%19.3%30.0%16.1%3.8% 2.7% 3.4% 3.7%10.0% 3.7%3.4%4.6%10.0% 2.7%100.0%100.0%100.0%100.0%100.0%100.0%非常满意比较满意一般不太满意很不满意你对自己与母亲的关系Total上等中上等中等中下等下等你的成绩目前在本班大致属于Total表10-5(练习)卡方检验表从表10-5(练习)可以看出卡方值为,自由度为16,卡方检验的P值为,小于,即通过了卡方检验。