第8章 列联分析
- 格式:doc
- 大小:146.00 KB
- 文档页数:5
第八章8.3.2A级——基础过关练1.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( )A.零假设H0:男性喜欢参加体育活动B.零假设H0:女性不喜欢参加体育活动C.零假设H0:喜欢参加体育活动与性别有关D.零假设H0:喜欢参加体育活动与性别无关【答案】D 【解析】独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的χ2应该很小,如果χ2很大,则可以否定假设,如果χ2很小,则不能够肯定或者否定假设.2.某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了 3 000人,计算发现χ2的观测值χ=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是( )A.90% B.95%C.99% D.99.5%【答案】B 【解析】因为χ2=6.023>3.841=x0.05,所以可断言市民收入增减与旅游愿望有关系的可信程度为95%.3.下列选项中可以有95%以上的把握认为“X与Y有关系”的χ2的值为( )A.χ2=2.700 B.χ2=2.710C.χ2=3.765 D.χ2=5.014【答案】D 【解析】因为5.014>3.841,所以D正确.4.某卫生机构抽取了366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人,阴性家族史者糖尿病发病的有17人,不发病的有240人,则认为糖尿病与遗传有关系出错的概率不超过( )A.0.001 B.0.005C.0.01 D.0.05【答案】D 【解析】可先作出如下列联表:根据列联表中的数据,得到χ2的观测值χ2=×172109×257×33×333≈6.067>3.841=x0.05.故在犯错误的概率不超过0.05的前提下认为糖尿病患者与遗传有关系.5.考察棉花种子是否经过处理跟生病之间的关系得到下表数据:A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的【答案】B 【解析】由χ2=407×32×213-61×101293×314×133×274≈0.164<2.706=x0.1,即没有把握认为种子是否经过处理跟是否生病有关.6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算得χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________(填“有关的”或“无关的”).【答案】有关的【解析】χ2=27.63>10.828=x0.001,有99.9%以上的把握认为这两个量是有关的.7.下表是某届某校本科志愿报名时,对其中304名学生进入高校时是否知道想学专业的调查表:①性别与知道想学专业有关;②性别与知道想学专业无关;③女生比男生更易知道所学专业.【答案】②【解析】χ2=304×63×82-42×1172180×124×105×199≈0.041≤2.706=x0.1,所以性别与知道想学专业无关.8.某销售部门为了研究具有相关大学学历和能按时完成销售任务的关系,对本部门200名销售人员进行调查,所得数据如下表所示:能按时完成销售任务是有关系的”.【答案】99% 【解析】χ2=200×57×65-42×36299×101×93×107≈9.67>6.635=x 0.01,所以有99%以上的把握认为“销售人员具有相关大学学历与能按时完成销售任务是有关系的”.9.研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;男生110名在相同的题目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用条形图和独立性检验的方法判断.解:建立性别与态度的2×2列联表如下:根据列联表中所给的数据,可求出男生中作肯定态度的频率为22110=0.2,女生中作肯定态度的频率为2260≈0.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系.假设H 0:性别和态度无关.根据列联表中的数据得到χ2的观测值χ2=170×22×38-22×882110×60×44×126≈5.622>3.841=x 0.05.根据小概率值α=0.05的独立性检验,我们推断H 0不成立,即认为性别和态度有关系,此推断犯错误的概率不大于0.05.B 级——能力提升练10.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,经过计算得到x 2=4.844>3.841,所以断定主修统计专业与性别有关系,那么这种判断出错的可能性约是( )A .0.5%B .1%C .5%D .10%【答案】C 【解析】∵P (χ2≥3.841)≈0.05,∴判断出错的可能性有5%. 11.(多选)有两个分类变量X ,Y ,其列联表为:其中a,15-a 均为大于5Y 与X 有关,则a 的可能取值为( )A .6B .7C .8D .9【答案】CD 【解析】根据a >5且15-a >5,a ∈Z ,知a 可取6,7,8,9,由表中数据及题意,得χ2=13×13a -60220×45×3×2≥3.841=x 0.05,知a 可能取值为8,9.12.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:经计算得χ2=7.8A .有99%以上的把握认为“爱好该项运动与性别有关” B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 【答案】A 【解析】根据独立性检验的定义,由χ2=7.8>6.635=x 0.01可知,有99%以上把握认为“爱好该项运动与性别有关”.13.在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是________. ①若χ2的观测值χ=6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.【答案】③ 【解析】χ2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.14.为研究患肺癌与吸烟是否有关,有人做了一次相关调查,其中部分数据丢失,但可以确定的是不吸烟人数与吸烟人数相等,吸烟患癌人数占吸烟总人数的45,不吸烟的人数中,患肺癌与不患肺癌的人数之比为1∶4.若研究得到在犯错误概率不超过0.001的前提下,认为患肺癌与吸烟有关,则吸烟人数至少有多少?解:设吸烟人数为5x ,由题意可得列联表如下:χ2=10x 16x 2-x225x4=3.6x .由题意知3.6x ≥10.828,故x ≥3.008. 因为x 为整数,故x 最小值为4. 故5x =20,吸烟人数至少为20人.C 级——探究创新练15.某学校为了解该校高三年级学生在市一模考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在[120,150]内为优秀.(1)由以上频率分布直方图填写下列2×2列联表.若按是否优秀来判断,是否有99%的把握认为该校的文理科数学成绩有差异?(2)某高校派出2140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试.若甲教授面试的学生人数为ξ,求ξ的分布列和均值.解:(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.010+0.004+0.002)×10×50=8,故非优秀人数为50-8=42.该校理科学生中数学成绩优秀的人数为(0.020+0.014+0.006)×10×50=20,故非优秀人数为50-20=30.则2×2列联表如下:∴χ2=100×8×50×50×28×72≈7.143>6.635,故有99%的把握认为该校文理科数学成绩有差异.(2)由(1)知,该校随机抽取的学生成绩中一模数学成绩在140分以上的学生为4人,ξ的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为C 14C 33+C 24C 22+C 34C 11=14,则P (ξ=1)=C 1414=27,P (ξ=2)=C 2414=37,P (ξ=3)=C 3414=27.∴ξ的分布列为∴E (ξ)=1×27+2×37+3×7=2.。
列连分析报告1. 引言列连分析是一种常用的统计方法,用于探索和描述两个或多个分类变量之间的关系。
通过计算交叉表和列联表来分析变量间的联系,并进行统计检验以确定是否存在显著差异。
本报告旨在分析某个特定数据集中的两个分类变量之间的关系,并解释结果。
2. 数据集介绍本次分析使用的数据集包含了一份关于学生的调查数据。
其中包含了以下两个分类变量:性别(Male/Female)和喜欢的科目(Math/Science/English/History)。
我们的目标是分析性别和喜欢的科目之间是否存在关联。
3. 数据分析方法为了分析性别和喜欢的科目之间的关联,我们首先使用交叉表来计算各个组合的频数和百分比。
然后,我们将进行卡方检验来确定这些组合是否有统计显著性差异。
4. 数据分析结果下图是性别和喜欢的科目之间的交叉表:Math Science English HistoryMale 20 15 18 12Female 10 25 20 15根据交叉表,我们可以看出男性学生中最喜欢的科目是数学(20人),其次是英语(18人)。
女性学生中最喜欢的科目是科学(25人),其次是英语(20人)。
为了确定这些差异是否是统计显著的,我们进行了卡方检验。
卡方检验的结果显示,性别和喜欢的科目之间存在显著差异(p < 0.05)。
这表明性别和喜欢的科目之间的关联并非偶然。
5. 结论根据我们的分析结果,我们可以得出以下结论:•对于男性学生而言,数学是最受欢迎的科目,其次是英语;•对于女性学生而言,科学是最受欢迎的科目,其次是英语;•性别和喜欢的科目之间存在显著关联。
这些结论对于学校、教育机构或决策者来说具有重要意义。
他们可以根据这些结果来制定更好的教育策略,以满足学生的兴趣和需求。
6. 建议基于我们的分析结果,我们提供以下建议:•学校可以根据性别喜好的差异,提供更多与学生兴趣相关的教学资源和课程内容;•教育机构可以设计更有趣和吸引人的教学方法,以激发学生对数学、科学、英语等科目的兴趣;•决策者可以基于性别和喜欢的科目之间的关联,制定针对不同学生群体的教育政策。
第九章 列联分析一、填空题1、设R 为列联表的行数,C 为列联表的列数,则进行拟合优度检验时所用统计量2χ的自由度为 。
2、设0f 为列联表中观察值频数,e f 为期望值频数,则进行拟合优度检验时所用统计量2χ= 。
3、在列联分析中,观察值总数为n ,RT 为列联表中给定单元的行合计,CT 为给定单元列合计,则该给定单元频数期望值为 。
4、在列联分析中,观察值总数为500,列联表中给定单元的行合计数为140,列合计数为162,则该给定单元频数期望值为 。
5、在3×4列联分析中,统计量220()e e f f f χ-=∑(其中0f 为观测值频数,e f 为期望值频数)的自由度为____________。
6、对来自三个地区的原料质量进行检验时,先把它们分成三个等级,在随机抽取400间进行检验,经分析得知原料质量与地区之间的关系实现著的,现计算得2300χ=,则ϕ相关系数等于 。
7、ϕ相关系数是描述两个分类变量之间相关程度的统计量,它主要用于描述的列联表数据。
8、若两个分类变量之间完全相关。
则ϕ相关系数的取值为 。
9、当列联表中两个变量相互独立时,计算的列联相关系数C= 。
10、利用2χ分布进行独立性检验,要求样本容量必须足够大,特别是每个单元中的期望频数e f 不能过小,如果只有两个单元,则每个单元的期望频数必须 。
二、单项选择题1、列联分析是利用列联表来研究( )A 、两个分类变量的关系B 、两个数值型变量的关系C 、一个分类变量和一个数值型变量的关系D 、连个数值型变量的分布2、设R 为列联表的行数,C 为列联表的列数,则进行拟合优度检验时所用统计量2χ的自由度为( )A 、RB 、C C 、R ×CD 、(R-1)×(C-1)3、若两个分类变量之间完全相关。
则ϕ相关系数的取值为( )A 、0B 、小于1C 、大于1D 、1=ϕ4、当列联表中两个变量相互独立时,计算的列联相关系数C ( )A 、等于1B 、大于1C 、等于0D 、小于05、利用2χ分布进行独立性检验,要求样本容量必须足够大,特别是每个单元中的期望频数e f 不能过小,如果只有两个单元,则每个单元的期望频数必须( )A 、等于或大于1B 、C 值等于ϕ值 C 、等于或大于5D 、等于或大于106、一所大学准备采取一项学生上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男生和120名女生进行调查,得到结果如下:A 、48和39B 、102和81C 、15和14D 、25和197、一所大学准备采取一项学生上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男生和120名女生进行调查,得到结果如下:A 、27021==ππB 、8721==ππC 、15021==ππD 、3222.021==ππ8、ϕ相关系数是描述两个分类变量之间相关程度的统计量,它主要用于描述( )A 、2×2列联表数据B 、2×3列联表数据C 、3×3列联表数据D 、3×4列联表数据9、ϕ相关系数的取值范围是( )A 、[0,1]B 、[-1,0]C 、[-1,1]D 、大于110、如果列联表有两个以上的单元,不能应用2χ检验的条件是( )A 、20%的单元期望频数大于5B 、20%的单元期望频数小于5C 、10%的单元期望频数大于5D 、10%的单元期望频数小于5三、简答题(每题5分,共10分)1、简述列联分析中一致性检验和独立性检验的主要区别。
第八章思考题及练习题(一)填空题1、时间数列又称_______ 数列,一般由________ 和 _______ 两个基本要素构成。
2、动态数列按统计指标的表现形式可分为___________ 、________ 和___________ 三大类,其中最基本的时间数列是____________ o3、编制动态数列最基本的原则是_4、时间数列中的四种变动(构成因素)分别是:_________ 、 ________ 、_______ 、和________5、时间数列中的各项指标数值,就叫____________ ,通常用a表示。
6平均发展水平是对时间数列的各指标求平均,反映经济现象在不同时间的平均水平或代表性水平,又称:______________________ 平均数,或________ 平均数。
7、增长量由于采用的基期不同,分为________ 增长量和 _______ 增长量,各 ______ 增长量之和等于相应的_________ 增长量。
8、把报告期的发展水平除以基期的发展水平得到的相对数叫_____________ ,亦称动态系数。
根据采用的基期不同,它又可分为_________ 发展速度和发展速度两种。
9、平均发展速度的计算方法有__________ 法和_________ 法两种。
10、某企业2000年的粮食产量比90年增长了2倍,比95年增长了0.8倍,则95年粮食产量比90年增长了_________ 倍。
11、把增长速度和增长量结合起来而计算出来的相对指标是: ___________________ o12、由一个时期数列各逐期增长量构成的动态数列,仍属时期数列;由一个时点数列各逐期增长量构成的动态数列,属___________ 数列。
13、在时间数列的变动影响因素中,最基本、最常见的因素是 _________ ,举出三种常用的测定方法______________ 、 ______________ 、 _____________ o14、若原动态数列为月份资料,而且现象有季节变动,使用移动平均法对之修匀时,时距宜确定为_______ 项,但所得各项移动平均数,尚需____________ ,以扶正其位置15、使用最小平方法配合趋势直线时,求解a、b参数值的那两个标准方程式为__________ o16、通常情况下,当时间数列的一级增长量大致相等时,可拟合趋势方程,而当时间数列中各二级增长量大致相等时,宜配合___________ 趋势方程。
第2讲串联电路和并联电路、闭合电路欧姆定律一、电路的连接1.串、并联电路的特点电路特点串联电路并联电路电流I=I1=I2=…=I n I=I1+I2+…+I n电压U=U1+U2+…+U n U1=U2=…=U n总电阻R总=R1+R2+…+R n1R总=1R1+1R2+…+1R n功率分配P1R1=P2R2=…=P nR nP1R1=P2R2=…=P n R n(1)串联电路的总电阻大于电路中任意一个电阻,电路中任意一个电阻变大时,总电阻变大。
(2)并联电路的总电阻小于电路中任意一个支路电阻,任意一个电阻变大时,总电阻变大。
思考辨析1.在串联电路中,若其中一个电阻增大,总电阻增大,在并联电路中,若其中一个电阻增大,总电阻减小。
(×) 2.在串联电路中,串联电阻的个数越多,总电阻越大,在并联电路中,并联电阻的个数越多,总电阻越小。
(√) 3.如何在表头的基础上改装电压表?如何在表头的基础上改装电流表?提示:测量较大的电压时,在表头上串联一个较大的电阻,就改装成了电压表。
测量较大的电流时,在表头上并联一个较小的电阻,就改装成了量程较大的电流表。
1.闭合电路(1)组成⎩⎨⎧①电源内部是内电路。
②用电器、导线组成外电路。
(2)内、外电压的关系:E =U 外+U 内。
2.闭合电路欧姆定律(1)内容:闭合电路的电流跟电源的电动势成正比,跟内、外电路的电阻之和成反比。
(2)公式:I =ER +r(只适用于纯电阻电路)。
3.路端电压与外电阻的关系一般情况U =IR =E R +r·R =E 1+r R当R 增大时,U 增大特殊情况①当外电路断路时,I =0,U =E②当外电路短路时,I 短=Er ,U =04.路端电压跟电流的关系 (1)关系式:U =E -Ir 。
(2)用图像表示如图所示,其中纵轴截距为电动势,横轴截距为短路电流,斜率的绝对值为电源内阻。
思考辨析1.电动势等于电源的路端电压。
第八章列联分析
习题
一、单选题
1.列联分析是利用列联表研究()。
A、两个或多个属性(定性变量)间的关系
B、两个数值型变量间的关系
C、一个分类型变量和一个数值型变量间的关系
D、不受变量类型的约束
χ分布的自由度为()。
2.在列联分析中,2
A、行数
B、行数与列数的乘积
C、列数
D、行数减1与列数减1的乘积
3.在某地生育意愿调查中,被调查者年龄与生育意愿的交叉列联表如表8-5,
表8-5 某地被调查者年龄与生育意愿的交叉列联表
生育意愿29岁以下30-39岁40-49岁50岁及以上合计
1孩及以下77 78 37 3 195 2孩129 288 206 14 637 3孩及以上 6 12 8 1 27 合计212 378 251 18 859 现根据表8-5回答(1)~(9)问题。
(1)请问,这个列联表的最右端一列称为()。
A、列边缘频数
B、行边缘频数
C、条件频数
D、总频数
(2)根据这个列联表计算的意愿生育二孩的行百分比依次为()。
A、25%、44%、29%和2%
B、20%、45%、32%和2%
C、23%、74%和3%
D、21%、76%和3%
(3)根据这个列联表计算的30-39岁被调查者的列百分比依次为()。
A、25%、44%、29%和2%
B、20%、45%、32%和2%
C、23%、74%和3%
D、21%、76%和3%
(4)根据这个列联表计算的各年龄段二孩的期望频数为()。
A、157、280、186和13
B、212、378、251和18
C、195、637和27
D、48、86、57和4
χ统计量为()。
(5)根据这个表计算的2
A、33.157
B、31.716
C、23.812
D、32.101
(6)如果要检验各年龄段被调查者的生育意愿是否相同,提出的原假设为()。
A、各年龄段生育意愿的频数相同
B、各年龄段生育意愿的比例相同
C 、各年龄段生育意愿的频数依次为195、637、27
D 、各年龄段生育意愿的频数依次为212、378、251、18 (7)根据这个列联表,2χ分布的自由度为( )。
A 、6 B 、3 C 、2 D 、12
(8)给定显著性水平05.0=α,检验各年龄段被调查者的生育意愿比例是否相同,得出的结论为( )。
A 、拒绝原假设
B 、可以拒绝也可以不拒绝原假设
C 、不拒绝原假设
D 、无法判断
(9)根据“表8-5某地被调查者年龄与生育意愿的交叉列联表”计算V 相关系数( )。
A 、0.1359 B 、0.1177 C 、0.1389 D 、0.1367 4.ϕ相关系数是描述( )列联表分类变量之间相关程度的统计量。
A 、2×2
B 、3×3
C 、2×3
D 、各分类变量的等级不受限制 5.ϕ相关系数的取值范围( )。
A 、[0,1]
B 、[-1,1]
C 、)1,0[
D 、任何值 6.列相关系数的取值范围为( )。
A 、[0,1]
B 、[-1,1]
C 、)1,0[
D 、任何值 7.当列联表中的两个变量相互独立时,计算的列相关系数为( )。
A 、1 B 、0 C 、大于1 D 、小于0 二、简答题
1.在列联分析过程中,应注意的问题有哪些? 2.方差分析和列联表分析的应用有哪些差异?
3.简述ϕ相关系数,列相关系数和V 相关系数各自的特点。
三、计算题
1.某人试图确定一颗骰子是否公平,他投掷了100次,结果如表8-6所示:
表8-6 投掷骰子频数分布情况
1 2 3 4 5 6 频数
21
15
13
17
19
15
试确定该骰子是否公平。
2.一家超市出售4种价格水平的水果,认为顾客购买从最低价到最高价水果的概率依次是0.15,0.3,0.5,0.05。
1000个样本中购买各种水果的频数为120,320,500和60。
这组样本与期望比例一致吗?(05.0=α)
3.某位老师的全校公选课各个年级的学生都有,现对该课进行评议,随机抽取了150名学生,对此课的态度如表8-7所示:
表8-7 关于某课程的评议结果 单位:人
一年级 二年级 三年级 四年级 合计 认可 26 35 14 18 93 不认可 14 21 14 8 57 合计
40
56
28
26
150
(1)在01.0=α的显著水平下对学生态度是否与所在年级有关进行检验。
(2)计算 相关系数、C相关系数和V相关系数。
习题答案 一、单选题
1.A 2.D 3.(1)B (2)B (3)D (4)A (5)A (6)B (7)A (8)A (9)C 4.A 5.A 6.C 7.B 二、简答题
1.答:(1)条件百分表的方向。
通常情况下,变量在列联表中的位置是任意的,但如果变量X 与Y 之间存在因果关系,则令X 为自变量,通常放在列的位置,Y 为因变量,通常放在行的位置。
条件百分表也多按照变量的方向计算。
(2)2χ分布的期望频数准则。
在对2χ分布进行独立性检验时,要求样本容量必须足够大,特别是每个单位中的期望频数不能过小,必须注意两个准则:
准则一:如果只有两个单元,每个单元的期望频数必须是5或5以上;
准则二:对于两个以上的单元,如果20%的单元期望频数e f 小于5,则不能应用2
χ检
验。
这可以采用合并一些单元的方式解决。
2.(1)方差分析是通过检验各样本总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
涉及两个类型的变量,分类型的自变量和数值型因变量。
它通过对数据误差来源的分析以判断不同总体的均值是否相等,进而分析自变量对因变量是否有显著影响。
这种误差一方面来源于组内误差,主要是不同水平(或处理)内的样本随机性所造成的;另一方面来源于组间误差,主要体现为不同水平之间的数据误差,这可能是由于抽样本身随机误差形成的,也可能是不同水平间的系统性因素造成的系统误差。
(2)列联分析是利用列联表来分析变量之间关系的一种统计方法,主要是借助于2χ统计量对列联表中变量间的相关性进行检验,仅仅涉及到分类型变量以及相关的频数分布。
主要是借助于真实频数和期望频数之间的差异情况来计算2χ统计量,与给定显著性水平下的
2χ临界值比较,以判断各类型的分布之间是否存在差异性。
3.从适用条件、计算公式不同、取值范围三个角度分析各自特点。
三、计算题
1.解:根据题意提出假设,
0H :各数字出现的比例是一致的
1H :各数字出现的比例是不一致的
计算2χ
21 100/6 1.127 15 100/6 0.167 13 100/6 0.807 17 100/6 0.007 19 100/6 0.327 15
100/6
0.167
2.602
∑-=e
e f f f 2
02
)(χ=2.602
给定显著性水平05.0=α,查自由度为5的2χ分布表,得临界值071.11)5(2
05.0=χ。
另一方法,就是利用Excel 中的函数=CHIDIST(2χ,自由度)计算p-值为0.7614。
由于071.11)5(205.02=<χχ或p-值大于显著性水平,故不拒绝原假设,说明各数字出
现的比例是一致的,这也就说明此骰子是公平的,所出现的频数差异是由于投掷的随机性造成的。
2.根据题意提出假设,
0H :样本与期望比例一致(或,0.15,0.3,0.5,0.05是消费者的购买概率) 1H :样本与期望比例不一致(或,0.15,0.3,0.5,0.05不是消费者的购买概率)
计算2χ
120 150 6 320 300 1.333 500 500 0 60
50
2
9.333
∑-=e
e f f f 2
02
)(χ=9.333 给定显著性水平05.0=α,查自由度为3的2χ分布表,得临界值815.7)3(2
05.0=χ。
另一方法,就是利用Excel 中的函数=CHIDIST(2χ,自由度)计算p-值为0.025。
由于815.7)3(205.02=>χχ或p-值小于显著性水平,
故拒绝原假设,说明样本与期望分布不一致。
3.(1)根据题意提出假设,
0H :学生态度与所在年级无关,即各年级的态度比例一致; 1H :学生态度与所在年级有关,即各年级的态度比例不一致 计算2χ统计量, 2.4472=χ。
给定显著性水平05.0=α,查自由度为3的2χ分布表,得临界值815.7)3(2
05.0=χ。
另一方法,就是利用Excel 中的函数=CHIDIST(2χ,自由度)计算p-值为0.4850。
由于815.7)3(205.02=<χχ或p-值大于显著性水平,
故不拒绝原假设,说明学生态度与所在年级有关。
(2)1277.0150
2.447
2
==
=
n
χϕ 1270.0150
447.2447
.222=+=
+=
n
C χχ
1277.0)
14,12(min )
1,1min(2
2
==--=
--=
ϕϕϕC R V。