第五章 假设检验
- 格式:ppt
- 大小:147.01 KB
- 文档页数:21
第五章假设检验与回归分析本章主要介绍了假设检验和回归分析两种统计方法。
一、假设检验假设检验是通过收集样本数据来对总体参数的假设进行推断的一种统计方法。
假设检验的步骤如下:1.建立原假设和备择假设:原假设是需要进行检验的参数的假设值,备择假设是对原假设的一种否定或补充。
通常将备择假设设置为我们要验证的假设。
2.收集样本数据:根据样本数据进行统计分析,并计算出检验统计量。
3.确定显著性水平:显著性水平是拒绝原假设的最大错误概率,通常取0.05或0.014.计算拒绝域的临界值:根据显著性水平和自由度,在统计表中查找检验统计量的临界值。
5.比较检验统计量和临界值:如果检验统计量落在拒绝域内,则拒绝原假设,否则接受原假设。
二、回归分析回归分析是一种用于研究两个或多个变量之间关系的统计方法。
它可以用来建立一个变量对另一个变量的预测模型。
回归分析的步骤如下:1.收集数据:根据需要收集自变量和因变量的数据。
2.建立模型:选择适当的回归模型,将自变量和因变量进行数学表达。
3.估计参数:使用最小二乘法等方法,对模型参数进行估计。
4.检验模型:通过检验模型的显著性水平,确定模型是否合理。
5.利用模型:使用估计的模型来进行预测和分析。
回归分析可以分为简单线性回归和多元线性回归两种。
简单线性回归是指只有一个自变量和一个因变量之间的关系,多元线性回归是指有多个自变量和一个因变量之间的关系。
回归分析的应用非常广泛,可以用于市场营销、财务管理、经济预测等领域。
通过回归分析,可以找到影响因变量的主要因素,并对未来的变化进行预测。
总之,假设检验和回归分析是统计学中两种重要的方法。
假设检验用于对总体参数的假设进行验证,回归分析用于研究变量之间的关系。
这两种方法在实际应用中具有广泛的价值。
第5章 假设检验案例辨析及参考答案案例5-1 为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的t 检验,随机抽取25名患者服用了新药,以常规药的疗效均值为0μ,进行t 检验,无效假设是0μμ=,对立假设是0μμ≠,检验水平α=1%。
结果t 值很大,拒绝了无效假设。
“拒绝了无效假设”意味着什么?下面的说法你认为对吗?(1)你绝对否定了总体均数相等的无效假设。
(2)你得到了无效假设为真的概率是1%。
(3)你绝对证明了总体均数不等的备择假设。
(4)你能够推论备择假设为真的概率是99%。
(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。
(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。
提示:就类似的问题,Haller 和Kruss (2002)在德国的6个心理系问了30位统计学老师、44位统计学学生和39位心理学家。
结果所有的统计学学生、35位心理学家和24位统计学老师认为其中至少有一条是正确的;10位统计学老师、13位心理学家和26位统计学学生认为第4题是正确的。
(见Statistical Science, 2005, 20(3):223-230.) 案例辨析 6个选择均不正确。
(1)可能犯Ⅰ类错误。
(2)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率。
(3)可能犯Ⅰ类错误。
(4)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率,而不是推论备择假设为真的概率是99%。
(5)在无效假设成立的条件下,就该例拒绝无效假设犯错误的概率是P 。
(6)在无效假设成立的条件下,还可能犯错误,并不是完全“可靠”的发现;1-α=99%是指无效假设成立的条件下不犯错误的概率是99%。
正确做法“拒绝了无效假设”意味着在无效假设成立的条件下,推断犯错误的概率为P。
案例5-2 某工厂生产的某医疗器械的合格率多年来一直是80.0%。
第五章假设检验5.1 现实中的统计案例一:时下不少大学生在一边学习的同时也不断寻找一些机会打些零工以赚点钱弥补学习和生活之需,这已经是学生们之间人所共知的事情。
这没有丝毫的让人好奇之处,让人好奇的是这些打工的学生究竟一个月平均能赚多少钱?假设有人说:这个数据是500元,你觉得信不信它呢?当然,你首先需要收集证据,没有证据是肯定说明不了任何问题的。
又假设有人通过组织调查取得过如下数据(调查到一共30人,单位:元):350 500 900 100 100 200 240 300 100 320450 260 650 380 290 400 800 400 250 400290 870 540 320 140 160 300 400 500 340 这时你该做何结论?就算是你得到以上数据的平均数等于423元,你是否就可以作出“是”或“不是”的回答?因为你要作出的回答是针对整个总体的,根据却又只是来自部分总体——即样本,所以事实上不论你最终作出的是“是”还是“不是”的回答,其实都存在犯错误的可能。
那么,如何以样本的数据去对总体参数下结论才最科学?才最不容易犯错误呢?这就是一个属于单个总体参数假设检验的问题了,是本章需要解决的问题。
案例二:你可能认为每一个美国人都知道像这样一些简单历史问题的答案“在美国国旗上有多少颗星?有多少条条纹?星代表什么?条纹又代表什么?”。
非常有意思的是,并非每一个人都知道问题的答案,而且当你知道问题的答案时,你也许会大吃一惊的。
1998年美国杂志《Today’s America》就确实做过这么一个调查,所得到的数据肯定多多少少会出乎很多人的意料之外。
下面就是按性别和美国地区列出的知道星的数目的成年人的百分比:男士女士大城市小城镇农村n(知道)72 72 57 56 31n(不知道)22 34 25 16 15在纽约的伊利县里200个成人被问及在美国国旗上有多少颗星。
上面的表现是属于每一类的成人的数目。
第五章假设检验一、填空题:1. 就是事先对总体参数作出一个假设,然后利用样本信息判断该假设是否合理。
2.原假设和备择假设的关系是。
3.假设检验最常用的有三种情况:双侧检验、和。
4. 当总体方差已知,正态总体时,样本均值服从正态分布,选择的统计量为统计量。
5. 左侧检验的拒绝区域位于统计量分布的,右侧检验的拒绝区域位于统计量分布的。
6.假设检验中的两类错误是和。
二、单项选择题:1. 在假设检验中,原假设H0,备择假设H1,则称()为犯第一类错误A、H0为真,接受H0B、H0为真,拒绝H0C、H0不真,接受H1D、H0不真,拒绝H02. 按设计标准,某自动食品包装及所包装食品的平均每袋中量应为500克。
若要检验该机实际运行状况是否符合设计标准,应该采用()。
A、左侧检验B、右侧检验C、双侧检验D、左侧检验或右侧检验3. 当样本统计量的观察值未落入原假设的拒绝域时,表示()。
A、可以放心地接受原假设B、没有充足的理由否定与原假设C、没有充足的理由否定备择假设D、备择假设是错误的4.进行假设检验时,在其它条件不变的情况下,增加样本量,检验结论犯两类错误的概率会()。
A、都减少B、都增大C、都不变D、一个增大一个减小三、多项选择题:1. 关于原假设的建立,下列叙述中正确的有()。
A、若不希望否定某一命题,就将此命题作为原假设B、尽量使后果严重的错误成为第二类错误C、质量检验中若对产品质量一直很放心,原假设为“产品合格(达标)”D、若想利用样本作为对某一命题强有力的支持,应将此命题的对立命题作为原假设E、可以随时根据检验结果改换原假设,以期达到决策者希望的结论2. 在假设检验中,α与β的关系是()。
A、α和β绝对不可能同时减少B、只能控制α,不能控制βC、在其它条件不变的情况下,增大α,必然会减少βD、在其它条件不变的情况下,增大α,必然会增大βE、增大样本容量可以同时减少α和β四、计算题:1.某种感冒冲剂的生产线规定每包重量为12克,超重或过轻都是严重的问题。
第五章 假设检验的功效与样本量∙ 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。
∙ 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。
5.1 两类错误与功效1. 两类错误的概率H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0-(5.2) (略) ∙ 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ∙ 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ∙ 两类错误的背景:拒绝H 0时可能犯第Ⅰ类错误不拒绝H 0时可能犯第Ⅱ类错误∙ 两类错误的后果:第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ∙ 一般α, β的数值要在科研设计时事先确定2. 功效 (power)∙ 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β(5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β(5.5) ∙ 功效就是真实有效的药物被发现的概率∕疾病被诊断出来的概率5.2 影响功效的四要素∙ 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6)∙ 功效的影响因素为:δ=0μ-x ,σ,n ,αX ≥μ0+Z αn σ (5.7) (略) ∙ 现用X 分布图形来定性地讨论四要素对功效的影响1. 客观差异越大,功效越大X ~N(μ,σ2/n) (5.8) (略)若H 0为真,X ~N(μ0,σ2/n) (5.9) (略)若H 1为真,X ~N(μ0+δ,σ2/n) (5.10) (略)2. 个体间标准差越小, 功效越大。