4.4似然比检验
- 格式:pdf
- 大小:104.35 KB
- 文档页数:5
似然比率检验法(lr)的基本思路似然比率检验法,又称为LR检验法(Likelihood Ratio Test),是一种常用的统计方法,用于比较两个统计模型的似然函数,判断哪个模型更能描述数据。
LR检验法在统计学、医学研究、生物学等领域广泛应用,具有较强的理论基础和实际效果。
LR检验法的基本思路是通过计算两个模型的似然函数值之比来比较它们的拟合优度。
似然函数是指给定模型参数和数据,模型能产生给定数据的概率密度函数值或概率值。
在LR检验中,假设有两个模型:模型A和模型B,分别用参数集θ1和θ2来表示。
模型A和模型B的似然函数分别为L(θ1|x)和L(θ2|x),其中x表示观测到的数据。
LR检验的核心概念是似然比率,定义为两个似然函数之比的对数:LR = log[L(θ1|x)/L(θ2|x)]。
似然比越大,表示模型A拟合数据的能力越强,越有可能是真实模型。
因此,在进行LR检验时,我们通过比较似然比与某个阈值的大小来判断哪个模型更好地解释了数据。
LR检验的具体步骤如下:1.提出两个互相竞争的假设:假设模型A和模型B分别描述了数据的生成过程,参数为θ1和θ2,求解两个模型的似然函数L(θ1|x)和L(θ2|x)。
2.计算似然比LR的值:通过计算log[L(θ1|x)/L(θ2|x)]得到似然比的值。
该值代表了模型A相对于模型B的拟合优度,值越大表示模型A更符合数据。
3.构建零假设和备择假设:假设模型B是真实模型,模型A是替代模型。
零假设(H0)为LR=0,备择假设(H1)为LR>0。
4.设定显著性水平:设定检验的显著性水平(例如α=0.05),表示拒绝零假设的临界点。
5.做出统计决策:比较似然比的值和显著性水平的大小。
如果似然比大于显著性水平,则拒绝H0,认为模型A更好地拟合了数据;如果似然比小于等于显著性水平,则接受H0,认为模型B更好地解释了数据。
LR检验的优点在于可以用来比较复杂模型之间的拟合,不受模型参数个数或形式限制。
似然比检验卡方分布表(原创实用版)目录1.似然比检验概述2.卡方分布表介绍3.似然比检验与卡方分布表的关系4.如何使用似然比检验卡方分布表5.实际应用案例正文1.似然比检验概述似然比检验(Likelihood Ratio Test)是一种用于检验两个或多个样本分布是否存在显著差异的统计方法。
该方法基于似然函数,通过比较样本观测值与理论概率之间的似然比,判断样本之间是否存在显著差异。
2.卡方分布表介绍卡方分布(Chi-square distribution)是一种用于描述独立性检验的统计分布。
在进行似然比检验时,需要计算观测值与理论概率之间的卡方统计量,并根据卡方分布表查找相应的临界值,以判断样本之间是否存在显著差异。
3.似然比检验与卡方分布表的关系似然比检验需要借助卡方分布表来完成。
在进行似然比检验时,首先计算观测值与理论概率之间的似然比,然后根据卡方分布表查找相应的临界值。
若似然比小于临界值,则不能拒绝原假设,认为样本之间不存在显著差异;若似然比大于临界值,则可以拒绝原假设,认为样本之间存在显著差异。
4.如何使用似然比检验卡方分布表使用似然比检验卡方分布表的步骤如下:(1)根据样本数据计算观测值与理论概率之间的似然比;(2)查找卡方分布表,根据自由度和显著性水平(一般取 0.05 或0.01)确定临界值;(3)将计算得到的似然比与临界值进行比较。
若似然比小于临界值,则不能拒绝原假设;若似然比大于临界值,则可以拒绝原假设。
5.实际应用案例假设我们有两个样本数据集 A 和 B,分别表示两种不同产品的销售数据。
我们想要检验这两个样本的分布是否存在显著差异。
首先,我们需要根据样本数据计算观测值与理论概率之间的似然比。
然后,根据卡方分布表查找相应的临界值。
似然比、沃尔德及拉格朗日乘数检验法1 引子1.1 问题的提出在计量经济模型检验中,t检验和F检验是一级检验:t检验的原假设为0:0(1,2,,) jH j kb==L,检验单个回归系数是否为零;F检验的原假设为12023:0k H b b b ====L ,模型的拟合优度检验。
那么当我们希望检验023:2H b b = 023:1H b b +=023:2H b b =和241b b +=0234:0H b b b === 0234:H b b b =应该如何做呢?有三种常用的检验方法,即似然比(LR )检验,沃尔德(W)检验和拉格朗日(lagrange)乘数(LM)检验。
这三种检验所用统计量都是基于极大似然估计法计算。
LR 检验由内曼—皮尔逊(Neyman-Pearson 1928)提出,只适用于对线性约束的检验。
W检验和LM检验既适用于对线性约束条件的检验,也适用于对非线性约束条件的检验。
计量经济学中的专门软件Eviews模型的OUTPUT窗口左下角有一个统计量Log likelihood是什么,对模型的检验有何用处呢?342 似然比检验2.1 统计量的构造似然比检验,即两个似然函数值之比构成的检验: —原假设成立条件下的似然函数值与任意情况下的似然函数之比。
用统计的语言来描述为:设总体的密度函数为(,)f x θ,∈θΘ。
()1,,n X X '=X 为来自此总体的样本,对于假设0010::H H ∈↔∉θΘθΘ ,称511(,,,)(,)nn i i L X X f x ==∏θθ为其似然函数。
称011max (,)max (,)ni i ni i f x f x ∈Θ=∈Θ=Λ=∏∏θθθθ为似然比。
(1)(1)式统计量的分子是在0H 成立下参数的极大似然函数值,因此是零假设的最佳表示。
而分母则表示在θ在任意情况下的极大似然函数值。
比值的最大极限值为1。
其值靠近1,说明局部的最大和全局最大近似,零假设成立可能性就越大。
似然比检验(log likelihood ratio test):似然,英文likelihood,实际上也可以翻译为可能性。
一个回归模型的似然值,可以理解为给定模型参数后出现所观察样本的可能性。
如模型I:Y=β0+ β1*X1 + β2*X2, 这个模型,给定的模型参数是β0、β1、β2,抽样得出所观察到的样本的可能性为L1。
似然比检验(LRT)用来比较两个模型,看是否可以用一个简单模型来替代一个复杂模型。
如上例模型I,若除去自变量X2,模型II:Y=β0+ β1*X1,这个模型参数少一个,相对简单,由这个模型抽样得出所观察到的样本的可能性为L2。
因为模型II少一个参数,自然L2要小于L1。
现在要问的问题是:是否L2比L1小得太多,以至于我们不应该剔除X2呢?判断是否可以简化模型I为模型II的标准,是用似然比检验(LRT):LR = 2*(lnL1-lnL2),其中lnL1为复杂模型I的似然值对数,lnL2为简单模型II的似然值对数。
LR近似符合卡方分布,自由度等于复杂模型I中的模型参数个数与简单模型II的参数个数差,这里等于1。
这样根据卡方分布临界值表,我们就可以判断模型差异是否显著。
如果差异显著,表示不能用简单模型II替代复杂模型I。
一般来说,似然比检验得出结论与模型I中对X2回归系数的Wald检验结论基本一致。
在做似然比检验比较两个模型时,要注意:(1)简单模型是从复杂模型简化得来的,即嵌套关系。
(2)两个模型所用的观察对象完全相同(当所剔除的变量有缺失值需注意两模型所用的样本量是否相同)。
Generated by Foxit PDF Creator © Foxit Software For evaluation only.似然比检验、wald 检验、拉格朗日乘数检验都基于 MLE,就大样本而言三者是渐 进等价的。
1、似然比检验的思想是:如果参数约束是有效的,那么加上这样的约束不应该 引起似然函数最大值的大幅度降低。
也就是说似然比检验的实质是在比较有约束条件下的似然函数最大值与无约束 条件下似然函数最大值。
似然比定义为有约束条件下的似然函数最大值与无约束 条件下似然函数最大值之比。
以似然比为基础可以构造一个服从卡方分布统计量 (具体形式参见 Greene)。
2、wald 检验的思想是:如果约束是有效的,那么在没有约束情况下估计出来的 估计量应该渐进地满足约束条件,因为 MLE 是一致的。
以无约束估计量为基础可以构造一个 Wald 统计量(具体形式参见 Greene),这 个统计量也服从卡方分布; 3、拉格朗日乘数检验的思想是:在约束条件下,可以用拉格朗日方法构造目标 函数。
如果约束有效, 则最大化拉格朗日函数所得估计量应位于最大化无约束所 得参数估计值附近。
这里也是构造一个 LM 统计量 (具体形式参见 Greene) 该统计量服从卡方分布。
,对于似然比检验,既需要估计有约束的模型,也需要估计无约束的模型;对于 Wald 检验,只需要估计无约束模型;对于 LM 检验,只需要估计有约束的模型。
一般情况下,由于估计有约束模型相对更复杂,所有 Wald 检验最为常用。
对于 小样本而言,似然比检验的渐进性最好,LM 检验也较好,Wald 检验有时会拒绝 原假设,其小样本性质不尽如人意。
似然比 似然比(likelihood ratio, LR) 是反映真实性的一种指标,属于同时反映灵敏 度和特异度的复合指标。
即有病者中得出某一筛检试验结果的概率与无病者得 出这一概率的比值。
似然比检验
一种假设检验,用于比较两个模型–一个所有参数都是自由参数的无约束模型,以及由原假设约束为较少参数的相应约束模型–的拟合优度以确定哪个模型
与样本数据拟合得更好。
例如,您可以使用此检验来比较无约束 3 参数 Weibull 分布与受约束 2 参数 Weibull 分布以确定哪个模型更适合您的数据。
该比较基于受约束模型的最大化似然函数与不受约束模型的最大化似然函数的比率进行。
如果此比率值足够小,就可以断定,与受原假设约束的简化模型相比,无约束模型与样本数据拟合得更好。
似然比检验对于检验复杂模型非常有用。
例如,Minitab 的“质量工具”菜单中的“个体分布识别”过程就是使用似然比检验比较 1 参数指数分布与无约束 2 参数指数分布的拟合优度。
如果 LRT p 值小于 a 水平(通常为 0.05 或 0.10),您可以断定与 1 参数模型相比,无约束 2 参数模型能够为您的数据提供显著更好的拟合优度。
如果 l 是似然比的值,那么对于大样本,(-2lnl) 服从卡方分布,且自由度等于无约束模型和受约束模型中自由参数数目之差。
因此,Minitab 经常通过卡方分布提供与似然比检验相关的 p 值。
第四章假设检验§4.1 假设检验的基本概念1.什么是假设检验在数理统计中,人们常常对总体分布中某些参数或分布函数的形式提出某种假设,然后利用样本的有关信息对所作假设的正确性进行推断,这类统计问题称为假设检验。
2. 假设检验的分类:假设检验可分为两大类:(1)参数的假设检验(Parametric test), 当总体分布形式已知,只对某些参数做出假设,进而做出的检验称为参数假设检验;(2)非参数假设检验(Nonparametric test)。
对分布假设做出的检验为非参数假设检验。
3. 假设检验的例子例4.1 某厂有一批产品,共一万件,须经检验后方可出厂。
按规定标准,合格品率需达99%以上。
今在其中抽取100件产品进行抽样检查,发现有4件次品,问这批产品能否出厂?设产品的合格率为1p−,次品率为p,假设检验要解决的问题是:如何根据样品的次品率(4/100)来推断整批产品的次品率是否超过了1%,问题归结为对假设:0H :整批产品的次品率p 不超过1%.作出接受或拒绝的判断。
一、 零假设与备选假设设ℱ为一分布族,ℱ0为ℱ的子分布族,总体的分布为F .一般地,一个假设可以表示为0:H F ∈ℱ0。
如果ℱ是一个参数分布族ℱ=}),;({Θ∈θθx F ,ℱ0=00{(;),},F x θθ∈ΘΘ⊂Θ, 在这种情况下,假设可以表示为参数假设检验的形式00:H θ∈Θ.以下先集中讨论参数假设检验。
一般把上述假设00:H θ∈Θ称为“零假设”或“原假设”。
当零假设被拒绝时,从逻辑上讲就意味着接受一个与之不同的假设(称为“备选假设”)记为1H 。
如果事先不指明备选假设,则拒绝0H 的含义就是接受备选假设11:H θ∈Θ,1Θ⊂Θ。
但在一些实际问题中,常常指明备选假设 1110:,H θ∈ΘΘ⊂Θ−Θ。
一个以0H 为零假设,1H 为备选假设的假设检验问题常记为:0011::H H θθ∈Θ↔∈Θ (4.2)其中0101,Θ∪Θ⊂ΘΘ∩Θ=∅。
信号检测论——有无法摘要本次实验采用信号检测论中的有无法,检验了甲,乙两名女性被试在呈现信号和噪音的先定概率发生变化时,其辨别力和判定标准是否都受到影响。
结果发现,随着先定概率的减小,两被试判断标准渐渐变的严格,被试的辨别能力大体上渐渐也在提高。
关键词信号检测论有无法ROC曲线辨别力判断标准本次实验尝试用信号检测论—有无法,来检验当呈现信号和噪音的先定概率发生变化时,对被试的辨别力和判定标准是否都有影响,并绘制ROC曲线。
本次实验假设,随着先定概率的减小,两被试判断标准渐渐变的严格,被试的辨别能力则保持不变。
2 方法2.1 被试两名被试,被试甲和被试乙,女,年龄均为20岁;2.2 实验设计本次实验使用先定概率为自变量,被试辨别力和判定标准是因变量。
2.3 实验材料信号及噪音卡片,每张卡片正面写有1位和2位的数字,范围是8-24,背面分为SN和N(SN 和N都呈正态分布);2.4 实验程序2.4.1 确定五种SN呈现的先定概率,本次实验按照实验手册中表6-2的标准进行;2.4.2 主试按照P(SN)=0.9, P(N)=0.1分别从总体SN和N中随机抽样,形成一个n=50的样本。
数据记入表格6-3;2.4.3 将SN和N的数字分布表给被试看,指导语为:“下面给你看一系列的数字卡片,你根据给你呈现的数字分布表来判断该数字为信号还是噪音,并口头报告。
”2.4.4 将每张卡片呈现给被试并让其判断,被试报告“信号”,主试就在记录表相应的空格内记下“+”,若被试判断为“噪音”,主试就在相应的空格内记下“—”。
每做完50次休息2分钟;2.4.5 实验结束后询问被试,在不同的情况下她是如何进行判断的,并将被试的回答记录在下面的“讨论”中;2.4.6 换被试重复上述过程。
3 结果3.1 从PZO转换表中分别查出的与5对P(y/SN),P(y/N)相应的Z和O值,以及五种先定概率的dˊ和β:被试甲如下:被试乙如下:3.2 绘制ROC曲线:被试甲:被试乙:3.3 用本实验的结果说明信号的先定概率如何影响被试的判断标准从表格中我们可以看到:被试甲随着先定概率的减小(0.9,0.7,0.5,0.3,0.1),被试判断标准总体来说是变的渐渐严格(β值渐渐增大,0.89,0.57,0.61,0.81,3.38);被试乙随着先定概率的提高(0.9,0.7,0.5,0.3,0.1),被试判断标准变的渐渐严格,(β值增大很明显,0.33,0..59,0.91,1.41,4.75)。
药时曲线的两组对比检验赵丽萍;夏志明【摘要】本文针对药代动力学中来自不同总体的两组样本进行对比检验.首先给出了原假设与备择假设下的似然函数,然后构造了似然比统计量,并证明了在原假设成立时统计量的极限分布为χ2(3)分布.最后通过数值模拟验证理论的正确性.结果表明:对于参数相同的两组样本,当样本量较大时,统计量的经验分布与极限分布拟合较好.对于参数不同的两组样本,随着参数间差异增大,p值变小,拒绝原假设的证据越充分.%Aiming at two groups of samples from different populations in the pharmacokinetics, we developed a comparative test of two groups. Firstly, we provided the likelihood function when the null hypothesis and the alternative hypothesis are given. Then the likelihood ratio statistic is constructed,and we proved that the limit distribution of the statistic isχ2(3)when null hypothesis is true. Lastly the numerical simulation is conducted to confirm the truth of the theory through data verification. The results show that for the two groups with the same parameters, the empirical distribution and the limit distribution fitting well when the sample size is large. On the contrary, the more differences parameters with the smaller values of the p-value,and the evidence to refuse the null hypothesis will be more sufficient.【期刊名称】《工程数学学报》【年(卷),期】2018(035)001【总页数】12页(P33-44)【关键词】药时曲线;变点;两组对比检验【作者】赵丽萍;夏志明【作者单位】西北大学数学学院,西安710127;西北大学数学学院,西安710127【正文语种】中文【中图分类】O2131 引言药代动力学是定量地描述药物通过各种途径(如静脉注射液、静脉滴注、口服给药等)进入体内的吸收、分布、代谢、排泄规律的一门学科,已在例如生物药剂学、临床药剂学、药物治疗学、分析化学、药理学等学科领域中得到广泛的应用.在临床前的实验研究中,为了评估新药物的安全性,往往以动物作为研究对象.对动物给药后,在事先设定的时间点测得药物浓度,通过药物浓度分析药物在体内的动力学过程.李敬来等[1]明确阐述了药物代谢动力学在药物研发中的意义及作用.关于药物代谢动力学的研究,如果能获得关于药物动力学的先验知识,可以考虑用Bayes方法.Wakefield[2]使用Bayes分层模型分析了群体药物代谢动力学数据,假设了药代动力学数据服从t分布,并考虑了个体之间的差异性.Chen和Lin[3]利用乘法模型对群体药物代谢动力学数据进行分析,并构造了参数的置信区间.Meza等[4]考虑了药代动力学数据服从重尾分布的非线性混合效应模型.Stacy[5]和Cox[6]使用了广义Gamma分布分析重复观测的药代动力学数据,并考虑了相连时间点数据的相关性.Lindsey等[7]比较了奎尼丁的药物代谢动力学数据在不同分布(normal、Log normal、Log Cauchy、Log Laplace、Weibull、Gamma)假设下,利用AIC准则评价模型的优劣,结果表明Gamma分布表现较好.因此,对于不同药物的药代动力学数据分析应该选用其合适的分布.本文将药物浓度的分布推广到更一般的指数族上,并进行了两组样本的对比检验.当样本数据来自不同总体时,例如健康总体与生病总体,应该考虑这两组样本的药时曲线是否存在差异,而这种差异主要反映在药代动力学参数上,因此问题转化为检验两组样本的药代动力学参数是否存在差异.两样本问题从理论上讲是变点[8]理论研究的基础,从实践上讲能够为准确的药代动力学数据分析提供帮助,对给药方案的制定或对某些药理现象做出更准确的解析.本文考虑样本来自两个独立总体时的检验问题,假设数据服从指数族且符合一阶吸收、消除的一房室模型.要检验两组样本的药代动力学参数是否相同,首先给出原假设与备择假设下的似然函数,并构造似然比统计量.在原假设成立的条件下,证明对数似然比统计量的渐近分布为χ2(3)分布.然后进行数值模拟,其中每个个体包含12个个数据.当两样本对应的药代动力学参数相同时,分别对不同个体数N=30,50,100给出统计量的经验分布与极限分布的各分位数、均值、方差的比较.画出N=100时的统计量直方图与极限分布密度曲线图,并利用Kolmogorov 方法进行分布检验.当两样本对应的药代动力学参数不同时,以50个个体的样本量计算各组参数对应的统计量值与p值.结果表明,当参数相同时,个体数为N=30,50,100对应统计量的经验分布与极限分布的各分位数、均值、方差都比较接近,且个体数为100时的经验分布与极限分布拟合较好.当参数不同时,两药代动力学参数差异越大,p值越小,拒绝原假设的证据越充分.最后的实例分析表明,在显著性水平α=0.025时,统计量的值大于临界值,所以拒绝原假设,认为正常组与模型组的药时曲线存在差异.2 统计模型与两组对比检验问题定义1[9] 若随机变量Y的概率分布(离散型)或概率密度(连续型)具有如下形式其中a(·),b(·),c(·)为已知连续函数,θ和ϕ为未知参数,则称Y服从指数族分布.通常θ与E(Y)=µ有关,是我们感兴趣的参数,而ϕ与Var(Y)=σ2有关,为多余参数.令Yij表示第i个个体在第j个时刻的药物浓度观测值,i=1,2,···,N,j=1,2,···,J.D表示给药剂量,ka与ke分别表示吸收、消除速率,V表示表观分布容积.假设tij时刻的药物浓度符合一阶吸收、消除的一房室模型,且不同时间点之间的药物浓度之间是相互独立的.令Y=(Y1,Y2,···,Y N),其中Yi=(Yi1,Yi2,···,YiJ),假设模型有如下形式其中g为联系函数.将上述模型中的未知参数记为(θ1,θ2,···,θk),且令θ1=ka,θ2=ke,θ3=V.为了保证模型的可识别性,Fattinger等[10]在奎尼丁的药物代谢动力学研究中假设ka>ke,本文假设吸收速率ka大于消除速率ke.假设密度族{p(y;θ):θ∈Θ},参数空间Θ是k+3维欧式空间Rk+3中的一个含有内点的集合.Θ0是Θ的一个子集.假设参数θ0是Θ的一个内点.该密度族满足下列条件:假设1 模型可识别性假设:θ1>θ2,θk+1>θk+2,使不同θ值对应不同概率分布.假设2 对密度函数的特点假设:其中K与θ无关,且在含有参数真值θ0的一个邻域内假设3 与Θ0对应的集合A上的密度假设:存在k维欧式空间Rk中的一个含有内点的集合A,以及定义在A上的k+3个三阶可导的函数g=(g1,g2,···,gk+3),使得A与Θ0一一对应在H0成立时,设.假设密度族满足假设1和假设2.假设现有两个总体,分别为正常组与模型组,对应的药代参数分别为(ka1,ke1,V1)与(ka2,ke2,V2),则模型未知参数表示为考虑如下检验问题H0:ka1=ka2,ke1=ke2,V1=V2←→H1:正常组与模型组对应药代参数不全相等.3 大样本检验性质对所研究的个体给药后,通过测量个体在不同时间点的药物浓度,来研究药物在体内的药代动力学过程.对于不同的个体(例如:正常与生病),其差异主要体现在药物浓度上,而药物代谢动力学参数决定着药物浓度,因此要考察不同总体的药代动力学过程是否存在差异,转化为考察药代参数之间是否存在差异.本文考虑两独立总体的假设检验,利用似然比检验方法.似然比检验可以看作Fisher极大似然估计概念在检验问题中的引申,要求原假设备择假设下似然函数的极值存在.求得到似然比统计量值后,为根据检验水平去决定临界值,需要求出统计量在原假设成立时的分布,但在一般情况下很难得到统计量的精确分布,此时可以求出它的极限分布近似地决定临界值.引理1在上述假设1至假设3下,原假设成立时,记θ的,似然方程为,其中则在NJ−→ ∞时,似然方程的解为依概率收敛于φ0.在H1成立时,记似然方程为,其中则在NJ−→∞时,似然方程的解依概率收敛于θ0.证明现证明在H1成立时,当NJ−→∞时,似然方程的解依概率收敛于θ0的情形.在原假设成立时,似然估计的相合性同理可证.对任意的θ′θ,由假设1知模型是可识别的.由Jensen不等式对充分小的,有,且由强大数定律,当NJ−→∞时,有因为l(θ)在上连续,所以必有一局部最大值点.又可微,故,所以似然方程的解依概率收敛于θ0.假设正常组有s个个体,则模型组有N−s个个体,则似然比检验统计量引理2在模型(1)满足假设条件1)和条件2)时,记是似然方程的相合解,则将在处泰勒展开,由于是似然方程的解,则其中.而由条件2)和条件3)及中心极限定理知当NJ→∞时,则所以引理3 在模型(1)满足假设条件1)和条件2)时,有其中证明将在处泰勒展开,则有其中将cij( θ∗)在θ0处泰勒展开,且有引理1知其中因为,所以,故有.又由大数定律所以.由大数定律知所以.从而,所以其中,所以定理1 在模型(1)满足假设条件1)至条件3)及H0时,有证明令则由中心极限定理,在NJ→∞时,有从而I−1(θ0)·V(θ0)与D(θ0)有相同的极限分布,且由引理1的证明过程知I−1(θ0)·V(θ0)与D(θ0)仅相差一个依概率收敛于0的量.由引理1与引理2知,S 与D(θ0)′·I(θ0)·D(θ0)有相同的极限分布且仅相差一个依概率收敛于0的量,且有所以S与[V(θ0)]′·[I(θ0)]−1·V(θ0)仅相差一个依概率收敛于0的量,它们有相同的极限分布.同理,令则有H与仅相差一个依概率收敛于0的量,它们有相同的极限分布,其中仅相差一个依概率收敛于0的量,它们有相同的极限分布.又因为所以有所以2lnλ(Y)与仅相差一个依概率收敛于0的量,它们有相同的极限分布.令,则,且2lnλ(Y)与有相同的极限分布,其中由于G(θ0)是幂等阵,则I−G(θ0)是幂等阵,且I−G(θ0)的秩为所以2lnλ(Y)的极限分布为χ2(3).4 数值模拟4.1 Monte Carlo模拟由于药物浓度是正值,所以通常考虑Yij服从右偏态分布,假设Yij是独立的,服从以下分布其中Yij∼Gamma(µ(tij;ka,ke,V)β,β),β>0.在原假设H0成立情形下,给定剂量D=15,时间t=(1,2,3,4.5,6,7.5,9,12,18,24,36,48)以及参数θ0=(1.6,0.06,1.2,2,1.6,0.06,1.2),利用模型(2)的数据生成机制产生数据,分别产生N=30,50,100个个体数据,各分成两组,每组包含s=15,25,50个个体.对两组样本做假设检验,分别计算出统计量2lnλ(y)的值.重复上述过程2000次,得到2lnλ(y)的经验分布.表1给出了不同样本量下统计量经验分布的分位数、均值、方差与极限分布χ2(3)对应量的比较.从表1可以看出,样本量N=30,50,100对应统计量的经验分布各分位数与极限分布各分位数都比较接近,而且均值与方差都表现很好.表1:经验分布与理论分布各分位数对应值比较个体2.5%5%10%90%95%97.5%均值方差N=30 0.252 0.363 0.644 6.4043 8.027 9.825 3.079 6.258 N=500.257 0.374 0.593 6.541 8.160 9.618 3.076 6.430 N=100 0.187 0.294 0.556 6.225 8.058 9.661 3.005 6.328 χ2(3)0.216 0.352 0.584 6.251 7.815 9.348 3 6在样本量N=100时,画出统计量2lnλ(y)密度直方图与χ2(3)分布密度曲线,如图1所示.从图1可直观看出统计量的密度直方图与极限分布的密度曲线拟合得较好.图1:2lnλ(Y)的直方图与χ2(3)的密度曲线为了更准确地度量经验分布与极限分布的差异,在样本量N=100时,利用Kolmogorov方法进行分布检验.假设2lnλ(y)是来自某连续分布F(x)的一个样本.当n很大时,经验分布Fn(x)是总体分布F(x)的很好估计,二者的偏差不应太大.检验经验分布Fn(x)与极限分布χ2(3)之间的差异.原假设为当n很大时,经验分布Fn(x)趋于χ2(3).Kolmogorov-Smirnov检验统计量是计算Fn(x)与χ2(3)的距离用R语言计算得到D=0.0119值很小,说明经验分布与极限分布的差异小.p值越大,认为数据与理论符合得越好,此时的p=0.9413,所以无法拒绝原假设.在H1成立的条件下,首先给定一组参数ka1=1.6,ke1=0.06,V1=1.2,β=1.2,利用模型(2)的数据生成机制生成数据,生成50个个体,每个个体包含12个数据.在其他参数不变的情况下,取ka2=2.8,3.4,4.4,7.6,分别生成50个个体数据,计算出相应的似然比统计量2lnλ(y)的值.同样取ke2=0.063,0.065,0.067,0.069,V2=1.27,1.29,1.31,1.33,并计算统计量的值.重复上述过程500次,在显著性水平0.05下,计算出检验统计量的势.从表2的结果可以看出,固定其他药代动力学参数不变,使其中一个变化,当参数变化越大时,即两总体差异越大时,检验统计量的势越接近于1.表2:不同参数差异下的结果比较ka2−ka1势ke2−ke1势V2−V1势1.2 0.894 0.03 0.374 0.07 0.884 1.8 0.978 0.05 0.848 0.09 0.974 2.8 0.992 0.07 0.992 0.11 1 6.0 0.994 0.09 1 0.13 14.2 实际数据分析给家兔灌胃广枣-冰片配伍后,以灌胃时间作为零时开始计算,在事先设定的时间点 t=(10,20,30,45,60,75,90,120,180,240,360,480)分钟进行采样,然后测定每次采样的药物浓度(注:数据来源于“陕西省中草药研究中心”).试验中对7只家兔灌胃后测得各个成分的血药浓度,本文取其中一种成分数据进行分析.在7只家兔中,其中5只正常组,2只气滞血瘀模型组.在模型(2)下,考虑两组家兔的药时曲线是否存在差异.H0:两组家兔的药时曲线不存在差异←→H1:两组家兔的药时曲线存在差异似然比统计量在H0下,两组家兔不存在差异,即ka1=ka2,ke1=ke2,V1=V2,受到3个条件的限制,所以参数空间的维度就是4.在H1下,不存在自由的参数,所以限制的参数空间的维度为0.两个维度的差为3.给定显著性水平α=0.025时,χ2(3)的临界值为9.348.由于165大于9.348,所以拒绝原假设,认为两组家兔的药时曲线存在差异.p值接近于0,这是拒绝原假设很强的证据.5 结论本文将药物浓度的分布推广到更一般的指数族上,并进行了两组样本的对比检验.对于来自不同总体的两组样本,检验它们的药时曲线是否存在差异,能够为药代动力学的深入研究提供帮助.本文首先构造了似然比统计量,然后证明了统计量的渐近分布为χ2(3)分布.在药代动力学数据分析中,通常假设数据服从对数正态或Gamma分布,当存在异常个体时,考虑使用t分布等重尾分布.本文假设药物浓度符合一阶吸收、消除的一房室模型,且考虑到药物浓度非负的特点,采用了Gamma布进行数值分析.分析结果表明:对参数相同的两组样本,当样本量较大时,统计量的经验分布与极限分布拟合较好.对参数不同的两组样本,参数之间差异越大,p值越小,拒绝原假设的证据越充分.参考文献:[1]李敬来,崔孟珣,张振清,等.药物代谢动力学在药物研发中的意义及作用[J].解放军药学学报,2010,26(3):258-261 Li J L,Cui M X,Zhang Z Q,et al.The significance and role of pharmacokinetics in drugdevelopment[J].Pharmaceutical Journal of Chinese People’s Liberation Army,2010,26(3):258-261[2]Wakefield J.The Bayesian analysis of population pharmacokinetics models[J].Journal of the American Statistical Association,1996,91(433):62-75[3]Chen Y I,Lin W M.Statistical model and inference for pharmacokinetic data[J].Journal of Statistical Computation and Simulation,2014,84(12):2607-2618[4]Meza C,Osorio F,De la Cruz R.Estimation in nonlinear mixed-effects models using heavy-tailed distributions[J].Statistics andComputing,2012,22(1):121-139[5]Stacy E W.A generalization of gamma distribution[J].The Annals of Mathematical Statistics,1962,33(3):1187-1192[6]Cox C,Chu H,Schneider M F,et al.Parametric survival analysis and taxonomy of hazard functions for the generalized gammadistribution[J].Statistics in Medicine,2007,26(23):4352-4374[7]Lindsey J K,Byrom W D,Wang J,et al.Generalized nonlinear models for pharmacokinetic data[J].Biometrics,2000,56(1):81-88[8]Xia Z M,Qiu P H.Jump information criterion for statistical inference in estimating discontinuous curves[J].Biometrika,2015,102(2):397-408[9]贺晓松,温罗生.广义线性模型的理论及应用实例[D].重庆:重庆大学,2015 He X S,Wen L S.Theory and applications of generalized linearmodel[D].Chongqing:Chongqing University,2015[10]Fattinger K,Vozeh S,Ha H R,et al.Population pharmacokinetics of quinidine[J].British Journal of Clinical Pharmacology,1991,31(3):279-286。