基于新药药效的预测模型
- 格式:doc
- 大小:921.58 KB
- 文档页数:28
基于机器学习的中药药效预测研究近年来,中药作为一种传统药材,被越来越多的人关注。
中药的功效和作用已经经过了几千年的实践和验证。
中药的疗效已经在很多疾病治疗中得到了广泛的应用。
但是,中药的药效和作用并不是很清楚。
这就需要进行针对中药药效进行研究。
基于机器学习的中药药效预测研究,是一种全新的探索方式。
机器学习是一种利用算法让计算机能够从数据中自主学习的方法。
这种方法在一些工业领域中得到了广泛的应用,如生物医学领域的癌症诊断、基因组学。
因此,使用机器学习的方法来预测中药的药效和作用也是可行的。
中药药效预测研究可以分为三个步骤:数据预处理、特征提取以及机器学习模型训练和预测。
数据预处理是指将原始数据转化成可处理的数据。
中药药效预测研究中,原始数据主要来自于中药数据库。
因此,需要对这些中药数据库进行清洗和整理,去掉噪声和冗余的数据。
同时还要进行缺失值的处理,保证数据的完整性和准确性。
特征提取是指从原始数据中提取关键特征,这些特征可以反映中药的药效和作用。
通常情况下,一个中药可以有许多化学成分,因此需要对这些成分进行筛选,选择与药效相关度最高的化学成分为特征。
同时,还可以考虑使用文献综述和专家询问等方法,对特征进行筛选和确定。
机器学习模型训练和预测是最核心的部分。
在选择机器学习算法时,需要考虑到数据的特点和问题要解决的任务类型。
对于中药药效预测研究,因为需要进行多标签分类,因此常用的机器学习算法包括:KNN、决策树、随机森林等。
同时,在训练和预测过程中,还可以考虑使用交叉验证和网格搜索等方法,优化模型的性能。
中药药效预测研究的意义在于提高中药的利用率和疗效。
传统的中药研究,通常是采用经验的方法来确定中药的使用范围。
但是,这种方法存在着信息不对称和误差积累的问题。
基于机器学习的中药药效预测研究,可以充分利用大数据和人工智能的优势,实现中药的精准治疗。
此外,基于机器学习的中药药效预测研究还可以为药物合成和药物研发提供参考。
简述药效团模型方法的概念和原理
药效团模型方法是一种常用的药物设计和药效预测方法,通过分析化合物中的结构和化学特征,以药物分子中具有特定生物活性的药效团作为关键标志,从而
预测和优化药物分子的活性和选择性。
该方法的原理基于药效团(pharmacophore)的概念,即一组具有特定功能和
空间关系的分子或原子团,能与药物和生物靶点之间发生特定的相互作用。
药效
团模型方法通过根据已知的药效团信息和活性化合物的结构,建立一个具有一定准确性和预测性的模型,以识别和验证具有类似药效团的化合物,从而筛选出可能具有相似生物活性的化合物。
在建立药效团模型时,通常需要考虑以下几个关键因素:首先,必须选择合适的活性化合物数据库,以保证模型的可靠性和准确性;其次,需要通过合适的分
子对齐方法将活性化合物的结构进行比对,以确定药效团在药物分子中的活性位点;然后,根据已知的活性药效团和结构活性关系,构建出一个合理的药效团模型;最后,通过验证该模型对已知和未知化合物的预测效果,评估模型的可靠性和适用性。
药效团模型方法具有许多优点,例如可以在早期药物设计过程中快速、准确地预测候选化合物的活性,从而加速药物发现和开发的进程;能够提供对生物活性关键结构的理解和解释,为合理设计目标化合物提供指导;可以用于药物筛选和虚拟筛选,从大量化合物中筛选出具有潜在活性的化合物。
然而,药效团模型方法也存在一些限制,如对已知药效团信息的依赖性较强,没有考虑化合物的物理化学属
性等。
总之,药效团模型方法是一种有效且广泛应用的药物设计和药效预测方法,通过分析和利用药效团的生物活性信息,能够预测和优化化合物的活性和选择性。
这一方法可以在药物研发过程中起到重要的指导作用,促进新药的发现和开发。
新药研发的失败率之高是众所周知的,新药研发过程中一方面是依靠动物实验获得临床前数据来预测药物的药效、毒性以及在人体中的PK(药代动力学)参数,这是早期的“标准操作”,,而另一方面,以体外细胞模型来替代动物实验,建立药物体外ADME模型,当前的体外模型主要依靠二维或者简单的三维细胞培养体系,简单快速高通量是它的优势,广泛用于早期化合物的筛选。
上海美迪西生物制药公司在药代动力学方面有丰富广泛的经验,为客户提供从所有小分子到大分子(蛋白质和抗体)的高质量药代动力学服务,包括体外ADME和体内药代以及生物分析。
涉及的动物种类有非人灵长类、狗、小鼠、大鼠、兔、豚鼠等。
其中非灵长类平台及利用同位素蛋白质/抗体实验平台被上海市政认定为重要实验室平台。
对于创新药物的研发,其过程由3个阶段、4个步骤组成:靶位的发现、特性与评价(生物靶标阶段);先导化合物的发现和优化(药物发现阶段);ADMET(吸收、分布、代谢、排泄和毒性)、PK、PD研究(药物发现和开发阶段);临床试验(药物开发阶段)。
关于药物吸收(Absorption)、分布(distribution)、代谢(metabolism)、排泄(excretion)的研究已成为药物化学研究中必不可少的部分,也是药物的研发与登记中相当重要的环节。
1、为什么要进行药物开发阶段进行ADME研究?在医药领域,一旦确认了一个重要的市场需求或疾病,就需要根据病理生理学知识、已知的分子作用机制和相关化学研究来选择有价值的治疗靶标。
根据初期假设所提出的药物进入途径、分子靶标位点进行研究,往往具有较大的风险。
通常,关于 ADME 的研究会被部署于药物开发阶段,因为如果要使已经投入应用的药物同时满足靶点和 ADME的要求,需要复杂的化学改造过程。
另外,制药公司将现有的医药发现模型转化成有效的人类药物的过程中,将面临许多困难,因为在临床试验前,研发者不能对人体进行测试。
这就要求研发者在病理生物化学,药物的理化性质和 ADME 特性上进行深入的了解。
设计基于CTMO的药效建模研究近年来,随着计算机技术和医疗技术的快速发展,医学信息化成为医疗行业的大趋势。
在这个趋势中,药效建模成为药学研究和药物临床应用的重要手段之一。
本文将介绍一种基于CTMO的药效建模研究方法,探究它对药学研究的意义。
一、药效建模的定义药效建模指通过量化药物与人体、微生物或疾病的相互作用及药物的代谢和排泄等关键生物过程来预测药物的功效和不良反应。
药效建模可以帮助研究人员更准确地评估药物的疗效和毒性,为药物研发、药物筛选、剂量确定和临床用药提供科学依据。
二、CTMO的介绍CTMO是中文临床试验药物研究协作组织(Chinese Trial Medical Organization)的缩写。
它是中国药监局主管的,由多个临床研究中心、医院和科研院所组成的一个协作组织。
CTMO通过开展大规模的多中心随机双盲临床试验,推动新药的研发和临床转化。
三、基于CTMO的药效建模研究方法基于CTMO的药效建模研究方法,主要是基于CTMO所获取的大量临床试验数据,建立数学模型来预测药物疗效和毒性。
该方法主要有以下几个步骤:1. 数据挖掘和预处理该步骤主要是对原始数据进行清理和筛选,确保数据的准确性和可信度。
2. 特征提取和特征选择该步骤主要是从数据中提取药物、生物学和临床特征,并对这些特征进行筛选和优化,以获得最佳的特征集。
3. 建立数学模型在该步骤中,研究人员利用机器学习、数据挖掘等技术,建立药效预测模型或毒性预测模型。
这些模型可以通过训练集和测试集的训练和测试来进行优化和验证。
4. 模型评估和优化在该步骤中,研究人员采用多种指标对数学模型进行评估和优化,以确定最佳模型并提高预测准确率。
四、基于CTMO的药效建模研究的意义基于CTMO的药效建模研究方法可以为药物研发和临床用药提供科学依据,具有重要的实用价值和临床应用前景。
首先,该方法能够从大量的临床试验数据中提取有效的信息,解释药物的疗效和毒性机制。
SAR与QSAR技术在新药研发中的应用随着生物学和药理学领域的不断发展,新药研发越来越复杂和技术化,历经多年才可能有望上市。
在这个过程中,SAR (Structure-Activity Relationships,结构-活性关系)和QSAR (Quantitative Structure-Activity Relationships,定量结构-活性关系)技术成为了新药研发中必不可少的工具之一。
SAR和QSAR技术标志着由经验性制药过程向精确、个性化的制药过程转变的重要一步。
为什么需要SAR和QSAR技术?药物分子的效价(活性)一般来说与药物分子的结构密切相关,而新药的研发通常需要从大量的化合物中筛选出活性最强的化合物。
传统的药物研发方法是通过炮弹式进行的,即大量合成并测试大量化合物,耗费时间和人力成本巨大,进展缓慢。
而SAR和QSAR技术则能够帮助科学家更准确预测一种新药分子的效价,从而节省经费和时间,提升研究效率,加速新药研发。
SAR技术SAR技术是基于结构坐标的关联分析,通过分类分子结构及活性之间关联的分析方法,预测一种新分子的活性。
换而言之,SAR技术利用分子的结构信息,预测化合物的活性,使药物研究人员能够通过有指导意义的探索不同分子结构来改进相应的药物性质。
其主要优点在于能够指导新药分子优化设计,节省研究和开发经费。
QSAR技术相对于SAR技术,QSAR技术在分子结构、属性和相应活性之间建立了更严格的关系模型。
它通过量化模型,将结构-活性关系表示为数学表达式,准确预测新药分子的活性。
QSAR技术对于实验条件复杂,需要进行大量实验才能得到数据的情况特别适用。
通过对合理的QSAR模型的构建和验证,药物研究人员可以实现通过计算化合物活性,避免不必要的化合物合成和实验,提高药物研发效率。
SAR和QSAR技术联合应用SAR和QSAR技术不是相互排斥的,而是可以结合使用的。
建立SAR模型采用的一般是人工智能机器学习,而QSAR模型采用的则是多元统计分析和机器学习技术。
新型止痛药药效的预测模型问题 一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物实验,给患有同种病痛的病人使用这种新止痛剂的以下4个剂量中的某一个:2g,5g,7g和10g ,并记录每个病人病痛明显减轻的时间(以分钟计)。
为了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按性别及血压得低,中,高三档平均分配来进行测试。
通过比较每个人病人的血压历史数据,从低到高分成三组,分别计作0.25,0.50,0.75。
实验结束后,公司的记录结果见下表(性别以0表示女,1表示男)。
请你为公司建立一个模型,根据病人用药的剂量、性别和血压组别,预测出服药后病痛明显减轻的时间。
用药剂量/g性别血压组别病人序号病痛减轻时间/min135200.25243200.50355200.75447210.25543210.50657210.75726500.25827500.50928500.751029510.251122510.501229510.751319700.251411700.501514700.751623710.251720710.501822710.7519131000.252081000.502131000.7522271010.2523261010.502451010.75表一分析与假设按照常识病痛减轻时间随着用药剂量的增加而增加,血压高的人病痛减轻时间少于血压低的人。
所以病痛减轻时间记作,药剂量记作,性别记作而且,血压高低记作基本模型 建立病痛减轻时间分别于与药剂量,性别,血压高低之间的线性关系,并作出分别与药剂量,血压高低的散点图对药剂量的散点图 对血压高低的散点图建立病痛减轻时间分别于与药剂量,性别,血压高低之间的线性关系的回归方程模型为利用MATLAB的统计工具箱可以得到回归系数以及置信区间(置信水平)结果见下表参数参数估计值参数置信区间63.1291[48.7173 77.5409]-10.2706[-14.9243 -5.6169]5.6667[-0.0213 11.3546]-1.5000[-15.4325 12.4325]0.5111[0.1319 0.8903]= 0.8275 F= 22.7903 P= 0.0000 = 44.3109结果分析 从表二中知= 0.8275,即因变量的82.75%可由模型确定,F= 22.7903超过临界值,P= 0.0000远小于,因而模型总体可用,但是因为该模型中,都存在零点所以还有待改进。
不良反应和预测模型
不良反应是指使用药物或接受其他治疗方法后出现的不良症状或副作用。
预测模型是指基于已有数据和统计方法,建立数学模型来预测未来事件或结果的工具。
在药物研发和临床实践中,预测模型可以用来预测药物的不良反应。
通过收集大量的临床试验数据、病例报告和其他相关信息,可以建立预测模型来预测某种药物在特定人群中可能出现的不良反应。
预测模型可以基于机器学习、人工神经网络、统计分析等方法来构建。
具体的建模过程包括特征选择、模型训练和验证等步骤。
通过这些模型,可以对患者在接受某种治疗方法后可能出现的不良反应进行风险评估和预测。
然而,预测模型并非完美,存在一定的误差和不确定性。
因此,在使用预测模型进行不良反应预测时,需要谨慎对待结果,同时还需要结合临床医生的专业判断和临床实践经验来做出最终的决策。
生物医药中的药效预测随着科技的发展,生物医药领域也取得了长足的进步。
其中,药效预测技术的应用尤为重要。
药效预测是指在化学物质进入人体前,通过计算机模拟等方法预测药物的效果。
这项技术可以大大减少药物开发所需的时间和费用,并在多个领域得到了广泛的应用。
药效预测的方法目前,药效预测的方法主要分为以下几种:1.计算机辅助药物设计(CADD):CADD技术是一种利用计算机在化学分子层面上设计新药物的方法。
该技术利用化学信息学、分子建模和机器学习等多种方法,通过预测药物分子的结构和性能,提高药物研究的效率和可靠度。
2.生物信息学预测:生物信息学预测是基于对生物信息的挖掘和分析,以预测新药物的药效。
该技术可通过基因、蛋白质序列、代谢途径等多种信息,在临床前预测新药物的疗效和副作用。
3.化学信息学预测:化学信息学预测是通过对已知药物分子结构和性质的分析,推算出未知药物分子的结构和性质,从而预测未知药物的药效。
药效预测的应用药效预测在生物医药领域的应用广泛,其中主要应用如下:1.药物开发:药效预测可以加速药物开发过程,优化药物设计、研发和临床试验的效率,减轻研发成本和风险。
如利用CADD技术,科学家可以通过计算机模拟预测新药物的性能,预测其对疾病的治疗效果。
2.临床前筛选:药效预测技术可以在药物进入人体前,预测其对人体的影响,从而筛选出对目标疾病有治疗效果、副作用小的药物。
这种临床前筛选可以给药物安全性和有效性评估提供参考,并有助于缩短药物开发时间。
3.疾病预测:药效预测技术可以通过基于生物信息学和药物学的分析,预测某些疾病的发生、发展和转归。
这样一来,可以提前预防、诊断和治疗某些疾病,有效地提高了生命质量和生命安全。
未来发展趋势随着技术的不断发展,药效预测技术也在不断的改进和完善。
未来,药效预测技术将会在以下几方面获得更多突破:1.快速高效:药效预测技术将更加高效快捷。
随着技术的进步和计算机性能的提高,药物分子模拟和人体代谢模拟的速度将会更快,使得研究人员可以在较短的时间内预测药效,加速新药研发。
基于新药药效的预测模型摘要本文主要讨论了新药临床实验的数据分析问题,根据公司在新药上的实验数据表,建立了统计回归模型和神经网络模型,并对题目给出的四个人服了这种药剂后疼痛减轻时间进行了预测。
我们建立了统计回归模型,在回归方程的确定过程中,从多元的线性回归模型推导至可化为线性的非线性回归模型,然后运用EView5.0分别对两个线性回归方程进行了检验,模型在置信概率为95%的条件下通过检验,并画出相应模型的的残差图,以便于模型的最优化选择。
同时我们还构造两个可线性化非线性模型,用matlab7.0对这两个回归方程进行了检验,同样在置信概率为95%的条件下通过检验。
然后进行逐步回归分析,计算出各项的系数。
最后通过分析及剔除变量法,并运用Excel2003对可化为线性的非线性回归方程的显著性检验,结合两个线性回归方程,最终得到一个比较合理的非线性回归模型。
运用该模型得到的预测结果分别为11.3631,15.6312,28.3152,39.9367分钟。
BP神经网络模型通过建立BP神经网络,让其依照试验结果记录中疼痛减轻时间,用药剂量,性别与血压的数据进行自我训练,得到一个误差小的关系式,最后利用这个关系式来对另外四个人服用止痛药后疼痛减轻时间进行预测。
并得到以下结果:四个服用止痛药的人疼痛明显减轻的时间为11.2875,16.1335,29.3262,41.0284分钟。
最后,我们对上述模型进行分析评价,提出了一些可能的改进方向。
关键字:统计回归线性方程非线性方程神经网络残差检验一、问题的重述与分析1.1 问题的重述1、某公司研制了一种止痛的新药,通过临床试验来确定它的疗效。
在临床试验过程中,用4种剂量来试验,剂量分别是2g,5g,7g,10g,分别记录每个病人用药后病痛明显减轻所需的时间(以分钟计)。
为了了解新药的疗效与病人性别和血压之间的关系,试验过程中研究人员把病人按性别及血压的高(0.8)、中(0.55)、低(0.3)三档来进行测试。
试验结束后,公司的记录结果见附件(性别1表示女,0表示男)。
附件中给出了相关的数据,需要建立合适的数学模型来分析病痛减轻的时间与用药剂量、性别和血压的关系。
2、通过问题一对病痛减轻的时间与用药剂量、性别和血压的关系的分析,进一步对于下面不同人服药的数据,预测出病痛明显减轻的时间。
1.2问题的分析问题一:为了了解新药的疗效与用药剂量、病人性别和血压之间的关系,我们用病痛减轻的时间长短来评估药效,即我们可以这样认为:疼痛减轻时间长则表示药效相对不好,而疼痛减轻时间短则表示药效相对较好。
而病痛减轻时间与用药剂量、病人性别和血压的关系是无法事先确定的,需要通过对样本数据的拟合,建立回归模型后加以分析。
问题二:为了预测出不同性别,有不同血压的病人用不同剂量的止痛药,病痛明显减轻的时间的多少,需要研究病痛减轻的时间与用药剂量、性别和血压的关系。
借助于MATLAB软件,构建一个输入用药剂量,性别与血压组别,输出疼痛减轻时间的神经网络可以达到目的。
二、模型的基本假设假设1:疼痛减轻的时间长短可以代表用药效果。
即疼痛减轻时间长则表示药效相对不好,而疼痛减轻时间短则表示药效相对较好。
假设2:疼痛减轻时间只与题目所给的用药剂量、性别、血压有关,其他外在条件对其不存在影响。
假设3:假设男性以0来计算,女性以1来计算,以便于问题研究。
三、符号说明四、模型的建立与求解4.1 模型一:统计回归模型我们记药效减轻的时间为y ,病人的用药剂量记为1x ,性别记为2x ,血压记为3x 。
基于以上分析并结合题目给出的24组数据,我们建立预测模型——统计回归模型。
4.1.1 (建立多元线性回归模型)(1)建立包含用药剂量、性别、血压的三元线性回归模型:我们运用EView5.0软件进行求解:在命令窗口依次键入以下命令即可:CREATE U 24DATA Y X1 X2 X3输入数据后键入命令:LS Y C X1 X2 X3即得如下结果(图表一):图表一 新药药效的估计结果因此病痛减轻的时间与用药剂量、性别和血压的关系函数为:3215000.16667.51373.4149.49x x x y -+-=∧]1[ t=(8.4807) (-7.6460) (1.7960) (-0.1940) (模型1) 7553.02=R 7186.02=R 575.20=F模型的求解结果表明,用药剂量对疼痛减轻时间的边际效益为(-4.1373), 由于性别只存在0和1的取值,所以男性和女性的不同对因变量的影响值为5.6667,血压对疼痛减轻时间的边际效益为(-1.5000)。
7553.02=R ,说明模型的拟合度不错。
模型1的显著性检验:1、F 检验:对于多元线性回归模型:i ik k i i i x b x b x b b y ε+++++=∧22110假设0H : 021====k b b b若假设成立,则意味着:i i a y ε+=表明y 的变化主要由模型之外的变量来决定,模型的线性关系不显著,所设定的模型没有意义。
在原假设0H 成立的情况下,可以证明: )1,(~)1(22----⎪⎪⎭⎫ ⎝⎛-=∑∑-∧k n k F k n i ki F e y y ]2[所以,对于给定的显著水平α,可由F 分布表查得临界值αF ,如果根据样本数据计算得出: αF F >则拒绝原假设0H ,即回归系数k b b b ,,,21 中至少有一个显著地不为0;此时可以认为模型的线性关系式显著的。
反之,则接受0H ,认为模型的线性关系不显著。
结合该模型数据(图表一),在置信概率为95%的条件下,由F 分布表查得临界值10.3=αF ,而实际模型中的F=20.575,即αF F >说明F 检验也是高度显著的,说明用药剂量、性别和血压对疼痛减轻时间的总影响是显著的。
2、解释变量的显著性检验(t 检验):如果模型通过了F 检验,则表明模型中所有解释变量的“总影响是显著的, 但这并不同时意味着模型中的每一个解释变量对y 都有重要的影响,或者说并不是每个解释变量的单独影响都是显著的。
因此,有必要对模型中每个解释变量(影响)的显著性进行检验,检验过程仍然采用假设检验方法。
对于多元线性回归模型:i ik k i i i x b x b x b b y ε+++++=∧ 22110假设0H : 021====k b b b即假设i x 对y 没有显著影响。
对于t 统计量我们有: )1(~)(---=∧∧k n t b S b b t i ii ]2[因此,对于给定的显著水平α,可以由t 分布表查得临界2αt ,若2||αt t >,则表明原假设0H 是一个错误假设,应该拒绝,即认为系数i b 显著的不等于0,i x 对y 有显著的影响:反之,则认为影响不显著,应该考虑i x 从模型中剔除而重新建立模型。
结合该模型数据(图表一),在置信概率95%的条件下,由t 分布表查得临界值086.2205.0=t ,而实际模型中解释变量32,x x 的t 统计值都要小于205.0t ,所以不能通过检验。
因此,需要对以上三元线性回归模型做适当的调整,按照统计检验程序,一般应先剔除t 统计量最小的变量(即血压变量)而重新建立模型。
]3[(2)建立剔除血压变量的二元线性回归模型:我们运用EView5.0软件进行求解:在命令窗口依次键入以下命令即可:CREATE U 24DATA Y X1 X2输入数据后键入命令:LS Y C X1 X2即得如下结果(图表二)图表二 剔除时间变量后的估计结果因此病痛减轻的时间与用药剂量和性别的关系函数为:216667.51373.4323.48x x y +-=∧t=(12.558) (-7.827) (1.839) (模型2) 7548.02=R 7315.02=R 325.32=F模型的求解结果表明,用药剂量的对疼痛减轻时间的边际效益为(-4.1373), 由于性别只存在0和1的取值,所以男性和女性的不同对因变量的影响值为5.6667,表明在这种情况下性别对疼痛时间的影响较为明显。
模型2的显著性检验:1、F 检验:用模型显著性检验的方法,结合图表二的数据,我们可以得到这样的结论:在置信概率为95%的条件下,由F 分布表查得临界值47.3=αF ,而实际模型中的F=32.325,即αF F >说明F 检验也是高度显著的,说明用药剂量和性别对疼痛减轻时间的总影响是显著的。
2、解释变量的显著性检验(t 检验):用模型显著性检验的方法,结合图表二的数据,我们可以得到这样的结论:在置信概率90%的条件下,由t 分布表查得临界值721.105.0=t ,而实际模型中解释变量21,x x 的t 统计值都要大于205.0t ,所以能通过检验。
模型2的拟合度相较模型1并没有多大变化,F 检验也是高度显著的。
这里,解释变量、常数项的t 检验值都相对比较大,都可以在置信概率90%以上通过检验,因此模型2较模型1更为合理。
4.1.2 (建立多元非线性回归模型)模型的准备:由附件中给出的数据,我们可以看出,同列相同值但是对应的疼痛时间值是不同的,这说明疼痛时间y 的确定与用药剂量1x 、性别2x 和血压3x 这三个因变量有关的。
于是我们用matlab7.0软件来分析Y 与这三个变量之间的关系,分别求出不同的变量对应的合适值,以用药剂量与病痛减轻时间的关系为例(程序见附录一),用药剂量为()T10752时,病痛减轻的时间为()T6176.133627.186373.267157.46。
然后我们通过MATLAB7.0软件分别画出对应图像(图表三):图表三 疼痛减轻时间分别与三个变量之间的关系图其中红色曲线代表y 与用药剂量1x 之间的关系,绿色曲线代表y 与性别2x 之间的关系,蓝色曲线代表y 与血压3x 之间的关系。
从上面的图,我们发现:因变量y 与三个自变量1x 、2x 、3x 之间存在着复杂的非线性关系,于是对模型1中的线性回归模型进行修改,并逐步加以分析。
(三)建立可线性化的三元非线性回归模型:我们估计疼痛减轻时间y 与321,,x x x 之间是一个非常复杂的关系,这是一个多元的关系,于是我们建立了如下多元非线性统计模型:31621513433221110x x x x x x x x y βββββββ++++++=--这是一个可线性化模型。
令 317216135114,,,x x x x x x x x x x ====-- 即得:7665543322410x x x x x x y βββββββ++++++=又令 ()T 6543210ββββββββ=我们用MATLAB7.0软件进行统计量p F R ,,2的检验(程序见附录2),运行结果如下(图表四):图表四 统计量的检验结果这个检验结果显示,9212.02=R 指因变量y (病痛减轻时间)的92.12%可由模型确定,在置信概率95%的条件下,由F 分布表查得临界值70.2)17,6(05.0=F ,而本模型的12.33=F 超过临界值,并且0000.0=p 小于0.05,可以通过显著性检验。