当前位置:文档之家› 代谢组学方法与应用(许国旺)张强

代谢组学方法与应用(许国旺)张强

代谢组学方法与应用(许国旺)张强
代谢组学方法与应用(许国旺)张强

第1章绪论

随着人类基因组测序工作的完成,基因功能的研究逐渐成为热点,随之出现了一系列的“组学”研究,包括研究转录过程的转录组学(transcriptomics)、研究某个生物体系中所有蛋白质及其功能的蛋白质组学(proteomics)及研究代

(图1-1)。谢产物的变化及代谢途径的代谢组学(metabolomics或metabonomics)代谢组学是众多组学中的一种,是随着生命科学的发展而发展起来的。与其他组学不同,代谢组学是通过考察生物体系(细胞、组织或生物体)受刺激或扰动后(如将某个特定的基因变异或环境变化后),其代谢产物的变化或其随时间的变化,来研究生物体系的一门科学[1]。所谓代谢组(metabolome)是基因组的下游产物也是最终产物,是一些参与生物体新陈代谢、维持生物体正常功能和生长发育的小分子化合物的集合,主要是相对分子质量小于1000的内源性小分子。代谢组中代谢物的数量因生物物种不同而差异较大,据估计,植物王国中代谢物的数量在200000种以上,单个植物的代谢物数量在5000~25000,甚至简单的拟南芥(Arabidopsisthaliana)也产生约5000种代谢产物,远远多于微生物中的代谢产物(约1500种)和动物中的代谢产物(约2500种)[2]。实际上,在人体和动物中,由于还有共存的微生物代谢、食物及其代谢物本身的再降解,到目前为止,还不能估计出到底有多少种代谢产物,浓度分布范围有7~9个数量级。因此对代谢组学的研究,无论从分析平台、数据处理及其生物解释等方面均面临诸多挑战。本章对代谢组学发展的历史、国内外现状、研究方法、典型应用领域及研究热点等给予了介绍。

代谢组学简介

代谢组学发展的时代背景

生命科学是研究生命现象、生命活动的本质、特征和发生、发展规律,以及各种生物之间和生物与环境之间相互关系的科学。自从1953年Watson和Crick 建立了DNA双螺旋结构模型后,生命科学研究的面貌便焕然一新。在此基础上发展的分子生物学使得生命的基本问题,如遗传、发育、疾病和进化等,都能从分子机制上得到诠释。生物学研究进入了对生命现象进行定量描述的阶段。分子生物学的飞速发展极大地推动了人们从分子组成水平对生物系统进行深人的了解。

基因组计划向人们展示了包括大肠杆菌、酵母、线虫、果蝇、小鼠等模式生物以及人类的所有遗传信息的组成,生命的奥秘就存在于这些序列中。技术上的突破使得基因组数据的获得已经不再是生命科学的难点。人类基因组计划的基本完成标志着后基因组时代的到来,在这一时期,基因组功能分析成为生命科学的主要任务,核心思想是以整体和联系的观点来看待生物体内的物质群,研究遗传信息如何由基因经转录向功能蛋白质传递,基因功能如何由其表达产物蛋白质以及代谢产物来体现。继基因组(genome)后、转录组(transcriptome)、蛋白质组(proteome)等相继出现,并相应形成“omics”学说,如转录组学(transcriptom-ics)、蛋白质组学(proteomics)等。但是基因与功能的关系是非常复杂的,还不能用转录组、蛋白质组来表达生物体的全部功能。生物体内存在着十分完备和精细的调控系统以及复杂的新陈代谢网络,它们共同承担着生命活动所需的物质与能量的产生与调节。在这一复杂体系中,既有直接参与物质与能量代谢的糖类、脂肪及其中间代谢物,也有对新陈代谢起重要调节作用的物质。这些物质在体内形成相互关联的代谢网络,基因突变、饮食、环境因素等都会引起这一网络中某个或某些代谢途径的变化,这类物质的变化可以反映机体的状态。起调节作用的代谢物,从生理功能上来说包括神经递质、激素和细胞信号转导分子等,从化学组成上来说包括多肽、氨基酸及其衍生物、胺类物质、脂类物质和金属离子等,这些调节物质绝大部分都是小分子物质,在植物与微生物中还存在着大量的次生代谢产物。这些分子广泛分布于体内,对多种生理活动都具有普遍和多样的调节作用,仅微量存在就能够发挥很强的生物效应。不同活性的分子或协同、或拮抗、或修饰而相互影响,在生物学效应以及信号转导和基因表达调控上形成复杂的网络,承担着维持机体稳态的重要使命,是神经内分泌和免疫网络调节的物质基础和自稳态调节的最重要成分。转录组、蛋白质组的研究很难涵盖这些非常活跃而且非常重要的生命活性物质,然而对这类物质的生理和病理生理学意义如果不能充分认识,就不可能真正阐明生命功能活动的本质。传统研究方法是以生理学和药理学实验方法为主,缺乏高通量的研究技术,难以建立生物小分子物质复杂体系的研究模式。在这种情况下,代谢组(metabolome)和代谢组学(metabolomics或metabonomics)应运而生了,并成为系统生物学的一个重要突破口[3],代谢处于生命活动调控的末端,因此代谢组学比基因组学、

蛋白质组学更接近表型。

从广义的代谢组学的意义上来说,代谢组学的历史是相当长的,很早以前人们就已经对生物样品中的某些靶标化合物进行分析以了解生命机体的状态。目前代谢组学所采用的一些技术平台,如NMR和色谱技术以及质谱技术也有比较长的应用历史。严格意义上的代谢组学(对限定条件下的特定生物样品中所有代谢组分的定性和定量)从提出到现在只有短短数年的时间。现在一般认为代谢组学源于代谢轮廓(metabolicprofiling)分析,在代谢轮廓分析中体现了代谢组学的“尽可能多地分析生物样本中的代谢产物”这一理念的萌芽。在这里,我们对从代谢轮廓分析发展到代谢组学这一过程[4](图1-2)做一简单的介绍。

早在20世纪70年代初,Baylor医学院就发表了有关代谢轮廓分析方面的论文,在他们的工作中采用了GC-MS的方法对多种类固醇、有机酸以及尿中药物的代谢物进行了分析,并将这种多组分分析的方法称为代谢轮廓分析,开创了对复杂样品进行代谢轮廓分析的先河。此后代谢轮廓分析广泛应用于血、尿等生物样本中代谢物的定性与定量分析,以对疾病进行筛选和诊断。在临床上使用GC-MS 的方法来诊断疾病的方法一直沿用到今天。紧接着,人们把重点主要放在分析的自动化上,并将GC的方法用于其他类型化合物的分析。进入20世纪80年代,人们开始使用高效液相色谱和核磁共振的技术来进行代谢轮廓的分析,如1982年,荷兰应用科学研究所(TNO)的vanderGreef[5]在国际上首先采用质谱对尿中代谢指纹进行研究。1983年,Sadler、Buckingham和Nicholson发表了第一个有关全血和血浆的1H-NMR谱[6]。在1986年,色谱杂志Journal of Chromatography 发表了一期有关代谢轮廊(metabolic profiling)分析的专辑。进入90年代,代谢轮廓分析技术一直平稳发展,每年都有10~15篇的论文发表,不过这一时期人们的目标更多地集中于某些特定的标靶化合物上。在90年代初,Sauter等人用基于GC-MS代谢轮廓分析的方法研究了不同除草剂对大麦的影响,这种用代谢轮廓分析来研究各种因素对生物功能的影响的研究思路随即被人们认可。1997年,Steven Oliver研究小组提出了通过对代谢产物的数量和定性来评估酵母基因的遗传功能及其冗余度,并率先提出了代谢组的概念[7]。1999年,等提出

metabonomics的概念[8],并在疾病诊断、药物筛选等方面做了大量卓有成效的工作[1,9~11]。接着,德国的Max-Planck-Institut的科学家们开始了植物代谢组学的研究[12],使代谢组学得到了极大的充实。

代谢组学的特点为:

(1)关注内源化合物。

(2)对生物体系中的小分子化合物进行定性定量研究。

(3)上述化合物的上调和下调指示了与疾病、毒性、基因修饰或环境因子的影响。

(4)上述内源性化合物的知识可以被用于疾病诊断和药物筛选。

与转录组学和蛋白质组学比较,代谢组学有以下优点[13]:

(1)基因和蛋白质表达的微小变化会在代谢物上得到放大,从而使检测更容易。(2)代谢组学的研究不需建立全基因组测序及大量表达序列标签(EST)的数据库。

(3)代谢物的种类要远小于基因和蛋白质的数目(每个组织中大约为1〇3数量级,即使在最小的细菌基因组中也有几千个基因)。

(4)研究中采用的技术更通用,这是因为给定的代谢物在每个组织中都是一样的缘故。

代谢组学是近几年才发展的一门新兴的技术,如何对这种技术进行命名曾经有争议,国际上存在metabolomics和metabonomics两个词汇,一般认为,metabolomics是通过考察生物体系受刺激或扰动后(如将某个特定的基因变异或环境变化后)代谢产物的变化或其随时间的变化,来研究生物体系的代谢途径的一种技术。而metabonomics 是生物体对病理生理刺激或基因修饰产生的代谢物质的质和量的动态变化的研究。前者一般以细胞作研究对象,后者则更注重动物的体液和组织。在植物、微生物领域一般用metabolomics,在药物研究和疾病诊断中,一般用metabonomics。现在这两个定义已经模糊化[6],没有特别的区分。

代谢组学研究现状

目前,代谢组学正日益成为生命科学研究的重点之一,在世界范围越来越多的科学工作者已加入到代谢组学的研究中。这可以从以下几个方面体现。

有关代谢组学的文献数量增长迅速,学术活动活跃

“Web of knowledge”是检索科学文献最好的网站之一,在该网站以metabolomics or metabonomics 和 metabolic profiling 为主题词进行检索,可得图1-3。以metabolomics or metabonomics 检索可得1950 篇,以metabolic profiling 检索可得 4581 篇(2008 年 1 月 5 日)。类似地,从“Web of knowledge”使用 proteomics 和 metabolome 分别检索到总文献9361篇和1000篇(图1-4),发现引用次数分别为112 566和8355,平均每篇引用分别为12. 02和,h指数分别为113和39。从中可知,尽管代谢组学比较年轻,是新兴技术,文献的总量不多,但与蛋白质组学相比,它们具有非常类似的发展趋势。

代谢组学的学术活动也在蓬勃进行,2001年12月在美国举行了题为“Metabolic Profiling: Pathways in Discovery”的专题会议,一年后(2002年11月)在加利福尼亚州召开的系统组学国际会议也特别强调了代谢组学。有关植物代谢组学方面的会议更多,2002年4月、2003年4月、2004年6月及2006年7月分别在荷兰、德国、美国和英国举行了第一届、第二届、第三届和第四届植物代谢组学国际会议,会议就分析技术的发展、代谢数据的生物信息和数据统计分析、标准化及数据库、代谢组学在解决生物技术问题中的作用和发展农作物等方面进行了广泛的探讨。2008年7月,国际植物代谢组学会议将在日本的横滨召开。

为与代谢组学的迅猛发展相适应,国际代谢组学学会()应运而生,并创刊了专业杂志Metabolomics()。2005年6月在日本召开了第一届代谢组学学会的国际会议(The First International Conference of the Metabolomics Society)。在取得成功的基础上,2006 年和 2007 年分别在美国和英国召开了第二届、第三届代谢组学学会的国际会议。这些会议的召开加速了代谢组学的发展。

国内在这一领域也紧跟国际前沿,中国科学院大连化学物理研究所在2001年学科规划时就将代谢组学列为中国科学院知识创新工程(二期)重要方向予以支持。自 2003年较全面地介绍代谢组学的综述发表后[14],又陆续有许多综述性的文章发表,内容涉及代谢组学的技术平台以及在医药、疾病、植物学等诸多

方面的应用[15~18]。2003 年9月,中国科学院生物局在上海召开了“植物、微生物的代谢组学、代谢工程”学术研讨会。2004年10月10~11日在上海威斯汀大饭店,中国科学院大连化学物理研究所和美国Waters公司合作举办的代谢组学高层研讨会及技术报告会隆重举行,英国伦敦帝国理工学院的Jeremy Nicholson教授受邀首次访问中国。此次研讨会的成功召开,进一步拉近了中国代谢组学与国际的距离,也标志着中国科学院大连化学物理研究所和美国Waters公司“代谢组学联合实验室”的正式运行。2004年11月,中国科学院启动了知识创新方向性项目“植物、微生物代谢组学的初步研究”。2004年12月18日,天津药物研究院与天津大学共同主办的“代谢物组学与药物研究高层研讨会”在天津大学化工学院举行,就“代谢物组学与重大疾病药物治疗相关基础和应用研究”进行了深入探讨。2005年4月5~6日,Waters公司首届制药技术论坛在上海虹桥宾馆召开, Jeremy Nicholson教授和许国旺研究员等做了关于代谢组学、新药发现和研究等方面的报告,探寻代谢组学脉动对制药业的深层影响及其对中草药开发方向的揭示[19]。在这期间,国内众多科研机构也纷纷加入代谢组学研究的行列。2005年,许国旺受Springer Link邀请,正式成为Metabolomics杂志编委。在“大连化学物理研究所科学论坛(DICP SYMPOSIUM)专项基金”资助下,中国科学院大连化学物理研究所分别在 2005年4月和2006年9月组织了“现代分离/分析化学和代谢组学”和“分析生物化学和中医药代谢组学”科学论坛,邀请了数十位来自英国、美国、德国、荷兰、日本、比利时、中国、中国香港、中国澳门等国家和地区的著名专家和学者参加。在国家有关部门和单位的配合下,2006年9月13~14日在中国科学院大连化学物理研究所召开了为期2天的主题为“医学代谢组学”的第284次香山科学会议,国内数家相关研究机构、大专院校和国外多个从事代谢组学研究的团体近50余位专家学者应邀出席。由中国工程院医药卫生学部等主办的2007年“环渤海医药发展前沿论坛”暨“代谢组学与中药研究”调研汇报会于2007年12月21~22日在天津举行,在刘昌孝、张伯礼和杨胜利三位院士的组织下,中药代谢组学研究的部分优势单位(中国科学院大连化学物理研究所、天津药物研究院、上海交通大学、中国药科大学、浙江大学、中国科学院武汉物理与数学研究所、天津中医药大学、沈阳药科大学等)的专家就代谢组学的技术平台、生物信息学、中药安

全性、中药资源和质量、中药方剂作用机制和中药作用物质基础等报告最新的研究进展。所有这些学术研讨会,一方面提供了与国内外一流科学家交流的机会,另一方面也使得我国的研究队伍不断扩大和加强。

代谢组学在各国的科研战略上得到了重视

美国Global Information Inc. 的市场调查报告显示,2002~2007年代谢组学技术工业的市场年增长率将达到46%[20]。2003年,美国国立卫生研究院(National Institutes of Health,NIH)在其中长期发展规划(NIH Roadmap)中[21],设立代谢组学专题,提出了要建立专门收集小分子信息并从事高通量筛选的研究中心,发展代谢组学技术平台,更快、更多地发现具有生物活性的小分子的构想。其下属的The National Institute of General Medical Sciences已在2003年批给加州大学3500万美元的一个5年计划做鼠巨噬细胞的类脂组学(lipidomics)研究。与此类似,日本政府也专门设立了“Construction of Basic Techniques for Lipidomics and Their Application”国家项目,建立类脂的

( metabolomics. 代谢途径数据库。2005年1月,加拿大启动7 “人类代谢组项目”

ca/),希望从组织和体液中识别、定量和分离出浓度大于1μmol/L 的所有代谢物。到2006年底,已定性出800个代谢产物。预期有1400个代谢产物可被定性、定量,其信息可放到公共数据库中,并可制备出单体保存到一80℃的冰箱中。至2008年1月5日,该项目已从数千种书籍、杂志文献和电子数据库中收集了2500个内源性代谢产物,建立了人类代谢组数据库(. ca/)[22]。库中每种代谢产物都有其相应的化学、临床、分子生物学和生化数据,据说是目前世界上最全的关于人类代谢物和人类代谢的数据库。

我国政府也十分重视代谢组学的研究,科技部早在2003年就将代谢组学平台技术的建立列入了国家“863”计划,并交给大连化学物理研究所所承担。在“十一五”期间,科技部先后在国家重大研究计划“蛋白质科学”、国家重点基础研究发展规划(“973”)、国家高技术研究发展计划(“863”计划)和“十一五”科技支撑项目、食品安全等方面支持了代谢组学的研究。国家自然科学基金委员会化学科学部连续多年将“组学分析中的新原理、新方法和新技术”列为重点项目支持方向。

代谢组学有着巨大的理论价值和应用前景,企业界对此也非常关注,西方国

家先后成立了多个关于代谢组学研究的研究中心或公司,如德国MAX-PLANCK-INSTITUT 的分子植物生理所、英国的Metabometrix Ltd、荷兰的Platform Plant Metabolomics(PPM)、美国的 The Metabolomics Group、加拿大的Phenomenome Discoveries Inc. 等。PFIZER等六个大制药公司与英国帝国理工学院的科学家们一起组织了一个为期3年的关于药物毒性研究的研究小组(COMET 1),拟在药物的发现(discovery)到开发(development)阶段用代谢组学的方法来评价药物的毒性(详见第13章)。在第一期取得成功的基础上,第二期项目(COMET 2)也于2006年3月正式启动,目标是研究标准毒物的分子机制,进而建立具预测性的构效关系专家系统。

以代谢组学为核心的系统生物学技术建立的BG MEDICINE公司(),非常重视代谢标志物对疾病的新诊断方法,在发现肺结核疾病的生物标志物方面处于领先地位。正在与M. D. Anderson Cancer Center合作以识别新的、专一性好的、敏感的用于监测乳腺癌患者治疗效果的血中蛋白质和小分子标志物。并从ACS Biomarker B. V获得授权来开发和商品化基于生物标志物的分子诊断测试方法以预兆充血性心力衰竭(congestive heart failure)。与 Multiple Sclerosis Research Center of New York (MSRCNY)合作以发现针对疾病和市场上现有药物疗效、安全性的新标志物。正在与FDA及7个制药公司合作以发现肝毒的生物标志物。

Metabolon 与美国传染病军队医学研究所(. Army Medical Research Institute of Infectious Diseases,USAMRIID)签署协议[23],军队将使用Metabolon 的代谢组学技术平台来研究接种AVA炭疽热疫苗(anthrax vaccine)的人的生化轮廓(biochemical profile)。 AVA 疫苗是 FDA 许可的唯一接种人的炭疽热疫苗。这也是第一个对接种疫苗的人的大规模代谢组学研究,这种生化轮廓将帮助USAMRIID较好地了解疫苗的安全性、有效性及其作用机制。

所有这些说明,代谢组学得到了学术界、政府和工业界的极大重视。

代谢组学与系统生物学

在几种常见的组学研究中,基因组学主要研究生物系统的基因结构组成,即DNA的序列及表达。蛋白质组学研究由生物系统表达的蛋白质及由外部刺激引起的差异。代谢组学是研究生物体系(细胞、组织或生物体)受外部刺激所产生的

所有代谢产物的变化,可以认为代谢组学是基因组学和蛋白质组学的延伸。随着这些组学研究的深入,科学家们逐渐认识到:基因组的变化不一定能够得到表达,从而并不对系统产生实质影响。某些蛋白质的浓度会由于外部条件的变化而升高,但由于这个蛋白质可能不具备活性,从而也不对系统产生影响。同时,由于基因或蛋白质的功能补偿作用,某个基因或蛋白质的缺失会由于其他基因或蛋白质的存在而得到补偿,最后反应的净结果为零。而小分子的产生和代谢才是这一系列事件的最终结果,它能够更准确地反映生物体系的状态[24]。因此,系统生物学的研究应涵盖基因组学、转录组学、蛋白质组学和代谢组学,任何单一组学的研究对生物问题的理解都是不全面的。

系统生物学是在细胞、组织、器官和生物体整体水平研究结构和功能各异的各种分子及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为的科学[25~28]。系统生物学从基因组序列开始,完成从生命密码到生命过程的研究。如果将生命体看成一个在基因调控下的无数的相互关联的生化反应所组成的一个新陈代谢网络,那么系统生物学将要鉴别每一个反应节点的各种分子及其相互作用,从局部到整体,最终完成整个生命活动的路线图。系统生物学的主要技术平台为基因组学、转录组学、蛋白质组学、代谢组学、相互作用组学和表型组学等,这些“组学”分别在DNA、mRNA、蛋白质和代谢产物水平检测和鉴别各种分子并研究其功能以及各种分子之间的相互关系。进而发现生化反应的途径和网络,构建生物学模块,并在研究模块相互作用的基础上绘制生物体的相互作用图谱。代谢组学与其他组学结合对阐明生命的奥秘具有重要意义。

代谢组学的研究方法

代谢组学研究一般包括样品采集和制备、代谢组数据的采集、数据预处理、多变量数据分析、标志物识别和途径分析等步骤(图1-5)[29]。生物样品可以是尿液、血液、组织、细胞和培养液等,采集后首先进行生物反应灭活、预处理,然后运用核磁共振、质谱或色谱等检测其中代谢物的种类、含量、状态及其变化,得到代谢轮廓或代谢指纹。而后使用多变量数据分析方法对获得的多维复杂数据进行降维和信息挖掘,识别出有显著变化的代谢标志物,并研究所涉及的代谢途径和变化规律,以阐述生物体对相应刺激的响应机制,达到分型和发现生物标志物的目的[29,30]。

根据研究的对象和目的不同,Oliver Fiehn将对生物体系的代谢产物分析分为四个层次[12]。

(1)代谢物耙标分析(metabolite target analysis):对某个或某几个特定组分的分析。在这个层次中,需要采取一定的预处理技术,除掉干扰物,以提高检测的灵敏度。

(2)代谢轮廓分析(metabolic profiling analysis):对少数所预设的一些代谢产物的定量分析。如某一类结构、性质相关的化合物(如氨基酸、顺二醇类)、某一代谢途径的所有中间产物或多条代谢途径的标志性组分。进行代谢轮廓分析时,可以充分利用这一类化合物的特有的理化性质,在样品的预处理和检测过程中,采用特定的技术来完成。

(3)代谢组学(metabonomics,metabolomics):限定条件下特定生物样品中所有内源性代谢组分的定性和定量。进行代谢组学研究时,样品的预处理和检测技术必须满足对所有的代谢组分具有高灵敏度、高选择性、高通量的要求,而且基体干扰要小。代谢组学涉及的数据量非常大,因此需要有能对其数据进行解析的化学计量学技术。

(4)代谢指纹分析(metabolic fingerprinting analysis):不具体鉴定单一组分,而是通过比较代谢物指纹图谱的差异对样品进行快速分类(如表型的快速鉴定)。

严格地说,只有第三层次才是真正意义上的代谢组学研究。目前,代谢组学的最终目标还是不可完成的任务,因为还没有发展出一种真正的代谢组学技术可以涵盖所有的代谢物而不管分子的大小和性质。但是,它和代谢轮廓(谱)分析有着显著的差别,在具体的实验中,代谢组学研究会设法解析所有的可见峰,因此代谢组学研究的特征也可以表述为它会设法分析尽可能多的代谢组分。

样品米集与制备

样品的采集与制备是代谢组学研究的初始步骤也是最重要的步骤之一,代谢组学研究要求严格的实验设计。首先需要采集足够数量的代表性样本,减少生物样品个体差异对分析结果的影响。实验设计中对样品收集的时间、部位、种类、样本群体等应给予充分考虑。在研究人类样本时,还需考虑饮食、性别、年龄、

昼夜和地域等诸多因素的影响。此外,在分析过程中要有严格的质量控制,需要考察如样本的重复性、分析精度、空白等。这方面的知识详见第2、14、15章。根据研究对象、目的和采用的分析技术不同,所需的样品提取和预处理方法各异。如采用NMR的技术平台,只需对样品做较少的预处理即可分析。对体液的分析,大多数情况下,只要用缓冲液或水控制pH和减少黏度即可。采用MS进行“全”成分分析时,样品处理方法相对简单,但不存在一种普适性的标准化方法,依据的还是“相似相洁原则”,脱蛋白后代谢产物通常用水或有机溶剂(如甲醇、己烷等)分别提取[31],获得水提取物和有机溶剂提取物,从而把非极性相和极性相分开,以便进行分析。对于代谢轮廓分析或靶标分析,还需要做较为复杂的预处理,如常用固相微萃取、固相萃取、亲和色谱等预处理方法。用气相色谱或气相色谱-质谱联用时,常常需要进行衍生化,以增加样品的挥发性。由于特定的提取条件往往仅适合某些类化合物,目前尚无一种能够适合所有代谢产物的提取方法。应该根据不同的化合物选择不同的提取方法,并对提取条件进行优化。具体方法可见第11、14、15章。

由于代谢组学一次分析很多样品,样品不可能一天采集完成,因此,样品保存问题也应注意,最好是保存在-80℃。COMET项目表明[6],尿样保存在-40℃冰箱中,至少9个月内没有发现变化。但在18个月后,发现TCA循环中的中间产物有轻微的变化。而血浆在-80℃下保存6个月,在NMR谱上没有发现明显的变化。

代谢组数据的采集

完成样本的采集和预处理后,样品中的代谢产物需通过合适的方法进行测定。代谢组学分析方法要求具有高灵敏度、高通量和无偏向性的特点,与原有的各种组学技术只分析特定类型的化合物不同,代谢组学所分析的对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数的差异很大。由于代谢产物和生物体系的复杂性,至今为止,尚无一个能满足上述所有要求的代谢组学分析技术,现有的分析技术都有各自的优势和适用范围[32~36]。最好采用联用技术和多个方法的综合分析。色谱[37]、质谱[32]、NMRM、毛细管电泳[39,40]、红外光谱[41,42]、电化学检测[43]等分离分析手段及其组合都出现在代谢组学的研究中。其中色谱-质谱联用方法兼备色谱的高分离度、高通量及质谱的普适性、高

灵敏度和特异性,NMR特别是1H-NMR以其对含氢代谢产物的普适性而成为最主要的分析工具。

NMR(见第6章):NMR是当前代谢组学研究中的主要技术,NMR的优势在于能够对样品实现无创性、无偏向的检测,具有良好的客观性和重现性,样品不需要繁琐处理,具有较高的通量和较低的单位样品检测成本。此外,1H-NMR对含氢化合物均有响应,能完成样品中大多数化合物的检测,满足代谢组学中的对尽可能多的化合物进行检测的目标。NMR虽然可对复杂样品如尿液、血液等进行非破坏性分析,与质谱法相比,它的缺点是检测灵敏度相对较低(采用现有成熟的超低温探头技术,其检测灵敏度在纳克级水平)、动态范围有限,很难同时测定生物体系中共存的浓度相差较大的代谢产物;同时,购置仪器所需的投资也较大。

为了提高NMR技术的灵敏度,研究者们采用了增加场强、使用低温探头和微探头的方法。针对分辨率的问题,使用了多维核磁共振技术和液相色谱-核磁共振联用(liquidchromatography-nuclearmagneticresonance,LC-NMR)。Daykin 等[44]在研究中采用色谱技术,利用LC-NMR联用对心血管疾病患者血中的脂蛋白代谢产物进行了检测。Nicholson研究小组[45,46]采用近年来新发展的魔角旋转(magic angle spinning,MAS)技术,让样品与磁场方向成°旋转,从而克服了由于偶极耦合(dipolar coupling)引起的线展宽、化学位移的各向异性。应

O 而不用MAS技术,研究者能够获得高质量的NMR谱图,样品中仅加入少量的D

2

必进行预处理,样品量只需约10mg。基于NMR技术的代谢组学方法已广泛地应用于药物毒性[47~49]、基因功能[50,51]以及疾病的临床诊断[9,51,52]。

质谱(见第2~5章):相对于NMR灵敏度低、检测动态范围窄等弱点,MS 具有较高的灵敏度和专属性,可以实现对多个化合物的同时快速分析与鉴定。随着质谱及其联用技术的发展,越来越多的研究者将色谱-质谱联用技术用于代谢组学的研究[32,53,54]。GC-MS方法的主要优点包括较高的分辨率和检测灵敏度,并且有可供参考、比较的标准谱图库,可以用于代谢产物定性。但是GC不能直接得到体系中难挥发的大多数代谢组分的信息,对于挥发性较低的代谢产物需要衍生化处理,预处理过程繁琐。GC-MS常用于植物和微生物代谢指纹分析[53~56],如Fiehn等[12]采用GC/MS研究拟南芥(Ar-abidopsis)的基因型及其表型的关系,Styczynski等[55]对大肠杆菌的代谢产物进行了详细的分析。LC-MS避免了GC-MS

中繁杂的样品前处理,由于其较高的灵敏度和较宽的动态范围,已被越来越多地用于代谢组学研究[57~59]。它非常适合于生物样本中复杂代谢产物的检测和潜在标志物的鉴定。LC-MS的代谢组学研究通常采用反相填料、梯度洗脱程序。但对于体液样品特别是尿样,含有大量的亲水性代谢产物,这些代谢产物在反相色谱上不保留或保留很弱。最近研究者们使用亲水反应色谱(hydrophilic interaction chromatography,HILIC)[60]:解决亲水性物质的弱保留问题。新的分析技术如超高效液相色谱/高分辨飞行时间质谱技术[61,62]、毛细管液相色谱-质谱联用技术[63]、傅里叶变换离子回旋共振技术[64,65]等也被用于代谢组学研究以提高代谢产物的检测灵敏度和通量。为解决通常液相色谱只能分离疏水性代谢物(反相色谱)或亲水性代谢物(亲水性色谱,HILIC)的问题,我们专门发展了一个柱切换二维液相系统[66~68],采用2根液相色谱柱(反相色谱柱和亲水作用色谱柱),通过阀切换实现了一次进样同时检测亲水和疏水代谢产物,解决了复杂生物样品中亲水性和疏水性代谢产物的同时检测问题。

数据分析平台

代谢组学得到的是大量、多维的信息。为了充分挖掘所获得数据中的潜在信息,对数据的分析需要应用一系列的化学计量学方法。在代谢组学研究中,大多数是从检测到的代谢产物信息中进行两类(如基因突变前后的响应)或多类(如不同表型间代谢产物)的判别分类[12,69],以及生物标志物的发现[59,70,71]。数据分析过程中应用的主要手段为模式识别技术,包括非监督(unsupervised)学习方法和有监督(supervised)学习方法(见第7章)。

非监督学习方法用于从原始谱图信息或预处理后的信息中对样本进行归类,并采用相应的可视化技术直观地表达出来,不需要有关样品分类的任何背景信息。该方法将得到的分类信息和这些样本的原始信息(如药物的作用位点或疾病的种类等)进行比较,建立代谢产物与这些原始信息的联系,筛选与原始信息相关的标志物,进而考察其中的代谢途径。用于这个目的的方法没有可供学习利用的训练样本,所以称为非监督(unsupervised)学习方法。主要有主成分分析(principalcomponents analysis,PCA)[59,72]、非线性映射[73]、簇类分析[74]等。有监督学习方法用于建立类别间的数学模型,使各类样品间达到最大的分离,并利用建立的多参数模型对未知的样本进行预测。在这类方法中,由于建立模型时

有可供学习利用的训练样本,所以称为有监督学习。这种方法经常需要建立用来确认样品归类(防止过拟合)的确认集(validation set)和用来测试模型性能的测试集(test set)。应用于该领域的主要是基于PCA、偏最小二乘法(partial least squares,PLS)、神经网络的改进方法,常用的有类模拟软独立建模[10,75]和偏最小二乘法-判别分析(PLS-discriminant analysis, PLS~DA)75,76]、正交(O)-PLS[77,78]。作为非线性的模式识别方法,人工神经元网络(neutral network,ANN)技术[79]也得到广泛应用。PCA和PLS-DA是代谢组学研究中最常用的模式识别方法。这两种方法通常以得分图(score plot)获得对样品分类的信息,载荷图(loading plot)获得对分类有贡献变量及其贡献大小,从而用于发现可作为生物标志物的变量。此外,在数据处理和分析的各阶段,对数据的质量控制和模型的有效性验证也需引起足够的重视[80~82]。

应该强调,由上述分析仪器导出的元数据(metadata),不能直接用于模式识别分析[83],还需对数据进行预处理,将元数据转变为适合于多变量分析(主要是模式识别)的数据形式,使相同的代谢产物在生成的数据矩阵中由同一个变量表示,所有的样品具有相同的变量数。最后用于模式识别的数据为二维矩阵数据形式,行代表样品或实验数目,列表示相应的单个测定指标(通常为代谢物的信号强度等)。仪器的微小波动及样品pH和基体的变化会引起NMR中化学位移的改变,色谱-质谱方法中流动相组成、柱温的微小变化、梯度的重现性及其柱表面的状态变化常导致保留时间的差异。在模式识别前,需对谱图实行峰匹配(或称峰对齐),使各样本的数据得到正确的比较。主要的数据预处理包括滤噪、重叠峰解析(deconvolution)、峰对齐、峰匹配、标准化和归一化等。在实际操作中,并不是这些步骤都需要进行,而是根据实际情况,只做其中几种预处理(表1-1)。相比之下,HPLC的保留时间重复性比GC要差一些,峰匹配要相对困难。我们发展的“多区域可变保留值窗口”的峰对齐算法[90],不仅可用于HPLC,也可用于GC代谢组学的峰匹配[99]。关于这方面的详情,有兴趣的读者可参看第2~5章的内容,也可查看表1-1中的文献。

代谢组学数据库

代谢组学分析离不开各种代谢途径和生物化学数据库。与基因组学和蛋白质

组学已有较完善的数据库供搜索、使用相比,目前代谢组学研究尚未有类似的功能完备的数据库[100]。一些生化数据库[101~105]可供未知代谢物的结构鉴定或用于已知代谢物的生物功能解释,如连接图数据库(Connections Map DB)、京都基因与基因组百科全书(KEGG)、METLIN、HumanCyc、EcoCycmetacyc、BRENDA^LIGAND、Meta-Cyc、UMBBD、WIT2、EMP项目,IRIS、AraCyc、PathDB、生物化学途径(Ex-PASy)、互联网主要代谢途径(main metabolic pathways on Internet,MMP)、Duke 博士植物化学和民族植物学数据库、Arizona大学天然产物数据库等,其中IRIS、Ara-Cyc分别为水稻和拟南芥的有关数据库。表1-2给出了其中的一些网址,可供读者参考。

理想的代谢组学数据库应包括各种生物体的代谢组信息以及代谢物的定量数据,如人类代谢组数据库()[22]中的那样。但实际上,这方面的信息非常缺乏。一些公共数据库对各种生物样本中代谢物的结构鉴定也非常有用,如Pubmed化合物库、ChemSpider数据库等(表1-2),后者包含有1650万个化合物的结构信息,可供网上检索。

代谢组学的应用

代谢组学自从出现以来,引起了各国科学家的极大兴趣,广泛地应用于各个领域[6],如疾病诊断、药物开发、植物代谢组学、营养科学[106,107]和微生物代谢组学等方面的研究中。详细的情况请见后面各章,这里只做简单归纳。

药物研发

药物研发领域,尤其是西方的药物研发主要沿用靶向研发策略,“致使90%的药物仅对30%~50%的患者有效”,即50%~70%的患者不但未从所接受的药物治疗中受益,反而要承担其所带来的副作用。鉴定出有效的具有生理和临床意义的标志物作为廉价、快捷的筛选对特定人群有效或有毒药物的方法,已成为大家的共识。事实上,由于药物开发成本的提高,新药发现-开发环节中的消耗变成了制药工业所面临的巨大挑战之一。任何能快速、经济、有效地预测药物对特定人群的潜在毒性的工具,毫无疑问地都会被重点关注。

代谢组学在疾病动物模型(包括转基因动物)的确证、药物筛选、药效及毒性评价、作用机制和临床评价等方面有着广泛的应用[101~104](详见第13章)。Nicholson研究小组[104,105,108,109]利用基于NMR的代谢组学技术,在药物毒性评价方

面开展了深人的工作。他们的研究表明采用代谢组学方法可判断毒性影响的组织器官及其位点,推测药物相关作用机制,确定与毒性相关的潜在生物标志物;并在此基础上可建立供毒性预测的专家系统以及毒物影响动物内源性代谢物随时间的变化轨迹。在COMET研究项目中,对147种典型药物的肝肾毒性进行了研究。通过检测正常和受毒大鼠和小鼠的体液、组织中代谢物的NMR谱,结合已知毒性物质的病理效应建立了第1个大鼠肝脏和肾脏毒性的专家系统。该专家系统分为3个独立的级别可实现正常/异常的判别、对未知标本进行毒性或疾病的识别以及病理学的生物标志物识别。目前COMET计划的目标是研究标准有毒药物的分子机制,进而建立可预测性的构效关系[110,111]。最近Mally等EM对1H-NMR代谢组学方法用于肾功能损伤标志物的可行性进行了研究。他们采用FeNTA或溴化钾引起的两种肾功能损伤小鼠模型,研究了4-羟基-2(E)-壬醛基-巯基尿酸作为肾功能损伤标志物的可行性。结果表明1H-NMR代谢组学方法可以用来指示肾功能损伤,但对氧化应激无特异性;HNE-MA和其他的磷脂过氧化标志物有很好的相关性,标志物的类型与病理条件有关,尚未发现普适性的氧化应激标志物。

1. 3. 2疾病研究

由于机体的病理变化,代谢产物也产生了某种相应的变化。对这些由疾病引起的代谢产物的响应进行分析,即代谢组学分析,能够帮助人们更好地理解病变过程及机体内物质的代谢途径,还有助于疾病的生物标志物的发现和辅助临床诊断的目的。如Brin-die等应用1H-NMR技术以36例严重心血管疾病患者和30例心血管动脉硬化患者的血清和血浆为研究对象进行了代谢组学分析,结合PCA、SIMCA、PL^DA、OSC-PLS等模式识别技术实现了对心血管疾病及其严重程度的判别,得到了高于90%的灵敏度及专一性[9]。

代谢组学在疾病研究中的应用主要包括病变标志物的发现、疾病的诊断、治疗和预后的判断[113,114](详见第9~11章)。最广泛的应用是发现与疾病诊断、治疗相关的代谢标志物(群),通过代谢物谱分析得到的相关标志物是疾病的分型、诊断、治疗的基础。目前已有较多文献报道代谢组学在疾病研究的应用,如新生儿代谢紊乱[115,116]、冠心病[117]、膀胱炎[118]、高血压[119]和精神系统疾病[120]等。

作者课题组将所建立的代谢组学方法应用于重大疾病(如肿瘤、2型糖尿病、重

型肝炎等)的病变标志物研究中,建立了基于正相液相色谱/电喷雾线性离子阱质谱方法,用于体液中磷脂的代谢轮廓谱分析[121,122]。将该方法用于2型糖尿病和健康人进行分类研究,识别出4种可能的磷脂分子生物标志物研究了n-3型多烯脂肪酸二十碳五烯酸(EPA)和二十二碳六烯酸(DHA)对人类JurkatE-6-lT 细胞中膜脂筏和可溶膜区域中几种主要磷脂组成的影响。结果表明,EPA或DHA 能够使脂酰链为n-3多不饱和脂肪酸(PUFA)的磷脂含量显著增加,揭示了PUFA 免疫抑制作用的分子机制[123~124]。作者课题组还建立了基于固相萃取(SPE)-HPLC 的体液中核苷代谢轮廓分析方法[125~127],并将该方法应用于肿瘤的研究中,建立了正常人和癌症患者尿中核苷的排放水平和模式;比较了不同癌种之间排放水平的差异,检测癌症的敏感性均显著高于目前已临床应用的肿瘤标志物。同时在区分良恶性肿瘤、监测手术和化疗效果以及预测肿瘤复发等方面都有较好的价值[127](详见第10章)。同时将基于液相色谱质谱联用(LC-MS)方法的代谢组学平台应用于肝病的研究中,实现了不同肝病患者与正常人进行有效区分,肝癌诊断中肝炎和肝硬化患者的假阳性率仅为%[37]应用于慢性乙型肝炎的急性发作样本,诊断正确率为100%;并鉴定出1个传统标志物和4个新的标志物[58]。

植物代谢组学

植物代谢组学[128]的很多研究集中在细胞代谢组学这个相对独立的分支。主要是通过研究植物细胞中的代谢组在基因变异或环境因素变化后的相应变化,去研究基因型和表型的关系及揭示一些沉默基因的功能,进一步了解植物的代谢途径[129,130](详见第14章)。植物代谢组学研究大多集中在代谢轮廓或代谢物指纹图谱(metabolite fingerprinting)上。根据对象的不同,植物代谢组学的研究主要包括:①某些特定种类(specie)植物的代谢物组学研究。这类研究通常以某一植物为对象,选择某个器官或组织,对其中的代谢物进行定性和定量分析。

②不同基因型(genotype)植物的代谢组学表型研究。一般需要两个或两个以上的同种植物(包括正常对照和基因修饰植物),然后应用代谢组学对所研究的不同基因型的植物进行比较和鉴别[131,132]。③某些生态型(ecotype)植物的代谢组学。这类研究通常选择不同生态环境下的同种植物,研究生长环境对植物代谢物产生的影响。④受外界刺激后的植物自身免疫应答。

植物代谢组学研究最具代表性的是Fiehri等[133~135]的工作,他们利用GC/MS

技术通过对不同表型萌芦韧皮部(cucurbita maxima phloem)的433种代谢产物进行代谢组学分析,结合化学计量学方法(PCA、ANN和HCA)对这些植物的表型进行了分类,找到了4种在分类中起着相当重要的代谢物质:苹果酸(malicacid)和柠檬酸、葡萄糖和果糖。与线粒体和叶绿体中的基因型结果一致。

随着植物细胞代谢组学的迅速发展,人们已经开始利用这一技术的成果。Meta-nomics公司的成立就是一个典型的代表,他们的目标是寻找植物代谢过程中的关键基因,如能够让植物耐寒的基因。其思想就是遵循代谢组学的方法,在改变植物的基因后,进行植物的代谢分析或记录代谢产物,从而更迅速地掌握有关植物代谢途径的信息。

目前所发现的次生代谢产物大约有80%来自植物。植物次生代谢产物包含很多功能组分,可用作药物(如青蒿素、紫杉醇、三萜皂苷等)、杀虫剂、染料、香精香料等。尽管植物能合成数十万种低分子质量的有机化合物(次生代谢产物),很多具有利用价值,但植物细胞的巨大合成能力并没有被很好地利用,更重要的是重要次生代谢产物的含量很低,如我国科学家首先自青蒿中分离得到的对脑疟等恶性疟疾有突出疗效的青蒿素,在青蒿中的含量低于1%,与人们的期望相差甚远。到目前为止,植物的次生代谢网络没有被很好地表征,与生物合成相关的功能基因组图还远未完成。而这些对突破植物或植物细胞培养低产率的瓶颈十分重要。为此,我们与中国科学院北京植物研究所合作,开展了青蒿中萜类物质的代谢途径的研究。建立了基于全二维气相色谱-飞行时间质谱联用技术(GC×GC-TOFMS)的青蒿挥发油分离分析方法,对青蒿中挥发油的成分进行分析,结果表明挥发油主要由烷烃、单萜、单萜含氧衍生物、倍半萜、倍半萜含氧衍生物5部分组成[136]。用全二维气相色谱与飞行时间质谱联用技术可从青蒿挥发油中鉴定出300多个化合物,并鉴定出了青蒿素代谢途径中的重要中间产物。采用GC×GC-TOFMS方法对转不同基因青蒿样品进行分析与定性,初步鉴定了将近100种萜类物质并找出普通植株与转基因植株在代谢产物上的差异。利用气相色谱火焰离子化检测器(GC-FID)和GC/MS方法为主要手段,对不同生长阶段的青蒿代谢指纹谱进行了研究[137],青蒿的5个生长时期(幼苗期、成苗期、现蕾前期、现蕾期和盛花期)可以得到很好的区分,并证实了青蒿素产生途径中瓶颈的存在。

微生物代谢组学

第一篇微生物代谢组学文献报道了基于GC-MS技术,通过分析脂肪酸、氨基酸和糖类并结合化学计量学方法监测肠系膜明串珠菌发酵生产葡聚糖过程中的微生物污染[138]。目前,代谢组学技术已应用于微生物表型分类[139]、突变体筛选[140]、代谢途径及微生物代谢工程[141,142]、发酵工艺的监控和优化[143,144]及微生物降解环境污染物[145,146]等方面[147](详见第15章)。

Buchholz等将快速取样技术和其他分析技术结合,实现了细胞内大量代谢物的快速、高频率定量,使之能够用于发酵过程的动态检测。该技术将帮助研究各种因素对发酵的影响,从而提高生物工程的产量。Dalliige等采用液相色谱与串联质谱联用对发酵过程中的氨基酸实现了监测,通过分析认为其中的一个子集可反映发酵的状态。Grivet等[148]对NMR这一技术用于微生物代谢组学研究做了较为详尽的综述;Ishii等[149]对微生物细胞中的计算机模拟做了很详细的综述,这里就不再赘述了。我们在研究不同基因修饰下胞内和胞外代谢物的变化规律与特点,比较不同底物、不同菌株胞内代谢物指纹谱的差异的基础上,考察了环境对微生物代谢的影响[150],得到不同条件下嗜碱乳酸菌胞内氨基酸变化与发酵液中乳酸产量的关系。研究铜绿假单胞菌和大肠埃希菌在不同抗生素作用下三羧酸(tricarboxylicacid, TCA)循环和糖酵解途径中主要有机酸类代谢产物代谢池的变化,发现在铜绿假单胞菌中喹诺酮类抗生素对TCA代谢物的影响与β-内酰胺类表现为负相关,这种相关性在抗菌活性上反映为具有正协同作用。对野生株、Δack和Δsdh基因修饰株大肠杆菌产琥珀酸情况进行分析发现,以葡萄糖和果糖为碳源时,Δack株的生物量明显低于其他两株,而且同样条件下,果糖为唯一碳源的情况下,生物量高于葡萄糖为碳源的情况。通过对胞内代谢通量的分析发现,Δack株的代谢通量改变较为显著。

代谢组学与中医药现代化

中医药学是我国医学科学的特色,也是中华民族优秀传统文化的重要组成部分。由于受我国科学技术整体水平的限制,中药研究水平较低、中药产业科技含量差、作用的物质基础研究有限、作用机制缺乏科学研究、药材资源数量和质量的制约因素多、认识中药毒性和不良反应还存在误区。这些因素严重地影响了中药在世界范围内的广泛使用和国际地位。正是基于此,国家提出了使用现代科学

技术来研究中药中的药物作用的物质学基础、中药的质量控制、中药的毒性研究等,即中药现代化的研究。

代谢组学的核心是研究外源性物质对生物体所产生的整体性效应。用它研究药物对机体所形成的内源性代谢组的系统作用时,其研究方法与中医治疗疾病的整体观念相一致[151],从此意义来看,立题运用代谢组学研究中药,对认识中药的药效作用的物质基础、产生毒副作用的物质基础,认识正确用药剂量和疗程、防止毒性反应都非常有意义,也是系统生物学时代给我们提供的一个机遇。因此,刘昌孝、王永炎、张伯礼、石学敏、陈凯先、胡之璧、杨胜利、肖培根、李连达、许国旺、王广基建议国家重大专项研究计划项目设立“基于代谢组学的中药现代研究”的专项[152,153]。在2005年纪念《传统药物学杂志》创刊25年出版100卷时出版的专集文章中明确认为,传统药物与系统生物学的整体观是完美的匹配,肯定地认为代谢组学技术是系统生物学研究的关键技术。用代谢组学研究中药,可对中药方剂配伍的科学性、中药种质资源、中药作用机制[155]、中药的临床前安全性和毒性[156]及中医疾病诊断的科学性进行研究。这方面已有很好的综述[157~159],这里不再展开。有兴趣的读者可参看本书第13章的内容。应该注意的一点是,中药代谢与肠道菌群密切相关[160,161]。由于大部分中药都是口服给药,肠道细菌的基因组会首先受到这些药的“攻击”。所以,要了解肠道细菌的基因组对中药汤剂的毒性和有效性是如何反应、调节的。这些机制的阐明,有可能会开发出一种突破性的治疗方法——通过调节人体的细菌就可以治疗疾病。

代谢组学发展展望

从总体来看,代谢组学仍然处于发展阶段,在方法学和应用两方面均面临着极大的挑战,需要其他学科的配合和交叉。

在技术平台和方法学研究方面,生物样本的复杂性使得代谢组学研究对分析技术的灵敏度、分辨率、动态范围和通量提出了更高的要求。代谢组学研究的深入得益于分析技术的不断发展,如高分辨质谱、超高效液相色谱/质谱、毛细管液相色谱/质谱、多维色谱质谱联用技术和多维核磁共振技术等的使用。生物标志物的结构鉴定也是目前代谢组学研究的重点和难点问题之一,由于缺乏标准的可通用的质谱数据库,基于LC-MS技术在代谢组学研究中的应用在一定程度上受到了制约。理论上讲,LC-MS~NMR可提供较好的关于组分结构的信息[162],但仪器

代谢组学的研究方法和研究流程

代谢组学的研究方法和研究流程分子微生物学112300003林兵 随着人类基因组计划等重大科学项目的实施,基因组学、转录组学及蛋白质组学在研究人类生命科学的过程中发挥了重要的作用,与此同时, 代谢组学(metabolomics)在20世纪90年代中期产生并迅速地发展起来,与基因组学、转录组学、蛋白质组学共同组成系统生物学。基因组学、转录组学、蛋白质组学和代谢组学等各种组学0在生命科学领域中发挥了重要的作用,它们分别从调控生命过程的不同层面进行研究, 使人们能够从分子水平研究生命现象, 探讨生命的本质, 逐步系统地认识生命发展的规律.这些组学手段加上生物信息学, 成为系统生物学的重要组成部分。 代谢组学的出现和发展是必要的, 同时也是必须的。对于基因组学和蛋白质组学在生命科学研究中的缺点和不足, 代谢组学正好可以进行弥补。代谢组学研究的是生命个体对外源性物质(药物或毒物)的刺激、环境变化或遗传修饰所做出的所有代谢应答, 并且检测这种应答的全貌及其动态变化。代谢组学方法为生命科学的发展提供了有力的现代化实验技术手段, 同时也为新药临床前安全性评价与实践提供了新的技术支持与保障. 1 代谢组学的概念及发展 代谢组学最初是由英国帝国理工大学Jeremy N icholson教授提出的,他认为代谢组学是将人体作为一个完整的系统,机体的生理病理过程作为一个动态的系统来研究, 并且将代谢组学定义为生物体对病理生理或基因修饰等刺激产生的代谢物质动态应答的定量测定。2000年,德国马普所的Fiehn等提出了代谢组学的概念,但是与N ichols on提出的代谢组学不同, 他是将代谢组学定位为一个静态的过程,也可以称为/代谢物组学, 即对限定条件下的特定生物样品中所有代谢产物的定性定量分析。同时Fiehn还将代谢组学按照研究目的的不同分为4类: 代谢物靶标分析,代谢轮廓(谱)分析, 代谢组学,代谢指纹分析。现在代谢组学在国内外的研究都在迅速地发展, 科学家们对代谢组学这一概念也进行了完善, 作出了科学的定义: 代谢组学是对一个生物系统的细胞在给定时间和条件下所有小分子代谢物质的定性定量分析,从而定量描述生物内源性代谢物质的整体及其对内因和外因变化应答规律的科学。 与基因组学、转录组学、蛋白质组学相同, 代谢组学的主要研究思想是全局观点。与传统的代谢研究相比, 代谢组学融合了物理学、生物学及分析化学等多学科知识, 利用现代化的先进的仪器联用分析技术对机体在特定的条件下整个代谢产物谱的变化进行检测,并通过特殊的多元统计分析方法研究整体的生物学功能状况。由于代谢组学的研究对象是人体或动物体的所有代谢产物, 而这些代谢产物的产生都是由机体的内源性物质发生反应生成的,因此,代谢产物的变化也就揭示了内源性物质或是基因水平的变化,这使研究对象从微观的基因变为宏观的代谢物,宏观代谢表型的研究使得科学研究的对象范围缩小而且更加直观,易于理解, 这点也是代谢组学研究的优势之一. 代谢组学的优势主要包括:对机体损伤小,所得到的信息量大,相对于基因组学和蛋白质组学检测更加容易。由于代谢组学发展的时间较短, 并且由于代谢组学的分析对象是无偏向性的样品中所有的小分子物质,因此对分析手段的要求比较高, 在数据处理和模式识别上也不成熟,存在一些不足之处。同时生物体代谢物组变化快, 稳定性较难控制,当机体的生理和药理效应超敏时,受试物即使没有相关毒性,也可能引起明显的代谢变化,导致假阳性结果。 代谢组学应用领域大致可以分为以下7个方面:

代谢组学技术及在毒理学研究中的应用

代谢组学技术及在毒理学研究中的应用 摘要:代谢组学是定性和定量分析某一生物或细胞所有低分子量代谢产物,从而监测机体或活细胞中化学变化的一门科学,是系统生物学的重要组成部分。作为系统生物学重要组成部分的“代谢组学”,通过考察机体受毒物刺激后体液或组织中代谢物的整体动态变化轨迹,结合模式识别的多元分析方法,快速筛选毒性相关的分子标志物,进而更系统、更全面的揭示毒物作用于机体的典型特征,为相关毒性作用模型建立、环境或药物中毒性化学物的快速高通量筛选以及相关疾病的预防与治疗提供重要的科学依据。本文将从代谢组学的概况、代谢组学在毒理学中的应用进行综述。 关键词:代谢组学;毒理学;应用 “代谢组学”(metabonomics)是指对机体因环境因素刺激、病理生理扰动或遗传修饰等引起的多种代谢指标动态变化的系统性定量检测新方法,该技术广泛用于植物学、药理学、毒理学、遗传学等学科领域。“代谢组学”最早是在1999年由英国的Jeremy Nicholson提出的,是在利用核磁共振技术检测生物体液组成成分的基础上结合模式识别的分析方法发展而来,主要是通过考察生物体系受环境刺激或病理生理扰动后的代谢产物动态变化,分析代谢产物整体的变化轨迹,以此阐述某种病理(生理)过程中所发生的一系列生物学事件及机制。 毒理学是研究毒物与机体交互作用的一门学科,一方面探讨毒物对机体各种组织细胞、分子、特别是生物大分子作用及损害的机制,阐明毒物分子结构与其毒作用之间的关系;另一方面,也研究毒物的体内过程(吸收、分布、代谢转化、排泄)及机体防御体系对毒物作用的影响。“代谢组学”一经提出,其崭新的研究思路和无损伤的整体研究方法在包括药物开发、毒性评价及预测、营养和食物安全性评价等在内的众多领域得到日益广泛的重视和应用。 1. 代谢组学的概况 1.1代谢组学的定义及发展[1] 代谢组学是以组群指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系统整合为目标的系统生物学的一个分支,是继基因组学、转录组学、

代谢组学方法与应用许国旺张强

第1章绪论 随着人类基因组测序工作的完成,基因功能的研究逐渐成为热点,随之出现了一系列的“组学”研究,包括研究转录过程的转录组学(transcriptomics)、研究某个生物体系中所有蛋白质及其功能的蛋白质组学(proteomics)及研究代谢产物的变化及代谢途径的代谢组学(metabolomics或metabonomics)(图1-1)。 代谢组学是众多组学中的一种,是随着生命科学的发展而发展起来的。与其他组学不同,代谢组学是通过考察生物体系(细胞、组织或生物体)受刺激或扰动后(如将某个特定的基因变异或环境变化后),其代谢产物的变化或其随时间的变化,来研究生物体系的一门科学[1]。所谓代谢组(metabolome)是基因组的下游产物也是最终产物,是一些参与生物体新陈代谢、维持生物体正常功能和生长发育的小分子化合物的集合,主要是相对分子质量小于1000的内源性小分子。代谢组中代谢物的数量因生物物种不同而差异较大,据估计,植物王国中代谢物的数量在200000种以上,单个植物的代谢物数量在5000~25000,甚至简单的拟南芥(Arabidopsisthaliana)也产生约5000种代谢产物,远远多于微生物中的代谢产物(约1500种)和动物中的代谢产物(约2500种)[2]。实际上,在人体和动物中,由于还有共存的微生物代谢、食物及其代谢物本身的再降解,到目前为止,还不能估计出到底有多少种代谢产物,浓度分布范围有7~9个数量级。因此对代谢组学的研究,无论从分析平台、数据处理及其生物解释等方面均面临诸多挑战。本章对代谢组学发展的历史、国内外现状、研究方法、典型应用领域及研究热点等给予了介绍。 1.1代谢组学简介 生命科学是研究生命现象、生命活动的本质、特征和发生、发展规律,以及各种生物之间和生物与环境之间相互关系的科学。自从1953年Watson和Crick建立了DNA 双螺旋结构模型后,生命科学研究的面貌便焕然一新。在此基础上发展的分子生物学使得生命的基本问题,如遗传、发育、疾病和进化等,都能从分子机制上得到诠释。生物学研究进入了对生命现象进行定量描述的阶段。分子生物学的飞速发展极大地推动了人们从分子组成水平对生物系统进行深人的了解。基因组计划向人们展示了包括大肠杆菌、酵母、线虫、果蝇、小鼠等模式生物以及人类的所有遗传信息的组成,生命的奥秘就存在于这些序列中。技术上的突破使得基因组数据的获得已经不再是生命

代谢组学的研究现状及其在方剂量效关系中的应用

代谢组学的研究现状及其在方剂量效关系中的应用 邓海山,段金廒*,尚尔鑫,唐于平 (南京中医药大学江苏省方剂研究重点实验室,江苏南京210046) 摘要:代谢组学能够准确、灵敏地反映生物体系的整体功能状态,同时克服了传统中医依赖医生个人经验进行诊疗的不确定性。方剂剂量的变化对其疗效乃至功用的改变都将在代谢组图谱的不同变化趋势中得到体现,从而能够对方剂的量效关系及其物质基础给出全新的解释,获得深入系统的认识。本文综述了代谢组学在中医药现代研究中的应用进展,并针对目前方剂量效关系研究中,方剂的疗效评价只能定性不能定量,导致量效关系不明的困境,提出以代谢组学技术作为方剂的整体疗效评价方法,通过追踪代谢组在病理发展过程中以及药物干预下的变化,开展方剂量效关系研究的新思路。 关键词:代谢组学;量效关系;整体疗效评价;代谢网络;中药 中图分类号:R285文献标识码:A文章编号:167420440(2009)0320198206 R esearch advances of m etabono m ics and app lica ti on i n the study of dose2effect r el a ti onsh ip of prescr i p tion s DENG H ai2shan,D UAN Jin2ao,S HANG Er2xi n,TANG Yu2ping (J i a ngs u K e y La bora tory for TCM F ormula e Research,Na nji ng Universit y o f Chinese M e d ici ne,Na nji ng210046,Ch i na) Abstr act:M etabono m es reflects t h e syste matic status of the organis m accurate l y,sensiti v ely and i m per2 sona ll y.To eva l u ate the therapeu tic eff ects bymeans ofmetabono m icsw ill overco m e the deficiency of un2 certa i n ty w ith the trad iti o na ld iagnostic methods i n cluding inspection,auscultation and olfaction,i n qu iry, and palpati o n.The i m pact of the variation of prescripti o ns dosage on effic i e ncy w ill be shown clearly through the change tendencies of metabono me spectra.Consequently,a ne w i n si g ht is obta i n ed f or the dose2eff ect re lati o nship and its materia l basis.The a mbiguous dose2eff ect relati o nship of trand itional Chi2 nese med icine(TC M)prescr i p tions has l o ng been controversia.l It is one of the most i m portant reasons that the therapeutic eff ect of th is kind ofm edic i n es cannot be evaluated quantitative ly.Based on the re2 vie w of t h e applicati o n of metabono m ics i n moder n st u dy of TC M,we suggest to carry out the st u dy on dose2eff ect re lationsh i p of prescri p ti o ns,in wh ich the techn i q ues ofmetabono m ics are e mp l o yed to co m2 prehensi v e l y evaluate the t h erapeutic eff ect of prescriptions,and the variation of metabono m es in the course of disease devecop m ent and treat m ent is traced. K ey words:metabono m ics;dose2eff ect relationsh i p;co mprehensive eval u ation of therapeuti c e f fec;t metabolic net w or k;trad ition Chinese med icine 收稿日期:2009202225 基金项目:江苏省自然科学重大基础研究资助项目(No.06KJ A36022,07K J A36024);江苏省方剂研究重点实验室/青年学者培养计划0资助项目(No.LTC MF20071203) 作者简介:邓海山,男,博士,讲师,研究方向:中药现代仪器分析与中药信息学,Te:l025*********,E2m a i:l hs_deng@n j u tc https://www.doczj.com/doc/181839044.html, *通讯作者:段金廒,男,教授,博士生导师,Te:l025*********,E2m ai:l d ja@n j utc https://www.doczj.com/doc/181839044.html,

代谢组学的数据分析技术

代谢组学的数据分析技术 摘要:代谢组学是效仿基因组学和蛋白质组学的研究思想,对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式,是系统生物学的组成部分。其研究对象大都是相对分子质量1000以内的小分子物质。先进分析检测技术结合模式识别和专家系统等计算分析方法是代谢组学研究的基本方法。文章主要综述了将代谢组学中的图谱、数据信息转换为相应的参数所采用的分析方法。 关键词:代谢组学;数据分析方法 代谢组学是以代谢物分析的整体方法来研究功能蛋白如何产生能量和处理体内物质,评价细胞和体液内源性和外源性代谢物浓度及功能关系的新兴学科,是系统生物学的重要组成部分,其相应的研究能反映基因组、转录组和蛋白组受内外环境影响后相互协调作用的最终结果,更接近反映细胞或生物的表型,因此被越来越广泛地应用。而代谢组学的数据分析包括预处理和统计分析方法,多元统计分析方法主要分为两大类:非监督和监督方法,非监督方法包括主成分分析PCA;聚类分析CA等;监督方法包括显著性分析、偏最小二乘法等,本文就是主要综述代谢组学图谱信息转化为参数信息所采用的数据分析方法。 1预处理 数据的预处理过程包括以下:谱图的处理;生成原始的数据矩阵;数据的归一化以及标准化处理过程。针对实验性质、条件以及样品等因素采用不同的预处理方法。在实际应用过程中,预处理可以通过实验系统自带的软件如XCMS软件。进行,因此一般较容易获得所需的数据形式。 2数据分析方法 2.1 主成分分析PCA是多元统计中最常用的一种方法,它是在最大程度上提取原始信息的同时对数据进行降维处理的过程,其目的是将分散的信息集中到几个综合指标即主成分上,有助于简化分析和多维数据的可视化,进而通过主成分来描述机体代谢变化的情况。PCA 的具体过程是通过一种空间转换,形成新的样本集,按照贡献率的大小进行排序,贡献率最大的称为第一主成分,依次类推。经验指出,当累计贡献率大于85%时所提取的主成分就能代表原始数据的绝大多数信息,可停止提取主成分。在代谢组数据处理中,PCA是最早且广泛使用的多变量模式识别方法之一。,具有不损失样品基本信息、对原始数据进行降维处理的同时避免原始数据的共线性问题等优点,但在实际应用过程中,PCA存在着自身的缺点[1]:离群样本点的存在严重影响其生物标志物的寻找;非保守性的代谢组分扰乱正确的分类以及尺度的差异影响小浓度组分的表现等,其他的问题之前也有讨论[2]。针对PCA 的缺陷采用了不同的改进措施,与此同时,为了简化计算,侯咏佳等[3]。提出了一种主成分分析算法的FPGA实现方案,通过Givens算法和CORD IC算法的矢量旋转,用简单的移位和加法操作来实现协方差矩阵的特征分析,只需计算上三角元素,因此计算复杂度小、迭代收敛速度快。 2.2 聚类分析CA是用多元统计技术进行分类的一种方法。其主要原理是:利用同类样本应彼此相似,相类似的样本在多维空间里的彼此距离应较小,而不同类的样本在多维空间里的

代谢组学在医药领域的应用与进展

代谢组学在医药领域的应用与进展 一、学习指导 1.学习代谢组学的概念及内涵,掌握代谢组学的研究对象与分析方法。 2.熟悉代谢组学数据分析技术手段 3.了解代谢组学优势特点 4.了解代谢组学在医药领域的应用 5.了解代谢组学发展趋势 二、正文 基因组功能解析是后基因组时代生命科学研究的热点之一,由于基因功能的复杂性和生物系统的完整性,必然要从“整体”层面上来理解构成生物体系的各个模块功能。随着新的测量技术、高通量的分析方法、先进的信息科学和系统科学新理论的发展,加上生物学研究的深入和生物信息的大量积累,使得在系统水平上研究由分子生物学发现的组件所构成的生命体系成为可能[1]。系统生物学家们认为,将生命科学上升为“综合”科学的时机已经成熟,生命科学再次回到整合性研究的新高度,逐步由分子生物学时代进入到系统生物学时代[2]。系统生物学不同以往的实验生物学仅关注个别基因和蛋白质,它要研究所有基因、蛋白质,代谢物等组分间的所有相互关系,通过整合各组成成分的信息,以数学方法建立模型描述系统结构[3,4]。 (一)代谢组学的概念及内涵 代谢组学是继基因组学、转录组学和蛋白质组学之后,系统生物学的重要组成部分,也是目前组学领域研究的热点之一。代谢组学术语在国际上有两个英文名,即metabolomics 和metabonomics。Metabolomics是由德国的植物学家Fiehn等通过对植物代谢物研究提出来的,认为代谢组学(metabolomics)是定性和定量分析单个细胞或单一类型细胞的代谢调控和代谢流中所有低分子量代谢产物,从而监测机体或活细胞中化学变化的一门科学[5]。英国Nicholson研究小组从毒理学角度分析大鼠尿液成份时提出了代谢组学(Metabonomics)的概念,认为代谢组学是通过考察生物体系受扰动或刺激后(如某个特定基因变异或环境变化后),其代谢产物的变化或代谢产物随时间的变化来研究生物体系的代谢途径的一种技术[6]。国内的代谢组学研究小组基本用metabonomics一词来表示“代谢组学”。严格地说,代谢组学所研究的对象应该包括生物系统中所有的代谢产物。但由于实际分析手段的局限性,只对各种代谢路径底物和产物的小分子物质(MW<1Kd)进行测定和分析。 (二)代谢组学优势特点 代谢组学作为系统生物学的一个重要组成部分,代谢组可以更好地反映体系表型生物机体是一个动态的、多因素综合调控的复杂体系,在从基因到性状的生物信息传递链中,机体需通过不断调节自身复杂的代谢网络来维持系统内部以及与外界环境的正常动态平衡[7]。

代谢组学在植物研究领域中的应用

Botanical Research 植物学研究, 2016, 5(1), 26-33 Published Online January 2016 in Hans. https://www.doczj.com/doc/181839044.html,/journal/br https://www.doczj.com/doc/181839044.html,/10.12677/br.2016.51005 Application of Metabolomics in Plant Research Guixiao La1, Xi Hao1, Xiangyang Li1, Mingyi Ou2, Tiegang Yang1* 1Industrial Crops Research Institute, Henan Academy of Agricultural Sciences, Zhengzhou Henan 2China Tobacco Guizhou Industrial Co. Ltd., Guiyang Guizhou Received: Dec. 10th, 2015; accepted: Dec. 25th, 2015; published: Dec. 30th, 2015 Copyright ? 2016 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY). https://www.doczj.com/doc/181839044.html,/licenses/by/4.0/ Abstract Metabolomics is an emerging omics technology after genomics and proteomics, which can qualify and quantify all small molecular weight metabolites in an organism or cells in a short time. With the technology development of gas chromatography-mass spectrometer (GC-MS), liquid chroma-tography-mass spectrometer (LC-MS) and capillary electrophoresis-mass spectrometry (CE-MS), and the improvement of data process method and presented huge advantages, plant metabolomics has been used in multiple research fields such as functional genomics, metabolism pathway, crop improvement... In this paper, we reviewed the recent progress in plant metabolomics and the put-ative problem in this research field. Moreover, the application prospects of the plant metabolom-ics were also forecasted. Keywords Metabolomics, Plant, Advance, Prospect 代谢组学在植物研究领域中的应用 腊贵晓1,郝西1,理向阳1,欧明毅2,杨铁钢1? 1河南省农业科学院经济作物研究所,河南郑州 2贵州中烟工业有限责任公司,贵州贵阳 *通讯作者。

代谢组学技术在烟草研究中的应用进展_王小莉

2016-02,37(1)中国烟草科学 Chinese Tobacco Science 89 代谢组学技术在烟草研究中的应用进展 王小莉,付博,赵铭钦*,贺凡,王鹏泽,刘鹏飞 (河南农业大学烟草学院,国家烟草栽培生理生化研究基地,郑州 450002) 摘要:简述了作为研究植物生理生化和基因功能新方法的代谢组学在烟草研究中的主要技术流程及其应用现状,归纳了不同生态环境和不同组织中烟草代谢物差异及产生原因,总结了生物和非生物胁迫及化学诱导处理等条件下的烟草生理生化变化及相关基因功能。最后提出了目前烟草代谢组学研究所面临的问题,并指出与其他组学整合应用是代谢组学在烟草研究领域的发展趋势。 关键词:烟草;代谢组学;胁迫;化学诱导;基因功能 中图分类号:S572.01 文章编号:1007-5119(2016)01-0089-08 DOI:10.13496/j.issn.1007-5119.2016.01.016 Research of Metabolomics in Tobacco WANG Xiaoli, FU Bo, ZHAO Mingqin*, HE Fan, WANG Pengze, LIU Pengfei (College of Tobacco Science, Henan Agricultural University, National Tobacco Physiology and Biochemistry Research Center, Zhengzhou 450002, China) Abstract: Metabolomics has been considered one of the most effective means of investigating physiological and biochemical processes and gene function of plants. Here we review the main process of metabolomics and its application status in tobacco research, the regulation mechanisms of physiological and biochemical reactions when tobacco responds to different environmental, biotic and abiotic stresses, chemically induced processes and genetic modifications. Finally, issues of critical significance to current tobacco metabolomics research are discussed and it is noted that integration with other omics is the trend of metabolomics research in tobacco. Keywords: tobacco; metabolomics; stress; chemical induction; gene function 代谢组学与基因组学、转录组学和蛋白质组学分别从不同层面研究生物体对环境或基因改变的响应,它们都是系统生物学的重要组成部分。植物代谢组学是21世纪初产生的一门新学科,主要通过研究植物的次生代谢物受环境或基因扰动前后差异来研究植物代谢网络和基因功能[1-2]。与微生物和动物相比,植物的独特性在于它拥有复杂的代谢途径,目前发现的次生代谢产物达20万种以上[3]。代谢物差异是植物对基因或环境改变的最终响应[4],因此,对代谢物进行全面解析,探索相关代谢网络和基因调控机制,是从分子层面深入认识植物生命活动规律的一个重要环节[5-7]。 烟草不仅是重要的经济作物,同时还是一种重要的模式植物,作为生物反应器在研究植物遗传、发育、防御反应和转基因等领域中具有重要意义[8-10]。烟草代谢物非常丰富,目前从烟叶中已鉴定出3000多种[11],且代谢物理化性质和含量差异较大,给烟草化学及代谢规律研究带来挑战。传统的烟草化学主要集中于研究某一类化学成分或某几种重要物质,如萜类[12]、生物碱类[13]、多酚类等[14],这很难全面地系统地阐述烟草代谢网络。随着系统生物学的发展,烟草越来越广泛地被用于基因组学、转录组学、蛋白质组学和代谢组学的研究中,例如采用系统生物学的方法找出 基金项目:中国烟草总公司浓香型特色优质烟叶开发(110201101001 TS-01);上海烟草集团责任有限公司“浓香型特色优质烟叶风格定位研究及样品检测”(szbcw201201150) 作者简介:王小莉(1983-),女,博士研究生,主要从事烟草生理生化研究。E-mail:xiaoliwang325@https://www.doczj.com/doc/181839044.html, *通信作者,E-mail:zhaomingqin@https://www.doczj.com/doc/181839044.html, 收稿日期:2015-09-09 修回日期:2015-11-19

植物代谢组学的研究方法及其应用

植物代谢组学的研究方法及其应用 ★★★ BlueGuy(金币+3)不错,谢谢! 近年来,随着生命科学研究的发展,尤其是在完成拟南芥(Arabidopsis thaliana) 和水稻(Oryza sativa) 等植物的基因组测序后,植物生物学发生了翻天覆地的变化。人们已经把目光从基因的测序转移到了基因的功能研究。在研究DNA 的基因组学、mRNA 的转录组学及蛋白质的蛋白组学后,接踵而来的是研究代谢物的代谢组学(Hall et al.,2002)。代谢组学的概念来源于代谢组,代谢组是指某一生物或细胞在一特定生理时期内所有的低分子量代谢产物,代谢组学则是对某一生物或细胞在一特定生理时期内所有低分子量代谢产物同时进行定性和定量分析的一门新学科(Goodacre,2004)。它是以组群指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系统整合为目标的系统生物学的一个分支。 代谢物是细胞调控过程的终产物,它们的种类和数量变化被视为生物系统对基因或环境变化的最终响应(Fiehn,2002)。植物内源代谢物对植物的生长发育有重要作用(Pichersky and Gang,2000)。植物中代谢物超过20万种,有维持植物生命活动和生长发育所必需的初生代谢物;还有利用初生代谢物生成的与植物抗病和抗逆关系密切的次生代谢物,所以对植物代谢物进行分析是十分必要的。 但是,由于植物代谢物在时间和空间都具有高度的动态性(stitt and Fernie,2003)。尤其是次生代谢物种类繁多、结构迥异,且产生和分布通常有种属、器官、组织以及生长发育时期的特异性,难于进行分离分析,所以人们一直在寻找更为强大的检测分析工具。在代谢物分析领域,人们已经提出了目标分析、代谢产物指纹分析、代谢产物轮廓分析和代谢表型分析、代谢组学分析等概念。20世纪90年代初,Sauter 等(1991)首先将代谢组分析引入植物系统诊断,此后关于植物代谢组学的研究逐年增多。随着拟南芥等植物的基因组测序完成以及代谢物分析手段的改进和提高,今后几年进入此研究领域的科学家和研究机构将越来越多。 1研究方法 代谢组学分析流程包括样品制备、代谢物成分分析鉴定和数据分析与解释。由于植物中代谢物的种类繁多,而目前可用的成分检测和数据分析方法又多种多样,所以根据研究对象不同,采用的样品制备、分离鉴定手段及数据分析方法各不相同。 1.1样品制备 植物代谢物样品制备分为组织取样、匀浆、抽提、保存和样品预处理等步骤(Weckwerth and Fiehn,2002)。代谢产物通常用水或有机溶剂(如甲醇和己烷等)分别提取,获得水提取物和有机溶剂提取物,从而把非极性的亲脂相和极性相分开。分析之前,通常先用固相微萃取、固相萃取和亲和色谱等方法进行预处理(邱德有和黄璐琦,2004)。然而植物代谢物千差万别,其中很多物质稍受干扰结构就会发生改变,且对其分析鉴定所采用的设备也不同。目前还没有适合所有代谢物的抽提方法,通常只能根据所要分析的代谢物特性及使用的鉴定手段选择合适的提取方法。而抽提时间、温度、溶剂成分和质量及实验者的技巧等诸多因素也将影响样品制备的水平。

代谢组学分析系统技术指标

代谢组学分析系统 1.工作条件: 1.1 电压:220V(±10%)单相,50Hz(±1)。 1.2 环境温度:19-22o C 1.3 相对湿度:<70% * 2.设备用途和基本组成 2.1 仪器用途:所提供仪器为高分辨率,高灵敏度、高通量的分析系统,配以 专业的数据分析处理软件构成代谢组学专用分析系统,从而快速 寻找标记物。 2.2 仪器组成 2.2.1 仪器由超效液相色谱-四极杆/二级碰撞室/飞行时间质谱组成的系统,和 专用代谢组学分析软件以及代谢物分析软件构成,具有先进的中医药代 谢组学研究分析功能。 * 2.2.2 质谱主机要求配置同一厂家生产的液相色谱仪,具有良好的兼容性。 * 2.2.3 具备准确质量测定功能 准确质量测定的内标必须有独立于实测样品的通道进入离子源,内标不得 干扰实际样品的数据结果,并且质量准度<2ppm。 2.2.4 真空系统 要求完全被保护的多级真空系统,具有自动断电保护功能,采用分子涡轮 泵。离子源和质谱间有隔断阀。便于源清洗和日常维护。 * 2.2.5 碰撞室具有两级碰撞功能。分为以下部分: 捕获富集单元:具有离子传输富集、碰撞室两种功能 传输单元:具有离子传输、碰撞室两种功能 * 2.2.6 检测器 检测器由单个微通道板离子计数检测,可检测正负离子和采集MS和 MS/MS的数据, TDC转换速率>4.0 GHz。 * 2.2.7 数据采集和处理系统 工作站用于仪器控制和采集, 1024MB RAM, 200GB硬盘,DVD-ROM,

刻录光盘驱动器,1.44MB 3.5英寸软驱。 软件基于Windows XP 操作系统的应用软件包括集成化的仪器控制、数据处理等软件,代谢组学分析软件以及代谢物分析软件等。 3 仪器的详细技术指标 3.1 液相色谱仪 * 液相色谱仪必须是能够耐超高压(1000bar)的超高效液相色谱仪(UPLC)。3.1.1 可编程二元梯度泵。 溶剂数量:4 流速范围:0.010 - 2mL/min,步进0.001mL/min, 流速精度:< 0.075% RSD,流速准确度:±1%, 泵耐压:0 - 15000psi(1000bar) 梯度设定范围:0 - 100% *系统延迟体积:< 120uL 3.1.2 二极管阵列检测器 波长范围:190-700nm. *测量范围:0.0001~4.0000AUFS *采样速率:40点/秒 流通池:500nl低扩散 3.1.3 自动进样器系统 样品数量:96孔板、384孔板、24x4ml瓶、48x2ml瓶 进样范围:0.1- 50 μL, “针内针”样品探针。 温度范围:4-40摄氏度 3.1.4 在线脱气系统 真空脱气:六通道在线脱气机 3.1.5 柱加热系统 控温范围:室温+5---65摄氏度 3.1.6 专用色谱柱; * 1.7μ, 2.1 mm x 50 mm Column

代谢组学技术及其应用的研究进展

0.前言 代谢组学是一种研究体内代谢产物的系统生物学方法,它能为疾病状态、药理毒理、基因功能的研究提供大量信息[1],1999年Nicholson[2]将其定义为能定量测定生命系统对病理生理刺激或基因改变所产生的动态多参数代谢反应的一种方法(Metabonomicsisdefinedas‘thequan-titativemeasurementofthedynamicmultiparametricmetabolicresponseoflivingsystemstopathophysiologicalstimuliorgeneticmodification’)。它是继基因组学、蛋白质组学、转录组学后新近发展起来的一门新的组学,并与基因组学、蛋白质组学、转录组学等共同构成系统生物学。代谢组学考查的是生物机体内所有的代谢产物[3],但主要关注的是分子量在1000以内的小分子物质,基因组学和蛋白质组学分别从基因和蛋白质层面探寻生命活动,代谢组学则从代谢物层面上探寻生命活动,基因组学和蛋白质组学告诉你什么可能会发生,而代谢组学则告诉你什么确实发生了[4]。代谢产物能在一个生物体的细胞、细胞器、组织、器官、体液等各个层面上产生[5],从某种意义上说机体内每一项生命活动都要受到代谢产物的调节和影响,因此,代谢组学研究可以了解和探索各项生命活动的整体代谢状况从而帮助人们更好地理解生命活动。目前代谢组学在药学、毒理学、疾病诊断、基因功能等生命科学的各个领域都有广泛应用,并已显示出其强大的优势,它在向各个学科渗透的同时,其自身技术和方法也在不断进步,随着系统生物学的发展,代谢组学正向真正的系统、综合、全面的目标迈进。 1.代谢组学的研究方法 代谢组学研究的基本方法是应用气相色谱质谱联用(GC-MS),液相色谱质谱联用(LC-MS),核磁共振波谱(NMR)等先进的仪器分析技术来检测各种生物样品(包括血液、尿液、脑脊液、肝脏、病变组织等)中代谢物组的信息并结合模式识别和专家系统等分析计算方法对所得代谢组学数据进行处理,最后综合解析这些数据以探讨各种生命活动在代谢物层面上的规律和特征并用于评价药物疗效、检测药物毒性、诊断疾病、分析疾病状态等。代谢组学的技术平台主要包括样品制备、代谢产物检测和分析鉴定以及数据分析与模型建立。 2.代谢组学的应用 2.1代谢组学为药学和毒理学研究中的应用 目前,代谢组学在药物安全性评价、新药开发、毒性标志物的筛选等方面应用广泛。Nicholls[6]运用代谢组学技术对药物引起磷脂质病的机理进行了研究,结果发现大鼠给药后不同时段尿液代谢组图谱发生变化。研究认为代谢组学技术能为药物引起磷脂质病微小生化改变的检测提供强有力的工具。Slim[7]利用代谢组学方法研究了地塞米松对磷酸二酯酶抑制剂诱导的大鼠脉管炎的治疗作用,发现大鼠尿液代谢组图谱与组织病理变化基本一致,研究认为尿液代谢组图谱的变化可反映主要的病理变化,代谢组学技术可非侵害地检测血管变化。 在动物实验和临床试验中利用高通量的技术手段筛选和检测潜在的毒性物质是新药安全性评价的重要环节[8],因为大多数药物通过广泛的生物转化作用可成为毒性明显不同的代谢物[9],当毒物与细胞或组织相互作用时会引起机体关键代谢过程中内源性物质的比例和浓度发生变化,所以只有对这些代谢物的变化信息进行全面的分析研究才能更好地评价药物的安全性,大量研究表明代谢组学技术能快速获得这些信息[10],它可检测生物体在给药后整体的代谢反应过程,能综合考察药物的药效和毒性,能全面分析代谢产物的变化特点和规律,从而系统地评价药物的价值和开发前景。在毒理学研究中,代谢组学技术在研究毒物作用机制、预测药物毒性、鉴定对临床有用的生物标志物等方面发挥着重要作用[11]。Warne[12]利用代谢组学技术研究3-三氟甲基-苯胺的毒 理反应,成功鉴定出了与毒性反应有关的潜在生物标志物。Azmi等[13]利用代谢组学技术研究了1-萘异硫氰酸酯(1-Naphthylisothiocyanate,ANIT)的肝毒性作用,研究认为代谢组学技术能够在器官、亚器官等不同水平上认识不同的毒理学机制。 鉴于代谢组学技术在药学和毒理学研究中的巨大贡献,英国帝国理工学院已与六家医药公司联合成立了名为毒理代谢组学(theConsor-tiumforMetabonomicToxicology,COMET)的研究组织,该组织旨在从方法学上建立一套毒理代谢组学研究体系和通用的标准评价方法,采用1HNMR技术分析尿液和血液代谢组信息以用于候选药物临床前的毒性检测[14]。近来,Clayton[15]又提出了药物代谢组学的概念(pharmaco-metabonomics,whichwedefineas‘thepredictionoftheoutcome(forex-ample,efficacyortoxicity)ofadrugorxenobioticinterventioninanindividualbasedonamathematicalmodelofpre-interventionmetabolitesignatures’)。 2.2代谢组学在疾病研究和诊断中的应用 近年来,代谢组学技术已广泛应用于心血管疾病、糖尿病、癌症等疾病的诊断和研究。在心血管疾病方面,Brindle[16]利用基于1HNMR的代谢组学技术对冠心病人的血清代谢组进行了分析,结果显示疾病组与正常组代谢组图谱存在明显差异,研究认为代谢组学技术不仅能快速、准确的诊断冠心病还能区分疾病的严重程度。Martin[17]运用代谢组学技术研究了不同饮食对动脉粥样硬化形成的影响,结果发现极低密度脂蛋白(VLDL)、胆固醇(cholesterol)、N-乙酰基糖蛋白(N-acetylgly-coproteins)与动脉粥样硬化的形成呈正相关,白蛋白赖氨酰残基(albu-minlysylresidues)、氧化三甲胺(trimethylamine-N-oxide)与之呈负相关,此外,在预测动脉粥样硬化变性方面代谢组学数据可达89%,而常规方法只有60%,研究认为代谢组学技术不仅能区分不同饮食诱导的动脉粥样硬化的生物反应(尤其是多参数代谢反应),还能发现新的与疾病进程呈正相关或负相关的潜在标志物,从而帮助人们更好地认识疾病发病的危险因素。 在糖尿病方面,Hodavance[18]认为代谢组学技术是研究2型糖尿病和胰岛素抵抗的有力工具,它能够识别那些常规方法无法识别的代谢产物。Yang[19]对比分析2型糖尿病人和正常人血清代谢组图谱发现2型糖尿病人的血清脂肪酸代谢谱与正常人存在差异,研究认为利用代谢组学方法检测血清脂肪酸代谢状况可快速诊断2型糖尿病。Yuan等[20]对2型糖尿病人尿液进行代谢组学分析并发现了马来酸(Maleicacid)、氧基乙酸(Oxylaceticacid)、4-氨基苯甲酸(4-Aminobenzoicacid)等与2型糖尿病有关的潜在生物标志物。 在癌症方面,Whitehead[21]认为代谢组学技术不仅能分析水溶性和脂溶性的癌组织提取物还能发现和鉴定在疾病不同阶段的特征性代谢产物,它是研究和诊断癌症的有力工具。Yang等[22]利用代谢组学技术对比分析了肝癌、肝炎、肝硬化患者及正常对照者的尿液代谢组信息,结果显示各组患者尿液代谢组信息存在明显差异,研究认为代谢组学技术不仅能清楚地区分患者和正常人还能诊断出患者是患肝炎、肝硬化还是肝癌,这对降低误诊率意义重大,研究还指出通过代谢组学技术鉴定出的尿液核苷在癌症诊断方面优于传统的肿瘤标志物甲胎蛋白(alpha-fetoprotein,AFP)。 代谢组学不仅在上述影响人类健康的重大疾病中有广泛的应用,目前还应用于泌尿系统疾病[23]、神经系统疾病[24]、高血压[25]、先天性代谢缺陷[26]等疾病的研究和诊断。这些研究均表明代谢组学是疾病研究和诊断的有力工具,它的应用为疾病研究和诊断开辟了新的领域。 2.3代谢组学在其它领域的应用 代谢组学凭借其独特的优势和应用潜力不仅在药学、毒理学、疾病 代谢组学技术及其应用的研究进展 苏州大学体育学院岳秀飞史晓伟 [摘要]代谢组学是一种研究生物体内所有小分子代谢物的系统生物学方法,它利用气相色谱质谱联用(GC-MS),液相色谱质谱 联用(LC-MS),核磁共振波谱(NMR)等先进的仪器分析技术来检测各种生物样品中代谢物组的信息并结合模式识别等分析计算方 法对所得代谢组学数据进行处理,最后综合解析这些数据以用于评价药物疗效、检测药物毒性、诊断疾病、分析疾病状态。代谢组学 自提出以来发展十分迅速,目前已在药学、毒理学、疾病研究和诊断等领域得到广泛应用。本文主要对代谢组学的概念,研究方法及 其应用进行综述,最后就代谢组学的发展趋势作一讨论。 [关键词]代谢组代谢组学核磁共振气相色谱质谱联用液相色谱质谱联用 95 ——

相关主题
文本预览
相关文档 最新文档