当前位置:文档之家› 系统生物学

系统生物学

什么是系统生物学
(Systems Biology)根据胡德的定义,系统生物学是研究一个生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系的学科。也就是说,系统生物学不同于以往的实验生物学——仅关心个别的基因和蛋白质,它要研究所有的基因、所有的蛋白质、组分间的所有相互关系。显然,系统生物学是以整体性研究为特征的一种大科学。

系统理论和系统思想对于我国知识分子并不陌生。1980年代在我国学术界曾经流行过“三论”——系统论、信息论和控制论,其中的“系统论”是指奥地利科学家贝塔朗菲(L. Bertalanffy)在1970年代创立的“一般系统论”(general system theory)。尽管贝塔朗菲是以生物学家的身份去思考、研究并提出系统论的,但他的系统论并不仅仅适用于生命科学,而且适用于物理学、心理学、经济学和社会科学等各门学科。如果说过去所谈论的是指在哲学层面上的、普适性强的一般系统论,那么本文所要介绍的系统生物学(systems biology),则是生命科学研究领域的一门新兴学科。

作为人类基因组计划的发起人之一,美国科学家莱诺伊·胡德(Leroy Hood)也是系统生物学的创始人之一。在胡德看来,系统生物学和人类基因组计划有着密切的关系。正是在基因组学、蛋白质组学等新型大科学发展的基础上,孕育了系统生物学。反之,系统生物学的诞生进一步提升了后基因组时代的生命科学研究能力。正如胡德所说,“系统生物学将是21世纪医学和生物学的核心驱动力”。基于这一信念,胡德在1999年年底辞去了美国西雅图市华盛顿大学的教职,与另外两名志同道合的科学家一起创立了世界上第一个系统生物学研究所(Institute for Systems Biology)。随后,系统生物学便逐渐得到了生物学家的认同,也唤起了一大批生物学研究领域以外的专家的关注。2002年3月,美国《科学》周刊登载了系统生物学专集。该专集导论中的第一句话这样写道:“如果对当前流行的、时髦的关键词进行一番分析,那么人们会发现,‘系统’高居在排行榜上。”

系统生物学的基本工作流程有这样四个阶段。首先是对选定的某一生物系统的所有组分进行了解和确定,描绘出该系统的结构,包括基因相互作用网络和代谢途径,以及细胞内和细胞间的作用机理,以此构造出一个初步的系统模型。第二步是系统地改变被研究对象的内部组成成分(如基因突变)或外部生长条件,然后观测在这些情况下系统组分或结构所发生的相应变化,包括基因表达、蛋白质表达和相互作用、代谢途径等的变化,并把得到的有

关信息进行整合。第三步是把通过实验得到的数据与根据模型预测的情况进行比较,并对初始模型进行修订。第四阶段是根据修正后的模型的预测或假设,设定和实施新的改变系统状态的实验,重复第二步和第三步,不断地通过实验数据对模型进行修订和精练。系统生物学的目标就是要得到一个理想的模型,使其理论预测能够反映出生物系统的真实性。


系统生物学的灵魂
——整合

作为后基因组时代的新秀,系统生物学与基因组学、蛋白质组学等各种“组学”的不同之处在于,它是一种整合型大科学。首先,它要把系统内不同性质的构成要素(基因、mRNA、蛋白质、生物小分子等)整合在一起进行研究。系统生物学研究所的第一篇研究论文,就是整合酵母的基因组分析和蛋白质组分析,研究酵母的代谢网络[2]。由于不同生物分子的研究难度不一样,技术发展程度不一样,目前对它们的研究水平有较大的差距。例如,基因组和基因表达方面的研究已经比较完善,而蛋白质研究就较为困难,至于涉及生物小分子的代谢组分的研究就更不成熟。因此,要真正实现这种整合还有很长的路要走。

对于多细胞生物而言,系统生物学要实现从基因到细胞、到组织、到个体的各个层次的整合。《科学》周刊系统生物学专集中一篇题为“心脏的模型化——从基因到细胞、到整个器官”的论文,很好地体现了这种整合性[3]。我们知道,系统科学的核心思想是:“整体大于部分之和”;系统特性是不同组成部分、不同层次间相互作用而“涌现”的新性质;对组成部分或低层次的分析并不能真正地预测高层次的行为。如何通过研究和整合去发现和理解涌现的系统性质,是系统生物学面临的一个带根本性的挑战。

系统生物学整合性的第三层含义是指研究思路和方法的整合。经典的分子生物学研究是一种垂直型的研究,即采用多种手段研究个别的基因和蛋白质。首先是在DNA水平上寻找特定的基因,然后通过基因突变、基因剔除等手段研究基因的功能;在基因研究的基础上,研究蛋白质的空间结构,蛋白质的修饰以及蛋白质间的相互作用等等。基因组学、蛋白质组学和其他各种“组学”则是水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种“三维”的研究。此外,系统生物学还是典型的多学科交叉研究,它需要生命科学、信息科学、数学、计算机科学等各种学科的共同参与。

系统生物学的整合性可以体现在两种不同的策略上。第一种就是胡德和系统生物学研

究所采用的方式,选定一个较为简单的系统,如单细胞生物酵母,然后分析尽可能多的构成成分——基因组、转录组、蛋白质组、相互作用组,以揭示整个系统的行为。另外一种策略是吉尔曼(A. G. Gilman)领导的“信号转导联军”采用的,以一个较为复杂的系统(G蛋白介导的和与其相关的细胞信号转导系统)为研究对象,采用尽可能多的研究手段去进行分析(详细介绍见本刊2002年第2期第36页)。


系统生物学的基础
——信息

在前分子生物学时代,生物学家把生命视为具有特殊“活力”的有机体,遵循着无机界不存在的法则进行生命活动。在分子生物学时代,研究者们把生命视为一架精密的机器,由基因和蛋白质根据物理、化学的规律来运转。在后基因组时代,像胡德这种类型的科学家,把生命视为信息的载体,一切特性都可以从信息的流动中得到实现。

胡德提出,应该把生物学视为一门信息科学。这个观点包含有三层意思。首先,生物学研究的核心——基因组,是数字化的(digital)。生物学与所有其他学科,如物理学、化学、地理学,是完全不一样的科学,因为生物学以外的学科都只能通过类比的方式(analog)进行分析。既然生物学研究的核心是数字化的,因此生物学可以被完全破译。从理论上说,我们对生物学的把握应该超过其他任何一门学科。其次,生命的数字化核心表现为两大类型的信息,第一类信息是指编码蛋白质的基因,第二类信息是指控制基因行为的调控网络。显然,由一段DNA序列组成的基因是数字化的。值得强调的是,基因调控网络的信息从本质上说也是数字化的,因为控制基因表达的转录因子结合位点也是核苷酸序列。生物学是信息科学的第三层意思是,生物信息是有等级次序的,而且沿着不同的层次流动。一般说来,生物信息以这样的方向进行流动:DNA→mRNA→蛋白质→蛋白质相互作用网络→细胞→器官→个体→群体。这里要注意的是,每个层次信息都对理解生命系统的运行提供有用的视角。因此,系统生物学的重要任务就是要尽可能地获得每个层次的信息并将它们进行整合。

根据系统论的观点,构成系统的关键不是其组成的物质,而是组成部分的相互作用或部分之间的关系。这些相互作用或者关系,从本质上说就是信息。换一个角度来说,生命是远离平衡态的开放系统,为了维持其有序性,生命系统必须不断地与外部环境交换能量,以抵消其熵增过程。奥地利物理学家薛定谔早在1940年代发表的著作《生命是什么?》中就已指出,生命以“负熵流”为食,而“负熵”其实就是信息的另一种表示

方法。因此,我们可以这样说,生命系统是一个信息流的过程,系统生物学就是要研究并揭示这种信息的运行规律。


系统生物学的钥匙
——干涉

系统生物学一方面要了解生物系统的结构组成,另一方面是要揭示系统的行为方式。相比之下,后一个任务更为重要。也就是说,系统生物学研究的并非一种静态的结构,而是要在人为控制的状态下,揭示出特定的生命系统在不同的条件下和不同的时间里具有什么样的动力学特征。

凡是实验科学都有这样一种特征:人为地设定某种或某些条件去作用于被实验的对象,从而达到实验的目的。这种对实验对象的人为影响就是干涉(perturbation)。传统生物学采用非干涉方法如形态观察或分类研究生物体。20世纪形成的分子生物学等实验生物学的特点就是,科学家可以在实验室内利用各种手段干涉生物学材料,如通过诱导基因突变或修饰蛋白质,由此研究其性质和功能。系统生物学同样也是一门实验性科学,也离不开干涉这一重要的工具。

系统生物学中的干涉有这样一些特点。首先,这些干涉应该是有系统性的。例如人为诱导基因突变,过去大多是随机的;而在进行系统生物学研究时,应该采用的是定向的突变技术。上面所提到的对酵母的系统生物学研究,胡德等人就是把已知的参与果糖代谢的9个基因逐一进行突变,研究在每一个基因突变下的系统变化。果蝇从受精开始到形成成熟个体一共有66个典型的发育阶段,不久前科学家利用基因芯片技术,对每一个发育阶段的基因表达谱进行了系统的研究。这也是一类系统性的干涉方式。其次,系统生物学需要高通量的干涉能力,如高通量的遗传变异。现有技术已经能做到在短时间内,把酵母的全部6000多个基因逐一进行突变。对于较为复杂的多细胞生物,可以通过RNA干涉新技术来实现大规模的基因定向突变。随着研究技术的发展,一定还会有许多新的干涉技术应用于系统生物学。

需要提请人们注意的是,以测定基因组全序列或全部蛋白质组成的基因组研究或蛋白质组研究等“规模型大科学”,并不属于经典的实验科学。这类工作中并不需要干涉,其目标只是把系统的全部元素测定清楚,以便得到一个含有所有信息的数据库。胡德把这种类型的研究称为“发现的科学”(discovery science),而把上述依赖于干涉的实验科学称为“假设驱动的科学”(hypothesis-driven science),因为选择干涉就是在做出假设。系统生物学不同于一般的实验生物学就在于,它既需要“发现的科学”,也需要“假设驱动的科学”。首先要选择一种条件(干涉),然后利用

“发现的科学”的方法,对系统在该条件下的所有元素进行测定和分析;在此基础上做出新的假设,然后再利用“发现的科学”研究手段进行新研究。这两种不同研究策略和方法的互动和整合,是系统生物学成功的保证。

笔者还要再强调一点,在注重这两类研究手段的同时,不应该忽略系统生物学的另一个特点——对理论的依赖和建立模型的需求。在本文一开始介绍系统生物学的概况时,特别指出过,系统生物学的理想就是要得到一个尽可能接近真正生物系统的理论模型;建模过程贯穿在系统生物学研究的每一个阶段。离开了数学和计算机科学,就不会有系统生物学。也许正是基于这一考虑,科学家把系统生物学分为“湿”的实验部分(实验室内的研究)和“干”的实验部分(计算机模拟和理论分析)。“湿”、“干”实验的完美整合才是真正的系统生物学。

从某种意义上说,系统生物学在中国有很好的基础。我们的传统医学就是把人体视为一个系统,通过测定和改变系统的输入和输出来调节系统的状态。传统科学的缺点在于,它只能进行“黑箱操作”,不能解释系统的内部组成成分和动力学过程。而系统生物学则把生物系统化为“白箱”,不仅要了解系统的结构和功能,而且还要揭示出系统内部各组成成分的相互作用和运行规律。

补充增加:
20世纪中贝塔朗菲(L.Von.Bertalanffy)创立系统论和理论生物学 - 开拓了系统生物科学(system bioscience)的发展:(Maelzer DA. Environment, semantics, and system theory in ecology. J Theor Biol. 1965 May;8(3):395-402.,)
1)系统生态学(systems ecology, Van Dyne GM.1966);
2)系统生理学(systems physiology, Sagawa K.1973);
3)系统心理学(system psychology, Edward B. Titchener.1992,70-80年代的文稿);
4)系统生物医学(system biomedicine, Kamada T.1992);
5)系统生物学(systems biology, Zieglgansberger W,Tolle TR.1993);
6)系统生物工程与系统遗传学(system bio-engineering, system genetics, Zeng BJ.1994); - 《转基因动物通讯》(1994年6月、11月,1995年3月、11月,1996年8-10月等,来自1994年5月Zeng BJ-曾(杰)邦哲《结构论-泛进化论》)
- 总称为系统生物科学(1999年创建的系统生物科学与工程网genbrain biosystem network等) - 所用词汇有:system bioscience, system bio-engineering, system biotechnology, biosystem science, biosystem engineering, biosystem medicine, biosystem technology, biosystem analytics, artificial biosystem等。


我相信生命科学产业最终将接受系统生物学这个范式。对于数据的测量、观察和获取──这3项技术的发展让我们进一步理解了生物系统之间的相互关联性,或者说,更加重要南嗷ヒ览敌浴?

那么,风险

投资基金究竟又在何处呢?过去的6~8年里,众多高调的融资行为之后随之而来的却是大量的销账,造成的负面影响使得风险投资放缓了对生物信息行业的支持。这些投资机构主要的顾虑在于,相关行业的复杂性和配套技术(例如测量技术)进展缓慢,将妨碍生物科技公司创造可观的、持续的、可预期的现金流。

Icoria公司的首席商务官Peter Johnson同时也是纽约研发三角园的系统生物解决方案的提供者,他说:“各生物阶段活力的测量技术已经成熟,各生物尺度间的相互关联性的测量技术也已经成熟。这对于理解生物体的发育、疾病的机理及形成、生物体对药物的反应都很有价值。”

Icoria公司正致力于构建一个整体的解决方案,将许多过去毫不相关的数据流集结成一个系统生物学的整体框架,其主要的目标就是通过对数据的自动处理,让分析工作的效率更高、费用更低,而结果更加准确。这种工作方式对于普通标准和语言的开放程度,使这些优势成为可能。许多生物信息的先驱没能找到一个完整的解决方案,或者没有理解客户的需求,是因为他们那种单个解决方案太局限,从而易遭到拥有大型解决方案的同行的攻击。

然而,这种整体性方案的缺憾之处是:那些靠风险投资支撑的公司由于缺乏资源而无法建立或者获取这样一个综合的解决之道。这不仅意味着要集合所有的数据流,还要创造出一个能够把握的结果,这种极度的挑战性常会使风险投资知难而退。

投资稍露端倪的科技业对风险投资者而言是有利可图的,但是,Johnson说道:“系统生物学还处在婴儿期,无论哪个集团,即便它倾其全力,也难以同时测量所有不同层面上的生物尺度。”考虑到我们依旧缺乏足够多的、基于生物IT技术而获成功的药物开发案例,这个行业将会继续处于摸索和试验阶段。

值得庆幸的是,系统生物学领域已经出现的一些迹象颇为引人注目,Johnson预测,在真正有意义的花费之前,药物开发周期预计可以提早大约4年左右的时间,这对临床阶段影响深远。由此而来的资金成本的大幅降低使得风险投资者感到很兴奋。例如,预测表明,有了这些系统分析工具,靶标确认芄淮?年减少到1年,并且能更好的了解生物标记。

于是有个对此颇有信心的风险基金给了生物技术的创业者们一个小小的忠告:关键不在于你筹集了多少资金,而是看你如何驾驭你的公司。换句话说,你越专注,越是能有效利用资金,那么你所建立的解决方案就越能吻合客户的需求。一般来说,1,500万美金的总投资就能使一家软件公司持续的

运营。

因此,你必须显得比你真正的实力更加强大。客户喜欢购买整体性解决方案,所以,如果合适的话,考虑一下合伙经营,以及会为你提供强大方案的收购和并购战略。为一两个客户提供的解决方案不会是一笔利润丰厚的大生意,因为产品太过个性化、定制化了。从趋势上还看不出风险投资基金意图恢复其投资的欲望。


线虫胚胎形成过程的早期阶段,是验证“系统水平”的方法在了解生物学过程方面与传统的、以各个酶为对象的还原方法相比所具有的潜力的一个理想系统。Gunsalus等人,通过将关于蛋白彼此之间如何发生相互作用、基因如何表达、以及“敲出”数百个基因所产生效应等方面的信息结合起来,建立了一系列关于在驱动早期胚胎形成过程中所涉及的分子机器的模型,并且能够提出这些机器之间的功能联系。他们发现,10种以前未定性的蛋白在这些系统中有重要作用,并且演示了这些系统何以能将信息反馈进单反应实验中。

———系统生物学创始人莱洛伊·胡德访谈录

20世纪80年代中期,生物学家莱洛伊·胡德开发出DNA自动化测序机,从而大大加快“人类基因组计划”的进展。曾是美国加州理工学院教授的胡德创建过若干家生物技术公司。他于2000年1月利用500万美元创建了系统生物学研究所。系统生物学是一门崭新的生物学分支。著名的麻省理工学院院刊《技术评论》栏目资深记者赞克斯对胡德进行专访。从他们之间的对话,可看出当今生物学发展方向及美国科学家的创业历程。

赞克斯:你领导的科研小组因发明了DNA自动测序机而闻名于世,除此之外你还发明过其他什么仪器?

胡德:我对开发将推动未来15年生物学发展的仪器深感兴趣。我发明了DNA测序机、DNA合成机、蛋白质测序机和蛋白质合成机。我认为这4种仪器将改变世界,使人类能更有效地解释合成生物学。

赞克斯:为什么这些仪器如此重要?

胡德:生物学和信息技术之间的关系十分有趣,很多生物学家对信息技术不感兴趣,他们使用这一技术,但没有真正地将其视为生物学的一个基本部分。而信息技术是一门能打开生物学前沿的崭新技术。例如,我们开发的蛋白质合成机,比老式仪器灵敏100倍,使我们能分析以前根本不能分析的大量蛋白质。我们完成了16项计划,其中每一项都开辟出一个新的研究领域。

赞克斯:你能简略地说说什么是系统生物学吗?

胡德:我想以汽车为例加以说明。若要了解汽车是如何运行的,过去的做法是建立若干个专家小组,每个小组只研究部件、齿轮、制动器及点火器等。而系统

生物学则试图采用最新的科学发现来解释整个汽车系统的所有部件,在各个层次上彼此之间的关系。最终以系统方法将不同的测量数据整合起来,利用数学模型深入了解汽车的结构和功能。系统生物学就是这么个思路。它先取得一个生物系统,辨识出各种因素,然后在一个模型系统中使这个生物系统动起来。在DNA、RNA、蛋白质相互作用及信息网络方面整合所获得的信息,然后开发出能描述系统结构和行为的数学模型。我们目前处于了解数学模型形成的早期阶段,一旦完成这一模型,它将能处理潜在的药物副作用等问题。

赞克斯:你为什么想创办一所系统生物学研究所?

胡德:1992年,我从加州理工学院来到华盛顿大学医学院,创建分子生物技术系。该系的宗旨是进行跨学科研究,因此聘用了工程师、应用物理学家、计算机科学家以及生物学家。分子生物技术系获得很大成功,在1995年,当我找到校长想让校方建一座楼,以扩大系统生物学的研究范围时,校长说因为校方计划太多,要我至少等上10年以上。于是我决定在医学院内建研究所,但花了4年时间也没建成。我认识到大学的文化、官僚作风及缺乏灵活性,不会对人类基因组计划的成功带来机会。我想只有辞职,另建一个独立的、非盈利研究所。

系统生物学研究所成立已有1年多,我们有跨学科的研究人员,员工从2人增加到160人。我们建立了6个技术平台,并已获得政府的拨款和企业的赞助,同时已同很多企业建立了合作关系。

赞克斯:你们现正开发什么样的技术?

胡德:我们正开发喷墨式合成机,用来建造少核基因芯片(一次能分析几千个基因),比光刻技术更为灵活。我们正建造超大规模蛋白质组生产线。对于后基因组时代,这是很重要的技术。我们还在开发技术完善的细胞分类器,以获取复杂的细胞群,并迅速地将不同的细胞进行分离。同时我们正在开发测定蛋白质与蛋白质、蛋白质与DNA相互作用的新方法以及解读生物复杂性的软件。(科技日报驻华盛顿记者张孟军翻译)

生物谷按:未来的生物学将会怎样?作者分析了化约论和合成论的应用范围和手段,指出:未来的生物学很可能透过灵活地、交错地运用化约与合成两种观点,建立起生物学的理论架构,使传统生物学由描述性的科学,转型变成一种分析性的生物学。

未来的生物学可能在描述现象外,加上预测的能力
未来的生物学究竟是什么?要回答这问题,一方面需要回顾历史这面明镜,在另一方面要有科幻小说家的想象力。生物学一直被科学家们认为是描述性的科学,可是若回想化学

发展的过程,就会理解化学在发现周期表之前,也是描述性的科学。可是在经过多年的努力后,已有许多原理形成,让我们可以预测反应的行为。生物学在过去是局部性地研究少数的基因,因此鲜有机会找出有用的规则作为预测之用。可是基因体分析计划所发展出的巨量分析技术,却让我们有机会可以作广域性(global)的分析,因此在未来或许可以像化学那样做预测,而不是只有对现象的描述。

传统生物学与化约论 (reductionism) 的观点
分子生物学采用化约论的观点,让我们有机会观察到许多前所未见的细节,让我们有机会提出反应机制来解释现象。化约论假设一个复杂的系统可以分割为许多不会互相干扰的子系统,因此只要将子系统研究清楚,就能了解复杂系统的行为。如果子系统仍然很复杂,就用同样的策略在子系统中再继续分割,再一一击破。这一套方法学固然使我们很成功地由分子层次解释反应运作的原理,而造成生物学上的突破。可是无限的化约真能解释生命现象吗?
在使用化约论观点的研究过程中,我们也发现子系统可能并非完全独立,因此不具加成性。生物体善用组合的策略,因此在执行纪录在DNA中的指令时,也有许多随机的组合。此外,有时更有环境因素的影响。这就是为什么每个人的指纹都不同;这也是为什么少数抗体基因,却能产生上百万种的抗体来抵御各种入侵的异物。当随机的因子出现时,化约论不再能预测产生结果的机制,只能观察最终的结果。化约论的死忠拥护者会辩解说这是因为没有找到所有的子系统,可是这种ad hoc的讲法不过是提出一个无法测试的假说。我们是不是应该承认任何一种方法学均非完美,而试由另一种观点来看问题呢?

系统生物学与合成(synthesis)的观点
系统生物学试图由合成的角度看生物学,合成的观点选择面对子系统不独立的可能性,而希望寻找新的方法来解决子系统间交互作用的问题。就像是研究任何一个科学问题一样,解决这问题的第一个步骤是有系统地收集这些交互作用的信息。在过去采用化约论的观点看问题时,在用一个新的观点诠释问题时,才会注意到过去那些被忽视的信息。佛来明发现抗生素时,并不是因为只有他观察到这现象,而是因为只有他重视这现象。因此能够灵活地由不同的尺度,不同的观点看问题时,才容易有新的发现。
传统生物学假设细胞是一个黑盒子,我们可以加入物质(例如养份或抑制剂),或制作突变株来扰动这未知的系统,再做实验上的观察。系统生物学在设计实验时,所测量的数值或许与过去所差不多,可是使用巨量分析的技术收集大

量数据,而解释数据的观点也不相同,甚至会引入许多生物学者不熟悉的分析方式。这种先收集大量数据,再做理论分析的研究方法是比较有效率的方式,可在同样的时间内由不同的专家“平行”地研究不同的路径。更重要的是这种研究方式,让我们有机会观察到许多路径间的交互作用,这是在针对单一路径做研究时不容易看见的信息,因此才有机会由合成的角度分析生物学。在发展遗传工程学时,曾经淘汰了一批不习惯用这样方式思考的人,也让学习这种思考方式的人有了飞快的进展。系统生物学的观点是否相当于过去遗传工程学对生物学的冲击,不同的人或许有不同的见解,可是可以确认的是它会发现一些过去忽视的现象,而且能与化约的观点互补。或许现在发展系统生物学的时机尚未成熟,可是我们是要创造时势,或是在未来追随时代的潮流,是我们应该思考的问题。

生物信息学是过渡到未来生物学的重要工具
未来的生物学究竟是否会综合化约与合成的观点来建立生物学的理论架构虽然尚不明朗,可以确认的是生物信息学的工具将像遗传工程技术那样的深入到每个生物学实验室。这种新的工具是这两种观点都需要的工具,它不但能被动地节省做分析的人力,也能主动地引入“由信息驱动的生物医学研究”。这种新的研究方式强调由数据中做观察,比较,进而提出假设,再以实验方法做验证。这种利用“信息探采(data mining)”的研究模式,与传统实验生物学的搭配,将使我们能更有效率地发现新的现象,因此生物信息学将使我们能更早地进展到有理论架构的未来生物学。

综合而言,基因体分析等研究为我们累积了巨量的数据,而生物信息学可协助我们利用这些数据加速做新的观察之速率,因此有机会由整体的、合成的角度检视生物学,而建立所谓的系统生物学。未来的生物学很可能透过灵活地、交错地运用化约与合成两种观点,建立起生物学的理论架构,使传统生物学由描述性的科学,转型变成一种分析性的未来生物学。


系统生物学实验室


https://www.doczj.com/doc/1a6904692.html,/

Systems biology is an emergent field that aims at system-level understanding of biological systems. Since the days of Weiner, system-level understanding has been a long standing goal of biological sciences. Cybernetics, for example, aims at describing animals and machines from the control and communication theory. Unfortunately, molecular biology has just started at that time, so that only phenomenological analysis has been possible. It was only recently that system-level analysis can be grounded on discoveries at molecular-level. With the progress of genome sequence project and range of o

ther molecular biology project that accumulate in-depth knowledge of molecular nature of biological system, we are now at the stage to seriously look into possibility of system-level understanding solidly grounded on molecular-level understanding.
What does it mean to understand at "system level"? Unlike molecular biology which focus on molecules, such as sequence of nucleotide acids and proteins, systems biology focus on systems that are composed of molecular components. Although systems are composed of matters, the essence of system lies in dynamics and it cannot be described merely by enumerating components of the system. At the same time, it is misleading to believe that only system structure, such as network topologies, is important without paying sufficient attention to diversities and functionalities of components. Both structure of the system and components plays indispensable role forming symbiotic state of the system as a whole.
Within this context, (1) understanding of structure of the system, such as gene regulatory and biochemical networks, as well as physical structures, (2) understanding of dynamics of the system, both quantitative and qualitative analysis as well as construction of theory/model with powerful prediction capability, (3) understanding of control methods of the system, and (4) understanding of design methods of the system, are key milestones to judge how much we understand the system.
There are numbers of exciting and profound issues that are actively investigated, such as robustness of biological systems, network structures and dynamics, and applications to drug discovery. Systems biology is in its infancy, but this is the area that has to be explored and the area that we believe to be the main stream in biological sciences in this century.

References:
H. Kitano, Systems Biology: a brief overview, Science, 295:1662-1664, 2002
H. Kitano, Computational Systems Biology, Nature, 420:206-210, 2002


系统生物学面面观


吴家睿

系统理论和系统思想对于我国知识分子并不陌生。1980年代在我国学术界曾经流行过“三论”——系统论、信息论和控制论,其中的“系统论”是指奥地利科学家贝塔朗菲(L. Bertalanffy)在1970年代创立的“一般系统论”(general system theory)。尽管贝塔朗菲是以生物学家的身份去思考、研究并提出系统论的,但他的系统论并不仅仅适用于生命科学,而且适用于物理学、心理学、经济学和社会科学等各门学科。如果说过去所谈论的是指在哲学层面上的、普适性强的一般系统论,那么本文所要介绍的系统生物学(systems biology),则是生命科学研究领域的一门新兴学科。


作为人类基因组计划的发起人之一,美国科学家莱诺伊·胡德(Leroy Hood)也是系统生物学的创始人之一。在胡德看来,系统生物学和人类基因组计划有着密切的关系

。正是在基因组学、蛋白质组学等新型大科学发展的基础上,孕育了系统生物学。反之,系统生物学的诞生进一步提升了后基因组时代的生命科学研究能力。正如胡德所说,“系统生物学将是21世纪医学和生物学的核心驱动力”[1]。基于这一信念,胡德在1999年年底辞去了美国西雅图市华盛顿大学的教职,与另外两名志同道合的科学家一起创立了世界上第一个系统生物学研究所(Institute for Systems Biology)。随后,系统生物学便逐渐得到了生物学家的认同,也唤起了一大批生物学研究领域以外的专家的关注。2002年3月,美国《科学》周刊登载了系统生物学专集。该专集导论中的第一句话这样写道:“如果对当前流行的、时髦的关键词进行一番分析,那么人们会发现,‘系统’高居在排行榜上。”



什么是系统生物学?根据胡德的定义,系统生物学是研究一个生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件下这些组分间的相互关系的学科[1]。也就是说,系统生物学不同于以往的实验生物学——仅关心个别的基因和蛋白质,它要研究所有的基因、所有的蛋白质、组分间的所有相互关系。显然,系统生物学是以整体性研究为特征的一种大科学。



系统生物学的基本工作流程有这样四个阶段。首先是对选定的某一生物系统的所有组分进行了解和确定,描绘出该系统的结构,包括基因相互作用网络和代谢途径,以及细胞内和细胞间的作用机理,以此构造出一个初步的系统模型。第二步是系统地改变被研究对象的内部组成成分(如基因突变)或外部生长条件,然后观测在这些情况下系统组分或结构所发生的相应变化,包括基因表达、蛋白质表达和相互作用、代谢途径等的变化,并把得到的有关信息进行整合。第三步是把通过实验得到的数据与根据模型预测的情况进行比较,并对初始模型进行修订。第四阶段是根据修正后的模型的预测或假设,设定和实施新的改变系统状态的实验,重复第二步和第三步,不断地通过实验数据对模型进行修订和精练。系统生物学的目标就是要得到一个理想的模型,使其理论预测能够反映出生物系统的真实性。



系统生物学的灵魂——整合



作为后基因组时代的新秀,系统生物学与基因组学、蛋白质组学等各种“组学”的不同之处在于,它是一种整合型大科学。首先,它要把系统内不同性质的构成要素(基因、mRNA、蛋白质、生物小分子等)整合在一起进行研究。系统生物学研究所的第一篇研究论文,就是整合酵母的基因组分析和蛋白质组分析,研究酵母的

代谢网络[2]。由于不同生物分子的研究难度不一样,技术发展程度不一样,目前对它们的研究水平有较大的差距。例如,基因组和基因表达方面的研究已经比较完善,而蛋白质研究就较为困难,至于涉及生物小分子的代谢组分的研究就更不成熟。因此,要真正实现这种整合还有很长的路要走。



对于多细胞生物而言,系统生物学要实现从基因到细胞、到组织、到个体的各个层次的整合。《科学》周刊系统生物学专集中一篇题为“心脏的模型化——从基因到细胞、到整个器官”的论文,很好地体现了这种整合性[3]。我们知道,系统科学的核心思想是:“整体大于部分之和”;系统特性是不同组成部分、不同层次间相互作用而“涌现”的新性质;对组成部分或低层次的分析并不能真正地预测高层次的行为。如何通过研究和整合去发现和理解涌现的系统性质,是系统生物学面临的一个带根本性的挑战。



系统生物学整合性的第三层含义是指研究思路和方法的整合。经典的分子生物学研究是一种垂直型的研究,即采用多种手段研究个别的基因和蛋白质。首先是在DNA水平上寻找特定的基因,然后通过基因突变、基因剔除等手段研究基因的功能;在基因研究的基础上,研究蛋白质的空间结构,蛋白质的修饰以及蛋白质间的相互作用等等。基因组学、蛋白质组学和其他各种“组学”则是水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种“三维”的研究。此外,系统生物学还是典型的多学科交叉研究,它需要生命科学、信息科学、数学、计算机科学等各种学科的共同参与。



系统生物学的整合性可以体现在两种不同的策略上。第一种就是胡德和系统生物学研究所采用的方式,选定一个较为简单的系统,如单细胞生物酵母,然后分析尽可能多的构成成分——基因组、转录组、蛋白质组、相互作用组,以揭示整个系统的行为。另外一种策略是吉尔曼(A. G. Gilman)领导的“信号转导联军”采用的,以一个较为复杂的系统(G蛋白介导的和与其相关的细胞信号转导系统)为研究对象,采用尽可能多的研究手段去进行分析(详细介绍见本刊2002年第2期第36页)。



系统生物学的基础——信息



在前分子生物学时代,生物学家把生命视为具有特殊“活力”的有机体,遵循着无机界不存在的法则进行生命活动。在分子生物学时代,研究者们把生命视为一架精密的机器,由基因和蛋白质根据物理、化学的规律来运转。在后基因组

时代,像胡德这种类型的科学家,把生命视为信息的载体,一切特性都可以从信息的流动中得到实现。



胡德提出,应该把生物学视为一门信息科学[1]。这个观点包含有三层意思。首先,生物学研究的核心——基因组,是数字化的(digital)。生物学与所有其他学科,如物理学、化学、地理学,是完全不一样的科学,因为生物学以外的学科都只能通过类比的方式(analog)进行分析。既然生物学研究的核心是数字化的,因此生物学可以被完全破译。从理论上说,我们对生物学的把握应该超过其他任何一门学科。其次,生命的数字化核心表现为两大类型的信息,第一类信息是指编码蛋白质的基因,第二类信息是指控制基因行为的调控网络。显然,由一段DNA序列组成的基因是数字化的。值得强调的是,基因调控网络的信息从本质上说也是数字化的,因为控制基因表达的转录因子结合位点也是核苷酸序列。生物学是信息科学的第三层意思是,生物信息是有等级次序的,而且沿着不同的层次流动。一般说来,生物信息以这样的方向进行流动:DNA→mRNA→蛋白质→蛋白质相互作用网络→细胞→器官→个体→群体。这里要注意的是,每个层次信息都对理解生命系统的运行提供有用的视角。因此,系统生物学的重要任务就是要尽可能地获得每个层次的信息并将它们进行整合[1]。



根据系统论的观点,构成系统的关键不是其组成的物质,而是组成部分的相互作用或部分之间的关系。这些相互作用或者关系,从本质上说就是信息。换一个角度来说,生命是远离平衡态的开放系统,为了维持其有序性,生命系统必须不断地与外部环境交换能量,以抵消其熵增过程。奥地利物理学家薛定谔早在1940年代发表的著作《生命是什么?》中就已指出,生命以“负熵流”为食,而“负熵”其实就是信息的另一种表示方法。因此,我们可以这样说,生命系统是一个信息流的过程,系统生物学就是要研究并揭示这种信息的运行规律。



系统生物学的钥匙——干涉



系统生物学一方面要了解生物系统的结构组成,另一方面是要揭示系统的行为方式。相比之下,后一个任务更为重要。也就是说,系统生物学研究的并非一种静态的结构,而是要在人为控制的状态下,揭示出特定的生命系统在不同的条件下和不同的时间里具有什么样的动力学特征。



凡是实验科学都有这样一种特征:人为地设定某种或某些条件去作用于被实验的对象,从而达到实验的目的。这种对实验对象的人为影响就是干涉(perturbation)。传统生物学采用非干涉方法

如形态观察或分类研究生物体。20世纪形成的分子生物学等实验生物学的特点就是,科学家可以在实验室内利用各种手段干涉生物学材料,如通过诱导基因突变或修饰蛋白质,由此研究其性质和功能。系统生物学同样也是一门实验性科学,也离不开干涉这一重要的工具。



系统生物学中的干涉有这样一些特点。首先,这些干涉应该是有系统性的。例如人为诱导基因突变,过去大多是随机的;而在进行系统生物学研究时,应该采用的是定向的突变技术。上面所提到的对酵母的系统生物学研究,胡德等人就是把已知的参与果糖代谢的9个基因逐一进行突变,研究在每一个基因突变下的系统变化[2]。果蝇从受精开始到形成成熟个体一共有66个典型的发育阶段,不久前科学家利用基因芯片技术,对每一个发育阶段的基因表达谱进行了系统的研究[4]。这也是一类系统性的干涉方式。其次,系统生物学需要高通量的干涉能力,如高通量的遗传变异。现有技术已经能做到在短时间内,把酵母的全部6000多个基因逐一进行突变。对于较为复杂的多细胞生物,可以通过RNA干涉新技术来实现大规模的基因定向突变。随着研究技术的发展,一定还会有许多新的干涉技术应用于系统生物学。



需要提请人们注意的是,以测定基因组全序列或全部蛋白质组成的基因组研究或蛋白质组研究等“规模型大科学”,并不属于经典的实验科学。这类工作中并不需要干涉,其目标只是把系统的全部元素测定清楚,以便得到一个含有所有信息的数据库。胡德把这种类型的研究称为“发现的科学”(discovery science),而把上述依赖于干涉的实验科学称为“假设驱动的科学”(hypothesis-driven science),因为选择干涉就是在做出假设。系统生物学不同于一般的实验生物学就在于,它既需要“发现的科学”,也需要“假设驱动的科学”。首先要选择一种条件(干涉),然后利用“发现的科学”的方法,对系统在该条件下的所有元素进行测定和分析;在此基础上做出新的假设,然后再利用“发现的科学”研究手段进行新研究。这两种不同研究策略和方法的互动和整合,是系统生物学成功的保证。



笔者还要再强调一点,在注重这两类研究手段的同时,不应该忽略系统生物学的另一个特点——对理论的依赖和建立模型的需求。在本文一开始介绍系统生物学的概况时,特别指出过,系统生物学的理想就是要得到一个尽可能接近真正生物系统的理论模型;建模过程贯穿在系统生物学研究的每一个阶段。离开了数学和计算机科学,就不会有系统生物学。也许正是基于

这一考虑,科学家把系统生物学分为“湿”的实验部分(实验室内的研究)和“干”的实验部分(计算机模拟和理论分析)[5]。“湿”、“干”实验的完美整合才是真正的系统生物学。



从某种意义上说,系统生物学在中国有很好的基础。我们的传统医学就是把人体视为一个系统,通过测定和改变系统的输入和输出来调节系统的状态。传统科学的缺点在于,它只能进行“黑箱操作”,不能解释系统的内部组成成分和动力学过程。而系统生物学则把生物系统化为“白箱”,不仅要了解系统的结构和功能,而且还要揭示出系统内部各组成成分的相互作用和运行规律。



[1] Hood L. J Proteome Res, 2002 (published on web)



[2] Ideker T, et al. Science, 2002, 292:929



[3] Noble D. Science, 2002, 295:1678



[4] Arbeitman M N. Science, 2002, 297:2270



[5] Kitano H. Science, 2002, 295:1662

●系统生物学将在基因组序列的基础上完成由生命密码到生命过程的研究,这是一个逐步整合的过程,可能需要一个世纪或更长时间,因此,常把系统生物学称为21世纪的生物学。

●长期以来,生物学研究是在规模较小的实验室进行的,系统生物学将在更大范围和更高层次进行学科交叉和国际合作,如人类基因组计划、人类单体型图谱计划、人类表观基因组学计划等。

●系统生物学使生命科学由描述式的科学转变为定量描述和预测的科学,已在预测医学、预防医学和个性化医学中得到应用。



20世纪生物学经历了由宏观到微观的发展过程,由形态、表型的描述逐步分解、细化到生物体的各种分子及其功能的研究。1953年沃森和克里克提出的DNA双螺旋模型是生物学进入分子生物学时代的标志,70年代出现的基因工程技术极大地加速和扩展了分子生物学的发展。1990年启动的人类基因组计划是生命科学史上第一个大科学工程,开始了对生物全面、系统研究的探索,2003年已完成了人和各种模式生物体基因组的测序,第一次揭示了人类的生命密码。人类基因组计划和随后发展的各种组学技术把生物学带入了系统科学的时代。

系统生物学是在细胞、组织、器官和生物体整体水平研究结构和功能各异的各种分子及其相互作用,并通过计算生物学来定量描述和预测生物功能、表型和行为。系统生物学将在基因组序列的基础上完成由生命密码到生命过程的研究,这是一个逐步整合的过程,由生物体内各种分子的鉴别及其相互作用的研究到途径、网络、模块,最终完成整个生命活动的路线图。这个过程可能需要一个世纪或更长时间,因此常把系统生物学

称为21世纪的生物学。

和以往系统科学研究复杂系统相比,系统生物学的研究将更为复杂和困难。非生物的复杂系统一般由相对简单的元件组合产生复杂的功能和行为,而生物体是由大量结构和功能不同的元件组成的复杂系统,并由这些元件选择性和非线性的相互作用产生复杂的功能和行为。因此,我们要建立多层次的组学技术平台,研究和鉴别生物体内所有分子,研究其功能和相互作用,在各种技术平台产生的大量数据的基础上,通过计算生物学用数学语言定量描述和预测生物学功能和生物体表型和行为。生物体的复杂性和大量过程的非线性动力学特征对计算科学也是一个新的挑战。据预测,系统生物学研究对计算机的要求高达1000万亿次浮点运算速度。

系统生物学也将使生物学研究发生结构性的变化。长期以来,生物学研究是在规模较小的实验室进行的,系统生物学研究将由各种组学组成的大科学工程和小型生物学实验室有机结合实施的。系统生物学研究也将在更大范围和更高层次进行学科交叉和国际合作,如人类基因组计划、人类单体型图谱计划、人类表观基因组学计划等。

系统生物学的主要技术平台为基因组学、转录组学、蛋白质组学、代谢组学、相互作用组学和表型组学等。基因组学、转录组学、蛋白质组学、代谢组学分别在DNA、mRNA、蛋白质和代谢产物水平检测和鉴别各种分子并研究其功能。相互作用组学系统研究各种分子间的相互作用,发现和鉴别分子机器、途径和网络,构建类似集成电路的生物学模块,并在研究模块的相互作用基础上绘制生物体的相互作用图谱。表型组学是生物体基因型和表型的桥梁,目前还仅在细胞水平开展表型组学研究。

计算生物学可分为知识发现和模拟分析两部分。知识发现也称为数据开采,是从系统生物学各个组学实验平台产生的大量数据和信息中发现隐含在里面的规律并形成假设。模拟分析是用计算机验证所形成的假设,并对体内、外的生物学实验进行预测,最终形成可用于各种生物学研究和预测的虚拟系统。

系统生物学研究在破译生命密码和应用方面都取得了较大进展。啤酒酵母是人类基因组计划中的一种模式生物,在其基因组中预测有6243个编码序列,分别用串联亲、标签(TAP)和绿色荧光蛋白标签进行标记进行表达的定量分析和蛋白质定位研究,结果表明有4251个TAP标记的基因在对数生长期表达;并对4156个绿色荧光标证的蛋白进行亚细胞定位研究,分别定位于22个不同的亚细胞区域。用酵母双杂交技术研究了酵母系统2039个蛋白质的相

互作用,鉴别了一个由1548个蛋白质参与、包括2358个相互作用的巨型网络和几个较小的网络。另一个模式生物果蝇的蛋白质相互作用草图也已绘制。模式生物的系统生物学研究将推动更复杂系统的研究,加速由生命密码到生命的研究进程。

系统生物学使生命科学由描述式的科学转变为定量描述和预测的科学,已在预测医学、预防医学和个性化医学中得到应用,如用代谢组学的生物指纹预测冠心病人的危险程度和肿瘤的诊断和治疗过程的监控;用基因多态性图谱预测病人对药物的应答,包括毒副作用和疗效。表型组学的细胞芯片和代谢组学的生物指纹将广泛用于新药的发现和开发,使新药的发现过程由高通量逐步发展为高内涵(Highcontent),以降低居高不下的新药研发投入。为此,世界十大制药企业中的六家组成了以系统生物学技术为基础的新药研发系统的联合体,以改进新药研发的投入产出。通过系统生物学的研究,设计和重构植物和微生物新品种,以提升农业和工业生物技术产业,开拓能源生物技术、材料生物技术和环境生物技术等新产业也取得较快进展。美国能源部2002年启动了21世纪系统生物学技术平台,以推动环境生物技术和能源生物技术产业的发展。系统生物学将不仅推动生命科学和生物技术的发展,而且对整个国民经济、社会和人类本身产生重大和深远的影响。



(本文作者为:中国工程院院士、上海系统生物学研究所所长)



上海系统生物学研究所

上海交通大学与中国科学院上海生命科学研究院12月29日启动全面合作计划。作为合作的一项重要内容,系统生物学研究所同日挂牌成立。

根据合作协议,双方继续共建上海交大生命科学技术学院,互聘兼职教授、兼职研究员。上海交大生命科学技术学院、药学院、医学院和农学院根据教学和科研需要邀请生科院优秀研究人员来校讲课,生科院则为交大学生听课和实习提供方便。上海交大将发挥多学科的优势,向生科院开放相关研究生课程,并推荐优秀大学本科生报考生科院研究生。双方还将在首先植物科学和多学科交叉研究两个领域开展科研合作。

系统生物学研究所是一个集多种学科一体的新型研究机构。它将选择生科院研究所和交大院系的相关研究单元成为其“卫星实验室”,并向海内外公开招聘国际一流的学术带头人,组建“核心实验室”。通过把生物学、工程学、数学、物理学和计算机科学等多学科的研究人员有机地结合在一起,以大规模基因功能鉴定、药物创新代谢工程和生物资源高效利用

为突破口,建设一个基础与应用研究浑然一体的国际一流的生命科学研究机构,成为支持上海乃至全国生物技术产业发展和传统产业技术进步的重要基地。



专家简介:杨胜利 生物技术专家。江苏太仓人。中国工程院院士,研究员,博士生导师,中心学术委员会主任和学位评定委员会委员,研究员任职资格评审委员会主任。1962年毕业于上海华东化工学院有机工业系、抗生素专业;1962年9月到中国科学院上海药物研究所工作,1979年赴美国加州大学博士生研究工作;1992-1996年担任中国科学院上海生物工程研究中心主任、党委书记。他还受聘为中科院生物技术专家委员会主任委员,中科院新药专家委员会副主任委员、国家“863”生物技术领域专家委员会委员、上海市科技进步专家咨询委员等。

杨胜利研究员长期从事于基因工程在酶、发酵和制药工业中应用研究和开发,他主持的青酶素酰化酶基因工程研究中,建立了基因克隆、定位表达系统,并采用DNA体内重组提高质粒的稳定性,优化了宿主和表达的条件,构建了高稳定性、高表达的基因工程菌,主要技术指标优于国际同类基因工程菌。他还在分子药理学、微生物血红蛋白和蛇毒基因工程、蛋白酶蛋白质工程、分子伴侣等方面进行了开拓性的创新研究,取得了一系列成果。他曾荣获中国科学院科技进步一等奖,中国科学院第二届亿利达科技奖。在国内外重要科技刊物上发表论文70余篇;培养博士研究生19名,硕士研究生14名。从1991年起享受国务院特殊津贴,1993年享受上海市特殊津贴。

1997年当选为中国工程院院士。





相关主题
文本预览
相关文档 最新文档