生物信息学现状与展望

  • 格式:doc
  • 大小:154.00 KB
  • 文档页数:5

下载文档原格式

  / 7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

研究生课程考试卷

学号、姓名: j20112001 苗天锦

年级、专业:2011生物化学与分子生物学

培养层次:硕士

课程名称:生物信息学

授课学时学分: 32学时 2学分

考试成绩:

授课或主讲教师签字:

生物信息学现状与展望

摘要:生物信息学是一门新兴学科,起步于20世纪90年代,至今已进入"后基因组时代",本文对生物信息学的产生背景及其研究现状等方面进行了综述,并展望生物信息学的发展前景。生物信息学的发展在国内、外基本上都处在起步阶段。

关键词:生物信息学;生物信息学背景;发展前景

一、生物信息学概述

1.生物信息学发展历史

随着生物科学技术的迅猛发展,生物信息数据资源的增长呈现爆炸之势,同时计算机运算能力的提高和国际互联网络的发展使得对大规模数据的贮存、处理和传输成为可能,为了快捷方便地对已知生物学信息进行科学的组织、有效的管理和进一步分析利用,一门由生命科学和信息科学等多学科相结合特别是由分子生物学与计算机信息处理技术紧密结合而形成的交叉学科——生物信息学(Bioinformatics)应运而生,并大大推动了相关研究的开展, 被誉为“解读生命天书的慧眼”【1】。

研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:基因是以生物成分存在。1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构。1953年James Watson 和FrancisCrick在Nature杂志上推测出DNA 的三维结构(双螺旋)。Kornberg于1956年从大肠杆菌(E.coli)中分离出DNA 聚合酶I(DNA polymerase I),能使4种dNTP连接成DNA。Meselson与Stahl (1958)用实验方法证明了DNA复制是一种半保留复制。Crick于1954年提出了遗传信息传递的规律,DNA是合成RNA的模板,RNA又是合成蛋白质的模板,称之为中心法则(Central dogma),这一中心法则对以后分子生物学和生物信息学的发展都起到了极其重要的指导作用。经过Nirenberg和Matthai(1963)的努力研究,编码20氨基酸的遗传密码得到了破译。限制性内切酶的发现和重组DNA的克隆(clone)奠定了基因工程的技术基础【2】。自1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划终于完成了工作草图,预示着完成人类基因组计划已经指日可待。生物信息学已成为整个生命科学发展的重要组成部分,成为生命科学研究的前沿。

2.生物信息学研究方向

2.1 序列比对

序列比对是指为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。序列比对是生物信息学的重要研究方向。生物信息学的研究重点主要体现在基因组学和蛋白质学两方面,具体地说就是从核酸和蛋白质序列出发, 分析序列中表达结构和功能的生物信息。生物信息学的基本任务是对各种生物分析序列进行分析, 也就是研究新的计算机方法, 从大量的序列信息中获取基因结构、功能和进化等知识。而在序列分析中, 将未知序列同已知序列进行相似性比较是一种强有力的研究手段,从序列的片段测定, 拼接, 基因的表达分析, 到RNA和蛋白质的结构功能预测。物种亲缘树的构建都需要进行生物分子序列的相似性比较。生物信息学中的序列比对算法的研究具有非常重要的理论意义和实践意义。【3】

2.2 分子进化和比较基因组学

生物进化过程中生物大分子的演变,包括前生命物质的演变;蛋白质分子和核酸分子的演变以及细胞器和遗传机构(例如遗传密码)的演变。分子进化的研究可以为生物进化过程提供佐证,为深入研究进化机制提供重要依据。近年来较多模式生物基因组测序任务的完成,人们可从整个基因组的角度来研究分子进化。在匹配不同种族的基因时,一般须处理三种情况:Orthologous:不同种族,相同功能的基因;Paralogous:相同种族,不同功能的基因;Xenologs:有机体间采用其他方式传递的基因,如被病毒注入的基因。这一领域常采用的方法是构造进化树,通过基于特征(即DNA序列或蛋白质中的氨基酸的碱基的特定位置)和基于距离(对齐的分数)的方法和一些传统的聚类方法(如UPGMA)来实现【4】。

2.3 蛋白质信息学

目前对蛋白质组研究的技术手段很多,常用的主要有双向凝胶电泳和测序质谱技术等。与它们相比,生物信息学在蛋白质组学的研究中将起着特殊的重要作用。因为蛋白质组研究提供的数据的数量之大在生物学上是史无前例的。当前生物信息学已经不仅是高效地进行对蛋白质数据的分析,而且可以对已知的或新的基因产物进行全面的功能分析。对蛋白质的分析研究产生了蛋白质组信息学。蛋白质组信息学研究包括蛋白质序列对齐、序列比较分析、蛋白质结构-功能关系的研究、点突变的设计及家族鉴定,蛋白质空间结构预测、建模和分子设计以及蛋白质功能预测等。在蛋白质的结构预测方面,由于蛋白质的生物学功能在很大程度上依赖于其空间结构,因而进行蛋白质的结构预测对了解未知蛋白生物学功能具有重要意义。而对蛋白质结构的预测离不开由许许多多的蛋白质数据形成的各种蛋白质数据库。蛋白质由氨基酸组成,它的结构层次包括一级结构、二级结构、三级结构和四级结构等【5】。蛋白质空间结构预测就是利用已知的一级序列来构建其立体结构模型。目前对单一序列的二级结构预测的准确率较高,通过多序列比对可以显著提高预测的效能,如PHDsec程序。对蛋白质三级结构的预测由于

蛋白质折叠过程的复杂性变得更难,目前在利用生物信息学对蛋白质三维空间结构预测方面的主要方法有同源模建、折叠识别和从头预测3种。一般先将目标蛋白与蛋白质结构数据库中的已知结构相比较,如果两者序列同源性较高,则可用同源模建方法对目标蛋白质的结构进行预测。同源模建方法在蛋白质结构预测及药物设计中起着重要的作用【6】。

2.4 生物系统的建模和仿真

随着大规模实验技术的发展和数据累积,从全局和系统水平研究和分析生物学系统,揭示其发展规律已经成为后基因组时代的另外一个研究热点-系统生物学。目前来看,其研究内容包括生物系统的模拟,系统稳定性分析,系统鲁棒性分析等方面。以SBML为代表的建模语言在迅速发展之中,以布尔网络、微分方程、随机过程、离散动态事件系统等方法在系统分析中已经得到应用。很多模型的建立借鉴了电路和其它物理系统建模的方法,很多研究试图从信息流、熵和能量流等宏观分析思想来解决系统的复杂性问题。当然,建立生物系统的理论模型还需要很长时间的努力,现在实验观测数据虽然在海量增加,但是生物系统的模型辨识所需要的数据远远超过了目前数据的产出能力【7】。例如,对于时间序列的芯片数据,采样点的数量还不足以使用传统的时间序列建模方法,巨大的实验代价是目前系统建模主要困难。系统描述和建模方法也需要开创性的发展【8】。

3.生物信息学发展前景

生物学是生物信息学的核心和灵魂,数学与计算机技术则是它的基本工具。这一点必须着重指出。预测生物信息学的未来主要就是要预测他对生物学的发展将带来什么样的根本性的突破。信息学的商业价值十分显著。国外很多大学,研究机构,软件公司甚至政府机构纷纷成立各种生物信息机构,建立自立的生物信息集成系统,研制这方面的软件,重金招聘人才,期望从中获取更多的生物信息和数据加以研究和利用,缩短药物开发周期,抢注基因专利,获取更大利润【9】。国内一些科研单位已经开始摸索着从事这方面的工作。清华大学在基因调控及基因功能分析、蛋白质二级结构预测方面,天津大学物理系和中科院理论物理所在相关算法方面,中科院生物物理所在基因组大规模测序数据的组装和标识方面,北京大学化学学院物理化学研究所在蛋白质分子设计方面,华大基因组研究中心(中科院遗传所人类基因组研究中心)在大规模测序数据处理自动化流程体系及数据库系统建立方面均已展开相关研究。随着生物信息学在国内受到越来越多人的重视和关注,我们有理由相信生物信息学会在未来迅速发展壮大【10,11】。

参考文献:

【1】生命科学发展战略调研小组.迎接生命科学世纪的挑战.世界科技研究与发