生物信息学的现状与展望
- 格式:doc
- 大小:40.00 KB
- 文档页数:8
分子生物学的现况和今后的发展分子生物学的现况和今后的发展唐宇轩MSN摘要分子生物学是利用分子生物学的技术和方法研究人体内源性或外源性生物大分子和大分子体系的存在、结构或表达调控的变化,从而为疾病的预防、预测、诊断、治疗和转归提供信息和决策依据的一门学科。
近些年其发展迅速,并渗透到了多门学科的研究领域。
分子生物学的发展前景是相当可观的。
关键字分子生物学现状及发展基因治疗蛋白质工程分子生物学的发展及其在临床医学上的应用已经走过了半个多世纪的路程,随着国际交往的增加,近年来我国分子生物学技术有了突飞猛进的发展。
目前在医学院校和省级以上的医院均建立了临床分子生物学实验室。
随着分子生物学的兴起和向各方面的渗透,生物科学的各分支学科也经历着兴衰更替的变化。
从目前的发展状况来看,分子生物学仍将保持带头分支学科的地位,分子生物学带动了整个生物科学的全面发展。
就分子生物学现状来看,现代生物科学是生物科学与众多学科之间相互交叉、渗透和相互促进的结果。
例如:分子生物学渗入到发育生物学产生了分子发育生物学(molecdar developmental biology), 生活周期短的一些动植物如线虫、果蝇、拟南芥已成为发育生物学的重点研究对象,它们的发育过程很多已从分子水平得到了解。
分子生物学与细胞生物学关系密切,已形成一门新的分子细胞生物学(molecdar cell biology)。
许多细胞生物学问题如细胞分裂、细胞骨架(cytoskeleton)、细胞因子(cytoldne)的研究都进入了分子水平。
免疫学与分子生物学结合,产生了分子免疫学(molecular immunology)。
病理学与分子生物学结合,产生了分子病理学(molecular pathology〉,其中病毒学与分子生物学结合,就是分子病毒学(molecular virology〉其他相关科学推动了生物科学对生命现象和本质的研究不断深入和扩大,生物科学的发展也为其他相关科学提出了许多新的研究课题,开辟了许多新的研究领域。
浅谈生物信息学一、生物信息学产生的背景有人说,基于序列的生物学时代已经到来,尽管对“序列生物学”这一提法可能有所争议,但是今日像潮水般涌现的序列信息却是无可争辩的事实。
自从1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。
迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。
至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划,经过美、英、日、法、德和中国科学家的艰苦努力,终于完成了工作草图,这是人类科学世上又一个里程碑式的事件。
它预示着完成人类基因组计划已经指日可待。
截止目前为止,仅登录在美国GenBank数据库中的DNA序列总量已超过70亿碱基对。
在人类基因组计划进行过程中所积累起来的技术和经验,使得其它生物基因组的测序工作可以完成得更快捷。
可以预计,今后DNA序列数据的增长将更为惊人。
生物学数据的积累并不仅仅表现在DNA序列方面,与其同步的还有蛋白质的一级结构,即氨基酸序列的增长。
此外,迄今为止,已有一万多种蛋白质的空间结构以不同的分辨率被测定。
基于cDNA 序列测序所建立起来的EST数据库其纪录已达数百万条。
在这些数据基础上派生、整理出来的数据库已达500余个。
这一切构成了一个生物学数据的海洋。
可以打一个比方来说明这些数据的规模。
有人估计,人类(包括已经去世的和仍然在世的)所说过的话的信息总量约为5唉字节(1唉字节等于1018字节)。
而如今生物学数据信息总量已接近甚至超过此数量级。
这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。
数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从中挖掘它们。
与正在以指数方式增长的生物学数据相比,人类相关知识的增长(粗略地用每年发表的生物、医学论文数来代表)却十分缓慢。
一方面是巨量的数据;另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求,这些新知识将帮助人们改善其生存环境和提高生活质量。
合成生物学的前景展望目录:前言科学定义学科特征发展现状前景展望结语前言当今方兴未艾的合成生物学,是一门建立在生物信息学、DNA化学合成技术、遗传学和系统生物学之上的交叉学科。
近十年来,该学科在病毒全基因组合成、标准化遗传回路和最小基因组研究中取得了巨大的突破,也展现了其在生物科学应用中扮演的重要角色。
本文将通过介绍与分析合成生物学的相关信息展望合成生物学的发展前景。
科学定义目前合成生物学研究涵盖范围广泛,对其定义的表述不尽相同:合成生物学领域知名的网站(http://syntheticbiology. org)这样描述该领域的主要研究内容:“设计和构建新型生物学部件或系统以及对自然界的已有生物系统进行重新设计,并加以应用。
”2010年12月,美国13位知名专家共同完成了一份名为《新的方向》的研究报告,专门探讨合成生物学问题,文中将合成生物学的研究目标定位为:“将标准化的工程技术应用于生物学,以此创造出新型或具有特定功能的生命体或生物系统,以满足无尽的需求。
”合成生物学组织(Synthetic Biology Community)网站上公布的合成生物学的定义则强调合成生物学的两条技术路线:(1)新的生物零件、组件和系统的设计与建造;(2)对现有的、天然的生物系统的重新设计。
综合起来,合成生物学可被理解为基于系统生物学的遗传工程从基因片段、人工碱基DNA子、基因调控网络与信号传导路径到细胞的人工设计与合成,类似于现代集成型建筑工程,将工程学原理与方法应用于遗传工程与细胞工程等生物技术领域,合成生物学、计算生物学与化学生物学一同构成系统生物技术的方法基础。
学科特征1.多学科交叉性:作为一个以多学科为基础的综合性交叉研究领域,对于生物学家,合成生物学打开了一扇探索生命奥秘的大门;工程学家更关注的是该如何将实验流程和各类生物学元件进行模块化、标准化,以及如何有效地控制多个元件的相互协调;而如何将标准化的生物学模块进行数字化、定量化评价,更好地为人造“软件”进行模拟计算从而指导生物系统的构建,则是计算科学在生命科学中应用的突出体现;化学家和药物学家则更愿意将合成生物学看作多种用途的新型工具,用于高效地生产新型燃料和药物。
生命科学的发展现状与未来趋势分析从古至今,生命科学一直是人类关注的焦点之一。
随着科学技术的不断进步,生命科学在过去几十年中取得了巨大的发展,为人类社会的进步和繁荣做出了重要贡献。
本文将分析当前生命科学的发展现状,并探讨未来的趋势和挑战。
首先,我们来看生命科学目前的发展现状。
生命科学是一门涉及生物学、生物化学、遗传学、微生物学等多个学科的综合科学,旨在揭示生命的起源、发展和运行规律。
在过去几十年里,生命科学取得了令人瞩目的成就。
例如,人类基因组计划的完成为人类基因研究奠定了基础,深度了解了人类基因组的组成和功能。
生物技术的迅猛发展使得我们能够对疾病的发生机制有更深入的了解,并开发出了许多新的治疗方法和药物。
另外,生物信息学的进步使得我们能够处理和分析大规模的生物数据,有助于揭示生命的复杂性和多样性。
然而,尽管取得了很多成就,但生命科学仍面临着许多挑战。
首先,生命科学的研究对象之一是复杂的生物系统,而生物系统的研究需要针对不同层面的层级进行多尺度的研究,这对科学家来说是一个巨大的挑战。
其次,由于生物学的交叉性和综合性,生命科学研究需要来自不同学科的专业人才,而当前的科学教育和培养体系仍存在不足。
此外,伦理和道德问题也是生命科学面临的重要挑战,如基因编辑技术的应用和遗传信息的隐私保护。
对于生命科学未来的趋势,我们可以预见以下几个方面的发展。
首先,人工智能的快速发展将为生命科学研究提供更多工具和方法,使得大规模数据的分析和模拟成为可能。
其次,合成生物学的兴起将使得我们能够设计和构建具有特定功能和性能的生物系统,这将推动生物医药、能源和环境方面的研究和应用。
此外,纳米技术和生物传感器的进步也将为生物医学的检测、监测和治疗提供更多的可能性。
另外,生态和环境保护问题将成为生命科学研究的重要方向,帮助我们深入理解和掌握地球生态系统的运行规律。
面对未来的挑战和趋势,生命科学研究需要加强国际合作和跨学科交流,共同解决共性和关键科学问题。
论21世纪生物技术的发展趋势现代生物科学的新进展,许多是在采用先进的技术和手段的条件下取得的,这些新技术有:DNA重组技术,DNA合成技术,快速DNA序列测定技术,蛋白质人工合成技术,蛋白质序列测定技术,核酸分子杂交技术,限制性内切酶片段长度多样性技术,反义RNA技术,聚合酶链反应扩增技术,单克隆抗体技术,脉冲电泳技术,磁力共振技术,扫描隧道和原子力显微技术,同步辐射技术,电子计算机技术,等等。
可见,研究技术和手段的革新是当代生物科学的另一个显著特点和发展趋势。
分开来看,生物科学技术拥有众多分支学科技术,现代生物学研究的热点领域有:基因组学、生物信息学、抗体工程技术、组织工程学、干细胞研究、药物分子设计以及行为科学、生态学等。
其中重要领域平台的发展现状和趋势如下:1、基因组学现状与发展趋势人类基因组计划的实施将极大地促进生命科学领域一系列相关科学的发展,阐明基因的结构与功能关系,细胞的发育、生长、分化的分子机理等。
这意味着生命科学从寻找生物学上个别重要的基因发展到整个基因组功能活动规律的研究,实现了从局部到整体的转变。
目前发展的最新趋势就是将最近几年发展起来的许多新技术(如高通量扫描,生物芯片,高密度单核苷酸多态性(SNP)遗传图谱,生物信息学等)与知识融入到分子医学、药理学、毒理学等诸多领域,并运用这些技术与知识大规模系统地从整个基因组层面去研究不同个体的基因差异与药效的关联,侧重于了解有重要功能意义和控制药物代谢与处置的多态性基因,以求探明药理学作用的分子机制以及各种疾病致病的遗传学机理,从而最终达到精确指导开发的目的`。
由于新一代遗传标记物(即单核苷酸多态性)的大规模发现,以及将其迅速应用于群体流行病遗传学,也可大大推动多基因遗传病和常见病(往往是多基因病)机理的基础研究,其研究结果又可以为制药工业提供新的药靶。
2、生物信息学现状与发展趋势生物信息学包括基因组学、结构生物信息学、功能生物信息学和蛋白质组信息学,核心是基因组学,包括基因组信息的获取、处理、存储、分配和解释,首要任务之一是发现新基因和新的功能;结构生物信息学主要研究基因产物即蛋白质和多肽的信息结构;功能生物信息学主要指细胞反应的数据库,存储有各种刺激后细胞基因表达改变的功能信息,提供细胞类型、能够表达的基因及其诱导剂等方面的咨询;蛋白质组信息学主要涉及蛋白质数据库的建立,相关软件的开发和应用,及蛋白质组成员序列、结构、功能、定位分类和蛋白质连锁图的构建,及蛋白质功能结构预测等。
生物信息学邱萌琳11216108一、定义与简介生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。
它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。
二、经历阶段前基因组时代(20世纪90年代前)这一阶段主要是各种序列比较算法的建立、生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等。
基因组时代(20世纪90年代后至2001年)这一阶段主要是大规模的基因组测序,基因识别和发现,网络数据库系统地建立和交互界面工具的开发等。
后基因组时代(2001至今)随着人类基因组测序工作的完成,各种模式生物基因组测序的完成,生物科学的发展已经进入了后基因组时代,基因组学研究的重心由基因组的结构向基因的功能转移。
这种转移的一个重要标志是产生了功能基因组学,而基因组学的前期工作相应地被称为结构基因组学。
三、生物信息学发展简介生物信息学是建立在分子生物学的基础上的,因此,要了解生物信息学,就必须先对分子生物学的发展有一个简单的了解。
研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:遗传因子是以生物成分存在,1871年Miescher 从死的白细胞核中分离出脱氧核糖核酸(DNA),在Avery和McCarty于1944年证明了DNA是生命器官的遗传物质以前,人们仍然认为染色体蛋白质携带基因,而DNA是一个次要的角色。
1944年Chargaff发现了著名的Chargaff规律,即DNA中鸟嘌呤的量与胞嘧定的量总是相等,腺嘌呤与胸腺嘧啶的量相等。
与此同时,Wilkins与Franklin用X射线衍射技术测定了DNA纤维的结构。
1953年James Watson 和FrancisCrick在Nature杂志上推测出DNA的三维结构(双螺旋)。
我国生物技术产业发展现状与前景第一章绪论1.1引言生物技术是现代生物学发展及其与相关学科融和的产物,其核心是以DNA重组技术为中心的基因工程,还包括微生物工程、生化工程、细胞工程及生物制品等领域。
生物技术,可视为一种运用生物体来制造产品的科学与技术,虽然生物技术这项专有名词是在七十年代才开始正式出现,但生物技术应用却可追溯至远古时代。
例如,神农氏尝百草是中国历史上利用植物在医药应用上的最早记载,足见生物技术观念与应用早已存在人类日常生活之中[1]。
现如今,生物技术基础研究不断取得新的突破,生物技术生产发展快速,涉足领域不断深入。
生物技术研发生物技术企业的发展也取得重要成果。
而生物技术的发展也仅局限于几方面。
所以我国的生物技术企业的发展越来越规模化,也越来越需要更多的专业人员去研究开发生物技术的应用。
以此同时,我国生物技术行业与国际水平的差距也有了很大的差异:自主知识产权过少,竞争能力有限;投入严重不足,研究开发能力有限;产业化人才缺乏,研发与产业化脱节等等。
虽然我国目前尚没有全国性统管生物技术研究开发及产业化的组织管理机构,缺乏全局性的战略部署。
但在整体的发展上来说,进行战略布局调整,形成产业聚集区;要充分利用和合理保护我国丰富的生物资源;使生物技术的发展更加具有规模化。
生物技术的发展可以划分为三个不同的阶段:传统生物技术、近代生物技术、现代生物技术。
传统生物技术的技术特征是酿造技术,近代生物技术的技术特征是微生物发酵技术,现代生物技术的技术特征就是以基因工程为首要标志。
本文所说的生物技术,是指现代生物技术,也可称之为生物工程。
现代生物技术在70年代开始突起,近些年来发展极为神速。
它与微电子技术、新材料技术和新能源技术并列为影响未来国计民生的四大科学技术支柱,被认为是21世纪世界知识经济的核心。
第二章我国生物技术产业发展现状经过近20年的发展,我国生物技术产业取得了快速发展,为经济建设和社会发展做出了重要贡献,总体水平已经在发展中国家处于领先地位。
一级学科生物学摘要:1.生物学概述2.生物学分支及其研究领域3.生物学在我国的发展现状与重要性4.学习生物学的建议和方法5.生物学相关职业及前景展望正文:生物学是研究生命现象和生命活动规律的科学,涵盖了广泛的领域,包括分子生物学、细胞生物学、生态学、遗传学、生物信息学等。
在当今社会,生物学在科学技术的发展中发挥着越来越重要的作用,与人类生活息息相关。
一级学科生物学下分为多个二级学科,每个二级学科都有其特定的研究领域。
例如,分子生物学研究生物大分子的结构与功能,细胞生物学探讨细胞的生命活动规律,生态学研究生物与环境的关系,遗传学关注遗传信息在生物体内的传递与变异,生物信息学则致力于解析生物大数据。
这些领域相互交叉,共同推动生物学的发展。
在我国,生物学研究取得了世界领先的成果,为国家的科技创新、经济发展和社会进步做出了巨大贡献。
在国家战略层面,生物学被列为优先发展的学科,得到了充分的重视和支持。
近年来,我国在基因编辑、细胞疗法、生物制药等领域取得了突破性进展,展示了强大的科研实力。
对于有志于学习生物学的学生,以下几点建议可供参考:1.扎实的基础知识:学习生物学需要具备扎实的数学、物理、化学等基础知识,为后续专业课程的学习奠定基础。
2.拓宽研究视野:阅读生物学领域的经典教材、研究论文,关注国际前沿动态,培养跨学科思维。
3.实践操作能力:参加实验课程,掌握基本的实验技能,培养独立设计和开展实验的能力。
4.团队协作与沟通能力:生物学研究往往需要多学科团队的协作,学会与他人合作、分享研究成果。
生物学相关职业前景广阔,包括但不限于科研人员、教师、医生、生物技术企业工程师等。
随着生物科技的飞速发展,生物学专业人才在各个领域的需求将持续增长。
生物统计学研究的现状与未来方向生物统计学,是以数学统计学为基础,结合生物学、医学、农业、环境科学等领域的实际问题,运用现代信息技术手段对生物数据进行收集、分析、解释的一门交叉学科。
近年来,生物统计学在生物信息学、基因组学、医学研究、环境科学等领域的应用越来越广泛,成为生物学等领域研究不可或缺的工具。
一、生物统计学的现状1. 应用范围广:生物统计学的应用范围非常广,可以应用于生物学、医学、环境科学等领域。
其中,应用于基因组学研究的生物统计学被称为基因组学统计学。
基因组学统计学主要研究高通量数据分析、基因关联性研究、遗传数据模拟、复杂遗传性疾病等问题。
2. 数据质量要求高:生物数据的种类繁多,包括单细胞数据、基因组测序数据、蛋白质质谱数据、代谢组学数据等。
这些数据的处理必须进行严格的质量控制,以确保数据的准确性和可靠性。
3. 方法不断更新:随着生物学和医学的发展,新的实验技术和数据处理方法不断涌现。
因此,生物统计学家必须不断更新自己的方法和技能,以满足不断变化的需求。
二、生物统计学的未来方向1. 数据集成与挖掘:随着生物学和医学数据的不断积累,数据集成和挖掘成为了生物统计学的一个重要方向。
生物统计学家需要掌握数据集成和挖掘的技术,以更好地发现生物学和医学中的潜在关联和趋势,推动革命性的发现。
2. 机器学习和人工智能的应用:机器学习和人工智能的发展为统计学的应用提供了新的机会。
生物统计学家必须关注和掌握这些技术课题,不断开发新的算法来解决相关问题。
3. 设计与分析复杂试验:生物统计学家需要解决有关随机化和未知的误差、可处理的变化和非线性模型的问题,以设计和分析非常复杂的试验。
4. 生物信息学与生物统计学的整合:生物信息学和生物统计学两个领域相互依存,逐渐成为一门重要的交叉学科。
生物统计学家需要掌握不同的生物信息学工具和技术,以开发新的方法来处理和分析生物数据。
三、结语总体而言,生物统计学是一个包罗万象的领域,涉及多个专业和分支学科。
生物信息学在环境保护中的作用在当今时代,环境保护已经成为全球共同关注的重要议题。
随着科技的不断发展,各种新兴学科和技术为环境保护提供了新的思路和方法,生物信息学就是其中之一。
生物信息学是一门结合生物学、计算机科学和统计学的交叉学科,它主要通过对生物数据的收集、整理、分析和解释,来揭示生命现象的内在规律。
那么,生物信息学在环境保护中究竟发挥着怎样的作用呢?首先,生物信息学有助于对生物多样性的研究和保护。
生物多样性是地球生态系统稳定和人类生存的基础,但由于人类活动的影响,生物多样性正面临着严重的威胁。
通过生物信息学的手段,我们可以对大量的生物物种信息进行分析,包括它们的基因序列、形态特征、生态习性等。
利用这些数据,我们能够更准确地评估生物多样性的现状和变化趋势,从而制定更有效的保护策略。
例如,研究人员可以通过对不同物种基因序列的比对,发现它们之间的亲缘关系和进化历程。
这有助于我们了解物种的形成和演化机制,以及它们在生态系统中的地位和作用。
同时,通过监测物种基因多样性的变化,我们可以及时发现那些受到威胁的物种,采取针对性的保护措施,如建立自然保护区、进行人工繁育等。
其次,生物信息学在监测环境污染方面也具有重要意义。
环境中的污染物会对生物的基因和蛋白质产生影响,从而导致生物体内的生理和代谢过程发生改变。
利用生物信息学技术,我们可以分析这些生物分子水平上的变化,从而间接监测环境中的污染情况。
比如,某些污染物会导致生物体内特定基因的表达发生变化。
通过对这些基因表达数据的分析,我们可以判断环境中是否存在相应的污染物以及其污染程度。
此外,蛋白质组学技术也可以用于监测环境污染。
环境中的污染物可能会与生物体内的蛋白质结合,改变蛋白质的结构和功能。
通过对蛋白质组数据的分析,我们可以了解污染物对生物体内蛋白质的影响,进而评估环境污染对生物的危害程度。
再者,生物信息学能够为生态系统的保护和恢复提供科学依据。
生态系统是一个复杂的生物群落与环境相互作用的整体,其稳定性和功能的维持对于环境保护至关重要。
生物信息学的现状与展望 The Current Status and The Prospect of Bioinformatics 摘 要:本文阐述了生物信息学产生的背景,生物学数据库,生物信息学的主要研究内容,与生物信息学关系密切的数学和计算机科学技术领域,生物信息学产业等内容,展望了其未来并提出了若干在我国发展生物信息学的建议。着重指出,理解大量生物学数据所包括的生物学意义已成为后基因组时代极其重要的课题。生物信息学的作用将日益重要。有理由认为,今日生物学数据的巨大积累将导致重大生物学规律的发现。生物信息学的发展在国内、外基本上都处在起步阶段。因此,这是我国生物学赶超世界先进水平的一个百年一遇的极好机会。 关键词:人类基因组计划 生物信息学 一、生物信息学产生的背景
有人说,基于序列的生物学时代已经到来,尽管对“序列生物学”这一提法可能有所争议,但是今日像潮水般涌现的序列信息却是无可争辩的事实。自从1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划,经过美、英、日、法、德和中国科学家的艰苦努力,终于完成了工作草图,这是人类科学世上又一个里程碑式的事件。它预示着完成人类基因组计划已经指日可待。截止目前为止,仅登录在美国GenBank数据库中的DNA序列总量已超过70亿碱基对。在人类基因组计划进行过程中所积累起来的技术和经验,使得其它生物基因组的测序工作可以完成得更快捷。可以预计,今后DNA序列数据的增长将更为惊人。生物学数据的积累并不仅仅表现在DNA序列方面,与 其同步的还有蛋白质的一级结构,即氨基酸序列的增长。此外,迄今为止,已有一万多种蛋白质的空间结构以不同的分辨率被测定。基于cDNA序列测序所建立起来的EST数据库其纪录已达数百万条。在这些数据基础上派生、整理出来的数据库已达500余个。这一切构成了一个生物学数据的海洋。可以打一个比方来说明这些数据的规模。有人估计,人类(包括已经去世的和仍然在世的)所说过的话的信息总量约为5唉字节(1唉字节等于1018字节)。而如今生物学数据信息总量已接近甚至超过此数量级。这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。 数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从中挖掘它们。与正在以指数方式增长的生物学数据相比,人类相关知识的增长(粗略地用每年发表的生物、医学论文数来代表)却十分缓慢。一方面是巨量的数据;另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求,这些新知识将帮助人们改善其生存环境和提高生活质量。这就构成了一个极大的矛盾。这个矛盾就催生了一门新兴的交叉科学,这就是生物信息学。美国人类基因组计划实施五年后的总结报告中,对生物信息学作了以下定义:生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。生物信息学这一名词的出现仅仅是几年前的事情,但是计算生物学这一名词的出现要早的多。鉴于这两门学科之间并没有或难以界定严格的分界线,在这里统称为生物信息学。 二、生物学数据库
《Nucleic Acids Research》杂志连续七年在其每年的第一期中详细介绍最新版本的各种数据库。在2000年1月1日出版的28卷第一期中详细地介绍了115种通用和专用数据库,包括其详尽描述和访问网址。迄今为止,生物学数据库总数已达500个以上。在DNA序列方面有GenBank、EMBL和DDBJ等。在蛋白质一级结构方面有 SWISS-PROT、PIR和MIPS等。在蛋白质和其它生物大分子的结构方面有PDB等。在蛋白质结构分类方面有SCOP和CATH等。应该指出,几乎所有这些数据库对学术研究部门或人员来说都是免费的,可以免费下载或提供免费服务。但是鉴于相当多的数据库的经营者们面临着财务紧缺的境地,这种免费的局面还能维持多久就不得而知了。有的数据库,如SWISS-PROT,已开始向商业用户每年收取数千至数万美元不等的使用费。其它数据库暂时还是免费的,但不知是否永远免费。如果一些重要的数据库对学术研究部门开始收费,这对于我国生物信息学的发展是非常不利的。中国是一个基因信息资源大国,我们应当抓紧建设我国自有的数据库,在世界上做出我们自己的贡献,在平等的基础上与国外共享生物信息资源。 三、生物信息学的主要研究内容
生物信息学主要包括以下几个主要研究领域,但是限于篇幅,这里仅列出其名称并只做简单介绍。 1、序列比对(Alignment)。
基本问题是比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础,非常重要。两个序列的比对有较成熟的动态规划算法,以及在此基础上编写的比对软件包——BALST和FASTA,可以免费下载使用。这些软件在数据库查询和搜索中有重要的应用。有时两个序列总体并不很相似,但某些局部片断相似性很高。Smith-Waterman算法是解决局部比对的好算法,缺点是速度较慢。两个以上序列的多重序列比对目前还缺乏快速而又十分有效的算法。 2、结构比对。 基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。已有一些算法。 3、蛋白质结构预测,包括2级和3级结构预测,是最重要的课
题之一。 从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学 和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构。同源模建和指认(Threading)方法属于这一范畴。虽然经过30余年的努力,蛋白结构预测研究现状远远不能满足实际需要。 4、计算机辅助基因识别(仅指蛋白质编码基因)。 基本问题是给定基因组序列后,正确识别基因的范围和在基因组序列中的精确位置.这是最重要的课题之一,而且越来越重要。经过20余年的努力,提出了数十种算法,有十种左右重要的算法和相应软件上网提供免费服务。原核生物计算机辅助基因识别相对容易些,结果好一些。从具有较多内含子的真核生物基因组序列中正确识别出起始密码子、剪切位点和终止密码子,是个相当困难的问题,研究现状不能令人满意,仍有大量的工作要做。 5、非编码区分析和DNA语言研究,是最重要的课题之一。
在人类基因组中,编码部分进展总序列的3~5%,其它通常称为“垃圾”DNA,其实一点也不是垃圾,只是我们暂时还不知道其重要的功能。分析非编码区DNA序列需要大胆的想象和崭新的研究思路和方法。DNA序列作为一种遗传语言,不仅体现在编码序列之中,而且隐含在非编码序列之中。 6、分子进化和比较基因组学,是最重要的课题之一。
早期的工作主要是利用不同物种中同一种基因序列的异同来研究生物的进化,构建进化树。既可以用DNA序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化。以上研究已经积累了大量的工作。近年来由于较多模式生物基因组测序任务的完成,为从整个基因组的角度来研究分子进化提供了条件。可以设想,比较两个或多个完整基因组这一工作需要新的思路和方法,当然也渴望得到更丰硕的成果。这方面可做的工作是很多的。 7、序列重叠群(Contigs)装配。
一般来说,根据现行的测序技术,每次反应只能测出500 或更多一些碱基对的序列,这就有一个把大量的较短的序列全体构成了重 叠群(Contigs)。逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配。拼接EST数据以发现全长新基因也有类似的问题。已经证明,这是一个NP-完备性算法问题。 8、遗传密码的起源。
遗传密码为什么是现在这样的?这一直是一个谜。一种最简单的理论认为,密码子与氨基酸之间的关系是生物进化历史上一次偶然的事件而造成的,并被固定在现代生物最后的共同祖先里,一直延续至今。不同于这种“冻结”理论,有人曾分别提出过选择优化、化学和历史等三种学说来解释遗传密码。随着各种生物基因组测序任务的完成,为研究遗传密码的起源和检验上述理论的真伪提供了新的素材。 9、基于结构的药物设计。
人类基因组计划的目的之一在于阐明人的约10万种蛋白质的结构、功能、相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗。基于生物大分子结构的药物设计是生物信息学中的极为重要的研究领域。为了抑制某些酶或蛋白质的活性,在已知其3级结构的基础上,可以利用分子对接算法,在计算机上设计抑制剂分子,作为候选药物。这种发现新药物的方法有强大的生命力,也有着巨大的经济效益。 10、其他。
如基因表达浦分析,代谢网络分析;基因芯片设计和蛋白质组学数据分析等,逐渐成为生物信息学中新兴的重要研究领域。这里不再赘述。 四、与生物信息学关系密切的数学领域
限于篇幅,仅列出它们的名称。统计学,包括多元统计学,是生物信息学的数学基础之一;概率论与随机过程理论,如近年来兴起的隐马尔科夫链模型(HMM),在生物信息学中有重要应用;运筹学,如动态规划法是序列比对的基本工具,最优化理论与算法,在蛋白质空间结构预测和分子对接研究中有重要应用,拓扑学,这里指几何拓扑,在DNA超螺旋研究中是重要工具,在多肽链折叠研究中也有应