人类基因组计划和生物信息学
- 格式:pdf
- 大小:179.69 KB
- 文档页数:3
生物的基因组学与生物信息学基因组学和生物信息学是现代生物学领域两个重要的分支。
基因组学研究基因组的组成、结构和功能,而生物信息学则利用计算机、数学和统计学等工具来处理和分析大规模的生物学数据。
1. 基因组学的概念与发展基因组学是研究生物体遗传信息的总和,包括DNA的组成、基因的组织和调控以及基因与基因之间的相互作用。
人类基因组计划的启动标志着基因组学的发展进入了一个新的阶段。
通过对不同生物基因组的研究,基因组学科学家们揭示了生命起源、进化以及生物体的复杂性。
2. 生物信息学的概念与应用生物信息学是一门研究如何存储、检索、分析和应用生物学数据的学科。
随着DNA测序技术的迅速发展,生物学领域产生了大量的数据,如基因序列、蛋白质序列等。
生物信息学通过运用计算机科学和统计学的方法,帮助科学家们更好地理解生物学现象,预测基因的功能和蛋白质的结构,以及挖掘新的生物学知识。
3. 基因组学与生物信息学的关系基因组学和生物信息学密切相关,相互促进,共同推动了生物学领域的发展。
基因组学提供了大量的数据资源,为生物信息学的研究和应用提供了基础。
而生物信息学则通过开发算法和软件工具,对基因组学数据进行处理、分析和解读,从而揭示基因组的结构、功能和演化等重要信息。
4. 基因组学与生物信息学在研究中的应用基因组学和生物信息学在许多领域都有广泛的应用。
例如,通过基因组学和生物信息学的研究,科学家们可以识别与疾病相关的基因,为疾病的早期诊断和治疗提供基础。
同时,基因组学和生物信息学的技术也被应用于农业、畜牧业和环境保护等方面,为提高农作物产量、改良畜禽品种以及保护生物多样性提供了新的途径。
5. 基因组学与生物信息学的挑战与未来发展尽管基因组学和生物信息学在生物学领域的应用取得了巨大的进展,但仍面临许多挑战。
其中包括如何处理和分析大规模的生物学数据、如何挖掘数据中隐藏的信息以及如何整合不同的数据源等。
未来,基因组学和生物信息学的发展方向将更加注重技术的改进和算法的优化,以应对日益增长的数据量和研究需求。
生物信息学期末复习资料(小字)名词解释或辨析。
1.生物信息学:生物信息学是包含生物信息的获取、处理、贮存、分发、分析和解释的所有方面的一门学科,它综合运用数学、计算机科学和生物学的各种工具进行研究,目的在于了解大量的生物学意义。
2.基因芯片:固定有寡核苷酸、基因组DNA或互补DNA 等的生物芯片。
利用这类芯片与标记的生物样品进行杂交,可对样品的基因表达谱生物信息进行快速定性和定量分析。
3.人类基因组计划:HGP,是一项规模宏大,跨国跨学科的科学探索工程。
其宗旨在于测定组成人类染色体(指单倍体)中所包含的30亿个碱基对组成的核苷酸序列,从而描绘人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。
4.中心法则:分子生物学的基本法则,是1958年由克里克(Crick)提出的遗传信息传递的规律,包括由DNA到DNA的复制,由DNA到RNA的转录和由RNA 到蛋白质的翻译等过程。
20世纪70年代逆转录酶的发现,表明还有由RNA逆转录形成DNA的机制,是对中心法则的补充和丰富。
5.相似性和同源性:相似性(similarity)和同源性(homology)是两个完全不同的概念。
同源序列是指从某一共同祖先经过趋异进化而形成的不同序列。
相似性是指序列比对过程中检测序列和目标序列之间相同碱基或氨基酸残基序列所占比例的大小。
当两条序列同源时,他们的氨基酸或核苷酸序列通常有显著的一致性(identity)。
如果两条系列有一个共同进化的祖先,那么他们是同源的。
这里不存在同源性的程度问题,两条序列要么是同源的要么是不同源的。
1.生物信息学:综合计算机科学、信息技术和数学的理论和方法来研究生物信息的交叉学科。
包括生物学数据的研究、存档、显示、处理和模拟,基因组遗传和物理图谱的处理,核苷酸和氨基酸序列分析,新基因的发现和蛋白质结构的预测等。
2.蛋白质组:指由一个基因组,或一个细胞、组织表达的所有蛋白质。
人类基因组计划名词解释生物信息学英文回答:Bioinformatics.Bioinformatics is a field that combines biology, computer science, and information technology. It involves the development and use of computational tools and techniques to manage, analyze, and interpret biological data. Bioinformatics is used in a wide range of research areas, including genomics, proteomics, drug discovery, and disease diagnosis.Key concepts in bioinformatics.Genomics: The study of the structure and function of genomes.Proteomics: The study of the structure and function of proteins.Transcriptomics: The study of the structure and function of transcripts.Metabolomics: The study of the structure and function of metabolites.Bioinformatics databases: Databases that store and manage biological data.Bioinformatics tools: Software tools that are used to analyze and interpret biological data.Applications of bioinformatics.Drug discovery: Bioinformatics is used to identify new drug targets and to design new drugs.Disease diagnosis: Bioinformatics is used to develop new diagnostic tests for diseases.Personalized medicine: Bioinformatics is used todevelop personalized treatment plans for patients.Evolutionary biology: Bioinformatics is used to study the evolution of species.Challenges in bioinformatics.Data explosion: The amount of biological data is growing rapidly, making it difficult to manage and analyze.Data integration: Biological data is often stored in different formats and in different databases, making it difficult to integrate and analyze.Algorithm development: New algorithms are needed to analyze and interpret complex biological data.Despite these challenges, bioinformatics is a rapidly growing field with the potential to revolutionize the way we understand and treat diseases.中文回答:生物信息学。
人类基因组计划的目的工作目标1. 精确绘制人类基因组的完整图谱人类基因组计划的核心目标是完成对人类基因组的精确绘制,这包括确定人类DNA序列中的约30亿个碱基对,以及识别和解析约20000个基因。
此工作不仅需要高精度的测序技术,还需要生物信息学领域的专家对所获得的大量数据进行整理、分析和解释。
此外,还需要关注基因间的相互作用和调控机制,以揭示人类生物学的奥秘,并为医学研究和疾病治疗提供基础。
2. 探索基因与疾病的关系人类基因组计划的一个重要目标是识别和研究基因与疾病之间的关系。
通过对人类基因组的深入研究,我们可以发现与各种疾病相关的基因变异,从而揭示疾病的发病机制,并为疾病的诊断、治疗和预防提供科学依据。
这有望极大地提高人类的健康水平和生活质量。
3. 促进生物科技的发展人类基因组计划还将促进生物科技的发展。
基因组研究为生物制药、基因治疗、个性化医疗等领域提供了广阔的应用前景。
通过人类基因组计划,我们可以深入了解基因的功能和调控机制,为开发新的药物和治疗方法提供科学依据,推动生物科技的进步。
工作任务1. 基因测序基因测序是实现人类基因组计划的关键步骤。
我们需要开发和应用高精度的基因测序技术,对人类基因组进行全面的测序。
这包括确定DNA序列中的碱基对,以及识别基因的起始和终止位置。
此外,还需要对基因进行表达和调控的分析和研究,以揭示基因的功能和生物过程。
2. 生物信息学分析人类基因组计划产生了大量的数据,需要生物信息学领域的专家进行分析和解释。
这包括对基因序列进行比对和注释,以确定基因的功能和调控机制。
同时,还需要开发和应用统计学方法,对基因表达数据进行分析和挖掘,以揭示基因与疾病的关系,并为医学研究提供指导。
3. 医学研究与应用人类基因组计划的研究成果将在医学领域产生广泛的应用。
我们可以利用基因组信息,开发新的疾病诊断和治疗方法。
例如,通过识别与疾病相关的基因变异,我们可以提前预测个体的疾病风险,从而进行早期干预和治疗。
人类基因组计划与意义人类基因组计划(Human Genome Project)是人类史上最宏大的科学计划之一,旨在通过对人类基因组的解读,更好地探索人类的生命机制,促进全球健康事业的发展,为人类健康和福祉做出贡献。
一、人类基因组计划的意义人类基因组计划不仅是科学界的一次重大突破,更是人类文明的一次伟大飞跃。
其意义主要可以从以下几个方面来阐述。
1. 探索人类生命机制人类基因组计划是人类了解自身生命机制的一项重要工作。
通过解读人类基因组,人们可以深入了解人类的遗传规律、基因突变和基因信息的传递等方面。
这不仅有助于医学领域的发展,也有助于人们更好地了解自身的特点和潜质。
2. 促进医学发展人类基因组计划的完成,为医学研究提供了重要的基础数据。
例如,人们可以基于人类基因组计划的数据,更精确地了解疾病的遗传性,为疾病的早期诊断和治疗提供科学依据。
同时,人们也可以利用人类基因组的研究成果,研发更为精确和有效的医疗技术和药物,以促进全球健康事业的发展。
3. 探索人类智能机制人类的智能一直是科学家们关注的热点问题之一。
通过人类基因组计划,人们可以更深入地了解人类大脑的结构和功能机制,这有助于人们更好地认识智能和思考的本质,推进人工智能等领域的发展。
4. 推动生物技术的发展基因工程是生物技术中最为重要的领域之一,也是人类基因组计划的重要分支之一。
通过对人类基因组的了解,人们可以发掘出更多的基因序列和特征信息,从而实现对生物体进行改良和优化的目的。
这不仅有助于提高农业、畜牧业的生产效率和质量,也有助于推进医学研究等领域的发展。
二、人类基因组计划的研究方法人类基因组计划是一项长期而复杂的研究工程,其研究方法主要分为以下几个阶段。
1. 基因测序基因测序是对基因组中包含的DNA信息进行解码的过程。
对于人类基因组计划来说,这是一个耗时且复杂的过程,需要运用到许多不同的技术和方法。
2. 基因标记基因标记是指对基因组进行标记以便进一步研究的过程。
生物信息学的新技术与应用随着科技的不断进步,生物学领域一直都是科技创新的热点之一。
特别是随着生物信息学的不断发展,生物领域的研究也进入了一个崭新的阶段。
在这篇文章中,我们将就生物信息学的新技术与应用进行深入的探讨。
一、生物信息学的概述生物信息学主要是针对生物学数据的分析和解释,通过利用计算机和其它技术手段,对生物数据进行处理和分析,然后从中获取有用的信息,从而使人们更好地理解和掌握生命科学研究的相关知识。
二、生物信息学的新技术1. 基因编辑技术基因编辑技术是近年来生物信息学领域最为炙手可热的技术。
基因编辑技术的出现,使我们可以对生物的基因DNA进行精度极高的修改,从而能够实现对细胞或生物体的精确操纵。
基因编辑技术除了能够用于治疗人类遗传性与获得性疾病,还可以利用这种技术开发新的药物、保护农作物、巩固环境保护等等。
2. 测序技术测序技术的发展越来越快,导致这个领域研究成果的数量极大地增长了,这对于学术研究以及药物研究的发展带来很大的促进作用。
测序技术主要是指对基因组的测序,从而解析出基因组的组成结构及其功能。
常见的测序技术有Sanger测序、Illumina测序、Ion Torrent测序等等。
3. 蛋白质质谱技术蛋白质质谱技术主要是用来研究蛋白质的功能和特性的。
这种技术通常被用于药物研制方面,以便更好地理解蛋白质与药物之间的相互作用。
蛋白质质谱技术能够将蛋白质分离出来,然后将其与质谱仪一起使用,通过分析蛋白质谱图像,来确定蛋白质的个体差异和化学性质。
三、生物信息学的应用1. 人类基因组计划人类基因组计划是生物信息学最具有代表性的一个应用,该计划启动于1990年,旨在解析出人类基因组的完整质量。
人类基因组计划一方面推动了生物信息学乃至整个医药行业的发展;另一方面,还为生物信息学的后续研究奠定了良好的基础。
2. 肿瘤诊疗除了人类基因组计划外,生物信息学还广泛地应用于医疗行业的肿瘤诊疗中。
通过生物信息学技术与肿瘤学的交叉研究,医生们可以更准确地对肿瘤类型、发病原因和治疗方法进行判断,从而提高肿瘤治疗的效果。
人类基因组计划中的技术进展和成果21世纪初的基因科学研究迈开了一个重要的里程碑。
在1990年代,美国国家卫生研究院(NIH)和英国人类基因组计划在全球范围内展开了一项名为人类基因组计划(Human Genome Project,HGP)的大规模基因测序计划。
至今,这个计划依旧在持续推进,同时积累越来越多的数据。
在这个过程中,科学家们不断研究并改进着基因组学和生物信息学技术,为癌症、遗传疾病、人类演化等领域带来了前所未有的革命性突破。
一、基因组学和生物信息学的技术进展作为人类基因组计划的核心技术之一,基因组学发展迅速,从最初的手工测序到现在的自动化测序,大大提高了测序速度和准确度。
比如,高通量测序技术可以在极短时间内测序成千上万个DNA片段,使得人们可以更容易地分析基因序列的含义和作用。
而随着技术发展,如今的基因测序能够覆盖整个人类基因组,且数据量越来越大,甚至可以进行全身疾病的基因组学分析。
而生物信息学的技术进展则是在数据分析和挖掘方面发力。
这其中包括了一些基因组数据的分析、处理、可视化、存储和传输等。
这个领域的目标便是发现数据中的模式和相互关系,寻找并全面利用生物大数据的更多价值。
近年来,随着深度学习、人工智能、云计算等技术的发展,生物信息学的研究也拓展到了更加广泛的应用领域。
二、基因组计划带来的革命性成果随着高峰每格测序技术和生物信息学技术的不断发展,基因组计划也在各个领域带来了许多革命性成果。
以下是一些典型的例子:1.阐明了人类基因组的组成和结构。
通过人类基因组计划,科学家们成功地测序了整个人类基因组,并将它分成约30万个部分。
这项工作使得科学家们对基因的功能和组成有了更加清晰的认识。
此外,人类基因组计划还发现了很多嵌合基因(一种包含两个或多个基因的DNA序列),更深入地揭示了人类基因组的基本结构和演化过程。
2.揭示了许多遗传病的病因。
人类基因组计划是揭示遗传病的病因和机制的一个重要途径。
生物信息学的应用及其在科学研究中的贡献生物信息学是生物科学与信息科学交叉融合的产物,它把计算机与生物学结合起来,通过数据分析、信息挖掘等手段,从海量生物数据中探索生物规律和生命现象,为生物医学领域提供了巨大的帮助。
1.基因组学在基因组学领域中,生物信息学的应用尤为广泛。
以人类基因组计划为例,人类基因组计划是人类谱系起源计划的一个重要分支,它的目标是确定人类的基因组序列。
在这个计划中,生物信息学扮演了至关重要的角色。
通过计算机技术,将大量生物数据进行处理和分析,找出基因序列中所含的基因和物种分化的规律,使我们能够更好地理解人类基因组。
同时,通过生物信息学手段可以较为精确地分析基因测序的结果,帮助科学家发现基因变异等信息,更好地了解遗传病的发生机制。
2.药物研发生物信息学在药物研发过程中的应用也越来越受到重视。
利用生物信息学手段,我们可以更加准确地预测药物在人体内的作用机制及药效,加速药物研发过程。
生物信息学的应用使得公司能够大大减少新药开发周期,节省研发费用,这对新药研发企业无疑是一大优势。
3.癌症研究生物信息学在癌症研究中的应用也越来越受到重视。
癌症研究是生物信息学在医学领域应用最为广泛、最具影响力的研究领域之一。
生物信息学技术通过对癌症基因组学和转录组学分析,可以为癌症基础研究和个性化治疗提供重要的信息。
例如,利用生物信息学工具挖掘肿瘤组织中癌基因、肿瘤抑制基因的变异情况以及癌症特异性信号通路等,分析癌细胞的代谢途径,预测化疗药物敏感性等,从而帮助科学家更深入地了解癌症。
此外,通过肿瘤组织中的基因测序和分析,可以为癌症临床治疗提供个性化药物治疗方案,为临床癌症治疗提供更为精细的指导。
4.生物多样性研究生物信息学在生物多样性领域中也有广泛的应用,它可以通过DNA测序,并配合相应的数据分析软件,深入研究种群的构成和遗传变异模型。
同时,生物信息学也可以用来分析物种数量、分布范围、物种在地球上的分布规律等重要信息,为生物多样性研究提供信息和数据。
人类基因组计划中的关键技术人类基因组计划是一个国际性的科学合作项目,旨在测定和分析人类基因组中所有的DNA序列,以进一步了解人类的遗传信息和基因相关疾病的发病机制。
该计划的启动标志着生命科学和计算机科学领域的一次革命性进步,也为更好地预防和治疗疾病提供了有力的科学依据。
在人类基因组计划中,关键的技术手段主要包括DNA测序、基因分型、生物信息学等方面。
下面我们将从这些角度来分析人类基因组计划中的关键技术。
DNA测序技术DNA测序技术是人类基因组计划中最重要的技术之一。
DNA 测序是指将DNA序列写出来的过程,它在人类基因组计划中的作用是揭示DNA的精确结构,进而找出存在于人类基因中的显性或隐性基因,从而得知人类遗传信息和基因相关疾病的发生机制。
DNA测序技术之所以能够得到广泛的运用,是因为它具备高度可靠和快速测序的优势。
DNA测序技术的发展,从最初的手工测序逐渐发展到高通量测序技术的应用。
手工测序需要手动处理和分析每一条碱基对的试图,可分析的DNA序列长度较短,仅局限于小片段的DNA分析。
而高通量测序技术则不同,它采用机器自动处理DNA序列,有效的提高了测序速度和数据质量,序列长度可大大提高。
目前市场上高通量测序技术主要有Illumina、PacBio、Ion Torrent等。
基因分型技术基因分型是人类基因组计划中的另一个重要技术手段。
基因分型是指对百余种基因突变体进行检测和鉴定的技术,其目的是寻找出恶性肿瘤、遗传性疾病的表达标志物、分子靶点等。
基因分型技术对了解生殖健康、肿瘤、心血管等疾病的发生有着重要的作用。
基因分型技术的监测方式也有所不同,常见的有聚合酶链反应技术、基因检测技术等。
聚合酶链反应技术是一种常用的DNA扩增技术,通过反复进行核酸链扩增,将微量核酸样品扩增至足够多的数量,以便进行检测和分析。
基因检测技术则是一种利用特异性引物和荧光探针进行PCR扩增和检测、分析目标基因的技术。
评估遗传因素对药物反应的影响、增强药物副作用的预测能力等都是基因分型技术在临床医学中重要的应用。
人类基因组计划和生物信息学徐新来 安道昌 王 芷3 李 青 付红波(中国生物工程中心 北京100081)(3中国科技信息研究所 北京100038)提要:介绍人类基因组计划和生物信息学,阐述了两者的关系,提出了在人类基因组计划中发展生物信息学的策略。
一、引 言人类基因组计划(H um an Genom e P ro 2ject ,H GP )是美国在1990年提出实施的一项大科学计划,在世界各国引起了很大反响。
计划的提出旨在对人类基因组3×109个脱氧核苷酸对进行作图和测序,进而解读和破译生老病死以及语言、记忆和疾病发生的遗传信息。
而生物信息学是集生物学、数学、信息学、计算机科学一体化的一门新的学科。
早在H GP 提出时就预示到生物信息学的重要性,当时就成立了有42位著名专家组成的生物信息学任务组。
随着人类基因组计划的进展,基因组的数据和信息大量,迅速地增加,信息的收集、储存、分发、分析的管理越来越显得紧迫和重要。
利用数学模式和计算机处理数据的功能来处理和分析大量增加的人类基因组信息的结果,使人类基因组计划和生物信息学紧紧地结合起来了,而且随着两者的紧密结合和互相渗透,人类基因组计划的前进步伐会大大加快,从而提前完成计划,为人类造福。
二、从人类基因组计划看生物信息学 美国在1990年率先提出H GP ,计划用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp )的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立)、测序和基因识别。
其中还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。
遗传图谱、物理图谱的建立是测序的必要条件;遗传图谱是根据遗传连锁标志之间的重组频率来确定它们的距离,遗传图谱的建立为基因识别和完成基因定位创造了条件。
物理图谱是以核苷酸的长度为单位绘制而成,详细描述染色体上界标间的距离,主要是编码蛋白质的外显子和排序DNA 克隆库组成,这些DNA 分子克隆库相互交错、重叠。
人类基因组全部DNA 序列的测定是H GP 的核心部分;随着遗传和物理图谱的完成和即将完成,测序就成为今后重中之重的工作。
而大规模测序技术的改进及分析大片段DNA 序列的生物信息技术的进步,对完成人类基因组全部核苷酸顺序测定起着决定性作用。
测序的完成依赖物理图谱上的排序的DNA 片段分子克隆,这些分子图谱通常是在较短的时间由一个研究组从单一分离群体中获得的,为了充分利用所有资料信息,要对其全部标记的同时进行分析,这种分析涉及十分庞杂和巨大的计算,手工无法完成。
基因识别是H GP 的重要内容之一;目的是要识别全部人类的基因,即基因组在生命活动中发生转录表达的DNA 片段,并对其结构进行研究。
目前常采用的有二种方法:一是从基因组顺序中识别那些转录表达的DNA 片段;二是从c D 2NA 文库中挑取并克隆。
两种方法都必须依靠生物信息学的帮助即信息系统的建立;前者需要对基因组进行分析,后者要对基因文库进行分析,甚至还要进行分类分型,建立二级库,才能有效地挑取到所需要的DNA 分子克隆。
模式生物基因组在H GP 中占有重要的位置;模—06—高技术通讯 1998181式生物基因组结构相对比较简单、单位DNA 片段上基因的密度高,易于基因的识别。
从进化角度讲,动物的许多基因有很大的同源性,对模式生物基因的分析有助于人类基因的结构与功能的阐明。
在这种背景下生物信息学的重要性便在基因组计划提出后真正显示出来了。
H GP的提出和实施,实验的数据和信息急剧大量的增加,信息的管理和分析成为一项重要的研究内容。
生物信息学以基因组信息学为核心,主要任务是收集、储存、分发基因组的数据和信息,管理和分析、处理基因组及相关的蛋白质、m RNA 的信息,根据基因组数据和信息的比较分析,发现新的基因,并对基因结构和功能进行研究。
信息的收集、储存、分发、分析是基因组计划最初提出时确定的任务,计划实施后,每天都有上万的数据,数据的取舍非常重要,数据的标准化和检验成为信息处理的第一步工作。
同时,数据必须能提供给广大的科研工作者使用,计算机管理要提供一个工作界面,才能有效地利用信息。
另外,这些数据还应可视化,方便用户使用。
生物信息学的研究更重要的作用是将原始的信息库进行分析、分类,按照需要建立具有特殊功能的二级数据库。
二级数据库是进一步研究开发基因组的重要手段,通常是封闭的,不对外开放,仅供内部使用。
随着基因组研究的发展,向功能基因组研究转化,解读生物的遗传密码成为生物信息学的又一项重要的任务。
生物信息学另一项重要任务是分析工具的研究开发,如序列相似性比较的软件。
分析软件是有效利用基因组信息的有利工具,同时分析软件也是构建二级、三级数据库的条件和手段。
分析软件还可将不同性质的数据库结合一起,如将基因组序列数据和蛋白质数据结合计算,可以推断结构和功能的关系,从而成为一种发现新基因的较为快捷的方法,有利解读全部生物遗传密码。
生物信息学发展很快,各种数据库不断涌现,数据库各有不同的特色。
美国、日本、欧盟、加拿大等国都有基因组数据库,有的是国际性的,有的是本国的,有的公开,有的不公开。
其中比较有代表性的数据库有:美国的GenB ank,欧盟的E M BL,日本的DDBJ和美国的N CB I等。
数据库的内容十分丰富,有表达序列标记数据库(dbEST),有序列标记位点数据库(dbST S),有蛋白质序列数据库、蛋白质序列功能位点数据库、还有基因图谱数据库、结构数据库等等。
各数据库的容量也在不断扩大,根据GenB ank1997年11月统计,该库已有100多万条人类核酸序列记录,近5万条蛋白质记录。
三、生物信息学发展现状 随着信息学大环境的改善,如信息高速公路、国际互联网的发展,生物信息学发展迅速。
美国、日本及欧洲各国的生物信息学已相继在In ternet上建立了各自的网络节点,进行管理大型数据库,为研究人员提供研究数据的分析、处理、采集、交换的服务。
国际互联网所到之处,都有各种研究机构的联网、数据库的建立,开展生物信息学研究。
各种数据库各具特色: GenB ank、E M BL、DDBJ是三大核苷酸 蛋白质数据库;GDB数据库主要收集遗传学制图的资料;CEPH的数据库收集YA C con tig; Genethon、CHL C储存遗传学标记系列; W h iethead研究所的数据库可了解全部18000个ST S及联系作图的信息;另外还有突变序列的数据库在建立之中。
在各类数据库建立的同时,数据库设计中出现了集成化趋势,集成化包括:各类数据的集成、数据库与数据分析软件的整合。
各种数据库分析、测序应用软件包也被开发出来。
除了数据库、数据分析软件的发展,生物信息学中比较基因组学的发展也较为突出。
其中河豚、鼠、猪、牛和马的基因组与人基因组的比较研究,秀丽隐杆线虫与人基因组的比较研究、酵母与人基因组的比较研究,支原体与嗜血流感杆菌基因组的比较研究,都取得了成果,从比较中分离到一些人类遗传病的候选基—16—高技术通讯 1998181因,鉴定了一些新克隆的基因,为人类基因组的分析提供了有益的数据。
随着计算机技术的发展和渗透,生物信息学在人类基因组中大规模测序的自动化控制、测序结果分析处理、序列数据的计算机管理、各类遗传图谱、物理图谱的绘制、研究数据的网络获取、分析和交换,以数据分析的结果辅助基因组研究等都发挥着不可替代的功能,显示出越来越重要的作用。
四、我们的策略 人类基因组计划和生物信息学是当今生命科学重要的课题,为全世界所关注。
由于其重大的科学意义和潜在的经济价值,积极开展有关的研究势在必行。
人类基因组计划启动时,生物信息学技术就已成为发展的重点之一,目前有关基因序列、图谱的数据信息的大量积累,使生物信息学研究在人类基因组研究中的重要性越来越突出,在今后的人类基因研究中,生物信息学是一个信息库,一种高层次研究的工具。
如果生物信息学研究发展滞后,将意味着失去信息,失去高层次、高水平研究的基础。
中国1993年开始参与H GP 研究,但由于资金技术等各种原因,其研究水平与国际同行尚有较大差距。
我国虽然早在1993年中国人类基因组计划中列入了生物信息学的内容,但真正起步可能是在1995—1996年,基础比较弱,尚处于引进国外已有数据库,为国内研究人员提供服务的阶段。
中国的人类基因组研究和生物信息学都处于一个不容乐观的现状。
如何在现有的资金、技术条件下,找到1个或2个突破口,改变落后现状,在国际同类研究领域争得一席之地,我们认为应该在策略上作些调整。
11在人类基因组研究上,找功能基因。
利用我国丰富的遗传资源和广泛的疾病谱系,从“c DNA ”入手,尽快地克隆一批新基因。
“c DNA ”又称互补DNA ,只占整个基因组DNA 很小的一部分,是编码蛋白质的,即功能基因,结合大家系和疾病谱系,才可以完成,我国在这方面具有利条件。
基因组测序是一件知识劳动密集性工作,只要我们引进技术和设备,培训一支高水平的技术队伍,利用我们的优势,就能够抢到一部分新基因。
21在引进国外数据库的同时,建立中国人基因资源数据库。
生物信息学对推进基因组的工作十分重要,充分利用国际基因信息库的信息,建立国际合作关系,在基因组研究工作的基础上,组建自己的生物信息网络,建设基因资源、基因结构的数据库。
同时,进行分析软件的开发研究,构建特殊需要的二级、三级数据库,从已知的c DNA 文库中,进行测序和功能推测研究,发现新基因,才有可能在国际人类基因组计划中占有一席之地。
31人才培养。
当务之急是对现有从事基因研究的科技人员进行生物信息学的培训。
只有有了中国自己的一支专门从事生物信息学研究的科研队伍,才能在中国人类基因组研究中做出国际领先水平的工作。
参考文献[1]刘春宇,夏家辉1国外医学遗传学分册,1996,19(5):262[2]李卫东,王明荣1国外医学遗传学分册,1996,19(5):264[3]丁达夫,梁卫平,陈洁1生物信息学,1998,50,2(3):20(上接第60页) [10]N akano T ,FujiM ,N agano K et al .N ipp on S teel T echnical R ep ort ,1987,34(7):21[11]M c D avid R M ,T hom as B G .M etallu rg ical and M aterials T ransactions B ,1996,27B :672[12]Ho B .M aster ’s thesis ,U niversity of Illi 2no is at U rbana 2Champaign ,U rbana ,I L ,1991[13]M c D avid R M .M aster ’s thesis ,U niversity of Illino is at U rbana 2Champaign ,U rbana ,I L ,1994[14]H uang X .U niversity of Illino is ,U rbana ,personal comm unicati on ,1993[15]龚家跃,吉新华,蔡中熊等1连铸机顶层保护渣热过程的三维数学模型及计算,工作报告,1997—26—高技术通讯 1998181。