当前位置:文档之家› 第八章线粒体DNA及其多态性

第八章线粒体DNA及其多态性

第八章线粒体DNA及其多态性
第八章线粒体DNA及其多态性

第十二章生物信息学及其在分子生物技术中的应用

第一节概述

一、生物信息学的概念

生物信息学(bioinformatics)是生命研究领域的一门新兴学科,它诞生的渊源在于20世纪生命科学和计算机科学的快速发展,特别是在分子生物学、国际互联网(world wide web,WWW)和生物医药的发展前提推动下,生物信息学以其快速发展的态势而备受世人的瞩目,并在人类基因组计划(human genome project,HGP)实施及后基因组计划中占有重要的地位。

生物信息学的概念有许多版本,其一,生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、贮存、传递、检索、分析和解读的科学,是现代生命科学与计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。其二,生物信息学的内涵十分具体,范围非常明确,由于生物信息学是伴随基因组研究的产生而产生,发展而发展的,因此它主要履行对基因组研究相关生物信息的获取、加工、贮存、分配、分析和解释等职责。其三,生物信息学所研究的材料是生物学的数据,进行研究的方法是从各种计算技术衍生而来。然而,无论是详尽描述还是简单概括,诸多观点对于生物信息学的研究目的和方法都是相对一致的。

生物信息学的内涵包括多个层面。

从生物学视角理解:生物信息学研究的是生物体内遗传信息的自然运动规律和变化,基因组数据是其研究的起点,通过破译基因序列的遗传规律、归纳转录调控规律和蛋白质谱数据,揭示生物体的发育、生长和代谢的过程;在后基因组时代,基因功能表达谱的研究是探讨基因在特定时空中的表达;确立核酸序列中编码蛋白质的基因,了解蛋白质的功能及其分子基础,采用蛋白质结构模拟与分子设计进行功能预测;对于已知的各种代谢途径和相关的生物分子的结构、功能及它们之间的相互作用进行整理,用以研究细胞发育、分化途径和疾病发生与发展的路径。

从信息学视角理解:生物信息学包括构建数据库和开发应用分析软件等多个方面。面对大量的信息资源,数据库的作用不仅仅是数据的储存,还含有数据分类、注释、分析及相关链接、数据库的查询和搜索、数据资源的交流和更新,具有广泛的使用价值;生物学数据的分析和处理是生物信息学的主要研究手段,核酸序列的获得、氨基酸序列的获得、序列间的比对、数据库的查询、序列的分析、结构的可视化都需要相应专业软件工具的支持。

总之,生物信息学是结合了生物学、应用数学和计算机学等多个学科的一门研究生命自身规律的综合性学科。

二、生物信息学的发展

(一)生物信息学的产生

生物信息学作为一门综合学科,它的发生及发展是在一定的物质基础和特定的外部条件前提下产生的。

它产生的物质基础是20世纪高速发展的生命科学,生命科学领域中产生了大批先进的实验技术和高效的科学仪器,加速了科学研究的进程。例如,全自动高效毛细管电泳测序仪的出现,替代部分平板胶测序方法,使人类基因组计划比预期提前完成任务。

生物信息学产生和发展的前提条件包括:①分子生物学者提供了大量的有关生物分子的原始数据。②随着人类基因组计划的开展,急剧增长的原始数据需要专门的技术对其采集、整理和管理。③大量的原始数据需要进行数据的科学分析和研、究。④后基因组时期的研究工作要求对蛋白质结构和功能进行预测。⑤目前,计算机的计算速率不断提高,能够适应数据信息的快速增长,国际互联网的广泛应用为研究者提供了便利的获取数据资源途径。⑥全球各个学科学者相互交流,共同协作,共享资源,提高了资源的可利用率。⑦应用数学与生物学相结合开发的各种算法适用于生物信息数据的处理和分析。⑧生物学软件的早期开发为

生物信息学提供了研究工具。

如果说是生命科学技术的进步孕育了生物信息学,那么诸多其他科学技术的进步促进了它的发生和发展,生物信息学是多种学科共同发展的产物。

(二)与分子生物技术发展的关系

分子生物学是20世纪推动生物学技术飞速发展的主要因素之一,分子生物学的发展进程中孕育着生物信息学的萌芽,生物信息学的应用又对分子生物学的进一步发展做出积极贡献。

1953年8月James Watson和Francis Crick提出了DNA的双螺旋结构模型,阐明了它是遗传信息的携带者。

1956年10月,在美国召开了“生物学中的信息理论研讨会”。

1961年,Jacob和Monod发现大肠杆菌的lac操纵子中存在调控元件,证实非编码序列并非垃圾序列。1962年,Khesin等人发现噬菌体中的基因转录表达具有定时调节机制。

1964年,开始蛋白质结构预测工作。

1970年,((Computer Methods and Programs in Biomedicine》杂志问世,是生物技术由单一的操作实验进入与计算实验并存时代的标志。同年,Needleman和Wunsch发布了著名的双序列比对算法,从全局的角度计算两条序列的对齐;Gibbs等发表了单序列分析方法。

1972年10月,Paul Berg和他的同事构建了第一个重组DNA分子。同年,蛋白质序列数据库出现。

1974年,Ratner首先对分子遗传调控系统进行理论处理。,

1975年Pipas等提出使用计算机技术分析RNA的二级结构。

1976年,Fiers等测得RNA噬菌体MS2的全部序列;生物多序列比对算法开始出现。

1977年,Allan Maxam和Walter Gilbert与Frederick Sanger分别完成DNA测序方法的改进。同时,以DNA序列为基础翻译成蛋白质序列的算法出现。

1978年,核酸序列数据库出现;限制酶切位点计算机预测软件出现。

1980年5月,David Botstein,Ronald Davis和Ray White建立了以限制性片段长度多态性(restriction fragment length polymorphism,RFLP)为基础的人类全基因组图谱的方法。

1982年,欧洲分子生物实验室EMBL (European Molecular Biology Laboratory)数据库和美国GenBank数据库相继建立。

1984年,Charles Cantor和David Schwartz研制了脉冲场电泳。英国医学理事研究会破译了Epstein-Barr病毒的DNA全序列,共170 000个碱基。

1985年,Katy Mullis建立大量复制DNA的PCR技术。在这一年,生物信息学专业期刊((Computer Application in the Biosciences))创刊。

1986年,日本核酸序列数据库(DNA Data Base of Japan,DDBJ)建立。Hood和Loyd Smith 以及他们的同事宣布研制出第一台DNA自动测序仪。这是使测序技术从繁重低效的手工操作中摆脱出来转折点。

1987年,David Burke,Maynard Olson和George Carle发展T酵母人工染色体(yease artifical chromosome,YAC)克隆技术。同年,双脱氧荧光标记快速DNA测序技术问世。

1989年Olson, Hood, Botstein和Cantor使用序列标签位点(sequence tag sites,STSs )作为新的制图策略。STS是目前生物信息数据库常用的物理图谱定位数据库。

(三)与人类基因组计划的关系

人类基因组计划的主要目的是获取人类基因组的全部序列信息,为生物信息学提供了丰富的研究材料,包含几十亿碱基对的核酸序列像一片数据的汪洋,它需要利用生物信息学的方法在数据海洋中导航。生物信息学伴随着人类基因组计划的进程不断完善和发展,并在后基因组时代担负着更重要的任务。

目前已知人类基因组大约有30亿个碱基对,其中可能含有3万^- 7万个左右的基因。人类基因组计划是美国科学家于1985年率先提出的,旨在阐明人类基因组的序列,发现所有人类基因及其染色体上的物理定位,破译人类全部遗传密码,在分子水平上全面地认识人类自身。

1990年,美国国会正式批准美国的人类基因组计划于1990年10月1日正式启动,这一价值30亿美元的计划的目标是,为由30亿个碱基对构成的人类基因组精确测序,最终确定每种基因所对应的蛋白质及其作用。

在此之前,1987年,意大利国家研究委员会组织了近30个实验室开展人类基因组计划研究。

1989年,英国开始人类基因组计划,成立了“英国人类基因组资源中心”,从事酵母人工染色体(YAC)库的筛选与克隆、cDNA文库、基因组DNA、比较基因组生物序列和信息分析的研究。Sanger中心以线虫基因组研究为起点,改进了大规模基因测序技术。

1990年6月,法国的国家人类基因组计划启动。研究方向是整体基因组、cDNA和自动化方法。诺贝尔获奖者Dausset在全基因组YAC重叠群、微卫星标记的构建等方面做出了杰出贡献。

1993年3月,欧洲生物信息研究所(European Bioinformatics institute, EB1)成立。8月,专业蛋白质分析系统网络服务器诞生。

1995年2月,德国成立了资源中心和基因扫描定位中心,开始人类21号染色体的大规模测序。Marc Wilkins等首次提出蛋白质组的概念。

1997年,中国北京大学生物信息中心成立。

1999年9月,中国获准加入人类基因组计划,负责测定人类基因组全部序列的1%,即位于3号染色体的3000万个碱基对。

1999年12月1日,人类首次成功地完成人体染色体基因完整序列的测定。

2000年4月底,中国科学家完成1%人类基因组的工作框架图。

2000年5月8日,由德国和日本等国科学家组成的国际科研小组宣布,他们已基本完成了人体第21对染色体的测序工作。

2000年6月26日,科学家公布人类基因组工作草图。12月14日,英美等国科学家宣布绘制出拟南芥基因组的完整图谱。

2001年2月12日,人类基因组图谱及初步分析结果首次公布。中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合公布人类基因组图谱及初步分析结果。这次公布的人类基因组图谱是在原“工作框架图”的基础上,经过整理、分类和排列后得到的,它更加准确、清晰、完整。

2003年4月14日,中、美、日、德、法、英六国科学家宣布人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现。已完成序列图覆盖人类基因组所含基因区域的99%,精确率达到99. 99%,比原计划提前两年多。

随着人类基因组和其他模式生物基因组的大规模测序的完成,生物信息学的比较基因组学和生物进化研究方法被广泛应用,功能基因的研究日益成为生物信息学研究的主要方向。

三、生物信息学的研究现状

2002年GenBank创立20周年,1月,数据库报告已有1700万个生物体的DNA(大多是细菌)完成测序。碱基对数目由1982年的680 338bp发展到2002年的220亿个,是1999年统计数字30亿的7倍多。1984年,GenBank日平均在线使用者为5人次,现在日均达数万人次。

随着其他生物体基因组的完成,数据库的数量也呈增长态势,《核酸研究》杂志将网络上与生物信息学相关的数据库分为十几类,基因组数据库不断增加,其中,比较基因组数据

库被列于显著位置,且二次数据库的数量在不断增长。

人类基因组计划、美国塞莱拉遗传信息公司、美国《科学》杂志和英国《自然》杂志联合宣布,继科学家绘制成功人类基因组工作框架图之后,他们又绘制出了更加准确、清晰、完整的人类基因组图谱,对人类基因的面貌有了新的发现:①基因数量少。一些研究人员曾经预测人类约有14万个基因,但塞莱拉公司将人类基因总数定在2. 6383万到3.9114万个之间。如果最终确定出的基因数在这个范围内,比如3万个左右,那么,人类只比果蝇多大约1.3万个基因。塞莱拉公司的科学家测出的序列准确地覆盖了基因组的95%,并已经确定了所有基因的2/3,平均测序精度为99. 96%。②人类基因组中存在“热点”和大片“荒漠”。人类基因组序列中所谓的“荒漠”就是包含极少或根本不包含基因的部分,基因组上大约1/4的区域是长长的、没有基因的片段。基因密度在第17、第19和第22号染色体上最高,在X染色体、第4、第18号和Y染色体上相对贫膺。③35. 3%的基因组包含重复的序列。这意味着所有这些重复序列,即原来被认为的“垃圾DNA”应该被进一步研究。事实上,第19号染色体57%是重复的。除了重复序列,科学家还鉴定了210万个人与人之间不同的基因序列,这些序列被称为“单核昔酸多态性”。④地球上人与人之间99.99%的基因密码是相同的。研究发现,来自不同人种的人比来自同一人种的人在基因上更为相似。在整个基因组序列中,人与人之间的变异仅为万分之一。

2002年5月,英国、加拿大和美国科学家通力合作进行的小鼠基因组计划取得重大进展,完成了98%的小鼠基因组绘图工作。小鼠基因组的物理图谱包括296个重叠克隆群(contigs)和16 992个独特的标记。

参与这项国际合作计划的主要是一些公共研究机构,包括美国国家人类基因组研究所、华盛顿大学和英国剑桥大学等。以鼠为模型,科学家们已经在癌症等人类疾病的研究方面获得了很多重要成果;由于鼠实际上携带着与人近似的基因,因此鼠的基因组图谱信息将有助于更深入了解很多人体基因的功能。破译鼠的遗传密码将为研究人类基因组提供重要参考。

科学家们指出,虽然草图还需要进一步完善,但它的详细程度,已可以让遗传学家们对一些感兴趣的问题进行研究。研究发现,鼠基因组共有约27亿个碱基对,比人类少15%,但其包含的基因数目约在3万个左右,与对人类基因数的估计非常接近,而且有99%的基因都能在人类基因组中找到相应的同源基因,人与鼠有着相近的基因数量、相似的基因结构,却有着迥然不同的表型与性状,这表明非编码区(non-coding region)和基因调控(gene regulation)研究的重要性。

随着人类基因组计划的不断深入,人类基因组DNA序列草图已经提前完成。在后基因组时代,首先要求利用这些序列信息来研究基因及其蛋白质产物的结构与功能,更进一步则是其在细胞和组织发生、发展、衰老、死亡,正常与疾病状态下的功能机制。目前从基因组到蛋白质组的研究模式已经初步形成,即基因组(测序)一转录子组(cDNA芯片)一蛋白质组(2D-gel,质谱分析、测序)的大规模、高通量的研究策略。对于蛋白质结构和功能,尽管可以通过实验的方法来实现,但由于目前的蛋白质检测的技术水平还跟不上新基因数量的增长,通过快速预测蛋白质结构与功能的生物信息学工具,对研究蛋白质组尤其是对那些通过实验难以测定结构的蛋白质分析则具有更大的价值。

当代科学的迅速发展越来越依赖于不同学科之间的交叉与融合。学科交叉是科学发展的必然趋势,是增强科技创新的重要途径。生物信息学是一个以数、理、化知识为基础,将计算机和信息科学方法运用到生命科学的学科。在过去的10年中,通用或专用生物信息数据库得到了快速构建和扩建。同时。在序列的搜索和对比、基因组图谱构建、进化和系统发生等方面取得了很大进展。目前的方法学和技术还不能完全解释和破译人类基因组信息。这就要求数学、物理、化学、分子生物学、统计学、计算机科学、信息科学等学科共同密切合作。在理论研究、软件的开发和说明、数据库的集成和扩增、生物数据的监控方面加强研究,使

生物信息学在揭示生命本质的过程中更加成熟和完善起来。

第二节生物信息学的研究方法和内容

一、研究方法

(一)计算机及互联网的运用

计算机和国际互联网络的高速发展给生物信息学带来直接推动,稳定的计算机及网络环境是生物信息学研究的保障。

计算机操作平台是计算机系统的重要组成部分,操作平台的性能对数据处理效率产生直接影响。专业机构使用UNIX工作站以应对高通量数据处理的要求,PC机用户使用Linux 操作系统或Windows操作系统,对于复杂的数据处理,PC机在速度上处于劣势。

计算机语言是生物信息学研究工作中不可或缺的工具,可选择多种计算机程序设计语言,包括C语言、Perl语言、Visual BASIC语言等。

网络文件传输协议(FTP )的使用十分简单,是网络下载各种文件的有利工具。在用户计算机(客户)和远端服务器之间建立起连接,并在整个FTP任务过程中保持连接,文件的传输速度非常快。建立FTP连接并传输文件,用户必须在远端服务器上有账号。全球科研界提供了许多免费文件和程序,访问这些文件只要使用匿名的FTP系统建立连接。在这个系统下,用户与远端服务器连接时并在用户名中输入、nonymous”,在口令中输入个人电子邮件地址。

电子邮件是一个方便快捷的发送、接收及回复信息的媒介,在许多地方实际上已成为不可或缺的工具。它的优势主要有:传递速度比邮政服务快得多;传送信息更为清晰明确;接收者可以有很大的自由度来决定是否回复,从而更好地控制自己的工作节奏;提供了一种方便的整理、保存信息的途径;成本很低,或不需成本。

(二)生物信息及资源的运用

随着网络的快速发展,生物信息网络资源数量高速增长,而且以覆盖面广、更新频率高的特点,为每个生命科学工作者提供了极其便捷、快速的实用工具,充分利用网络中生物信息资源,可以使自己的研究方向与同时代的科学发展保持一致性。下面列举一些相关网站、搜索引擎及研究机构。

1.生物信息学网站

(1)国际网站:

美国国家生物技术信息中心(national centre for biotechnology

information,NCBI)http://www.ncbi.nim. nih.gov/

欧洲分子生物学实验室(EMBL)http://www. embl-heidelberg. de/

日本核酸序列数据库(DDBJ)http://www. ddbj. nig. ac. jp/

欧洲分子生物学网络组织(EMBnet )http://www. embnet. org/

哈佛生物实验室http://golgi. harvard. edu/

人类基因组图谱计划资源http://www. hgmp. mrc. ac. uk/

生物信息中心http://www. bic. nus. edu. sg/

生物世界http://www. bioworld. com/

生物空间http://www. biospace. com/

生物在线http://www. bio. com/os/start/home. html

生物信息资源http://www. genet. sickkids on. ca/bioinfo_resources/

(2)中国网站:

北京大学生物信息中心http://www. cbi. pku. edu. cn/

中国科学院基因组信息学中心http : //www. genomics. org. cn: 8080/

bgi/index. jsp

中科院计算所生物信息实验室http://www. bioinfo. org. cn/

中华生物信息网http://www. bioinfochina. com/

中国医学生物信息网http : //cmbi. bjmu. edu. cn/

军事医学科学院生物工程研究所生物信息网http://bioinf. bmi. ac. cni

postnuke/index. php

中国生物信息网http://www. biosino. com. cn/

天津大学生物信息中心http://tubic. tju. edu. cn/

中山大学生物信息中心http : //genome. zsu. edu. cn/

生物引擎http://www. bio-engine. com/

中华基因网http ; //www. chinagenenet. com/

生物通http://www. ebiotrade. com/’

新生命http://www. newlifebp. com/

华大基因研究中心(北京)http://www: genomics. org. cn/index. htm

37℃医学网http://www. 37c. com. Cn

2.网络搜索引擎

哈佛大学生物信息搜索引擎Biology Links http://golgi. harvard. edu

Pedro 工具搜索引擎http : //www. public. iastate. edu/pedro/reasch-

tools.html

DBCat目录http : //www. infobiogen. fr/services/dbcat

METACRAWLER http://metacrawler.com/info.metac/dog/index:

html

生物引擎文献检索系统http://www. bio-engine. com/resource/journal/

index.asp

MEDLINE文献查阅http: //www. healthgate. com/healthgate/med-

line/search-advanced.html

加利福尼亚州立大学检索系统http://arnica. csustan. edu/index. html

BCM分子生物学资料库http://searchlauncher. bcm. tmc. edu/

BioABACUS生物学缩略词搜索http//www. nmsu. edu/-v molbio/

bioABACUShome.html

生物学网络资源索引http://www. academicinfo. net/biology. html

基因组网络资源库http://www. hgmp. mrc. ac. uk/GenomeWeb/

3.部分数据库资源

爆炸性增长和复杂程度的增加是生物信息学数据库的重要特征。出于其覆盖面广,分布分散且格式不统一,因此一些生物计算中心将多个数据库整合在一起提供综合服务,以方便使用。目前常用的数据库列举如下:

(1)核酸数据库:

欧洲分子生物学实验室核酸序列数据库EMBL (Europe molecular bio-

logy laboratory)http://www. ebi.ac.uk/embl/

国家生物技术情报中心NCBI (national center for biotechnology infor-

mation)http://www. ncbi.nlm.nih. gov/GenbankOverview. html

日本核酸序列数据库DDBJ (DNA Data Bank of Japan ) http//www.

ddbj.nig.ac.Jp/

瑞士生物信息学学会的ExPASy http://www. expasy. org

HIV序列数据库http://hiv-web. lanl. gov/

序列表达标记数据库http://www. ebi. ac. uk/imgt/

真核启动子数据库http://www. epd. isb_sib. ch/

(2)基因组数据库:

人类基因组数据库(GDB)http://www. gdb. org/

线虫基因组数据库(ACeDB)http://moulon. inra. fr. /acedb/acedb. html

果蝇基因组数据库http://www. fruitfly. org/

酵母菌基因组数据lVhttp://genome-www.stanford.edu/Saccha-romyces/

大肠杆菌K12基因数据库http : //bmb. med. miami. edu/EcoGene/

EcoWeb/

沙门菌LTZ基因组数据库http : //www. ucalgary. ca/^- kesander/

salty.html/

玉米基因组数据库http://www. agron. misouri. edu/

(3)蛋白质数据库:

瑞士蛋白序列数据库http://www. ebi. ac. uk/swissprot/

蛋白质分析专家系统http://www. expasy. ch/

限制酶数据库http://rebase. neb. com/rebase/rebase. html

蛋白结构信息数据库http : //www. infobiogen. fr/

大肠杆菌基因一蛋白两维凝胶数据库http : //www. ucalgary. ca/-kesa-

nder/salty.html

4.部分研究机构资源

(1)英文网站:

人类基因组计划http://www. genome. gov/

国际遗传工程和生物技术中心http://www. icgeb. trieste. it/

欧洲生物信息学研究所http://www. ebi. ac. uk/

英国Sanger测序中心http://www. sanger. ac. uk/

瑞士生物信息学研究所http://www. expasy. ch/

澳大利亚国家基因组信息服务中心http:刀www. angis. su. oz.“”/

南非国家生物信息研究所http://www. sanbi. ac. za/

美国癌症协会http://www. cancer. org

美国医学会http://www. ama-assn. org

美国生物化学和分子生物学协会http://www. faseb. org/asbmb/

美国细胞生物学协会http://www. faseb. org/aseb/

美国微生物协会http://www. asmusa. org

美国遗传协会http://www. faseb. org/genetics/gsa/gsamenu. html

澳大利亚遗传协会http://gsa. angis. org. au/

日本国立遗传研究所http//www. nig. ac. jp/

国际生物学信息联合组织http://www. nbii. gov/

国际生化和分子生物学联盟http://www. iubmb. unibe. ch/

东南地区遗传学协会http ; //www. emory. edu/PEDIATRICS/sergg/

sergg.html

(2)中国网站:

中国科学院http://www. cas. ac. cn/cas. html

国家863计划(生物领域)http://www. 863. org. cn/biology八ndex. html 火炬计划http://www. chinatorch. gov. cn/

中国科学院动物研究所http:刀www. ioz. ac. cn/

中国科学院遗传研究所http://www. genetics. ac. cn/

中国科学院植物研究所http://www. ibcas. ac. cn/

中国科学院水生生物研究所http://www. ihb. ac. cn/

中国科学院上海细胞生物学研究所http://www. cell. ac. cn/default2. html

中国科学院生物物理研究所http://www. ibp. ac. cn/

中国科学院微生物研究所http:刀www. im. ac. cn/

国家自然科学基金委员会http//www. nsfc. gov. cn/

中国科学院国家基因研究中心http://www. ncgr. ac. cn/

(三)数据分析软件的运用

1.生物软件的获取

完善的大规模数据库提供分析软件的在线使用,或下载到本地计算机,有许多生物学网站提供相关软件的下载。

(1)英文专业软件网下载站点:

http://www. biosoft.com/

http://www. labonweb.com/

http://www. biosoft.it/

http://psyche.uthct.edu/ous/software.html/

(2)中文文专业软件网下载站点:

中国生物软件网http://www. biogene. com. cn/

生物软件网http://www. bio-soft. net

免费生物化学软件http://www. biolover. com/biochemsoft/’

2.生物软件

参照国内生物软件网(http : //www. bio-soft. net)的分类法将上百种生物软件分为三维分子类、DNA分析、RNA分析、蛋白质分析、生化教学、生化工程、引物分析、进化树分析、质粒绘图、图像处理、序列格式转换、序列综合分析、基因芯片、数据处理、生物学数据库、在线综合工具、在线蛋白工具、在线核酸工具、在线引物设计、在线生物资源等多种类别。这些软件可下载到本地电脑使用,但有的软件部分功能受限制。

(1) DNA分析软件:

DNAClub PCR处理软件:

jambw 1. 1:JA V A语言编写的分子生物学软件jambw是在浏览器下工作的。jambw是一个分子生物学软件包,功能包括:序列格式转换、求序列的互补序列与逆序列、将DNA 序列翻译成蛋白质序列、序列分析、多序列比较、特征位点查找、三维分子结构查看、PCR 引物设计、缓冲液设计等功能,包含了分子生物学研究常用的一些操作。

DNA Tool 6.0.118:是一个功能很全面的DNA序列分析工具包,共享软件,允许免费使用3个月,它的功能包括:序列编辑与类似序列查找、建立自己的序列数据库赴行查找、多序列比较、序列翻译、蛋白质序列分析、引物设计与分析、基因表达序列分析(SAGE)功能等,还包括DNA分析常用到的一些功能,如碱基百分组成、分子质量计算等。

pDRAW32 1.1.48:是一个非常方便的质粒绘制工具与DNA分析工具。包括DNA序列输入与分析、限制酶消化分析以及环形与线性DNA图形输出等许多功能。

AnnHyb v. 4 BETA:DNA工具软件,对短DNA序列,它可进行互补序列生成、熔解温度预测.GC百分含量计算、分子质量计算、摩尔消光系数计算等功能。增加了许多功能,包括序列检索、注释、编辑、格式转换、限制酶分析、翻译、序列查找、逆序列与互补序列、序列统计、开放阅读框(open read frame,ORF)查找、寡序列分析、探针分析等。

RESTRICTION ANAL YSIS Beta版:用来获得限制酶消化结果。用户定义需消化的序列以及在限制酶数据库中指定所用的限制酶,程序便输出消化的结果。

ABIView 1.0:可打开ABI格式序列文件,查看与编辑。可在Windows3. 1与Windows95,98平台使用。

Chromas 2. 22和Chromas 1.45:另一个可打开ABI格式序列文件,查看与编辑的Windows 95软件。共享软件,可免费使用60天。

Sequence viewer 1.0:是一个图形界面的工具,用来获取与观察从GSDB(The Genome Sequence DataBase)获取的DNA序列数据及其关联特性的工具。

DNAssist 2. 0:著名的DNA分析共享软件,含有部分蛋白质序列分析功能。可以全功能使用90天。

DNAProbe为了确定蛋白质家族新成员的基因序列,常常需要根据蛋白质序列对比设计核昔酸序列。DNAPROBE便是用来帮助在这种情况下进行核苷酸序列设计的程序。

DnaSP 3. 5:DNA序列种群遗传学分析软件,输入比对后的DNA序列文件,进行种群内和种群间的多态性、不稳定连接、重组及基因转变分析,输出为表格与图谱。

DFW 2.21:DNA for Windows的缩写,是一个易于使用的DNA分析软件,主要用于小规模序列分析,例如,用来编辑与显示ABI仪器获得的文件。程序具有DNA翻译与限制酶分析功能,并可以利用外部程序CLUSTALW进行序列比对。

Artemis R4:是一个免费的DNA序列查看器与注释工具,可以以图形形式查看序列的各种分析结果与特性。以JA V A语言写成,需要安装JREl. 2,直接双击便可执行。程序读取EMBL与GENBANK格式的序列与单纯DNA序列,为英国Sanger中心推出。

ACT R1:是Artemis Comparison Tool的缩写,DNA序列比较查看器,基于Artemis程序写成,也是以Java语言编写,需要安装JRE1. 2,直接双击便可执行。主要用来读取与显示blastx 与tblastx的比较结果,也可以读取与查看EMBL与GENBANK数据库的条目。

GDA 1. 1:Genetic Data Analysis的缩写,主要用来进行不连续基因数据的统计分析,输入文件格式为NEXUS,BIOSYS,Weir与GeneStrut。

RDP 1. 09:recombination detecting program的缩写。从一组比对的核酸序列中查找潜在的重组体。输入的比对核酸序列文件格式支持FASTA,GCG,NEXUS,CLUSTAL和DNAMAN 等格式。

Sequencher 4.0.5 Demo:是装配DNA小片段成为大的连续序列或层叠(序列)群(Contig),还具有ORF分析、蛋白质翻译、酶切位点作图、杂合子识别等分析功能的软件。演示版除了酶切位点作图功能可以免费使用,能够打印、拷贝与贮存,其他功能不能打印、贮存与拷贝。用作练习的两组数据:尼古丁受体自动数据与手动数据。

MeltCalc免费简易版和MeltCalc 2-0: 6无限时专业版,自动计算DNA序列热力学数据的Excel电子表格宏软件。基于热力学计算,根据输入的核酸序列、自动计算热力学数据、熔解温度(Tm),设计杂交探针。软件不支持引物设计,所以可与Prime3引物设计)软件联合使用。

基因探索者1. 0 Demo:我国自行开发的第一个中文界面的功能集成、高效、快捷的基因分析软件,拥有功能:DNA序列的常规分析统计;定位ORF与外显子;Motif搜索;蛋白翻译oligo分析;引物设计;电子酶切和载体构建;同源序列对排;序列拼接以及相关的数据库系统等。演示梅拥有部分功能,包括互补链、开放阅读框定位、DNA翻译、质粒绘图等等。

ConsInspector 3. 3: DNA蛋白结合位点预测识别软件。软件包括1996年8月的共有序列库(consensus library).通过比较预先设定的共有序列库来识别预测共有序列。

MatInd 2. 2与MatInspector 2.2:是两个快速匹配DNA序列与已知共有序列的软件工具,

内含TRANSFAC 4. 0库。

GBuilder 1. 23: JA V A语言编制的用来分析与显示DNA序列〔例如来自高通量基因测序与表达序列标签数据库的序列数据」的软件GBuilder使用CORBA链接到位于EBI的数据库服务器。使用此程序,需要安装java运行环境。

GenomePixelizer 2002.2.15版:是用来帮助理解基因组中的簇基因(clustering gene)之间的相互关系的软件。特别是检测基因组中的重复事件(duplicating events),追踪进化的“足迹”以及显示遗传图等。程序需先安装TCL/TK后才能执行。

LabBook Genomic XML Viewer 3.3.0.41:是一个图形化显示并处理GenBank序列数据的免费软件。

Gene Construction Kit 2.5 Demo:与大多数分析的软件不同,它管理并显示克隆策略中的分子构建过程,包括分子构建、电泳条带。另外,还可以质粒作图(有序列、没序列均可)。

Genalysis 2.1.2评估版:比较基因组或大量基因序列的工具软件,可发现精确匹配序列片段,还能使用各种基于因特网的工具进行分析。该软件通过比较一个相类似的基因组序列,发现新基因组序列中的基因。

GenescanView4和GenescanView8查看基因扫描(genescan)格式,fsa文件并计算峰值大小的小软件。

WinGene 2. 31:分析核酸序列的多用工具软件。拥有一些常用的核酸序列分析功能。

Sequin 4. 0:是一个独立的程序,由美国国家生物情报中心开发,用来向三大核酸数据库GenBank,EMBL,DDBJ查询与提交序列数据,是非常重要的一个工具软件。

(2)蛋白质分析软件:

AnthePro 5. 0:蛋白质序列分析软件包,包括了蛋白质研究领域所包括的大多数内容,功能非常强大。

PSAAM:蛋白质序列分析软件包。

VHMPT:Viewer and Editor for Helical Membrane Protein Topologies的缩写,是螺旋状膜蛋白拓扑结构观察与编辑软件,可以自动生成带有跨膜螺旋的蛋白质的示意性二维拓扑结构,并可对拓扑结构进行交互编辑。安装Tel8. 0方可运行。

aminoXpress 5. 02:是一个多功能蛋白质分析软件包,整合了生化学家研究蛋白质最基本的运算与分析。

WinPep3. 0l:分析蛋白质序列的工具软件。拥有一些常用的蛋白质序列分析功能。

MPEx 1. 5: Membrane Protein Explorer的缩写,研究膜蛋白拓扑学结构和其他特性的JA V A软件。软件可以很方便地使用膜蛋白拓扑结构数据库MPtopo。需要JA V A运行环境。

(3)三维分子软件:

RASMOL 2. 7. 2. 1:观看生物分子3D微观立体结构的软件,可以旋转,以多个模式观看,并可以存成普通图形文件。

RasTop 2. 0:为RasMol的图形用户界面软件,免费,简化RASMOL的使用。

CHIME 2.6 SP3:是IE与NetScape浏览器插件,安装后,可以直接用浏览器观看PDB 格式的文件,直接在浏览器中观看3D分子。不需运行RASMOL。

Mo1Mo1 2k. 1:将PDB等格式的蛋白质文件通过微调,存成普通的图形文件。

CrystInfo 1. 0:是一个Windows应用程序,用来快速、方便地构建、观察与检查晶体结构。可以使用几个分子展示模式,并且根据内建的光线追踪算法,也可以使绘出的图像带光影效果,如阴影与反射效果。晶体的任何参数可以随意调整,可以改变晶体内单个原子、原子类型与键型,并可以改变晶体自身的空间群体与单位晶格的参数。

PDVIEWER:观察三维分子PDB文件的程序。

Weblab Viewlite 4.2:三维分子浏览工具,是分子模拟公司出品的软件Weblab ViewPro

的简化版,免费推出,功能十分强大。可读取PDB格式及其他数种格式的分子文件,易于操作,性能不亚于RasMol。

Weblab ViewPro 4.2 Demo:三维分子浏览工具,是分子模拟公司出品的软件,30天试用版,功能十分强大。可读取PDB格式及其他数种格式的分子文件,易于操作。

ICMLite 2.8:三维分子浏览工具,是Molsoft公司出品的软件ICM的简化版,免费软件,功能十分强大。可读取PDB格式及其他数种格式的分子文件,易于操作。

VMD 1. 72:用来显示生物分子的微观立体结构,可以利用内建的功能,做出动画效果。

CN 3D 3. 0:在线作为客户端可视并交互地观察NCBI Entrez数据库的立体蛋白质序列,也可用来离线观察蛋白质序列与序列排序。能够读取MMDB格式文件,不能读取PDB格式文件,但可以输出为PDB格式文件。

WPDB 2.2:美国国家计算机科学与工程学实验室开发的基于Windows的PDB文件查询与处理分析软件,可进行各种检索、序列比对检索、氨基酸特性图分析、3D结构显示、几何学计算(键角、键长)等功能,可以直接调用Rasmol观看3D结构。可以使用WPDBL 建立自己的PDB文件数据库。

DTMM 4.0 2001.12.21版:是一个简单易用的三维分子模型显示、编辑与构建程序,可以以各种模式显示三维分子,并能进行编辑。License文件放在安装目录下才能运行。

MOLE 1. 1. 8 Demo:是一个高性能的大分子三维图形显示计算工具,它读取PDB格式文件,容易使用,可以输出到图形,显示形式多样,而且可同时以不同形式显示同一分子。虽然是演示版,但只有少量功能限制,包括输出图形时在图形上显示DEMO字样,一些计算功能限制以及查询到PDB文件后只能到网上下载而不能直接使用。

gopenmol 2. 1:是一个显示并分析分子结构及其特性,计算分子轨道、电子势能的软件包,支持多种分子结构格式,包括PDB格式。

POV-Ray 3.5 beta rc:是一个高质量、完全免费三维图像的工具,在分子生物学上,用它生成高质量的三维大分子图像。

WinMegaPov 0. 7:是POV-Ray非官方编译版本,三维渲染效果更好。需要预安装POV-Ray。

Mol2Mol Demo 4. 1:主要用来进行各种分子文件的转换,支持30种主要分子格式,也可以用来进行三维分子的简单显示。可将PDB格式输出为POV格式后,用POV-Ray进行渲染,生成三维图形。演示版只支持样板文件与原子数小于20的分子文件格式的转换。

Mo1POV 2.0.8:是格式转化工具,可以将大分子PDB格式文件转化为POV格式,以便用POV-Ray进行三维渲染,生成高质量的分子三维图形。软件有许多选项,只需设定这些选项,便能生成相应的POV格式文件。

POVChem 2. 1. 1:将PDB格式分子文件转化为POV格式,再使用POV-Ray v3. 1g进行3D加工。共享软件,可以使用30天。

Ortep-3 for Windows V er. 1. 0:用来生成分子的热椭圆形点图。可结合使用POV-Ray生成分子图。

PWT

Mage 6. 02:读取并演示Kinemage格式文件的专用软件。、Kinemage格式是一种电脑图像交互式演示格式,使用MAGE软件进行查看,整个图像可实时旋转、三维动画演示,部分图像可隐藏和显示。Kinemage文件是一种文本文件,文件内含有各种信息与命令。

Prekin 6. 02:将PDB格式文件转换为对应的Kinemage格式的专用软件。

Swiss-PdbViewer 3. 7:是一个界面友好的应用程序,使用方便,可以同时分析几个蛋白质PDB文件。可以将几个蛋白质叠加起来用来分析结构类似性,比较活性位点或其他有关

位点。通过菜单操作与直观的图形,可以很容易获得氢键、角度、原子距离、氨基酸突变等数据。

DINAMO:蛋白质序列比对编辑与三维模型构建工具软件。可以根据蛋白质序列与已知结构蛋白质的类似性与预测折叠的类似性构建简单三维模型。以JA V A语言写成,必须先安装CHIME软件后才能使用,用支持JA V A的浏览器运行。

PCMolecule2 Lite:是PCMolecule 2. 0的简化版,免费软件,用来方便地查看PDB格式文件,可自由设定背景颜色、打光方向,并能根据设定让分子自动旋转。

StrukEd Demo:化学分子编辑与三维模型生成软件,用于编辑化学分子二级与三级结构,同时可以进行一些简单量子化学与电子结构计算,支持POV-Ray格式输出,可用POV-Ray 进行分子三维结构进一步渲染,生成分子艺术图片。Demo版有一些限制仅可编辑原子小于10个等。

JMVC 2:JA V A3D Molecular Visualisation System的缩写,使用JA V A技术编写的三维分子查看器,需要安装JA V A3D后才能执行。

Re-View 1. 0:为读取及分析XYZ格式三维分子文件的软件,可进行三维分析、做分子动画及几何学分析,还可输出为POV格式文件,进行进一步三维渲染。

Oscail 9:用来处理、定义与检查小分子单晶的软件包,可以显示高质量图片,也可进行三维渲染,还可以进行动画处理。软件包内还包括了粉晶谱(powder pattern)模拟软件。

Moilin:分子构建与观察软件,是Tinker软件的Windows界面程序。

Tinker 3. 9:为DOS下的分子设计建模软件,可使用许多常用参数集。

Biodesigner 0. 60:免费的分子建模与显示软件,支持多种三维分子格式。

MoluCAD 1999.04.19版:是一个全功能的分子建模与显示工具软件。使用者可以快速生成模型,以各种角度观看,生成动画并将数据保存到硬盘。

Viewer Activex Control 4.0:三维分子显示控件,用来在网页中,OFFICE各个软件的文件中,VB, VC应用程序中显示三维分子,支持许多标准三维分子格式。

MarvinView 2.9.12:是一个JA V A语言编写的化学分子二维与三维显示程序,可以与化学绘图中的MarvinSketch 2. 9结合使用,程序运行需要JA V A虚拟机程序。

ACD/3D Viewer for ISIS 4.5:免费的ISIS Draw三维显示插件,需要先安装ISIS Draw。

Amira 2.3 Demo:一个高等三维显示建模系统,功能非常强大。不仅可以显示三维分子,还包括通过获得CT、显微图像,核磁等数据生成三维图像。

AmiraMol 0. 91:为Amira 2. 3的插件,是显示三维分子的增强工具,必须先安装Amira 2. 3才能使用,解压到Amira 2. 3的安装目录后使用。

Visualize 1. 30:分子建模和研究软件包,还能进行能量与几何学优化计算等。

ScientificGL 1. 2:是一个帮助生物科学软件设计人员的C-t-+ OpenGL API三维分子开发工具,内建功能可以很方便地渲染原子与分子键三维结构,并计算生成表面。

Sojourner 1. 10;是一个DOS下的程序,用来找出小蛋白质的最小能量构型,同时以矢量图形实时演示。它使用一个基因学算法探测构象空间,计算内部原子的交互能量。

PyMOL 0. 80:一个免费且公开源代码的三维分子显示、动画、编辑程序。

Qmol 2. 0:一个基于OpenGL的三维分子显示软件。

Protein Explorer 1. 922 Alpha:RASMOL衍生出的软件,具有速度快的特点。

WinMGM 2. 0b:一个分子图像程序,可显示和处理三维分子,需要安装JA V A虚拟机。

(4)引物分析软件:

primer Premier 5. 0:序列分析与引物设计。

Oligo 6.57:引物分析软件,主要应用于核酸序列引物分析设计软件,同时计算核酸序列的杂交温度和理论预测序列二级结构。

Primer D'Signer 1. 1:免费的引物设计辅助软件,专门用于pASK-IBA和pPR-IBA表达载体,简化引物设计工作。

Array Designer 2. 00 Demo:DNA微矩阵软件,批量设计DNA和寡核苷酸引物工具。

Beacon Designer 1. 01 Demo:PCR定量分析中分子信标(molecular beacon)设计的软件。

NetPrimer:基于WEB界面的引物设计程序,包括JA V A程序和帮助文件,解压后,可在本地直接使用。

(5) RNA分析软件:

RNA draw 1.1b:RNA二级结构分析软件,对RNA一级序列进行二级结构分析作图。

RNAstructure 3.71:输入或载入RNA的一级序列,根据最小自由能原理,依据一定算法,预测出其二级结构图。

Tcl 8. 3. 2 ,ClassyTkl. 0. exe和RnaViz 2. 0:界面友好的RNA二级结构图绘制程序。可生成发表质量的二级结构图,可显示一些特殊结构。

loopDloop 2. 07b:JA V A语言写成的绘制RNA二级结构的软件,使用时需要安装JA V A 虚拟机。

Circles 0. 1. 0:使用比较的方法分析RNA二级结构软件,并以标准格式输出预测的二级结构。

RNAFold:RNA二级结构分析软件。

(6)进化树分析软件:

Phylip 3. 6a3:进行进化树分析,可以分析DNA与蛋白质序列、限制位点等,并可绘制进化树。程序含有许多选项可以精确控制与分析。

TreeView 1. 6.6:是用来生成与打印进化树的软件,它可以读取NEXUS与PHYLIP生成的进化树格式文件,生成进化树,并输出到打印机。

GeneTree 1. 3:是用来比较基因与种系进化树的程序。

NDE 0. 5. 0:是用来编辑NEXUS格式文件的程序,它只具有编辑功能,但是不具有分析功能。

TreeMap 1. 0:用来可视地比较主、从进化树的软件。

Spectrum:用来分析进化信息而不用将之转化为进化树。

Phyltools 1. 32:Phylogenetic Computer Tools的缩写,是一个与进化树软件Phylip共同使用的软件,用来计算与处理进化树数据的软件,包括RFLP、RAPD与AFLP数据。

tree-puzzle 5. 0:核酸序列、蛋白质序列相似性分析及进化树构建工具。根据序列数据的最大相似性构建进化树,可对大量数据进行快速分析构建,程序还包含数个统计测试。

ATV 1. 92:A Tree Viewer的缩写,是一个JA V A语言编写的工具,用来显示“New Hampshire"与NHX格式的进化树文件,需要安装JA V A1.1以上版本的JA V A虚拟环境才可以运行。

TREECON 1. 3b Demo:是一个主要用来构建和绘制进化树的软件包,还可进行序列距离评估计算、文件格式转换等工作。演示版不能打印与存贮,但可以配合截图工具使用。

ProBiosys 1. 0:主要用来比较表现型分类法数据和分析计算核酸序列数据距离值的软件,进而构建进化树。

COMPONENT 2. 0:分析进化树免费软件。

(7)图像处理软件:

ImageTool (IT)3.0:是一个免费的科学用途的图像处理与分析软件,可以显示、编辑、分析、处理、压缩、打印灰度图形或彩色图形。可打开超过22种图像格式。在生物领域,它用于是各种电泳胶图的分析。只要有扫描仪,便能利用计算机完成胶图的各种处理,包括注释、透光率扫描等工作。

Image) 1. 26:包括JA V A运行环境。一个用JA V A语言写成的科学用途图像处理软件,可以显示、编辑、分析、处理8位、16位、32位图像。

Cross Checker 2.91:RFLP,RAPD与AFLP遗传指纹图分析软件。

Band Leader 3. 0:凝胶图像处理软件,为共享软件。

Scion Image 4. 02Beta:是一个免费图像处理与分析工具。是苹果机上的Windows版,用来显示编辑分析各种图像。读取格式为TIFF与BMP格式,是一个专业图像分析软件。

OSIRIS 4.12:是一个通用医学图像处理与分析软件。

Melanie 3 Viewer:免费软件,用来查看使用Melanie3软件获得的凝胶图片与相关数据,也包括一些凝胶数据分析功能。

Smart Draw 6. 0 Demo:30天全功能演示版,绘制流程图、组织图、科学绘图、表格、平面布置图非常方便。

GIMPWin 1. 2-3:是符合GNU协议的图像处理自由软件,原软件是UNIX版,经改造为Windows版。

ChromoZoom 1. 1:是设计用来比较两个图像的相同与不同之处的软件。

bandscan 5. 0 Demo:蛋白质凝胶电泳图像分析软件30天内30次试用版,功能包括凝胶图像分析、光密度扫描、分子质量计算、自动查找条带、杂点去除、电泳迁移校正功能。

SigmaScan Pro 5. 0 Demo:是一个图像分析软件30天全功能演示版,可以进行数字图像的分析处理,得出科学结论。

SigmaGel 1. 0 Demo:凝胶图像分析软件,30天Demo版。

TotalLab 2. 0评估版:是一个图像分析软件,对DNA,蛋白质凝胶电泳图像、阵列,点杂交与克隆等图像可以进行很方便的处理。评估版有时间限制。

Lablmage 2.62评估版:凝胶图像分析软件,30天免费使用。

GelDiff 1.0:是用来定量比较两个2D凝胶图像的不同之处的JA V A软件,需要先安装JDK后才可以运行。

Timediff 1.2:是一个分析蛋白质/基因表达图谱时间序列的JA V A软件,需要先安装JA V A JDK才可以运行。

QuantiScan 2. 1 Demo:使用简单功能专一的凝胶扫描、分析软件。

PDQuest 6. 2. 1:是一个分析二维凝胶并生成数据库的标准软件。30天试用版。可以同时分析100个凝胶图像,生成包含1000个凝胶图像的数据库。

digitizer 3. 3:图形数字化软件,可以将曲线图转化为数据与等式。当用仪表作曲线图后,用扫描仪扫入计算机,存成JPEG格式,便能用此软件处理了。首先确定X轴与Y轴及刻度,再在曲线上确定数个点,进而得到点的横、纵坐标并能拟合出X,Y公式。

Grafula 3 v2. 10:是一个将图形数字化的软件。软件读取BMP格式的图像,设定坐标,将图形、曲线数字化。可手动、自动、半自动进行曲线的数字化。

Graph Digitizer 2.14:是一个将图形转化为数字的软件,共享软件,使用期限一个月,支持bmp, jpg,tif ,gif格式图形。

Peak Explorer 1. 01:用来自动处理试验图谱图像软件,软件自动定位峰点,计算峰面积,绘制峰基线和左右边界等。

(8)序列格式转换软件:

vised 1. 1:Visual Sequence Editor 1. 1序列输入分析和格式转换软件。

ForCon 1. 0:蛋白质与核酸序列格式并无统一标准,不同的数据库与不同的程序定义了不同的格式文件,ForCon 1. 0是一个核酸与蛋白质不同序列格式文件的转换软件,可双向转换各种常见的多序列格式文件。支持连续序列形式与隔行序列形式,也可互相转换。

SeqVerter 1. 581:是一个序列格式转换软件,它可以同时打开多个序列文件、查看序列、

选择序列的一部分进行格式转换、将来自不同文件的序列并入一个多序列文件以及将序列从一个多序列文件中分成不同单序列文件。

GeneStudio Pro Public Beta 6:序列格式显示、编辑与转换工具软件,可以免费使用60天。

FASTA/BLAST SCAN v4. 1 beta:是一个补充程序,用来对FASTA与BLAST查询输出的文件进行处理,并以Pearson格式输出序列文件,便于使用其他分析软件分析检索出的序列。

RevComp 2.4:序列格式转换软件,获得DNA序列的互补序列并保存为文本格式。

(9)序列综合分析软件:

pcgexe.exe ,pcgene.r00 ,pcgene.r01和pcgene. r02:分子生物应用软件,共4张rar压缩pcgene。可以在ms-dos下运行。

MACAW 2.05:多序列构建与分析软件。在大量的蛋白质序列与DNA序列数据中,了解其相互关系,查找有用的片段。这样的片段常常显示类似的分子结构与生物特性。运用统计学方法,利用一定的运算规则,使用计算机来查找这些片段是有效的方法。

Clustal W 1. 8:用来对核酸与蛋白质序列进行多序列比较的软件。多序列比较在分子生物学中是一个基本方法,用来发现特征序列,进行蛋白质分类,证明序列间的同源性,帮助预测新序列二级结构与三级结构,确定PCR引物,以及分子进化分析。

FASTA 3. 4t 1 Od 3:在Internet上有许多的在线FASTA查找服务,查找某数据库中的同源序列,也可下载后离线使用。将一条序列与另一条序列进行比较或在数据库中查找同源序列并输出。

GeneDoc 2.6.02:帮助研究人员进行多序列比较,并可以用各种方式标记序列,生成发表质量的输出报告,还能进行相关的分析。

BLAST 2.2.2:在数据库中查找某一个序列的类似序列,目前在Internet网上有许多在线的BIAST查找程序。专门用于查找各大数据库中与用户提交的序列类似的序列,分成五个不同的程序,分别为blastp, blastn,blastx、tblastn、tblastx。通常通过在线方式或Email方式提交查询序列,得到查询结果。如果需要在本地使用的话,可以下载BLAST程序与相应数据库,即能在本地使用了。DNA TOOL可以调用此软件。

Blastcl3: BLAST的客户端程序,直接链接至BLAST服务器,使用BLAST服务,不需浏览器。

SeqPup 0. 9:是生物分子序列编辑与分析软件。功能包括多序列比较、单序列编辑、各种序列格式文件读取与将序列输入到不同的序列格式文件、序列整理打印(可加框与阴影,加标记等)、序列编辑、互补序列、DNA翻译到蛋白质序列或蛋白质序列翻译到DNA.可以外挂其他分析软件,例如ClustalW等,可自定义外观应用软件。目前的版本用JA V A语言写成,需要JA V A运行环境。

K-Estimator 6. 0:当对两个核酸序列进行队列比较时,K-Estimator用来评估两者核苷酸替代数(趋异性),包括蛋白质编码区与非蛋白质编码区。使用Monte Carlo模拟估算可信区间,在分子进化研究中,评估两条核酸序列的被替换核苷酸数量是一个中心课题。精确量化这些数据将直接影响广泛应用于进化基因学的许多实验的可靠性。对蛋白质编码区,分为两种情况,一种是核苷酸替换不造成氨基酸改变,称为同义替代(synonymous);另一种情况为核苷酸替换造成氨基酸改变,称为非同义替代(nonsynonymous),分别评估这种核苷酸替代数量。每个位点同义替代数量用Ks表示,非同义替代数量用Ka表示。对非蛋白质编码区,总替代数为K。

BioEdit 5. 0. 9:是一个序列编辑器与分析工具软件,功能强大,使用容易。功能包括:序列编辑、外挂分析程序,RNA分析、寻找特征序列、支持超过20 000个序列的多序列文件、

基本序列处理功能、质粒图绘制等。

DAMBE 4.0.75:是香港大学的Xia Xuhua编制的综合性序列分析工具软件,功能广泛,包括格式转换、统计,处理、分析、绘图、进化树分析,可以处理各种序列数据。

DNASTAR (LaserGene 5. 01):综合性序列工具软件,功能广泛,囊括分子生物学领域大多数内容。

SeaView图形化多序列队列编辑器,能够读各种队列格式(包括MSF,CLUSTAL、FASTA、PHYLIP, MASE等),可手动编辑队列。

Jalviewl. 7b:用JA V A语言写的多序列队列编辑器,需要安装JA V A运行环境。

DNASIS 2.5:综合性低级结构分析软件,包括DNA,RNA,蛋白质等,与DOS下的PCGENE, Windows下的Omiga属同一类的软件。

DNASIS Max Demo 1. 0:为综合序列分析软件DNASIS 2.5软件的升级版。

Genamics Expression 1. 1演示版:是一个DNA与蛋白质序列分析工具。功能包括,序列绘图、注释、引物设计,ORF预测、特征序列查找各数据库查找对比等,需要安装Microsoft virtual machine方可运行。一个月全功能演示版。

V ector NTI Viewer 4. 0. 1:是一个载体查看软件,其功能易用方便,输入文件格式广泛,除了公司本身文件格式外,还能识别各种数据库应用格式软件:EMBL, GenBank, FASTA, Sequence files.可以查找特定序列,ORF(可以设置相关参数),描述载体、限制酶位点、一些功能序列和附注。整个界面由文本、图形和序列三部分构成,而且点击任意的序列、RE、基因,图形和序列均会自动标记到相应位置,非常直观方便。载体可用圆形表示,也可以用线形表示。还可进行核酸到蛋白质的翻译等功能。

Jellyfish 2. 1:可以用来进行DNA翻译、序列比对、限制酶消化、提交序列进行BLAST 搜索、研究项目管理等。操作十分简单,只需拖动与点击。

ProSeq 2.9 beta:PROcessor of SEQuences的缩写,是一个核酸序列编辑与种群遗传学分析软件,可识别多种格式,并能够以多种格式输出。

Gap4 database viewer 2000. 1版:Gap4基因装配数据库读取显示软件。是著名的UNIX 下的DNA分析软件包Staden的一部分,首次推出的Windows版本。用来读取和显示软件包中的Gap4程序生成的基因装配数据库,不能进行编辑,软件内还包括Trev 1. 5版的Windows版本,用来读取和显示ABI、ALF、SCF、CTF、ZTR格式的Trace文件。

SMS为Sequence Manipulation Suite的缩写,是DNA与蛋白质序列分析与格式化在线工具的集合,常用的在线小工具均包括在内,需要浏览器支持javascript,可以下载解压后离线使用。

omiga 2 Demo与PCGENE类似的核酸与蛋白质序列综合性分析软件30天全功能演示版,提供了关键性的科学分析功能,包括Blast与Entrez数据库查询。

Staden 2001. 0:巨型软件,Staden软件包是UNIX系统下的著名综合序列分析工具集,此软件包为新开发的Windows版。

V ector NTI Suite 7. 1 Demo综合性蛋白质核酸分析工具包,具有蛋白质核酸序列分析、引物设计分析、序列显示、多序列比对、序列装配等多种功能,还具有增强Internet功能,可直接在软件中使用互联网相关网站的生物信息功能。

INCA 0. 38:是一个JA V A脚本语言写成的BLAST服务器客户端程序,程序输入一个起始序列,链接到BLAST服务器,查找相关序列,可以调整BLAST参数,还能使用部分Entresz功能。需要IE4. 0以上才能运行。

ISYS v1. 33 build#140:90天免费评估版。国家基因组资源中心(National Center for Genome Resources, NCGR )开发的用JA V A语言写成的数个不同类生物信息软件与数据库的软件集合平台ISYS,允许各个独立组成部分之间进行复杂的交换数据与交互运行,软件包

内的组件包括Sequence Viewer. Similarity Search Launcher. Similarity Search Browser. Table Viewer. ORF-to-gene mapper,还可加入maxdView.与BDGP Gene Ontology Browser,需各自下载后安装。

DNAScriptor 1. 00:是一个DNA与蛋白质序列综合分析软件,它提供了一个脚本语言,就叫做DNAScript,允许使用者通过这个脚本语言对序列按照自己的要求,进行程序分析。

Sequence Quickie-Calc 2.5 DEMO:是一个分子生物学工具软件,用来简化分子生物学中的许多常规操作与序列处理工作。所有功能以计算器的形式显示在主屏幕上,且均为最常用的功能。

PhyloGrapher用来显示与研究相类似的基因与蛋白质序列之间的进化关系的软件。根据给定的基因,生成定制的图形。需要安装TCL/TIK才可以运行。

B1astDoc:对BLAST查找结果进行图形化显示软件。

Wonderful生物信息学系统1.0试用版:提供生物信息学常规分析工具,包括核酸、蛋白质序列统计分析,开放阅读框(ORF)搜索定位,基因组、蛋白质组信息搜索、分析、同源性比对等工具,并为实验室PCR克隆扩增靶分子基因、进行基因产物改造及修饰等提供简便的设计操作软件,同时该系统内置了丰富全面的药物受体库,以促进药物新靶点的筛选以及基于药物靶分子的新药设计与开发。

(10)质粒绘图软件:

Plasmid Processor 1. 02:免费的绘制质粒图软件。

Plasmid Processor Pro:免费的绘制质粒图软件,是Plasmid Processor的增强版。

WinPlas 2.7 Demo:一种质粒绘图软件商业版的演示版。

DMUP beta:质粒绘图软件测试版,可绘制环状质粒,并以BMP格式输出。

Plasmid Toolkit 1. 4s:质粒绘制软件,为共享软件,但对学生免费。不论是否有序列信息均可绘制质粒图,支持常见的序列格式(例如GenBank格式)。

pDRAW32 1.1.48文件1,文件2,文件3,文件4:解压到同一个目录后安装。pDRAW是一个非常方便的质粒绘制工具与DNA分析工具。它包括DNA序列输入与分析、限制酶消化分析以及环形与线性DNA图形输出等许多功能。

Redasoft Visual Cloning 2000 Demo:是Redasoft Plasmid 1. 1软件的升级版,主要用于质粒绘图,也有简单限制酶分析、开放读框查找、引物设计、序列查找等功能。演示版只能编辑程序自带的DNA序列。

SimVector 2. 00 Demo:质粒图绘制软件,绘制发表质量的质粒图与序列、载体图。

C1oneMap 2. 11 Demo:质粒作图软件演示版,输出功能被限制。

二、研究内容

(一)研究内容的组成

1.数据库的建设

(1)建立全球基本生物信息库:目前,世界范围的多种生物的基因组完全测序工作正在广泛进行之中,包括哺乳动物、植物、昆虫、鱼类和禽类、微生物和病毒及各类原核真核生物。不断涌现的基因组数据需要相应的数据库进行采集、存贮、管理和提供传递功能。网络的建设是全球协作研究生物数据的基本保证,包括扩大网络的覆盖面,提升网络传输速度等。而建立人类体内代谢和细胞调节、疾病发生和遗传学数据库,建立与动植物良种繁育相关的数据库以及与大分子设计和药物设计相关的数据库,是和人类自身的关系更加密切的工作。

(2)生物信息数据的质量评估:数据是生物信息学研究的基本材料,它的质量直接影响生物信息的后期工作。提高原始数据的可信度、发展各种计算算法、增强分析工具的精度,将对生物信息学的快速发展提供可靠保证。

(3)生物信息的在线服务:建立适于数据库自身所描述的生物数据信息的查询检索功能

和搜索功能,提供统一规范的格式,提升数据的容量,简并应用软件的操作,为研究者营造一个友好的使用环境是数据库建设的方向。

(4)数据信息可视化:解读生物的遗传密码成为生物信息学研究功能基因的一项重要任务。大量的核酸及蛋白质序列、基因及蛋白质结构和功能数据,各种疾病相关数据以及生物文献数据等正飞速增长,充分利用这些数据信息、挖掘数据间潜在的生物关系、解释这些数据,是生物信息学面临的巨大挑战。大多数生物学知识既不能像物理学那样以数学公式表示,又不能像计算机学那样以逻辑公式表示,却能以表格、图形、网络等直观的形式体现,因而可借助于科学可视化技术进行生物数据挖掘。

科学可视化的目的是理解、分析和解释数据,可分为3个层次:分子模型化、分子信息显示及信息关联显示。分子生物学中已经运用传统的可视化方法,如构建分子三维模型来体现DNA分子双螺旋空间缠绕结构,或蛋白质折叠结构等是最基本的生物信息可视化技术。随着分子生物学的发展,有更多的分子信息需要显示,如DNA的Z曲线变换、蛋白质亲疏水表面、基因突变等。这就促使分子信息可视化技术加大新的科技含量做进一步发展。

2.人和各种生物的完整基因组数据信息的提取和分析

(1)基因组相关信息分析:基因组序列信息的提取和分析包括基因的发现与鉴定;基因组中非编码区的信息结构分析,提出理论模型,完成该区域生物学功能的研究;对各种模式生物进行完整基因组的信息结构分析和比较研究;研究相关遗传密码起源、基因组结构演化、基因组空间结构与DNA折叠的关系以及与生物进化关系等生物学问题。

(2)功能基因组相关信息分析:包括大规模基因表达谱分析,基因组信息相关的核酸、蛋白质空间结构的预测和模拟,以及蛋白质功能预测的研究、相关的算法、软件研究、基因表达调控网络的研究。

3.生物信息分析的技术与方法研究

研究支持大尺度作图与测序需要的软件以及数据库工具,改进理论分析方法,如统计方法、模式识别法、隐马尔科夫过程法、分维法、神经网络法、复杂性分析、密码学方法、多序列比较方法等;建立适用于基因组信息分析的新方法、新技术,引入高度可靠性的复杂系统分析技术、信息系统分析技术等;建立严格的多序列比较方法;发展与应用密码学方法以及其他算法和分析技术,探索DNA序列及其空间结构信息的新表征;研究和发展基因组完整信息结构和信息网络的研究方法等;完善生物大分子空间结构模拟、电子结构模拟和药物设计的新方法与新技术。

(二)研究内容

1.基因与基因组的信息学

(1)大规模基因组测序中的信息分析:基因组研究的首要目标是获得生物体的整套遗传密码。人的遗传密码约有30亿个碱基,而目前的DNA测序仪每个反应只能读取几百到上千个碱基,因此,在基因组大规模测序的每一个环节都与信息分析紧密相关。从测序仪的采样与分析、碱基读出、载体标志与去除、拼接、填补序列间隙,到重复序列标志、开放读框(ORF)预测和基因标注,每一步都依靠生物信息学的软件和数据库。其中,序列拼接和填补序列间隙是最为关键的难题。其困难不仅来自它巨量的数据,而且在于它含有高度重复的序列。为此,这一过程特别需要把实验设计和信息分析联系在一起。另一方面,必须按照不同步骤的要求,发展适当的算法及相应的软件,以应对各种复杂的问题。国际上很多著名的基因组研究中心,都有自己的拼接和组装策略,并且这样的工作都是在超级计算机上完成的。

有了完整基因组,人类对自身的认识就更为深入细致、更为精确。人类基因组中编码蛋白质区域即外显子部分比例很少,只占 1.1%;外显子与外显子之间的区域即内含子占了24%;而基因之间的间隔序列占了75%,非编码区域占了绝大部分。研究发现,人类编码蛋白质的基因更为复杂,有更为丰富的剪接方式。基因组中片段重复现象反映了人类复杂的

进化历史。

(2)新基因和新SNP的发现与鉴定:发现新基因是当前国际上基因组研究的热点,生物信息学方法是发现新基因的重要手段,包括基因的电子克隆,从基因组DNA序列中预测新基因。新基因的发现使我们对生命活动的认识进一步加深。据1999年12月2日《自然》杂志报道,人的第22号染色体鉴定出679个基因,其中55%的基因是未知的。有35种疾病与该染色体突变相关,如免疫系统疾病、先天性心脏病和精神分裂症。将人类的所有基因及其相应的蛋白质及相关的功能完整正确地整合到一个索引中是具有重要意义的工作。

SNP研究是人类基因组计划走向应用的重要步骤。因为SNP对于高危群体的发现、疾病相关基因的鉴定、药物的设计和测试以及生物学的基础研究等提供一个强有力的工具。SNP在基因组中分布相当广泛,研究表明,在人类基因组中每300碱基对就出现一次。大量存在的SNP位点,与各种疾病,包括肿瘤相关的基因组突变有关;有些SNP并不直接导致疾病基因的表达,但由于它与某些疾病基因相邻,而成为重要的标记。

(3)非编码区信息结构分析:近年来的研究表明,低级生物非编码蛋白质的区域占整个基因组序列的10%到20%。随着生物的进化,非编码区越来越多,高等生物和人的基因组中非编码序列已在基因组序列中占有相当大的比例。这表明非编码序列必定具有重要的生物功能,’目前认为它们与基因的表达调控有关。98%非编码区蕴含的信息内涵将是十分可观的,因此寻找这些区域的编码特征、信息调节与表达规律是未来的热点课题。

(4)生物进化的研究:随着基因组序列数据的大量增加,对序列差异和进化关系在分子水平的研究日益深入。进化关系是利用系统发育分析方法进行推断或评估,其结果用进化树来描述。对于基因组研究来说,一个重要的研究方向就是分子序列的进化。通过比较不同生物基因组中各种结构成分的异同,从各种基因结构与成分的进化,密码子使用的进化,到进化树的构建上加深对生物进化的认识。

(5)完整基因组的比较研究:在后基因组时代,完整基因组数据越来越多,利用这些资料对若干重大生物学问题进行分析,如研究生命的起源,生命的进化,遗传密码起源,估计最低限度基因组合,阐明机体最基本的代谢途径等等。例如,鼠和人的基因组大小相似,都含有约30亿碱基对,基因的数目也类似且大部分同源,可是鼠和人差异却如此之大。不同人种间基因组的差别仅为0.1%,远远低于人种内的差异;人猿间差别约为1%,但他们表型间的差异十分显著。因此,种间差异不仅应从基因、DNA序列找原因,也应考虑到整个基因组、考虑到染色体组织上的差异。

2.大规模基因功能表达谱的分析

获得基因的功能表达谱是生命界在基因组测定基本完成之后的一个核心问题,用以揭示生物体在一定时间和空间上的基因种类和丰度。大规模基因功能表达谱分析利用DNA芯片技术、蛋白质谱技术和蛋白质组技术进行高通量数据研究。

利用DNA微阵列技术在基因组水平上系统地研究生命的现象及其本质,是当今世界范围的研究热点。已应用于肿瘤分型、肿瘤分类、基因功能研究、基因之间调控网络构建、药物靶位识别等许多方面。基因表达谱反映基因在某一生命过程中的表现,是基因的一种表型数据,通过这种表型数据来揭示基因的结构与功能关系,进一步揭示某些生命现象的本质。影响基因表达的各种调控元素与表达谱关系的研究中一个重要方面就是序列调控区与表达谱之间关系。利用生物信息学方法可以实现对相关序列的调控区分析。

微阵列实验所直接获得的是一个基因表达谱,微阵列的实际应用就是通过对基因表达矩阵的生物信息学处理实现的,因此,在由微阵列技术为基础的分子生物学研究中,生物信息学是其中重要的一环。随着人类基因组工作草图与多种模式生物基因组测序的完成以及基因芯片技术的广泛应用,人们面对的是极速增长的生物信息数据,如何发展有效的生物信息学工具,从这种包含序列结构和功能信息的数据海洋中确定与某一特定生命现象(如生长发育、

肿瘤发生等)相关的基因及其功能,已成为后基因组时代国际上的研究的焦点。

3.生物大分子结构模拟和药物分子设计

生物大分子结构的模拟是研究蛋白质功能和药物分子设计的基础,包括蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质以及连接肤的设计;生物活性分子的电子结构计算和设计;纳米生物材料的模拟与设计;RNA的结构模拟和反义RNA的分子设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计;基于DNA结构的药物设计等。

蛋白质结构是极其复杂的,蛋白质的结构决定着蛋白质的功能,要找到这些蛋白质功能的分子基础,必须进一步分析它们的三维结构。同时,药物设计也需要了解相应的蛋白质受体的三维结构。目前X射线晶体学技术、多维核磁共振(NMR )波谱学技术、二维电子衍射和三维图像重构技术成为蛋白质空间结构测定试验手段,但是提供蛋白质三维结构的速度远远低于蛋白质序列信息的增长速度,仅使用实验方法已经不能满足功能蛋白质的研究。此外,这些实验方法依然存在局限性,因此,理论模拟与结构预测的方法就显示出了重要性。理论的研究方法不仅可提供生物大分子空间结构的信息,还能在分子水平上提供电子结构的信息,如能级、表面电荷分布、分子轨道相互作用等信息,及生物化学反应中的能量变化、电荷迁移、构象变化等,为天然生物大分子的改性和基于受体结构的药物分子设计提供依据,即为蛋白质工程提供理论依据。蛋白质工程是以蛋白质的结构规律及其与生物功能的关系为基础,通过分子设计和控制基因的修饰以及基因合成,对已有蛋白质进行定向改造,并最终构建生产性能比天然蛋白质更优越的产品。

蛋白质结构模拟的主要方法有同源模建、序列结构联配、分子动力学模拟等。

第三节生物信息数据库

一、生物信息数据库及其分类

生物信息数据库种类繁多,总体可以分为四大类,即:①基因组数据库。②核酸和蛋白质一级结构序列数据库。③生物大分子三维空间结构数据库。④以上三类数据库和文献资料为基础构建的二次数据库。基因组数据库数据来源于基因组作图,序列数据库数据来源于序列测定,结构数据库数据来源于X衍射和核磁共振结构测定。基因组数据库、序列数据库、结构数据库是分子生物信息学的基本数据资源,通常称为基本数据库或初始数据库,也称一次数据库。近些年来,世界各国的生物学家和计算机科学家合作,根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建了大量具有特殊生物学意义和专门用途的二次数据库,已经开发了几百个二次数据库和复合数据库,也称专门数据库、专业数据库、专用数据库。

一次数据库的数据信息量大,更新速度快,用户面广,通常需要高性能的计算机硬件、大容量的磁盘空间和专业的数据库管理系统支持。例如,欧洲生物信息学研究所维护核酸数据库EMBL使用的Oracle数据库管理软件。基因组数据库GDB的运行使用Sybase数据库系统,即使是镜像安装,也要有Sybase支持。而二次数据库的信息容量比较小,更新速度比一次数据库慢。许多二次数据库是基于Web浏览器开发的,使用超文本语言HTML和JA V A程序编写的图形界面,有的还带有搜索程序,可以不用大型商业数据库软件支撑。针对不同主题开发的二次数据库的最大特点是使用方便,易于为计算机经验不丰富的研究者的使用。

二次数据库种类很多,主要是对一次数据库信息进行分析、提炼加工而成,更易于使用。以核酸数据库为基础构建的二次数据库,如基因调控转录因子数据库TransFac,克隆载体数据库Vector,真核生物启动子数据库EPD。以蛋白质序列数据库为基础构建的二次数据库,如蛋白质功能位点数据库Prosite,同源蛋白家族数据库Pfam,蛋白质功能位点序列片段数据库Prints,同源蛋白结构域数据库Blocks。以具有特殊功能的蛋白为基础构建的二次数据库,如免疫球蛋白数据库Kabat,蛋白激酶数据库PKinase等。以三维结构原子坐标为基础构建

药物代谢酶基因多态性简介

药物代谢酶基因多态性简介 代谢酶基因多态性是指由于编码代谢酶的DNA序列的单核苷酸多态性等可遗传变异,导致的不同种群之间代谢酶的底物特异性无变化,但是代谢酶的活性存在显著的差别的现象。由此可能造成个体间PK和药物反应的差异,进而造成不必要的治疗失败和毒副作用。单核苷酸多态性(SNPs)存在于Ⅰ相代谢酶、Ⅱ代谢酶和转运体等多个方面,其中临床影响较大的为CYP450酶的基因多态性,因此了解不同人群代谢酶活性的差异有助于理解种群间PK差异和实现个性化治疗。SNPs存在于许多亚型的代谢酶中,Sarah等人的研究结果显示如下图,其中高加索人种中CYP2D6多态性的频率最高,其次为CYP2A6和2B6。但是并非所有的CYPs均参与药物代谢,既存在较高频率的多态性,又与药物代谢相关的为CYP1A2, 2D6, 2C9和2C19,其中CYP2D6与多数药物的代谢相关,下文将以CYP2D6为代表阐述其进化特征、功能多样性和临床影响等相关内容。 CYP2D6是由497个氨基酸组成的多肽,其对生物碱类物质具有较高的亲和力,该酶不可被环境因素调控且不能被诱导。最早CYP2D6的多态性是由

于个体间PK差异引起人们注意的,而后随着生物技术手段的提升才逐渐揭开其遗传基础。CYP2D6位于染色体22q13.1上,其邻近包含两个假基因CYP2D7和CYP2D8。至今发现了几十种CYP2D6的等位基因,大多数编码有缺陷的基因产物,最常见的突变型等位基因分布于不同种群中,如CYP2D6*2, CYP2D6*4, CYP2D6*5, CYP2D6*10和CYP2D6*17等,详细见下图,其可分为彻底失活、活性降低、正常、活性增加和活性本质上的改变五大类,在不同种群中分布特点有明显的差异。亚洲人群最常见的CYP2D6*10,其发生了P34S的有害突变导致了P450折叠功能的丧失而造成不稳定性,且降低了底物的亲和力。非洲人群中常见突变体为CYP2D6*17发生的错义突变导致其活性位点结构发生改变,由此造成底物特异性发生改变,且其活性低于野生型。 如下图演示了CYP2D的演变规律,啮齿动物与人的活性CYP2D基因的数量存在巨大的差异,小鼠有9个不同的活性基因,而人只有1个,且7%的高加索人群缺失该活性基因。由于CYP2D6对于生物碱类的生物毒素具有高亲和力,进化角度可以认为小鼠需要保留较多的活性基因来维持解毒能力,而人类的饮食结构更为严谨进而逐渐不需要更多的活性基因。 不同人群中的CYP2D6的代谢活性可分为超快代谢(ultrarapid metabolizers, UMs)、快代谢(extensive metabolizers, EMs)、中等代谢(intermediate metabolizers, IMs)和慢代谢(poormetabolizers, PMs)四种类型。一般而言,白人种PMs的频率较高约为10%左右,而亚洲人群中

基因多态性

基因多态性 多态性(polymorphism)是指在一个生物群体中,同时和经常存在两种或多种不连续的变异型或基因型(genotype)或等位基因(allele),亦称遗传多态性(genetic polymorphism)或基因多态性。从本质上来讲,多态性的产生在于基因水平上的变异,一般发生在基因序列中不编码蛋白的区域和没有重要调节功能的区域。对于一个体而言,基因多态性碱基顺序终生不变,并按孟德尔规律世代相传。 基因多态性分类生物群体基因多态性现象十分普遍,其中,人类基因的结构、表达和功能,研究比较深入。人类基因多态性既来源于基因组中重复序列拷贝数的不同,也来源于单拷贝序列的变异,以及双等位基因的转换或替换。按引起关注和研究的先后,通常分为3大类:DNA片段长度多态性、DNA重复序列多态性、单核苷酸多态性。 DNA片段长度多态性DNA片段长度多态性(FLP),即由于单个碱基的缺失、重复和插入所引起限制性内切酶位点的变化,而导致DNA片段长度的变化。又称限制性片段长度多态性,这是一类比较普遍的多态性。 DNA重复序列多态性DNA重复序列的多态性(RSP),特别是短串联重复序列,如小卫星DNA和微卫星DNA,主要表现于重复序列拷贝数的变异。小卫星(minisatellite)DNA由15~65bp的基本单位串联而成,总长通常不超过20kb,重复次数在人群中是高度变异的。这种可变数目串联重复序列(VNTR)决定了小卫星DNA长度的多态性。微卫星(microsatellite)DNA 的基本序列只有1~8bp,而且通常只重复10~60次。 单核苷酸多态性单核苷酸多态性(SNP),即散在的单个碱基的不同,包括单个碱基的缺失和插入,但更多的是单个碱基的置换,在CG序列上频繁出现。这是目前倍受关注的一类多态性。 SNP通常是一种双等位基因的(biallelic),或二态的变异。SNP大多数为转换,作为一种碱基的替换,在基因组中数量巨大,分布频密,而且其检测易于自动化和批量化,因而被认为是新一代的遗传标记。 遗传背景知识遗传和变异各种生物都能通过生殖产生子代,子代和亲代之间,不论在形态构造或生理功能的特点上都很相似,这种现象称为遗传(heredity)。但是,亲代和子代之间,子代的各个体之间不会完全相同,总会有所差异,这种现象叫变异(variation)。遗传和变异是生命的特征。遗传和变异的现象是多样而复杂的,正因为如此,才导致生物界的多种多样性。

药物基因组学

药物基因组学 PART 01 药物基因组学 一、药物基因组学 药物基因组学:是研究人类基因变异和药物反应的关系,利用基因组学信息解答不同个体对同一药物反应存在差异的原因。 基因组(genome):是指生物体单倍细胞中一套完整的遗传物质,包括所有的基因和基因间区域(即编码区和非编码区)。 人类基因组计划是由序列(结构)基因组学向功能基因组学的转移。开启了人类的“后基因组时代”。 后基因组时代研究的重要方向: 功能基因组学 比较基因组学 结构基因组学 蛋白质组学 药物基因组学 …… PART 02 基因多态性 二、基因多态性 基因多态性是指在一个生物群体中,呈不连续多峰曲线分布的一个或多个等位基因发生突变而产生的遗传变异。 CYP450酶超大家族 共涉及1000种药物的代谢(拓展) 12种亚型:CYP1、CYP2、CYP3…… 15个亚家族:A~Q 如:CYP2C9、CYP2C19、CYP2D6、CYP3A5等 药物转运蛋白-MDR1(多药耐药基因)(拓展) 调控许多药物吸收、分布和排泄过程 与胆红素、抗癌化疗药物、强心苷、免疫抑制剂、糖皮质激素、HIVⅠ型蛋白抑制剂有关 药物靶蛋白-ADRB2 编码人β2肾上腺受体 人类白血球抗原-HLA-B HLA-B变异,将引起某些药物的严重皮肤反应 内容: 1.药物代谢酶的多态性 同一基因位点上具有多个等位基因引起,其多态性决定表型多态性和药物代谢酶的活性,造成不同个体间药物代谢反应的差异。是产生药物毒副作用、降低或丧失药效的主要原因之一。 细胞色素P450酶(CYP)是药物代谢的主要酶系。在细胞色素P450的亚群中,CYP2D6、CYP2C9和CYP2C19对许多药物的效应非常重要。(拓展) 例: 奥美拉唑、兰索拉唑和泮托拉唑等质子泵抑制剂由P450酶代谢,主要由CYP2C19,部分由CYP3A4代谢。 因此,CYP2C19的基因多态性会影响质子泵抑制剂的药动学,从而影响后者治疗相关疾病的临床效果。 艾司奥美拉唑仅经CYP3A4代谢。 2.药物转运蛋白 在药物的吸收、排泄、分布、转运等方面起重要作用,其变异对药物吸收和消除具有重要意义。

第五章 药物基因组学

目录 第五章药物基因组学 第一节药物基因组学基础 一、遗传药理学的发展 二、药物基因组学的遗传学基础 三、基因多态性的类型 四、多态性研究的整体思路 第二节药物代谢酶的遗传药理学 一、I相代谢酶 二、II相代谢酶 第三节药物转运体基因多态性 一、ABC转运体 二、SLC超家族 第四节药物受体基因多态性 一、 肾上腺素受体基因多态性 二、血管紧张素Ⅱ型受体 三、过氧化物酶体增殖物激活受体 四、μ阿片受体 五、磺脲类受体 六、维生素K环氧化物还原酶复合体1 第五节基因芯片技术在药物基因组学研究中的应用 一、基因芯片的原理 二、基因芯片的分类 三、基因芯片的产品 四、基因芯片的应用前景 第六节药物基因组学临床应用的机遇与挑战

第五章药物基因组学 影响患者对药物反应的因素有很多,包括患者本身的内在因素如年龄、性别、种族/民族、遗传、疾病状态和器官功能,还有其它生理变化,包括怀孕、哺乳,以及外源性因素如吸烟和饮食。基因变异可导致疾病表现和药物反应的多样性这一观念目前已得到广泛认可,并经许多的研究证实。对于一些遗传因素影响研究比较明确的药物,在治疗上可以根据基因信息的指导进行给药,避免其毒性并使治疗效果达到最优化。此外,对于药物反应个体化差异的遗传机制的研究,有助于降低新药研发中不可预期毒性的风险,明确哪些病人将会有最好的治疗效果,收益程度最大;或者淘汰那些对患者疗效不佳、容易出现严重不良反应的新药。越来越多的经美国FDA批准的药品说明书中都提供了药物基因组学方面的信息。生物学信息在药物的研发、管理和临床应用方面的融合和使用在以后将会继续增长。 药物基因组学为临床医生和临床药师提供了很大程度上改善几百万患者药物治疗效果的机会。但是,这个机会的利用却受到阻碍和挑战,并且新的知识还在不断的更新。本章节将通过药物基因组学基础知识和具体疾病结合应用的学习帮助临床药师迎接这一挑战,提高将药物基因组学知识运用到日常临床实践中的能力。 第一节药物基因组学基础 一、遗传药理学的提出 美国药学科学家协会(AAPS)将遗传药理学(Pharmacogenetics)定义为一门研究药物反应个体差异遗传机制的科学。遗传药理学的研究历史可以追溯到公元前510年,当时Pythagoras 发现有一些人摄入蚕豆后会发生致死性的发应,而其它大部分人则不会有这种反应。从那时起,许多里程碑性的发现(见表1)逐渐形成了现在的研究领域。遗传药理学较重要的发展时期是在20世纪50年代,Motulsky和Vogel正式将遗传药理学作为一门药理学分支提出来。Motulsky在1957年认为对药物的异常反应有时是由遗传决定的酶缺损而引起的,V ogel则首先使用“遗传药理学(Pharmacogenetics)”这一名词。20世纪90年代,药物基因组学(pharmacogenomics)这一术语开始出现在一些科学著作中。它的出现源于全基因组学技术的出现和兴起。美国药学科学家协会对药物基因组学的定义是“全基因组水平分析药物效应和毒性的遗传标记”。 遗传药理学主要着重于染色体上单个或少量基因的研究,从药物代谢动力学和药物效应动力学两方面研究DNA序列的变异在药物反应个体变异中的作用。机体内药物作用靶点(受体)、药物转运体和药物代谢酶是在一定基因指导下合成的,所以遗传基因的变异是构成药物反应差

SNP单核苷酸多态性检测技术

1定义: 单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。单核苷酸多态性(SNP)是指在基因组上单个核苷酸的变异,包括置换、颠换、缺失和插入。所谓转换是指同型碱基之间的转换,如嘌呤与嘌呤( G2A) 、嘧啶与嘧啶( T2C) 间的替换;所谓颠换是指发生在嘌呤与嘧啶(A2T、A2C、C2G、G2T) 之间的替换。从理论上来看每一个SNP 位点都可以有4 种不同的变异形式,但实际上发生的只有两种,即转换和颠换,二者之比为2:1。SNP 在CG序列上出现最为频繁,而且多是C转换为T ,原因是CG中的C 常为甲基化的,自发地脱氨后即成为胸腺嘧啶。一般而言,SNP 是指变异频率大于1 %的单核苷酸变异。在人类基因组中大概每1000 个碱基就有一个SNP ,人类基因组上的SNP 总量大概是3 ×106个。依据排列组合原理,SNP 一共可以有6种替换情况,即A/ G、A/ T、A/ C、C/ G、C/ T 和G/ T ,但事实上,转换的发生频率占多数,而且是C2T 转换为主,其原因是Cp G的C 是甲基化的,容易自发脱氨基形成胸腺嘧啶T , Cp G 也因此变为突变热点。理论

基因多态性分析

. 人基因多态性分析 一、实验目的 1. 了解基因多态性在阐明人体对疾病、毒物的易感性与耐受性、疾病临床表现的多样性以及对药物治疗的反应性中的重要作用。 2. 了解分析基因多态性的基本原理和研究方法。 二、实验原理 基因多态性(gene polymorphism)是指在一个生物群体中,同时存在两种及以上的变异型或基因型或等位基因,也称为遗传多态性(genetic polymorphism)。人类基因多态性对于阐明人体对疾病的易感性、毒物的耐受性、药物代谢差异及遗传性疾病的分子机制有重大意义;与致病基因连锁的多态性位点可作为遗传病的诊断标记,并为分离克隆致病基因提供依据;病因未知的疾病与候选基因多态性的相关性分析,可用于辅助筛选致病易感基因。 聚合酶链反应-限制性片段长度多态性(polymerase chain reaction—Restriction Fragment Length Polymorphism,PCR-RFLP)分析是一种常用的DNA分子标记。原理是通过PCR扩增获得目的基因。若目的基因存在等位变异(多态性),且变异正好发生在某种限制性内切酶识别位点上,使酶切位点增加或者消失,则酶切结果就会产生大小不同的片段,即片段长度多态性,再利用琼脂糖凝胶电泳分离,可呈现出多态性电泳图谱。若将患者与正常的多态性图谱比较,可确定是否变异。应用PCR-RFLP,可检测某一致病基因已知的点突变,进行直接基因诊断,也可以此为遗传标记进行连锁分析进行间接基因诊断。 三、器材与试剂 1. 器材 ⑴离心机。 ⑵DNA扩增仪。 ⑶电泳仪。 ⑷水平电泳槽。 ⑸紫外检测仪。 ⑹移液器。 2. 试剂 . . ⑴口腔拭子DNA抽提试剂盒。 ⑵琼脂糖。 ⑶1×TAE电泳缓冲液:980ml蒸馏水中加入50×TAE母液20ml。 ⑷50×TAE母液:Tris 121g,0.5M EDTA(pH8.0)50ml,冰醋酸28.55ml,定容至500ml。

基因多态性与各种肿瘤的关系

2003 年 Kripp l等[ 1 ]报道VEGF 936 C等位基因携带者患乳 腺癌的危险性降低, 1 Kripp l P, LangsenlehnerU, RennerW, et al. A common 936 C /T gene polymorphism of vascular endothelial growth factor is associated with decreased breast cancer risk. Int J Cancer, 2003, 106: 4682 471. 我们进行了一系列的生长因子基因多态性与结 直肠癌关系的研究,已经发现VEGF 61 G/G基因型 和G等位基因与结直肠癌的发生有关[ 9 ] 。VEGF 936 T/C 基因多态性与结直肠癌关系的研究表明 VEGF 936 C /C基因型或936 C等位基因与结直肠 癌的生成无关,但有助于减少术后结肠吻合口瘘的 发生。含有VEGF 936 T基因的结直肠癌患者术后 并发吻合口瘘的机会增加,或许VEGF 936 T基因 可作为检测结直肠癌或预测结直肠癌术后并发吻合 口瘘的一个危险因素,但这需要进一步的研究。同 时观察这一基因多态性在其他伤口愈合并发症中的 作用也将很有意义。 血管内皮生长因子936 T/C基因多态性 与结直肠癌及术后吻合口瘘的关系 吴国洋王效民Michael Keese Till Hasenberg JêrgW. Sturm 血管内皮生长因子基因多态性与肺癌危险度的关系 Lee SJ , Lee SY, Jeon HS, et al/ / Cancer Ep idemiol Biomarkers Prev, 2005, 14: 571 - 575 背景和目的:血管生成是包括肺癌在内的恶性肿瘤发 生、发展和转移中的一个重要过程。血管内皮生长因子基 因( vascular endothelial growth factor, VEGF)变异可以导致 其编码蛋白的产量和活性的改变,通过作用于肿瘤的血管 生成过程,从而引发个体对肺癌易感性的差异。为了检验 这一假设,作者研究了韩国人VEGF基因的3个单核苷酸多 态性( - 460T >C、+ 405C > G和936C > T)及其单倍型和肺 癌危险度之间的关系。方法:研究对象包括432名肺癌患者 和432名年龄和性别匹配的对照。运用贝叶斯定理构建单 体型。采用logistic回归校正相关协变量计算OR值。结果: 在+ 405位点,与CC和CG基因型比较, GG基因型个体小 细胞肺癌危险度显著降低,调整OR 值为0136, 95%可信限 为0117~0178; 936位点变异基因型(CT和CT + TT)个体较 野生基因型(CC)个体小细胞肺癌的危险度降低,调整OR 值分别为0147和0144, 95%可信限分别为0126~0185和 0124~0180。CGT单体型与小细胞肺癌的危险度降低相关, 调整OR值为0139, 95%可信限为0118~0187;而TCC与小 细胞肺癌的危险度增加相关,调整OR 值为1163, 95%可信 限为1114~2133。上述多态性对小细胞肺癌以外的肺癌类 型的危险度没有影响。单体型TCT和TGT与整体肺癌危险 度相关,调整OR值分别为0138和3194, 95%可信限分别为 0125~0160和2100~7176, TCT和TGT单体型的这种作用 在3种主要的肺癌组织类型中均有发现。结论: VEGF基因 多态性与个体肺癌遗传易感性有关。 (冷曙光) Objectives: Vascular endothelial growth factor (VEGF) is a potent stimulus

遗传病及遗传多态性

遗传病及遗传多态性 遗传病(hereditary disease)由基因突变或染色体畸变引起的疾病。已知的遗传病约有5000种,可分为3大类: 单基因遗传病由某一基因突变而引起,又分为:(1)常染色体显性遗传病,致病基因位于1~22号常染色体中的某一对上,且呈显性。如并指、多指、视网膜母细胞瘤、遗传性小脑性运动失调、先天性肌强直、多发性肠胃息肉、遗传性卟啉病等。(2)常染色体隐性遗传病,致病基因位于1~22号常染色体中的某一对上,且呈隐性。如白化病、先天性聋哑症、苯丙酮尿症、半乳糖血症、先天性鳞皮病等。(3)伴性遗传病,由性染色体上的基因发生突变而引起。包括X连锁隐性遗传病(致病基因位于X染色体上且呈隐性),如红绿色盲、血友病、先天性白内障、先天性丙种球蛋白缺乏症等;X连锁显性遗传病(致病基因位于X 染色体上且呈显性),如抗维生素D佝偻病、遗传性肾炎等。 多基因遗传病受多对微效基因控制并易受环境因素影响的遗传病。如唇裂、腭裂、先天性巨结肠、先天性幽门狭窄、早发性糖尿病、各种先天性心脏病等。 染色体异常病由先天性的染色体数目异常或结构异常而引起。又分为:(1)常染色体病,由1~22号常染色体发生畸变而引起。包括单体综合征,某一号染色体为单体,如21单体和22单体,这类病人极少见,大都于胎儿期死亡;三体综合征,某一号同源染色体不是两个而是三个,如21三体(又称先天愚型或唐氏综合征,核型为47XX或XY;+21)、18三体(Edward氏综合征)和13三体(Patan氏综合征)等;部分三体综合征(由某一片段有三份而引起)如9p部分三体综合征(9号染色体的短臂有三份);部分单体综合征(由某一常染色体的部分缺失而引起),如猫叫综合征(婴儿期哭声类似猫叫)就是5号染色体短臂部分缺失引起的。(2)性染色体病,由X和Y性染色体数目或结构变异而引起。如女性的特纳氏综合征(45,XO),男性的克氏综合征(47,XXY)等。遗传病目前尚难根治,故应积极预防。预防的措施有检出致病基因的携带者与禁止近亲结婚,推行计划生育,开展遗传咨询,进行产前检查与中止有病胎儿的妊娠等。 遗传多态性(genetic polymorphism)在一个群体内存在两种或两种以上非连续变异类型,而其中最罕见类型的频率不小于0.01(或0.05)的现象。常见的不同水平上的遗传多态性有:(1)基因多态性(gene polymorphism)。经调查人类大多数群体的ABO血型系统的三种复等位基因I A、I B和i的频率,最高的不超过0.55,最低的不小于0.2,所以,ABO血型系统的基因座为多态基因座。据研究,大多数生物的多态基因座约占总数基因座的15%~50%,即约有1/4~1/2的基因座存在两种或两种以上的等位基因。(2)染色体多态性(chromosome polymorphism)。在一群体中的同一染色体上可以发生不同的倒位或易位。例如拟暗果蝇(Drosophila pseudoobscura)的第三染色体上存在多种倒位,其自然群体中的倒位类型竟多达20余种。植物群体中的倒位多态性比动物的更普遍。在一些动植物群体中(如蟑螂、直果曼陀罗)还观察到易位多态性。此外,随着研究的深入,在分子水平上还发现核酸有限制性片段长度多态性(restriction fragment length polymorphism,RFLP),例如,在群体中用同一限制性内切酶“切割”DNA,可得到不同长度的DNA片段。 现在一般用自然选择理论来解释遗传多态性产生的原因,主要有杂合优势说和依赖 选择说。杂合优势说认为,杂合体(如Aa)在适应能力上要优于纯合体(如AA和aa),因此群体中的等位基因A和a的频率就会维持在一个既不过高也不过低的水平上。依赖选

基因多态性分析

人基因多态性分析 一、实验目的 1. 了解基因多态性在阐明人体对疾病、毒物的易感性与耐受性、疾病临床表现的多样性以及对药物治疗的反应性中的重要作用。 2. 了解分析基因多态性的基本原理和研究方法。 二、实验原理 基因多态性(gene polymorphism)是指在一个生物群体中,同时存在两种及以上的变异型或基因型或等位基因,也称为遗传多态性(genetic polymorphism)。人类基因多态性对于阐明人体对疾病的易感性、毒物的耐受性、药物代谢差异及遗传性疾病的分子机制有重大意义;与致病基因连锁的多态性位点可作为遗传病的诊断标记,并为分离克隆致病基因提供依据;病因未知的疾病与候选基因多态性的相关性分析,可用于辅助筛选致病易感基因。 聚合酶链反应-限制性片段长度多态性(polymerase chain reaction—Restriction Fragment Length Polymorphism,PCR-RFLP)分析是一种常用的DNA分子标记。原理是通过PCR扩增获得目的基因。若目的基因存在等位变异(多态性),且变异正好发生在某种限制性内切酶识别位点上,使酶切位点增加或者消失,则酶切结果就会产生大小不同的片段,即片段长度多态性,再利用琼脂糖凝胶电泳分离,可呈现出多态性电泳图谱。若将患者与正常的多态性图谱比较,可确定是否变异。应用PCR-RFLP,可检测某一致病基因已知的点突变,进行直接基因诊断,也可以此为遗传标记进行连锁分析进行间接基因诊断。 三、器材与试剂 1. 器材 ⑴离心机。 ⑵DNA扩增仪。 ⑶电泳仪。 ⑷水平电泳槽。 ⑸紫外检测仪。 ⑹移液器。 2. 试剂

基因多态性及其生物学作用和医学意义doc资料

基因多态性及其生物学作用和医学意义

基因多态性及其生物学作用和医学意义 一、基因多态性: 多态性(polymorphism)是指处于随机婚配的群体中,同一基因位点可存在2 种以上的基因型。在人群中,个体间基因的核苷酸序列存在着差异性称为基因(DNA)的多态性(gene polymorphism)。这种多态性可以分为两类,即DNA位点多态性(site polymorphism)和长度多态性 (longth polymorphism)。 1.位点多态性:是由于等位基因之间在特定的位点上DNA序列存在差异,也就是基因组中散在的碱基的不同,包括点突变(转换和颠换),单个碱基的置换、缺失和插入。突变是基因多态性的一种特殊形式,单个碱基的置换又称为单核苷酸多态性(single nucleotide polymorphism, SNP), SNP通常是一种二等位基因(biallelic)或二态的变异。据估计,单碱基变异的频率在1/1000-2/1000。SNP在基因组中数量巨大,分布频密,检测易于自动化和批量化,被认为是新一代的遗传标记。 2. 长度多态性:一类为可变数目***重复序列(variable number of tandem repeats, VNTRS),它是由于相同的重复顺序重复次数不同所致,它决定了小卫星 DNA(minisatellite)长度的多态性。小卫星是由15-65 bp的基本单位***而 成,总长通常不超过20bp,重复次数在人群中是高度变异的。另一类长度多态性是由于基因的某一片段的缺失或插入所致,如微卫星DNA (microsatellite),它们是由重复序列***构成,基本序列只有1-8bp,如(TA)n及

氯吡格雷基因多态性,个人整理

氯吡格雷是一种前体药物,本身无抗血小板作用,需要经过细胞色素P450将其转化为活性代谢产物才能实现其血小板抑制效应。部分患者在长期服用氯吡格雷后,血小板活性未得到有效控制导致严重支架内血栓形成、再发心肌梗死等不良心血管事件发生,临床上称这种现象为氯吡格雷抵抗。CYP2C19是氯吡格雷活性代谢产物生成过程中的主要酶,而CYP2C19基因多态性是导致氯吡格雷抵抗的最重要的因素[1]。 2010 年3 月, 美国食品药品监督管理局(FDA) 宣布氯吡格雷抵抗的“黑框警告”,提醒应用氯吡格雷后出现心血管不良事件与CYP2C19 功能缺失的等位基因有关。 CYP2C19 不同位点的等位基因对氯吡格雷的代谢的作用强度不同, 在各等位基因中,*1 为正常功能等位基因;*2 和*3 为功能缺陷型等位基因(其在亚洲人群中突变频率分别为30%~50%和5%~10%);*17 是功能增强等位基因(其在我国人群中的突变频率为1.2%~3%),携带CYP2C19*2 和*3 等位基因者为CYP2C19 慢代谢型,此类人群氯吡格雷体内活化速率降低、活性代谢产物减少、抗血小板活性降低。Meta 分析的结果表明,在服用氯吡格雷的患者中,携带1~2 个CYP2C19 功能缺陷型等位基因的患者发生不良临床事件的危险性可能会增加55~76%[2]。

建议(1)基因多态性所致血小板反应性差异对个体临床结果的影响尚不能肯定,不推荐常规进行CYP2C19基因型检测。(2)这些个体化用药建议主要用于行PCI 的ACS 患者。目前还没有数据支持CYP2C19基因型检测用于其他场合的用药指导[3]。 常用经由CYP2C19代谢的药物: ①质子泵抑制剂:奥美拉唑、兰索拉唑、泮托拉唑、雷贝拉唑 ②抗抑郁药:氟西汀、西酞普兰、艾司西酞普兰 ③抗癫痫药:丙戊酸钠、苯妥英钠、苯巴比妥、地西泮 ④其他:伏立康唑、利福平 [1]张丽娜,王浩然,丁虎,等.氯吡格雷吸收和代谢通路相关基因变异与临床个体化用药实践.分子诊断与治疗杂志,2013,5(5):289-294 [2]刘俊,朱艳虹,栾佳杰,等.基因型检测在氯吡格雷个体化抗血小板治疗中的应用价值.中国药房,2014,25(12):1097-1098. [3]钟诗龙,韩雅玲,陈纪言,等.氯吡格雷抗血小板治疗个体化用药基因型检测指南解读.中国实用内科杂志,2015,35(1):38-41

遗传学名词解释

遗传学名词解释 1.遗传(heredity):亲代与子代之间同一性状相似的现象称为遗传。 2.变异(variation):亲代与子代或子代之间出现形状差异的现象称为变异。 3.真实遗传(breeding true)/ 纯育(true-breeding):子代性状与亲代的遗传一致性极高的品系称为纯育,这种生物的性状能够代代稳定遗传的现象称为真实遗传。 4.并显性/共显性(codominance):一对等位基因的两个成员在杂合体中都表达的遗传现象称为并显性遗传,或共显性遗传。 5.复等位基因(multiple aleles):在群体中,占据某一同源染色体的同一座位上的两个以上的、决定同一性状的基因称为复等位基因。 6.叠加基因/重叠基因:对同一性状的表型具有相同效应的非等位基因称为叠加基因。 7.性连锁遗传/伴性遗传(sex-linked inheritance):由性染色体所携带的基因在遗传时与性别相联系的遗传方式称为性连锁遗传,亦称伴性遗传。 8.限性性状(sex-limited traits)和限性遗传(sex-limited inheritance):只在某一种性别表现的性状称为限性性状,限性性状的遗传行为称为限性遗传。控制限性性状的基因多数位于常染色体上,也有少部分位于性染色体上。 9.剂量补偿效应(dosage compensation effect):在XY性别决定的生物中,使性连锁基因在两种性别中有相等或近乎相等的有效剂量的遗传效应称为剂量补偿效应。 10.并发系数(coefficient of coincidence, C):实际观察到的双交换率与预期的双交换率的比值称为并发系数。并发系数越大表示干涉作用越小。 11.C值(C value)和C值悖理(C value paradox):一个物种基因组的DNA含量是相对恒定的,它通常称为该物种的C值。物种的C值与其进化复杂性之间没有严格的对应关系,这种现象称为C值悖理或C值佯谬。 N值悖理(N value paradox):生物的基因数目与生物在进化树上的位置不存在正相关的事实称为N值悖理或N值佯谬。 12.基因转变(gene conversion):在子囊菌的减数分裂过程中,由于交换使得异源双链DNA的核苷酸对发生错配,错配的核苷酸对经过修复校正后导致一个基因转变为它的等位基因,从而使减数分裂后的四分体发生异常分离现象,这种现象称为基因转变。(自己总结,仅供参考)13.同线分析(synteny analysis):将连锁分析原理用于体细胞杂种染色体分析得方法称为同线分析。14.可变剪接(alternative splicing):同一前体mRNA分子,可以在不同的剪接位点发生剪接反应,生成不同的mRNA分子,最终产生不同的蛋白质分子的一种RNA剪切方式称为可变剪接。15.中断杂交实验(interrupted mating experiment):在不同品系的大肠杆菌Hfr细胞和F-细胞的杂交过程中,每隔一定时间取样并在搅拌器内搅拌以打断配对的接合管,使接合细胞分开而中断杂交,再检测形成了何种重组子,从而确定各种基因进入F-细胞的时间和次序并进行作图的实验即为中断杂交实验。 16.共转导/并发转导(co-transduction):在噬菌体对细菌的基因进行转导时,两个基因共同转导的现象称为共转导或并发转导。两个基因之间共转导频率越高说明它们连锁越紧密,且共转导的两个基因之间的距离一般不会大于噬菌体的染色体长度。 17.高频重组菌株(high frequency recombination, Hfr):细菌的F因子能够整合到细菌的染色体中,带有一个整合的F因子的细菌品系在与F-细菌接合时可以将染色体的一部分或全部传递给F-细胞,当二者的等位基因带有不同的标记时就可以发生重组,且重组频率可达到10-2以上,因此称为高频重组菌株。 18.互补测验(complementation test)/顺反测验(cis-trans test):将两种不同rⅡ突变型的T4噬菌体对大肠杆菌K(λ)进行双重感染,若能够产生亲代基因型的子代噬菌体,则说明两种突变可以互补,位于不同的顺反子上,这个实验就称为互补测验或顺反测验。利用该测验可以确定基因之间的功能关系。 19.核外遗传(extranuclear inheritance)/细胞质遗传(cytoplasmic inheritance):在真核生物中,染色体外的遗传因子所决定的遗传现象称为核外遗传或细胞质遗传。核外遗传因子通过细胞质又一代传到下一代,且子代分离比不符合孟德尔定律、正反交的结果不同,核外因子亦不能进行遗传作图。

医学遗传学

第一章人类基因与基因组 第一节、人类基因组的组成 1、基因是遗传信息的结构和功能单位。 2、基因组是是细胞内一套完整遗传信息的总和,人类基因组包含核基因组和线粒体基因组 单拷贝序列串联重复序列 按DNA序列的拷贝数不同,人类基因组高度重复序列 反向重复序列 重复序列短分散核元件 中度重复序列 长分散核元件 3、多基因家族是指由某一祖先经过重复和所变异产生的一组基因。 4、假基因是基因组中存在的一段与正常基因相似但不能表达的DNA序列。 第二节、人类基因的结构与功能 1、基因的结构包括:(1)蛋白质或功能RNA的基因编码序列。(2)是表达这些结构基因所需要的启动子、增强子等调控区序列。 2、割裂基因:大多数真核细胞的蛋白质编码基因是不连续的编码序列,由非编码序列将编码序列隔开,形成割裂基因。 3、基因主要由外显子、内含子、启动子、增强子、沉默子、终止子、隔离子组成。 4、外显子大多为结构内的编码序列,内含子则是非编码序列。 5、每个内含子5端的两个核苷酸都是GT,3端的两个核苷酸都是AG,这种连接方式称为GT--AG法则。 6、外显子的数目等于内含子数目加1。 7、启动子分为1类启动子(富含GC碱基对,调控rRNA基因的编码)、2类启动子(具有TATA 盒特征结构)、3类启动子(包括A、B、C盒)。 第三节、人类基因组的多态性 1、人类基因组DNA多态性有多种类型,包括单核苷酸多态性、插入\缺失多态性、拷贝数多态性。

第二章、基因突变 突变是指生物体在一定内外环境因素的作用和影响下,遗传物质发生某些变化。基因突变即可发生在生殖细胞,也可发生在体细胞。 第一节、基因突变的类型 一、碱基置换:是指DNA分子多核苷酸链中的某一碱基或碱基对被另碱基或碱基对置换、替代的突变方式,通常又称点突变。包括: 1、同义突变:替换发生后,虽然碱基组成发生变化,但新旧密码子具有完全相同的编码意义。同义突变并不产生相应的遗传学表观效应。 2、错义突变:替换发生后,编码某一氨基酸的密码子变成了编码另一种氨基酸的密码子,改变了多肽链中氨基酸种类的结构序列组成。 3、无义突变:替换后,编码某一氨基酸的密码子变成了不编码任何氨基酸的终止密码子,引起多肽链提前终止。 4、终止密码子突变:DNA分子中某一终止密码子发生单个碱基替换后,变成了具有氨基酸编码功能的遗传密码子,导致多肽链的合成非正常继续进行。 二、移码突变:是指DNA多核苷酸链中插入或缺失一个或多个碱基对,导致DNA读码序列发生移动,改变密码子的编码意义。 三、整码突变:基因组DNA多核苷酸链的密码子之间插入或缺失三或三的倍数个碱基,导致多肽链中增加或减少一个或多个氨基酸。 四、片段突变:包括缺失、重复、重组、重排。 五、动态突变:是指在DNA分子中,短串联重复序列,尤其是三核甘酸重复序列的重复次数可随着世代传递而逐代增加,这种增加达到一定程度后会产生突变效应,从而引起某些疾病。如脆性X染色体,Huntington病。 第二节、基因突变的诱发因素及作用机制 基因突变分为自发突变和诱发突变。自发突变是指在自然条件下发生的突变。诱发突变则是指

第三讲 基因突变与单基因病(参考答案)

第三讲基因突变与单基因病-13级临床1-10班、麻 醉班 考试说明: 一、单项选择题 1 基因突变致病的可能机制是() 所编码蛋白质的结构改变,导致其功能增强所编码蛋白质的结构改变,导致其功能减弱所编码蛋白质的结构虽不变,但其表达量过多所编码蛋白质的结构虽不变,但其表达量过少以上都包括 2 点突变可引起( ) mRNA降解 DNA复制停顿阅读框架移动氨基酸置换氨基酸缺失 3 属于颠换的碱基替换为() G和T A和G T和C C和U T和U 4 属于转换的碱基替换为() A和C A和T T和C G和T G和C 5 不改变氨基酸编码的基因突变为() 同义突变错义突变无义突变终止密码突变移码突变 6 导致脆性X综合征的是哪一种突变类型( ) 移码突变碱基替换后发生错义突变动态突变碱基替换后发生无义突变碱基替换后发生终止密码突变 7 某基因表达后,合成了一条比正常基因产物短的多肽链,该基因突变为( )

移码突变动态突变错义突变终止密码突变无义突变 8 下列哪种突变可导致肽链氨基酸序列由“Ala-Gly-Val-Leu-Pro-Cys”为 “Ala-Val-Val-Leu-Pro- Cys”() 同义突变错义突变无义突变移码突变整码突变 9 终止密码突变会引起() 肽链缩短肽链延长编码的氨基酸不变编码的氨基酸性质改变都不对 10 关于基因突变说法正确的是() 由点突变引起的错义突变能够使蛋白质序列变短产生同义突变的原因是密码子具有简并性插入或者缺失碱基必定改变开放阅读框嘌呤和嘧啶互相替代的点突变称为转换结构基因的突变导致蛋白质表达量改变 11 由脱氧三核苷酸串联重复扩增而引起疾病的突变为() 移码突变动态突变片段突变转换颠换 12 下列哪种突变可导致肽链氨基酸序列由“Ala-Gly-Val-Leu-Pro-Cys”为 “Ala-Val-Gly-Val-Leu-Pro- Cys”() 错义突变无义突变终止密码子突变移码突变整码突变 13 下列哪种突变可引起移码突变( ) 转换和颠换颠换点突变缺失1-2个碱基插入3个核苷酸 14 错配联会和不等交换常引起() 错义突变中性突变移码突变整码突变大段核酸缺失或重复 15 下列哪一种数量的碱基插入会导致基因的移码突变()

基因多态性及其生物学作用和医学意义.doc

基因多态性及其生物学作用和医学意义 一、基因多态性: 多态性(polymorphism)是指处于随机婚配的群体中,同一基因位点可存在2种以上的基因型。在人群中,个体间基因的核苷酸序列存在着差异性称为基因(DNA)的多态性(gene polymorphism)。这种多态性可以分为两类,即DNA位点多态性(site polymorphism)和长度多态性(longth polymorphism)。 1.位点多态性:是由于等位基因之间在特定的位点上DNA序列存在差异,也就是基因组中散在的碱基的不同,包括点突变(转换和颠换),单个碱基的置换、缺失和插入。突变是基因多态性的一种特殊形式,单个碱基的置换又称为单核苷酸多态性(single nucleotide polymorphism, SNP), SNP通常是一种二等位基因(biallelic)或二态的变异。据估计,单碱基变异的频率在1/1000-2/1000。SNP在基因组中数量巨大,分布频密,检测易于自动化和批量化,被认为是新一代的遗传标记。 2. 长度多态性:一类为可变数目***重复序列(variable number of tandem repeats, VNTRS),它是由于相同的重复顺序重复次数不同所致,它决定了小卫星DNA(minisatellite)长度的多态性。小卫星是由15-65 bp的基本单位***而成,总长通常不超过20bp,重复次数在人群中是高度变异的。另一类长度多态性是由于基因的某一片段的缺失或插入所致,如微卫星DNA(microsatellite),它们是由重复序列***构成,基本序列只有1-8bp,如(TA)n及(CGG)n 等,通常重复10-60次。长度多态性是按照孟德尔方式遗传的,它们在基因定位、DNA指纹分析,遗传病的分析和诊断中广泛地应用。 造成基因多态性的原因:1复等位基因(multiple allele)位于一对同源染色体上对应位置的一对基因称为等位基因(allele)。由于群体中的突变,同一座位的基因系列称为复等位基因。某些复合体基因的每一座位都存在为数众多的复等位基因,这是某些复合体(HLA)高度多态性的最主要原因。2共显性(condominance)一对等位基因同为显性,称为共显性,某些复合体中如HLA每一对等位基因匀为共显性。共显性大大增加了人群中某些基因表型的多样化。基因的多态性显示了遗传背景的多样性和复杂性。它可能是人类在进化过程中抵御不良环境因素的一种适应性表现,对维持种群的生存与延续具有重要的生物学意义。 二、基因多态性的生物学作用: 1.遗传密码的改变:如果基因多态性的碱基的取代、缺失、插入引编码序列的核苷酸顺序改变,在转录和翻译合成蛋白质的过程中,有的对多肽链中氨基酸的排列顺序产生影响,有的不产生影响。可分为:错义突变(missense mutation)指DNA分子中碱基对的取代,使得mRNA的某一密码子发生变化,由他所编码的氨基酸就变成另一种不同的氨基酸,使得多肽链中氨基酸的顺序也相应地发生改变。无义突变(nonsense mutation)指由于碱基取代使原来可翻译某种氨基酸的密码子变成了终止密码子。例如UAU(氨酸)颠换成UAA(终止密码子)使多肽链的合成到此终止,形成一条不完整的多肽链,使蛋白质的生物活性和功能改变。转换也可引起无义突变。同义突变(same sense mutation)指碱基的取代并不都是引起错义突变和翻译终止,也就是虽然碱基被取代了,但蛋白质水平上没有引起变化,氨基酸没有被取代。移码突变(frame-shifting mutation)指在编码序列中单个碱基、数个碱基的缺失或插入,

相关主题
文本预览
相关文档 最新文档