第03章 人类基因组学
- 格式:doc
- 大小:45.50 KB
- 文档页数:7
人类基因组计划与后基因组时代3骆建新1 郑崛村133 马用信2 张思仲2(1第三军医大学成都军医学院生物化学与分子生物学教研室 成都 6100832四川大学华西医学中心附属第一医院医学遗传室 成都 610041)摘要 2003年4月14日生命科学诞生了一个新的重要里程碑,人类基因组计划完成,后基因组时代正式来临。
着重介绍了人类基因组计划的提出、目标与任务、实施与进展等方面的基本情况,讨论了后基因组时代的时间界定,分析展望了后基因组时代与人类基因组计划密切相关的生物信息学、功能基因组学、蛋白质组学、药物基因组学等几个重要研究领域。
关键词 人类基因组计划 后基因组时代收稿日期:20032102293四川省杰出青年基金资助项目(03Z Q0262056)33通讯作者,电子信箱:juecunz @ 2003年4月14日,美国人类基因组研究项目首席科学家C ollins F 博士在华盛顿隆重宣布:人类基因组序列图绘制成功,人类基因组计划(human genome project ,HG P )的所有目标全部实现。
这标志“人类基因组计划”胜利完成和“后基因组时代”(post genome era ,PGE )正式来临,在举世庆祝“DNA 双螺旋结构”提出50周年之际,生命科学诞生了一个新的里程碑。
HG P 被誉为可与“曼哈顿原子弹计划”、“阿波罗登月计划”相媲美的伟大系统工程,是人类第一次系统、全面地解读和研究人类遗传物质DNA 的全球性合作计划。
人类基因组序列图的成功绘制是科学史上最伟大的成就之一,奠定了人类认识自我的重要基石,推动了生命与医学科学的革命性进展。
在后基因组时代,生命科学关注的范围越来越大,涉及的问题越来越复杂,采用的技术越来越高,取得的成就将越来越多,生命科学及其相关科学将大有作为。
1 人类基因组计划111 HGP 的提出HG P 的提出有两个重要背景。
其一,美国(1945年)在日本广岛和长崎投掷的两颗原子弹导致大量幸存者遭受大剂量核辐射,造成受害者DNA 结构严重破坏,基因大量突变。
第三章生物体中究竟有多少基因?与原核基因组(Genome)相比,真核基因组有一些不同的特点。
一个基因的完整性可以被打断,会有多个相同的重复序列,并且有大量的DNA并不编码蛋白。
由于核与胞质的分离,真核中基因的表达也必然和原核生物不同。
但是“真核基因组”并没有明确的界限,其必要条件是基因组大部分位于核内。
核DNA的数量变化很大,它所形成的染色体数量各不相同,序列类型也有很大区别,而细胞器含有相对较少的基因组,其大小也表现出广泛差异。
在分析真核基因组,特别是高等真核生物基因组的主要困难是编码区只代表总DNA 的很小一部分。
由于基因可能是割裂的,其大部分可能并非与编码的蛋白质相关。
基因之间也可能存在很长的DNA。
因此我们不可能从基因组总大小上推测出基因的大小。
可以通过鉴定拥有开放读框的区域直接推知基因组的编码潜力。
但是割裂基因可能含有很多分离的开放读框,从而混淆大规模基因组作图。
由于我们不知道蛋白产物的功能,或者没有确实证据说明它们表达,这种方法仅局限于确定基因组的潜力(但也有假设认为保守的开放读框会被表达,见第二章)。
另一种确认基因数量的途径是通过它们表达的蛋白或者mRNA。
这对处理已知条件下表达的基因非常可靠。
可了解在特定组织或者细胞中有多少基因表达,在相关表达水平上存在哪些差别,并且在一个细胞中表达的基因有多少与其它细胞不同,或者有多少也在其他细胞表达。
关于细胞类型,我们可能会问一个特定基因是否是必要的,当该基因突变时会发生什么情况呢?如果这种突变是致死的,或者生物表现出可见的缺陷,我们可能推测这个基因是必须的,或者至少表现出选择优势。
但有些基因的缺失对表型没有明显的影响,这些基因真是不需要的吗?在其他情况下或者经过长期的进化,它们的缺失意味着选择的劣势吗?3.1 基因组为何如此之大?基因组中DNA的总量是物种所特有的,称为C值(C-value)。
C值的范围变化很大,从微生物中的<106到一些植物和两栖类的>1011。
人类基因组的分子进化过程人类基因组是所有人类细胞中的遗传信息总和,它是由数十亿个碱基对组成的。
基因组的分子进化过程是由基因测序技术和分析方法的发展所揭示的。
进化是一种长期而不断的过程,影响每个生物的基因组。
在进化中,生物的基因组会经历许多变化,包括变异、插入、缺失、扩增、转位等。
这些变化构成了生物基因组在物种演化上的动态(例如人类与黑猩猩基因组的比较)。
这篇文章将探讨人类基因组的分子进化过程,特别是在进化中与其他成员的基因组发生的变化,为我们更好地理解人类起源和演化提供参考。
人类基因组的进化原理生物体存在遗传变异现象,是由于DNA的变异所导致的。
DNA是由四种碱基(腺嘌呤、鸟嘌呤、胸腺嘧啶和鸟嘧啶)的序列组成。
在人类进化中,这些碱基可能发生变异,导致了基因组的演化。
基因组变异可以分为两种主要形式:单核苷酸多态性(SNP)和插入/删除/重复(InDel)。
SNP描述的是基因组中的一个碱基序列更换成另一个碱基序列,这种替换通常是由DNA的复制/修复过程中的错误引起的。
此外,还有一个常见的变异是插入/删除/重复,即碱基序列的增加或减少,或者重复插入到基因组中其他地方。
这种变异可以通过许多不同的机制进行,例如转位、重组和基因家族扩张,这些机制可以使基因组变得更加复杂。
进化过程中的变异:起因和后果基因组的进化始于遗传变异,该遗传变异最初可能是由随机突变所引起的。
随机突变是指由于环境或其他因素而引起的变异,例如化学及放射性物质,或噬菌体病毒和其他来源的基因重组。
这些变异有时可以导致功能改变,例如改变基因表达、功能缺失或其他负面效应。
随着时间的推移,许多人类基因组基本上不变。
这是因为突变在基因组中的频率非常低,因此在几代中不容易积累足够的突变。
但是,一旦突变达到一定频率,就会成为新的“正常”状态,并随后传递到下一代。
这些突变可以通过自然选择加速演化进程,也可以慢慢逐渐地在漫长的时间尺度下积累。
这些变异在对个体的适应和生存优劣进行筛选时可发挥重要作用。
第三章人类基因组学基因组指一个生命体的全套遗传物质。
从基因组整体层次上研究各生物种群基因组的结构和功能及相互关系的科学即基因组学。
基因组学的研究内容包括三个基本方面,即结构基因组学,功能基因组学和比较基因组学。
人类基因组计划(HGP)是20世纪90年代初开始,由世界多个国家参与合作的研究人类基因组的重大科研项目。
其基本目标是测定人类基因组的全部DNA序列,从而为阐明人类全部基因的结构和功能,解码生命奥秘奠定基础。
人类基因组计划的成果体现在人类基因组遗传图,物理图和序列图的完成,而基因图的完成还有待大量的工作。
后基因组计划(PGP)是在HGP的人类结构基因组学成果基础上的进一步探索计划,将主要探讨基因组的功能,即功能基因组学研究。
由此派生了蛋白质组学,疾病基因组学,药物基因组学,环境基因组学等分支研究领域,同时也促进了比较基因组学的展开。
后基因组计划研究的进展,促进了生命科学的变革,可以预见会对医学、药学和相关产业产生重大影响。
HGP的成就加速了基因定位研究的进展,也提高了基因克隆研究的效率。
基因的定位与克隆是完成人类的基因图,进而解码每一个基因的结构和功能的基本研究手段。
本章扼要介绍了基因定位的方法和原理,及基因克隆的研究策略。
一、基本纲要1.掌握基因组,基因组学,结构基因组学,功能基因组学,比较基因组学的概念。
2.熟悉人类基因组计划(HGP)的历史,HGP的基本目标;了解遗传图,物理图,序列图,基因图的概念和构建各种图的方法原理。
3.了解RFLP,STR和SNP三代DNA遗传标记的特点。
4.熟悉后基因组计划(PGP)的各个研究领域即功能基因组学、蛋白质组学、疾病基因组学、药物基因组学,比较基因组学、生物信息学等的概念和意义。
5.了解基因定位的各种方法的原理,尤其是连锁分析与LOD值计算。
6.了解基因克隆的三种研究策略。
二、习题(一)选择题(A型选择题)1.人类基因组计划仍未完成的基因组图为___________。
A.遗传图B.物理图C.序列图D.连锁图E.基因图2.下列不属于基因组学分支学科的是____________。
A.基因组文库B.环境基因组学C.疾病基因组学D.药物基因组学E.比较基因组学3.科学家发现与蛋白质合成有关的基因序列只占整个基因组序列的__________。
A.10%B.2%C.1%D.5%E.3%4.HGP是美国科学家在__________年率先提出的。
A. 970B. 1985C. 1990D. 2005E. 以上都不是5.不属于结构基因组学研究任务是__________。
A.基因图B.遗传图C.物理图D.序列图E.三维转录图6.用作遗传制图的遗传标记有一个发展的过程。
第一代DNA遗传标记是__________。
A.序列标记部位B.表达序列标记C.限制性片段长度多态性D.短串联重复序列E.单核苷酸多态性7.后基因组计划不包括__________。
A.药物基因组学B.环境基因组学C.蛋白质组学D.比较基因组学E.序列图制作8.基因定位研究不需用的技术是__________。
A.连锁分析B.放射杂种C.原位杂交D.YAC克隆E.体细胞杂交9.在基因组遗传图和物理图的制作过程中,不需要的DNA特定结构是__________。
A.STRB.SNPC.CpG岛D.contingE.BAC10.在基因组序列图和基因图的制作过程中,不需要的DNA特定结构是__________。
A.BACB.ContingC.CpG岛D.ESTE.RFLP11.第一、二、三遗传标记分别是_______________。
A.RFLP,EST,SNPB.EST,STS,SNPC.EST,STR,SNPD.RFLP,STR,SNPE.VNTR,STS,SNP12.基因克隆研究策略不包括__________。
A.功能克隆B.定位克隆C.定位候选克隆D.候选克隆E.cDNA策略(二)空题1.基因组学是从__________层次上研究生命体遗传物质的结构和功能的科学。
2.基因组学的研究内容包括三个基本方面,即__________,__________和__________。
3.美国率先提出的人类基因组计划于__________年启动,至________年完成此计划。
4.HGP的基本任务是建立人类基因组的结构图谱,即_________,___________和__________,并在此基础上,鉴定人类的每一个基因,绘出人类的基因图。
5.遗传图又称连锁图。
它是以具有遗传多态性的__________作为“位标”,以__________为“图距”的基因组图。
6.两个连锁的基因位点在生殖细胞形成时,发生重组的几率为__________,其间距为1cM,相当于106bp(1Mb)。
7.随着HGP的完成,科学家们又启动了后基因组计划。
它主要研究__________,即__________。
8.人类基因组多样性计划是比较研究不同人种,民族,族群_________的差异,探讨其含义。
9.基因定位研究的基本技术方法有_________、__________、________和________等。
10.基因克隆的研究策略包括__________,__________,和__________。
(三)名词解释1.基因组(genome)2.基因组学(genomics)3.比较基因组学(comparative genomics)4.疾病基因组学(morbid genomics)5.蛋白质组学(protomics)6.生物信息学(bioinformatics)7.遗传标记(genetic marker)8.CpG岛(CpG island)9.表达序列标签(EST)10.基因定位(gene mapping)11.连锁分析(linkage analysis)12.原位杂交(hybridization in situ)13.基因克隆(gene cloning)14.定位克隆(positional cloning)(四)问答题1.概述基因组学的研究内容。
2.说明HGP的科学目标和工作任务。
3.什么是遗传图和物理图?简述构建原理。
4.基因定位的主要方法的特点是什么?5.说明基因克隆的三种研究策略。
三、参考答案(一)选择题1.E2.A3.D4.C5.E6.C7.E8.D9.C 10.E 11.D 12.E (二)填空题1.基因组2.结构基因组学、功能基因组学、比较基因组学3.1990、20054.遗传图、物理图、序列图5.遗传标记、遗传距离6.1%7.基因的功能、功能基因组学8.基因组9.连锁分析、体细胞杂交、原位杂交、放射杂种10.功能克隆、定位克隆、候选克隆(三)名词解释1.基因组指某生命体的全套遗传物质。
2.基因组学是从基因组层次上系统地研究各生物种群基因组的结构和功能及相互关系的科学。
3.比较基因组学是在基因组层次上比较不同生物种群之间的异同,探讨其含义。
4.疾病基因组学是从基因组中分离重要疾病的致病基因与相关基因,确定其致病机制。
5.蛋白质组学是研究组织细胞中基因组所表达的全部蛋白质,尤其是不同生命时期、不同生命状态、及不同环境条件下全部蛋白质的变化。
6.生物信息学是生物学与计算机科学和应用数学交叉的一门科学,对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示所含的生物学意义有重要作用。
7.遗传标记可以是任何一种呈孟德尔式遗传的性状或物质形式,可以是基因,血型,血清蛋白等,确定其在基因组中的位置后,可作为参照标记用于遗传重组分析。
8.CpG岛是哺乳动物基因组DNA中长约1000bp的CG重复序列,在基因组中含量高,约占基因组总量的1%。
几乎所有持家基因及约40%的组织特异性基因的5′端均有CpG岛,它易于甲基化,从而影响基因的表达活性。
9.表达序列标签(EST)是长约200~300bp的cDNA片段,它在基因组中的定位是不明确的。
这是由特定组织细胞中提取到mRNA后,经反转录酶催化而合成的。
由它可用不同方法获得全长cDNA,再经FISH定位在染色体上。
10.基因定位是运用一定的方法将各个基因确定到染色体的实际位置。
11.连锁分析是基因定位的一种方法。
基因在染色体上呈线性排列,在减数分裂后,由于同源染色体重组,可结合家系分析进行不同座位的基因间重组的统计,依据待定位基因与已定位基因之间的重组值分析,可确定二者之间的连锁关系和遗传距离而达到基因定位。
12.原位杂交是核酸分子杂交技术在基因定位中的应用。
用经放射性同位素标记的探针,同染色体标本载玻片上原位变性的染色体DNA进行分子杂交,通过放射自显影来检测与探针杂交结合的染色体DNA同源序列,依据探针放射性颗粒在某条染色体上的显影位置进行基因定位。
13.基因克隆是从基因组中把某一基因用一定方法分离出来,以便进行单一基因精细结构和功能的研究。
14.定位克隆策略是先抓住目的遗传性状(包括疾病)与基因的联系,先进行定位,而后再鉴定分析目的性状决定基因的表达产物及功能。
(四)问答题1.基因组学是从基因组整体层次上研究各生物种群基因组的结构和功能及相互关系的科学。
其研究内容有三个基本方面:结构基因组学要研究基因组内基因的数量,基因的定位和每个基因编码区和基因间隔区DNA序列结构。
绘制基因组遗传图、物理图、序列图和基因图。
功能基因组学要在基因组层次上研究所有基因的表达,调控与功能。
及基因表达在不同生命期、不同生理病理条件下和在不同环境因素下的变化。
比较基因组学是比较不同生物种群基因组之间的异同,探讨其含义。
人类基因组多样性研究也属此范畴。
当研究涉及不同领域时,又会产生一些学科分支。
2.人类基因组计划(HGP)的科学目标是至2005年全部测定组成人类基因组的DNA序列,从而为阐明人类所有基因的结构和功能,解读人类遗传密码奠定基础。
主要工作任务是认识人类基因组的整体结构,即完成基因组的遗传图、物理图和序列图,在此基础上识别鉴定基因组的每一个基因,逐步完成人类的基因图。
3.遗传图是指每条染色体上的遗传标记的相对位置经连锁分析确定后所构成的图谱,遗传标记间的距离用它们之间交换率来衡量,图距单位1厘摩(cM)即为1%的交换率。
染色体上不同遗传标记间的距离可以相加。
物理图是将染色体的随机切割DNA片段的实际排列顺序确定后所构成的图。
先用限制酶将染色体切成一个个DNA片段,插入YAC或BAC形成克隆,借这些DNA片段中所存在的STS路标,将之连接成重叠克隆群(contig),即可得出覆盖整个基因组的DNA片段排列顺序。
4.常用的基因定位方法:(1)连锁分析以家系分析和重组值计算为依据,确定待定位基因与已定位基因之间的相对位置。
(2)体细胞杂交法是利用人/鼠融合细胞中人类染色体丢失,仅剩少数乃至一条人类染色体,结合染色体显带技术,再结合细胞生化性状分析实现基因定位。