当前位置:文档之家› 生物信息学

生物信息学

Chapter2 Genome Project
AATTGTCG ATCTTCG TGCTGCC …CGTCTC GCTGAAAA TGGAG GA TTTTGCAT GCCATGGA CGGGG ACTTGTTG GCCACGC CTA CACGGTG GCTGCTAA GACCTCTT AGTAT TG GGCTGCCT GTCCACGT AATCA CC GCCTCGAT CAATGACC GGCAG CCAATGAG CTATG AA GCTAGGCT CCCAA CTTATCAT GG GTTTGAAG TTTTG AAGATGAT TTTCTTTA AACTC TTTTG ATCTTCA AGAAATGAG AAGCACGTCATA AT TTTGGTTTA GTCGCGAAGCGA AT TGT TATGTTC ATTTTGGT CAATGGGC CACTC TC GCGTAGCT TAAATCTA AAACT CT CTTTTTTT TTTAAGTT TTAGT TAATTTAG TGTAT ATACT GT TAGCACAT TATAGTGT TTAAT GATAGATG TAAGTTCT… ATTTAGTT
Chapter2 Genome Project
2.1 Introduce to genomics 2.2 genomic mapping 2.3 Human genome project 2.4 Genome sequencing method 2.5 Functional genomics
5 ’
UT 3 R ’
CD S
UT R
2.6 Comparative genomics
2.1 Introduce to genomics
2.1.1. Concept of genome and genomics: 基因组(genome):是指细胞中所有的 DNA,包括所有的基因和基因间隔区域。是 指细胞所有遗传信息的总和。
Genome一词最早由H.Winkler于1920年提 Genome一词最早由H.Winkler于 1920年提 出。系Gene和Chromosome二词缩并而成。 出。系Gene和Chromosome二词缩并而成。
基因组学(genomics):研究基因组的 ( ):研究基因组的 科学。具体地讲,以基因组分析为手段,研 科学。具体地讲, 究基因组的结构组成、时序表达模式和功 能,并提供有关生物物种及其细胞功能进化 信息的一门学科。
基因组学由美国科学家Thomas Roderick与1986年 基因组学由美国科学家Thomas Roderick与 1986年 提出,是指对所有基因进行基因组作图(包括遗 传图谱、物理图谱、转录图谱),核苷酸序列分 析,基因定位和基因功能分析的一门科学。并将 其作为一个新创刊的杂志。
换句话说,基因组学就是指对所有基因 进行基因组作图(包括遗传图谱、物理 图谱、转录本图谱),核苷酸序列分 析,基因定位和基因功能分析的一门科 学。
经典的“基因学”与现在的“基因组学”有何异同?
经典的“基因学”与“基因组学”的相同之处是 经典的“ 基因学” 基因组学” 研究基因;不同之处是在策略上,前者是“零敲 研究基因; 不同之处是在策略上, 前者是“ 碎打”,而后者是“整体阐明”,从整体上研究 碎打” 而后者是“ 整体阐明” 人类整个基因组的序列。
1

二. 基因组学分类:
(一)根据研究的目的: 结构基因组学:(structural genomics) ( ) 建立高分辨率的遗传、物理、转录和序列等图 谱。以全基因组测序为目标 功能基因组学: (functional genomics) :
确定并分析基因组的全部功能。以基因功能鉴定 为目标
(二)根据研究的阶段:基因组时代可分为 (二)根据研究的阶段: 前基因组时代: :
前基因组时代的“钓鱼”和后基因组时代的“捞鱼”
后基因组时代: :
Genomics
Structural genomics Functional genomics
三. 基因组学的核心任务:
1.构建基因组的遗传图谱与物理图谱; 2.在基因组内鉴别与注释所有基因编码; 3.编译基因表达图谱; 4.积累功能数据(包括基因的生化和表型特征); 5.揭示DNA序列多样性; 6.提供基因组间比较的资源。 7.创建一个综合的网络数据库与研究界面;
第二节 基因组作图 基因组的特点:
基因组图的绘制是基因组全面测序的工作框架。
~10 000
四张图
★遗传图谱 ★物理图谱 ★序列图谱 ★转录图谱
2

一.遗传图谱(genetic map):
遗传图(连锁图)→DNA标志在染色体上的相
(一)概念:
? 遗传图谱又称连锁图谱(linkage map),它 是以具有遗传多态性的遗传标记为“路 标”,以遗传学距离为图距的基因组图。
对位置(遗传距离),遗传距离以DNA片段在 染色体交换过程中的分离频率厘摩(cM)来表 示。cM值越大,两者之间距离越远。 通过遗传图分析,可以了解各个基因或DNA片 段之间的相对距离。
基因组路标(landmarker)
标记1 标记2
标记3
染色体上的基因和DNA顺 序均可作为路标, 路标 具有物理属性,他们由特 定的DNA顺序组成. 路标 位于染色体上的位置是 固定的, 不会更改的,因 而提供了作图的依据
1
RG472 RG246 1 1 K5 U10 RG532 W1 RG173 Amy1B RZ276 RG146 RG345 RG381 RZ19 RG690 RZ730 RZ801 3 4 3 RG810 RG331
2
RG437 RG544 RG171 RG157 RZ318 Pall RZ58 CDO686 Amy1A/C RG95 RG654
3
RG104 RG348 RZ329 RZ892 RG100 RG191 RZ678
4
RG218 RZ262 RG190 RG908 RG91 RG449 RG788 RZ565 RZ675 RG163 RZ590 RG214 RG143 RG620 4 5
5
RG556 RZ390 RG313 RZ556 RG403 RG229 RG13 CDO105 RZ649 RZ67 RZ70 RZ225
2
2
1
1
(二)遗传图谱的构建的主要步骤: 选择适合作图的遗传标记 根据遗传材料之间的遗传多态性,选择用 于建立作图群体的亲本组合 建立作图群体 测定群体中不同个体的标记基因型 对标记基因型数据进行连锁分析,构建标 记连锁图
2
4 5 4
3 RZ574 5 RZ284 RZ394 pRD10A RZ403 RG179 CDO337 RZ337A RZ448 RZ519 Pgi -1 CDO87 RG910 RG418A
3 5
4
遗 传 图 谱
2
3
RG256 RZ213 RZ123 RG520
2
2
6
RZ398 RG213 Amp -3 Est -2 RZ144 RZ667 Pgi -2 pRD10B RG648 RG424 RG162 RG172 CDO544 2 RG653 Amy2A RG433 Cat -1 3 4 5
7
RG773 RG769 3 4 5 RZ488 RG511 RG477 PGMS0.7 CDO59 RG711 Est -9 RZ337B CDO497 CDO418 RZ978 CDO38 RG351
8
RZ143 RG20 A5J560 A3E396 1 1 A18A1120 TGMS1.2 A10K250 AG8-Aro RZ617 RG978 RG1 Amy3D/E RZ66 AC5 RG418B Amp -2 CDO99
9
RG757 CDO590 C711 G103 RZ206 RZ422 Amy3ABC RZ228 RZ12 RG667 RG451 RZ792 RZ404
2
2
图例:
1 1
QTL的位置 不同测定时期的非条件QTL 不同测定时期的条件QTL
3

1. 遗传标记:
遗传标记(genetic marker):就是指在染色体特定 位置上用于遗传分析的标签,借此可追踪染色体、染 色体某一节段、某个基因座位在家系中传递的任何一 种遗传特性,可以明确反映遗传多态性的生物特征, 可以帮助人们更好地研究生物的遗传与变异规律。 它具有两个基本特征,即可遗传性和可识别性。 因此生物的任何有差异表型的基因突变型均可作为 遗传标记。
标记1 基因1 标记2 标记3
MM Mm mm
2
1
0
基因2
遗传标记的类型: 形态标记 细胞学标记 生化标记——蛋白质标记 DNA分子标记
分子标记是指在分子水平上探测遗传多态性的标 记。 广义上的分子标记包括蛋白质标记与DNA标 记。 狭义上的分子标记就是指DNA分子标记。目前 所说的分子标记一般是指DNA分子标记。
形态标记
形态标记:指那些能够明确显示遗传多态性的外 观性状。 如:果蝇眼睛的颜色、植株的高矮等。 广义的形态标记那些借助简单测试即可识别的某 些形状如生理特性、抗病虫性等。 一个遗传性状必须以两种表型(phenotype)存 在才能用于遗传学分析,每种表型是由相应基因的 不同等位基因(allele)所决定的。
4

形态标记的不足: 可以观察到的标记非常有限,难以建立饱 和的遗传图谱 许多形态标记还受环境、生育期等因素的 影响 形状的识别需要有相关的经验
细胞学标记
细胞学标记:指能明确显示遗传多态性的细胞学 特征。 染色体的结构特征和数量特征是常见的细胞学标 记。 用具有染色体数目和结构变异的材料与染色体正常 的材料进行杂交,其后代常导致特定染色体上的基因 在减数分裂过程中的分离和重组发生偏离,由此可以 测定基因所在的染色体及其相对位置。
生化标记
细胞学标记克服了形体标记易受环境影响的 缺点,但这种标记的产生需要花费大量的人力 物力进行培养选择。 染色体变异对材料的影响较大,观察和鉴定 比较困难。 生化标记主要指蛋白质标记 蛋白质标记:蛋白质的多态性,可能是由于 基因编码的氨基酸序列的差异引起的,也可能是 由于蛋白质后加工不同引起的。 如糖基化能导致蛋白质分子量的变化。 同工酶是指具有相同催化功能而结构及理化 性质又不同的一类酶,其结构的差异来源于基因 的差异,因此并不一定是同一基因的产物。
蛋白质是基因表达的产物,与形态性状、
A A B B C C A B C
细胞学特征相比,数量上更丰富,受环境影 响更小,能更好地反映遗传多态性,已被广 泛地应用于物种起源和进化研究、种质鉴 定、分类和抗病性筛选等领域。 同工酶标记需要特殊的显色方法和技术 某些酶的活性具有发育和组织特异性 标记的数量还是比较有限
5

DNA分子标记 DNA分子标记:是DNA水平上遗传多态性的 直接反映,DNA水平的遗传多态性表现为核 苷酸序列的任何差异,哪怕是单个核苷酸 的变异。
标记可以是一个基因,也可以是未知功能的 DNA片段。 近年来,最常用的分子标记
DNA标记的优点: 遗传多态性丰富; 是遗传物质DNA差异的直接反映; 稳定性、重现性好,不受环境影响; 在基因组中大量存在且分布均匀; 信息量大、分析效率高 检测手段简单快捷,易于自动化 成本较低
DNA分子标记的三个阶段
随着分子生物学技术发展和研究水平的深入,分子 标记的发展经历了三个阶段,也称为三代DNA分子标 记。 第一代分子标记:以酶切与分子杂交技术为核心的 分子标记技术。如 RFLP标记 第二代分子标记:以PCR技术为核心的分子标记技 术。如SSR标记、RAPD标记、AFLP标记、SCAR标记等 第三代分子标记:一些新型的分子标记技术。如SNP 标记等 SSR SNP RAPD AFLP RFLP
目前应用的路标 ——多态性分子标记
restriction fragment length polymorphism, 限制性片段长度多态性 random amplified polymorphism DNA 随机扩增多态性 amplified fragment lenth polymorphism 扩增片段长度多态性 simple sequence repeat polymorphism 简单序列重复多态性 single nucleotide polymorphism 单核苷酸多态性
RFLP标记 目前,分子标记技术已经发展出许多类 型,其中最常见的四种分子标记技术为: RFLP、RAPD、AFLP与SSR RFLP标记 :(Restriction Fragment Length Polymorphism)即限制性片段长度 多态性。这种多态性是由于限制性内切酶酶 切位点或位点间DNA区段发生突变引起的。
Botstein等在1980年首次提出了用RFLP作为遗传标记 构建连锁图谱的设想,并在1987年由Donis-Keller等 建成了第一张人的RFLP图谱
6

RFLP标记是根据在不同基因型的基因组DNA中 限制性内切酶酶切位点各不相同的原理,在用 限制性内切酶酶切不同个体基因组DNA后,会产 生大小不同的DNA酶切片段,经凝胶电泳将不同 大小的片段分离开来,然后将这些大小不同的 DNA片段转移到硝酸纤维膜或尼龙膜上,并用特 异的探针进行Southern印迹杂交,最后通过放 射自显影或其它显色技术显示杂交结果,从而 揭示出DNA的多态性。
选用不同限制性内切酶消化DNA 用琼脂糖凝胶电泳分离酶切片段 将凝胶中的酶切片段DNA的找到尼龙膜上 用同位素标记好的探针与尼龙膜上的DNA杂交 通过放射自显影,显示DNA多态性
最早发现的DNA分子标记--RFLP
RFLP示意图
限制性片段的制备


Southern 印 迹
RFLP
与放射性探针杂交
放射性自显影
7

RFLP连锁图绘制
遗传图与RFLP连锁图
RFLP的特点:
处于染色体上的位置相对固定; 同一亲本及其子代相同位点上的多态性片 段特征不变; 同一凝胶电泳可显示不同多态性片段, 表 现为共显性; 这类标记数量较少,多态性信息因而较 低。 操作流程长,费时费力.
RAPD标记
RAPD标记 (random amplified polymorphism DNA) :即随机扩增多态性标记. RAPD标记是 基于PCR技术的DNA指纹。RAPD标记技术就是用一 个(有时用两个)随机引物(一般8-10个碱基) 非定点地扩增基因组DNA,然后用凝胶电泳分开扩 增片段,检测DNA多态性。
1990年Williams等第一次运用随机引物扩增寻找 多态性DNA片段作为一种新的分子标记—RAPD标记。
8

S165 S168
TGTTCCACGG TTTGCCCGGT
RAPD标记的主要特点:
(1)设计引物也无须知道序列信息,一套引物可用 于不同生物的基因组分析,可检测整个基因组; (2)操作简单易行;
RAPD
(3)对DNA样品需要量极少,对DNA质量要求不高; (4)引物价格便宜,成本较低; (5)显性遗传(极少数为共显性),不能鉴别杂合 子和纯合子; (6)实验重复性较差,结果可靠性较低。
SSR标记 SSR标记 :(Simple sequence repeat )即 简单序列重复多态性标记,也称作微卫星标 记。这种多态性是由于基因组DNA中简单序列 重复单元(如AT、GA、CTT等)的重复次数不同 引起的长度多态性。
每个SSR座位 两侧一般是相 对保守的单拷 贝序列
Tetra-nucleotide minisatellites
9

SSR标记的主要特点:
(1)数量丰富,广泛均匀地分布于整个基因组; (2)具有较多的等位性变异,可以检测出复等位 基因的差异; (3)共显性标记,可以鉴别出杂合子和纯合子; (4)实验重复性好,结果稳定可靠; (5)操作简单; (6)由于创建新的标记时需知道重复序列两端的 序列信息,因此其开发有一定困难,费用也较高。
AFLP标记
AFLP标记(Amplified fragment length polymorphism):即扩增片段长度多态性标记,
AFLP技术是先用限制性内切酶将基因组DNA切割开 来,然后将人工合成的双链接头连接到酶切片段末 端,再用与接头互补的特异性引物进行PCR扩增,将 扩增产物进行聚丙烯酰胺凝胶电泳,用放射性或非放 射性显示DNA的多态性。 是由Zabeau和Vos(1993)发明的一种选择性扩增 限制性片段的DNA指纹技术。
AFLP
AFLP实际上是一种限制性酶切和PCR相结合的技 术,也就是将随机性与专一性扩增结合起来,所以 AFLP既有RFLP的可靠性,也有PCR的高效性,可以 在一个反应内检测大量的限制性片段,一次可获得 50-100条谱带的信息,因此AFLP提供的信息量大, 多态性检出率高。AFLP较其他分子标记有着明显的 优越性。
AFLP的主要特点:
(1)无需预先知道DNA的任何序列信息;适合于任何 生物,没有种属的特异性; (2)所需DNA用量少,反应灵敏、快速高效,适合于 大规模样品的研究; (3)多态性丰富,用少量的引物就能获得大量的多态 性片段,该方法可以检测到种和种以下水平的差异; (4)重复性好,结果可靠,灵敏度高; (5)呈显性或共显性遗传,能检测到覆盖整个基因组 的遗传变异; (6)操作难度较高,花费较大。
10

SNP标记
SNP标记(Single nucleotide polymorphism):
即单核苷酸多态性。主要是指基因组DNA在单碱基水 平上的差异,它不仅能检测基因组中点的差异,而且 通常也能探测单个或数个碱基的小的插入、缺失、颠 换与转换等微小变异。 SNP能够探测不同个体间DNA序列水平上的任何差 异,为遗传学家探寻个体差异提供了一种强有力的 工具。因此又被称为第三代遗传标记。
SNP
1/1000 sequence variations between any two individuals There would be at least 3 millions of SNPs
SNP具有如下特点:
(1)SNP多态性位点丰富。SNP几乎遍及整个基因组。 (2)更加直接而精确地检测基因组DNA序列的差异。 (3)SNP更有助于基因功能的研究。 (4)SNP操作技术难度大,花费昂贵。
分子遗传标记的发展
?
11

DNA recovered from fingerprints
Genetic markers for forentics
Genetic markers making individual identification
possible
Fingerprint
??
Individual Identification and Paternity Testing Nothing would be more specific and reliable than DNA! Individual Identification and Paternity Testing Nothing would be more specific and reliable than DNA!
12

2. 创建作图群体
在构建遗传图谱时,首先需要有作图群体。 作图群体就是遗传标记与基因处于分离状态 的遗传群体。 如F2群体就是一个作图群体。
遗传作图群体
Recombinant Inbred Lines
BALB/cBy (C) C57BL/6By (B)
F1 F2
20 Generations Brother-Sister Mating
CXB RI Set CXB1
CXB2
+? +
CXB13
3. 测定群体中不同个体的标记基因型
基因定位实验数据
Ind Mk1 Mk2 Mk3 … Mk52 Mk53 Mk54 Ph6Y1 Ph7Y1 Ph6Y2 Ph7Y2 1 2 3 4 ┇ 96 97 98 99 2 1 1 2 ┇ 1 1 1 1 1 1 1 2 ┇ 1 1 1 1 1 1 2 2 ┇ 1 1 1 1 … … … … ┇ … … … … 2 2 2 . ┇ 1 2 1 1 . . . . ┇ . 2 . . 2 2 2 2 ┇ 1 2 1 2 46.3 63.2 72.3 47.6 ┇ 78.7 96.2 45.2 59.6 50.1 73.7 93.1 51.2 ┇ 93.4 104.5 47.1 62.9 68.8 89.3 120.8 76.8 ┇ 97.4 124 62.6 97.8 75.4 107 141.8 82 ┇ 108.4 136.8 66 109.3
MM Mm mm
1
3
2
13

遗传图谱资料
Population 2 3 4 5 6 1 2 3 3 3 3 1 3 2 3 1 1 2 2 2 1 1 2 2 2 3 1 3 2 2 2 3 1 3 3 2 2 1 1 3 1 2 3 3 2 3 3 2 3 2 3 3 1 1 2 2 1 3 1 3 3 1 3 3 3 1 3 3 3 1 3 1 3 3 1
4. 遗传标记连锁分析,构建连锁图
7 3 1 2 3 1 2 3 3 1 1 3 3 2 1
… … … … … … … … … … … … … … …
标记1 基因1 标记2 标记3
基因2
Marker No. MK1 MK2 MK3 MK4 MK5 MK6 MK7 MK8 MK9 MK10 MK11 MK12 MK13 MK14
P1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
P2 F1 2 3 2 3 2 3 2 3 2 3 2 3 2 3 2 3 2 3 2 3 2 3 2 3 2 3 2 3
1 3 2 1 1 3 1 3 2 1 3 3 1 3 3
采用连锁分析,计算标记之间的交换率,进而 确定标记之间的遗传距离。 交换率 遗传距离
1% ≈ 1cM 可以采用连锁分析软件Mapmaker3.0来进行 连锁分析与遗传图谱构建。
1
RG472 RG246 1 1 K5 U10 RG532 W1 RG173 Amy1B RZ276 RG146 RG345 RG381 RZ19 RG690 RZ730 RZ801 3 4 3 RG810 RG331 3
2
RG437 RG544 RG171 RG157 RZ318 Pall RZ58 CDO686 Amy1A/C RG95 RG654 4 5
3
RG104 RG348 RZ329 RZ892 2
4
RG218 RZ262 RG190 RG908 RG91 RG449 RG788 RZ565 RZ675 RG163 RZ590 RG214 RG143 RG620 4 5
5
RG556 RZ390 RG313 RZ556 RG403 RG229 4 RG13 CDO105 RZ649 RZ67 RZ70 RZ225
2
1
1
RG100 RG191 RZ678 3 RZ574 5 RZ284 RZ394 pRD10A RZ403 RG179 CDO337 RZ337A RZ448 RZ519 Pgi -1 CDO87 RG910 RG418A 3 5
2
4
2
RG256 RZ213 RZ123 RG520
2
2
6
RZ398 RG213 Amp -3 Est -2 RZ144 RZ667 Pgi -2 pRD10B RG648 RG424 RG162 RG172 CDO544 2 RG653 Amy2A RG433 Cat -1 3 4 5
7
RG773 RG769 RZ488 3 4 5 RG511 RG477 PGMS0.7 CDO59 RG711 Est -9 RZ337B CDO497 CDO418 RZ978 CDO38 RG351 1
8
RZ143 RG20 A5J560 A3E396 1 A18A1120 TGMS1.2 A10K250 AG8-Aro RZ617 RG978 RG1 Amy3D/E RZ66 AC5 RG418B Amp -2 CDO99 2
9
RG757 CDO590 C711 G103 RZ206 RZ422 Amy3ABC RZ228 RZ12 RG667 RG451 RZ792 RZ404
2
图例:
1 1
QTL的位置 不同测定时期的非条件QTL 不同测定时期的条件QTL
二.物理图谱( physical map):
利用限制性内切酶将染色体切成片段,再根据重叠 物理图谱(Physics Map):是以一段已知核酸序列 的片段STS序列为路标,以碱基对数目的多少为图距 来表示两个遗传标记之间的物理距离[基本单位是 Mb、kb、bp]的图谱。 序列标签位点(Sequence Tagged Sites,STS)用来 确定相连或重叠的DNA片段,进而确定片段在基因组 的位置。 ★首先,物理图要获得大量定位明确STS; ★其次,在此基础上构建覆盖每条染色体的大片段 DNA的连续克隆系,为最终完成全序列的测定奠定基 础。 物理图谱是进行DNA分析和基因结构研究的基础。 序列确定片段间连接顺序。
遗传图谱是“路标”,物理图谱就是“铁轨” 遗传图谱是“ 路标” ,物理图谱就是“ 铁轨”
14

遗传图与物理图
遗传图
共同遗传的频率 两个或两个 以上基因 相互间在染色体 上的位置关系 限制性酶切片断作图 重复序列克隆图谱 DNA序列 实际物理位置
物理图
遗传距离是“相对距离”,物理距离就是“实际距离”
cM
bp
物理图谱是系统性、大规模基因组测序的必备条 件,也是对基因定位、克隆和分析基因组结构的关键 工具。 物理图谱不考虑两个标记共同遗传的概率等信息。 对于人类基因组来说,最粗的物理图谱是染色体的 条带染色模式,最精细的图谱是测出DNA的完整碱基 序列。
为什么基因组计划中既要作遗传图谱与又要 作物理图谱呢? 1)基因组太大,必需分散测序,然后将分散的顺 序按原来位置组装,需要图谱进行指导. 2)基因组存在大量重复顺序,会干扰排序,因此 要高密度基因组图. 3)遗传图和物理图各有优缺点,必须相互整合校 正.
三.序列图谱(sequence map):
序列图谱:是分别将各染色体全部碱基序列绘制 的图谱。包括转录序列和非转录序列。 序列图谱是基因组计划最实质的内容,是最精 密的基因图谱,即它将DNA序列按照遗传图和物 理图的标记,确定在基因组中而组合成完整的染 色体序列图谱。
15

目前的策略是把庞大的基因组分成若干有路标的 区域后,进行测序分析。将测出的每一个DNA片段 按其染色体位置进行准确的排列, 从而得到基因 组DNA序列的全貌。 测序方法有多种:全基因组的“鸟枪法”测序策 略,逐步克隆测序策略、cDNA测序等。 目前,我们可以从基因网的数据库中查到所有基 因的序列
四.转录图谱( Transcription map ):
因此,转录图亦称cDNA图或“表达序列”图。 转录图谱也叫基因表达图谱,以表达序列标签 (expressed sequence tag , EST )为位标,反映基 因在不同条件下的表达情况的图谱。 EST是指一段cDNA片段。 所有生物性状和疾病都是由蛋白质决定的,而所有 蛋白质都是mRNA依照遗传密码编码的,若把mRNA通 过反转录合成cDNA(或称作EST的部分cDNA片段), 就抓住了基因的转录部分。然后大规模测序,进行 基因的分离、定位。 表达图谱的意义:通过这张图我们可以了解某一 基因在不同时间、不同组织、不同水平的表达。它 能有效的反映在正常或受控条件中表达的全基因的 时空图。有了“正常”的基因图谱,就奠定了构建特 定生理条件下(如受外源的病原体、药物、食物、 精神的刺激)与“异常”病理情况下,cDNA差异图的 基础,以此为21世纪的基因医学绘制出指导的蓝 图。
16

水稻基因时空动态谱
人基因组时空动态谱
R I C E
L I F E
ALL
AML
C-myb (U22376) Aldehyde reductase (X15414) Proteasome iota (X59417) SNF2 (D26156) Myosin light chain (M31211) Op 18 (M31303) Cyclin D3 (M92287) MCM3 (D38073) MB-1 (U05259) HSP 70 (HG2855-HT2995) RbAp48 (X74262) Estrogen sulfotransferase (U20499) Macmarcks (HG1612-HT1612) HMG-1 (D63874) HkrT-1 (S50223) Alanyl t-RNA synthetase (D32050) TFIIE (X63469) ? Inducible protein (L47738) LPAP gene (X97267) Topoisomerase II (Z15115) ? E2A (M31523) Rabaptin-5 (Y08612) KIAA0159 gene (D63880) SRP9 (U20998) Spectrin (J05243) ? LTC4 synthase (U50136) Zyxin (X95735) Fumarylacetoacetate (M55150) LYN (M16038) Leptin receptor (Y12670) CD33 (M23197) HOXA9 (U82759) Proteoglycan 1 (X17042) MCL1 (L08246) IL-8 precursor (Y00787) Adipsin (M84526) p62 (U46751) ATPase (M62762) CyP3 (M80254) Cystatin C (M27891) Cathepsin D (M63138) IL-8 gene (M28130) CD11c (M81695) Epb72 (X85116) Lysozyme (M19045) Ferritin light chain (M11147) Lectin (M57710) MAD-3 (M69043) Azurocidin (M96326) Properdin (M83652)
Distinguishing Leukemias
ALL AML
Gene expression profile -based gene diagnosis
The gene expression profiles could tell us the differences.
It has taken 4 decades to have the cytology-based classification.
基因表达谱 用于 白血病诊断
(区别急淋与急粒)
low high
第三节 人类基因组计划
人类基因组计划的问世和实施 虽然人类已经经过多年的努力,但解开生命之谜 的愿望还未实现。以往的失败使大家认识到,单靠一 门学科的独自努力太局限了,难以完成人类对自身的 认识和保护。美国投巨资的肿瘤十年计划基本上以失 败告终就说明这个问题。现在,人们认识到先认识全 局再研究局部也许会快捷和方便的多。于是,决定开 始进行人的基因组的研究,由此形成了基因组学和人 类基因组计划.
17

4 major streams
leading to HGP
1. Environment and Mutation (DOE) 2. Cancer Research 3. Human Gene Mapping 4. Strong Passions for Reading Sequences
Human Gene Mapping
(since 1980’) To place a gene for a phenotype at a position of the chromosomes as precise as possible.
Gene for myotonic dystrophy (DM)
Santa Cruz Meeting 对人类基因组测序这个想法是一位名 叫Robert Sinsheimer(罗伯特.辛谢 摩尔)的美国人的心中产生的。
R. Sinsheimer
HGP
(1985)
Robert Sinsheimer convened the meeting which might be the first one that seriously considered sequencing the human genome.
1985年,他把年轻的基因测序研究领域中的最聪明的 研究者聚集在一起,思考这个问题,他们一致同意。 这个想法非常大胆也非常激动人心——但就是很不现 实。同时,他们甚至无法想象为某个细菌测序基因图 谱,当时已被测序的最大的生物是一种只有150000个 碱基的病毒。开始为人类测序基因图谱简直就是天方 夜谭。
R. Sinsheimer
Charles DeLisi, then C. DeLisi Director of Health and Environmental Research at DOE, endorsed the initiative and began to fund in 1987.
那次会议上少数几个人,著名的有瓦尔特.吉尔伯特 对这个想法却是跃跃欲试。吉尔伯特说服了詹姆斯.沃 森接受了这个想法,渐渐地,其他一些科学家,有些 还是科学机构中的权威管理者,加入了这个事业。不 出几年,反对意见开始出现,他们认为,虽然这是可 能的,但还是不能做,因为这会从其他更为紧迫的研 究计划中抽走资金。而且不管怎样,为什么要费心去 想整个基因组序列的问题呢?大多数基因组序列都是 “垃圾”?在需要的时候,只测序关键的基因,这不就 行了吗?
“I became a strong proponent of an international Human Genome Project (HGP)…” “We proposed a 15-year-long effort, reflecting our belief that those starting the project should also be part of the finishing team …” J. Watson
18

“Turning point of cancer research - Sequencing the whole genome”
(Science, March 7, 1986)
R. Dulbbeco (2003)
全球性的人类基因绍计划(HGP)的蓝图是由美国 的杜尔贝克(Dulbbeco)首先提出来的。 1986年3月7日.杜尔贝克在《科学》杂志上发表 了一篇题为“癌症研究的转折点——测定人类基因 组序列”的文章,他在文章中首先论述了癌症研究 的进展,指出癌症研究最重要的成果是使我们认识 到,癌症与其他疾病的发生都与基因有关。因此, 他提出:我们有两种选择,要么各自为政,各家寻 找各家感兴趣的基因,要么测定人类的整个基因组 序列。杜尔贝克着重论述了后者即测完人类整个基 因组序列的途径和重要意义。
他指出“这样的工作是任何一个实验室都难以承担 的,至少应该成为国家级的项目。它的意义可以与 征服宇宙的创举相媲美。我们应该以征服宇宙的气 魄来进行这一宏伟的计划,” “更加引人的是使这一 计划成为国际性的课题,DNA顺序是人类的真话,这 里发生的一切,都与之息息相关”。
之后,经过较长时间的争论,甚至是激烈的辩 论,终于在1988年美国能源部和国家卫生研究院率 先在美国开展人类基因组计划,并得到国会的批 准,由政府资助。鉴于人类基出组的研究是—个全 球性的课题,需要国际间的合作,不久又成立一个 机构——人类基因组织,有多个国家筹集资金和科学 力量,积极参加广这一国际性研究计划。
在接下去的几年中,每当在资金争夺和项目控制的权 利之争发生之时,有关这个问题的讨论就会没完没了 地进行。到1988年,美国国家卫生研究院(NIH)已经 成立一个基因组研究办公室,沃森就是这个办公室的 主任。英国的WELCOME TRUST是一个巨大的医疗慈善机 构,它也加入了。世界上其他大型实验室也参加进来 了,至此,人类基因工程开始启动。
人类基因组计划(HGP) 人类基因组计划(HGP)
1990年启动——生物界中的“阿波罗 登月计划” 目标:测定人类基因组的全部DNA序 列,了解基因及其功能; 国际大合作:美国、英国、日本、 法国、德国、中国 投入:50亿美元 结果:2000年完成工作框架图,2003 年完成精细图,产生32亿个数据
19

Major Missions of HGP
★ Genetic map (STR, 1 cM)
人类基因组计划研究的主要成果和进展表现在这“四张图”上
? 遗传图谱 又称为连锁图谱(linkage map),指基因或DNA标志在染色体 上的相对位置与遗传距离 ? 物理图谱 以定位的DNA标记序列如STS作为路 标,以DNA实际长度即bp、kb、Mb 为图距的基因组图谱。 ? 转录图谱 利用EST(expressed sequence tags 表达序列标签)作为标记所构建的 分子遗传图谱 ? 序列图谱 通过基因组测序得到的,以A、T、 G、C为标记单位的基因组DNA序列
★ Physical map (STS, 0.1 Mb) ★ Sequence map ★ Transcription map (ESTs) ★ Model organisms ★ Technical development ★ ELSI (ethical, legal, social issues)
人类基因组计划大事记
1990年10月——启动了被誉为生物界中的“阿波罗登 月计划”的国际人类基因组计划启动。 1998年5月—— 一批科学家在美国罗光威尔组建塞 拉莱昂遗传公司,目标是投入3亿美元,到2001年绘制 出完整的人体基因组图谱,与国际人类基因组计划展 开竞争; 1999年10月23日——美国国家人类基因组研究所在 美国《科学》杂志上发表声明说,人类基因组计划的 全部基因测序工作将比原计划提前两年,即在2003年 完成。
* Craig Venter博士采用 散弹法于Science上发表 结果。
1999年3月15日—— 英国韦尔科姆基金会宣布,由于科学家 加快工作步伐,人类基因组工作草图将提前至2000年完成。 1999年9月
—— 中国获准加入人类基因组计划,负责测定
2000年3月14日——美国总统克林顿和英国首相布莱尔 发表联合声明,呼吁将人类基因组研建成果公开,以便世 界各国的科学家都能自由地使用这些成果。 2000年4月6日——Celera公司宣布已破译出一名实验者 的完整遗传密码。但不少欧美科学家对Celera公司的成果 表示质疑,认为该公司的研究“没有提供有关基因序列的 长度和完整性的可靠参数”,因而是“有漏洞的”。 2000年4月末—— 我国科学家按照国际人类基因组计划 的部署,完成了1%人类基因组的工作框架图。
人类基因组全部序列的1%,也就是3号染色体上的3000万个 碱基对,使中国成为继美、英、日、德、法之后第六个国际 人类基因组计划参与国,也是参与这一计划的唯一发展中国 家。 1999年12月1日—— 国际人类基因组计划联合研究小组宣 布,他们完整地译出人体第22对染色体的遗传密码,这是人 类首次成功地完成人体染色体基因完整序列的测定。
20

相关主题
文本预览
相关文档 最新文档