微生物基因组学

  • 格式:ppt
  • 大小:5.53 MB
  • 文档页数:73

下载文档原格式

  / 73
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Genome(kb)
580 640 641 679 751 816 963 910 1,138 1,042 1,069 1,228 1,229 1,230 1,268 1,111
ORF
468 583 545 621 613 677 782 853 1,041 894 924 1,070 1,052 1,052 1,374 834
Guillardia theta Encephalitozoon cuniculi Saccharomyces cerevisiae S288C Schizosaccharomyces pombe Caenorhabditis elegans Arabidopsis thaliana Drosophila melanogaster Oryza sativa L. ssp. Indica Oryza sativa ssp. Japonica Homo sapiens Dictyostelium discoideum Chr. 2 Leishmania major Friedlin Chr. 1 Plasmodium falciparum 3D7 Chr. 3 Plasmodium falciparum 3D7 Chr. 2 3 1 16 3 6 5 6 12 12 24 6 36 14 14 551 2,500 12,069 14,000 97,000 115,428 137,000 420,000 420,000 3,000,000 8,000 257 1,060 947 464 1,997 6,294 4,824 19,099 25,498 14,100 50,000 50,000 30,000 2,799 79 220 205
已完成测序的病原原核生物
鼠疫耶氏菌(Yersinia pestis) 布鲁氏菌(Brucella melitensis 16M) 梭菌(Fusobacterium nucleatum 流感嗜血杆菌(Haemophilus influenzae,Hinf) 麻风分枝杆菌(M. leprae,Mlep) 结核分枝干菌(M. tuberculosis,Mtub) 巴斯德氏菌(Pasteurella multocida,Pmul) 李斯德杆菌(Listeria monocytogenes) 绿脓假单孢菌(P. aeruginosa,Paer) 3 1 1 1 1 2 1 1 1
Buchnera sp Aquifex aeolicus
640 1,551
583 1,512
988 956
90 93
Saccharomyces cerevisiae Schizosaccharomyces pombe
12,069 14,000
6,294 4,820
1,092 2,033
57 70
Caenorhabditis elegans Arabidopsis thaliana
微生物基因组学
微生物基因组学
微生物基因组研究概况 微生物基因组的特点 微生物基因组研究的意义
一 微生物基因组研究概况
1986年: 美国DOE启动MGP 1994年: DOE项目转向 项目转向
环境或能源相关 系统发生学相关 潜在商业应用性 的微生物
1995年:《Science》发表第一株细菌-流感嗜血杆 》发表第一株细菌-
菌全基因组
1995-2002年原核生物全基因组测序情况
25 20 15 10 5 0
1995
1996
1997
1998
1999
2000
2001
2002
已完成测序的病原原核生物 (40株)
金黄色葡萄球菌(Staphylococcus aureus,SaurN) 3 肺炎链球菌(Streptococcus pneumoniae,Spneu) 2 化脓性链球菌(Streptococcus pyogenes,Spyo) 2 脑膜炎奈瑟菌 (Neisseria meningitidis,Nmen) 2 沙门氏菌(S. typhi; S. typhimurium ) 2 空肠弯曲菌(Campylobacter jejuni,Cjej) 1 大肠杆菌(E. coli O157:H7,Ecoli_O157) 2 幽门螺杆菌(Helicobacter pylori,Hpyl ) 2 霍乱弧菌(Vibrio cholerae,Vcho) 1
2. 原核生物基因组的编码序列-- 原核生物基因组的编码序列--
Distribution of E. coli proteins among 22 functional groups (continued)
Functional class Number Percentage Cell processes (including adaptation, protection) 188 4.38 Biosynthesis of cofactors, prosthetic groups, and carriers 103 2.40 Putative chaperones 9 0.21 Nucleotide biosynthesis and metabolism 58 1.35 Amino acid biosynthesis and metabolism 131 3.06 Fatty acid and phospholipid metabolism 48 1.12 Carbon compound catabolism 130 3.03 Central intermediary metabolism 188 4.38 Putative enzymes 251 5.85 Other known genes (gene product or phenotype known) 26 0.61 Hypothetical, unclassified, unknown 1632 38.06 Total 4288 100.00
二 微生物基因组的特点
原核生物基因组的大小 原核生物基因组的编码序列( 原核生物基因组的编码序列(CDS/ORF) 原核生物染色体结构 GC 含量 重复序列 DNA链组成的非对称性 DNA链组成的非对称性 最小基因组
原核生物基因组的大小-1. 原核生物基因组的大小--基因组较小的原核生物
Prokaryocyte
已完成测序的病原原核生物
沙眼衣原体(Chlamydia trachomatis,Ctra) 2 肺炎衣原体(Chlamydia pneumoniae,Cpneu) 3 生殖道枝原体(M. genitalium,Mgen) 1 肺炎枝原体(M. pneumoniae,Mpneu) 1 支气管枝原体(M. pulmonis,Mpul 1 溶脲脲原体(Ureaplasma urealyticum,Uure) 1 立克次体(Rickettsia prowazekii,Rpxx) 2 梅毒螺旋体(Treponema pallidum,Tpal) 1 伯氏疏螺旋体(Borrelia burgdorferi,Bbur) 1
原核生物基因组的编码序列-2. 原核生物基因组的编码序列--ORF的注释
Organism Mycoplasma Genitalium Brucella suis Clostridium perfringens Date Genome (kb) ORFs known hypo. unique Hypo.
Mycoplasma genitalium G-37B0 Buchnera sp Buchnera aphidicola SG Glossina brevipalpis Ureaplasma urealyticum serovar 3B0 Mycoplasma pneumoniae M129B0 Mycoplasma pulmonis Borrelia burgdorferi B31B1 Treponema pallidumNichols B1 Chlamydia trachomatis serovar D Chlamydia trachomatis MoPnB1 Chlamydia pneumoniae J138 Chlamydia pneumoniae AR39B1 Chlamydia pneumoniae CWL029B1 Rickettsia conorii Malish 7 Rickettsia prowazekii Madrid EB1
95-10 02-10
580 2,160
470 2,175
318(68%) 1,333 (61%)
56(12%) 623 (29%)
96(20%) 219 (10%)
02-01
3,031
2,660
1,492(56%)
502(19%)
666(25%)
Methanosarcinห้องสมุดไป่ตู้ Acetivorans 02-07
2. 原核生物基因组的编码序列
(Coding sequence)
ORF 占原核生物基因组总序列的90% 基因的平均大小为1kb
原核生物基因组的编码序列-- 2. 原核生物基因组的编码序列--
不同生物编码序列的比较
Organism Genome (kb) ORFs ORF size Coding Sequence(%)
5,751
4,524
2,226 (49%)
908 (20%)
1,390 (31%)
2. 原核生物基因组的编码序列-- 原核生物基因组的编码序列--
Distribution of E. coli proteins among 22 functional groups
Functional class Number Percentage Regulatory function 45 1.05 Putative regulatory proteins 133 3.10 Cell structure 182 4.24 Putative membrane proteins 13 0.30 Putative structural proteins 42 0.98 Phage, transposons, plasmids 87 2.03 Transport and binding proteins 281 6.55 Putative transport proteins 146 3.40 Energy metabolism 243 5.67 DNA replication, recombination, modification, and repair 115 2.68 Transcription, RNA synthesis, metabolism, and modification 55 1.28 Translation, posttranslational protein modification 182 4.24
97,000 115,428
19,099 25,498
1,311 460
27 29
Homo sapiens
3,000,000
3,100
1,340
<2
基因组编码序列的注释
确定编码序列
序列同源性比较 ,如BLAST 概率型方法,基于隐马尔可夫模型的GENSCAN
基因的功能注释
已知功能的蛋白质基因的序列 已知功能蛋白质的motif/domain 有同源序列的未知基因 无同源序列的疑是基因
原核生物基因组的大小-1. 原核生物基因组的大小--基因组较大的原核生物 Prokaryocyte
Xanthomonas campestris Xanthomonas axonopodis Methanosarcina acetivorans C2A Ralstonia solanacearum GMI1000 Escherichia coli O157:H7. Sakai Pseudomonas aeruginosa PAO1B6 Nostoc sp. PCC 7120 Sinorhizobium meliloti Mesorhizobium loti MAFF303099 Streptomyces coelicolor A3(2)
Genome(kb)
5,076 5,273 5,751 5,810 5,996 6,264 6,413 6,690 7,036 8,667
ORF
4,182 4,386 4,540 5,120 5,448 5,570 5,366 6,205 6,752 7,825
原核生物基因组的大小-1. 原核生物基因组的大小--真核生物基因组的大小 Chr. Genome(kb) ORF