基因组学
- 格式:ppt
- 大小:6.74 MB
- 文档页数:115
基因组学的定义有广义和狭义之分。
广义的基因组学涉及到细胞学、遗传学、进化论和分子生物学的研究对象和范畴,可以称为是规模化的生物学研究。
狭义的基因组学主要是以各类物种的基因组为研究对象,形成复杂的概念、理论框架和研究命题。
基因内涵的最新发展基因在分子生物学中占据了核心地位,基因概念的发展贯穿了分子生物学理论的整个发展历程。
在某种程度上,基因内涵的更新与发展可以视为分子生物学发展阶段的标志。
从最初孟德尔通过离散型表型抽象出的遗传因子(genetic factor)开始,在基因内涵的发展史上先后出现过遗传物质究竟是核酸还是蛋白质之争、DNA琴弦假说等早期探索性工作。
目前,大家所熟知的基因形式包括顺反子、断裂基因、重复基因、重叠基因、跳跃基因、rRNA基因、tRNA基因、假基因等,近来又发现了以微小RNA基因为代表的多种非编码RNA基因(noncoding RNA gene)、跨染色体剪接基因、跨物种横向转移基因(即自然界的转基因)等多种新的基因形式。
诺贝尔生理医学奖在历史上曾多次与基因的更新和发展有关。
随着更多新的基因形式被不断发现,基因内涵也在不断发生变化。
Gerstein等(2007)和Pesole(2008)分别对基因的概念做了较新的定义。
他们给出的基因新概念主要在强调基因编码产物形式的多样性,其本质仍然是遗传信息的功能单位,而且细胞核基因组DNA也仍然是承载基因的主要物质载体。
在传统观念中,除了RNA编辑、剪接,以及蛋白质分子修饰之外,遗传信息从DNA到表型的传递过程几乎是完全线性的,至DNA以下的所有环节,包括中间分子信息和表型均最终受控于基因组DNA,生物的可遗传组分完全由基因组DNA的序列信息决定。
但随着研究的不断深入,这种传统观点正逐渐被打破,目前已经知道表观遗传及其他“软”遗传(soft inheritance)机制也广泛参与了跨代遗传的调控过程。
此外,已在细胞水平和整体水平上证明环境刺激引起的基因表达模式改变也可以在一定条件下实现跨代遗传,好像米丘林遗传学这一被扔进历史垃圾堆里的伪科学又死灰复燃了,在与孟德尔遗传学分道扬镳多年后又开始有了相互靠拢的新迹象(说不准某些曾经的伪科学还真有咸鱼翻身的机会)。
基因组学概念
基因组学(Genomics)是一门研究基因组结构和功能的学科,它涵盖了生命科学、生物信息学、计算机科学等多个领域。
基因组学通过研究基因组的结构、组成、表达和调控,深入理解生命的本质、生物多样性和疾病发生机制,为新药研发、医学诊断和治疗提供基础支持和解决方案。
基因组学的主要研究对象是基因组,即生物体内部所有基因的集合体。
基因组由DNA序列组成,其中包括编码蛋白质和调节基因表达的基因,以及非编码DNA序列和重复DNA序列等。
基因组学的研究内容包括以下几个方面:
1. 基因组测序:通过高通量测序技术,对基因组进行大规模的测序分析,以获取基因组的详细序列和变异信息。
2. 基因组组装:通过对测序数据进行组装和分析,构建基因组的物理图谱和遗传图谱,以确定基因组的结构和组成。
3. 基因组注释:通过对基因组序列进行注释和分析,确定基因的编码区、调控序列和重复序列等信息,以揭示基因的功能和表达模式。
4. 基因组变异分析:通过分析基因组序列中的变异,包括单核苷酸变异(SNV)、插入和缺失(INDEL)、结构变异(SV)等,揭示基因组的遗传多样性和疾病发生机制。
5. 基因组学应用:将基因组学应用于医学、农业、环境科学等领域,包括新药研发、疾病诊断和治疗、生物多样性保护等。
基因组学的发展得益于现代科技的不断进步和创新,如高通量测序技术、生物信息学方法和计算机科学算法等。
随着技术的不断革新和完善,基因组学将在生命科学、医学和农业等领域发挥越来越重要的作用,为人类提供更加全面、深入和精准的知识和解决方案。
基因组:生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。
基因组学:研究基因组结构和功能的科学。
指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。
C值:指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。
每个细胞中以皮克(pg,10-12g)水平表示。
C 值矛盾:在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,它们的C值可以相差数10倍乃至上百倍。
序列复杂性:不同序列的DNA总长称为复杂性,复杂性代表了一个物种基因组的基本特征。
隔裂基因:指基因内部被一个或更多不翻译的编码顺序即内含子所隔裂。
假基因:来源于功能基因但已失去活性的DNA序列。
微卫星序列:或称简单串联重复,重复单位较短。
重复序列只有1-6个核苷酸,分布在整个基因组,10-50个重复单位.重叠群:通过末端的重叠序列相互连接形成连续的DNA长片段的一组克隆称为重叠群。
指纹:指确定DNA样品所具有的特定DNA片段组成。
STS作图:根据STS序列设计引物,扩增文库当中的克隆,能扩出条带的克隆都含有序列重叠的插入子。
荧光原位杂交:指在染色体上进行DNA杂交,以便识别荧光标记探针在染色体上位置的方法。
辐射杂种群:通过放射杂交产生的融合细胞群称为辐射杂种群。
覆盖面(或深度):每个核苷酸在完成顺序中平均出现的次数,或者说完成顺序的长度与组装顺序长度之比。
支架:一组已锚定在染色体上的重叠群, 内部含间隙或不含间隙.同源性:基因系指起源于同一祖先但序列已经发生变异的基因成员。
一致性:指同源DNA顺序的同一碱基位置的相同的碱基成员, 或者蛋白质的同一氨基酸位置的相同的氨基酸成员, 可用百分比表示.相似性:指同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。
转座子:一段DNA顺序可以从原位上单独复制或断裂下来,插入另一位点,并对其后的基因起调控作用,此过程称转座,这段序列称跳跃基因或转座子。
1.突变:指基因组中小段区域内核苷酸序列的改变,大多数突变是点突变,即核苷酸序列中某一碱基取代了另一碱基,其他的突变则涉及一个或几个核苷酸的插入或缺失。
2. 重组:指基因组中发生重新组合的区段,产生于减数分裂时同源染色体的交换,染色体的到位和易位,转座成分在同一染色体或不同染色体上转座以及外源DNA的整合等。
3.重组的分类:同源重组和非同源重组。
4. (1)同义突变:突变的密码子仍然指令同一氨基酸,因而同义突变是沉默突变。
(2)错义突变:此类突变发生的位置在密码子的第1位和第2位碱基,可改变密码子的含义,指令一个不同的氨基酸。
(3)终止突变:可使原来编码氨基酸的密码子变成翻译终止密码,产生残缺的蛋白质。
(4)连续突变:终止密码变成指令某一氨基酸的密码子,使翻译继续进行。
5.突变对多细胞生物的影响:(1)功能丧失(2)功能增益6.染色体重排:染色体的非同源重组与交换会导致染色体重排。
7.转座:一个转座子由基因组的一个位置转移到另一个位置的过程。
8.基因簇:基因家族中来源相同、结构相似和功能相关的基因在染色体上彼此紧邻所构成的串联重复单位。
9.基因组学:用于概括涉及基因组作图、测序和整个基因组功能分析的遗传学学科分支,并已用来命名一个学术刊物。
10.基因组学的研究内容:全基因组范围研究基因的结构,组成,功能及其变化,因而涉及大范围高通量收集和分析有关基因组DNA的序列组成,染色体分子水平的结构特征,全基因组的基因数目,功能和分类,基因组水平的基因表达与调控以及不同物种间基因组的进化关系。
11.遗传的分子基础:绝大多数生物,包括低等生物和高等生物的基因组都由脱氧核糖核酸(DNA)组成,少数病毒基因组则为核糖核酸(RNA)。
12.蛋白质的二级结构:(1)α螺旋:多肽链中一些连续的氨基酸序列能自发形成有规律的盘旋构型。
(2)β-折叠:由侧向平行的多肽链组成,一条多肽链中肽键的羰酰氧原子与另一条多肽链中肽键的酰胺氢原子形成氢。
基因组:生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。
基因组学:指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。
基因组学包括3个不同的亚领域1结构基因组学:以全基因组测序为目标2功能基因组学:以基因功能鉴定为目标3比较基因组学C值是指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。
C值悖理(矛盾):在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,它们的C值可以相差数10倍乃至上百倍。
C值不随生物的进化程度和复杂性而增加;关系密切的生物C值相差甚大;真核生物的DNA的量远大于编码蛋白质所需的量。
C值反映了总体趋势上,随着生物结构和功能的复杂性的增加,各分类单元中最小基因组的大小随分类地位的提高而递增。
单一顺序:基因组中单拷贝的DNA序列重复顺序:基因组中多拷贝的基因序列真核生物基因组DNA组分为非均一性,可分为3种类型:快速复性组分、居间复性组分、缓慢复兴组分基因家族:是真核基因组的共同特征,他们来自一个共同的祖先,因基因加倍和趋异,产生了许多在DNA序列上基本一致而略有不同的成员。
包括编码RNA的基因和编码蛋白质的基因隔裂基因(split gene):指基因内部被一个或更多不翻译的编码顺序即内含子所隔裂。
3、异常结构基因分类重叠基因:编码序列彼此重叠的基因,含有不同蛋白质的编码序列。
基因内基因:一个基因的内含子中包含其他基因。
反义基因:与已知基因编码序列互补的的负链编码基因,参与基因的表达调控,可以干扰靶基因mRNA转录与翻译。
假基因:来源于功能基因但已失去活性或者改变原来活性功能的DNA序列.四、基因组特征比较真核生物基因组的特征:复杂性较高的生物基因组结构松弛,在整个基因组范围内分布大量重复顺序(小基因组重复序列较少,大基因组重复序列急剧扩增);含有大量数目不等的线性DNA分子,并且,每个长链DNA都与蛋白质组成染色体结构;含有细胞器基因组(所有真核生物都具有环状的线粒体DNA,植物细胞还含有环状的叶绿体DNA。
名词解释:第一章基因组遗传图(连锁图):指基因或DNA标记在染色体上的相对位置与遗传距离。
单位是厘摩cM (基因或DNA片段在染色体交换过程中分离的频率)。
物理图:以已知核苷酸序列的DNA片段(序列标签位点,sequence-tagged site, STS)为“路标”,以碱基对作为基本测量单位(图距)的基因组图。
转录图:以EST(expressed sequence tag ,表达序列标签)为标记,根据转录顺序的位置和距离绘制的图谱。
EST:通过从cDNA文库中随机挑选的克隆进行测序所获得的部分cDNA的5'或3'端序列称为表达序列标签(EST),一般长300-500 bp左右。
序列图(分子水平的物理图):序列图是指整个人类基因组的核苷酸序列图,也是最详尽的物理图。
既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和。
基因:合成有功能的蛋白质或RNA所必需的全部DNA序列,即一个基因不仅包括编码蛋白质或RNA的核酸序列,还应包括为保证转录所必需的调控序列。
基因组(genome):生物所具有的携带遗传信息的遗传物质的总和。
基因组学(genomics):涉及基因组作图、测序和整个基因组功能分析的一门学科。
C值:单倍体基因组的DNA总量,一个特定种属具有特征C值C值矛盾(C value paradox):指一个有机体的C值和其编码能力缺乏相关性。
单一序列:基因组中单拷贝的DNA序列。
重复序列:基因组中多拷贝的DNA序列。
复杂性(complexity):基因组中不同序列的DNA总长。
高度重复序列(highly repetitive sequence):重复片段的长度单位在几个到几百个碱基对(base pair,bp)之间(一般不超过200 bp),串联重复频率很高(可达106以上),高度重复后形成的这类重复顺序称为高度重复顺序。
中度重复序列(intermediate repetitive sequence ):重复长度300~7000 bp不等,重复次数在102~105左右。
基因组学1.基因组学包括那些研究内容?(1)结构基因组学:通过基因组作图、核苷酸序列分析,研究基因组结构,确定基因组成、基因定位的科学基因组测序:⾸先将整个基因组的DNA分解为⼀些⼩⽚段,然后将这些分散的⼩⽚段逐个测序,最后将测序的⼩⽚段按序列组装基因组作图:在长链DNA分⼦的不同位置寻找特征性的分⼦标记,绘制基因组图。
根据分⼦标记可以准确⽆误地将已测序的DNA⼩⽚段锚定到染⾊体的位置上。
(2)功能基因组学:利⽤结构基因组学提供的信息和产物,在基因组系统⽔平上全⾯分析基因功能的科学。
功能基因组学的研究内容:(1)进⼀步识别基因以及基因转录调控信息。
(2)弄清所有基因产物的功能,这是⽬前基因组功能分析的主要层次。
(3)研究基因的表达调控机制,分析基因产物之间的相互作⽤关系,绘制基因调控⽹络图。
(3)⽐较基因组学:研究不同物种之间在基因组结构和功能⽅⾯的亲源关系及其内在联系的学科。
⽐较基因组学的研究内容::(1)绘制系统进化树,显⽰进化过程中最主要的变化所发⽣的时间及特点。
据此可以追踪物种的起源和分⽀路径。
(2)了解同源基因的功能。
(3)对序列差异性的研究有助于认识产⽣⼤⾃然⽣物多样性的基础。
2.基因组学的历史变⾰与发展趋势?(⼀)1900年代以前:前遗传学时代(1)物种进化的⾃然选择学说——达尔⽂进化论。
(2)1865年G.Mendel发表豌⾖杂交实验结果,提出了遗传学的两⼤遗传规律—分离规律和独⽴分配规律,并认为是⽣物体内的遗传因⼦或遗传颗粒控制⽣物性状(⼆)1900—1950年代:经典遗传学时代标志:1900年,孟德尔遗传规律再发现标志着遗传学的诞⽣)⼈们开始把控制⽣物遗传性状的遗传单称为基因。
⽣命科学的研究基本都是围绕着基因来进⾏。
(三)1950—1990年代:分⼦⽣物学时代(前基因组学时代)标志:Watson & Crick 的DNA 双螺旋结构的发现[《Nature》1953.4.25],标志着分⼦⽣物学时代的开始 F.Crick根据DNA 的X射线衍射图谱,提出了DNA双螺旋结构模型,解释基因复制的机制,从⽽真正开始从分⼦⽔平上研究⽣命活动。
基因组复习基因组(genome),又称染色体组一个物种单倍体的染色体数目,物种全部遗传信息的总和基因组学研究的最终目标: 获得生物体全部基因组序列; 鉴定所有基因的功能; 明确基因之间的相互作用关系; 阐明基因组的进化规律。
经典遗传学:在20世纪初,遗传学刚刚诞生的时候,遗传学家的工作主要是鉴别感兴趣的基因,确定这些基因在染色体上的位置。
第一个环节:寻找自发突变体,或者利用物理、化学因素诱发突变。
第二个环节:通过连锁分析确定新基因与已知基因的相互关系,绘制遗传连锁图。
基因组学的研究内容结构基因组学:基因定位;基因组作图;测定核苷酸序列功能基因组学:又称后基因组学(postgenomics)基因的识别、鉴定、克隆;基因结构、功能及其相互关系;基因表达调控的研究蛋白质组学:鉴定蛋白质的产生过程、结构、功能和相互作用方式遗传图谱(genetic map)采用遗传分析的方法将基因或其它DNA序列标定在染色体上构建连锁图。
遗传标记:有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。
构建遗传图谱就是寻找基因组不同位置上的特征标记。
包括:形态标记;细胞学标记;生化标记;DNA 分子标记所有的标记都必须具有多态性!所有多态性都是基因突变的结果!形态标记:形态性状:株高、颜色、白化症等,又称表型标记。
数量少,很多突变是致死的,受环境、生育期等因素的影响控制性状的其实是基因,所以形态标记实质上就是基因标记。
细胞学标记明确显示遗传多态性的染色体结构特征和数量特征:染色体的核型、染色体的带型、染色体的结构变异、染色体的数目变异。
优点:不受环境影响。
缺点:数量少、费力、费时、对生物体的生长发育不利生化标记又称蛋白质标记就是利用蛋白质的多态性作为遗传标记。
如:同工酶、贮藏蛋白优点:数量较多,受环境影响小缺点:受发育时间的影响、有组织特异性、只反映基因编码区的信息DNA分子标记:简称分子标记以DNA序列的多态性作为遗传标记优点:不受时间和环境的限制遍布整个基因组,数量无限不影响性状表达自然存在的变异丰富,多态性好共显性,能鉴别纯合体和杂合体限制性片段长度多态性(restriction fragment length polymorphism,RFLP)DNA序列能或不能被某一酶酶切,相当于一对等位基因的差异。