当前位置:文档之家› 基因组学重点整理

基因组学重点整理

基因组学重点整理
基因组学重点整理

生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物

具有催化活性的RNA分子称为核酶(ribozyme)核酶催化的生化反应有:自我剪接、催化切断其它RNA、合成多肽键、催化核苷酸的合成

新基因的产生:基因与基因组加倍1)整个基因组加倍;2)单条或部分染色体加倍;3)单个或成群基因加倍。DNA水平转移:原核生物中的DNA水平转移可通过接合转移,噬菌体转染,外源DNA的摄取等不同途径发生,水平转移的基因大多为非必须基因。动物中由于种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞的内共生。动物种间基因转移主要集中在逆转录病毒及其转座成分。

外显子洗牌与蛋白质创新:产生全新功能蛋白质的方式有二种:功能域加倍,功能域或外显子洗牌

基因冗余:一条染色体上出现一个基因的很多复份(复本)当人们分离到某一新基因时,为了鉴定其生物学功能,常常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基因而使突变型表型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保持剂量平衡,因此重复的拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的结构。这类基因重复拷贝变异可使其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致复杂形态的建成,具有许多冗余基因。

非编码序列扩张方式:滑序复制、转座因子

模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中G+C%含量高, 同时CpG 岛的比例也高。进化程度越高, G+C 含量和CpG 岛的比例就比较低

如果基因之间不存在重叠顺序,也无基因内基因(gene-within-gene),那么ORF阅读出现差错的可能只会发生在非编码区。细菌基因组中缺少内含子,非编码序列仅占11%, 对阅读框的排查干扰较少。细菌基因组的ORF阅读相对比较简单,错误的机率较少。高等真核生物DNA的ORF阅读比较复杂:基因间存在大量非编码序列(人类占70%);绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于100个密码子

内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的压力,保留了较多突变。由于碱基突变趋势大多为C-T,故A/T的含量内含子高于外显子。由于终止密码子为TAA\TAG\TGA,如果以内含子作为编码序列,3种读码框有很高比例的终止密码子。

基因注释程序编写的依据:1)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚嘧啶序列,分支点保守序列2)内容指令,密码子偏好,内含子和外显子长短

基因功能的检测:基因失活、基因过表达、RNAi干涉

双链DNA的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。

要获得大于50 kb的DNA限制性片段必需采用稀有切点限制酶。

酵母人工染色体(YAC)1)着丝粒在细胞分裂时负责染色体均等分配。2)端粒位于染色体端部的特异DNA序列,保持人工染色体的稳定性3)自主复制起始点(ARS)在细胞中启动染色体的复制

合格的STS要满足2个条件:它应是一段序列已知的片段,可据此设计PCR反应来检测不同的DNA片段中是否存在这一顺序;STS必需在染色体上有独一无二的位置。如果某一STS在基因组中多个位点出现,那么由此得出的作图数据将是含混不清的。

遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定律为等位基因随机分离,第二条定律为非等位基因自由组合,显隐性规律/不完全显性、共显性、连锁

衡量遗传图谱的水平覆盖程度饱和程度

基因类型:transcribed, translatable gene (蛋白基因) ;transcribed but non-translatable gene ( RNA基因)Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因

基因组(genome):生物所具有的携带遗传信息的遗传物质总和。

基因组学(genomic):用于概括涉及基因作图、测序和整个基因功能分析的遗传学分支。

染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。

比较基因组学(comparative genomics):比较基因组学是基因组学与生物信息学的一个重要分支。通过模式生物基因组与人类基因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。(目标)

RNA世界:RNA不仅可以是信息的携带者,而且还可以是功能的执行者,这使科学家们想到了原始的生物世界可能是一个只由RNA组成的“RNA世界”

外显子洗牌:由不同基因中编码不同结构域的片段彼此连接形成的全新编码顺序称为功能域或外显子洗牌。水平基因转移:是指在差异生物个体之间,或单个细胞内部细胞器之间所进行的遗传物质的交流。

基因共线性(syteny/colinearity):不同基因组中,基因排列顺序的一致性更能够体现基因组的共同起源,这种基因排列顺序的一致性称为共线性。破坏基因组共线性的因素很多, 包括转座、插入、染色体重排、区段加倍和缺失。染色体重排可造成大范围基因位置的改变,但不打乱基因组某些区段的微观共线性。

宏观共线性系指遗传连锁图上锚定标记排列次序的一致性。

微观共线性(microsynteny)则指物理图上基因顺序的一致排列。在多数情况下, 只有在进化距离非常近的物种间才能保持很好的微观共线性。

基因岛(gene island):某些区段基因密度比全基因组的平均密度高很多,形成基因岛。

直系同源集簇(clusters of orthologous groups,COG):由一个共同的祖先基因衍生的一组基因。包括:不同基因组中执行同一生物学功能的种间同源物(ortholog);同一基因组中因基因加倍产生的种内同源物(paralog),或平行基因。

基因的协同丢失和协同进化:执行同一生物学功能的基因有相伴丢失的趋势。与此同时,为了补偿丢失基因所执行的功能,导致其它具有类似功能的基因群高度分化。这就是基因的协同丢失和协同进化。

开放读框(open reading frames, ORFs)所有编码蛋白质的基因都含有开放读框,它们由一系列指令氨基酸的密码子组成。开放读框有一个起点,又称起译密码,一般为ATG,还有一个终点,又称终止密码,分别为TAA,TAG和TGA,三者含义相同。

同义密码子(synonym):编码同一氨基酸的不同密码子称为同义密码子,其差别仅在密码子的第三位碱基不同。

同源查询(homology search)利用已存入数据库中的基因顺序与待查的基因组序列进行比较,从中查找可与之匹配的碱基顺序用于界定基因,这种方法称为同源查询。同源查询的依据:生物的不同种属之间具有功能或结构相似的直系基因成员,它们在起源上一脉相承,其间存在保守的顺序组成。待注释的DNA顺序与已报道的其它基因序列对比,可发现其中的相似性:1)存在某些完全相同的序列;2)ORF读框的排列类似,如等长的外显子;3)ORF指令的氨基酸顺序相同;4)模拟的多肽高级结构相似

孤独基因(orphan gene)在基因分类时,缺少同源顺序的ORF被称为孤独基因。

同源性(homology): 起源于同一祖先序列发生变异的序列。直向同源基因(orthologous ~)不同物种间的同源基因。

共生同源基因(paralogous ~)同一物种的同源基因。

相似性(similarity): 同源蛋白质的氨基酸序列中一致性氨基酸和可取代氨基酸所占比例。可取代氨基酸:具有相同性质(极性)的氨基酸,代换不影响蛋白质的生物学功能

一致性(identity): 同源DNA(蛋白质)序列中同一碱基(氨基酸)位置上相同的碱基(氨基酸)成员

动物园杂交(Zoo-blotting)如果某一物种的DNA顺序与来自另一亲缘种的DNA片段杂交产生阳性信号,该区段可能含有一个或多个基因,这种方法称为动物园杂交。

结构域(domain):指蛋白质高级结构中具有相对独立的亚结构区,通常含有数个二级结构基序,具有相对独立的功能。

蛋白质域结构(domain architecture):又称蛋白质指纹,指蛋白质成员中结构域的组合形式及排列顺序。

直系同源(orthologous)这是指不同物种之间的同源基因,它们来自物种分隔之前的同一祖先。

平行同源(paralogous)同一种生物内部的同源基因,它们常常是多基因家族的不同成员, 其共同的祖先基因可能存在于物种形成之后,也可能出现于物种形成之前。

基因剔除(knock-out)将一段无关的DNA片段用来取代某一特定的基因,是最简便的使基因失活的方法。主要原理是,在一段无关片段的两侧连接与代换基因两侧相同的顺序,将这一构建导入目的细胞,由于同源片段之间的重组,可使无关片段取代靶基因整合到染色体中。

覆盖面:指随机测序获得的序列总长与单倍体基因组序列总长之比。

染色体步移(chormosome walking) 从第一个重组克隆插入片段的一端分离出一个片段作为探针从文库中筛选第二

个重组克隆,该克隆插入片段含有与探针重叠顺序和染色体的其他顺序。从第二个重组克隆的插入片段再分离出末端小片段筛选第三个重组克隆,如此重复,得到一个相邻的片段,等于在染色体上移了一步,故称之为染色体步移顺序标签位点(Sequence tagged site, STS)是一小段长度在100到500 bp的DNA顺序,每个基因组仅一份拷贝,很易分辨。顺序标签位点作图通过PCR或分子杂交将小段DNA顺序定位在基因组的DNA区段中。

表达顺序标签(EST):从cDNA克隆中找到的小段顺序,cDNA代表了mRNA所在细胞中表达的基因。EST可转变为STS,条件是这个EST来自单拷贝基因而非基因家族成员。

RFLP标记限制性片段长度多态性,是指用某一种限制性内切酶来切割来自不同个体的DNA分子,内切酶的识别序列有差异,即是由限制性酶切位点上碱基的插入、缺失、重排或点突变所引起的。这种差异反映在酶切片段的长度和数目上

SSLP(Simple sequence length polymorphisms) 简单序列长度多态性,产于重复顺序的可变排列,同一位点重复顺序的重复次数不同,表现出DNA序列的长度变化。SSLP有些场合又称SSR。

SSR标记:简单序列重复,微卫星DNA标记,它是指基因组中存在的由2-5个核苷酸为重复单位组成的长达几十个核苷酸的串联重复序列,广泛分布于真核生物基因组中。

单核苷酸多态性(single nucleotide polymorphisms,SNP):2个同源DNA顺序中同一碱基位置含有不同的核苷酸作图试剂(mapping reagent):覆盖整条染色体或整个基因组的DNA片段群体,用于STS作图。

厘镭(centiRay,cR),其定义是DNA分子暴露在N拉德X射线剂量下两个分子标记之间发生1%断裂的频率。

C值(C value)是指一个单倍体基因组中DNA的总量,一个特定的种属具有特征的C值。

C值悖理(C value paradox)生物的复杂性与基因组的大小并不完全成比例增加

为什么说RNA分子起主导地位?

RNA不仅可以是信息的携带者,而且还可以是功能的执行者,这使科学家们想到了原始的生物世界可能是一个只由RNA组成的“RNA世界”。

首先,在人工模拟的原始地球的条件下,核糖核苷酸或RNA要比脱氧核糖核苷酸或DNA相对容易形成一些。其次、在现代的生物系统中,合成核苷酸过程是先从糖、氨基酸、二氧化碳等小分子物质合成出RNA的前体;再由核糖核苷酸经还原反应去氧生成DNA的前体。因此,认为RNA比DNA先出现是合理的。RNA能贮存遗传信息,在现代生物中,仍然有少数病毒的基因组完全由RNA组成。从而,认为最早的遗传物质是RNA也是合理的。

RNA一般以单链的形式存在,而单链的RNA可以折叠成多种多样的结构,这为RNA可以具有多种功能提供了结构上的基础。现代的蛋白质酶也正是靠有多种多样的立体结构才可以担当催化生物体内众多的新陈代谢过程的重任。另一方面,在模拟原始地球的条件下很容易产生类蛋白,但不能通过模拟的途径来形成具某种功能的简单蛋白质。因此,RNA是先于蛋白质的生物催化剂。

单独由RNA组成的原始生命的进化以不完全精确的RNA自复制为基础。从大量的RNA变异体中,通过不断的选择,可以使RNA的某种催化功能得到大大的强化,甚至产生出具有新催化功能的RNA分子。因此,只由RNA 构成的生命系统是可以进化的。

在RNA世界中,RNA本身能自我复制,并且能进行一些十分简单的生命活动:RNA分子内或分子间的重组(RNA自剪接)、催化一些早期的生物化学反应、RNA还有可能促进DNA和蛋白质的产生

RNA如何把其长期贮存遗传信息的功能移交给DNA,把它的大部分催化功能移交给蛋白质?

为什么会出现RNA向蛋白质的转变?

一方面,蛋白质的多样性远远超过RNA,因为多肽链中有20种氨基酸,RNA只有4种核苷酸,前者的排列组合的方式比后者大得多,可以催化范围更广的反应;另一方面,蛋白质的催化更为成功。因为多肽链有更大的可塑性,而RNA分子中碱基配对区段则有较强物理刚性。第三,RNA分子的长度有限,限制了它们的催化反应活性。RNA原始基因组仍处在十字路口

一方面,RNA扮演的主要角色是催化各种生化反应,这一点它们做得不错。另一方面,RNA行使编码功能,但显得不太适合。由于受2‘OH基团的影响,RNA的磷酸脂键稳定性较差,无法胜任建立稳定遗传系统的重任。RNA 的编码功能转移到更为稳定的DNA是一种必然的趋势。

RNA世界向DNA世界的转变

尿苷酸由其甲基化的衍生物胸腺嘧啶取代,使DNA顺序具有更高的稳定性;DNA损伤修复系统的诞生进一步奠定了双链DNA作为编码分子的地位,使遗传信息更忠实地传递。

基因组的起源

最初,DNA基因组由许多分散的分子组成,每一个指令单个蛋白质,相当于一个基因。这些基因彼此连接成染色体,它们可能在编码的RNA转变为DNA之前或之后出现。由于组成了含许多基因的染色体,在细胞分裂时基因的分配要比分散的类型更加有效、精确而方便,在竞争中占有优势。

概括:地球上最早出现的生物大分子为RNA,RNA同时具有催化与编码两种功能。RNA可以催化肽键形成并合成蛋白质,此后RNA与蛋白质联手以RNA为模板合成DNA。RNA的编码功能由DNA取代,催化功能转移到蛋白质,RNA自身则成为传达遗传信息的中介分子.

生物为什么能忍受如此之多的无用DNA?

非编码DNA可能具有某种尚未识别的功能,如果没有这些DNA细胞将不能存活。基因的调控顺序虽然没有编码蛋白的功能,但仍有重要的控制基因表达的作用。多数转座因子特别是逆转录转座因子含有控制基因表达的顺序,当它们插入到基因附近时有可能成为增强子的组成元件,为基因表达多样性提供分子基础。

基因功能比基因数量更重要

并非每种生物的基因数量与其基因组尺寸成正比。总体上说,高等动物的基因组大, 基因排列得也稀疏, 也就意味着不必要的重复序列和基因内区多。大的基因组并不意味着更多的基因, 甚至高等动物并不一定比低等动物的基因多。例如果蝇比低等的线虫少5,000个基因。这就是说, 基因功能比基因数量更重要。如果去掉与原核细胞共有的基因, 就可以发现真核细胞独有的决定其特异性的基因

搜索基因的方式

根据已知的顺序人工判读或计算机分析寻找与基因有关的序列

原理:如果一段DNA顺序中含有编码基因,那么这段顺序的碱基序列就不会是随机排列的,一定存在某些可以辨别的特征。

方法:开放读框、同源查询、EST筛选全长cDNA

根据实验分析确认基因

原理:任何基因都可转录为RNA拷贝,这是实验确证基因的依据。真核生物中许多编码蛋白质的基因其转录的初级产物都有内含子,剪切加工后成为mRNA。根据mRNA的顺序可以找到外显子的位置以及整个基因的组成ESTs与基因预测

由于EST来源于cDNA,因此每一条EST均代表了的一个基因的部分序列。

使用合适的比对参数,大于90%的已经注释的基因都能在EST库中检测到。

ESTs可作为其它基因预测算法的补充。

ESTs可以发现基因不同的可变剪接,为蛋白质组学研究提供参考

ESTs具有特定的时空表达,依据来源可判断表达场所,有利于功能研究

实验分析确认基因(论述)

任何基因都可转录为RNA拷贝,这是实验确证基因的依据。真核生物中许多编码蛋白质的基因其转录的初级产物都有内含子,剪切加工后成为mRNA。根据mRNA的顺序可以找到外显子的位置以及整个基因的组成。

分子杂交可确定DNA片段是否含表达顺序

在进行分子杂交实验时,从样品中纯化的RNA经电泳分离,然后转移到杂交膜上。将待测DNA样品标记后与RNA杂交(Northern blotting), 如果RNA中含有DNA的转录产物,会给出明显的信号。

对那些Northern杂交不易检测到的基因还可用另一种途径验证。一些亲缘关系相近的物种,其基因的编码区相似性较高,而非编码区的同源性很低。如果某一物种的DNA顺序与来自另一亲缘种的DNA片段杂交产生阳性信号,该区段可能含有一个或多个基因,这种方法称为动物园杂交。

DNA顺序中基因位置的确定

Northern分析和动物园杂交可判断某一DNA区段是否含有基因,但不能给出基因在DNA顺序中的确切位置。

EST和cDNA的测序可以解决这一问题。cDNA是mRNA 的反转录拷贝,与基因的编码区对应,并含有非转译的5’引导顺序以及3’结尾顺序。将cDNA 与基因组的DNA比较,不仅可以发现漏注的基因,还可确定基因所在的区域并找到外显子和内含子的边界

化学降解法原理

在选定的核苷酸碱基中引入化学基团使DNA分子在被修饰的核苷酸位置降解。

4种核苷酸A,C,G和T均可分别修饰,分别降解,形成只差一个核苷酸的降解DNA群体。

起始DNA样品为双链DNA,测序前要将其转变为单链。

每个单链的同一方向末端都结合了放射性同位素标记,经电泳分林后可显示DNA条带的位置。

每组反应只针对特定碱基,共有四组反应,可分别显示G(硫酸二甲酯),A+G(哌啶甲酸),C(肼)和C+T(1.5M NaCl肼)的终止位置。

链终止法原理

制备相同的单链模板DNA,将其与一小段称为引物的寡聚核苷酸退火,形成双链后起始新链合成。反应由DNA多聚酶催化,底物是4种脱氧核苷酸。在链终止反应中加入了少量的双脱氧核苷酸( dd NTP ),由于DNA多聚酶不能区分dNTPs和ddNTPs,ddNTP可掺入新生的单链中。ddNTP的核糖基3-碳原子上连接的是氢原子而不是羟基,因而不能与下一个核苷酸聚合延伸,合成的新链在此终止。

链终止法对DNA多聚酶的要求

1)高酶活性指多聚酶在终止合成前多聚核苷酸分子可延伸的有效长度。如果测序所用的多聚酶与模板结合能力强,在终止核苷酸掺入新链之前不会脱离模板,即不会提前终止反应。

2)无5’—3’外切核酸酶活性大多数DNA多聚酶都有外切核酸酶活性,5’ 3’核酸酶活性可将新合成DNA 链的5’末端除去核苷酸从而改变链的长度,给顺序的阅读造成困难与误差。

3)无3'—5'外切核酸酶活性可使DNA多聚酶校正3 ' 端错配的核苷酸。

链终止法测序要求单链作为模板,制备单链DNA的方法有:

1)质粒载体克隆单链DNA

2)以M13载体克隆单链DNA

3)以噬粒(phagemid)克隆DNA

4)PCR产生单链DNA

噬粒(phagemid)克隆DNA

一种改造过的质粒克隆载体,含有2个复制起始点:1、质粒自身的复制起始点2、来自M13或其他单链DNA噬菌体基因组的复制起始点。

荧光标记测序的优点

1)免除了同位素标记必需同时进行四组反应的麻烦,简化为由一个泳道同时判读四种碱基;

2)自动化荧光测序系统极大地提高了测序的效率,为基因组大规模测序提供了可能。

3)避免肉眼分辨减少了差错,阅读信号与计算机相连后可直接对数据进行电脑处理,加快了基因组测序的进程。序列间隙

概念:测序时遗漏的序列,本身仍保留在尚未挑选到的克隆中。

填补方法:测序时遗漏的顺序,通过相邻已知顺序作为探针筛选已有的基因组文库,通过挑选阳性克隆解决遗漏的间隙。---PCR扩增

物理间隙

概念:指构建文库时被丢失的DNA序列,在克隆群体中永久的消失。

填补方法:利用其它载体或宿主菌重新构建一个基因组文库。然后以间隙两侧的顺序为探针从新的文库中筛选阳性克隆;或制成相应的PCR引物两两配组从新的文库中筛选阳性克隆。

物理间隙产生的原因:⑴由于特殊的碱基组成,如高度重复序列,缺少合适的酶切位点,难以获得大分子克隆⑵高度重复序列的克隆载体很不稳定,在扩增中容易丢失⑶某些基因的表达产物对宿主菌具有毒性,可将宿主菌杀死,随之克隆DNA本身也消失

随机测序与序列组装

直接鸟枪法的顺序组装是直接从已测序的小片段中寻找彼此重叠的测序克隆,然后依次向两侧邻接的序列延伸。

不需预先了解任何基因组的情况,即使缺少遗传图或物理图也可完成整个基因组顺序的组装。流感嗜血杆菌、果蝇。定位克隆

基因已经定位在染色体的连锁图上,但并不知道它们的具体产物,也不知道它们的表达场所。

先找到与靶基因连锁的分子标记,然后构建基因组文库。通过与靶基因连锁的分子标记筛选阳性克隆;再根据克隆插入子两端的DNA顺序查找与之连接的克隆建立重叠群(contig),直到覆盖整个靶基因位点。

限定测序和序列组装

限定测序和序列组装与定位克隆类似,但前者的目标不在分离基因,而是将一段染色体区段的DNA顺序进行组装。使用这一方法,先要建立基因组的物理图;再从物理图中选出完全覆盖了基因组的彼此最少重叠的克隆,对这些克隆进行测序后,便完成了整个基因组的测序。已经绘制了遗传图与物理图的微生物、线虫、拟南芥、水稻、人类基因组测序采用这一方法。

遗传图谱(genetic map):是以遗传距离表示基因组内基因座位相对位置的图谱。

遗传作图(Genetic mapping)采用遗传学分析方法将基因或其它DNA顺序标定在染色体上构建连锁图。

遗传图谱有什么作用?

人类基因组有30亿个碱基对,含有大量重复序列。要在这样大的序列中确定某一基因的位置,如同大海中捞针。染色体标志:长臂、短臂、区、带、亚带等。但是每一条染色体亚带通常包含几百万个碱基。

因此基因定位需要更细致的划分和标记。就好像对一个街区中的每一条小巷,甚至每一个院落都给予编号一样。

遗传作图标记:形态标记(morphological marker)细胞学标记(cytological marker)生化标记(biochemical marker)免疫标记(Immune marker)分子标记(molecular marker)

分子(DNA)标记优点:中性、共显性、多态性高、数量多、分布均匀、不受环境影响;多基因影响的同一性状遗传分析可以将一个数量性状分解为多个QTL(Quantitative traits loci),通过分析数量性状的基因位点,估算每个QTL 的遗传效应及贡献率。

三代DNA标记

(1)是以Southern杂交技术为核心的分子标记,(如RFLP),这类分子标记被称为第代分子标记。

(2)是以PCR技术为核心的分子标记,(如STS、RAPD、AFLP、SSR)等,这类分子标记被称为第二代分子标记;(3)单核苷酸多态性(SNP)标记被称为第三代分子标记。它也是以以PCR技术为基础的分子标记技术。

物理图谱

物理图谱(physical map)指表示DNA序列上DNA标记之间实际距离的图。

物理作图(physical mapping)采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组的实际位置。辐射杂种、限制性片段作图、荧光原位杂交(FISH)、序列标签位点(STS)、克隆作图等。

物理图的重要意义

利用物理图可获得预期有用的基因;物理图为测定全基因组DNA全序列提供了必要的“骨架”;基因组DNA全序列的测定,就能使人们最终可以在分子(核苷酸)认知水平上解开生命的遗传奥秘

为何要绘制物理图?遗传分析绘制的基因组图为何不能指导基因组计划的测序?

遗传图的分辨率有限:人类及大多数高等真核生物由于不可能获得大量的子代,只有少数的减数分裂事件可供研究,连锁分析的分辨力受到很大限制。人类遗传图其标记密度平均为599 kb,离每100 kb一个标记的要求仍差距甚远,后者是进入基因组全面测序的前提。这种高密度基因组图仅仅采用遗传作图技术是无法完成的,必须借助于其他非遗传分析的方法

遗传图的精确性较低(覆盖面较低):连锁分析中重组热点的存在使染色体某一区段的交换频率高于其他区段。特别是倒位区段,由于受到交换限制,无法绘制精细遗传图。

遗传图分子标记的排列有时会出现差错:遗传作图的依据主要是子代个体的基因型重组及其分离比,由于环境和抽样误差,可能存在非随机的群体组成,这种条件下,用不同的杂交组合会出现不同结果,相同分子标记在联锁图位置不同。

遗传图与物理图并不完全一致:

1.基因座位之间的相对距离不同。遗传作图受重组频率的影响,热点重组区比其它区段图距更长

2.相对位置可能有点偏差,例如一对基因座位chal和glk1的相对位置在遗传图与物理图中正好相反

限制性作图的基本原理

最简单的方法是比较不同限制酶产生的DNA片段的大小:

首先用一种限制酶处理样品,电泳分离可见大小确定的DNA片段。然后用第二种限制酶处理获得第二组片段。最后用2种酶混合处理,获得第三组片段。收集所有上述资料进行对比组装,对2种酶切位点交替出现的区段,用加减法确定酶切位点的相对位置。

克隆载体应具备的条件

项目Y AC BAC

转化率

分离获得DNA难易程度

重组率

插入DNA片段长度低

(1)有多种限制性内切酶切点,每种切口最好只有1个(2)有选择标记,例如抗药性标记,蓝白斑试验;

(3)有一定载体容量;(4)有相当的拷贝数,每个宿主菌可能容纳最多数。

YAC的弊端:

(1)在YAC 载体的插入片段会出现缺失和基因重排(2)容易形成嵌合体(3)YAC 染色体与宿主细胞的染色体大小相近,影响了YAC 载体的广泛应用。

突出优点:酵母细胞比大肠杆菌对不稳定的、重复的和极端的DNA

有更强的容忍性

第八章分子生物学常用技术的原理及其应用及人类基因组学

第八章分子生物学常用技术的原理及其应用及人类基因组学 测试题 一、名词解释 1.分子杂交 2.Southernblotting 3.Northernblotting 4.Westernblotting 5.dotblotting 6.DNA芯片技术 7.PCR 8.功能性克隆 9.转基因技术 二、填空题 1.Southernblotting用于研究、Northernblotting用于研究,Westernblotting用于研究。 2.PCR的基本反应步骤包括、和三步。 3.在PCR反应体系中,除了DNA模板外,还需加入、、和。 4.Sange法测序的基本步骤包括、、和。 5.目前克隆致病相关基因的主要策略有、、。 6.血友病第Ⅷ因子基因的首次克隆成功所采用的克隆策略是,而DMD致病基因的克隆所采用的克隆策略是。 三、选择题 A型题 1.经电泳分离后将RNA转移到硝酸纤维素(NC)膜上的技术是: A.SouthernblottingB.Northernblotting

C.WesternblottingD.dotblotting E.insituhybridization 2.不经电泳分离直接将样品点在NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.Dotblotting E.insituhybridization 3.经电泳分离后将蛋白质转移到NC膜上的技术是 A.SouthernblottingB.Northernblotting C.WesternblottingD.dotblotting E.insituhybridization 4.经电泳后将DNA转移至NC膜上的技术是A.SouthernblottingB.Northernblotting C.WesternblottingD.Easternblotting E.insituhybridization 5.PCR的特点不包括 A.时间短,只需数小时B.扩增产物量大 C.只需微量模板D.用途非常广泛 E.底物必须标记 6.用于PCR的DNA聚合酶必须 A.耐热B.耐高压C.耐酸D.耐碱E.耐低温7.PCR反应过程中,模板DNA变性所需温度一般是A.95?CB.85?CC.75?CD.65?CE.55?C 8.PCR反应过程中,退火温度一般是 A.72?CB.85?CC.75?CD.65?CE.55?C 9.PCR反应过程中,引物延伸所需温度一般是A.95?CB.82?CC.72?CD.62?CE.55?C

现代分子生物学重点

现代分子生物学 第一章 DNA的发现: 1928年,英国Griffith的体内转化实验 1944年,Avery的体外转化实验 1952年,Hershey和Chase的噬菌体转导实验 分子生物学主要研究内容(p11) DNA的重组技术 基因表达调控研究 生物大分子的结构功能研究——结构分子生物学 基因组,功能基因组与生物信息学研究 第二章 DNA RNA组成 脱氧核糖核酸 A T G C 核糖核酸 A U G C 原核生物DNA的主要特征 ①一般只有一条染色体且带有单拷贝基因; ②整个染色体DNA几乎全部由功能基因与调控序列组成; ③几乎每个基因序列都与它所编码的蛋白质序列呈线性对应状态。 染色体作为遗传物质的特点: (1)分子结构相对稳定(贮存遗传信息) (2)通过自我复制使前后代保持连续性(传递遗传信息) (3)通过指导蛋白质合成控制生物状态(表达遗传信息) (4)引起生物遗传的变异(改变遗传信息) C值以及C值反常 C值单倍体基因组DNA的总量 C值反常C值往往与种系进化的复杂程度不一致,某些低等生物却有较大的C值。如果这些DNA 都是编码蛋白质的功能基因,那么,很难想象在两个相近的物种中,他们的基因数目会 相差100倍,由此推断,许多DNA序列可能不编码蛋白质,是没有生理功能的。 DNA的中度重复序列,高度重复序列 中度各种rRNA,tRNA以及某些结构基因如组蛋白基因都属于这一类 高度卫星DNA 核小体 是由H2A H2B H3 H4 各2分子生成的八聚体和约200bp的DNA构成的,H1在核小体外面。 真核生物基因组的结构特点 ①基因组庞大; ②大量重复序列; ③大部分为非编码序列,90%以上; ④转录产物为单顺反子; ⑤断裂基因; ⑥大量的顺式作用元件; ⑦DNA多态性:SNP和串联重复序列多态性; ⑧端粒(telomere)结构。

基因组学复习题

基因组学复习题 Prepared on 22 November 2020

第1章 1)什么是C-值悖理什么是N-值悖理 C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类 mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型 tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因假基因是如何形成的 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达为什么 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族什么是超基因家族 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别为什么会产生这些差别 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在5 Mb以下; 3)缺少重复序列; 4)很少非编码序列。

生物信息学试题整理

UTR的含义是(B ) A.编码区 B. 非编码区 C. motif的含义是(D )。 A.基序 B. 跨叠克隆群 C. algorithm 的含义是(B )。 A.登录号 B. 算法 C. RGR^ (D )。 A.在线人类孟德尔遗传数据 D.水稻基因组计划 下列Fasta格式正确的是(B) 低复杂度区域 D. 幵放阅读框 碱基对 D. 结构域 比对 D. 类推 B. 国家核酸数据库 C. 人类基因组计划 A. seql: agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta B. >seq1 agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta C. seq1:agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta D. >seq1agcggatccagacgctgcgtttgctggctttgatgaaaactctaactaaacactccctta 如果我们试图做蛋白质亚细胞定位分析,应使用(D) A. NDB 数据库 B. PDB 数据库 C. GenBank 数据库 D. SWISS-PROT 数

据库 Bioinformatics 的含义是(A )。 A. 生物信息学 B. 基因组学 C. 蛋白质组学 D. 表观遗传学 Gen Bank中分类码PLN表示是(D )。 A.哺乳类序列 B. 细菌序列 C.噬菌体序列 D. 植物、真菌和藻类序列 ortholog 的含义是(A)0 A.直系同源 B.旁系同源 C.直接进化 D.间接进化 从cDNA文库中获得的短序列是(D )o A. STS B. UTR C. CDS D. EST con tig的含义是(B )o A.基序 B. 跨叠克隆群 C. 碱基对 D. 结构域 TAIR (AtDB)数据库是(C)o A.线虫基因组 B. 果蝇基因组 C. 拟南芥数据库 D. 大肠杆菌基因组ORF的含义是(D )o A.调控区 B. 非编码区 C.低复杂度区域 D. 幵放阅读框

基因组学重点整理

生物五界:动物、植物、真菌、原生生物和原核生物;生物三界:真细菌、古细菌、真核生物 具有催化活性的RNA分子称为核酶(ribozyme)核酶催化的生化反应有:自我剪接、催化切断其它RNA、合成多肽键、催化核苷酸的合成 新基因的产生:基因与基因组加倍1)整个基因组加倍;2)单条或部分染色体加倍;3)单个或成群基因加倍。DNA水平转移:原核生物中的DNA水平转移可通过接合转移,噬菌体转染,外源DNA的摄取等不同途径发生,水平转移的基因大多为非必须基因。动物中由于种间隔离不易进行种间杂交,但其主要来源于真核细胞与原核细胞的内共生。动物种间基因转移主要集中在逆转录病毒及其转座成分。 外显子洗牌与蛋白质创新:产生全新功能蛋白质的方式有二种:功能域加倍,功能域或外显子洗牌 基因冗余:一条染色体上出现一个基因的很多复份(复本)当人们分离到某一新基因时,为了鉴定其生物学功能,常常使其失活,然后观察它们对表型的影响。许多场合,由于第二个重复的功能基因可取代失活的基因而使突变型表型保持正常。这意味着,基因组中有冗余基因存在。看家基因很少重复,它们之间必需保持剂量平衡,因此重复的拷贝很快被淘汰。与个体发育调控相关的基因表达为转录因子,具有多功能域的结构。这类基因重复拷贝变异可使其获得不同的表达控制模式,促使细胞的分化与多样性的产生,并导致复杂形态的建成,具有许多冗余基因。 非编码序列扩张方式:滑序复制、转座因子 模式生物海胆、果蝇、斑马鱼、线虫、蟾蜍、小鼠、酵母、水稻、拟南芥等。模式生物基因组中G+C%含量高, 同时CpG 岛的比例也高。进化程度越高, G+C 含量和CpG 岛的比例就比较低 如果基因之间不存在重叠顺序,也无基因内基因(gene-within-gene),那么ORF阅读出现差错的可能只会发生在非编码区。细菌基因组中缺少内含子,非编码序列仅占11%, 对阅读框的排查干扰较少。细菌基因组的ORF阅读相对比较简单,错误的机率较少。高等真核生物DNA的ORF阅读比较复杂:基因间存在大量非编码序列(人类占70%);绝大多数基因内含有非编码的内含子。高等真核生物多数外显子的长度少于100个密码子 内含子和外显子序列上的差异:内含子的碱基代换很少受自然选择的压力,保留了较多突变。由于碱基突变趋势大多为C-T,故A/T的含量内含子高于外显子。由于终止密码子为TAA\TAG\TGA,如果以内含子作为编码序列,3种读码框有很高比例的终止密码子。 基因注释程序编写的依据:1)信号指令,包括起始密码子,终止密码子,终止信号,剪接受体位和供体位,多聚嘧啶序列,分支点保守序列2)内容指令,密码子偏好,内含子和外显子长短 基因功能的检测:基因失活、基因过表达、RNAi干涉 双链DNA的测序可从一端开始,亦可从两端进行,前者称单向测序,后者称双向测序。 要获得大于50 kb的DNA限制性片段必需采用稀有切点限制酶。 酵母人工染色体(YAC)1)着丝粒在细胞分裂时负责染色体均等分配。2)端粒位于染色体端部的特异DNA序列,保持人工染色体的稳定性3)自主复制起始点(ARS)在细胞中启动染色体的复制 合格的STS要满足2个条件:它应是一段序列已知的片段,可据此设计PCR反应来检测不同的DNA片段中是否存在这一顺序;STS必需在染色体上有独一无二的位置。如果某一STS在基因组中多个位点出现,那么由此得出的作图数据将是含混不清的。 遗传图绘制主要依据由孟德尔描述的遗传学原理,第一条定律为等位基因随机分离,第二条定律为非等位基因自由组合,显隐性规律/不完全显性、共显性、连锁 衡量遗传图谱的水平覆盖程度饱和程度 基因类型:transcribed, translatable gene (蛋白基因) ;transcribed but non-translatable gene ( RNA基因)Non- transcribed, non-translatablegene ( promoter, operator ) rRNA基因,tRNA基因, scRNA基因, snRNA基因, snoRNA基因, microRNA基因 基因组(genome):生物所具有的携带遗传信息的遗传物质总和。 基因组学(genomic):用于概括涉及基因作图、测序和整个基因功能分析的遗传学分支。 染色体组(chromosome set):不同真核生物核基因组均由一定数目的染色体组成,单倍体细胞所含有的全套染色体。 比较基因组学(comparative genomics):比较基因组学是基因组学与生物信息学的一个重要分支。通过模式生物基因组与人类基因组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。(目标)

分子生物学考试重点

基因文库:包括基因组文库和部分基因文库。将含有某种生物不同基因的许多 DNA片段,(导入受体菌的群体中储存,各个受体菌分别含有这种生物的不同的基因,称为基因文库。) 蛋白激酶:是指能够将磷酸集团从磷酸供体分子转移到底物蛋白的氨基酸受体上的一大类酶。 蛋白磷酸酶:是具有催化已经磷酸化的蛋白质分子发生去磷酸化反应的一类酶分 子,与蛋白激酶相对应存在,共同构成了磷酸化和去磷酸化这一重要的蛋白质活性的开关系统。 受体:是细胞膜上或细胞内能识别外源化学信号并与之结合的蛋白分子。是信息分子的接收分子,它们的化学本质是存在于细胞表面或细胞内的蛋白分子。mRNA剪接:去除初级转录物上的内含子,把外显子连接成为成熟RNA的过程前导链:在复制过程中,连续复制的链的前进方向始终与复制叉前进方向一致称为前导链 校对:DNApolI的3’到5’外切酶活性将错配的A水解下来,同时利用5’到3’聚合 酶活性补回正确配对的C,复制可以继续下去,这种功能称为校对 核小体:真核生物染色质由DNA与蛋白质构成,其基本单位是核小体。各两分子的H2A、H2B、H3、H4构成八聚体的核心组蛋白,双链DNA缠绕在这一核心上形成核小体的核心颗粒。颗粒之间再由DNA和组蛋白H1构成的链接区相连形成串珠样结构。 解链温度/融解温度(Tm):在解链过程中,紫外吸光度的变化ΔA260达到最大变化值的一半时所对应的温度定义为DNA的解链温度或融解温度。Tm值:DNA在加热变性过程中,紫外吸收值达到最大值的50%时的温度 增色效应:在DNA解链过程中,由于有更多的共轭双键得以暴露,含有DNA的溶液在260nm 处的吸光度随之增加,这种现象称为DNA的增色效应 DNA复性:当变性条件缓慢除去后,使原来两条彼此分离的DNA链重新缔合,形成双螺旋结构,这个过程称为DNA的复性。 退火:热变性的DNA经缓慢冷却后可以复性,这一过程称为退火。 DNA变性:某些理化因素(温度,pH,离子强度)导致DNA双链互补碱基对之间的氢键发生断裂,使DNA双链解离为单链的现象 DNA复制:以亲代DNA分子为模板按照碱基配对原则合成子代DNA分子的过程。广义也指DNA或RNA基因组的扩增过程,其化学本质是酶促脱氧核苷酸聚合反应 不对称转录:在DNA分子双链上,按碱基互补配对规律能指导转录生成RNA的一股链作为模板指导转录,另一股链则不转录,这种模板选择性称为不对称转录 转录:以DNA为模板合成RNA的过程称为转录。 逆转录:是以RNA为模板合成DNA的过程,即RNA指导下的DNA合成。此过程中,核酸合成与转录(DNA到RNA)过程与遗传信息的流动方向(RNA到DNA)相反称为逆转录 颠换:嘌呤被嘧啶取代或反之。 转换:DNA链中一种嘌呤被另一种嘌呤取代,或嘧啶被另一种嘧啶所取代。

进化基因组学研究进展

研究进化基因组学进展 摘要:进化基因组学是利用基因组数据研究差异基因功能、生物系统演化、从基因在水平探索生物进化的学科。随着近年来基因组数据的不断增加,进化基因组学得到了长足的发展。进化基因组学主要包括从基因组水平理解和诠释生物进化和新基因分析研究探索两方面的内容。本文介绍了进化基因组学研究的主要内容和较为常用的方法,以及近年来在细菌、酵母、果蝇进化基因组学方面的研究进展。 关键词:进化基因组学系统进化比较基因组学新基因 正文 随着基因测序技术的不断进步以及基因组学的飞速的发展,人们积累了大量的基因组学数据,利用所得的大量的基因组数据与进化生物学相结合,在基因组水平研究生物进化机制,随即产生了进化基因组学。 近年来进化基因组学取得了长足的进展,在研究差异基因功能、生物系统演化、从基因在水平探索生物进化的终极方式等方面有重大突破,对人类理解生命现象和过程有重要作用。 研究系统进化学通常包括两个关键步骤:一方面,在不同物种中鉴定同源性特佂,另一方面利用构建系统进化树的方法比较这些特征,进而重新构建这些物种的进化历史[1]。针对这两个关键步骤,传统系统进化学,常采用基于形态学数据和单个基因研究的同源性状鉴定和重建系统进化树(常包括距离法、最大简约法、概率法)[1]的方法来研究。在目前拥有丰富基因组数据的条件下,我们可以分析基因组数据,利用进化基因组学研究系统进化。 一、目前进化基因组学的研究内容主要集中于两个方面:(1)在比较不同生物的基因数据的基础上,从基因组水平理解和诠释生物进化;(2)通过对新基因的分析研究探索基因进化过程的规律两个方面。在进行全基因组进化分析方面,进化基因组学主要集中于构建系统进化树、研究基因组进化策略、研究生物功能变化和进化机制、进化和生态功能基因组学、基因注释的等方面;在新基因方面

基因组学的研究内容

基因组学的研究内容 结构基因组学: 基因定位;基因组作图;测定核苷酸序列 功能基因组学:又称后基因组学(postgenomics基因的识别、鉴定、克隆;基因结构、功能及其相互关系;基因表达调控的研究 蛋白质组学: 鉴定蛋白质的产生过程、结构、功能和相互作用方式 遗传图谱 (genetic map)采用遗传分析的方法将基因或其它dNA序列标定在染色体上构建连锁图。 遗传标记: 有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。 构建遗传图谱 就是寻找基因组不同位置上的特征标记。包括: 形态标记; 细胞学标记; 生化标记;DNA 分子标记 所有的标记都必须具有多态性!所有多态性都是基因突变的结果! 形态标记: 形态性状:株高、颜色、白化症等,又称表型标记。 数量少,很多突变是致死的,受环境、生育期等因素的影响 控制性状的其实是基因,所以形态标记实质上就是基因标记。

细胞学标记 明确显示遗传多态性的染色体结构特征和数量特征 :染色体的核型、染色体的带型、染色 体的结构变异、染色体的数目变异。优点:不受环境影响。缺点:数量少、费力、费时、对生物体的生长发育不利 生化标记 又称蛋白质标记 就是利用蛋白质的多态性作为遗传标记。 如:同工酶、贮藏蛋白 优点: 数量较多,受环境影响小 ?

缺点: 受发育时间的影响、有组织特异性、只反映基因编码区的信息 DNA 分子标记: 简称分子标记以 DNA 序列的多态性作为遗传标记 优点: ? 不受时间和环境的限制 ? 遍布整个基因组,数量无限 ?

不影响性状表达 ? 自然存在的变异丰富,多态性好 ? 共显性,能鉴别纯合体和杂合体 限制性片段长度多态性(restriction fragment length polymorphism , RFLP ) DNA 序列能或不能被某一酶酶切,

基因组学试题

基因组学试题 1、什么是基因组(5分)?什么是转录组(5份)?说明基因组 合的关系和异同(10分)基因组是生物体(细胞或病毒)中所有的DNA的总和, 包括所有的基因和基因间区域,包 括染色体之外的遗传物质,如线粒体、叶绿体、质粒等。 基因组:物种内恒定(♀/♂),生物体或细胞内恒定,没有时空变化(?)。事实上有特例,1、盲鳗(Hugfish) ,性细胞和体细胞DNA 量差异; 2、部分昆虫,性细胞和体细胞染色体数目差异; 3、动物雌雄个体差异 转录组: ?生物体、组织、细胞不同生长发育阶段的转录产物不同。 ?生物体不同组织、同一组织不同细胞的转录产物不同。 ?生物体、组织、细胞不同环境、不同生理状态下的转录产物 不同。 ?转录产物中包含大量不翻译蛋白的RNA,如rRNA; sRNA 2、简述原核生物基因组和真核生物基因组的特点和差异(10分)原核生物基因组 ?一条环状DNA; ?只有一个复制起始点; ?有操纵子(Operon)结构

1.结构基因为多顺反子,若干个功能相关的功能基因串联在一起, 手统一调控区调控。 2.数个操纵子还可以受同一个调节基因(regulaterygene),即调节 子(regulon)调控。 ?结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质 ?基因是连续的,无内含子,转录后不剪接; ?重复序列少,蛋白质基因一般为单拷贝基因,但编码rRNA的基因一般为多拷贝,有利于核糖体快速组装。 真核生物基因组 ?复杂的染色体结构,一般有多条染色体 ?每条染色体上有多个复制起始点; ?基因组中有大量的重复序列(轻度、中度、高度重复); ?基因是不连续的,有内含子,转录后经过剪接加工成成熟RNA;?有许多来源相同、结构相似、功能相关的基因组成的单一基因簇,或基因家族 ?有细胞器基因,真核生物除具有核基因外,还有存在于线粒体和叶绿体中基因,编码同功酶等。 3、什么是遗传图谱(5分)?遗传图谱在基因组研究中的意义 何在(15分)?采用遗传学分析方法将基因或其它DNA标记

基因组考研试题及答案解析(华东师范大学)

第一章基因组学 1、学习基因组学所面临的挑战和意义? 全面鉴定人类基因组所编码的结构和功能成分;发展对人类基因组的可遗传变异的详细理解;发展基于基因组学的方法来预测疾病的敏感性和药物反应,疾病的早期检验,以及疾病的分子分类;应用新的基因和代谢通路的知识开发有效的、新的疾病治疗方法发展;理解物种间的进化变异及其机制;关键农作物基因的克隆和功能验证;基于基因组的工具来提高农作物产量,解决世界粮食危机及全球温饱问题。 2、DNA作为遗传物质的优点? 信息量大,集成度高;碱基互补配对,保证精确复制;核糖2’碳位脱氧,在水溶液中稳定 性好;以T取代U,没有C脱氨变U的危险。 3、证明DNA双螺旋的证据? 各种生物物理证据;X射线衍射图谱;碱基比例;模型构建。 4、DNA、RNA的两个重要化学差异有哪些? 碱基组成;链数。 5、原核、真核生物基因组的不同点? 原核生物:基因组为环状双链DNA分子;只有一个复制起始点;具有操纵子结构:指数个功能上相关的基因串联在一起,连同上游的调控区和下游的转录终止信号构成基因的表达单位:一般无重叠基因;基因是连续的,无内含子;编码区在基因组中的比例;基因组中重复 序列很少;具有编码同工酶的基因(isogene):同工酶是指具有相同催化功能而化学结构不 同的酶,它受一个或几个基因座等位基因;分子中有多功能识别区域复制、转录起始区复制、转录终止区 真核生物:体细胞: 两套基因组(二倍体细胞)性细胞: 一套基因组(单倍体细胞);基因组结构复杂,数目庞大, 多个复制起始点;mRNA为单顺反子:真核基因转录产物为单顺反子,即一种基因编码一种多肽链或RNA链,每个基因转录有各自的调节元件;含大量重复 序列;非编码序列占90%以上;基因间有间隔区(spacer DNA),基因为断裂基因(split gene) 即内含子,外显子;功能相关的基因串联在一起形成基因家族 7、真核生物染色体三大要素及功能? 着丝粒:控制细胞分裂时染色体的取向和移动;端粒:防止染色体末端粘连,保证DNA长度稳定;复制原点:起始DNA复制。 8、染色体末端的端粒为什么很重要? 维持染色体结构的完整性,防止染色体被核酸酶降解及染色体间相互融和;防止染色体结构基因在复制时丢失,解决了末端复制的难题。 9、人类基因组中存在哪些类型的重复DNA? 串联重复基因: 6、简述DNA组成基因的两个重要实验? 第二章基因组的复制 1、在Meselson-Stahl的实验前,我们不知道DNA复制是“弥散型”“半保留型”或“全保留型”,描述经几种不同方式复制,子代分子DNA中DNA的区别? 2、什么是半不连续复制模型? 前导链(leading strand):以5’-3’方向连续合成的DNA 链 滞后链(lagging strand):总体上沿着3’到5’方向延伸,但以小片段形式(5¢-3¢)不连续合成,最后共价连接起来 3、为什么需要RNA引物来引发DNA复制呢? (1)RNA引物可以提供3’-OH末端作合成新DNA链起点。

高通量测序生物信息学分析(内部极品资料,初学者必看)

基因组测序基础知识 ㈠De Novo测序也叫从头测序,是首次对一个物种的基因组进行测序,用生物信息学的分析方法对测序所得序列进行组装,从而获得该物种的基因组序列图谱。 目前国际上通用的基因组De Novo测序方法有三种: 1. 用Illumina Solexa GA IIx 测序仪直接测序; 2. 用Roche GS FLX Titanium直接完成全基因组测序; 3. 用ABI 3730 或Roche GS FLX Titanium测序,搭建骨架,再用Illumina Solexa GA IIx 进行深度测序,完成基因组拼接。 采用De Novo测序有助于研究者了解未知物种的个体全基因组序列、鉴定新基因组中全部的结构和功能元件,并且将这些信息在基因组水平上进行集成和展示、可以预测新的功能基因及进行比较基因组学研究,为后续的相关研究奠定基础。 实验流程: 公司服务内容 1.基本服务:DNA样品检测;测序文库构建;高通量测序;数据基本分析(Base calling,去接头, 去污染);序列组装达到精细图标准 2.定制服务:基因组注释及功能注释;比较基因组及分子进化分析,数据库搭建;基因组信息展 示平台搭建 1.基因组De Novo测序对DNA样品有什么要求?

(1) 对于细菌真菌,样品来源一定要单一菌落无污染,否则会严重影响测序结果的质量。基因组完整无降解(23 kb以上), OD值在1.8~2.0 之间;样品浓度大于30 ng/μl;每次样品制备需要10 μg样品,如果需要多次制备样品,则需要样品总量=制备样品次数*10 μg。 (2) 对于植物,样品来源要求是黑暗无菌条件下培养的黄化苗或组培样品,最好为纯合或单倍体。基因组完整无降解(23 kb以上),OD值在1.8~2.0 之间;样品浓度大于30 ng/μl;样品总量不小于500 μg,详细要求参见项目合同附件。 (3) 对于动物,样品来源应选用肌肉,血等脂肪含量少的部位,同一个体取样,最好为纯合。基因组完整无降解(23 kb以上),OD值在1.8~2.0 之间;样品浓度大于30 ng/μl;样品总量不小于500 μg,详细要求参见项目合同附件。 (4) 基因组De Novo组装完毕后需要构建BAC或Fosmid文库进行测序验证,用于BAC 或Fosmid文库构建的样品需要保证跟De Novo测序样本同一来源。 2. De Novo有几种测序方式 目前3种测序技术 Roche 454,Solexa和ABI SOLID均有单端测序和双端测序两种方式。在基因组De Novo测序过程中,Roche 454的单端测序读长可以达到400 bp,经常用于基因组骨架的组装,而Solexa和ABI SOLID双端测序可以用于组装scaffolds和填补gap。下面以solexa 为例,对单端测序(Single-read)和双端测序(Paired-end和Mate-pair)进行介绍。Single-read、Paired-end和Mate-pair主要区别在测序文库的构建方法上。 单端测序(Single-read)首先将DNA样本进行片段化处理形成200-500bp的片段,引物序列连接到DNA片段的一端,然后末端加上接头,将片段固定在flow cell上生成DNA簇,上机测序单端读取序列(图1)。 Paired-end方法是指在构建待测DNA文库时在两端的接头上都加上测序引物结合位点,在第一轮测序完成后,去除第一轮测序的模板链,用对读测序模块(Paired-End Module)引导互补链在原位置再生和扩增,以达到第二轮测序所用的模板量,进行第二轮互补链的合成测序(图2)。 图1 Single-read文库构建方法图2 Paired-end文库构建方法

分子生物学试题_完整版(Felisa)

05级分子生物学真题 一、选择题 1、激活子的两个功能域,一个是转录激活结构域,另一个是(DNA结合域) 2、转录因子包括通用转录因子和(基因特异转录因子) 3、G-protein激活needs(GTP)as energy. 4、Promoters and(enhancers)are cis-acting elements. 5、噬菌体通过(位点专一重组)整合到宿主中 6、在细菌中,色氨酸操纵子的前导区转录后,(翻译)就开始 7、mRNA的剪切跟(II)类内含子相似 8、UCE是(I)类启动子的识别序列 9、TATA box binding protein在下列哪个启动子里面存在(三类都有) 10、(5S rRNA)是基因内部启动子转录的 11、人体全基因组大小(3200000000bp) 12、与分枝位点周围序列碱基配对的剪接体(U2snRNP) 13、tRNA基因是RNA聚合酶(III)启动的 14、在细菌中,色氨酸操纵子的前导区转录后,(翻译)就开始 15、乳糖操纵子与阻遏蛋白结合的物质是(异构乳糖)。 16、核mRNA的内含子剪接和(II类内含子剪接)的过程相似 17、基因在转录时的特点(启动子上无核小体) 18、RNA干涉又叫(转录后的基因沉默,PTGS) 19、内含子主要存在于(真核生物) 20、snRNA在下列哪种反应中起催化酶的作用(mRNA的剪接) 二、判断题 1、原核生物有三种RNA聚合酶。 2、抗终止转录蛋白的机制是使RNA聚合酶忽略终止子。 3、RNA聚合酶II结合到启动子上时,其亚基的羧基末端域(CTD)是磷酸化的。 4、Operon is a group of contiguous,coordinately controlled genes. 5、RNA聚合酶全酶这个概念只应用于原核生物。 6、聚腺苷酸尾是在mRNA剪接作用前发生的。 7、σ在转录起始复合复合物中使得open到closed状态(closed转变成open) 8、剪接复合体作用的机制:组装、作用、去组装,是一个循环 三、简答题 1、原核生物转录终止的两种方式。 2、组蛋白乙酰化对基因转录的影响。 3、G蛋白在翻译中的作用有哪些? 4、什么是转座?转座子有哪些类型? 5、简述增强子的作用机制。 04级分子生物学期末题目 一、选择题(20题) 1、tRNA的5端剪切所需的酶(RNase P) 2、人体全基因组大小(3,200,000,000bp) 3、(5S rRNA)是基因内部启动子转录的 4、线虫反式剪接所占比例(10%-20%) 5、与分枝位点周围序列碱基配对的剪接体(U2snRNP)

分子生物学知识点归纳

分子生物学 1.DNA的一级结构:指DNA分子中核苷酸的排列顺序。 2.DNA的二级结构:指两条DNA单链形成的双螺旋结构、三股螺旋结构以及四股螺旋结构。 3.DNA的三级结构:双链DNA进一步扭曲盘旋形成的超螺旋结构。 4.DNA的甲基化:DNA的一级结构中,有一些碱基可以通过加上一个甲基而被修饰,称为DNA的甲基化。甲基化修饰在原核生物DNA中多为对一些酶切位点的修饰,其作用是对自身DNA产生保护作用。真核生物中的DNA甲基化则在基因表达调控中有重要作用。真核生物DNA中,几乎所有的甲基化都发生于二核苷酸序列5’-CG-3’的C上,即5’-mCG-3’. 5.CG岛:基因组DNA中大部分CG二核苷酸是高度甲基化的,但有些成簇的、稳定的非甲基化的CG小片段,称为CG岛,存在于整个基因组中。“CG”岛特点是G+C含量高以及大部分CG二核苷酸缺乏甲基化。6.DNA双螺旋结构模型要点: (1)DNA是反向平行的互补双链结构。 (2)DNA双链是右手螺旋结构。螺旋每旋转一周包含了10对碱基,螺距为3.4nm. DNA双链说形成的螺旋直径为2 nm。每个碱基旋转角度为36度。DNA双螺旋分子表面存在一个大沟和一个小沟,目前 认为这些沟状结构与蛋白质和DNA间的识别有关。 (3)疏水力和氢键维系DNA双螺旋结构的稳定。DNA双链结构的稳定横向依靠两条链互补碱基间的氢键维系,纵向则靠碱基平面间的疏水性堆积力维持。 7.核小体的组成: 染色质的基本组成单位被称为核小体,由DNA和5种组蛋白H1,H2A,H2B,H3和H4共同构成。各两分子的H2A,H2B,H3和H4共同构成八聚体的核心组蛋白,DNA双螺旋缠绕在这一核心上形成核小体的核心颗粒。 核小体的核心颗粒之间再由DNA和组蛋白H1构成的连接区连接起来形成串珠样结构。 8.顺反子(Cistron):由结构基因转录生成的RNA序列亦称为顺反子。 9.单顺反子(monocistron):真核生物的一个结构基因与相应的调控区组成一个完整的基因,即一个表达单位,转录物为一个单顺反子。从一条mRNA只能翻译出一条多肽链。 10.多顺反子(polycistron): 原核生物具有操纵子结构,几个结构基因转录在一条mRNA链上,因而转录物为多顺反子。每个顺反子分别翻译出各自的蛋白质。 11.原核生物mRNA结构的特点: (1) 原核生物mRNA往往是多顺反子的,即每分子mRNA带有几种蛋白质的遗传信息。 (2)mRNA 5‘端无帽子结构,3‘端无多聚A尾。 (3)mRNA一般没有修饰碱基。 12.真核生物mRNA结构的特点: (1)5‘端有帽子结构。即7-甲基鸟嘌呤-三磷酸鸟苷m7GpppN。 (2)3‘端大多数带有多聚腺苷酸尾巴。 (3)分子中可能有修饰碱基,主要有甲基化。 (4)分子中有编码区和非编码区。 14.tRNA的结构特点 (1)tRNA是单链小分子。 (2)tRNA含有很多稀有碱基。 (3)tRNA的5‘端总是磷酸化,5’末端核苷酸往往是pG. (4)tRNA的3‘端是CCA-OH序列。是氨基酸的结合部位。 (5)tRNA的二级结构形状类似于三叶草,含二氢尿嘧啶环(D环)、T环和反密码子环。 (6)tRNA的三级结构是倒L型。D环和T环在L的拐角上。 15.rRNA (1)rRNA是细胞内含量最丰富的RNA,它们与核糖体蛋白共同构成核糖体,后者是蛋白质合成的场所。 (2)核糖体和rRNA一般都用沉降系数S表示大小。原核生物核糖体的沉降系数为70S,由50S和30S 两个大小亚基组成,30S小亚基含有16SrRNA和21种蛋白质。50S大亚基含有23S和5SrRNA以及 34种蛋白质。真核生物沉降系数为80S,由大小亚基组成。40S小亚基含有18SrRNA和30多种蛋 白质。60SrRNA含有5S、5.8S和28SrRNA 以及大约45种蛋白质。 16.核酶(ribozyme):某些RNA分子能催化自身或其他RNA分子进行化学反应,即具有酶样的催化活性,这类具有催化活力的RNA称为核酶。核酶分为3类:(1) 异体催化的剪切型。(2)自体催化的剪切型(3)内含子的自我剪切型。 17.核内不均一RNA(hnRNA):真核生物转录生成的mRNA前体即为hnRNA。这类mRNA前体必须经过一系列的加工处理才能变成成熟的mRNA。加工过程的主要环节包括:(1)5‘端加帽(2)3’端加尾(3)内含子的切除和外显子的连接(4)分子内部的甲基化修饰(5)核苷酸序列的编辑作用。 18.miRNA:是一种单链小分子RNA,广泛存在于真核生物中,是一组不编码蛋白质的短序列RNA,其特点就是高度的保守性、时序性和组织特异性。研究表明miRNA可能决定组织和细胞的功能特异性,也可能参与了复杂的基因调控,对组织的发育起重要作用。 19.siRNA:小干扰RNA。是人工合成的短的双链RNA,它可抑制细胞内特定基因的表达,导致转录后基因失

基因组学(结构基因组学和功能基因组学).

问:基因组学、转录组学、蛋白质组学、结构基因组学、功能基因组学、比较基因组学研究有哪些特点? 答:人类基因组计划完成后生物科学进入了人类后基因组时代,即大规模开展基因组生物学功能研究和应用研究的时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。以功能基因组学为代表的后基因组时代主要为利用基因组学提供的信息。 基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(struc tural genomics和以基因功能鉴定为目标的功能基因组学(functional genomics。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。 功能基因组学(functional genomics又往往被称为后基因组学(postgenomics,它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。 基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。 功能基因组学

基因组学复习题

第1章 1)什么是C-值悖理?什么是N-值悖理? C-值悖理:生物基因组的大小同生物进化所处地位的高低无关的现象。 N-值悖理:基因数目与进化程度或生物复杂性的不对应性,称之为N值悖理 2)什么是序列复杂性? 基因组中不同序列的DNA总长,用bp 表示。 3)RNA分子有哪些种类? mRNA tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 4)不编码蛋白质的RNA包括哪些类型? tRNA rRNA scRNA snRNA snoRNA 小分子干扰RNA 5)什么是假基因?假基因是如何形成的? 来源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可转录的假基因。 产生假基因的原因有很多,如编码序列出现终止密码子突变,或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或者异常延伸,合成无活性的蛋白质。 6)假基因能否表达? 为什么? 能,假基因相对于原来的基因已经失去功能但是可能产生新的功能。 最初人们认为, 假基因是不能转录的基因, 随着基因组数据的积累, 现在已知有不少假基因仍然保持转录的活性, 特别是起源于重复基因的假基因和获得启动子加工的假基因,但假基因的转录产物已失去原有的功能, 如产生残缺蛋白质。 7)如何划分基因家族? 什么是超基因家族? 基因家族:将来自共同的祖先,因基因加倍或变异产生了许多在DNA序列组成上基本一致而略有不同的成员划分为一个基因家族。 超基因家族:起源于共同祖先,由相似DNA序列组成的许多基因亚家族或相似的基因成员构成的群体,它们具有相似的功能。 8)低等生物与高等生物基因组组成有何差别?为什么会产生这些差别? 低等生物:1)结构紧凑,一般不存在内含子(古细菌除外); 2)大小在5 Mb以下; 3)缺少重复序列; 4)很少非编码序列。

基因组学复习资料整理

基因组学 1. 简述基因组的概念和其对生命科学的影响。 基因组:指一个物种的全套染色体和基因。广义的基因组:核基因组,线粒体基因组,叶绿体基因组等。 基因组计划对生命科学的影响: ①研究策略的高通量,彻底认识生命规律:基因组研究高通量,研究手段和 研究策略的更新,加强了生命科学研究的分工与协作,从不同层次深入研究生命现象。 ②促进了相关学科的发展:分子生物学遗传学生物信息学生物化学细胞生 物学生理学表观遗传学等 ③物种的起源与进化: Ⅰ.重要基因的发掘、分离和利用:遗传疾病相关基因,控制衰老的基因,工业价值的细菌基因,重要农艺性状基因等。 Ⅱ.充分认识生命现象:基因的表达、调控,基因间的相互作用,不同物种基因组的比较研究,揭示基因组序列的共性,探讨物种的起源和进化。 ④伦理学法律问题:伦理问题,知识产权问题,法律问题,社会保险问题。 2. Ac/Ds转座因子 Ac因子有4563bp,它的大部分序列编码了一个由5个外显子组成的转座酶基因,成熟的mRNA有3500bp。该因子本身的两边为11bp的反向重复末端(IR),发生错位酶切的靶序列长度8bp。Ds因子较Ac因子短,它是由Ac因子转座酶基因发生缺失而形成的。不同的Ds因子的长度差异由Ac因子发生不同缺失所致。 Ac/Ds因子转座引起的插入突变方式:玉米Bz基因是使糊粉层表现古铜色的基因,当Ac/Ds转座插入到Bz基因座后,糊粉层无色。当Ac/Ds因子在籽粒发育过程,部分细胞发生转座,使Bz靶基因发生回复突变,从而形成斑点。 Ac/Ds两因子系统遗传特点: 1)Ac具有活化周期效应,有活性的Ac+因子被甲基化修饰后会形成无活性的ac-因子,反之无活性的ac-因子去甲基化成有活性的Ac+因子。 2)Ac与Ds因子有时表现连锁遗传但更多表现独立遗传。 3)Ac对Ds的控制具有负剂量效应。 4)Ac/Ds可引发靶基因表现为插入钝化、活性改变、表达水平改变和缺失突变等。 5)Ds的结构不同,插入同一靶基因的位点可能不同,形成的易变基因的表型也不同。(分子生物学79-81) 3. 正向遗传与反向遗传 正向遗传学研究指从突变体开始的遗传学研究,关心的问题是突变体表型的变化是由哪一个基因功能丧失后引起。 反向遗传学研究指从基因序列开始的遗传学研究,关心的问题是基因功能丧失后会使植物的表型产生什么样的变化。

遗传学重点名词解释

Chapter 1 性状(character): 生物体所表现的明显的能够遗传的特征。 单位性状(unit character):一个基因或一组基因所决定的一个性状,作为一个遗传单位进行传导。 相对性状(contrasting character):遗传学中同一单位性状的相对差异。 真实遗传(true-breeding)自带性状永远与亲代性状相同的遗传方式。 纯系(pure line):能够进行真是遗传的品种。 三个假说:(1)遗传因子成对存在(颗粒遗传因子) (2)显隐性(3)分离 表型(phenotype):个体形状的外在表现。 基因型(genotype):决定个体表型的基因形式。 等位基因(allele):一个基因的不同形式,是由突变形成的。 纯合体(homozygote):基因座上有两个相同的等位基因,就这个基因座而言,这种个体或细胞成为纯合体。 杂合体(heterozygote):基因座上有两个不同的等位基因。 侧交:杂交产生的后代与隐性纯合亲本交配以检测自带个体基因型。 自由组合定律:配子形成后,同一基因的等位基因分离,非等位基因自由组合。 染色体(chromosome)常由脱氧核糖核酸、蛋白质和少量核糖核酸组成的线状或棒状物,是生物主要遗传物质的载体。 染色质(euchromatin):用碱性染料染色时着色浅的部位,是构成染色体DNA 的主体,在间期呈高度分散状态。 异染色质(heterochromatin):用碱性染色质染色时着色深的部位,又分为组成型染色质. 组成型染色质(constitutive heterochromatin): 在染色体上的大小和位置恒定,在间期时,仍保持螺旋化。如着丝粒。 兼性异染色体(facultative heterochromatin.): 起源于常染色质,在个体发育的特定阶段可转变成异染色质。如x染色体失活。 着丝粒(centromeres):每个染色体上都有一个高度浓缩的区域。 核型分析(karyotype):是指某一物种染色体的组成,通常用中期染色体的照片,铵长臂的大小或总的长度排列,用来表明物种的特点以及和亲缘种之间的进化关系。 带型(banding patterns):用特定的染料对染色体染色后,会出现深浅不一的条带,条带的位置和大小既有高度的染色体的专一性。 端粒(tele mere): 真核生物染色体的末端,有许多成串短的序列组成。 端粒的功能:稳定染色体末端结构,防止染色体间末端连接,并可补偿前导链和后滞链5’末端在消除RNA 引物后造成的空缺。 细胞周期(cell cycle):一次分裂的开始到下一次分裂的开始的这段时间。 姐妹染色单体(sister chromosome):染色体复制,着丝粒的DNA也复制,尽管仅能看到一个着丝粒。复制了的染色体是两个完全一样的拷贝。 G1 S关卡:检测细胞大小和DNA是否受损伤。 G2 M关卡:细胞进入有丝分裂之前检测细胞的生理状态。(如果DNA复制

相关主题
文本预览
相关文档 最新文档