基因功能分析的基本策略-硕士
- 格式:ppt
- 大小:8.88 MB
- 文档页数:75
硕士研究生分子生物学复习JUJU一、名词解释1. 基因gene:是指核酸分子中贮存遗传信息的遗传单位,是指贮存有功能的蛋白质多肽链或RNA序列信息及表达这些信息所必需的全部核苷酸序列.2. 基因组genome:是指细胞或生物体中,一套完整单倍体的遗传物质的总和.基因组的结构主要指不同的基因功能区域在核酸分子中的分布和排列情况,基因组的功能是储存和表达遗传信息.3. 基因家族gene family:是指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因.同一个家族的基因成员是由同一祖先基因进化而来.4. 假基因pseudogene:在多基因家族中,某些成员并不能表达出有功能的产物,这些基因称为假基因,用ψ表示.假基因与有功能的基因同源,原来也可能是有功能的基因,由于缺失、倒位或点突变等原因失去活性,成为无功能的基因,它们或者不能转录,或者转录后生成无功能的异常多肽.5. 质粒plasmid:是存在于细菌细胞质中的一类独立于染色体的遗传成分,它是由环形双链DNA组成的复制子.质粒DNA分子可以持续稳定的处于染色体外的游离状态,但在一定条件下又会可逆的整合到宿主染色体上,随染色体的复制而复制,并通过细胞分裂传递到后代.6. 基因超家族gene superfamily:是指一组由多基因家族及单基因组成的更大的基因家族.它们的结构有程度不等的同源性,可能是由于基因扩增后又经过结构上的轻微改变,因此它们可能都起源于相同的祖先基因.但是它们的功能并不一定相同,这一点正是与多基因家族的差别.这些基因在进化上也有亲缘关系,但亲缘关系较远.如免疫球蛋白超家族.7. 卫星DNAsatellite DNA:为非编码区串联重复序列.通常存在于内含子和间隔DNA内.重复次数从数次至数百次,甚至几十万次,串联重复单位从最短的2bp 起,长短不等.这类重复顺序组成卫星DNA的基础.可分为三类:大/小/微卫星DNA.8. 基因多态性:是指由于等位基因间在特定位点上DNA序列存在差异造成的,一般发生在基因序列中不编码蛋白质的区域和没有重要调节功能的区域.9. 操纵子operator:是阻遏蛋白识别与结合的一小段DNA序列,转录过程存在阻遏调控机制的基因中均含有这样的序列.操纵子紧接在启动子下游,通常与启动子有部分重叠.10. 顺式作用元件cis-acting elements:是指那些与结构基因表达调控相关、能够被基因调控蛋白特异性识别和结合的DNA序列.原核生物中主要是启动子、阻遏蛋白结合位点、正调控蛋白结合位点、增强子等.真核生物中包括启动子、上游启动子元件、增强子、加尾信号和一些反应元件等.11. 反式作用因子trans-acting elements:在真核生物中,基因特异性转录因子称为反式作用因子,这些因子通常是通过与增强子或上游启动元件结合而发挥作用.反式作用因子通过与通用转录因子及RNA聚合酶相互作用而刺激转录,这些相互作用促进前起始复合物的形成.12. 增强子enhancer:是一种较短的DNA序列,能够被反式作用因子识别与结合.反式作用因子与增强子元件结合后能够调控通常为增强临近基因的转录.增强子序列通常是数个形成一簇,位于转录起始点上游-100~-300bp处,但在基因之外或某些内含子中也有增强子序列.13. 启动子promoter:是RNA聚合酶特异性识别和结合的DNA序列.启动子具有方向性,一般位于结构基因转录起始点的上游,启动子本身并不被转录.也有一些真核生物启动子位于转录起始点下游,且可以被转录14. 载体vector:携带外源DNA进入宿主细胞,并在宿主细胞中进行无性繁殖或表达的小分子DNA. 这种DNA进入受体细胞后,可自主复制,或插入到基因组中,随受体细胞的基因组一起复制.载体上还常带有特定的药物抗性基因,便于筛选.按功能可分为克隆载体和表达载体,按来源可分为质粒、噬菌体、噬菌粒、粘粒、病毒和人工染色体载体等.15. 基因工程gene engineering:将基因进行克隆,并利用克隆的基因表达、制备特定的蛋白或多肽产物,或定向改造细胞乃至生物个体的特性所用的方法及相关的工作统称为基因工程./是在分子水平上,用人工方法提取或制备DNA, 在体外切割、拼接和重新组合,然后通过载体把重组的DNA分子导入受体细胞,使外源DNA在受体细胞中进行复制与表达,生产出人们所需要的产物,或定向创造生物新性状,并使之稳定地传给下一代.16. PCRpolymerase chain reaction:聚合酶链式反应.是在DNA聚合酶、模版DNA、引物和4种dNTP存在的条件下进行的体外酶促DNA合成反应,是在体外特异性扩增位于两段已知序列之间的DNA区段的一种方法./其原理是依据细胞中DNA半保留复制机理,DNA在不同温度下变性、复性的特性,人为控制温度高温变性、低温退火、中温延伸循环多次后使目的基因得到扩增.17. RNAiRNA interference:RNA干涉,是指外源性的dsRNA所致的细胞内有效的和特异性的基因封闭.其作用机制是双链RNA被特异的核酸酶降解,产生干扰小RNAsiRNA,这些siRNA与同源的靶RNA互补结合,特异性酶降解靶RNA,从而抑制、下调基因表达.已经发展成为基因治疗、基因结构功能研究的快速而有效的方法./是指在生物体细胞内,dsRNA引起同源mRNA的特异性降解,因而抑制相应基因表达的过程.是一种转录后水平的基因沉默,在生物体内普遍存在./指在生物体细胞内,外源性dsRNA酶切产生siRNA引起同源mRNA的特异性降解,因而抑制相应基因表达的过程. 是一种转录后水平的基因沉默,在生物体内普遍存在外源性dsRNA被一种叫DICER的dsRNA内切酶剪切产生siRNA,其可识别靶mRNA分子并使其被相应的核糖核酸酶切割成片段,从而抑制正常基因的表达,正常时生物体内不会有RNAi现象,只有在外源性RNA导入的情况下会发生.18. 分子杂交nucleic acid hybridization:是指具有互补序列的两条核酸单链在一定条件下按碱基酸对原则形成双链的过程.19. 基因诊断gene diagnosis:是以DNA和RNA作为诊断材料,通过检查基因的存在、缺陷或异常表达,对人体状态和疾病作出诊断的方法和过程.其基本原理是检测DNA或RNA的结构变化与否,量的多少及表达功能是否正常,以确定被检查者是否存在基因水平的异常变化,以此作为疾病诊断的依据.20. 基因治疗gene therapy:是应用基因或基因产物,治疗疾病的一种方法.狭义的说,基因治疗是把外界的正常或治疗基因,通过载体转移到人体的靶细胞,进行基因修饰和表达,改善疾病的一种治疗手段.21. miRNAmicroRNA:是真核生物中发现的一类内源性的具有调控功能的非编码RNA,其大小长约20~25nt.成熟的miRNA是由较长的初级转录产物经过一系列核酸酶的剪切加工而产生的,随后组装进RNA诱导的沉默复合体,通过碱基互补配对的方式识别靶mRNA,并根据互补程度的不同指导沉默复合体降解靶mRNA或阻遏靶mRNA的翻译./长度约20-25个碱基对的非编码单链RNA,通过与 mRNA3'UTR互补的机制结合到mRNA上,抑制其转录或直接导致其降解,从而抑制基因表达.有高等生物基因组编码,在物种进化中相当保守.miRNAs的表达具组织特异性和时序性,在细胞生长和发育过程的调节中起多种作用22. 反义RNAanti-sense RNA:其碱基序列正好与mRNA互补,从而可与mRNA配对结合形成双链,抑制mRNA作为模板进行翻译.23. 转染transfection:指真核细胞主动摄取或被动导入外源DNA片段而获得新的表型的过程.24. 转化transformation:是指将质粒或其他外源DNA导入处于感受态的宿主细胞,并使之获得新的表型的过程.转化现象在自然界普遍存在,是常见的基因转移方式之一.25. 基因表达:是指生物基因组中结构基因所携带的遗传信息经过转录、翻译等一系列过程,合成特定的蛋白质,进而发挥其特定的生物学功能和效应的全过程.但并非所有基因表达过程都产生蛋白质,rRNA、tRNA编码基因转录生成RNA的过程也属于基因表达.26. 限制性核酸内切酶restriction endonuclease:是一类能识别双链DNA分子中特定核苷酸序列,并在识别序列内或附近特异切割双链DNA的核酸内切酶. 27. 基因组学genomics:指对所有基因进行基因组作图包括遗传图谱、物理图谱、转录图谱,核酸序列分析,基因定位和基因功能分析的一门科学.包括结构基因组学、功能基因组学、比较基因组学.28. 蛋白质组学proteomics:是对不同时间和空间发挥功能的特定蛋白群体的研究,它是指从整体角度分析细胞内动态变化的蛋白质组成分、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,揭示蛋白质功能与细胞生命活动规律的一个新的研究领域.蛋白质组学的研究技术体系包括:样品制备,双向聚丙烯酰胺凝胶电泳,蛋白质的染色,凝胶图像分析,蛋白质分析,蛋白质组数据库等./是指对在一定时间内或某一特定环境条件下,细胞、组织或有机体内所表达的所有蛋白质即蛋白质组进行系统的、总的研究的一门学科.旨在阐明生物体全部蛋白质的表达模式和功能模式,内容包括鉴定蛋白质表达、存在方式、结构、功能的互相作用方式等,它不同于传统的蛋白质学科,是在生物体或其细胞的整体蛋白质水平上进行的,从一个机体或一个细胞的蛋白质整体活动来揭示生命规律.包括表达蛋白质组学和细胞图形功能蛋白质组学.29. 顺反子cistron:编码单条多肽链的一个遗传功能单位,即转录单位.有单顺反子和多顺反子./即是由结构基因转录出的、并作为模板与核蛋白体结合、指导蛋白质合成的一类RNA分子.在真核细胞中一种mRNA分子只能翻译出一种蛋白质,为单顺反子.在原核细胞中一种mRNA分子可翻译出多种蛋白质,为多顺反子.二、问答题1. 真核生物基因组结构特点. P351结构基因:真核生物的结构基因是不连续的,编码氨基酸的序列被非编码序列打断,因而被成为断裂基因.编码序列之间的序列称为内含子,被隔开的编码序列称为外显子.2顺式调控元件:是指那些与结构基因表达调控相关、能够被基因调控蛋白特异性识别和结合的DNA序列.包括启动子、上游启动子元件、增强子、加尾信号和一些反应元件等.3基因家族:是指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因.同一个家族的基因成员是由同一祖先基因进化而来.根据基因家族同源性程度的不同可以分为以下几型:①基因序列相同;②基因序列高度同源;③基因序列不同,编码产物具有同源功能区;④基因序列不用,编码产物具有小段保守基序;⑤基因超家族.4假基因:在多基因家族中,某些成员并不能表达出有功能的产物,这些基因称为假基因,用ψ表示.假基因与有功能的基因同源,原来也可能是有功能的基因,由于缺失、倒位或点突变等原因失去活性,成为无功能的基因,它们或者不能转录,或者转录后生成无功能的异常多肽.5重复序列:真核基因组存在大量重复序列,除了编码rRNA、tRNA、组蛋白及免疫球蛋白的结构基因外,大部分重复序列是非编码序列.根据出现频率不同可分为:高度重复序列、中度重复序列、单拷贝序列.6真核生物基因组中的转座子:是一些可以移动的遗传因素.7端粒:真核生物基因组染色体DNA为线性分子,其末端存在一种特殊的结构形式,称为端粒.该结构是一段DNA序列和蛋白质形成的复合体,只存在于真核细胞染色体末端.其在染色体的定位、复制、末端保护以及控制细胞寿命等方面起重要作用.8非编码序列:占基因组90%以上,编码序列小于DNA总量的5%.9为单基因结构,转录产物为单顺反子.10有多复制起点,每个复制起点大小不一.2. 真核生物和原核生物基因组结构的异同点. P35①真核基因组远远大于原核生物的基因组.②真核基因具有许多复制起点,每个复制子大小不一.原核基因只有一个复制起点.每一种真核生物都有一定的染色体数目,除了配子精子和卵子为单倍体外,体细胞一般为双倍体,即含两份同源的基因组,而原核基因组则是单拷贝的.③真核基因都是由一个结构基因与相关的调控区组成,转录产物为单顺反子monocistron,即一分子mRNA只能翻译成一种蛋白质.原核基因具有操纵子结构,即由几个功能相关的结构基因串联在一起,连同它们的调控序列组成一个转录单位.转录产物为多顺反子.④真核生物基因组中含有大量重复顺序,而原核生物基因组除rRNA、tRNA基因外,重复顺序不多.⑤真核生物基因组内非编码的顺序占90%以上.基因中非编码顺序所占的比例是真核生物与细菌、病毒的重要区别,且在一定程度上也是生物进化的标尺.⑥真核基因是断裂基因,即编码序列被非编码序列分隔开来,基因与基因间的非编码序列为间隔DNA,基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子.而原核基因是连续的.⑦功能相关的基因构成各种基因家族,它们可串联在一起,亦可相距很远,但即使串联在一起的成簇的基因也是分别转录的.⑧真核生物基因组中也存在一些可以移动的遗传因素,这些DNA顺序并无明显生物学功能,似乎为自己的目的而组织,故有自私DNA之称,其移动多被RNA介导如哺乳动物及人类基因组中的逆转座子,也有被DNA介导的如果蝇及谷类中的DNA 转座子.1、原核结构基因无重叠现象,即同一部分DNA序列不编码两种蛋白质2、原核具有编码同工酶的基因3、原核DNA分子中有多种功能的识别区域,如复制起始区与终止区、转录启动区与终止区等,这些区域往往具有特殊序列,并含有反向重复序列.3. 人类基因组的组织结构特点.P371人类基因组的重复序列:按组织结构和分布特点分类①反向重复序列:是指两个顺序相同的拷贝在DNA链上呈反向排列.人类基因组中约含5%的反向重复序列,散布于整个基因组中,常见于基因组的调控区内,可能与复制转录的调控有关.②串联重复序列:特点是具有一个固定的重复单位,该重复单位头尾相连形成重复顺序片段,约占人类基因组10%.A.编码区串联重复序列:如组蛋白基因、5sRNA基因等,其意义在于快速大量合成相应基因的mRNA.B.非编码区串联重复序列:其通常存在于间隔DNA和内含子内,是组成卫星DNA的基础.③散在重复序列:除串联重复和反向重复序列之外的所有重复序列,不论重复次数多少,都可归在散在重复序列.根据重复序列的长度可分为短散在核元件和长散在核元件.2人类基因组中的DNA多态性:DNA多态性是指发生在DNA水平的多态性.在人类漫长的进化过程中,由于染色体结构的改变、DNA突变、重组、交换以及转座子的插入等,使得除了单卵双胞得个体外,没有两个个体的DNA组成是完全相同的.人类基因组多态性都是按孟德尔规律遗传的,具有体细胞稳定性和种系稳定性,因此可用它们作为染色体上疾病基因座位的遗传标记.①基因多态性:是由于等位基因间在特定位点上DNA序列存在差异造成的.②限制性片段长度多态性:是指突变、重排、单个核苷酸的插入或缺失可使DNA 顺序发生改变,其中有些可能造成限制酶切位点的增加、缺失或易位,致使DNA分子的限制酶切位点数目、位置发生改变.用限制酶切割不用个体基因组时,所产生的限制性片段的数目和每个片段的长度不同.③串联重复序列多态性:是以相同的核心序列按首尾相连的形式串联排列在一起形成一段特殊的序列的重复次数有较大变化.为DNA序列长度多态性.主要发生在小卫星和微卫星DNA.④单核甘酸多态性:是指基因组内特定核苷酸位置上存在不同的碱基,其中最少的一种在群体中的频率不低于1%.4. 原核生物基因表达调控机制.P78原核生物基因的转录和翻译偶联,mRNA降解快、半衰期短.原核生物基因表达调控主要在转录水平,其次是翻译水平.有两种方式:起始调控启动子调控和终止调控衰减子调控,转录是通过负调控因子和正调控因子进行复合调控的.以大肠杆菌E.coli为例介绍.1)转录起始调控的主要模式:①σ因子控制特定基因的表达:不同的σ因子可以竞争结合RNA聚合酶,RNA聚合酶的核心酶与不同σ因子组成的全酶识别不同基因的启动子.②乳糖操纵子的转录调控:在大肠杆菌的许多操纵子中,基因的转录不是由单一因子调控的,而是通过负调控因子和正调控因子进行复合调控的.细菌通常优先以葡萄糖作为能源,葡萄糖代谢产物能抑制细胞腺苷酸环化酶和激活磷酸二酯酶的活性,结果使细胞内的cAMP水平降低.葡萄糖耗尽时,细胞内cAMP水平升高,即可通过CAP调控其它操纵子的表达.E.coli的乳糖操纵子有Z、Y、A三个结构基因,编码β-半乳糖甘酶、乳糖透酶和半乳糖甘乙酰化酶,结构基因上游有一个启动子P和一个操纵子O.启动子上游有一个CAP蛋白的结合位点.启动子、操纵子和CAP结合位点共同构成乳糖操纵子的调控区.I基因是调节基因,编码产生阻遏蛋白.阻遏蛋白为四聚体,每个亚基相同.在没有乳糖的条件下,阻遏蛋白能与操纵子结合.由于操纵子与启动子有部分重叠,阻遏蛋白与操纵子结合后,抑制结构基因的转录.但是阻遏蛋白的抑制作用并不是绝对的.乳糖存在时,乳糖经透酶作用进入细胞,经β-半乳糖甘酶催化,转变成半乳糖和葡萄糖,同时催化一小部分乳糖转变成异乳糖.异乳糖作为诱导剂与阻遏蛋白结合,使阻遏蛋白构象发生改变,导致阻遏蛋白与操纵基因的解聚,引起结构基因的转录.lac操纵子中的lac启动子是弱启动子,RNA聚合酶与之结合的能力很弱,只有CAP结合到启动子上游的CAP结合位点后,促进RNA聚合酶与启动子的结合,才能有效转录.在这种调控中,CAP起正调控作用.乳糖操纵子的转录起始由CAP和阻遏蛋白两种调控因子来控制,可因葡萄糖和乳糖的存在与否而有4种不同的组合.A.葡萄糖存在、乳糖不存在:此时无诱导剂存在,阻遏蛋白与DNA结合,而且由于葡萄糖的存在,CAP也不能发挥正调控作用,基因处于关闭状态.B.葡萄糖和乳糖都不存在:在没有葡萄糖的情况下,CAP可以发挥正调控作用.但由于没有诱导剂,阻遏蛋白的负调节作用是基因仍然处于关闭状态.C.葡萄糖和乳糖都存在:乳糖的存在对基因的转录产生诱导作用.但由于葡萄糖的存在使细胞cAMP水平降低,cAMP-CAP复合物不能形成,CAP不能结合到CAP 结合位点上,转录仍不能启动,基因处于关闭状态.D.葡萄糖不存在、乳糖存在:此时CAP可以发挥正调控作用,阻遏蛋白由于诱导剂的存在而失去负调控作用,基因被打开,启动转录.1阻遏蛋白的负性调节:在没有乳糖的条件下,阻遏蛋白能与操纵序列O结合,抑制了RNA聚合酶与启动子P的结合,从而抑制酶与启动子的结合,使乳糖操纵子处于阻遏状态.2CAP的正性调节:分解代谢基因激活CAP分子内存在DNA和CAMP结合位点,当没有葡萄糖使,CAMP浓度升高,CAMP与CAP结合,CAMP-CAP复合物结合于CAP结合位点,提高了乳糖操纵子的转录活性.3不同生长条件下的协调调节:是指LAC操纵子阻遏蛋白的负性调节与CAP的正性调节机制协调合作.CAP不能激活被阻遏蛋白封闭的基因转录,反之没有CAP的存在来加强转录活性,即使阻遏蛋白从操纵子上解离,基因仍无转录活性.具体以下4种情况.③阿拉伯糖操纵子的转录调控④色氨酸操纵子的转录调控⑤DNA片段倒位对基因表达的调控转录终止的调控:分为依赖p因子和不依赖p因子的终止调控,核糖体也参与转录终止.2)翻译的可调控性及调控方式:①SD序列对翻译的影响A.SD序列的顺序及位置对翻译的影响不同的SD序列有一定的差异,因而翻译起始效率不一样.SD序列的核心序列是六个嘌呤AGGAGG,SD序列与核糖体小亚基中16S rRNA 3’端的互补序列配对结合,使起始密码子定位于翻译起始部位.SD1、SD2、SD3的序列可以不同,SD1/ORF1,SD2/ORF2,SD3/ORF3的AUG和SD 之间的距离也不同.核糖体以不同的效率结合不同的SD和起始翻译.SD序列位于起始密码子AUG上游8~13个碱基处,不同的开放阅读框上游的SD序列与起始密码子之间的距离是不同的,这使得起始密码子在翻译起始部位定位的精确度不同,因而翻译的起始效率也不相同.此外,某些蛋白质与SD序列的结合也会影响mRNA与核糖体的结合,从而影响蛋白质的翻译.不同的SD序列有一定的差异,因而翻译起始效率不一样.SD序列与起始密码子之间的距离,也影响mRNA翻译效率.核糖体以不同的效率结合不同的SD和起始翻译. 不同的开放阅读框上游的SD序列与起始密码子之间的距离是不同,这使起始密码子在翻译起始部位定位的精确度不同,因而翻译的起始效率也不同. B. mRNA二级结构隐蔽SD序列的作用在某些mRNA分子中,核糖体结合位点在茎环中,使核糖体无法结合,只有破坏茎环结构,核糖体才能结合.红霉素抗性的细菌编码一种红霉素甲基化酶,该酶使核糖体23S mRNA上特定位点的一个腺嘌呤甲基化,阻止红霉素的结合.红霉素通过该位点结合于核糖体,抑制蛋白质合成.②mRNA的稳定性许多细菌mRNA降解速度很快,细菌的生理状态和环境因素都会影响mRNA的降解速度.细菌mRNA的降解是由核酸内、外切酶共同完成的.③翻译产物对翻译的调控:如核糖体蛋白的调控、翻译终止因子RF2调节自身的翻译.1.核糖体蛋白:核糖体蛋白合成的控制主要是在翻译水平.每个操纵子转录的mRNA所编码的蛋白质中都有一种蛋白或两种蛋白形成的一个复合物可以结合到多顺反子上游的一个特定部位,阻止核糖体结合和起始翻译.2.翻译终止因子RF2调节自身的翻译:RF2 识别终止密码 UGA 和 UAA,RF1 识别终止密码 UAG 和 UAA.④小分子RNA的调控作用1.调整基因表达产物的类型2.低水平表达基因的控制5. 真核生物转录水平的基因表达调控机制.P89。
功能基因筛选的基本策略
功能基因筛选研究的基本策略包括:(1)通过表达谱差异分析、生物信息学分析和基因克隆等途径获得候选基因;(2)对候选基因进行功能评价, 可在基因组、转录、蛋白质组和代谢产物等水平进行);(3)基因功能确证;(4)决定开发战略。
获得候选基因的研究路线之一是通过正常和疾病组织的表达谱差异分析获得疾病的相关基因, 进一步进行基因功能的筛选研究.该筛选策略与疾病过程密切相关, 较多地应用于新药及治疗靶点的发现。
确定候选功能基因获得候选基因的另一研究路线是通过生物信息学分析预测、选定基因序列、克隆获得候选基因, 进一步进行基因功能的筛选研究。
该研究策略筛选范围广, 多用于新基因的功能探索研究。
用于生物信息学分析的数据资料, 主要来源于DNA芯片技术和其他相关技术测定的基因表达信息。
通过与已知基因或蛋白质序列的分析、比较, 可以确定候选研究基因序列长度, 提供该未知基因产物信号转导通路、细胞结构蛋白类型和细胞定位等预测信息。
然而, 由于人类基因组中约1/3的基因序列与其他基因无同源性, 因此这些基因的功能不易进行直接预测。
另一方面, 蛋白质的功能表现还与其所处的分子环境有关, 医学教.育网搜集整理一种蛋白质实际上与相邻蛋白质形成了功能网络。
因此, 生物信息学中的功能网络数据库分析, 对于了解复杂信号通路及与其他基因产物的关系, 可能会提供有价值的参考信息。
除上述研究策略外, 其他途径的功能基因研究也在进行, 如直接从正常或疾病组织中克隆单一未知基因, 进行功能研究。
基因分析的基本策略引言基因分析是生物领域中一项重要的研究工具,通过对基因的分析可以揭示生物的遗传信息、功能以及与疾病相关的遗传变异。
基因分析的基本策略是一系列针对基因组的实验和计算方法,旨在深入理解基因的结构、功能和作用机制。
本文将介绍基因分析的基本策略和常用的分析方法。
1. 基因组测序基因组测序是基因分析的第一步,通过测序技术可以获取基因组的完整序列。
现代基因组测序技术包括传统的链终止法(Sanger测序),以及高通量测序技术,如 Illumina HiSeq、Pacific Biosciences 和Oxford Nanopore Technologies 等。
基因组测序的产出是一系列的DNA片段,通过生物信息学工具进行序列拼接和组装,可以得到完整的基因组序列。
2. 基因注释基因注释是对基因组进行功能和结构的标注,将序列信息翻译成有意义的生物学信息。
基因注释可以分为结构注释和功能注释两个层次。
结构注释结构注释主要用于预测基因的结构和组织结构。
常见的结构注释方法包括基因预测、剪接位点预测和重复序列识别等。
基因预测是确定基因的位置和转录本的起始和终止位点的过程。
剪接位点预测用于确定基因的剪接方式,即基因转录本的选择性剪接。
重复序列识别可以帮助鉴定基因组中的重复序列,例如转座子等。
功能注释功能注释主要通过比对基因组序列和已知功能基因库,将未知基因序列进行功能注释。
常见的功能注释方法包括BLAST、GO富集分析和KEGG通路分析等。
BLAST是一种比对算法,可以通过比对基因组序列和已知序列库,找到相似的序列并推断基因的功能。
GO富集分析是根据基因的注释信息,统计出某一功能术语在基因集中的富集程度,从而推断基因集的功能。
KEGG通路分析则是通过比对基因组序列和KEGG数据库,分析基因在代谢通路中的功能。
3. 基因表达分析基因表达分析是研究基因在不同条件下的表达水平和变化趋势。
通过基因表达分析可以了解基因在发育和疾病等生物过程中的功能和调控机制。
研究植物基因功能的策略和方法研究植物基因功能主要有两种策略:正向遗传学(forward genetics)和反向遗传学(reverse genetics)策略。
正向遗传学即通过生物个体或细胞基因组的自发突变或人工诱变,寻找相关表型或性状改变,然后通过图位克隆并结合一些基因差异表达筛选技术(如差减杂交、差异显示PCR、差异显示分析等)从这些特定性状变化的个体或细胞中找到对应的突变基因,并揭示其功能,例如遗传病基因的克隆。
反向遗传学的原理正好相反,人们首先是改变某个特定的基因或蛋白质,然后再去寻找与之有关的表型变化,例如基因剔除技术或转基因研究。
简单地说,正向遗传学是从表型变化研究基因变化,而反向遗传学则是从基因变化研究表型变化。
研究植物体内基因功能的方法主要有以下几种:(1)基因功能丧失或减少,即筛选目的基因功能部分丧失或全部丧失的突变体,比较其与野生型的表型差异来确定该基因功能;(2)基因功能增加或获得,即筛选目的基因高水平表达的植株,比较其与相应对照植株(野生型植株,功能丧失突变体或模式植物植株)差异,观察其表型性状变化来鉴定基因功能;(3)基因异位表达(Ectopic expression),通过定向调控靶基因的时空表达模式来研究基因功能;(4)微阵列(Microarray)是一种在全基因组水平对基因表达进行高通量检测的技术;(5)酵母双杂交技术(Yeast two-hybrid system)用于分析基因产物即蛋白质之间的互作。
1 基因功能丧失或减少以前,通常通过筛选自然突变体来获得基因功能部分或全部丧失的突变体,但概率较低;现在一般通过各种人工方法来获得合适突变体。
人工产生基因功能丧失的方法有插入突变、反义抑制(antisense suppression)、共抑制(cosuppression)、双链RNA干扰(double-stranded RNA interference, dsRNAi)。
基因功能分析的基本策略一、利用转基因模型研究基因的功能1转基因动物:是指用人工方法将外源基因导入或整合到基因组内,并能稳定传代的一类动物。
2基本原理:将目的基因(或基因组片段)用显微注射等方法注入实验动物的受精卵或着床前的胚胎细胞中,使目的基因整合到基因组中,然后将此受精卵或着床前的胚胎细胞再植入受体动物园的输卵管(或子宫)中,使其发育成携带有外源基因的转基因动物。
导入基因的方法有显微注射法、胚胎干细胞法、逆转录病毒感染法、精子载体法。
二、利用基因敲除模型研究基因的功能1基因打靶:是指通过DNA定点同源重组,改变基因组中的某一特定基因,从而在生物活体内研究此基因的功能。
若定向敲除某个基因,称为基因敲除,若定向将一段基因序列替代另一段基因序列,称为基因敲入。
2同源重组:是指发生在同源序列间的重组,它通过链的断裂和再连接,在两个DNA分子同源序列之间进行单链或双链片段的交换。
又称基本重组。
3基因敲除:是目前在体内研究基因功能的最佳方法,是指通过DNA同源重组定向的将外源基因插入宿主细胞染色体DNA,从而使特定基因在细胞内或生物或体内失活的过程。
4基因打靶的必备条件:胚胎干细胞(ES)、打靶载体5打靶载体的筛选标志:neo(新霉素)阳性筛选标志;HSV-tk阴性筛选标志。
6基因敲除的基本程序:①打靶载体的构建②打靶载体导入ES细胞③基因敲除ES细胞注射入胚泡④胚泡植入假孕小鼠的子宫中⑤嵌合体的杂交育种7构建打靶载体的基本过程①获得目的基因的同源片段,将此DNA片段克隆到一般的质粒载体中;②从重组质粒中切除目的基因的大部分同源DNA序列,只留部分序列在线性质粒载体的两端;③将neo基因克隆到带有目的基因同源顺序的线性质粒中,使之位于残留目的基因同源顺序的中间;④在目的基因同源顺序的外侧线性化重组质粒载体,将HSV-tk基因克隆到此线性载体中。
三、通过抑制或沉默基因表达对基因的功能进行分析研究1利用反义RNA抑制基因表达水平2利用RNAi技术在细胞中沉默特定基因已研究其功能1。