当前位置:文档之家› 基因功能与通路分析技术

基因功能与通路分析技术

研究基因功能的4大绝招

研究基因功能的“四大绝招”(初步总结版) 生命科学的研究有很大一部分集中于研究基因及其产物的功能。到底有哪些方法可以用来研究基因功能呢?本文初步总结为“四大绝招”。 第一招:患得患失 得,指的是基因的过表达(Overexpression);失,指的是基因敲除(Knockout)或者低表达(Under-expression)。例如研究的假说是基因A与记忆力呈正相关,那么可以这样设计实验:先过表达基因A,预期结果是记忆力增强,再降低基因A的表达水平,或者完全敲除(如果不是lethal的话),预期结果是记忆力减弱。一个高质量的实验设计,一般应该“患得患失”,两方面的实验都要做。 我们不仅要“患得患失”,还要“斤斤计较”。因为过表达或低表达的水平不同,表型改变可能也不同,甚至看不到表型改变。例如,用RNAi Knockdown一个基因的表达水平的70%也许看不到任何变化,但是Knockdown 90%就能观察到表型改变了。所以,当过表达或者低表达研究基因却没有得到预期结果的时候,就需要考虑基因表达水平的变化是否不足。 有时即使完全敲除一个基因也看不到任何表型的改变,此时也不能下“研究基因与研究表型无关”的结论。这就好比一个桥有十个桥墩,如果只去除掉桥墩4,在非过负荷的情况下,桥可能不会倒塌,可以正常通车。可是,如果先去除掉桥墩5,再去除桥墩4,桥就会倒塌了。我们能够认为桥墩4是无用的吗?当然不能。桥墩在这里好比处于同一个通路具有相似功能的基因,桥是否可以通车好比基因的表型是否正常。所以,在敲除一个基因A看不到表型改变的情况下,可以在基因B(与A的功能具有相似性,或者是上下游的基因)敲除的动物模型上敲除基因A,观察敲除后是否有变化。 有时候,全身性的过表达、低表达或者基因敲除会出现我们不想要的结果。例如,全身性的基因敲除会致命。为了解决这个问题,现已开发出许多种组织特异性和时间特异性的过表达、低表达和基因敲除技术,使得基因调控更加准确。 第二招:上下求索 基因需要经过转录为RNA、翻译为蛋白质至少两步才能发挥功能。所以,研究一个基因的功能,就可以在DNA、RNA和蛋白质的水平分别进行研究。DNA 的水平相同,不代表RNA的水平相同;同样,RNA的水平相同,不代表在蛋白质的水平相同。哪怕就是在RNA水平,还有不同的剪切的可能。 一个基因翻译成蛋白质之后,常常需要同其它的基因及其产物相互作用才能发

研究新基因的功能

基因功能的研究思路主要包括: 1.基因的亚细胞定位和时空(发育期或梯度药物处理浓度, 不同组织/器官)表达谱; 2.基因在转录水平的调控(可以通过genome walking PCR或通过已有的资源库寻找该基因的启动子等转录调控区域, 通过单杂交或ChIP等技术, 寻找该基因的转录调控蛋白) 3.细胞生化水平的功能研究(也就是蛋白蛋白作用复合体的寻找验证,具体方法有酵母双杂交, GST pulldown, co-IP, BRET, FRET, BiFc等等,对该基因的表达产物做一个细胞信号转导通路的定位) 4.gain-of-function & loss-of-function: 也就是分别在细胞和个体水平,做该基因的超表达和knockdown(或knockout), 从表型分析该基因的功能. 功能研究应从完整的分子-细胞-个体三个层次研究, 综合分析. 关于基因的表达和定位,可以这样去做: 1. mRNA水平检测基因表达:选择表达目的基因的组织/细胞(发育不同时期、机体不同部位、加处理因素...),提取RNA,反转录,做RT-PCR或real time RT-PCR,检测基因的表达情况/变化。 (或者以northern blot、Rnase protection assay方法,检测基因的mRNA表达情况/变化。)2. 蛋白质水平检测基因表达:选择相应的组织/细胞,以Western blot、免疫组化(OR免疫荧光)检测目的蛋白的表达。 3. 检测目的蛋白的细胞定位:将目的基因克隆至带荧光标签(如GFP)的表达载体,在适合的模式细胞中表达,在活细胞中观察蛋白的细胞定位。 1 首先应当表达该基因,原核基因最好原核表达,真核基因最好真核表达。 2 蛋白质的功能首先观察这种蛋白是膜蛋白还是分泌型蛋白,通过软件分析都可以预测。 3 功能分析可以通过基因树,探究此基因与其他基因的同源性,然后用表达的蛋白进行分析。 4 再有考虑到蛋白相互作用往往介导了蛋白的功能,可以应用酵母双杂交技术和噬菌体展示技术筛选能与此基因表达的蛋白相互作用的蛋白。 5 发现与其相互作用的蛋白后可以通过与其相互作用蛋白的功能推测。 6 可以通过体外过表达此基因观察各种信号通路的改变从而推测其功能

功能基因的克隆及生物信息学分析

功能基因的克隆及其生物信息学分析 摘要:随着多种生物全基因组序列的获得,基因组研究正从结构基因组学(structural genomics)转向功能基因组学(functional genomics)的整体研究。功能基因组学利用结构基因组学研究获得的大量数据与信息评价基因功能(包括生化功能、细胞功能、发育功能、适应功能等),其主要手段结合了高通量的大规模的实验方法、统计和计算机分析技术[1],它代表了基因分析的新阶段,已成为21世纪国际生命科学研究的前沿。功能基因组学是利用基因组测序获得的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使生物学研究从对单一基因或蛋白的研究转向多个基因或蛋白同时进行系统的研究,是在基因组静态的组成序列基础上转入对基因组动态的生物学功能学研究[2]。如何研究功能基因,也成为我们面临的一个课题,本文就克隆和生物信息学分析在研究功能基因方面的应用做一个简要的阐述。 关键词:功能基因、克隆、生物信息学分析。 1.功能基因的克隆 1.1 图位克隆方法 图位克隆又称定位克隆,它是根据目标基因在染色体上确切位置,寻找与其紧密连锁的分子标记,筛选BCA克隆,通过染色体步移法逐步逼近目的基因区域,根据测序结果或用BAC、YAC克隆筛选cDNA表达文库寻找候选基因,得到候选基因后再确定目标基因。优点是无需掌握基因产物的任何信息,从突变体开始,逐步找到基因,最后证实该基因就是造成突变的原因。通过图位克隆许多控制质量性状的单基因得以克隆,最近也有报道某些控制数量性状的主效基因(控制蕃茄果实大小的基因克隆[3]、控制水稻成熟后稻谷脱落基因克隆[4]以及小麦VRN2 基因克隆[5]等)也通过图位克隆法获得。

DNA结构分析

基因结构分析 摘要:本文综述了基因的研究背景,并且用X射线衍射技术观察了DNA的双螺旋结构,原子力显微镜观察了pBR322DNA的拓扑结构,电子显微镜观察DNA,扫描隧道显微镜观察了DNA的变异结构,以及用透射电镜观察DNA的转录。 关键词:DNA X射线衍射原子力显微镜电子显微镜 1 研究背景 1869 年瑞士化学家米歇尔(Friedrich Miescher)在细胞核中发现了一种含有磷酸的奇特的物质,他把这种物质称为“核质”(nuclein),后来改名为核酸(nucleic acid)。1880年德国生化学家科塞尔(Albrecht Kossel)开始了对核酸的生化分析,到19 世纪末叶已从DNA中分离出4 种碱基,它们是腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶。1927年李()从DNA中分离出脱氧核糖。到20世纪30年代已经确定了DNA的化学组成,它由4个称为核苷酸的基本单位组成,每种核苷酸又是由3 种基本的亚单位,1个碱基,1个脱氧戊糖和1个磷酸基团组成[1]。 1950 年查伽夫(Erwin Chargaff )发现DNA中嘌呤类两个碱基之比例和嘧啶类两个碱基之比例随生物种类不同而大有不同. 他又发现嘌呤类之总量和嘧啶类之总量相等,其中腺嘌呤之量等于胸腺嘧啶之量,鸟嘌呤之量等于胞嘧啶之量[1]。 1952 年赫尔希(. Hershey )和蔡斯(Martha Chase)利用放射性示踪物质对噬菌体侵染过程中分子事件的确切研究,表明了只有DNA(而没有蛋白质)参与了噬菌体颗粒复制的生化过程,说明DNA是遗传物质[2]。 DNA 分子是由许多核苷酸分子连接而成的长链分子,在DNA 中核苷酸是通过磷酸基团连接起来的(如图1所示)。每一个核苷酸的脱氧核糖与另一个核苷酸的磷酸基连接在一起,形成糖-磷酸基骨架,构成了DNA 的主链,这条主链决定了DNA分子的长度。 虽然糖-磷酸基主链是很有规则的,其结构单元是彼此相同的,但它不是作

功能基因研究

吉基 吉凯基因 2014 让我们用心,换取您的放心!

常见问题 ◆创新性不够。 ◆立题依据不充分。 ◆实验设计不合理。 ◆如何做好预实验。 ◆如何获得一个好基因。 让我们用心,换取您的放心!

典型基金精要 A基因通过调控B信号通路影响C肿瘤的D功能

A基因通过调控B信号通路影响C肿瘤的D功能 1. 相关性研究: A--C 组织水平:肿瘤组织样本基因的表达情况 临床水平:基因表达水平与各种临床特点(恶性程度,转移与否,耐药性,生存率等)的相关性 2.功能研究: A--D 细胞水平:生长,凋亡,转移,侵润,血管新生,耐药 细胞水平:生长凋亡转移侵润血管新生耐药 动物水平:成瘤,转移,药物敏感 3. 机制研究: A--B 3机制研究:A B 分子水平:相互结合,表达调控,翻译后修饰前,降解调控,剪切调控,胞内定位,激酶信号传导等 3

肿瘤基因功能研究流程推进 第一步:由特定肿瘤找出相关基因 肿瘤 表达检测 基因常规方法:表达芯片,等 目的:通过筛选,找出在肿瘤组织中有表达,和肿瘤的 目的通过筛选找出在肿瘤组织中有表达和肿瘤的 临床特征有相关性的基因 功能意义:研究的应用性以及临床相关性 意义研究的应用性以及临床相关性 机制 让我们用心,换取您的放心!

肿瘤基因功能研究流程推进 第二步确定候选基因的生物学功能 肿瘤第二步:确定候选基因的生物学功能基本逻辑:改变基因状态后检测细胞模型、动物模型 的表型变化 基因基因操作基因操作常规方法:过表达,RNAi 功能检测功能检测方向:增殖凋亡,转移,血管新生等 功能目标确定候选肿瘤相关基因的生物学功能机制 目标:确定候选肿瘤相关基因的生物学功能 意义:研究的重要性让我们用心,换取您的放心!

实验--基因结构预测分析

学院:______ 班级:_______ 学号:_________ 姓名:__________ 成绩:______ 实验五基因结构预测分析 目的: 1、熟悉并掌握从基因组核酸序列中发现基因的方法。 内容: 1、用NCBI的ORF Finder分析原核生物核酸序列或真核生物的cDNA序列中的开放阅读框; 2、使用GENSCAN在线软件预测真核生物基因; 3、使用POL YAH在线预测转录终止信号; 4、使用PromoterScan在线预测启动子区域。 操作及问题: 随着测序技术的不断发展,越来越多的模式生物启动了全基因组测序计划,完成全基因组测序的物种也越来越多,使得基因结构和功能的预测成为可能。同时,通过基因组文库筛选也可得到目的基因所在克隆。获得克隆序列后,同样也需要对目的基因做结构预测以便指导后续功能研究。本实验介绍几种常用的基因预测分析工具,预测核酸序列的开放阅读框、转录终止信号、启动子、CpG岛等信息。 一、开放阅读框(open reading frame,ORF)的识别 ORF是指从核酸序列上5’端翻译起始密码子到终止密码子的蛋白质编码序列。原核生物与真核生物的基因结构存在很大不同,真核生物的ORF除外显子(平均150bp)外,还含有内含子,因此真核生物基因的预测远比原核生物复杂。 (一)利用NCBI ORF Finder预测原核生物核酸序列或真核生物的cDNA序列中的开放阅读框。https://www.doczj.com/doc/ab3761991.html,/gorf/gorf.html 1、在NCBI上查找AC 号为AE008569 的核酸记录。(见实验五中的AE008569.mht) 问题1:这个序列的名称? 问题2:这个序列来源物种所属的生物学大分类?

Gene 序列分析

Gene 序列分析 原文https://www.doczj.com/doc/ab3761991.html,/vionit/blog/item/98edb0dc706167a2cc116651.html 核酸和蛋白质序列分析 在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信息,从而指导进一步的实验研究。通过染色体定位分析、内含子/外显子分析、ORF分析、表达谱分析等,能够阐明基因的基本信息。通过启动子预测、CpG岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为基因的调控研究提供基础。通过蛋白质基本性质分析,疏水性分析,跨膜区预测,信号肽预测,亚细胞定位预测,抗原性位点预测,可以对基因编码蛋白的性质作出初步判断和预测。尤其通过疏水性分析和跨膜区预测可以预测基因是否为膜蛋白,这对确定实验研究方向有重要的参考意义。此外,通过相似性搜索、功能位点分析、结构分析、查询基因表达谱聚簇数据库、基因敲除数据库、基因组上下游邻居等,尽量挖掘网络数据库中的信息,可以对基因功能作出推论。上述技术路线可为其它类似分子的生物信息学分析提供借鉴。本路线图及推荐网址已建立超级链接,放在北京大学人类疾病基因研究中心网站(https://www.doczj.com/doc/ab3761991.html,/science/bioinfomatics.htm),可以直接点击进入检索网站。 下面介绍其中一些基本分析。值得注意的是,在对序列进行分析时,首先应当明确序列的性质是mRNA序列还是基因组序列?是计算机拼接得到还是经过PCR扩增测序得到?是原核生物还是真核生物?这些决定了分析方法的选择和分析结果的解释。 (一)核酸序列分析 1、双序列比对(pairwise alignment) 双序列比对是指比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置,它是用计算机进行序列分析的强大工具,分为全局比对和局部比对两类,各以Needleman-Wunsch算法和Smith-Waterman算法为代表。由于这些算法都是启发式(heuristic)的算法,因此并没有最优值。根据比对的需要,选用适当的比对工具,在比对时适当调整空格罚分(gap penalty)和空格延伸罚分(gap extension penalty),以获得更优的比对。 除了利用BLAST、FASTA等局部比对工具进行序列对数据库的搜索外我们还推荐使用EMBOSS软件包中的Needle软件(http://bioinfo.pbi.nrc.ca:8090/EMBOSS/),和Pairwise BLAST (https://www.doczj.com/doc/ab3761991.html,/BLAST/)。以上介绍的这些双序列比对工具的使用都比较简单,一般输入所比较的序列即可。 (1)BLAST和FASTA FASTA(https://www.doczj.com/doc/ab3761991.html,/fasta33/)和BLAST(https://www.doczj.com/doc/ab3761991.html,/BLAST/)是目前运用较为广泛的相似性搜索工具。这两个工具都采用局部比对的方法,选择计分矩阵对序列计分,通过分值的大小和统计学显著性分析确定有意义的局部比对。使用FASTA和BLAST,进行数据库搜索,找到与查询序列有一定相似性的序列。一般认为,如果蛋白的序列一致性为25-30%,则可认为序列同源。 BLAST根据搜索序列和数据库的不同类型分为5种(表2),另外PSI-BLAST通过迭代搜索,可以搜索到与查询序列相似性较低的序列。其中BLASTN、BLASTP在实践中最为常用,TBLASTN 在搜索相似序列进行新基因预测时特别有用。 使用BLAST时,先选择需要使用的BLAST程序,然后提供相应的查询序列,选择所比对的数据库即可。 (2)Needle和Pairwise BLAST:其中Needle适用于蛋白质和DNA序列,而Pairwise BLAST仅适用于DNA序列(3)相似性和同源性:必须指出,相似性(similarity)和同源性( homology)是两个完全不同的概念。同源序列是指从某一共同祖先经过趋异进化而形成的不同序列。相似性是指序列比对过程中检测序列和目标序列之间相同碱基或氨基酸残基序列所占比例的

基因表达及分析技术

基因表达及其分析技术 生命现象的奥秘隐藏在基因组中,对基因组的解码一直是现代生命科学的主流。基因组学研究可以说是当今生命科学领域炙手可热的方向。从DNA 测序到SNP、拷贝数变异(copy number variation , CNV)等DNA多态性分析,到DNA 甲基化修饰等表观遗传学研究,生命过程的遗传基础不断被解读。 基因组研究的重要性自然不言而喻。应该说,DNA 测序技术在基因组研究 中功不可没,从San ger测序技术到目前盛行的新一代测序技术(Next Gen eration Seque ncing NGS)到即将走到前台的单分子测序技术,测序技术是基因组解读最重要的主流技术。而基因组测序、基因组多态性分析、DNA 甲基化修饰等表观遗传分析等在基因组研究中是最前沿的课题。但是基因组研究终究类似“基因算命”,再清晰的序列信息也无法真正说明一个基因的功能,基因功能的最后鉴定还得依赖转录组学和蛋白组学,而转录作为基因发挥功能的第一步,对基因功能解读就变得至关重要。声称特定基因、特定SNP、特定CNV、特定DNA修饰等与某种表型有关,最终需要转基因、基因敲除、突变、 RNAi 、中和抗体等技术验证,并必不可少要结合基因转录、翻译和蛋白修饰等数据。 基因实现功能的第一步就是转录为mRNA或非编码RNA,转录组学主要研究基因转录为RNA 的过程。在转录研究中,下面几点是必须考虑的: 1,基因是否转录(基因是否表达)及基因表达水平高低(基因是低丰度表达还是中、高丰度表达)。特定基因有时候在一个细胞中只有一个拷贝的表达,而表达量会随细胞类型不同或发育、生长阶段不同或生理、病理状态不同而改变。因此任何基

研究基因功能的“七大绝招”与“三板斧”

研究基因功能的“七大绝招”与“三板斧” 2011.12.6-12.8 (说明:本文是对大约一年前的博文《研究基因功能的“四大绝招”(初步总结版)》的修改和补充,仍存在继续修改的可能。本文可能适合的读者是生物医学的科研新手和非生物医学领域的人。) 生命科学的研究有很大一部分集中于研究基因及其产物的功能。到底有哪些方法可以用来研究基因功能呢?本文初步总结为“七大绝招”和“三板斧”。掌握了这“七大绝招”和“三板斧”,设计实验更容易,看文献听学术报告也更轻松。 第一招:天地人合 无论是学习还是研究,必须遵循的一个原则是“从生活中来,到生活中去”。学习的时候,如果与日常生活中熟悉的、简单的事情结合起来理解,就可以化繁为简,化难为易。学习的目的是为了应用,学到的东西,必须应用到日常生活中去。 怎样研究基因的功能?要回答这个问题,我们先看怎样研究人的功能。假如你是男生,喜欢上了一个“女生”,可是这个“女生”长得扑朔迷离,帅气中带着妩媚,羞涩中透出豪爽。所以,你面临的第一个问题就是:TA到底是男还是女?第二个问题是:TA是不是学生?如果是的话,是本校的吗?你不认识TA的任何朋友,所以也没法打听。为了回答这几个问题,你决定翘课跟踪TA。你发现,白天的大多数时间,TA去了本校教学楼的教室。你守在教室的洗手间旁边,观察TA下课的时候上洗手间,去的是男洗手间还是女洗手间。高兴的是,你发现 TA去了女洗手间(终于松了一口气)。不过你比较小心,为防万一,你又跟 踪她,看她晚上回宿舍去的是男生宿舍还是女生宿舍。不出所料,她去了本校的女生宿舍。这下你终于放心了:她是本校的一个女生。

因为她去女洗手间和女生宿舍,提示她是女的。因为她白天去本校教室,晚上去本校女生宿舍,提示她是本校女生。上述事例告诉我们:一个人什么时候,在哪里活动可以提示其身份。同样,基因表达的时间和部位,常常可以提示其功能。例如,如果基因A在胚胎发育过程中表达,成年后不表达,则提示该基因与发育有关。基因B在在大脑的海马中表达,而海马与记忆有关,那么这个基因可能与记忆有关。 接下来的问题就是:她是哪个系的?她有什么兴趣爱好?你发现,她有两个个形影不离的好朋友。你恰好有同学认识她的这两个朋友。同学告诉你:她两个好朋友都是中文系的,都喜欢打羽毛球。这时,你基本上就可以认为这个女生是中文系的,爱好之一是羽毛球了。 以上所述可以归纳为三点:天时,地利,人和。“天时”指基因及其产物什么时候表达,“地利”指的是基因及其产物表达于哪个部位。“人和”可以进一步引申为两点:1. 近朱者赤,近墨者黑。就是说一个人会与他经常接近的人相似。基因也是如此,相互作用的一些基因常常具有类似的功能,它们为了完成同一个功能而通力合作。例如,如果实验发现蛋白C与蛋白D相互结合,而基因D是某一信号通路的受体,则基因C可能也是该信号通路的成员。2. 近猪者吃,近墨者喝。就是说一个人不仅会经常接触与自己类似的人,还经常接触自己的工作对象。例如,一个经常与学生接触的人,既可能是学生(近朱者赤),也可能是老师(近猪者吃)。同理,与一个基因接触的其它基因或者物质,也可能是其作用的对象。例如,如果蛋白质F与DNA结合在一起,则提示其对DNA发挥作用,可能参与DNA复制、转录等。 “合”指的是合理。亿万年的进化使不合理的基因基本上都被淘汰了,所以存在的基因其功能必定是合理的,至少具有合理性的一面。合理的表现就是能够促进个体的生存和繁衍。合理遵循两个原则:一,经济原则。生物不会浪费物质和能量在一个无用或者冗余的基因上。凡是一个基因可以实现的功能,没有必要用两个基因。二,有效原则。基因的功能应该促进而不是损害生物的生存和繁衍。根据合理性原则,无需任何实验证据,我们不难想到非编码DNA序列是有用的,不是无用的垃圾。 第二招:患得患失

基因芯片数据功能分析

生物信息学在基因芯片数据功能分析中的应用2009-4-29 随着人类基因组计划(Human Genome Project)即全部核苷酸测序的即将完成,人类基因组研究的重心逐渐进入后基因组时代(PostgenomeEra),向基因的功能及基因的多样性倾斜。 通过对个体在不同生长发育阶段或不同生理状态下大量基因表达的平行分析,研究相应基因在生物体内的功能,阐明不同层次多基因协同作用的机理,进而在人类重大疾病如癌症、心血管疾病的发病机理、诊断治疗、药物开发等方面的研究发挥巨大的作用。它将大大推动人类结构基因组及功能基因组的各项基因组研究计划。生物信息学在基因组学中发挥着重大的作用,而另一项崭新的技术——基因芯片已经成为大规模探索和提取生物分子信息的强有力手段,将在后基因组研究中发挥突出的作用。基因芯片与生物信息学是相辅相成的,基因芯片技术本身是为了解决如何快速获得庞大遗传信息而发展起来的,可以为生物信息学研究提供必需的数据库,同时基因芯片的数据分析也极大地依赖于生物信息学,因此两者的结合给分子生物学研究提供了一条快捷通道。 本文介绍了几种常用的基因功能分析方法和工具: 一、GO基因本体论分类法 最先出现的芯片数据基因功能分析法是GO分类法。Gene Ontology(GO,即基因本体论)数据库是一个较大的公开的生物分类学网络资源的一部分,它包含38675个Entrez Gene注释基因中的17348个,并把它们的功能分为三类: 分子功能,生物学过程和细胞组分。在每一个分类中,都提供一个描述功能信息的分级结构。这样,GO中每一个分类术语都以一种被称为定向非循环图表(DAGs)的结构组织起来。研究者可以通过GO分类号和各种GO数据库相关分析工具将分类与具体基因联系起来,从而对这个基因的功能进行描述。在芯片的数据分析中,研究者可以找出哪些变化基因属于一个共同的GO功能分支,并用统计学方法检定结果是否具有统计学意义,从而得出变化基因主要参与了哪些生物功能。

肌肉疾病基因功能研究介绍

肌肉疾病基因功能研究介绍 我们常遇到的肌肉疾病主要包括杜氏肌营养不良症(Duchenne Muscular Dystrophy, DMD),Becker型肌营养不良(Becker Muscular Dystrophy, BMD) , 脊髓性肌萎缩(spinalmuscularatrophy, SMA)和肌萎缩性侧索硬化症(Amyotrophic lateral sclerosis, ALS)等。 DMD和BMD都属于X染色体隐性遗传,Duchenne型发病率最高,病情最严重,是遗传性肌萎缩症中最有代表性的疾病。DMD也是人体最大的基因,由DMD基因功能丧失引起,可以通过基因治疗技术手段治疗。SMA是常染色体隐性遗传,由SMN基因缺陷、运动神经元丧失引起,可以通过基因治疗的方式来治愈,多发生在婴幼儿。ALS也称为运动神经元病(MND),它是上运动神经元和下运动神经元损伤之后,导致包括球部(即延髓支配的这部分肌肉)、四肢、躯干、胸部腹部的肌肉逐渐无力和萎缩,病因至今不明。 神经肌肉萎缩患者大部分是缓慢起病,神经肌肉萎缩患者往往出现四肢肌肉无力、萎缩,也可有麻木、易疲劳、肌肉疼痛等症状;有的患者还有眼肌、咽喉肌的无力,出现视物重影、眼球活动障碍、发音和吞咽困难等症状,严重者无法吞咽,甚至可能因呼吸肌无力而死亡。 1、这些疾病中主要集中在DMD和SMA疾病,模型分别为: DMD: DMD小鼠模型mdx小鼠,原理为:编码抗肌萎缩蛋白基因的第3185位基因自发突变,由C-T,致使原本编码谷氨酰胺的密码子变成了终止密码子,基因表达提前终止,导致DMD功能缺陷。 SMA: SMA模型鼠,通常是SMN1和SMN2双基因缺陷小鼠。 ALS:SOD1突变相关的ALS小鼠模型(比如突变SOD1 转基因小鼠等)

第四章-基因的结构和功能

第四章基因的结构和功能 一、教学目的和要求: 1掌握基因概念及其发展; 2 掌握基因的重组测验 3 理解利用顺反试验、互补试验鉴定两个突变型是否属于同一基因的原理; 4 了解缺失作图的原理 二、教学重点: 1基因概念及其发展; 2 基因的重组测验 三、教学难点: 缺失作图的原理 四、教学方法: 面授并辅以多媒体教学 五、教学内容 基因是一个特定的DNA或RNA片段,但并非一段DNA或RNA都是基因。 第一节基因的概念一、基因概念的发展 (一)遗传“因子”:孟德尔认为,生物性状的遗传由遗传因子所控制,性状本身不遗传。(二)染色体是基因的载体:摩尔根实验证明基因位于染色体上,并呈直线排列,提出了遗传学是连锁交换规律,建立了遗传的染色体学说,为细胞遗传学奠定了重要基础。并由此提出基因既是一个功能单位,是一个突变单位,也是一个交换单位的“三位一体”概念。∴经典遗传学认为:基因是一个最小的单位,不能分割;既是结构单位,又是功能单位。(三)DNA是遗传物质:1928年Griffith首先发现了肺炎球菌的转化,证实DNA是遗传物质而非蛋白质;Avery用生物化学的方法证明转化因子是DNA而不是其他物质。 (四)基因是有功能的DNA片段 20世纪40年代Beadle和Tatum提出一个基因一个酶的假说,沟通了蛋白质合成与基因功能的研究 1953年Watson和Crick提出DNA双螺旋结构模型,明确了DNA的复制方式。 1957年Crick 提出中心法则,61年提出三联体遗传密码,从而将DNA分子结构与生物体结合起来 1957年Benzer用大肠杆菌T4噬菌体为材料,分析了基因内部的精细结构,提出了顺反子(cistor)的概念,证明基因是DNA分之上一个特定的区段,是一个功能单位,包括许多突变位点(突变子),突变位点之间可以发生重组(重组子) 理论上,一个基因有多少对核苷酸对就有多少突变子和的重组子,实际上,突变子数少于核苷酸对数,重组子数小于突变子数。 总之:顺反子学说打破了“三位一体”的基因概念,把基因具体化为DNA分子上特定的一段顺序--- 顺反子,其内部又是可分的,包含多个突变子和重组子。 近代基因的概念:基因是一段有功能的DNA序列,是一个遗传功能单位,其内部存在有许多的重组子和突变子。 突变子:指改变后可以产生突变型表型的最小单位。 重组子:不能由重组分开的基本单位。(五)操纵子模型 1961年法国分子生物学家Jacob和Monod通过对大肠杆菌乳糖突变体研究,提出了操纵子学说(operon theory)。阐明了基因在乳糖利用中的作用。

几种常用的基因功能分析方法和工具

几种常用的基因功能分析方法和工具(转自新浪博客) 一、GO分类法 最先出现的芯片数据基因功能分析法是GO分类法。Gene Ontology(GO,即基因本体论)数据库是一个较大的公开的生物分类学网络资源的一部分,它包含38675 个Entrez Gene 注释基因中的17348个,并把它们的功能分为三类:分子功能,生物学过程和细胞组分。在每一个分类中,都提供一个描述功能信息的分级结构。这样,GO中每一个分类术语都以一种被称为定向非循环图表(DAGs)的结构组织起来。研究者可以通过GO分类号和各种GO 数据库相关分析工具将分类与具体基因联系起来,从而对这个基因的功能进行描述。在芯片的数据分析中,研究者可以找出哪些变化基因属于一个共同的GO功能分支,并用统计学方法检定结果是否具有统计学意义,从而得出变化基因主要参与了哪些生物功能。 EASE(Expressing Analysis Systematic Explorer)是比较早的用于芯片功能分析的网络平台。由美国国立卫生研究院(NIH)的研究人员开发。研究者可以用多种不同的格式将芯片中得到的基因导入EASE 进行分析,EASE会找出这一系列的基因都存在于哪些GO分类中。其最主要特点是提供了一些统计学选项以判断得到的GO分类是否符合统计学标准。EASE能进行的统计学检验主要包括Fisher 精确概率检验,或是对Fisher精确概率检验进行了修饰的EASE 得分(EASE score)。 由于进行统计学检验的GO分类的数量很多,所以EASE采取了一系列方法对“多重检验”的结果进行校正。这些方法包括弗朗尼校正法(Bonferroni),本杰明假阳性率法(Benjamini falsediscovery rate)和靴带法(bootstraping)。同年出现的基于GO分类的芯片基因功能分析平台还有底特律韦恩大学开发的Onto-Express。2002年,挪威大学和乌普萨拉大学联合推出的Rosetta 系统将GO分类与基因表达数据相联系,引入了“最小决定法则”(minimal decision rules)的概念。它的基本思想是在对多张芯片结果进行聚类分析之后,与表达模式不相近的基因相比,相近的基因更有可能参与相同的生物学功能的实现。比较著名的基于GO分类法的芯片数据分析网络平台还有七十多个,表1列举了其中的一部分。 二、通路分析法 通路分析是现在经常被使用的芯片数据基因功能分析法。与GO分类法(应用单个基因的GO分类信息)不同,通路分析法利用的资源是许多已经研究清楚的基因之间的相互作用,即生物学通路。研究者可以把表达发生变化的基因列表导入通路分析软件中,进而得到变化的基因都存在于哪些已知通路中,并通过统计学方法计算哪些通路与基因表达的变化最为相关。现在已经有丰富的数据库资源帮助研究人员了解及检索生物学通路,对芯片的结果进行分析。主要的生物学通路数据库有以下两个:①KEGG 数据库:迄今为止,KEGG数据库(Kyoto encyclopedia of genes and genomes)是向公众开放的最为著名的生物学通路方面的资源网站。在这个网站中,每一种生物学通路都有专门的图示说明。②BioCarta 数据库:BioCarta 是一家生物技术公司,它在其公共网站上提供了用于绘制生物学通路的模板。研究者可以把符合标准的生物学通路提供给BioCarta数据库。BioCarta数据库不会检验这些生物学通路的质量,因此其中的资源质量参差不齐,并且有许多相互重复。然而BioCarta数据库数据量巨大,且不同于KEGG数据库,包含了大量代谢通路之外的生物学通路,所以也得到广泛的应用。 最先出现的通路分析软件之一是GenMAPP(gene microarray pathway profiler)。它可以免费使用,其最新版本为Gen-MAPP2。在这个软件中,使用者可以用几种灵活的文件格式输入自己的表达谱数据,GenMAPP的基因数据库包含许多从常用的资源中得到的物种特异性的基因注释和识别符(ID)。这些ID可以将使用者输入的基因与不同的生物学通路的基

02 生物化学习题与解析--核酸的结构与功能

核酸的结构与功能. 一、选择题 (一) A 型题 1 .核酸的基本组成单位是 A .磷酸和核糖 B .核苷和碱基 C .单核苷酸 D .含氮碱基 E .脱氧核苷和碱基 2 . DNA 的一级结构是 A .各核苷酸中核苷与磷酸的连接键性质 B .多核苷酸中脱氧核苷酸的排列顺序 C . DNA 的双螺旋结构 D .核糖与含氮碱基的连接键性质 E . C 、 A 、 U 、 G 4 种核苷酸通过3′ , 5′- 磷酸二酯键连接而成 3 .在核酸中,核苷酸之间的连接键是 A .糖苷键 B .氢键 C .3′ ,5′- 磷酸二酯键 D .1′ , 3′- 磷酸二酯键 E .2′ ,5′- 磷酸二酯键 4 .核酸中稀有碱基含量最多的是 A . rRNA B . mRNA C . tRNA D . hnRNA E . snmRNA 5 .核酸的最大紫外光吸收值一般在 A . 280nm B . 260nm C . 240nm D . 200nm E . 220nm 6 .有关核酸酶的叙述正确的是 A .由蛋白质和 RNA 构成 B .具有酶活性的核酸分子 C .由蛋白质和 DNA 构成的 D .专门水解核酸的核酸 E .专门水解核酸的酶 7 . DNA 与 RNA 彻底水解后的产物是 A .戊糖不同,碱基不同 B .戊糖相同,碱基不同 C .戊糖不同,碱基相同 D .戊糖不同,部分碱基不同 E .戊糖相同,碱基相同 8 .关于 DNA 的二级结构,叙述错误的是 A . A 和 T 之间形成三个氢键, G 和 C 之间形成两个氢键 B .碱基位于双螺旋结构内侧 C .碱基对之间存在堆积力 D .两条链的走向相反 E .双螺旋结构表面有大沟和小沟 9 .关于 mRNA 叙述正确的是 A .大多数真核生物的 mRNA 在5′ 末端是多聚腺苷酸结构 B .大多数真核生物的 mRNA 在5′ 末端是 m 7 GpppN- C .只有原核生物的 mRNA 在3′ 末端有多聚腺苷酸结构 D .原核生物的 mRNA 在5′ 末端是 m 7 GpppN- E .所有生物的 mRNA 分子中都含有稀有碱基 10 .关于 DNA 热变性的描述正确的是 A . A 260 下降 B .碱基对可形成共价键连接

基因家族生信分析

基因家族生信分析 一、什么是基因家族 概念:是来源于同一个祖先,有一个基因通过基因重复而产生两个或更多的拷 贝而构成的一组基因,他们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。 划分: 按功能划分:把一些功能类似的基因聚类,形成一个家族。 按照序列相似程度划分:一般将同源的基因放在一起认为是一个家族。 1.常见基因家族: WRKY基因家族:是植物前十大蛋白质基因家族之一,大量研究表明,WRKY 基因家族的许多成员参与调控植物的生长发育,形态建成与抗病虫。 NBS-LRR抗病基因家族:是植物中最大类抗病基因家族之一。 MADS-BOX基因家族:是植物体内的重要转录因子,它们广泛地调控着植物的生长、发育和生殖等过程。在植物中参与花器官的发育,开花时间的调节,在果实,根,茎,叶的发育中都起着重要的作用。 热激蛋白70家族(HSP70)是一类在植物中高度保守的分子伴侣蛋白,在细胞中协助蛋白质正确折叠。 二、基因家族分析流程: ●利用蛋白保守域结构提取号在Pfam数据库提取其隐马尔科夫模型矩 阵文件(*.hmm) ●在数据库(Ensemble 、JGI、NVBI)下载你所需要的物种的基因组数 据(*.fa,*.gff) ●在虚拟机中Bio-Linux中的hummsearch程序,用隐马尔科夫模型矩 阵文件在蛋白序列文件中搜索含有该保守结构域的蛋白 ●将蛋白序列导入MEGA软件构建进化树(可以阐明成员之间系统进化 关系,从进化关系上揭示其多样性) ●利用MEME搜索蛋白质的保守结构域 利用MEME搜索基因家族成员的motif可以揭示基因家族在物种内的多样化及其功能,如果他们都含有相同的motif表明其功能具有 相似性,如果部分家族成员含有其他不同的motif,很可能这些成员有 其他特异功能,或者可以归分为一个亚族 ●绘制基因染色体位置图 从*.gff文件中抽取我们搜索到的基因位置信息,_v2.0/在线绘 制基因染色体位置图 通过染色体位置分布,可以了解基因主要分布字哪条染色体上,及是

Klotho基因功能研究进展

第31卷 第2期青 海 医 学 院 学 报V o.l31 N o.2 2010年JOURNAL OF Q I NGHA IM ED ICAL COLLEGE2010 K lotho基因功能研究进展 郜 茜 (青海大学附属医院消化科) 中图分类号 R78 文献标识码 B K l o t h o(K l)基因是由Kur o-o等[1]在1997年研究自发性高血压时偶然发现的,后确认K l o tho基因缺失鼠(K l-/-)的表型类似人类的衰老表现,包括寿命缩短、动脉硬化、皮肤肌肉萎缩、认知障碍、运动神经元受损、软组织钙化、听力下降、骨质疏松[2~4]。反之,K lotho基因高表达可延长实验动物的寿命[2],说明它是一个衰老抑制基因。当K l表达异常时,出现一系列与衰老及与衰老密切相关的疾病[5],提示K lotho基因在衰老和衰老相关疾病的发生中起着重要作用。同时在一些病理状态下,K l表达变化也和疾病的发展、预后密切相关。近年研究发现,K l抗衰老的作用主要是通过抗氧化、抗凋亡功能实现的,本文就这方面研究作一综述。 1 K l的一般生物学特点 K l基因1997年由Kuro-o等[1]首先从表现为衰老的模型小鼠中克隆成功,随后发现人和大鼠中也存在K l基因,且它们之间具有较高的同源性(83%)。K l基因在人和小鼠中均定位于第13号染色体(13q12),基因全长50kb,包含5个外显子,可通过选择性拼接产生两种蛋白产物上,一种为膜型K l蛋白,人的膜型K l蛋白全长有1012个氨基酸残基(小鼠为1024个),为跨膜蛋白,该类型主要在肾脏、胎盘、小肠和前列腺中表达;另一种为分泌型K l 蛋白,人的分泌型K l蛋白全长有549个氨基酸残基(小鼠为550个),该类型缺乏跨膜结构和胞内结构,它以游离的形式发挥功能,在人的大脑、海马、胎盘、肾脏、前列腺和小肠等组织中均检测到其存在,在血清中也检测到K l蛋白的存在[6]。目前认为血循环中的K l蛋白作为一种激素参与对机体功能的调节,它可与细胞表面的受体结合,抑制细胞内胰岛素和胰岛素样生长因子-1(i n su li n/I G F)的信号转导通路,对多种靶器官发挥生理效应[7]。 2 K l基因的抗氧化作用及抗凋亡作用 活性氧簇(Reactive oxygen spec ies,ROS)在缺血、中毒、免疫等因素介导的组织损伤中的作用日益引起人们的重视,氧化应激是缺血再灌注引起急性肾损伤的一个重要原因[8]。动物实验和体外实验都证实了ROS在组织损伤中的作用,并把清除氧自由基作为治疗的重要方法之一。有研究表明动物在应激状态下体内K l mRNA和蛋白表达下降。M i tobe等[9]对小鼠肾脏内髓集合管3细胞(M ouse i n ner m edullary collecti n g duct3,m I M CD3)进行培养观察发现,在过氧化氢(H2O2)诱导的氧化应激状态下K l表达降低,凋亡细胞数目增加,并且这种改变和剂量、时间的变化呈正相关,可将其作为氧化应激状态下组织细胞凋亡的一个指标[10]。H aruna,Y[11]等发现肾小球肾炎的小鼠动物模型在40周时肾组织凋亡细胞数较转K l基因小鼠(I CGN/K l T G)增多明显,并伴有抗凋亡蛋白Bc l-2的下调及凋亡蛋白Bax的上调。Ya m a m oto等[12]观察了K l高表达转基因小鼠(EFmKL48)和野生型小鼠尿中8-OhdG(活体内DNA氧化损伤的生物标记)的分泌量发现, EFmKL48鼠尿中8-OhdG分泌量仅为野生型小鼠的一半,提示K l的高表达能降低体内DNA的氧化损伤;在服用致死剂量的百草枯(除草剂,可产生过氧化物)后EF mKL48鼠的寿命长于野生型小鼠;在培养H eLa细胞的培养基中加入百草枯,处理组中加入可溶性的K l蛋白,观察细胞脂质氧化。和对照组比较,处理组脂质过氧化情况较对照组明显减轻;在中国仓鼠卵巢细胞(C HO)细胞培养基中加入百 123 *郜茜(1975~),女,汉族,青海籍,主治医师

第六章 基因预测和基因结构分析

第六章基因预测和基因结构分析 人们获得各种核酸和蛋白质序列的目的是了解这个序列在生物体中充当了怎样的角色。例如,DNA序列中重复片段、编码区、启动子、内含子/外显子、转录调控因子结合位点等信息;蛋白质的分子量、等电点、二级结构、三级结构、四级结构、膜蛋白的跨膜区段、酶的活性位点、以及蛋白质之间相互作用等结构和功能信息。虽然用实验的方法是多年以来解决这类问题的主要途径,但新的思路是利用已有的对生物大分子结构和功能特性的认识,用生物信息学的方法通过计算机模拟和计算来“预测”出这些信息或提供与之相关的辅助信息。由于生物信息学的特点,可以用较低的成本和较快的时间就能获得可靠的结果。近10年来生物学序列信息的爆炸性增长大大促进了各种序列分析和预测技术的发展,目前已经可以用理论预测的方法获得大量的结构和功能信息。要注意的是,尽管各种预测方法都基于现有的生物学数据和已有的生物学知识,但在不同模型或算法基础上建立的不同分析程序有其一定的适用范围和相应的限制条件,因此最好对同一个生物学问题尽量多用几种分析程序,综合分析各种方法得到的结果和结果的可靠性。此外,生物信息学的分析只是为生物学研究提供参考,这些信息能提高研究的效率或提供研究的思路,但很多问题还需要通过实验的方法得到验证。在构建一个基因结构预测模型时,一些主要问题是值得注意的:(1)对真核生物序列,遮蔽重复序列应先于其它分析过程;(2)大多程序都有特定生物物种适用性;(3)许多程序只能特定适用于基因组DNA数据或者只适用于cDNA的数据;(4)序列的长度也是一个重要因素。 6.1针对核酸序列的预测方法 针对核酸序列的预测就是在核酸序列中寻找基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。在此过程中,确认一段DNA序列是一个基因需要有多个证据的支持。一般而言,在重复片段频繁出现的区域里,基因编码区和调控区不太可能出现;如果某段DNA片段的假想产物与某个已知的蛋白质或其它基因的产物具有较高序列相似性的话,那么这个DNA片段就非常可能属于外显子片段;在一段DNA序列上出现统计上的规律性,即所谓的“密码子偏好性”,也是说明这段DNA是蛋白质编码区的有力证据;其它的证据包括与“模板”序列的模式相匹配、简单序列模式如TATA Box等相匹配等。一般而言,确定基因的位置和结构需要多个方法综合运用,而且需要遵循一定的规则:对于真核生物序列,在进行预测之前先要进行重复序列分析,把重复序列标记出来并除去;选用预测程序时要注意程序的物种特异性;要弄清程序适用的是基因组序列还是cDNA序列;很多程序对序列长度也有要求,有的程序只适用于长序列,而对EST这类残缺的序列则不适用。 6.1.1 重复序列分析 对于真核生物的核酸序列而言,在进行基因辨识之前都应该把简单的大量的重复序列标记出来并除去,因为很多情况下重复序列会对预测程序产生很大的扰乱,尤其是涉及数据库搜索的程序。常见的重复序列分析程序有GrailEXP等,可以在Web界面上使用这些程序,或者用Email来进行。 6.1.2 数据库搜索 把未知核酸序列作为查询序列,在数据库里搜索与之相似的已有序列是序列分析

相关主题
文本预览
相关文档 最新文档