当前位置:文档之家› 抗虫基因的结构、功能和应用

抗虫基因的结构、功能和应用

抗虫基因的结构、功能和应用
抗虫基因的结构、功能和应用

抗虫基因的结构、功能和应用

摘要:人类和昆虫自古就开始为了绿色植物争斗,而当人类发现了抗虫基因,人类就占据了上风,本文主要介绍了抗虫基因的几个种类,及其中一些的结构功能,了解抗虫基因的应用。

关键词:抗虫基因;BT基因;结构;功能;应用

昆虫有100多万种,在地球上有4亿年历史了,因为抵抗逆境的能力强,所以一直繁衍到现在;又因为繁殖能力强,所以即便遭到毁灭性杀伤,残余势力很快就会恢复原来的种群。以野生植物为食的昆虫有几十万种,它们主要受环境抑制;以栽培植物为食的昆虫有几万种,它们主要受人类抑制。与人类争食,要么你死,要么我活。人类与昆虫的战争,始于亘古,延至未来,永远不会停息,小战争司空见惯,大战争骇人听闻。还记得民国三十一年(1942年)河南的蝗灾吗?吃光了一切绿色植物;还记得唐玄宗的宰相姚崇吗?破除迷信,力主灭蝗,虫口夺粮,传颂千年,可是依然歉收。只有在化学农药出现以后,人类才取得胜利。可是,胜利是短暂的。一种新农药用不了几年,昆虫就会产生抗药性。于是,再研制新农药,过不了几年,昆虫又产生抗药性。如此恶性循环,环境污染越来越重。而且,新农药也不是那么容易研制的,其研制难度不亚于人类吃的药。美国科技水平最高,研制一种新农药约需10年,花费约需10亿美元。幸亏分子遗传学发展到了转基因水平,农药的污染才得以大大减轻。然而,昆虫对转基因抗虫作物也会产生抗性。如果抗虫基因只有一种,人类算是没辙了。所幸的是,科学家们已经发现了多种抗虫基因。

1.抗虫基因

1.1 BT基因

BT基因即是苏云金芽胞杆菌(Bacillus thuringiensis,简称Bt)基因,因其杀虫效果好、安全、高效等优点而成为应用最为广泛的杀虫微生物。Bt与其它芽胞杆菌相比,一个显著特点就是不仅能够形成芽胞,同时还能产生由杀虫蛋白组成的晶体。苏云金芽胞杆菌可以分泌一种毒蛋白,对鳞翅目鞘翅目昆虫(比如小菜蛾)有很强的杀伤作用。人类很早就研究利用BT菌来杀灭害虫,总共有100多年历史。随着分子生物学技术的发展和基因克隆、DNA操作等技术出现,人类开始从BT 菌中克隆其毒蛋白基因到工程菌中,制作生物农药。不过随着广泛的应用,害虫也大量出现抗药性。

苏云金芽胞杆菌是一种革兰氏阳性土壤芽孢杆菌,属于芽胞杆菌属的一个种。根据鞭毛抗原的血清型和生理生化特性可以划分为若干亚种;由于无鞭毛亚种的出现,故营养细胞的酯酶型可以作为补助分类方法。在外界条件适宜时,Bt的营养体进行横裂生殖;当营养体老熟或者外界条件苛刻时,将进入产胞循环。包裹在芽胞与晶体外侧的细菌壁在后期破裂,释放出自由的芽胞和伴胞晶体;当外界条件适宜时,芽胞萌发为营养体进而开始新的生命循环。

Bt的毒素主要为内毒素和外毒素。外毒素指细菌在生命活动过程中排出体外的代谢物,包括α-外毒素、β-外毒素、γ-外毒素、不稳定外毒素和水溶性外毒素等。内毒素又称δ-内毒素、晶体毒素或杀虫晶体蛋白3伴胞晶体由一种或几种杀虫晶体蛋白组成,在Bt对昆虫的致死过程中起主要作用。杀虫晶体蛋白是根据氨基酸同源性进行分类的。同源性在45%以下,为第一等级,用阿拉伯数字表示;同源性在45%~78%之间,为第二等级,用大写英文字母表示;同源性在78%~95%之间,为第三等级,用小写英文字母表示;同源性在95%以上,为第四等级,用阿拉伯数字表示。例如Cry1Ac10。杀虫晶体蛋白对鳞翅目、双翅目、鞘翅目、膜翅目、同翅目、直翅目、食毛目等多种昆虫以及线虫、蜡类和原生动物具有特异性的杀灭活性。

1.2 蛋白酶抑制剂基因

除了Bt基因,还有别的抗虫基因。如蛋白酶抑制剂基因。蛋白酶存在于人、动物、昆虫的胃肠道里,作用是把吃进去的蛋白质分解为氨基酸,氨基酸被肠道吸收,在体内再合成为蛋白质。蛋白酶也存在于植物体内,植物是要合成蛋白质的,如果蛋白酶很强,把蛋白质都分解了可不是好事。为了避免这种坏事,植物体内还有蛋白酶抑制剂,专门抑制蛋白酶。几乎每一种植物都有蛋白酶抑制剂,有的较多,有的较少,受基因控制。含蛋白酶抑制剂较多的植物,具有天然的抗虫性,它被昆虫吃了以后,能抑制昆虫胃肠里的蛋白酶,那么昆虫吃进去的蛋白质就不能被分解吸收,那么昆虫体内就缺乏合成蛋白质的氨基酸,而蛋白质是生命的载体,每一个细胞都需要蛋白质来构成,没有蛋白质,昆虫必然死亡。把蛋白酶抑制剂较多的植物的基因,转入蛋白酶抑制剂较少的植物的体内,它就具有了天然的抗虫性。豇豆、葫芦、马铃薯的控制蛋白酶抑制剂的基因,已被转入棉花、水稻、油菜、西红柿、草莓。可是问题又来了,人吃了这些转基因作物,不也抑制人的胃肠里的蛋白酶吗?是的。但是人吃的是熟食,经过加热,蛋白酶抑

制剂就没有了活性。许多食物宜熟食不宜生食就是这个道理。可是西红柿、草莓是生食的,不过,因为所含蛋白酶抑制剂相对较少,而人的胃肠里的蛋白酶相对较多,所以不影响蛋白质的消化吸收。

1.3 植物凝集素基因

很多植物都含有凝集素,凝集素是蛋白质与糖的结合体,按其结构又分为不同类型,分别喜欢与人、动物、昆虫胃肠黏膜上的含糖的蛋白结合,或者与含糖的蛋白酶结合,从而破坏消化吸收功能。草食动物不吃某些植物,就是因为凝集素,吃了胃肠难受,所以不吃。人亦如此。昆虫比较傻,某些植物含有专门毒害它的凝集素,它也照吃不误。把这种植物的基因转入农作物,就是转基因抗虫作物。目前还处在研究阶段。

1.4 “抗维生素H蛋白”的基因

维生素H存在于绝大多数的植物中,是人、动物、昆虫生长所必需的,人缺乏维生素H会掉头发、秃顶,动物缺乏维生素H会掉毛,严重缺乏,将危及生命。维生素H最怕鸡蛋中的一种蛋白质,这种蛋白质就叫“抗维生素H蛋白”,它可以与维生素H牢固结合,使维生素H失去活性,导致维生素H缺乏,因此不提倡生吃鸡蛋,煮熟后“抗维生素H蛋白”就失去了活性。把禽类的控制“抗维生素H蛋白”的基因转入农作物,就能杀死绝大多数昆虫。目前也处在研究阶段。

自然界抗虫基因岂止以上这些,多得很,但是必须去发现。随着转基因研究步步深入,人类或许最终可以战胜昆虫,战胜它不等于灭绝它,它别吃栽培植物,去吃野生植物吧。

2 抗虫基因结构

Bt蛋白,营养体:呈杆状,两端钝圆,大小约1.2~1.8×3.0~5.0 μm;周生鞭毛,微动或不动;单个或两个以上呈链状存在。芽胞和伴胞晶体:芽胞约0.8~0.9×2.0 μm,为休眠体;对高温或者干燥等不良环境有较强的抵抗力。伴胞晶体的形状因菌株的不同而有所差别。有180种结构,结构不同则性质不同,结构受基因控制,那么基因也不同,有180种基因吗?科学家还没有全部弄清,从理论上说应该有。已经弄清了9种,这9种基因都可以抗虫,已经转入农作物的只是其中的1种。从理论上说,都能转入农作物,或一个个转入,或一起转入,从而打破昆虫的抗性。魔高一丈,道高十丈,转基因的研究值得期待。

植物蛋白酶抑制剂(proteina.e inhibitor,PI)是种能够抑制蛋白水解酶活性的

小分子蛋白或多肽。根据作用于酶的活性基团不同及其氨基酸序列的同源性,可将植物中的PI分为4类,即丝氨酸类、半胱氨酸类(巯基类)、天冬氢酸类和金属类,共10个族。其中,丝氨酸类蛋白酶抑制剂与抗虫关系最为密切,因为大多数昆虫(如鳞翅目、直翅目、双翅目、膜翅目、鞘翅目)肠道内的蛋白酶主要是丝氨酸蛋白酶。丝氨酸蛋白酶抑制剂又可分Bowman-Birk、Kunitz.PI- I和PI-Ⅱ家族等不同的类型。目前应用最多的是Bowman-Birk家族的CpTI,该抑制剂具有2个抑制活性中心,可同时竞争性抑制2个胰蛋白酶分子。Kunintz家族蛋白酶抑制剂是丝氨酸蛋白酶抑制剂的另外一个主要类型,大豆Kunitz型胰蛋白酶抑制剂(SKTI)是其中典型的代表,虽然只有一个与酶作用的活性中心,但研究表明Kunintz家族蛋白酶抑制剂的抗虫性明显好于豇豆胰蛋白酶抑制剂。PI -I和PI-Ⅱ家族蛋白酶抑制剂是创伤诱导型表达的蛋白酶抑制剂。

3 抗虫基因作用及应用

3.1 作用

顾名思义,抗虫基因的作用就是能够编码一种蛋白质,这种蛋白质被虫子吃了以后,会杀死虫子。能够编码这种蛋白质的基因,就是抗虫基因。

Bt的致病机理——杀虫机理:Bt伴胞晶体被敏感昆虫摄食后,在中肠蛋白酶的作用下溶解并激活,释放出毒素核心肽段;而后毒素作用于中肠上皮细胞,引起细胞膨胀和裂解,由此引起昆虫肠道麻痹和肠道穿孔,消化道细胞的离子和渗透压平衡遭到破坏,最终导致昆虫死亡,这在昆虫致死作用中占主导地位。

另外,芽胞可以经虫口进入消化道,在毒素破坏中肠后,菌体可以进入体腔进行大量繁殖,引起幼虫败血症。

3.2 应用

由于过度使用农药给生态环境和农产品出口等领域带来诸多问题;人们更倾向于对生物防治领域的开发,Bt制剂也应运而生;它是开发历史最久,应用最成功的微生物杀虫剂。它具有对人畜和非靶标生物安全、环境兼容性好和不易产生抗性等优点,因此占据了生物农药90%以上的市场;主要用于防治农业害虫烟草夜蛾、菜粉蝶、玉米螟、棉铃虫和森林害虫松毛虫等。另外,自1983年转B2基因烟草问世以来,转基因生物得到迅猛发展;1995年转基因作物开始进入大规模商业化种植阶段,直至现在转Bt基因作物也是全球商品化程度最快的抗虫转基因作物。

Bt除了用于传统农业害虫的防治外,它的应用领域还扩展到防治蜜蜂病虫害。由于部分Bt菌株对鳞翅目害虫具有较强的毒杀作用,因此人们可以利用Bt

制剂防治蜜蜂的敌害——大蜡螟。大蜡螟属鳞翅目,螟蛾科;它们是世界性害虫,也是蜜蜂最重要的敌害,每年给世界专业养蜂者造成严重的损失。大蜡螟在美国、南非和菲律宾等国造成蜂群经常性的逃亡;在我国造成的损失尚无准确估计,它们对东方蜜蜂的危害较西方蜜蜂严重。大蜡螟的幼虫称为巢虫,又称隧道虫和绵虫;由于幼虫取食巢脾,因此大蜡螟是在幼虫期危害蜂群,经常造成蜂群内的“白头蛹”,严重时白头蛹可达到全部子脾的80%以上。危害轻者影响蜂群的繁殖力,重者造成蜂群的飞逃;通常是弱群更易受到危害,巢虫会在一个月内将整个蜂巢彻底毁掉。

对于巢虫造成的危害除了常规的物理和化学方法防治外,还可以利用Bt可湿性粉剂或者悬浮液喷洒巢脾和蜂箱进行防治。当蜂群受到巢虫危害时,将Bt制剂水溶后立即喷洒在巢脾的两侧,巢虫会在短时间内停止进食,虫体逐渐变黑直至死亡;由于虫龄短的幼虫较虫龄长的更易因感染Bt而死亡,因此在虫害初期进行防治效果会更好。另外,当采收蜂蜜后需要贮存巢脾时,喷洒Bt制剂的巢脾应该放于避风处干燥,避免阳光直射,一般情况下药效能够持续一个季度。除了Bt

制剂的喷洒外,还可以将Bt与蜂蜡混合制成巢脾进行巢虫的防治。与常用的化学防治药物对二氯苯和三氢化磷相比,Bt制剂具有在蜂蜡和蜂蜜中无残留、不会改变蜂蜜的味道、对蜜蜂幼虫和成虫无害以及对人畜无毒等优点,同时也避免了因出口的蜂蜜中含有过量的上述化学药物而被召回的困扰。

国内外不少学者就此进行了研究。达克东等在超强表达豇豆胰蛋白酶抑制剂基因转化苹果的研究中使用的赳强启动子来自增加了上游调控序列的甘露碱合成酶的启动子,该启动于启动的GUS基因在烟草中的表达强度分别是35S和双

35S启动子的156倍和26倍。中国科学院遗传与发育生物学研究所利用CaMV 35S 启动子串联因子调控的Cp TI基因转化烟草,转基因烟草中CpTI的表达显著提高,但是高效表达引发转基因烟草白化。与此同时,已有许多转双价植物蛋白酶抑制剂基因抗虫植物成功的例子。钱海丰等报道过国外l例利用CpTI和OC I作为蛋白酶抑制剂对不同蛋白酶作用的互补性转双价CpTI-OC I基因的例子,CpTI存在于植物细胞膜外属于膜外周蛋白,它抑制了丝蛋白酶的活性和蛋白水解过程;OC I 则抑制了锍基蛋白酶的活性,延缓雌性食草性害虫的生长,从而减少了食草性害

虫的受精次数。JohnRon等则将PI- I和PI-Ⅱ基因转入烟草中,使表达胰蛋白酶抑制剂及胰凝乳蛋白酶抑制剂的转基因烟草植林获得了对烟草灭蛾的抗性。CpTI 基因和SKTI 基因同时使用的双价抗虫转基因烟草也表现出很好的抗虫效果。4.展望

随着人们环保和食品安全意识的增强,在蜜蜂病虫害防治中生物防治会受到更加广泛的关注,而抗虫产业也会迎来宝贵的发展契机。虽然中国对Bt的研究、开发和应用起步较晚,但目前国内Bt制剂已经进入大规模的生产阶段,并且基本具备了生产工艺的基础以及多领域协同研究攻关的社会氛围。因此利用Bt制剂防治蜜蜂病虫害将具有巨大的发展潜力以及广阔的市场前景,但同时也要注意寻求方法克服Bt制剂杀虫谱窄、药效慢、持效期短以及易受外界环境影响的弱点。

参考文献

[1] 西部蜜蜂网,苏云金芽胞杆菌及其在蜂病防治中的应用,2009年1月18日

[2] 高越峰,朱桢,肖桂芳,等.大豆Kunitz型胰蛋白酶抑制剂基因的分离及其在抗虫植物

基因工程中的应用【J】.植物学报,1998,40(5):404

[3] 卢晓风,夏玉先,裴炎.植物蛋白酶抑制剂在植物抗虫与抗病中的作用【J】.生物化学与

生物物理进展,1998,25(4):328

[4] Mours DS et al. Plant Physial,2001,126(1):289--298

功能基因的克隆及生物信息学分析

功能基因的克隆及其生物信息学分析 摘要:随着多种生物全基因组序列的获得,基因组研究正从结构基因组学(structural genomics)转向功能基因组学(functional genomics)的整体研究。功能基因组学利用结构基因组学研究获得的大量数据与信息评价基因功能(包括生化功能、细胞功能、发育功能、适应功能等),其主要手段结合了高通量的大规模的实验方法、统计和计算机分析技术[1],它代表了基因分析的新阶段,已成为21世纪国际生命科学研究的前沿。功能基因组学是利用基因组测序获得的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使生物学研究从对单一基因或蛋白的研究转向多个基因或蛋白同时进行系统的研究,是在基因组静态的组成序列基础上转入对基因组动态的生物学功能学研究[2]。如何研究功能基因,也成为我们面临的一个课题,本文就克隆和生物信息学分析在研究功能基因方面的应用做一个简要的阐述。 关键词:功能基因、克隆、生物信息学分析。 1.功能基因的克隆 1.1 图位克隆方法 图位克隆又称定位克隆,它是根据目标基因在染色体上确切位置,寻找与其紧密连锁的分子标记,筛选BCA克隆,通过染色体步移法逐步逼近目的基因区域,根据测序结果或用BAC、YAC克隆筛选cDNA表达文库寻找候选基因,得到候选基因后再确定目标基因。优点是无需掌握基因产物的任何信息,从突变体开始,逐步找到基因,最后证实该基因就是造成突变的原因。通过图位克隆许多控制质量性状的单基因得以克隆,最近也有报道某些控制数量性状的主效基因(控制蕃茄果实大小的基因克隆[3]、控制水稻成熟后稻谷脱落基因克隆[4]以及小麦VRN2 基因克隆[5]等)也通过图位克隆法获得。

研究细菌基因组结构的意义

细菌基因组的结构和功能 细菌和病毒一样同属原核生物,因而细菌基因组的结构特点在许多方面与病毒的基因组特点相似,而在另一些方面又有其独特的结构和功能。本节首先介绍细菌染色体基因组的一般结构特点,然后再具体介绍大肠杆菌染色体基因组 的结构和功能。 1细菌染色体基因组结构的一般特点 (1)细菌的染色体基因组通常仅由一条环状双链 DNA分子组成细菌的染色体相对聚集在一起,形成一 个较为致密的区域,称为类核(nucleoid)。类核无 核膜与胞浆分开,类核的中央部分由RNA和支架蛋白 组成,外围是双链闭环的DNA超螺旋。染色体DNA通 常与细胞膜相连,连接点的数量随细菌生长状况和不同的生活周期而异。在DNA链上与DNA 复制、转录有关的信号区域与细胞膜优先结合,如大肠杆菌染色体DNA的复制起点(OriC)、复制终点(TerC)等。细胞膜在这里的作用可能是对染色体起固定作用,另外,在细胞分裂时将复制后的染色体均匀地分配到两个子代细菌中去。有关类核结构的详细情况目前尚不清楚。 (2)具有操纵子结构(有关操纵子结构详见基因表达的调控一章)其中的结构基因为多顺反子,即数个功能相关的结构基因串联在一起,受同一个调节区的调节。数个操纵子还可以由一个共同的调节基因(regulatorygene)即调节子(regulon)所调控。 (3)在大多数情况下,结构基因在细菌染色体基因组中都是单拷贝但是编码rRNA的基因rrn往往是多拷贝的,这样可能有利于核糖体的快速组装,便于在急需蛋白质合成时细胞可以在短时间内有大量核糖体生成。 (4)和病毒的基因组相似,不编码的DNA部份所占 比例比真核细胞基因组少得多。 (5)具有编码同工酶的同基因(isogene)例如,在 大肠杆菌基因组中有两个编码分支酸(chorismicacid) 变位酶的基因,两个编码乙酰乳酸(acetolactate)合成 酶的基因。 (6)和病毒基因组不同的是,在细菌基因组中编码 顺序一般不会重叠,即不会出现基因重叠现象。 (7)在DNA分子中具有各种功能的识别区域如复制 起始区OriC,复制终止区TerC,转录启动区和终止区等。 这些区域往往具有特殊的顺序,并且含有反向重复顺序。

基因组的结构与功能习题

第二章基因组的结构与功能 (一)选择题 A 型题 1.原核生物染色体基因组是 A.线性双链DNA分子 B.环状双链DNA分子 C.线性单链DNA分子 D.线性单链RNA分子 E.环状单链DNA分子 2.真核生物染色体基因组是 A.线性双链DNA分子 B.环状双链DNA分子 C.线性单链DNA分子 D.线性单链RNA分子 E.环状单链DNA分子 3.有关原核生物结构基因的转录,叙述正确的是 A.产物多为多顺反子RNA B.产物多为单顺反子RNA C.不连续转录 d.对称转录 E.逆转录4.原核生物的基因组主要存在于 A.质粒 B.线粒体 C.类核 D.核糖体 E.高尔基体 5.下列有关原核生物的说法正确的是 A.原核生物基因组DNA虽然与蛋白结合,但不形成真正的染色体结构 B.结构基因中存在大量的内含子 C.结构基因在基因组中所占比例较小 D.原核生物有真正的细胞核 E.基因组中有大量的重复序列 6.下列有关原核生物的说法不正确的是 A.原核生物的结构基因与调控序列以操纵子的形式存在B.在操纵子中,功能上关联的结构基因串联在一起C.在一个操纵子内,几个结构基因共用一个启动子 D.操纵元件也是结构基因E.基因组中只存在一个复制起点 7.真核生物染色质中的非组蛋白是 A.碱性蛋白质B.序列特异性DNA结合蛋白C.识别特异DNA序列的信息存在于蛋白上 D.不能控制基因转录及表达E.不参与DNA分子的折叠和组装 8.真核生物染色质的基本结构单位是 A.α-螺旋B.核小体 C.质粒 D.?-片层 E.结构域 9.关于真核生物结构基因的转录,正确的说法是 A.产物多为多顺反子RNAB.产物多为单顺反子RNAC.不连续转录D.对称转录E.新生链延伸方向为3'→5' 10.外显子的特点通常是 A.不编码蛋白质B.编码蛋白质C.只被转录但不翻译D.不被转录也不被翻译E.调节基因表达11.下列有关卫星DNA说法错误的是 A.是一种高度重复序列 B.重复单位一般为2~10 bp C.重复频率可达106 D.能作为遗传标记 E.在人细胞基因组中占5%~6%以上 12.下列有关真核生物结构基因的说法不正确的是 A.结构基因大都为断裂基因 B.结构基因的转录是不连续的 C.含有大量的重复序列 D.结构基因在基因组中所占比例较小 E.产物多为单顺反子RNA 13.染色体中遗传物质的主要化学成分是 A.组蛋白 B.非组蛋白 C.DNA D.RNA E.mRNA 14.真核生物染色质中的组蛋白是 A.酸性蛋白质 B.碱性蛋白质 C.一种转录因子 D.带负电荷 E.不带电荷 15.指导合成真核生物蛋白质的序列主要是 A.高度重复序列 B.中度重复序列 C.单拷贝序列 D.卫星DNA E.反向重复序列

基因表达及分析技术

基因表达及其分析技术 生命现象的奥秘隐藏在基因组中,对基因组的解码一直是现代生命科学的主流。基因组学研究可以说是当今生命科学领域炙手可热的方向。从DNA 测序到SNP、拷贝数变异(copy number variation , CNV)等DNA多态性分析,到DNA 甲基化修饰等表观遗传学研究,生命过程的遗传基础不断被解读。 基因组研究的重要性自然不言而喻。应该说,DNA 测序技术在基因组研究 中功不可没,从San ger测序技术到目前盛行的新一代测序技术(Next Gen eration Seque ncing NGS)到即将走到前台的单分子测序技术,测序技术是基因组解读最重要的主流技术。而基因组测序、基因组多态性分析、DNA 甲基化修饰等表观遗传分析等在基因组研究中是最前沿的课题。但是基因组研究终究类似“基因算命”,再清晰的序列信息也无法真正说明一个基因的功能,基因功能的最后鉴定还得依赖转录组学和蛋白组学,而转录作为基因发挥功能的第一步,对基因功能解读就变得至关重要。声称特定基因、特定SNP、特定CNV、特定DNA修饰等与某种表型有关,最终需要转基因、基因敲除、突变、 RNAi 、中和抗体等技术验证,并必不可少要结合基因转录、翻译和蛋白修饰等数据。 基因实现功能的第一步就是转录为mRNA或非编码RNA,转录组学主要研究基因转录为RNA 的过程。在转录研究中,下面几点是必须考虑的: 1,基因是否转录(基因是否表达)及基因表达水平高低(基因是低丰度表达还是中、高丰度表达)。特定基因有时候在一个细胞中只有一个拷贝的表达,而表达量会随细胞类型不同或发育、生长阶段不同或生理、病理状态不同而改变。因此任何基

基因芯片数据功能分析

生物信息学在基因芯片数据功能分析中的应用2009-4-29 随着人类基因组计划(Human Genome Project)即全部核苷酸测序的即将完成,人类基因组研究的重心逐渐进入后基因组时代(PostgenomeEra),向基因的功能及基因的多样性倾斜。 通过对个体在不同生长发育阶段或不同生理状态下大量基因表达的平行分析,研究相应基因在生物体内的功能,阐明不同层次多基因协同作用的机理,进而在人类重大疾病如癌症、心血管疾病的发病机理、诊断治疗、药物开发等方面的研究发挥巨大的作用。它将大大推动人类结构基因组及功能基因组的各项基因组研究计划。生物信息学在基因组学中发挥着重大的作用,而另一项崭新的技术——基因芯片已经成为大规模探索和提取生物分子信息的强有力手段,将在后基因组研究中发挥突出的作用。基因芯片与生物信息学是相辅相成的,基因芯片技术本身是为了解决如何快速获得庞大遗传信息而发展起来的,可以为生物信息学研究提供必需的数据库,同时基因芯片的数据分析也极大地依赖于生物信息学,因此两者的结合给分子生物学研究提供了一条快捷通道。 本文介绍了几种常用的基因功能分析方法和工具: 一、GO基因本体论分类法 最先出现的芯片数据基因功能分析法是GO分类法。Gene Ontology(GO,即基因本体论)数据库是一个较大的公开的生物分类学网络资源的一部分,它包含38675个Entrez Gene注释基因中的17348个,并把它们的功能分为三类: 分子功能,生物学过程和细胞组分。在每一个分类中,都提供一个描述功能信息的分级结构。这样,GO中每一个分类术语都以一种被称为定向非循环图表(DAGs)的结构组织起来。研究者可以通过GO分类号和各种GO数据库相关分析工具将分类与具体基因联系起来,从而对这个基因的功能进行描述。在芯片的数据分析中,研究者可以找出哪些变化基因属于一个共同的GO功能分支,并用统计学方法检定结果是否具有统计学意义,从而得出变化基因主要参与了哪些生物功能。

第四章-基因的结构和功能

第四章基因的结构和功能 一、教学目的和要求: 1掌握基因概念及其发展; 2 掌握基因的重组测验 3 理解利用顺反试验、互补试验鉴定两个突变型是否属于同一基因的原理; 4 了解缺失作图的原理 二、教学重点: 1基因概念及其发展; 2 基因的重组测验 三、教学难点: 缺失作图的原理 四、教学方法: 面授并辅以多媒体教学 五、教学内容 基因是一个特定的DNA或RNA片段,但并非一段DNA或RNA都是基因。 第一节基因的概念一、基因概念的发展 (一)遗传“因子”:孟德尔认为,生物性状的遗传由遗传因子所控制,性状本身不遗传。(二)染色体是基因的载体:摩尔根实验证明基因位于染色体上,并呈直线排列,提出了遗传学是连锁交换规律,建立了遗传的染色体学说,为细胞遗传学奠定了重要基础。并由此提出基因既是一个功能单位,是一个突变单位,也是一个交换单位的“三位一体”概念。∴经典遗传学认为:基因是一个最小的单位,不能分割;既是结构单位,又是功能单位。(三)DNA是遗传物质:1928年Griffith首先发现了肺炎球菌的转化,证实DNA是遗传物质而非蛋白质;Avery用生物化学的方法证明转化因子是DNA而不是其他物质。 (四)基因是有功能的DNA片段 20世纪40年代Beadle和Tatum提出一个基因一个酶的假说,沟通了蛋白质合成与基因功能的研究 1953年Watson和Crick提出DNA双螺旋结构模型,明确了DNA的复制方式。 1957年Crick 提出中心法则,61年提出三联体遗传密码,从而将DNA分子结构与生物体结合起来 1957年Benzer用大肠杆菌T4噬菌体为材料,分析了基因内部的精细结构,提出了顺反子(cistor)的概念,证明基因是DNA分之上一个特定的区段,是一个功能单位,包括许多突变位点(突变子),突变位点之间可以发生重组(重组子) 理论上,一个基因有多少对核苷酸对就有多少突变子和的重组子,实际上,突变子数少于核苷酸对数,重组子数小于突变子数。 总之:顺反子学说打破了“三位一体”的基因概念,把基因具体化为DNA分子上特定的一段顺序--- 顺反子,其内部又是可分的,包含多个突变子和重组子。 近代基因的概念:基因是一段有功能的DNA序列,是一个遗传功能单位,其内部存在有许多的重组子和突变子。 突变子:指改变后可以产生突变型表型的最小单位。 重组子:不能由重组分开的基本单位。(五)操纵子模型 1961年法国分子生物学家Jacob和Monod通过对大肠杆菌乳糖突变体研究,提出了操纵子学说(operon theory)。阐明了基因在乳糖利用中的作用。

几种常用的基因功能分析方法和工具

几种常用的基因功能分析方法和工具(转自新浪博客) 一、GO分类法 最先出现的芯片数据基因功能分析法是GO分类法。Gene Ontology(GO,即基因本体论)数据库是一个较大的公开的生物分类学网络资源的一部分,它包含38675 个Entrez Gene 注释基因中的17348个,并把它们的功能分为三类:分子功能,生物学过程和细胞组分。在每一个分类中,都提供一个描述功能信息的分级结构。这样,GO中每一个分类术语都以一种被称为定向非循环图表(DAGs)的结构组织起来。研究者可以通过GO分类号和各种GO 数据库相关分析工具将分类与具体基因联系起来,从而对这个基因的功能进行描述。在芯片的数据分析中,研究者可以找出哪些变化基因属于一个共同的GO功能分支,并用统计学方法检定结果是否具有统计学意义,从而得出变化基因主要参与了哪些生物功能。 EASE(Expressing Analysis Systematic Explorer)是比较早的用于芯片功能分析的网络平台。由美国国立卫生研究院(NIH)的研究人员开发。研究者可以用多种不同的格式将芯片中得到的基因导入EASE 进行分析,EASE会找出这一系列的基因都存在于哪些GO分类中。其最主要特点是提供了一些统计学选项以判断得到的GO分类是否符合统计学标准。EASE能进行的统计学检验主要包括Fisher 精确概率检验,或是对Fisher精确概率检验进行了修饰的EASE 得分(EASE score)。 由于进行统计学检验的GO分类的数量很多,所以EASE采取了一系列方法对“多重检验”的结果进行校正。这些方法包括弗朗尼校正法(Bonferroni),本杰明假阳性率法(Benjamini falsediscovery rate)和靴带法(bootstraping)。同年出现的基于GO分类的芯片基因功能分析平台还有底特律韦恩大学开发的Onto-Express。2002年,挪威大学和乌普萨拉大学联合推出的Rosetta 系统将GO分类与基因表达数据相联系,引入了“最小决定法则”(minimal decision rules)的概念。它的基本思想是在对多张芯片结果进行聚类分析之后,与表达模式不相近的基因相比,相近的基因更有可能参与相同的生物学功能的实现。比较著名的基于GO分类法的芯片数据分析网络平台还有七十多个,表1列举了其中的一部分。 二、通路分析法 通路分析是现在经常被使用的芯片数据基因功能分析法。与GO分类法(应用单个基因的GO分类信息)不同,通路分析法利用的资源是许多已经研究清楚的基因之间的相互作用,即生物学通路。研究者可以把表达发生变化的基因列表导入通路分析软件中,进而得到变化的基因都存在于哪些已知通路中,并通过统计学方法计算哪些通路与基因表达的变化最为相关。现在已经有丰富的数据库资源帮助研究人员了解及检索生物学通路,对芯片的结果进行分析。主要的生物学通路数据库有以下两个:①KEGG 数据库:迄今为止,KEGG数据库(Kyoto encyclopedia of genes and genomes)是向公众开放的最为著名的生物学通路方面的资源网站。在这个网站中,每一种生物学通路都有专门的图示说明。②BioCarta 数据库:BioCarta 是一家生物技术公司,它在其公共网站上提供了用于绘制生物学通路的模板。研究者可以把符合标准的生物学通路提供给BioCarta数据库。BioCarta数据库不会检验这些生物学通路的质量,因此其中的资源质量参差不齐,并且有许多相互重复。然而BioCarta数据库数据量巨大,且不同于KEGG数据库,包含了大量代谢通路之外的生物学通路,所以也得到广泛的应用。 最先出现的通路分析软件之一是GenMAPP(gene microarray pathway profiler)。它可以免费使用,其最新版本为Gen-MAPP2。在这个软件中,使用者可以用几种灵活的文件格式输入自己的表达谱数据,GenMAPP的基因数据库包含许多从常用的资源中得到的物种特异性的基因注释和识别符(ID)。这些ID可以将使用者输入的基因与不同的生物学通路的基

02 生物化学习题与解析--核酸的结构与功能

核酸的结构与功能. 一、选择题 (一) A 型题 1 .核酸的基本组成单位是 A .磷酸和核糖 B .核苷和碱基 C .单核苷酸 D .含氮碱基 E .脱氧核苷和碱基 2 . DNA 的一级结构是 A .各核苷酸中核苷与磷酸的连接键性质 B .多核苷酸中脱氧核苷酸的排列顺序 C . DNA 的双螺旋结构 D .核糖与含氮碱基的连接键性质 E . C 、 A 、 U 、 G 4 种核苷酸通过3′ , 5′- 磷酸二酯键连接而成 3 .在核酸中,核苷酸之间的连接键是 A .糖苷键 B .氢键 C .3′ ,5′- 磷酸二酯键 D .1′ , 3′- 磷酸二酯键 E .2′ ,5′- 磷酸二酯键 4 .核酸中稀有碱基含量最多的是 A . rRNA B . mRNA C . tRNA D . hnRNA E . snmRNA 5 .核酸的最大紫外光吸收值一般在 A . 280nm B . 260nm C . 240nm D . 200nm E . 220nm 6 .有关核酸酶的叙述正确的是 A .由蛋白质和 RNA 构成 B .具有酶活性的核酸分子 C .由蛋白质和 DNA 构成的 D .专门水解核酸的核酸 E .专门水解核酸的酶 7 . DNA 与 RNA 彻底水解后的产物是 A .戊糖不同,碱基不同 B .戊糖相同,碱基不同 C .戊糖不同,碱基相同 D .戊糖不同,部分碱基不同 E .戊糖相同,碱基相同 8 .关于 DNA 的二级结构,叙述错误的是 A . A 和 T 之间形成三个氢键, G 和 C 之间形成两个氢键 B .碱基位于双螺旋结构内侧 C .碱基对之间存在堆积力 D .两条链的走向相反 E .双螺旋结构表面有大沟和小沟 9 .关于 mRNA 叙述正确的是 A .大多数真核生物的 mRNA 在5′ 末端是多聚腺苷酸结构 B .大多数真核生物的 mRNA 在5′ 末端是 m 7 GpppN- C .只有原核生物的 mRNA 在3′ 末端有多聚腺苷酸结构 D .原核生物的 mRNA 在5′ 末端是 m 7 GpppN- E .所有生物的 mRNA 分子中都含有稀有碱基 10 .关于 DNA 热变性的描述正确的是 A . A 260 下降 B .碱基对可形成共价键连接

基因组学(结构基因组学和功能基因组学)

问:基因组学、转录组学、蛋白质组学、结构基因组学、功能基因组学、比较基因组学研究有哪些特点? 答:人类基因组计划完成后生物科学进入了人类后基因组时代,即大规模开展基因组生物学功能研究和应用研究的时代。在这个时代,生命科学的主要研究对象是功能基因组学,包括结构基因组研究和蛋白质组研究等。以功能基因组学为代表的后基因组时代主要为利用基因组学提供的信息。 基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(struc tural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics)。结构基因组学代表基因组分析的早期阶段,以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段,是利用结构基因组学提供的信息系统地研究基因功能,它以高通量、大规模实验方法以及统计与计算机分析为特征。 功能基因组学(functional genomics)又往往被称为后基因组学(postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。 基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析。新的技术应运而生,包括基因表达的系统分析,cDNA微阵列,DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异,因此需要建立模式生物体。 功能基因组学

基因家族生信分析

基因家族生信分析 一、什么是基因家族 概念:是来源于同一个祖先,有一个基因通过基因重复而产生两个或更多的拷 贝而构成的一组基因,他们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。 划分: 按功能划分:把一些功能类似的基因聚类,形成一个家族。 按照序列相似程度划分:一般将同源的基因放在一起认为是一个家族。 1.常见基因家族: WRKY基因家族:是植物前十大蛋白质基因家族之一,大量研究表明,WRKY 基因家族的许多成员参与调控植物的生长发育,形态建成与抗病虫。 NBS-LRR抗病基因家族:是植物中最大类抗病基因家族之一。 MADS-BOX基因家族:是植物体内的重要转录因子,它们广泛地调控着植物的生长、发育和生殖等过程。在植物中参与花器官的发育,开花时间的调节,在果实,根,茎,叶的发育中都起着重要的作用。 热激蛋白70家族(HSP70)是一类在植物中高度保守的分子伴侣蛋白,在细胞中协助蛋白质正确折叠。 二、基因家族分析流程:

●利用蛋白保守域结构提取号在Pfam数据库提取其隐马尔科夫模型矩 阵文件(*.hmm) ●在数据库(Ensemble 、JGI、NVBI)下载你所需要的物种的基因组数 据(*.fa,*.gff) ●在虚拟机中Bio-Linux中的hummsearch程序,用隐马尔科夫模型矩 阵文件在蛋白序列文件中搜索含有该保守结构域的蛋白 ●将蛋白序列导入MEGA软件构建进化树(可以阐明成员之间系统进化 关系,从进化关系上揭示其多样性) ●利用MEME搜索蛋白质的保守结构域 利用MEME搜索基因家族成员的motif可以揭示基因家族在物种内的多样化及其功能,如果他们都含有相同的motif表明其功能具有 相似性,如果部分家族成员含有其他不同的motif,很可能这些成员有 其他特异功能,或者可以归分为一个亚族 ●绘制基因染色体位置图 从*.gff文件中抽取我们搜索到的基因位置信息,http://mg2c.iask.in/mg2c_v2.0/在线绘制基因染色体位置图 通过染色体位置分布,可以了解基因主要分布字哪条染色体上,及是 否能形成基因簇(被认为是通过重组与错配促进基因交流) ●基因结构分析 从gff文件中抽取基因的结构信息,绘制转录本结构图。 ●计算串联重复基因的Ka,Ks 1.首先将筛选到的基因的cds序列进行多序列对比,筛选identity > 75%,tength大于对比的两条序列中较长的那条的长度的75%,将 筛选到的基因分别用clustalw进行比对,比对结果导入 KsKs_Calculster计算Ka,Ks、 Ka/ks比,计算核苷酸的非同义替代(ka)与核苷酸的同义替代 (ks)的平均速率。 2.Ka/ks比值<1表明:通过纯化选择降低了氨基酸变化的速率;比 值=1表示中性选择;比值>1,表明这些基因可能已经收到积极选 择,有利于适应性遗传,这些受正向选择的基因将作为以后的研 究重点。 软件的安装 从图片中获得进入NCBI-blast官网复制blast-linux版本的链接

相关主题
文本预览
相关文档 最新文档