当前位置:文档之家› 植物功能组研究进展

植物功能组研究进展

植物功能组研究进展
植物功能组研究进展

程论文(作业)封面(2011 至2012 学年度第 2 学期)课程名称:_ ___

课程编号:___________

学生姓名:__ ________

学号:_______

年级:__ ___________

任课教师: _ ____________

提交日期:年月日成绩:__________________ 教师签字:__________________ 开课---结课:第周---第周评阅日期:年月日

植物的功能基因组学研究进展

摘要:基因组研究计划包括以全基因组测序为目标的结构基因组学和以基因功能鉴定为

目标的功能基因组学两方面的内容。目前基因功能鉴定的方法主要有:基因表达的系统分析(SAGE) 、cDNA 微阵列、DNA(基因) 芯片、蛋白组技术以及基于转座子标签和T-DNA 标签的反求遗传学技术等。本文对上述各种技术的优缺点以及它们在植物基因功能鉴定中的应用进行了综述。

关键词:功能基因组学; 基因表达的系统分析;cDNA 微阵列;DNA 芯片;蛋白组

以拟南芥和水稻为代表的植物基因组研究已取得了迅速的进展,到目前为止,占拟南芥基因组(100Mb) 近三分之一的DNA 序列已被测定并在GenBank 数据库中登记注册,预期到2001 年通过全球合作将完成拟南芥全基因组的序列测定工作。随着植物基因组计划的实施和进展,GenBank 中累积了大量的未知功能的DNA 序列,如何鉴定出这些基因的功能将成为基因组研究的重点课题, 因此, 基因组研究应该包括两方面的内容: 以全基因组测序为目标的结构基因组学(structural genomics) 和以基因功能鉴定为目标的功能基因组研究, 后者往往又被称为后基因组研究。功能基因组研究的内容是利用结构基因组所提供的信息, 发展和应用新的实验手段系统地分析基因的功能〔1 〕。目前人类和酵母的功能基因组研究已经全面展开, 尤其是对已完成全基因组测序的酵母来说, 其功能基因组研究任务更加紧迫。植物的基因组研究虽然起步较晚, 但由于吸取了人类基因组研究中积累的一些经验, 所以进展也相当迅速, 对植物功能基因组学的研究目前也已经受到重视, 在1998 年12月出版的最新一期Plant Cell (10 :1771) 和Plant Physiol . (118 :713) 上均编发了关于植物功能基因组学研究的编者按, 并由Bouchez 和Hofte (1998) 〔2 〕综述了植物尤其是拟南芥功能基因组学研究的现状, 本文在此基础上综述了目前植物功能基因组学研究中使用的主要技术手段以及最新的研究进展。

1 基因功能的含义

基因的功能主要包括: 生物化学功能, 如作为蛋白质激酶对特异的蛋白质进行磷酸化修饰; 细胞学功能, 如参与细胞间和细胞内的信号传递途径; 发育上的功能, 如参与形态建成等。目前,获得一段DNA 序列的功能信息的最简单的方法是将该DNA 序列与GenBank 中公布的基因序列进行同源性比较,如利用BLASTn 和BLASTx 两种软件分别进行核苷酸和氨基酸序列同源性比较等。同源性比较的结果大体可以分为如下类型: 与生化和生理功能均已知的基因具同源性; 与生化功能已知的基因具同源性, 但该基因的生理功能未知;与其它物种中生化和生理功能均未知的基因具同源性; 虽与生化和生理功能均已知的基因具同源性, 但对该基因功能的了解尚不深入, 仍停留在表观现象上。上述同源性检索分析方法仅仅为该DNA 片段的功能提供了间接的证据,对基因功能的直接证据还需要实验上的数据。Bouchez 和Hofte (1998)〔2 〕将所需要的实验证据归纳如下: (1) 通过研究基因的时空表达模式确定其在细胞学或发育上的功能, 如在不同细胞类型、不同发育阶段、不同环境条件下以及病原菌侵染过程中mRNA 和/ 或蛋白质的表达的差异等。(2) 研究基因在亚细胞内的定位和蛋白质的翻译后调控等。(3) 利用基因敲除(knock - out) 技术进行功能丧分析或通过基因的过量表达(转基因) 进行功能获(gain2of2function) 分析,进而研究目的基因与表型性状间的关系。(4) 通过比较研究自发或诱发突变体与其野生型植株在特定环境条件下基因表达的差异来获取基因功能的可能信息。

2 植物的表达序列标记(EST) 与基因组大规模测序

通过从cDNA 文库中随机挑取的克隆进行测序所获得的部分cDNA 的5′或3′端序列称为表达序列标记( EST) ,一般长300~500bp 左右, 利用EST作为标记所构建的分子遗传图

谱被称为转录图谱。目前植物EST计划主要集中在拟南芥〔3 ~5 〕和水稻〔6 〕上,其他植物的EST相对较少,截止到1998 年12 月底,在美国国家生物技术信息中心(NCBI) 数据库中公布的各种植物EST的数目总和已达几万条(见表1) 。这些EST不仅为植物基因组遗传图谱的构建提供了大量的分子标记, 而且来自不同组织和器官的EST也为基因的功能研究提供了有价值的信息,此外,EST计划还为基因的鉴定提供了候选基因(candidates) 。EST计划的一个不足之处在于通过随机测序有时难以获得那些低丰度表达的基因和那些在特殊环境条件下(如生物胁迫和非生物胁迫) 诱导表达的基因,因此为了弥补EST计划的不足, 必须开展基因组测序计划。通过分析基因组序列能够获得基因组结构的完整信息, 如基因在染色体上的排列顺序, 基因间的间隔区结构, 启动子的结构以及内含子的分布等。

3 植物基因的功能分析方法

基因的时空差异表达是植物发育、分化、衰老和抗逆等生命现象的分子基础。基因在不同组织、不同器官以及不同环境条件下的差异表达特征, 为基因的功能提供了重要的信息。Velculescu 等(1997) 〔12 〕将在特定组织或细胞内转录的所有基因及其表达丰度称为转录组(transcriptome) , 因此在转录水平上进行的基因表达差异分析实际上就是进行转录组研究。经典的减法杂交(subtractive hybridization) , 差示(differentialscreening) , cDNA 代表差异分析(representative difference

analy2sis ,RDA) 以及mRNA 差异显示(differential display) 等技术已被广泛用于鉴定和克隆差异表达的基因, 但是这些技术不能胜任对大量的植物基因进行全面、系统的分析, 于是, 基因表达的系统分析(serial analysis of gene expression , SAGE) 、cDNA 微阵列(cDNA microarray) 和DNA芯片(DNA chip) 等能够大规模地进行基因差异表达分析的技术应运而生。

3. 1 基因表达的系统分析( SAGE)

SAGE 技术的主要理论依据是: 来自cDNA 3′端特定位置的一段9~11bp 长的序列能够区分基因组中95 %的基因。这一段基因特异的序列被称为SAGE标签(SAGE tag) 。通过对cDNA 制备SAGE 标签并将这些标签串联起来, 然后对上述串联起来的SAGE 标签进行测序不仅可以显示各SAGE标签所代表的基因在特定组织中是否表达, 还可以根据各SAGE 标签所出现的频率作为其所代表的基因表达丰度的指标〔13 〕。应用SAGE技术的一个必要前提是GenBank 中必须有足够的某一物种的DNA 序列资料,尤其是EST序列资料。目前该技术在人类〔14 〕和酵母〔12 〕基因组研究中已得以应用,但是尚未用于植物基因组研究。SAGE 技术的不足是不能够检测出稀有转录物。

3. 2 cDNA 微阵列和DNA 芯片技术

cDNA 微阵列和DNA 芯片都是基于reverse Northern 杂交以检测基因表达差异的技术。二者的基本思路都是首先把cDNA , 或EST, 或基因特异的寡聚核苷酸固定在固相支持物上, 并与来自不同细胞、组织或整个器官的mRNA 反转录生成的第一链cDNA 探针进行杂交, 然后用特殊的检测系统对每个杂交点进行定量分析, 理论上杂交点的强度基本上反映了其所代表的基因在不同细胞、组织或器官中的相对表达丰度。这两项技术的优点是可以同时对大量基因, 甚至整个基因组的基因的表达差异进行对比分析。cDNA 微阵列技术是Schena 等(1995) 〔15 〕发展起来的,其主要优点是: 灵敏度极高,mRNA 丰度低至10 万分之一仍能被检测出; 使用几种不同颜色的荧光染料标记探针, 这样在同一张阵列膜上进行一次杂交实验就可以同时分析不同细胞间或不同环境胁迫下基因表达的差异。cDNA 微阵列技术的主要不足是成本非常高,如需要机器人点膜和特殊的信号检测分析系统, 点在玻璃片上的array 不能重复使用等。最近,Desprez 等(1998)〔16 〕和胡玉欣等(中科院遗传所,私人交流) 分别独立发展了利用尼龙膜作固相支持物和使用同位素标记探针进行杂交的cDNA 表达阵列技术,从而降低了成本,但检测的灵敏度却降低了(万分之一) 。DNA 芯片技

术是Affymetrix 公司率先研制出来的, 该技术利用结合化学手段在玻璃固相支持物上原位合成大量的基因特异的寡聚核苷酸, 并与荧光标记的探针进行杂交, 再利用特殊的检测系统进行信号分析, 就可以获得基因的时空差异表达谱,最近Ramsay (1998) 〔17 〕对DNA 芯片技术的原理和应用进行了较全面的介绍,这里不再赘述。

3. 3 蛋白组( proteome) 研究

转录不是基因表达的最终结果, 基因功能的实现最终是以蛋白质的形式体现的, 因此, 在转录水平上所获取的基因表达的信息有时并不足以揭示该基因在细胞内的确切功能。蛋白组指的是由基因组表达产生的总蛋白质的统称, 由英文单词protein 的前半部加上单genome 的后半部组合而成。蛋白质双向电泳是目前蛋白组研究的首选技术〔18 〕, 但是该技术在以下方面尚需改进: 分辨率和可重复性; 蛋白质斑点的自动定量检测系统, 以及蛋白质N端和内部氨基酸序列测定技术等。

利用蛋白质双向电泳技术对基因敲除(knock - out) 突变体或转基因重组体与野生型个体间双向电泳蛋白图谱的差异进行对比分析就可以对目的基因的功能进行分析。在植物上该技术已被用来分离新的基因, Damerval 等(1998) 〔19 〕分析了玉米Opaque2 基因的近等基因系之间的双向电泳蛋白图谱的差异, 结果鉴定克隆了一个新的转录激活因子基因。对水稻盐胁迫处理和ABA 处理前后的双向电泳蛋白图谱进行的对比分析同样克隆了几个与水稻耐盐性相关的胚胎晚期丰富蛋白(lea) 基因〔20 ,21 〕。

3. 4 反求遗传学研究

传统的遗传学或称为正向遗传学(forward genetics) 主要研究自发或诱发突变体中某一突变性状的遗传行为, 如控制突变性状的基因的数目及其在染色体上的位置、突变性状在后代中的传递规律等。反求遗传学(reverse genetics) 是在已知基因序列的基础上研究基因的生物学功能, 一般通过创造功能丧失(loss-of-function) 突变体并研究突变所造成的表型效应。在微生物和小鼠中可以通过同源重组的方法用突变的基因取代野生型基因创造功能丧失突变体进行反向遗传学研究, 但在植物中很难进行同源重组试验〔22 〕, 不过植物中有成熟的转座子标签(transposon tagging) 系统和T-DNA 标签系统,而且目前已经获得了拟南芥、金鱼草、番茄、玉米和水稻等植物的转座子插入诱变的突变体群体, 以及

T-DNA 插入诱变了的拟南芥突变体群体。从这些突变体群体中筛选出特异基因被突变了的植株, 并对突变株进行表型分析将有助于揭示目的基因的生物学功能。筛选突变体的常用方法是利用PCR 技术,这是在果蝇〔23 〕和线虫( C. elegans) 〔24 〕中发展起来的比较成熟的方法, 其基本思路是根据目的基因的序列设计一个引物, 再根据插入元件(转座子或T- DNA) 的序列设计第二个引物, 用上述引物对突变体群体进行PCR 扩增, 由于只有目的基因插入转座子或T-DNA 的突变体才有PCR 扩增产物,这样根据扩增产物的有无就可以很容易地从数以千计的突变体群体中筛选出所需要的突变体。该技术已经在矮牵牛〔25 〕、玉米〔26 ,27 〕和拟南芥〔28 ~35 〕等植物中得以成功应用。但是对数以千计的材料进行PCR 反应工作量十分巨大, 为克服这一困难,Winkler 等(1998)〔33 〕设计了利用DNA 混合池(pooling) 进行突变体筛选的实验程序, 结果只需要进行36 个PCR 反应就可以从由6000 个突变体组成的群体中筛选出单个的突变株,大大减轻了筛选的工作量,同时这些突变体的DNA 样品及构建的DNA 池也可以向其他研究者免费提供。当然,要对基因组中所有的基因进行功能分析所需要的突变体的数目也是十分可观的, 理论上, 要达到95 %的概率使基因组中每一个基因均因插入元件而致突变, 则所构建的突变体群体中个体的数量至少应为该植物基因总数的5 倍左右。

在进行反求遗传学研究时, 有时筛选出来的突变体在正常生长条件下并不表现出突变的表型效应, 这种情况一方面可能是由于突变的表型效应需要在特定的生长环境中才能得以表现出来,如拟南芥的钾离子通道基因突变体Akt1 只有在缺钾的培养条件下才表现出突

变的表型效应〔35 〕。另一方面, 植物基因组中有些基因是以基因家族的形式存在的, 即存在基因冗余, 这样只要基因家族中有一个成员未发生插入突变, 该基因的表达就能够补偿其他家族成员由于发生突变所造成的功能丧失效应。因此, 对植物的家族基因的功能进行反求遗传学研究时必须对该基因家族中的各个成员均已发生插入突变的突变株进行表型分析, 才能揭示该基因家族的生物学功能。

植物的功能基因组学研究才刚刚开始, 上述的各种技术手段都各有优缺点,随着植物基因组研究的进展和深入,在完善现有的研究手段的同时, 还必须发展一些新的基因功能的研究技术,同时加强国际间的学术和材料交流,建立全球共享的植物基因组数据库系统, 以最终阐明植物基因组的结构与功能。另外,进一步的研究应从模式植物拟南芥的基因组研究转向作物的基因组研究,为作物的遗传改良作出贡献。

参考文献:

〔1〕Hieter P , Boguski M. Functional genomics : it’ s all how you read it〔J〕.

Science ,1997 ,278 :601~602.

〔2〕Bouchez D ,Hofte H. Functional genomics in plants〔J〕. Plant Physi2ol . ,1998 ,118 :725~732. 〔3〕Hofte H, et al. An inventory of 1151 expressed sequence tags obtainedby partial sequencing of cDNAs from Arabidopsis thaliana〔J〕. PlantJ ,1993 ,4 :1051~1061.

〔4〕Newman T, et al. Genes galore :a summary of methods for accessingresults from large2scale partial sequencing of anonymous ArabidopsiscDNA clones〔J〕. Plant Physiol ,1994 ,106 :1241~1255.

〔5〕Cooke R , et al. Further progress towards a catalogue of all Arabidop2s2is genes : analysis of a set of 5 000 non2redundent ESTs〔J〕. Plant J ,1996 ,9 :101~124.

〔6〕Yamamoto K,Sasaki T. Large2scale EST sequencing in rice〔J〕. PlantMol Biol ,1997 ,35 :135~144. 〔7〕Bevan M, et al. Analysis of 1. 9Mb of contiguous sequence from chro2mosome 4 of Arabidopsis thaliana〔J〕. Nature ,1998 ,391 :485~488.

〔8〕Uberbacher E C, et al. Locating protein coding regions in human DNAsequences using a multiple sensor2neural net2work approach〔J〕. ProcNatl Acad Sci USA ,1991 ,88 :11261~11265.

〔9〕Hebsgaard S M, et al. Splice site prediction in Arabidopsis thaliana DNA by combining local and global sequence information〔J〕. NucleicAcids Res ,1996 ,24 :3439~3452.

〔10〕Tolstrup N, et al. A branch point consensus from Arabidopsis found bynon2circular analysis allows for better prediction of the acceptor sites〔J〕. Nucleic Acids Res ,1997 ,25 :3159~3163.

相关主题
文本预览
相关文档 最新文档