大规模表达序列标签测定及分析
- 格式:ppt
- 大小:1.02 MB
- 文档页数:51
新型分子标记的开发和利用黄磊;唐光绪;田东;何庆元【摘要】比较遗传分析中常用的随机DNA分子标记、目的基因标记、功能性分子标记.综述了近年开发的几种分子标记,并对新型分子标记(功能性分子标记)进行阐述,如何利用Tilling技术和关联分析的方法开发功能性分子标记,并介绍了功能性分子标记的优点和利用前景.【期刊名称】《安徽农学通报》【年(卷),期】2010(016)023【总页数】4页(P43-45,61)【关键词】功能性分子标记;目的基因标记;Tilling;关联分析【作者】黄磊;唐光绪;田东;何庆元【作者单位】安徽科技学院生命科学学院,安徽凤阳,233100;安徽科技学院生命科学学院,安徽凤阳,233100;安徽科技学院生命科学学院,安徽凤阳,233100;安徽科技学院生命科学学院,安徽凤阳,233100【正文语种】中文【中图分类】Q75长期以来,植物育种选择都是基于植物的表型性状进行的,当性状的遗传基础较为简单或即使较为复杂但表现加性基因遗传效应时,表型选择是有效的。
但许多数量性状难以准确鉴定,根据表型提供的性状遗传潜力的度量是不确切的,因而选择是低效的。
遗传育种家们很早就提出了利用标记进行辅助选择以加速育种改良进程的设想。
但形态标记和常规遗传标记数量少、遗传稳定性差、且常常与不良性状连锁,因而利用受到很大限制。
分子标记是近年迅速发展起来的一种技术手段,它的出现使人们对于基因的准确检测,目标基因的分离,克隆和转移更为方便。
自1974年Grodzicker创立RFLP技术以来,目前已发展起了多种分子标记,按其技术基础主要可分为3类:(1)依赖杂交技术手段的分子标记,如RFLP;(2)依赖于PCR为基础的分子标记,如RAPD,SSR等;(3)一些新型的分子标记,如SNPs等[1]。
按其作用分为随机DNA分子标记(random DNA markers,RDMs)、目的基因分子标记(gene targeted makders,GTMs)和功能性分子标记(functional markers,FMs)[2]。
表达序列标签(est)在基因组学研究中的应用序列标签(Sequence Tag)是指由DNA或RNA片段构成的一系列序列标记,它可以在遗传疾病、基因表达、信号转导等生命科学研究中发挥重要作用。
其中,表达序列标签(EST)是一种简单而有效的标记技术,它的应用在基因组学领域得到了广泛关注。
一、EST技术简介EST技术是一种由测序技术支持的高通量筛选技术,其主要原理是通过随机挑选某些不同的cDNA克隆来获得所需的不同的EST序列。
它的应用可以大大降低生物学研究的难度,也可以在较短的时间内获得大量的基因序列。
二、EST在基因组学研究中的应用(一)基因组注释及功能预测基因组注释是指对基因组序列进行生物信息学分析,以确定其中的基因区域和基因的结构。
EST技术可以通过对基因组序列的全长编码区域进行建库、测序和组装,从而确定基因的结构和位置,从而实现基因组注释。
(二)基因家族的发现和分类EST技术可以应用于表达的基因家族的发现和分类,例如受体基因、酶基因和转录因子基因家族等。
EST序列可以用作启动点,通过比对模式,可将同源序列聚类形成基因家族,并进一步研究其与环境、生长过程或其它生物学过程的关系。
(三)隐形基因的寻找传统的基因克隆方法主要寻找已知的基因进行克隆,而隐形基因(也称未知基因)的寻找则需要更为深入的研究。
EST技术可以通过测序与注释,从全基因组的角度分析,实现隐形基因的发现。
这可以为了解未知疾病的发病机制、发病率等方面提供重要支持和信息。
(四)基因调控机理的研究EST技术不仅可以应用于基因组学研究,还可以应用于表观遗传学——研究基因调控机理。
EST序列常常用于测定细胞特异性基因表达、基因表达的时间和空间分布等方面。
它对于异等基因的表达差异、组织特异性基因表达模式、静态和动态转录调控等具有重要的科研价值。
同时,它还可以用于筛选差异表达基因,并进一步研究其相关的信号传导机制、生长发育机制等。
三、结论在基因组学研究中,EST技术可以为高通量测序提供支持,并更好地揭示基因组结构和基因调控机制。
农业生物技术学报JournalofAgriculturalBiotechnology2006,14(6):963 ̄969・研究论文・稻瘟病菌发育cDNA文库构建与表达序列标签分析*金庆超1,董海涛1**,彭友良2,陈保善3,邓晔1,戴承恩1,方永启1,邵菁1,娄沂春1,李有志3,李德葆1**(1.浙江大学农业与生物技术学院生物技术研究所,杭州310029;2.中国农业大学农业部分子植物病理学重点实验室,北京100094;3.广西大学亚热带生物资源保护和利用实验室,南宁530004)摘要:利用稻瘟病菌(Magnaporthegriesa)连续6个发育时期的材料构建了一个混合cDNA文库。
文库滴度,重组率和插入片段长度等质量分析表明,构建的文库包含完整的稻瘟病菌基因,可用于病菌基因表达分析。
利用该文库获得了7456条5′端表达序列标签(ESTs)(GenBank收录号:(CK909944 ̄CK913666和CK928583 ̄CK932582),生物信息分析表明:EST序列拼接出2975个假定独立转录本(TUTs),冗余度为60.1%;从cDNA文库中筛选出大量的低丰度表达基因,约占TUT总数的79.8%,说明在文库中基因组成类型的复杂性较高;在所有TUTs中,功能未知基因约占85.5%,编码ECM33蛋白和疏水蛋白等病菌致病相关的注释基因高丰度表达,进一步表明该cDNA文库反映了病菌侵染和发育过程中基因表达的状况。
关键词:稻瘟病菌;cDNA文库;表达序列标签中图分类号:S188文献标识码:A文章编号:1006-1304(2006)06-0963-07MagnaporthegrisesaDevelopmentcDNALibraryConstructionandExpressedSequenceTagsAnalysis*JINQing-chao1,DONGHai-tao1**,PENGYou-liang2,CHENBao-shan3,DENGYe1,DAICheng-en1,FANGYong-qi1,SHAOJing1,LOUYi-chun1,LIYou-zhi3,LIDe-bao1**(1.InstituteofBiotechnology,CollegeofAgricultureandBiotechnology,ZhejiangUniversity,Hangzhou310029,China;2.TheKeyLaboratoryofMolecularPlantPathology,MinistryofAgriculture,ChinaAgriculturalUniversity,Beijing100094,China;3.LaboratoryofSubtropicalBioresourceConservationandUtilization,GuangxiUniversity,Nanning530004,China)Abstract:TheinfectionmodelofmechanicalpenetrationofplantsurfacesbyMagnaporthegriseahasbecomeafocusofmolecu-larmechanismofthefungalpathogenesis.Inordertooverallanalyzegeneexpressionduringinfectionanddevelopment,amixedcD-NAlibrarywasconstructedwithmaterialsfromcontiguoussixdevelopmentstagesofM.grisea.Somequalityanalysis,suchasthetiter,therecombinantrateandinsertcDNAlengthofthecDNAlibrary,indicatedthatthelibrarycontainedintactgenesandcouldbeusedforgeneexpressionanalysisofM.grisea.Total7456expressedsequencetags(ESTs)(GenBank(CK909944 ̄CK913666andCK928583 ̄CK932582)of5′endswereobtainedfromthecDNAlibrary.ResultsofbioinformaticsanalysisforallESTsdatashowedthatESTsequencesassembledout2975tentativeuniquetranscripts(TUTs)andendued60.1%redundancy;mostgenesex-pressedwithlowabundancegeneratedfromthecDNAlibraryandoccupied79.8%ofallTUTs,indicatingthelibraryhadagoodcomplexityofgenecomposition;about85.5%TUTscouldnotbeassignedfunctionaldescriptionandinfectionrelatedgenes,suchasECM33proteinandhydrophobinexpressedathighabundancelevelamongtheremainedannotatedgenes,furtherlyindicatedthatthecDNAlibraryreflectedcorrectlygeneexpressionduringM.griseadevelopment.SothemixedcDNAlibraryprovidesaneffectivere-sourceforfunctionalstudyofthefungusandissuitableforfurtherstudyformolecularmechanismofinfectionanddevelopmentofM.grisea.Keywords:Magnaporthegrisea;cDNAlibrary;expressedsequencetags*基金项目:国家高技术研究与发展计划(863)项目(No.2002BA711A15)资助。
冬虫夏草菌表达序列标签的分析冯辉;金永三;刘燕楠;刘震;韩宇宁;孙海波;张绍鹏【期刊名称】《世界科学技术-中医药现代化》【年(卷),期】2010(012)004【摘要】为研究野生冬虫夏草的基因表达谱和挖掘其功能基因,在前期构建的冬虫夏草高质量cDNA文库基础上,挑选21845个克隆测序,筛选出了20136条EST序列,最终获得6434条非重复序列,包括2462条重叠群,3972条单一序列,代表本物种的转录序列.与GenBank中已知序列BLAST比对(E值10-5),获得部分同源基因的功能注释.基因功能分属7个不同的类别.本文重点讨论了营养物质消化吸收相关基因与抗性基因,旨在说明冬虫夏草菌适应寄生环境的机制,为进一步从分子水平研究活性成分及开发利用这一基因资源提供了条件.【总页数】6页(P604-609)【作者】冯辉;金永三;刘燕楠;刘震;韩宇宁;孙海波;张绍鹏【作者单位】北京中医药大学,北京,100029;北京中医药大学,北京,100029;北京中医药大学,北京,100029;北京华大基因研究中心,北京,101300;北京华大基因研究中心,北京,101300;北京华大基因研究中心,北京,101300;北京华大基因研究中心,北京,101300【正文语种】中文【中图分类】R2【相关文献】1.表达序列标签大规模序列分析策略及方法 [J], 刘稳升;吴忠道2.肝细胞癌中差异表达的表达序列标签的生物信息学分析 [J], 陈香宇;段芳龄;李建生;朱武凌;韩泽广;薛乐勋3.大片吸虫成虫cDNA表达文库的构建及其表达序列标签初步分析 [J], 罗洪林;张为宇;郑小龙;黄维义4.梅山猪、大白猪和梅大杂交猪背最长肌中差异表达的14个表达序列标签的分离、鉴定及组织表达分析 [J], 刘永刚;熊远著;左波;蒋思文;邓昌彦;李家连;李凤娥;郑嵘5.大片吸虫成虫FG0018表达序列标签序列的电子克隆分析及实验验证 [J], 罗洪林;郑小龙;张为宇;覃华;黄维义因版权原因,仅展示原文概要,查看原文内容请购买。
基因组学试题1、什么是基因组(5分)?什么是转录组(5份)?说明基因组合的关系和异同(10分)基因组是生物体(细胞或病毒)中所有的DNA的总和, 包括所有的基因和基因间区域,包括染色体之外的遗传物质,如线粒体、叶绿体、质粒等。
基因组:物种内恒定(♀/♂),生物体或细胞内恒定,没有时空变化(?)。
事实上有特例,1、盲鳗(Hugfish) ,性细胞和体细胞DNA量差异; 2、部分昆虫,性细胞和体细胞染色体数目差异; 3、动物雌雄个体差异转录组:•生物体、组织、细胞不同生长发育阶段的转录产物不同。
•生物体不同组织、同一组织不同细胞的转录产物不同。
•生物体、组织、细胞不同环境、不同生理状态下的转录产物不同。
•转录产物中包含大量不翻译蛋白的RNA,如rRNA; sRNA2、简述原核生物基因组和真核生物基因组的特点和差异(10分)原核生物基因组•一条环状DNA;•只有一个复制起始点;•有操纵子(Operon)结构1.结构基因为多顺反子,若干个功能相关的功能基因串联在一起,手统一调控区调控。
2.数个操纵子还可以受同一个调节基因(regulaterygene),即调节子(regulon)调控。
•结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质•基因是连续的,无内含子,转录后不剪接;•重复序列少,蛋白质基因一般为单拷贝基因,但编码rRNA的基因一般为多拷贝,有利于核糖体快速组装。
真核生物基因组•复杂的染色体结构,一般有多条染色体•每条染色体上有多个复制起始点;•基因组中有大量的重复序列(轻度、中度、高度重复);•基因是不连续的,有内含子,转录后经过剪接加工成成熟RNA;•有许多来源相同、结构相似、功能相关的基因组成的单一基因簇,或基因家族•有细胞器基因,真核生物除具有核基因外,还有存在于线粒体和叶绿体中基因,编码同功酶等。
3、什么是遗传图谱(5分)?遗传图谱在基因组研究中的意义何在(15分)?采用遗传学分析方法将基因或其它DNA标记按一定的顺序排列在染色体上,这一方法包括杂交实验,家系分析。
禾谷镰刀菌基因组学研究进展张大军,邱德文,蒋伶活*(中国农业科学院植物保护研究所植物病虫害生物学国家重点实验室,北京100081)摘要 禾谷镰刀菌是小麦和大麦生产上一类重大的病原真菌。
禾谷镰刀菌全基因组测序的完成,为禾谷镰刀菌功能基因的发掘提供了十分有利的信息。
简述了禾谷镰刀菌在基因组学,包括比较基因组学和功能基因组学等领域的研究进展。
关键词 禾谷镰刀菌;比较基因组学;功能基因组学中图分类号 S188 文献标识码 A 文章编号 0517-6611(2009)17-07892-03R e se a rch Pro g re s s on th e G e n om ic s o f Fusariu m g r a m inear u m ZHANG D a -ju n e t a l (S ta te K ey L abo ra to ryfo r B io logy o f P lan t D isea se an d In sect P es ts ,In s titu te o f P lan t P ro tection,C h in ese A cade m y o f A gr icu ltu r-a l S cien ces ,B e ijin g 100081)A b s tra c t Fu sarium g r am in earu m is a m a jo r fu n ga l pa th og en on w h ea t an d bar le y produ ction.T h e com p le tion o f F .g ra m inear um gen om ic sequ en cin g prov i de s va lu ab le in form a tion fo r s tu dy in g th e f u n ction a l gen e s o f Fu sariu m g r am i n ear um.T h e recen t re se arch p rog ress on th e g en o m ics o f Fusarium gra m inearu m w e re rev iew ed ,su ch as co m pa ra tive gen om ics an d fu n ction a l gen om ics .K e y w o rd s Fusariu m gra m inear um;C om pa ra tive gen om ics ;F un ction a l g en o m ics基金项目 国家“973”项目(2006CB 101907)。
新技术新方法大规模平行测序技术(MPSS)研究进展陈杰*(第三军医大学新桥医院肿瘤科,重庆400037)摘要大规模平行测序技术(massively par allel signatur e sequencing,MPSS)是以DNA测序为基础的大规模高通量基因分析新技术,通过标签库的建立、微珠与标签的连接、酶切连接反应和生物信息分析等步骤,获得基因表达序列.MP SS具有能测定表达水平较低、差异较小的基因,不必预先知道基因的序列,自动化和高通量等特点,是值得推广的技术.关键词基因,表达分析,大规模平行测序学科分类号Q34311,Q78大规模平行测序技术(massively parallel signature sequencing,MPSS)是Brenner等[1]于2000年建立,由美国Lynex公司(www.lynex. com)将其商品化的一种基因克隆新技术.在发明之初就与TAKARA公司联手向全球推广.其核心技术分别由MegaClone、MPSS和生物信息分析三部分组成.是基于序列分析技术的高通量、高特异性和高敏感性的基因分析技术.本文就最新建立的大规模平行测序技术做简要介绍,并比较该技术与其他几种常用技术的优缺点.1MPSS概况基因药物及相关诊断试剂开发的首要条件是要找出导致疾病或与疾病相关的基因.人类基因组共有1万至5万个基因,而在人体的任一器官、任一时刻,大约有1万至115万个基因在同时起作用.找出与疾病直接相关的基因是一个复杂的过程,涉及到基因表达水平的测定、蛋白质表达、抗体产生和测试,以及复杂的实验设计和数理统计.而其中最重要的一个环节是准确有效地检测基因在不同样品中表达水平的差异.MPSS是以基因测序为基础的新技术,其方法学基础是一个标签序列(10~20bp)含有能够特异识别转录子的信息,标签序列与长的连续分子连接在一起,便于克隆和序列分析.通过定量测定可以提供相应转录子的表达水平,也就是将mRNA 的一端测出一个包含10至20个碱基的标签序列,每一标签序列在样品中的频率(拷贝数)就代表了与该标签序列相应的基因表达水平,所测定的基因表达水平是以计算mRNA拷贝数为基础,是一个数字表达系统,只要将病理和对照样品分别进行测定,即可进行严格的统计检验,能测定表达水平较低、差异较小的基因,而且不必预先知道基因的序列,该技术的特点是基因表达水平分析的自动化和高通量.大规模平行测序技术,其基本方法是从生物样品中提取mRNA,将mRNA分子转换成cDNA,通过固相克隆将该cDNA均匀地加载到特制的小分子载体表面,然后在小分子载体上进行大量的PCR扩增.将所有cDNA游离的一端进行精确测序产生16至20个碱基.每一特定序列在整个生物样品中所占的比例,就代表了含有该cDNA基因在样品中的相对表达水平.该技术能将一个生物样品中几乎所有表达了的基因全部分别克隆到特制的小分子载体上,然后把几十或上百万个小分子载体放进一个特殊的反应系统内,使所有小分子载体都排列在一个平面上,然后将带特殊荧光标记的G、A、T、C单核苷酸按顺序分别加入反应体系中,分别与小分子载体上的cDNA进行分子杂交,每次分子杂交后将所有小分子载体进行激光扫描照相.当加入G时,有特殊荧光的小分子载体上所载的*通讯联系人.Tel:023*********,E2mail:jazz0331@收稿日期:2004202210,接受日期:2004203228cDNA在这个碱基位置上就是G,当加入A时有荧光,则这个位置就是A,以此类推,只需经过4次反应4次激光扫个碱描照相就可将上百万个cDNA 同时将这一位置的序列测出[2].该技术的特点是:a1不必事先知道基因的序列,适用于任何生物体及任何性状;b1基因组覆盖面高,能测量出样品中几乎所有表达了的基因; c1基因表达水平的测量是通过直接计算样品中cDNA的拷贝数目,属于非连续变量,所以只要有病理和正常个体(或组织)两个样品即可以进行严格的统计检验,能有效地检测差异性中等或较小的基因;d1实验效率高,只要两个星期即可获得几十万个克隆的16至20个碱基序列.该技术的关键是验证数据问题,即如何确定转录子和基因表达水平与标签序列产生的数据之间的关系.对不同的基因使用正确的标签序列,如果基因与标签序列之间是非特异性和不明确的都将会产生分析错误.2MPSS基本步骤首先用生物素标记的寡核苷酸引物(biotin2 labelled oligo2dT primer)将来自细胞或组织的mRNA合成为cDNA双链(图1)[3].Dp nÒ限制性内切酶(酶切位点为GATC)消化cDNA片段,利用标记的生物素纯化消化的cDNA片段.将纯化的cDNA片段克隆入包含有32bp序列的标签(tag)载体中,并通过标签上的PCR引物扩增插入片段.酶切消化线性化PCR产物,生成含cDNA片段与32bp标签相连接的产物.将cDNA模板连接到直径为5L m的微球体上./克隆0的方法是利用人工设计长度不同的两类互补寡核苷酸(tag和anti2tag),分别将cDNA与tag连接,anti2tag和微球体连接之后,再将cDNA模板通过tag和anti2tag杂交连接与微球体连接起来.为了能装载下细胞内所有的cDNA模板(若以310 ~410个基因计算),寡核苷酸的数量至少应该要比模板的量多100倍以上,为此Brenner等设计了1167@107个长32bp的寡核苷酸片段,这样可以保证生物体所有不同的cDNA模板都能与不同的寡核苷酸相连接,而且每一个微球体上也可承载104 ~105个相同的cDNA拷贝[3].与32bp标签序列互补的序列(anti2tag)杂交连接,而anti2tag预先已经通过共价键与直径为5L m的微球体连接,这样含cDNA片段与32bp 标签相连接的序列就与微球体相结合.cDNA序列测定,通过连接接头和ÒS型限制性酶BbvÑ,进一步消化结合在微球体上cDNA模板,BbvÑ能在距识别位点9个碱基和13个碱基的位置切割cDNA双链,并在cDNA模板上产生4个碱基末端.Fig11Atta chment of tags to cDNAs[3]图1cDNA片段与标签及微球体的结合[3]洗脱除去寡核苷酸接头,经过BbvÑ酶切后的cDNA模板,进入下一轮分析.分析所得到的17张荧光显微照片,就可以读出微球体阵列中每一个微球体上长度为17bp的cDNA模板序列(图2)[3].Fig12Deter mine the17mer2signatur e of ea ch cDNA2bead[3]图2每个cD NA2bead序列中17bp标签的产生[3]3MPSS应用根据MPSS技术的原理可以知道,MPSS一方面可提供某一cDNA在体内特定发育阶段的拷贝数,另一方面还可测定出相应cDNA17bp的序列,所以这就为在转录水平上进行基因表达分析提供了强有力的定性和定量手段,很明显,这一技术首先可以应用于不同丰度基因的差异表达分析,制作基因转录图谱,这无疑将加速新基因克隆和基因功能的分析.MPSS所获得的基因序列可提供PCR 引物,可通过比较GenBank EST数据库等进行基因定位,也可转化为分子标记构建遗传图谱等等,因此该技术可广泛用于动植物体分类学和遗传学,功能基因组学,蛋白质组学等研究.Hoth等[4]用MPSS克隆出细胞分裂素上调基因823和下调基因917.Christensen等[5]用MPSS 分析了单叶ROB基因家族的保守亚群和发育调节基因.Jongeneel等[2]用MPSS分析了HB4a(正常乳腺上皮细胞)和H CT2116(结肠腺癌细胞)两株细胞的转录子特征.每株细胞获得了107个序列标签,建立了一个基因表达短标签的分析平台.每个细胞株单拷贝表达基因数量为10000~15000之间.两株细胞中绝大多数转录子都可以在已知基因和多聚A变异体上找到对应的位置,从表达序列标签上克隆的基因,大约8000个两株细胞能公共表达,而6000个分别特异表达.Potschka等[6]以大鼠颞叶癫痫模型为研究对象,采用MPSS技术克隆大鼠癫痫特异表达基因,结果提示,在海马回中有263个特异表达基因,其中,最有意义的是知觉早期基因Homer1A,其功能与谷氨酸受体修饰有关,在癫痫大鼠海马回中过表达.Hoth等[7]在研究基因组ABA(phytohormone abscisic acid,ABA)反应基因在拟南芥(Ara bidopsis thalia na)和abi121突变株中的表达差异时,应用了MPSS技术,结果提示,在ABA处理的野生株中发现的1 354个上调和下调基因,在这些ABA反应基因中大多数编码信号传导组分.在abi121突变的对ABA无反应的对照组中,8415%的克隆基因表达减弱,619%基因表达消失,而816%的基因仍然有一定的调节作用.因此作者认为与其他几种基因表达分析方法相比较,MPSS具有高度特异性和敏感性,是在拟南芥野生株中克隆到大量ABA反应基因的主要手段.4MPSS技术的特点目前,应用于基因克隆的技术有DNA芯片(DNA microarrays)、基因表达系列分析(serial analysis of gene expression,SAGE)、定量PCR (quantitative RT2PCR)、差异显示RT2PCR (differential2display RT2PCR)、抑制消减杂交(subtractive suppress hybridization,SSH)和大规模平行测序(massively parallel signature sequencing, MPSS)等方法.每一种方法,都有自身的优点和不足.考察每一种方法的优劣,应该从该技术的特异性、敏感性、可信性、技术难度和运作成本等方面考虑.尤其是建立的基因表达数据库是否有利于下一步生物信息学的分析.基于序列分析的技术有基因表达系列分析、大规模平行测序(MPSS)和表达标签序列分析等方法.相对而言,基于杂交技术的DDRT2PCR、SSH 和RNA点杂交等技术具有可靠、前期操作简单、通量低、后期生物信息学处理较容易、实验成本低等特点.而基于序列分析的SAGE、EST和MPSS 等具有自动化程度高、通量大、生物信息学处理困难和运作成本高等特点.所以在整体基因和基因组分析中很难说那一种技术占有绝对的优势,研究者可以根据各自的实验目标选择一种适当的方法.MPSS分析系统对基因表达分析过程,诸如微球体阵列的制作,反应液的供排、各种反应条件的控制,图像的处理和数据的分析已经完全自动化,能够在很小的一块微球体阵列上,通过常规的分子生物学手段:连接、酶切、萤光成像等简单几个步骤就可以同时分析数以万计的基因数目,这大大超过了基因的EST、RNAse保护分析、DDRT RT2 PCR分析(这几种方法一次只能检测很少的基因表达情况),甚至超过了SAGE的一次性分析能力,同时不需要耗费时间做大量的PCR实验,不需要对cDNA模板做特殊的处理,也不用对探针序列进行提前选择,因此MPSS技术分析样品基因表达的操作简便,速度快,时间短.更为重要的是MPSS可根据荧光信号对基因表达水平做定量的分析,能提供基因末端序列信息,这是MPSS与RT2 PCR、SAGE等常规方法不同之处.另外,MPSS 对基因末端序列与常规测序不同的是,它不需要进行基因片段的分离、克隆再逐一测序,而是具备了cDNA芯片、cDNA微阵列荧光分析法直接读出序列的优点,可同时获得大量cDNA末端序列,从而简化了测序过程,这符合后基因组时代基因功能分析的高通量、自动化、微型化的要求[8,9].MPSS与基因芯片技术相比较,有下列优点: a1可以避免在cDNA芯片技术中出现的高度同源序列的交叉杂交.因此可以保证基因的高度特异性.9712%的标签中,17bp长度的标签已经足够鉴别基因组中相关的基因.如此高的鉴别率, cDNA芯片技术很难达到;b1MPSS的高分辨率可以检测很低表达水平的基因;c1MPSS技术检测基因不需要预先知道该基因的相关信息,可以应用于任何生物体的基因表达检测,而cDNA芯片技术需要将已知基因片段作为探针固定在片基上[10].当然该技术同DNA芯片技术一样,需要较为昂贵的硬件和相配套的软件协同运做.目前国内外的相关应用报道较少,因此目前还亟需降低仪器检测的成本,加强推广和普及工作.总之,MPSS技术是基因表达定性和定量研究的一种有效工具,它能在短时间内检测细胞或组织内全部基因的表达情况,并能通过与已知基因数据库进行比对,定量显示出基因在细胞或组织内的表达状况,是功能基因组研究和基因发现的有力工具,对于致病基因的识别、药物在组织中的药效分析、揭示基因与疾病之间的传导通路.揭示基因在疾病中的作用都是非常有价值的,而这些与疾病相关的基因将是非常有价值的药靶.随着MPSS技术的不断发展,相信该技术必将在各种生物基因组功能方面及其相关领域研究中发挥巨大的作用.参考文献1Brenner S,Johnson M,Bridgham J,et al.Gene expression analysis by massively parallel signature sequencing(MPSS)on microbead arrays.Nat B iotechnol,2000,18(6):630~6342Jongeneel C V,Iseli C,Stevenson B J,et prehensive sampling of gen e expression in human cell li nes with massivelyparallel signature sequencing.Proc Natl Acad Sci USA,2003,100(8):4702~47053J eannette R,Eddy B,Jingzhong L,et al.Massively parallel signature sequencing(MPSS)as a tool for in2depth quanti tative gene ex pres sion profiling in al l organisms.Briefings i n Functional Genomics and Protemics,2002,1(1):95~1044Hoth S,Ikeda Y,Morgante M,et al.Moni toring genome2wide changes in gen e expression in response to endogenous cytokinin reveals targets i n Arabidop s is thaliana.FEBS Lett,2003,554(3):373~3805Christensen T M,Vej lupkova Z,Sharma Y K,et al.Conserved subgroups and developmental regulation in the monocot rop gene family.Plant Physiol,2003,133(4):1791~18086Potschka H,Krupp E,Ebert U,et al.Kindling2inducedoverexpressi on of hom er1A and i ts functional i mplications for epileptogenesi s.Eur J Neurosci,2002,16(11):2157~21657Hoth S,Morgante M,Sanchez J P,et al.Genom e2wide gene expression profiling in Arabidop s is thaliana reveals new targets of abscisic acid and largely impaired gene regulation in the abi121 mutant.J Cell Sci,2002,115(24):4891~49008Pollock J D.Gene expression profili ng:methodological challenges, results,and prospects for addiction research.Chem Phys Lipids, 2002,121(1~2):241~569Brenner S,Williams S R,Vermaas E H,et al.In vitro cloni ng of complex mixtures of DNA on microbeads:physical separation of differentially ex pres sed cDNAs.Proc Natl Acad Sci USA,2000, 97(4):1665~167010Blohm D H,Guiseppi2Elie A.New developments in microarray technology.Curr Opin B iotechnol,2001,12(1):41~47A Novel Gene Identification Approach:Massively ParallelSignature SequencingCHEN Jie*(C a ncer T reatmen t Center,Xin qiao Hos p ital,The Third Military Medical University,Chongqing400037,China)Abstr act Massively parallel signature sequencing,MPSS,is an open platform that reveals the expression level of virtually all genes expressed in a sample by counting the number of individual mRNA molecules produced from each gene.The MPSS process involves cloning each mRNA molecule onto the surface of a5L m bead.T he DNA combitag sequence is attached to a fragment of cDNA.The cDNA library is hybridized to beads.After hybridization,each of the beads displays amplified copies of one and only one starting mRNA molecule.MPSS has a routine sensitivity of a few molecules of mRNA per cell and the results are in a digital format that simplifies data management and analysis.MPSS results will be particularly useful for generating the type of complete data sets that will help to identify the functionally important genes in the sample of interest.Key words gene,expression analysis,massively parallel signature sequencing(MPSS)*Corresponding author.T el:86223268755646,E2mail:jazz0331@Received:February10,2004Accepted:March28,2004。