Nature 471, 83(2011)
- 格式:pdf
- 大小:472.65 KB
- 文档页数:6
INSTRUCTIONSTo provide an example of peer-editing, below is a student submission that has been edited by the instructor and scored using the grading rubric.---------------------------------------------------------------------------------------------------------------------------- FIRST WE PRESENT THE ORIGINAL STUDENT SUBMISSIONImmortality is an alluring concept. Some scientists believe that it will be possible to "upload" one's mind by recreating the circuitry of the brain in silico. Before we can upload brains, we first must reverse-engineer neural circuitry and begin by creating a circuit map.Electron microscopy provides the only possible method through which we're able to clearly visualize synapses and follow neural processes. Volumetric reconstruction of neural tissue using electron microscopic resolution is necessary to map neural circuitry. Focused ion-beam scanning electron microscopy (Knott et al. 2008) gives excellent quality images, but fails to process tissue pieces larger than 40 microns in diameter. Thin sections imaged with transmission electron microscopy succumb to the damaging effects of manual handling and section distortion. Thus, it's most prudent to use a method that images the block-face directly and is capable of imaging large block-faces. Serial block-face scanning electron microscopy (SBEM; Denk and Horstmann 2004) provides both necessary components.Using SBEM, Dr. Kevin Briggman and associates (Briggman, Helmstaedter, and Denk 2011) recently mapped the connections between starburst amacrine cells and bipolar ganglion cells in the mouse retina to better understand the wiring specificity, elucidating the cellular circuit between starburst amacrine cells and direction-selective bipolar retinal ganglion cells.By staining a 200-micron piece of retina, which contained the entire arborization field of a starburst amacrine cell with an extracellular stain that could outline cells and neural processes in SBEM, Briggman was then able to reconstruct neural processes. Based on morphology, he assessed the locations and sizes of putative synapses on these processes.Unfortunately, synapses were invisible within the data because the tissue was only stained with an extracellular, electron-dense stain and some synaptic features are intracellular. In an effort to address this ambiguity, Briggman then stained a second piece of tissue where synapse-associated features werestained and visible. He then correlated the extracellular morphology found at synapses between the first and second pieces of tissue.This is the first example of relatively large neural circuit reconstruction and it solved controversy about exactly how starburst amacrine cells are wired to be directionally-selective. The next steps in whole-brain circuit reconstruction will be large sample preparation (Mikula, Binding, and Denk 2012) and imaging on a whole-brain SBEM for mapping the whole mouse brain as a first mammalian complete connectome (Seung 2011).ReferencesKnott, Graham,et al. ―Serial Section Scanning Electron Microscopy of Adult Brain Tissue Using Focused Ion Beam Milling.‖ The Journal of Neuroscience 28, no. 12 (March 19, 2008): 2959–2964.Denk, Winfried, and Heinz Horstmann. ―Serial Block-Face Scanning Electron Microscopy to Reconstruct Three-Dimensional Tissue Nanostructure.‖ PLoS Biology 2, no. 11 (November 2004).Briggman, Kevin L., Moritz Helmstaedter, and Winfried Denk. ―Wiring Specificity in the Direction-selectivity Circ uit of the Retina.‖ Nature 471, no. 7337 (March 10, 2011): 183–188.Mikula, Shawn, Jonas Binding, and Winfried Denk. ―Staining and Embedding the Whole Mouse Brain for Electron Microscopy.‖ Nature Methods In press (2012).Seung, H. Sebastian. ―Neuroscience:Towards Functional Connectomics.‖ Nature 471, no. 7337 (March 10, 2011): 170–172.SECOND WE PRESENT THE REVIEWD STUDENT SUBMISSION----------------------------------------------------------------------------------------------------------------------------INSTRUCTOR SCORES ON RUBRIC✓Clarity: 2/3✓Concision: 2/3✓Style: 2/3✓Organization: 3/3✓Focus: 3/3✓Total: 12/15---------------------------------------------------------------------------------------------------------------------------- REVIEWING LEGENDThis is an insertion.This is a deletion.[This is a comment.]---------------------------------------------------------------------------------------------------------INSTRUCTOR EDITSImmortality is an alluring concept. Some scientists believe that it will be possible to "upload" one's mind by recreating the circuitry of the brain in silico. Before we can upload brains, we first must reverse-engineer neural circuitry and begin by creating a circuit map.In the first example of a relatively large neural circuit reconstruction, Dr. Kevin Briggman and colleagues (Briggman, Helmstaedter, and Denk 2011) recently mapped the connections between key neurons—starburst amacrine cells and bipolar ganglion cells—in the mouse retina. The work solves a long-standing controversy about exactly how starburst amacrine cells are wired to be directionally-selective [can you say this more plainly?].Electron microscopy provides the only possible method through which we're able to clearly Briggman's team used serial block-face electron microscopy (SBEM; Denk and Horstmann 2004) to visualize synapses and follow neural processes. Volumetric reconstruction of neural tissue using e E lectron microscopic resolution is necessary to map neural circuitry. Focused ion-beam scanning electron microscopy (Knott et al. 2008) gives excellent quality images, but fails to process tissue pieces larger than 40 microns in diameter;. Thin sections imaged with and transmission electron microscopy requires ultra-thin samples that often succumb to the damaging effects of manual handling and section distortion. Thus, it's most prudent to use a method that images the block-face directly and is capable of imaginglarge block-faces. Serial block-face scanning electron microscopy (SBEM; Denk and Horstmann 2004) provides both necessary components.Using SBEM, Dr. Kevin Briggman and associates (Briggman, Helmstaedter, and Denk 2011) recently mapped the connections between starburst amacrine cells and bipolar ganglion cells in the mouse retina to better understand the wiring specificity, elucidating the cellular circuit between starburst amacrine cells and direction-selective bipolar retinal ganglion cells.Briggman's team treated By staining a 200-micron piece of retina, which contained including the entire arborization field of a starburst amacrine cell with an extracellular stain that could outline cells and neural processes in SBEM, Briggman was then able to reconstruct neural processes. Due to their many intracellular features, Briggman's team could not directly visualize synapses. But, B b ased on morphology, t he y assessed inferred the locations and sizes of putative synapses on these processes. They also Unfortunately, synapses were invisible within the data because the tissue was only stained with an extracellular, electron-dense stain and some synaptic features are intracellular. In an effort to address this ambiguity, Briggman then stained a second piece of tissue where synapse-associated features were stained and visible with an intracellular stain that revealed synapse-associated features,. He then and correlated the extracellular morphology found at synapse s maps between the first and second pieces of tissue.ADD: PARAGRAPH ABOUT THE CONTROVERSY THAT THEY SOLVED!This is the first example of relatively large neural circuit reconstruction and it solved controversy about exactly how starburst amacrine cells are wired to be directionally-selective. The next steps in whole-brain circuit reconstruction will be to prepare, image, and map large sample preparation (Mikula, Binding, and Denk 2012) and imaging on a whole mouse -brain. This would represent the SBEM for mapping the whole mouse brain as a first mammalian complete connectome (Seung 2011) and would be the closest anyone has ever come to immortalizing a mammalian brain.References:Knott, Graham,et al. ―Serial Section Scanning Electron Microscopy of Adult Brain Tissue Using Focused Ion Beam Milling.‖ The Journal of Neuroscience 28, no. 12 (March 19, 2008): 2959–2964.Denk, Winfried, and Heinz Horstmann. ―Serial Block-Face Scanning Electron Microscopy to Reconstruct Three-Dimensional Tissue Nanostructure.‖ PLoS Biology 2, no. 11 (November 2004).Briggman, Kevin L., Moritz Helmstaedter, and Winfried Denk. ―Wiring Specificity in the Direction-selectivity Circuit of the Retina.‖ Nature 471, no. 7337 (March 10, 2011): 183–188.Mikula, Shawn, Jonas Binding, and Winfried Denk. ―Staining and Embedding the Whole Mouse Brain for Electron Microscopy.‖ Nature Methods In press (2012).Seung, H. Sebastian. ―Neuroscience: Towards Functional Connectomics.‖ Nature 471, no. 7337 (March 10, 2011): 170–172.。
本科实验报告课程名称:现代文献检索与利用实验项目:各种类型中外文文献检索实验地点:专业班级:学号:学生姓名:ALXB指导教师:年月日实验1:各种类型中外文文献检索(4学时)目的:1.学会电子图书检索。
2.学会中文学位论文检索。
3.学会中文会议论文检索。
4.学会中文期刊论文检索。
5.学会国内重要专业人士、重要研究机构、重要文献、重要期刊等信息检索。
6.学会标准文献检索。
7. 学会科技成果检索。
8. 学会外文期刊论文检索。
内容:1.自选检索课题。
2.分析检索课题,确定检索标识,编写提问式。
3.利用超星电子图书(免费阅览室) 、中国知网数字出版平台、国家科技图书文献中心等相关数据库。
4. 在相关检索提问框中输入提问式实施检索,筛选命中文献,选择检索结果输出格式并输出结果。
如有必要可反复修改检索提问式优化检索结果。
5.记录检索过程,完成检索报告并提交。
要求:1.电子图书选择超星电子图书(免费阅览室)或其他电子书全文数据库中的1种数据库进行电子图书检索:数据库名称___超星百万册电子图书_________________________检索策略(表达式)__荷马史诗(书名)____________________命中文献数___4_________选取其中1条文献题录:书名:《江格尔》与《荷马史诗》比较研究作者姓名:王卫华出版时间:2007总页数:256章(或节)数:共5章参考文献数:122.中文学位论文选择中国知网数字出版平台——中国优秀硕士学位论文全文数据库、中国博士学位论文全文数据库、国家科技图书文献中心——中文学位论文等数据库中的1种数据库进行学位论文检索:数据库名称___中国博士学位论文全文数据库___________________检索年限_____2010——2013____________________________检索策略(表达式)__中国高速铁路对区域经济发展影响研究(主题)__________命中文献数___1______选取其中1条文献题录:【文内图片】论文题目:中国高速铁路对区域经济发展影响研究作者姓名:王凤学导师姓名:朱显平授予学位级别:博士作者专业名称:区域经济学位授予单位:吉林大学授予学位时间:2012论文总页数:1693.会议论文选择中国知网数字出版平台——中国重要会议论文全文数据库、国家科技图书文献中心——中文会议论文等数据库中的1种数据库进行会议论文检索:数据库名称____中国知网数字出版平台__________________检索年限_____2010-1-1——2013-7-1_________________检索策略(表达式)__大学生就业形势分析(主题)________________ 命中文献数______1_____选取其中1条文献题录:论文题目:沈阳市大学生就业形势分析与对策探讨作者姓名:姚天冲第一作者单位:东北大学会议名称:第七届沈阳科学学术年会暨浑南高新技术产业发展论坛会议地点:中国辽宁沈阳主办单位:中共沈阳市委员会、沈阳市人民政府出处(会议录名称、出版时间、论文在会议录中的页码范围):科技创新与产业发展(B卷)——第七届沈阳科学学术年会暨浑南高新技术产业发展论坛文集4.中文期刊论文选择中国知网数字出版平台——中国学术期刊网络出版总库、国家科技图书文献中心——中文期刊等数据库中的1种数据库进行中文电子期刊检索:数据库名称___中国学术期刊全文数据库(CNKI远程)__________检索年限_________2010——2013_____________检索策略(表达式)__中国经济改革的反思(主题)_____________命中文献数_____240____选取其中1条文献题录:论文题目:改革开放以来中国海洋经济研究的回顾与反思作者姓名:赵晔第一作者单位:中共辽宁省委党校出处(出版物名称、年、卷、期、页码范围):党政干部学刊2011年第3期5.国内重要专业人士、重要研究机构、重要文献、重要期刊等信息利用中国知网数字出版平台——中国学术期刊网络出版总库进行相关信息检索:数据库名称_中国知网数字出版平台——中国学术期刊网络出版总库__检索年限___2010——2013________________检索策略(表达式)____中国国家安全(主题)______命中文献数___143____选取其中1条文献题录:(1)该领域重要作者(收录文献总数位于前三名):第一名:张仕荣收录文献数量:3作者姓名:张仕荣作者单位:中共中央党校第二名:郭建军收录文献数量:2作者姓名:郭建军作者单位:西安政治学院第三名:黄日涵收录文献数量:2作者姓名:黄日涵作者单位:国际关系学院(2)该领域重要机构(收录文献总数位于前三名):第一名:国际关系学院收录文献数量:8单位名称中国人民大学:国际关系学院第二名:解放军国防大学收录文献数量:6单位名称:解放军国防大学第三名:中共中央党校收录文献数量:5单位名称:中共中央党校(3)该领域重要文献(文献被引频次位于前三名):第一名:文献题目:在变动的世界中谋求国家安全作者姓名:唐永胜文献来源:现代国际关系发表时间:2011年02期被引频次:2作者单位名称:国防大学战略研究所第二名:文献题目:全面认识当前的中国国家安全环境作者姓名:沈丁立文献来源:探索与争鸣发表时间:2011年4月被引频次:2作者单位名称:复旦大学国际问题研究院第三名:文献题目:我国国家安全观的重要转变作者姓名:郭秀清文献来源:理论探索发表时间:2011年05期被引频次:1作者单位名称:解放军南京政治学院上海分院(4)该领域重要中文期刊(收录文献总数位于前三名):第一名:收录文献数量:19期刊名称:国际安全研究第二名:收录文献数量:5期刊名称:江南社会学院学报第三名:收录文献数量:4期刊名称:世界知识6.标准文献选择国家科技图书文献中心——标准检索、标准网——标准目录高级查询等数据库中的1种数据库进行标准检索:数据库名称_______标准网——标准目录高级查询_____________检索年限________2000--2012____________检索策略(表达式)_____轻工行业__________________命中文献数____31_____选取其中1条文献题录:标准名称:皮鞋外底标准编号: QB/T 2956-2008起草单位或起草人:中国皮革和制鞋工业研究院、温州小林鞋材有限公司等实施日期: 2008-09-01发布日期: 2008-03-12分类号: Y78标准文献页数:7.科技成果选择国家科技成果数据库国家科技成果网——成果高级检索、中国知网数字出版平台——国家科技成果数据库、国家科技图书文献中心——中国科技成果等数据库中的1种数据库进行科技成果检索:数据库名称___国家科技成果数据库________检索年限____2000--2013_________检索策略(表达式)_____车辆安全(主题)___________________________ 命中文献数___8_________选取其中1条文献题录:成果名称:移动车辆安全生产监测系统分类号:580.20完成单位:解放军信息工程大学成果公布日期:20088.外文期刊论文选择国家科技图书文献中心——西文期刊检索、中国知网数字出版平台——德国SPRINGER公司期刊数据库、Emerald管理学、经济学、工程学数据库等数据库中的1种数据库进行外文电子期刊检索:数据库名称_____国家科技图书文献中心——西文期刊检索________检索年限______2010-01-01~2013-01-01_____检索策略(表达式)___天线_____________________命中文献数____23____选取其中1条文献题录:论文题目:Coupled quantized mechanical oscillators作者姓名:K. R. Brown;C. Ospelkaus;Y. Colombe;A. C. Wilson;D. Leibfried;D. J. Wineland;出处(出版物名称、年、卷、期、页码范围):Nature【ISSN】:0028-0836【出版年】:2011【卷】:471【期】:Mar.10 TN.7337本科实验报告课程名称:现代文献检索与利用实验项目:利用搜索引擎及网上免费资源检索相关课题的文献实验地点:北区电机馆三层跨越机房专业班级:信息1002 学号:2010001236学生姓名:沈成业指导教师:王一平2013年 5 月10 日实验2:利用搜索引擎及网上免费资源检索相关课题的文献(2学时)目的:1.学会搜索引擎高级检索的技巧2.学会网上免费资源的使用方法内容:1.自选检索课题。
Caspase和BCL-2两大家族介绍汇总|最新+最全,总有一天会用到原创2018-06-21 订阅号APExBIO看到“caspase”和“BCL-2”这两个词是不是觉得很眼熟?这两个家族的研究历史悠久,有的人即使不研究这个也或多或少听说过它们;有的人虽然不了解,但是知道它们跟凋亡相关。
这两大家族的成员有很多,搞不清楚的可以了解一下。
(一)Caspases家族Caspase,这是个缩写,英文全称是cysteine-dependent aspartate-specifc proteases,中文名称称为胱天蛋白酶或半胱天冬酶。
Caspases家族成员是一组存在于胞质溶胶中的半胱氨酸蛋白酶。
利用半胱氨酸(Cys)侧链切割含有天冬氨酸(Asp)的多肽底物,caspases可以选择性地对多种信号转导途径中的蛋白质进行高效切割。
Caspases调节多种生物过程,如程序性细胞死亡,炎症,细胞分化、增殖和运动。
启动者和效应者的激活Caspases的功能基于结构和功能,哺乳动物caspases可以分为三大类:(1)促凋亡caspases。
包括caspase-2,8,9,10,3,6,7。
它们以级联的方式切割一系列胞内蛋白,最终导致细胞凋亡。
它们被分为两派,启动者(initiators)和效应者(effectors)。
启动者参与细胞内在(caspase-9)或细胞外在(caspase -8和-10)凋亡途径。
效应者切割数百种细胞蛋白质。
然而,一些促凋亡caspases在诸如淋巴细胞增殖、细胞运动和组织入侵的过程中也具有非凋亡作用。
(2)促炎性caspases。
包括caspase-1,4,5,11,12,13。
在先天性免疫应答激活期间,促炎性caspases介导特异性细胞因子(cytokines)的成熟,但也可能参与一种称为pyroptosis(焦亡)的细胞死亡形式。
(3)角化细胞分化。
Caspase-14参与角化细胞的分化,但不会在炎症或细胞凋亡中发挥重要作用。
Sharpin蛋白在寻常型银屑病皮损内的表达及其与PASI评分关系的研究袁立燕;王宇;程庆;林尔艺;杨斌【摘要】目的:探讨Sharpin蛋白在寻常型银屑病皮损内的表达及其与PASI评分的关系.方法:采用实时荧光定量PCR及免疫组织化学方法检测Sharpin在寻常型银屑病及正常皮肤内的表达,并探讨其与临床病理特征的关系.结果:Sharpin mRNA 在寻常型银屑病皮损内较正常皮肤内表达明显升高,两者差异有统计学意义(t=0.03, P<0.05);免疫组化结果提示Sharpin蛋白在寻常型银屑病皮损内高表达,且在寻常型银屑病皮损内的阳性表达率高于正常皮肤组织,平均染色得分亦高于正常皮肤(P 值均<0.05).此外,Sharpin蛋白表达与治疗前寻常型银屑病PASI评分呈正相关(r=0.83, P<0.05).结论:Sharpin蛋白可能参与了银屑病发病机制,对提示银屑病病情及预后可能具有一定的意义.【期刊名称】《皮肤性病诊疗学杂志》【年(卷),期】2017(024)003【总页数】4页(P161-164)【关键词】Sharpin蛋白;寻常型银屑病;PASI评分【作者】袁立燕;王宇;程庆;林尔艺;杨斌【作者单位】南方医科大学皮肤病医院;广东省皮肤病医院,广东广州 510091;南方医科大学皮肤病医院;广东省皮肤病医院,广东广州 510091;南方医科大学皮肤病医院;广东省皮肤病医院,广东广州 510091;南方医科大学皮肤病医院;广东省皮肤病医院,广东广州 510091;南方医科大学皮肤病医院;广东省皮肤病医院,广东广州510091【正文语种】中文【中图分类】R758.63寻常型银屑病(psoriasis vulgaris)是一种常见并易复发的慢性炎症性皮肤病,近年来其发病率不断上升。
由于本病发病率高、易于复发、病程长,对患者的身体及心理影响极大[1-2],明确银屑病病因及发病机制对银屑病治疗显得尤为重要。
基于大量ChIP数据集的果蝇顺式调控模块的从头预测李婷;张少强【摘要】通过整合果蝇已有的ChIP数据集,采用模体发现算法FisherNet及高性能并行的模体聚类算法CLIMP对果蝇的顺式调控模块进行从头预测.与已知的顺式调控模块进行比对分析,结果表明该方法预测结果覆盖了数据集中已知顺式调控模块的82.93%,证明该方法具有一定的普适性.与较新的DePCRM算法进行比较,结果表明本算法在从头预测顺式调控模块上速度更快、精度更高.【期刊名称】《天津师范大学学报(自然科学版)》【年(卷),期】2018(038)002【总页数】4页(P73-76)【关键词】ChIP数据集;果蝇;顺式调控模块;模体;FisherNet;CLIMP【作者】李婷;张少强【作者单位】天津师范大学计算机与信息工程学院,天津300387;天津师范大学计算机与信息工程学院,天津300387【正文语种】中文【中图分类】Q78随着新技术的快速发展,基因组测序的成本下降,特别是转录因子的ChIP-seq技术的广泛使用[1],使得很多后生动物和植物产生了海量的ChIP-seq数据集.尽管目前已有大量的预测顺式调控元件和模块的工具,但在大型基因组中,整合指数级增长的ChIP数据集,并在全基因组范围预测顺式调控元件和模块,却一直是具有挑战性的计算问题[1-4].一定数量的转录因子常常组合起来,共同调控不同细胞类型、组织、发育阶段和生理条件下的不同基因[5],与这些共同调控的转录因子相结合的非编码DNA位点(即顺式调控元件)构成了其顺式调控模块.大量的ChIP数据集中包含着一定的模块组合信息,这些信息是由不同转录因子共同转录调控而形成的[6-7].因此,利用不同细胞类型、组织、发育阶段和生理条件下的不同转录因子的大量ChIP数据集,就有可能通过对模体进行整合以寻找共现模式,进而对某种真核生物全基因组范围顺式调控模块进行从头预测.本文基于果蝇已有的ChIP数据集,采用模体发现算法FisherNet及高性能并行的模体聚类算法CLIMP对果蝇的顺式调控模块进行从头预测,并与较新的DePCRM算法[8]进行了比较.本文研究方法的流程如图1所示.图1 顺式调控模块预测流程图Fig.1 Flow chart of predicting CRMs1 数据来源与预处理1.1 数据来源由于果蝇常被用来研究动物基因的转录调控,大量的顺式调控元件和模块已被实验验证,而且在过去的几年中该生物已经产生了大量的ChIP-chip和ChIP-seq数据,因此本文使用果蝇作为模式生物评估算法.为此,整理了来自56个不同转录因子的168个ChIP-chip和ChIP-seq数据集,这些数据集包含不同的发育阶段(胚胎、幼虫期1~3、蛹和雌雄成虫)和不同实验条件下(热休克等)的结果,其中:42个ChIP-chip和42 个 ChIP-seq 数据集来自 modENCODE 项目[6,9],38个ChIP-chip数据集来自Berkeley果蝇转录网络项目(BDTNP)[10],46个ChIP-chip数据集来自文献[8].1.2 数据预处理利用peak-calling工具[11]查找ChIP数据中结合峰的序列,这些序列包含丰富的对应转录因子的顺式调控元件.将较短的结合峰从两端延伸到3 000个碱基长的序列(这个长度与典型顺式调控模块的长度相当),使得结合最高峰正好位于序列中部.除了ChIP实验的转录因子的顺式调控元件外,扩展的结合峰更可能包含辅助调控转录因子(在顺式调控模块中共同作用的转录因子)的顺式调控元件.2 算法步骤数据预处理后的具体算法流程见图2.图2 数据预处理后的具体算法流程图Fig.2 Flow chart of detailed algorithm after data preprocessing2.1 构建模体相似多部图对于每组延伸后的结合峰序列数据集,运用模体发现工具FisherNet算法[12]寻找大量的假定模体.对每个数据集输出前k个最优的模体,见图2(a),k默认值为20. 对于预处理的每个数据集输出的前20个最优模体,以每个模体做为顶点,考虑到2个模体的频率矩阵和位置权重矩阵,本文使用位置信息含量相似度量法SPIC(similarity with position information contents)[13]计算不同数据集间模体的相似性(阈值为0.7),SPIC度量法已被证实优于其他度量公式[13],若2个模体的相似度大于阈值,则连接2个模体,从而构建模体相似多部图,见图2(b).数据集内部模体之间不连边,只计算不同数据集间模体的两两相似性.构建模体相似多部图后,运用双向最佳匹配BDBM(bi-directional best match)算法寻找模体配对,见图2(c),其中,若一个模体与另外一个数据集中多个模体都最相似,则选取靠前的模体进行配对.2.2 模体相似多部图的CLIMP聚类对于配对后的模体相似多部图,运用CLIMP算法[14]进行团(即每对顶点均连接的子图)融合聚类,并形成聚类编号,见图2(d).每个聚类中高度相似的模体分别来自于不同的数据集,这些相似的模体可能是同一转录因子在不同数据集的同一模体.因为同一转录因子可能在多个ChIP数据集中作为辅调控因子或主调控因子出现,因此对应的模体会在多个数据集中被反复识别.2.3 构建模体共现多部图对得到的团融合聚类构建模体共现多部图,计算不同聚类中属于相同数据集的每对模体的共现分数.对于数据集Md中的模体Md(i)和Md(j),共现分数Sc为其中:|Md(i)|和|Md(j)|分别为模体Md(i)和Md(j)含有顺式调控元件结合峰的数量;o(Md(i),Md(j))代表这2个模体中都含有的顺式调控元件的结合峰的数量.若共现分数不小于阈值α,则视其为共现模体,将之连接,最终形成模体共现多部图,见图2(e).基于REDfly数据库[15]已有顺式调控模块的训练,阈值α的取值为0.7. 2.4 模体共现多部图的CLIMP聚类对模体共现多部图进行CLIMP聚类,得到模块类.聚类结果即为顺式调控模块,并按下式由小到大进行排序其中:M为聚类后的模块;|M|为M中含有模体的数量;m为模块中的模体;i(m)为模体m在团融合聚类后的聚类编号.SM的值越小,则顺式调控模块M就越可能是真实的.将少于2个模体的聚类舍弃.见图2(f).3 实验结果结合峰长度分布密度见图3.图中,虚线为结合峰长度分布密度,实线为结合峰长度的累积分布,可见结合峰的大部分长度约为1 000,有0.62%的结合峰长度大于5 000,由于其质量不高,所以不使用这部分数据.由FisherNet查找的模体的信息含量分布密度见图4.由图4可见,162个数据集中的模体(有6个数据集包含模体少于2个,被丢弃)具有较高信息含量.在各个数据集输出的前20个模体中,包含99个已知模体,并且被FisherNet程序优先识别.图3 结合峰长度分布密度Fig.3 Distribution density of binding peak length图4 模体信息含量分布密度Fig.4 Distribution density of information content of motifs将本算法(A)和DePCRM算法(B)应用于162个ChIP数据集,模体和顺式调控模块预测结果见表1.其中,已知顺式调控模块数量为1 330个(REDfly数据库).若一个已知的顺式调控模块与预测的顺式调控模块有至少一半长度是重叠的,则将其视为全覆盖.表1 本研究算法(A)和DePCRM算法(B)预测结果Tab.1 Predictions of algorithms of this research(A)and DePCRM(B)Percent of known CRM containing A B A B Motif finding 3 240 017 890 1 214 1 061 91.28%79.77%CRM finding 1 346 115 932 1 103 0 947 82.93% 71.20%Results A B Number of known CRM containing由表1可见,在模体发现中,本算法输出每个数据集中最优的模体,得到了3 240个模体,其中包含1 214个已知的顺式调控模块(占已知数量的91.28%);而DePCRM算法由于并未考虑模体的优劣,因此输出模体数量较多,为17890个,其中包含1 061个已知的顺式调控模块(占已知数量的79.77%).在顺式调控模块预测中,本算法得到的1 346个模块中有1 103个已知模块(占已知数量的82.93%);而DePCRM算法得到的115 932个模块中有947个已知模块(占已知数量的71.20%).以上数据说明,本算法在顺式调控模块的预测中较DePCRM有更高的覆盖率和敏感性.顺式调控模块长度和相邻顺式调控元件间距离分布密度见图 5(a)和(b).由图 5(a)可见,本算法预测的顺式调控模块比已知的顺式调控模块的长度短.由图5(b)可见,预测结果的相邻顺式调控元件间距离与已知的顺式调控元件比较相似,一部分距离比已知的短.这表明可能遗漏了顺式调控模块中的某些顺式调控元件,尤其是两端的,这可能是由于ChIP数据没有足够多样化的信息.图5 顺式调控模块长度预测结果Fig.5 Prediction results of CRM length4 结论本文利用大量的ChIP数据集实现了全基因组范围的顺式调控模块的从头预测.通过识别最优表达的、组合的模体,完成了对顺式调控模块的预测.预测结果覆盖了数据集中已知顺式调控模块的82.93%.这些预测的顺式调控模块比随机选择的序列更保守,更有可能具有调控功能.与已有的DePCRM算法相比,本文采用了2个多部图和2次CLIMP聚类,比DePCRM算法更简便快速.本算法不采用共现对的概念,克服了模体以偶数对出现的缺点.当有足够多数量的、不同种类的其他真核生物ChIP数据集时,本算法可推广到该类真核生物,用来预测其顺式调控模块.[1]PEPKE S,WOLD B,MORTAZAVI putation for ChIP-seq and RNA-seq studies[J].Nature Methods,2009,6(11):22-32.[2]PARK P J.ChIP-seq:Advantages and challenges of a maturing technology[J].Nature Reviews Genetics,2009,10(10):669-680.[3]HAWKINS R D,HON G C,REN B.Next-generation genomics:An integrativeapproach[J].NatureReviewsGenetics,2010,11(7):476-486. [4]LAIRD P W.Principles and challenges of genome-wide DNA methylation analysis[J].Nature Reviews Genetics,2010,11(3):191-203.[5]MASTON G A,EVANS S K,GREEN M R.Transcriptional regulatory elements in the human genome[J].Annual Review of Genomics and Human Genetics,2006,7(1):29-59.[6]NEGRE N,BROWN C D,MA L J,et al.A cis-regulatory map of the drosophila genome[J].Nature,2011,471(7339):527-531.[7]GERSTEIN M B,LU Z J,NOSTRAND E L V,et al.Integrative analysis of the Caenorhabditis elegans genome by the modENCODE project[J].Science,2010,330(6012):1775-1786.[8]MENG N,TABARI E S,SU Z C.De novo prediction of cis-regulatory elements and modules through integrative analysis of a large number of ChIP datasets[J].BMC Genomics,2014,15(1):1047-1066.[9]CONSORTIUM T M,ROY S,ERNST J,et al.Identification of functional elements and regulatory circuits by Drosophila modENCODE[J].Science,2010,330(6012):1787-1797.[10]LI X Y,MACARTHUR S,BOURGON R,et al.Transcription factors bind thousands of active and inactive regions in the Drosophilablastoderm[J].Plos Biology,2008,6(2):365-388.[11]ZHANG Y,LIU T,MEYER C A,et al.Model-based analysis of ChIP-seq(MACS)[J].Genome Biology,2008,9(9),DOI:10.1186/gb-2008-9-9-r137.[12]张志红.基于ChIP-seq数据集的顺式调控模块发现算法研究[D].天津:天津师范大学,2017.ZHANG Z H.Algorithm for Finding Cis-Regulatory Module Based on ChIP-seq Datasets[D].Tianjin:Tianjin Normal University,2017(in Chinese).[13]ZHANG S Q,ZHOU X,et al.SPIC:A novel similarity metric for comparing transcription factor binding site motifs based on information contents[J].BMC Systems Biology,2013,7(2):1-8.[14]ZHANG S Q,CHEN Y.CLIMP:Clustering motifs via maximal cliques with parallel computing design[J].Plos One,2016,11(8):1-17.[15]IVAN A,HALFON M S,SINHA putational discovery of cisregulatory modules in Drosophila,without prior knowledge of motifs[J].Genome Biology,2008,9(1):1-17.。