钙结合蛋白及作用位点的生物信息学研究
- 格式:pdf
- 大小:907.11 KB
- 文档页数:51
畜牧与饲料科学Animal Husbandry and Feed Science2012 , 33 ( 5-6 ) :35-36钙蛋白酶系统研究进展申晓亮 , 何永梅 , 贺晓丽 , 王梦娇 , 曹果清(山西农业大学动物科技学院 ,山西 太谷030801)摘要 : 钙蛋白酶系统在人和动物体内广泛存在 , 是 高度 复 杂 、 高 度 调 控 的 体 系 。
钙 蛋 白 酶 系 统 由 钙 蛋 白 酶 (calpain ) Ⅰ (CAPN1 )、 钙 蛋 白 酶 Ⅱ (CAPN2 )、 骨 骼 肌 特异 性 蛋 白 (muscle specific calpain ,CAPN3) 和 钙 蛋 白 酶 抑 制 蛋 白 (calpastatin , CAST ) 组成 。
钙蛋白酶系统在动物屠宰后肉的成熟嫩化及人和动物正常生理过程的维持中起重要作用 。
对钙蛋白酶系 统的作用 、 各成分分子结构 、 基因结构 、 作用机制 、 调控机制等做了综述 ,并讨论了其应用前景及今后的研究方向 。
关键词 : 钙蛋白酶系统 ; 作用 ; 结构 ; 调节机制 中图分类号 :Q55 文献标识码 :A 文章顺序编号 :1672-5190 (2012 )05-0035-02钙蛋白酶系统在人和动物的体内广泛存在 , 是一个高 度复杂、 高度调控的体系。
钙蛋白酶系统由钙蛋白酶 (calpain )Ⅰ (CAPN1 )、 钙蛋白酶 Ⅱ (CAPN2 )、 骨 骼 肌特 异 性 蛋 白 (muscle specific calpain ,CAPN3) 和 钙 蛋 白 酶 抑 制 蛋 白 (calpastatin ,CAST )组成 。
据研究 ,钙蛋白酶的表达会引起肌 细胞肌原纤维的降解 , 钙蛋白酶抑制蛋白的表达会抑制肌 肉蛋白质水解 。
目前 ,钙蛋白酶和钙蛋白酶抑制蛋白基因[1]1.3与健康和疾病的关系钙蛋白酶系统不但参与神经发育 、 葡 萄 糖 转 运 、 细 胞 信号 转 导 、 细 胞 周 期 调 控 与 凋 亡 等 正 常生理过程 , 还与肌肉萎缩 、2 型糖尿病 、 风 湿性 关 节 炎 、 缺 血再灌注损伤以及阿尔茨海默病等疾病的发生有关 [2]。
CDH1基因突变诊断研究进展摘要:E-钙黏蛋白(cadherin)基因(CDH1基因)外显子突变是目前已知的、导致HDGC等多种肿瘤发病的最重要因素, 筛查其突变情况可以用于指导肿瘤的临床诊治,CDH1基因的其他改变, 如内含子突变、基因甲基化及单核苷酸多态性也可能影响其表达,但这些改变与肿瘤诊断的关系尚需进一步研究。
关键词:E-钙黏蛋白;CDH1基因;肿瘤诊断CDH1基因是位于染色体16q22.1的一种肿瘤抑制基因。
它的功能是E-cadherin的编码。
E-cadherin是依赖性粘附的钙粘蛋白家族成员。
E-钙粘蛋白的蛋白质被发现在上皮细胞,表示在人类发展的早期阶段。
E-钙黏蛋白(cadherin)基因(CDH1基因)的损失和上皮相关的变化细胞粘附和运动已注意到在数种癌症,包括胃癌,大肠癌,乳腺癌和卵巢癌。
本文综述了E-钙黏蛋白(cadherin)基因(CDH1基因)在肿瘤诊治方面的研究进展。
1.动物模型检测Irina V.Kovtun_, Kimberly J.Harris3, Aminah Jatoi1【1】研究了在妇科肿瘤中E-cadherin的表达情况。
通过敲除MMR基因,引起DNA错配修复(MMR)而发生妇科肿瘤小鼠模型,发现E-cadherin和DNA结合中断MMR途径增加子宫内膜肿瘤的发病率老鼠。
E-cadherin的启动子区的序列分析证明了E-cadherin表达的损失是由失活突变引起的,这意味着E-cadherin是一个突变靶向的Msh2-缺陷小鼠。
Msh2(2/2)/ CDH1(1/2)的小鼠提供妇科肿瘤发生的一个很好的模式,可能有助于测试分子靶向特异性治疗。
艾斯克尔·吐拉洪,陈凯,邓大伟【2】建立裸鼠低位直肠癌淋巴结转移模型,检测E-钙黏蛋白在裸鼠低位直肠癌淋巴结转移模型中的表达,探讨其在直肠癌淋巴结转移过程中的作用。
发现E-钙黏蛋白表达的减弱或缺失,导致肿瘤细胞间黏附性降低,诱导EMT发生,可促进肿瘤细胞获得侵袭和转移的能力,进而促进了肿瘤的浸润及淋巴结转移,但其具体作用机制还不十分清楚,仍有待于进一步研究。
蛋白组学是研究生物体内所有蛋白质的组成、结构和功能的学科,通过分析蛋白质的表达水平和相互作用,可以深入了解生物体内的生物学过程和疾病发生机制。
而KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库则是一个集成了基因组、化学物质以及生物系统功能信息的综合性数据库,为研究者提供了丰富的生物信息资源。
蛋白组学和KEGG数据库的结合,能够为我们揭示蛋白质在不同生物学过程中的功能和调控机制提供有力支持。
蛋白组学中的KEGG富集分析,则是一种常用的数据分析方法,用于发现蛋白质组中与特定生物学过程相关的蛋白质通路和功能模块。
一、KEGG数据库概述KEGG数据库以图谱方式展示生物系统的功能和代谢通路,并提供了基因组、生物化学反应、蛋白质序列等多方面的信息。
在KEGG 数据库中,可以找到大量与蛋白质相关的信息,如代谢通路中涉及的酶、信号转导途径中的蛋白质等。
这些信息为蛋白组学研究提供了丰富的数据支持,使得我们能够更好地理解蛋白质在细胞内的功能和调控。
二、蛋白组学与KEGG数据库的结合在蛋白组学研究中,通过质谱技术等手段可以获取大量蛋白质的表达数据,而KEGG数据库则提供了这些蛋白质在生物系统中的功能和相互关系的详细信息。
将蛋白组学数据与KEGG数据库相结合,可以对蛋白质进行功能注释、通路分析和互作网络构建,帮助研究者深入挖掘蛋白质的生物学意义。
三、KEGG富集分析的原理KEGG富集分析是一种常用的生物信息学方法,用于发现蛋白质组中与特定生物学过程相关的蛋白质通路和功能模块。
其原理是将实验测得的蛋白质列表与KEGG数据库中的代谢通路、信号通路等信息进行比较,从而找出在特定生物学过程中显著富集的蛋白质通路和功能模块。
四、KEGG富集分析的应用KEGG富集分析广泛应用于生物学研究领域,特别是在蛋白组学研究中发挥着重要作用。
通过KEGG富集分析,研究者可以发现与特定生物学过程相关的蛋白质通路和功能模块,进而揭示蛋白质在疾病发生机制中的作用机制,寻找潜在的生物标志物,为疾病诊断和治疗提供新的思路和靶点。
棉花科学,2021,43(2):14-21前沿与创新亚洲棉CBL基因家族鉴定及生物信息学分析杨秀,邓艳凤,肖水平,刘新稳,王涛,杨绍群(江西省棉花研究所/国家棉花产业技术体系鄱阳湖综合试验站,江西九江332105)收稿日期:2021 02 19基金项目:国家重点研发计划(2018YFD0100404);国家重点研发计划(2016YFD0101414);江西省现代农业产业技术体系专项(JXARS 22)。
作者简介:杨秀(1991 ),女,研究实习员,硕士,从事棉花新品种选育与栽培研究工作,yangxiu0117@163 com。
通信作者:杨绍群,农艺师,从事棉花新品种选育与栽培研究工作,523639515@qq com。
摘要:为了探究CBL(钙调磷酸酶B亚基蛋白)基因参与棉花非生物胁迫响应。
利用生物信息学的方法对亚洲棉CBL家族成员进行鉴定,并对其成员的理化性质、进化关系、基因结构、蛋白结构、染色体定位、顺式作用元件进行分析。
结果表明,在亚洲棉中获得20个CBL基因,该基因成员蛋白的理化性质差异不大,大多数CBL基因成员的等电点为4~5 5,CBL蛋白中的氨基酸大部分为酸性;系统进化树分析得出两个组,GroupII包含的成员最多,GroupI中仅有GaCBL4 1、GaCBL4 2、GaCBL4 3和GaCBL8共4个成员;结构域和保守基序分析发现所有的CBL基因均含有至少一个EF hand结构域,且同一类群中的大多数成员具有相似的motif;基因结构分析发现同一类群中外显子-内含子结构比较相似,不同组之间的基因结构差异较大。
染色体定位分析发现18个CBL基因被定位在10条染色体上,而GaCBL2 5和GaCBL2 6不能定位到任何染色体上。
GaCBL家族基因成员启动子区域中均含有多个能够应答逆境和植物激素的顺式作用元件。
综上表明,亚洲棉各CBL基因参与不同的生物学过程并发挥着不同的功能。
关键词:亚洲棉;CBL;基因鉴定;生物信息分析中图分类号:S562 035 文献标识码:A 文章编号:2095-3143(2021)02-0014-08DOI:10 3969/j issn 2095-3143 2021 02 002IdentificationandBioinformaticsAnalysisofGACBLFamilyGeneinGossypiumArboretumYangXiu,DengYanfeng,XiaoShuiping,LiuXinwen,WangTao,YangShaoqun(CottonResearchInstituteofJiangxiProvince/PoyangLakeComprehensiveExperimentalStationofNationalCottonIndustrialTechnologySystem.,Jiujiang,Jiangxi332105,China)Abstract:InordertoexploretheinvolvementofCBL(calcineurinBsubunitprotein)genesinabioticstressresponseincotton.UsingbioinformaticsmethodstoidentifythemembersofGaCBLfamily,andthephysicochemi·41·《棉花科学》欢迎投稿,欢迎订阅!棉花科学2021年(第43卷)第2期杨秀,等:亚洲棉CBL基因家族鉴定及生物信息学分析calproperties,evolutionaryrelationships,genestructure,proteinstructure,chromosomelocationandcis-actingelementsofthememberswereanalyzed.Theresultsshowedthat20CBLgeneswereobtainedfromG.arboreum,andthephysicalandchemicalpropertiesoftheirmemberproteinswerenotsignificantlydifferent.TheisoelectricpointsofmostmembersofGaCBLgeneswerebetween4to5 5,thatmostoftheaminoacidsinGaCBLproteinswereacidic.Phylogenetictreeanalysisoftwogroups,GroupIIcontainedthemostmembers,whileGroupIonlycontainedGaCBL4 1,GaCBL4 2,GaCBL4 3andGaCBL8.Throughdomainandconservedmotifanalysis,foundthatallGaCBLgenescontainatleastoneEF handdomain,andmostmembersofthesamegrouphavesimilarmo tifs.Theanalysisofgenestructurefoundthattheexon intronstructureofthesamegroupwassimilar,andthedifferenceofgenestructurebetweendifferentgroupswasgreat.Chromosomallocationanalysisrevealedthat18GaCBLgeneswerelocatedon10chromosomes,whileGaCBL2 5andGaCBL2 6couldnotbelocatedonanychro mosome.ThepromoterregionsofmembersoftheGaCBLfamilyofgenescontainseveralcis actingelementsthatre spondtostressandplanthormones.Inconclusion,differentGaCBLparticipateindifferentbiologicalprocessesandplaydifferentfunctions.Keywords:Gossypiumarboreum;CalcineurinB likeproteins;Geneticidentification;Bioinformaticsanalysis 土壤盐碱化会引起离子毒性、高渗透胁迫和氧化等次生胁迫从而对植物造成危害[1]。
《兴安落叶松特有钙结合蛋白的鉴定与功能研究》篇一一、引言兴安落叶松(Larix gmelinii)是一种重要的树种,在生态系统和林业产业中扮演着重要的角色。
近年来,有关兴安落叶松的研究逐渐增多,其中特有钙结合蛋白(Calcium-binding Protein,CBP)的研究备受关注。
钙结合蛋白是一类能够与钙离子结合的蛋白质,参与细胞内多种生物学过程。
在兴安落叶松中,特有钙结合蛋白的鉴定和功能研究对于了解其生物学特性和生理功能具有重要意义。
本文旨在通过实验方法对兴安落叶松特有钙结合蛋白进行鉴定,并对其功能进行深入研究。
二、实验方法2.1 材料准备选取健康生长的兴安落叶松为实验材料,分别在春、夏、秋、冬四个季节进行取样。
取样部位为树皮、树干和树根等不同部位。
2.2 蛋白质提取与纯化采用常规的蛋白质提取方法,分别从春、夏、秋、冬四个季节取样的兴安落叶松不同部位中提取蛋白质。
经过一系列的纯化步骤,得到纯度较高的特有钙结合蛋白。
2.3 蛋白质鉴定利用质谱技术和生物信息学方法对纯化后的特有钙结合蛋白进行鉴定,包括蛋白质的分子量、等电点、氨基酸序列等信息。
2.4 功能研究通过体外实验和细胞实验等方法,研究特有钙结合蛋白的功能,包括其与钙离子的结合能力、对细胞生长和分化的影响等。
三、结果与讨论3.1 蛋白质鉴定结果经过质谱技术和生物信息学方法的鉴定,成功鉴定出兴安落叶松特有钙结合蛋白的分子量为XX kD,等电点为XX,氨基酸序列等信息也得到了明确。
同时,我们还发现该特有钙结合蛋白在不同季节和不同部位的表达量存在差异。
3.2 功能研究结果通过体外实验和细胞实验等方法,我们发现兴安落叶松特有钙结合蛋白具有与钙离子结合的能力,并且能够影响细胞的生长和分化。
具体而言,该特有钙结合蛋白能够促进细胞的增殖和分化,同时还能增强细胞的抗逆能力。
此外,我们还发现该特有钙结合蛋白的表达量与兴安落叶松的生长状况密切相关,表达量的变化可能会影响树木的生长和发育。
《E-钙粘附素序列模体分析》篇一一、引言近年来,蛋白质分子中不同序列的功能性和生物结构信息受到了广泛的关注。
其中,E-钙粘附素(E-cadherin)作为一种重要的细胞表面受体,在细胞与细胞间的粘附过程中发挥着关键作用。
其序列模体(motif)的组成和功能特性对于理解其生物学功能具有重要意义。
本文旨在通过对E-钙粘附素序列模体的分析,探讨其结构与功能的关系。
二、E-钙粘附素概述E-钙粘附素是一种钙依赖性的细胞粘附分子,属于钙粘蛋白家族的成员之一。
它通过与同型或异型细胞表面的其他E-钙粘附素分子相互作用,参与细胞间的粘附过程,从而维持细胞的极性及组织的完整性。
在许多生物过程中,包括发育、形态形成、细胞分化及肿瘤发生等方面都起着重要作用。
三、E-钙粘附素序列模体分析(一)序列模体的定义与分类序列模体是指在蛋白质序列中具有特定功能的短序列片段。
根据其在蛋白质结构与功能中的作用,可以将其分为保守模体和可变模体两类。
保守模体在进化过程中较为稳定,通常参与蛋白质的稳定和功能维持;而可变模体则可能参与蛋白质与其他分子的相互作用,以及在不同条件下的调节过程。
(二)E-钙粘附素序列模体的组成与功能通过对E-钙粘附素序列的分析,我们发现其包含多个保守模体和可变模体。
其中,保守模体主要涉及钙离子结合位点、跨膜区及细胞质尾部的关键结构域等,这些区域对于维持E-钙粘附素的稳定性和功能至关重要。
而可变模体则可能涉及与其他分子相互作用的位点,如与其他钙粘蛋白的相互作用或参与信号转导等过程。
(三)E-钙粘附素序列模体的结构特点E-钙粘附素的序列模体在结构上具有一定的特点。
例如,保守模体通常具有较高的序列保守性,且在空间结构上呈现出特定的构象。
而可变模体则可能在空间结构上具有一定的灵活性,以适应不同的生物过程和条件变化。
这些结构特点使得E-钙粘附素能够灵活地参与多种生物过程。
四、结论通过对E-钙粘附素序列模体的分析,我们可以更好地理解其在细胞与细胞间粘附过程中的作用及其与其他分子的相互作用机制。
植物生理学报 Plant Physiology Journal 2015, 51 (5): 633~641 doi: 10.13592/ki.ppj.2015.0040633收稿 2015-01-23 修定 2015-04-27资助 国家自然科学基金(U1130304和31201679)和浙江省自然科学基金(LY15C020006)。
* 通讯作者(E-mail: liqundu@; Tel: 0571-********)。
植物钙调素结合转录因子CAMTA/SR 功能的研究进展曾后清1, 王国平1, 王慧中1, 林金星2,3, 杜立群1,*1杭州师范大学生命与环境科学学院, 杭州310036; 2中国科学院植物研究所, 北京100093; 3北京林业大学生物科学与技术学院, 北京100083摘要: 在钙信号转导途径中, 钙调素(CaM)作为一种主要的钙感受器, 通过与下游靶蛋白结合调节植物一系列的生理活动。
信号响应蛋白(SR)是一类广泛存在于多细胞真核生物中结构保守的钙调素结合型转录因子(CAMTA)。
近年来, 人们在植物CAMTA/SR 功能的研究上取得了重要的进展。
CAMTA/SR 在植物的生长发育、防卫反应、通用胁迫反应、抗冻性、抗旱性和激素信号途径等方面发挥了重要的调控作用。
本文总结了植物CAMTA/SR 的结构特征及生物学功能, 并展望了其研究前景。
关键词: CAMTA/SR; 钙信号; 钙调素; 转录因子; 逆境胁迫; 防卫反应Functions of Calmodulin-Binding Transcription Activators (CAMTAs) in PlantsZENG Hou-Qing 1, WANG Guo-Ping 1, WANG Hui-Zhong 1, LIN Jin-Xing 2,3, DU Li-Qun 1,*1College of Life and Environmental Sciences, Hangzhou Normal University, Hangzhou 310036, China; 2Institute of Botany, Chi-nese Academy of Sciences, Beijing 100093, China; 3College of Biological Sciences and Technology, Beijing Forestry University, Beijing 100083, ChinaAbstract: As a primary calcium sensor in all eukaryotes, calmodulin (CaM) regulates a wide range of cellular processes by binding to its effector proteins in plants. Among the target proteins of CaM, signal responsive pro-teins, also named as calmodulin-binding transcription activators (CAMTAs/SRs) comprise a conserved family of transcription factors in all the multicellular eukaryotes examined so far. In recent years, major progresses have been made in the functional analyses of CAMTAs in plants. In this review, we summarize the domain structures of CAMTAs and the functional significance of CAMTAs in defenses against pathogen and herbivore attacks, in regulation of general stress responses, in tolerance to abiotic stresses such as low temperature and drought, and in growth and development of plants. Perspective on future research is also suggested based on our understanding in this topic.Key words: CAMTA/SR; Ca 2+ signal; calmodulin; transcription factor; environmental stress; defense response 钙离子(Ca 2+)是一种广泛存在于真核生物中的重要细胞信使。
分类号学号M201071365学校代码10487密级硕士学位论文钙结合蛋白及作用位点的生物信息学研究学位申请人:彭胜军学科专业:生物医学工程指导教师:薛宇教授答辩日期:2012年5月18日A Thesis Submitted in Partial Fulfillment of the Requirementsfor the Degree of Master of Engineeringanalysis sis of calcium binding Computational analysites in proteinsCandidate:Shengjun PengMajor:Biomedical EngineeringSupervisor:Prof.Yu XueHuazhong University of Science&TechnologyWuhan430074,P.R.ChinaMay,,20201212May独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。
尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。
对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。
本人完全意识到本声明的法律结果由本人承担。
学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
保密□,在年解密后适用本授权书。
本论文属于不保密□。
(请在以上方框内打“√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日华中科技大学硕士学位论文摘要钙是生命活动中最重要的基本元素之一,在真核生物细胞内以离子状态充当第二信使。
钙离子通过与特定钙受体或者钙结合蛋白绑定实现其生物学功能,调控细胞信号传导和细胞生命周期(包括细胞分裂、分化和凋亡)等过程。
基于钙结合蛋白的功能结构域组成可将之分为两类:一类具有EF-hand结构域,其典型代表是钙调蛋白(Calmodulin);另一类不具有EF-hand结构,即非EF-Hand钙结合蛋白。
随着对钙结合蛋白研究的日趋深入,实验证据表明钙离子与蛋白质结合形式具有复杂性和不规则性。
鉴定钙结合蛋白中钙离子与蛋白质的结合位点是了解生物系统中钙离子如何调控蛋白质结构和功能首要步骤。
实验验证钙离子结合位点需要耗费大量的时间、精力和资金。
利用生物信息学的方法开展预测,能够有效地去除潜在的假阳性结果,为进一步的实验研究提供有价值的参考信息。
迄今为止,所有预测钙结合蛋白结合位点的生物信息学方法,都基于蛋白质的三级结构,从而具有较大的局限性。
在本论文中,我们设计了一种基于位点特异性打分矩阵(PSSM)算法的方法,能够快速、准确的预测潜在的钙结合蛋白位点。
通过阅读科学文献,搜集了实验验证的369个钙结合蛋白,包含了986个钙离子结合位点,对这些数据进行训练,并通过“除一法”(Leave-one-out validation)等方法评估其预测性能,发现本方法的灵敏度(Sensitivity)和特异性(Specificity)分别为69.67%和90.00%。
本方法仅需提供蛋白质的一级序列即可预测蛋白质的钙离子结合位点。
与此同时,对搜集到的实验验证过的钙结合蛋白数据做了GO统计分析,从钙结合蛋白的生物学过程(Biological process)、分子功能(Molecular function)以及亚细胞定位(Cellular component)三个层面进行了生物统计学分析。
我们的结果表明:(1)钙结合蛋白主要分布在细胞质(GO:0005829)、细胞膜(GO:0005886)和细胞外区域(如组织液)(GO:0005576)等区域;(2)钙结合蛋白参与的生理过程主要有肌肉的收缩(GO:0006936)、突触信号传递(GO:0007268)和信号转导(GO:0007165)等过程;(3)钙结合蛋白具有的分子功能有与钙离子的结合(GO:0005509)、与钙依华中科技大学硕士学位论文赖的蛋白结合(GO:0048306)和与其他蛋白质绑定(GO:0005515)等。
另外,我们从Uniprot数据库中下载了人、小鼠、果蝇、线虫、酵母和拟南芥六个具有代表性的模式生物的序列信息,并对这六个物种进行了大规模预测,得到了与钙结合的蛋白质数目分别为人76.4%、小鼠68.6%、果蝇47.8%、线虫23.2%、酵母14.7%、拟南芥53.5%。
从中可以得到两个结论:(1)钙结合蛋白在这六个物种中普遍存在;(2)物种由低等到高等,钙结合蛋白的比例逐渐增加。
综上所述,我们对钙离子结合蛋白及作用位点进行了系统性分析,为进一步的实验分析提供了潜在的数据资源。
我们相信,计算预测与实验验证的有机结合可将钙结合蛋白的研究带入一个新的发展阶段。
关键词:钙离子;钙结合蛋白;PSSM算法;GO统计分析;大规模预测华中科技大学硕士学位论文AbstractAs a secondary messenger in cellular signal transduction of eukaryotic cells,calcium is one of the most important metals for the life,and implicated in a variety of biological processes,such as cell division,differentiation and apoptosis.Calcium carries out its functions by binding to specific Calcium receptors or Calcium-binding proteins(CaBPs). Based on the3D structure,they were classified into two main subfamilies:the EF-hand CaBPs and the non-EF-hand CaBPs.The typical example of EF-hand CaBPs is calmodulin,which has been characterized by the presence of structural motifs called ‘EF-hands’.Non EF-hand CaBPs do not use this structural motif to bind calcium. Identifying calcium-binding sites in proteins is fundamental for understanding the molecular mechanisms and regulatory roles of calcium.Identification of calcium ion binding sites with conventionally experimental approaches is time-consuming, labor-intensive and expensive.Prediction of calcium binding sites in proteins with computational methods can efficiently narrow down the potential candidates,and provide useful information for further experimental studies.Due to the complexity and diversity of calcium-binding sites,a fast and accurate method for predicting and identifying calcium-binding protein is urgent needed.However,most of current computational analysis are3D structure-based and can not be generally used.Here we developed a novel method to predict calcium-binding sites in proteins.From the scientific literature,we collected369experimentally identified calcium-binding proteins with986sites.The PSSM(Position-specific scoring matrix)algorithm was adopted,while the leave-one-out and n-fold cross-validations were performed to achieve the performance of sensitivity69.67%and specificity90%.Also,the statistical analysis were performed based on the GO(gene ontology)information for known calcium-binding proteins.From the results,we observed that calcium binding proteins preferentially locate in the cytoplasm(GO:0005829),cell membrane(the GO:0005886),and cells outside the region(such as organizations liquid)(the GO:0005576).Moreover,calcium-binding protein are preferentially involved in the physiological process of muscle contraction(GO:华中科技大学硕士学位论文0006936),synaptic signaling(GO:0,007268),and signal transduction(GO:0007165).In addition,the major molecular functions of calcium-binding proteins are calcium ion binding(GO:0005509),calcium-dependent protein binding(GO:0048306),and protein binding(GO:0005515).We downloaded the protein sequences of human,rat,Drosophila, C.elegans,yeast and Arabidopsis from the Uniprot database,and used our method to predict potential calcium binding proteins.In our results,the percentage of calcium-binding proteins is human76.4%,mouse68.6%,fly47.8%,yeast23.2%, nematode14.7%,and Arabidopsis thaliana53.5%.In this regard,calcium binding is ubiquitous in eukaryotes,while the number of calcium-binding proteins increases during evolution.Taken together,we conducted a systematic analysis of the calcium-binding proteins and the binding sites,which can be useful for further experimental consideration.We believe the computational prediction together with experimental validation can propel the research of calcium binding proteins into a new phase.Keywords:Calcium;Calcium binding protein;GO statistical analysis;PSSM;Large-scale prediction华中科技大学硕士学位论文缩略词组CaBP calcium binding proteinECF Extracellular calcium binding protein PSSM position specific scoring matrixTP True positivesFP False positivesTN True negativesFN False negativesAc AccuracySn SensitivitySp SpecificityMCC Mathew correlation coefficient LOO Leave-one-out validationGO Gene Ontology华中科技大学硕士学位论文目录摘要.........................................................................................................I Abstract Abstract (III)III 第一章前言1.1钙在生命中的重要性 (8)1.2钙结合蛋白 (10)1.3细胞外钙结合蛋白 (12)1.4细胞内钙结合蛋白 (12)1.5与钙结合蛋白相关的疾病 (18)1.6实验检测与验证的方法 (20)1.7钙结合蛋白的生物信息学分析 (21)1.8本课题研究的背景、理论依据和意义 (23)第二章材料与方法2.1数据收集和整理 (24)2.2数据处理 (25)2.3PSSM 算法 (26)2.4PSSM 矩阵的可视化 (28)2.5预测性能的计算和检验 (28)2.6ROC 曲线 (29)华中科技大学硕士学位论文2.7预测性能的评估检验 (30)2.8GO注释与聚类统计分析 (30)2.9蛋白质钙结合位点的大规模预测 (33)第三章实验结果及分析3.1Weblogo分析钙结合位点阳性数据和PSSM阵的生成 (34)3.2PSSM-CaBP1.0预测性能 (35)3.3GO统计分析 (36)3.4蛋白质钙结合位点的大规模预测 (39)第四章总结与展望4.1全文总结 (40)4.2展望 (41)致谢..........................................................................................................................................................................................................((4343))...................................................................................................((4444))参考文献...................................................................................................华中科技大学硕士学位论文第一章前言1.1钙在生命中的重要性钙元素是生命中的重要元素之一,而钙结合蛋白则是最常见的生物信号载体,它调节着从卵子的受精一直到细胞的凋亡的整个细胞生命周期过程(包括细胞的分裂,细胞的增值,细胞的死亡[1](图1-1)。