生物信息学5-2017
- 格式:docx
- 大小:19.81 KB
- 文档页数:2
系统医学 2024 年 2 月第 9 卷第 3期应用生物信息学筛选结直肠癌Hub 基因及验证陈树华,温日葵,祝惠钦,谢荣章云浮市人民医院检验科,广东云浮 527300[摘要] 目的 通过运用生物信息学分析,筛选出与结直肠癌相关的差异表达基因(Differentially Expressed genes, DEGs ),并验证其生物学功能。
方法 云浮市人民医院检验科从基因表达综合数据库(Gene Expression Omnibus, GEO )中下载结直肠癌芯片数据GSE 21815、GSE 31905、GSE 35279资料,应用GEO2R 语言进行处理得出结直肠癌和正常结直肠组织之间的差异表达基因,并通过生物信息学工具DAVID 、STRING 、Cytoscape 构建差异表达基因的蛋白互作网络,筛选Hub 基因,应用基因本体论(Gene Ontology, GO )、基因百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG )分析筛选出的Hub 基因的生物功能,并利用MiRDB 工具找出可能调控Hub 基因的miRNA ,并于2017—2022年8月收集30例结直肠癌组织和30例正常结直肠组织样本,通过实时荧光定量PCR (Quantitative Real-time PCR, qPCR )验证。
结果 经生物学信息分析和蛋白质相互作用网络图分析催产素受体基因、基质金属蛋白酶11基因、间质上皮转化因子基因、基质金属蛋白酶7基因、激肽释放酶8基因、激肽释放酶10基因为结直肠癌组织发生发展的关键Hub 基因。
结直肠癌组织中基质金属蛋白酶11基因(4.38±1.58)、间质上皮转化因子基因(2.69±0.29)、基质金属蛋白酶7基因(0.88±0.14)、激肽释放酶8基因(11.09±3.90)、激肽释放酶10基因mRNA (7.88±2.20)的表达,显著高于正常结直肠组织组织,差异有统计学意义(t =9.605、25.339、26.376、9.541、3.726,P 均<0.001)。
生物信息学札记(第4版)樊龙江浙江大学作物科学研究所浙江大学生物信息学研究所浙江大学IBM生物计算实验室2017年9月本材料已由浙江大学出版社出版:《生物信息学》,樊龙江主编,2017部分内容可通过下列网址获得:/bioinplant/札记前言第一版这份材料是我学习和讲授《生物信息学》课程时的备课笔记,材料大多是根据当时收集的一些外文资料翻译编辑而成。
学生在学习过程中经常要求我给他们提供一些中文的讲义或材料,这促使我把我的这份笔记整理并放到网上,供大家参考。
要提醒使用者的是,这份材料仅是根据我对生物信息学的一些浮浅的认识整理而成,其中的错误和偏颇只能请读者自鉴了。
2001年6月第二版自1999年开始接触生物信息学以来,一晃已近六年,而本札记也近四岁了。
2001和2002年中国科学院理论物理所的郝柏林院士在浙江大学首次开设生物信息学研究生课程,我作为他的助教系统地学习了生物信息学;同时,借着我国水稻基因组测序计划的机遇,在他的带领下从2001年开始从事水稻基因组分析,从此自己便完全投入到这一崭新、引人入胜的领域中来。
不断有来信向我索要本札记的电子版文件,同时在不少网站上看到推荐该札记的内容。
生物信息学、基因组学等发展很快,现在再回头审看该札记,有些部分已惨不忍读,这促使我下决心更新它。
但因时间和学识问题,还是有不少部分自己不甚满意,就只有待日后再努力了。
欢迎告诉我札记中的BUG,我的信箱*************.cn或******************.cn。
2005年3月30日第三版近年来高通量测序技术产生的序列数据大量出现(如小RNA和大规模群体SNP数据),本次更新根据这一进展增加了两章内容,分别是第七章有关小RNA的分析和第八章遗传多态性及正向选择检测。
两章内容由我的博士生王煜为主编写,李泽峰和刘云参与了文献整理。
另外还更新了第四章有关水稻基因组分析一节。
2010年1月第四版2014年浙江大学开展本科生教材建设工作,我当时作为系主任要带头,就承诺编写我主讲的《生物信息学》教材。
生物信息学方法分析前列腺癌组织及细胞系中LMNA基因第七外显子点突变左灵坤;阳荣辉;马慧;周萍;孔璐【摘要】目的探讨前列腺癌中核纤层蛋白A/C(lamin A/C,LMNA)基因第七外显子点突变与LMNA表达差异的相关性.方法采用高通测序分析了永生化正常前列腺上皮细胞(RWPE-1)、低侵袭力前列腺癌上皮细胞(PC-3M-2B4)及高侵袭力前列腺癌上皮细胞(PC-3M-1E8)LMNA基因的12个外显子,识别出在RWPE-1与PC-3M-1E8细胞系中C.1159C> CA(p.L387LI)点突变,定位在1号染色体156106006.为了验证点突变在前列腺癌患者中的分布情况,PubMed GEO数据库下载了3组数据,分别是100例前列腺癌患者石蜡包埋标本的总RNA测序数据、20例前列腺癌和10例配对正常组织的转录组数据及21种前列腺正常及癌细胞株的测序数据.在1号染色体上选取156105950到156106055范围,设置比对序列CTACGCCTG或者NTACGCCTGTCCCCCAGCCC,每次分析比对长度为50 nt.同时,利用GEO数据库分析了突变点周围序列的特点与功能.最后,转染突变质粒,蛋白质电泳分析LMNA点突变对LMNA蛋白质表达的影响.结果在所有分析的样品中,1号染色体LMNA外显子7从156106006到156106011的区域内,存在2种错义突变形式:C/CA(p.L387LI)、C/CG (p.L387LV)和4种同义突变形式:C/CT (p.L387L)、C/CA(p.R388R)、C/CT(p.R388R)、C/CG(p.R388R).前列腺癌按格里森(Gleason score,GS)评分系统分组,错义突变的总发生率分别占40%(正常)、11%(GS5-6)、2% (GS 7)和6% (GS 8-10).在16种前列腺癌细胞系和5种前列腺良性细胞系中,错义突变的总发生率分别占31%和60%.此外,还发现1号染色体上从156106008到156106066是转录因子结合位点,常见转录因子为PAX5、HEN1(NHLH1)、HTF、P53、MIF1、COMP1和NGFIC (NGF4).通过功能聚类分析,这些转录因子的功能主要集中在染色质重组及调控、RNA代谢过程的正向调节、组蛋白修饰的调控以及程序性细胞死亡的负调节等方面.高表达突变LMNA的细胞系LMNA及磷酸化LMNA蛋白质表达下调.结论 156106006位点突变多发生在前列腺正常组织和前列腺良性细胞株,与LMNA蛋白质表达密切相关,可能是lamin 蛋白质异源性表达的机制之一.%Objective Our research focuses on investigating the associations between point mutation of exon 7 in LMNA and its expression in prostate cancer.Methods A lamin A/C (LMNA) genomic missense variation C.1159C > CA (p.L387LI,locatedchr1:156106006),identified by DNA sequencing for all 12 exons of LMNA,in HPV-immobilized normal epithelium(RWPE-1)and high-invasive prostate cancer cell line(PC-3M-1E8) models was recognized.To verify these point mutations in prostate cancer patients,we downloaded three group data from PubMed GEO datasets,respectively from global RNA sequencing data,paraffin-embedded (FFPE) prostatectomy samples from 100 patients,from the transcriptome (polyA +) data of 20 prostate cancer tumors and 10 matched normal tissues and from sequencing data from 21 prostate cell lines.All reads were selected on the range from 156105950 to 156106055 on chrl and these reads were aligned with CTACGCCTG or NTACGCCTGTCCCCCAGCCC.The length of reads analyzed is 50 nt for one time.Further,we analyzed the function of the sequence around the mutation point using GEO database.At last,we analyzed the effects of LMNA mutation by Western blotting in transfected mutation plasmid cells.Results We found that missense mutation has two forms of C/CA (p.L387LI) and C/CG (p.L387LV),however same-sense mutation has fourforms of C/CT (p.L387L),C/CA (p.R388R),C/CT (p.R388R) and C/CG (p.R388R) in the range from 156106006 to 156106011 of exon 7 of chrl in LMNA from samples or cell lines.However,the incidence of missense mutation accounted for respectively 40%,11%,2% and 6% in normal,Gleason score 5-6,7 and 8-10 of patient samples.In16 prostate cancer cell lines and 5 prostate benign cell lines,the incidence of missense mutation accounted for respectively 31% and 60% in cancer and benign cell lines.In addition,this sequence from 156106008 to 156106066 on chr1 was transcription factors (TFs) binding site;The common TFs in this region were PAXS,HEN1 (NHLH1),HTF,P53,MIF1,COMP1 and NGFIC (NGF4).By functional cluster analysis,the function of these TFs focuses on chromatin organization,positive regulation of RNA metabolic process,regulation of histone modification,regulation of chromosome organization and negative regulation of programmed cell death.Mutation led to a downregulation of in LMNA and phosphor-LMNA expression levels.Conclusion Missense mutation incidence of 156106006 on chr1 in both prostate cancer tissues and prostate cancer cell lines is lower than that of prostate normal tissue and prostate benign cell lines.It is possible to have relationship between the mutation and expression level or a heterogeneous expression pattern of LMNA.【期刊名称】《首都医科大学学报》【年(卷),期】2017(038)006【总页数】7页(P884-890)【关键词】前列腺癌;核纤层蛋白A/C;突变;生物信息分析【作者】左灵坤;阳荣辉;马慧;周萍;孔璐【作者单位】首都医科大学基础医学院生物化学与分子生物学系,北京100069;首都医科大学基础医学院生物化学与分子生物学系,北京100069;首都医科大学基础医学院生物化学与分子生物学系,北京100069;首都医科大学生物医学工程学院生物医学信息学系,北京100069;首都医科大学基础医学院生物化学与分子生物学系,北京100069【正文语种】中文【中图分类】R329.2前列腺癌(prostate cancer,PCa)是威胁男性健康的最常见肿瘤之一,在发达国家中其发病率居男性肿瘤的首位;病死率居男性癌症病死率第二,仅次于肺癌[1]。
基因组学与应用生物学,2020年,第39卷,第9期,第4345-4352页研究报告Research Report生物信息学分析鉴定肝细胞癌中的关键基因和信号通路殷松娜张翔*杜娟陈雅慧延安大学医学院,延安,716000*通信作者,**********************摘要肝细胞肝癌是死亡率较高的癌种之一。
本研究旨在为HCC的发生发展机制研究提供更多数据支持,从而对HCC的基因治疗提供一定的理论基础。
从GEO数据库检索下载肝癌患者芯片数据GSE62232,包括10个正常肝脏样本,81个HCC患者的肿瘤样本。
用Limma包分析HCC肿瘤组织中与正常肝组织中差异表达基因。
随后进行基因本体论(GO)和信号通路(KEGG)富集分析。
Cytoscape的MCODE插件用于分析差异基因的蛋白质相互作用关系。
并筛选出Hub基因并应用Kaplan-Meier分析其在肝癌患者中的总体存活率情况。
筛选得到237个DEGs(82个上调基因和155个下调基因),主要富集在视黄醇代谢通路,P53信号通路和PPAR信号通路。
从PPI网络中鉴定出2个关键子网络和29个Hub基因;并得到与肝癌患者预后不良相关的8个基因的生存曲线。
本研究可为HCC的发生发展的机制研究和药物靶点提供新的研究方向。
关键词肝细胞癌(HCC),差异基因,KEGG信号通路,蛋白质-蛋白质相互作用,Hub基因Identification of Key Genes and Pathways in Hepatocellular Carcinoma Using Bioinformatics AnalysisYin Songna Zhang Xiang*Du Juan Chen YahuiYan'an University Medical College,Yan'an,716000*Corresponding author,**********************DOI:10.13417/j.gab.039.004345Abstract Hepatocellular carcinoma(HCC)is one of the cancers species with high mortality rates.The purpose of this study is to provide more data for the underlying mechanism of HCC,which could be useful for the research of gene therapy.The array data of GSE62232was downloaded from GEO database,including10normal liver samples,and81HCC liver tumors corresponding to81patients.The differentially expressed genes(DEGs)in the HCC tumor tissues compared with the normal liver tissue were analyzed with limma package.The gene ontology(GO)and Kyoto Encyclopedia of Gene and Genomes pathway(KEGG)enrichment analyses were performed subsequently. The Molecular Complex Detection(MCODE)plug-in in Cytoscape was applied to identify protein-protein interaction (PPI)network of the DEGs.Hub genes were picked out and the Kaplan-Meier analysis for overall survival was also applied.237DEGs were identified(82up-regulated and155down-regulated genes),which were enriched in retinol metabolism,P53signaling pathway and PPAR signaling pathway.The top2modules and top29hub genes were identified from the PPI network;survival curves of8genes associated with poor prognosis in patients with liver cancer.This study could provide more data for the underlying mechanism and drug-target for HCC.Keywords Hepatocellular carcinoma(HCC),DEGs,KEGG pathway,PPI,Hub gene基金项目:本研究由陕西省教育厅专项项目(18JK0863)、陕西省教育厅专项项目(18JK0869)、延安大学博士科研启动项目(20504-0136)和延安大学校级引导项目(205100114)共同资助引用格式:Yin S.N.,Zhang X.,Du J.,and Chen Y.H.,2020,Identification of key genes and pathways in hepatocellular carcinoma using bioinformatics analysis,Jiyinzuxue Yu Yingyong Shengwuxue(Genomics and Applied Biology),39(9):4345-4352(殷松娜,张翔,杜娟,陈雅慧,2020,生物信息学分析鉴定肝细胞癌中的关键基因和信号通路,基因组学与应用生物学,39(9):4345-4352)基因组学与应用生物学肝细胞癌(hepatocellular carcinoma,HCC)在全球男性常见恶性肿瘤中占第5位,在全球女性中占第9位,每年约有500000和200000例新病例(Bray et al.,2013)。
附件3普通高等学校本科专业目录(2012年)教育部2012年9说明一、《普通高等学校本科专业目录(2012年)》是高等教育工作的基本指导性文件之一。
它规定专业划分、名称及所属门类,是设置和调整专业、实施人才培养、安排招生、授予学位、指导就业,进行教育统计和人才需求预测等工作的重要依据。
二、本目录根据《教育部关于进行普通高等学校本科专业目录修订工作的通知》(教高〔2010〕11号)要求,按照科学规范、主动适应、继承发展的修订原则,在1998年原《普通高等学校本科专业目录》及原设目录外专业的基础上,经分科类调查研究、专题论证、总体优化配置、广泛征求意见、专家审议、行政决策等过程形成的。
三、本目录的学科门类与国务院学位委员会、教育部2011年印发的《学位授予和人才培养学科目录(2011年)》的学科门类基本一致,分设哲学、经济学、法学、教育学、文学、历史学、理学、工学、农学、医学、管理学、艺术学12个学科门类。
新增了艺术学学科门类,未设军事学学科门类,其代码11预留。
专业类由修订前的73个增加到92个;专业由修订前的635种调减到506种。
本目录哲学门类下设专业类1个,4种专业;经济学门类下设专业类4个,17种专业;法学门类下设专业类6个,32种专业;教育学门类下设专业类2个,16种专业;文学门类下设专业类3个,76种专业;历史学门类下设专业类1个,6种专业;理学门类下设专业类12个,36种专业;工学门类下设专业类31个,169种专业;农学门类下设专业类7个,27种专业;医学门类下设专业类11个,44种专业;管理学门类下设专业类9个,46种专业;艺术学门类下设专业类5个,33种专业。
四、新目录分为基本专业(352种)和特设专业(154种),并确定了62种专业为国家控制布点专业。
特设专业和国家控制布点专业分别在专业代码后加“T”和“K”表示,以示区分。
五、本目录所列专业,除已注明者外,均按所在学科门类授予相应的学位。
常用生物信息学数据库生物信息学基础入门第一讲常用生物信息学数据库(1学时)•生物信息学的简介、发展和应用•常用生物信息学数据库的概况•NCBI、UCSC数据库的介绍和使用第二讲癌症相关数据库(1学时)•癌症相关数据库的概况•TCGA数据库的介绍和使用•TCGA数据的下载和解读•TCGA数据的在线分析工具第三讲基因功能富集分析(1学时)•基因本体数据库GO及注释•生物学通路KEGG及注释•基因功能富集分析第四讲基因调节网络分析(1学时)•蛋白互作、转录因子调节关系数据库的介绍和使用•非编码RNA调节网络数据库的介绍和使用•基因网络图的展示、Cytoscape软件的介绍和使用第五讲基于公共数据库进行课题研究的案例分析(1.5学时)•实例讲解GEO数据的下载、处理和分析•实例讲解TCGA数据的下载、处理和分析这节课的主要内容•生物信息学的概念•生物信息学发展的背景•生物信息学的发展阶段•生物信息学的研究领域•常用生物医学数据库•NCBI: Gene、GEO•UCSC: Genome Browser、Table Browser生物信息学的概念生物信息学(bioinformatics),是在生命科学的研究中,利用计算机科学、信息技术、应用数学以及统计学方法对生物信息进行采集、处理、存储、传播、分析和解释的学科。
生物信息学发展的背景•人类基因组计划( human genome project, HGP)是由美国科学家Robert Sinsheimer 于1985年5月率先提出(但是当时美国NIH不感兴趣)。
•经过多位科学家的努力,终于将HGP提上美国政府预算,并于1990年正式启动。
•预计2005年(15年的时间),将人类基因组的DNA序列全部测定,把人体内约2.5万个基因的密码全部解开,同时绘制出人类基因的图谱。
•美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。
•我国于1999年7月加入人类基因组计划,得到完成人类3号染色体短臂上一个约30Mb区域(约3000万个碱基对)的测序任务,该区域约占人类整个基因组的1%,称之为“1%计划”。
目录“生物信息学”课程教学大纲 (1)“预防医学概论”课程教学大纲 (4)“全科医学教育”课程教学大纲 (4)“环境医学”课程教学大纲 (5)“医用电子显微技术”课程教学大纲 (6)“机能综合实验设计”课程教学大纲 (32)“医学分子遗传学导论”课程教学大纲 (34)“生物信息学”课程教学大纲英文名称:Introduction to Medical Bioinformatics课程编号:BASM2017学时:32 学分:1.5适用对象:临床医学专业五、七年制,预防医学、法医学、口腔医学专业先修课程:分子生物学、计算机网络基础使用教材及参考书:[1]楚雍烈主编,《医用生物信息学概论》,陕西科学技术出版社,2005年[2]罗静初主编,《生物信息学》,北京大学出版社,2002年一、课程性质、目的和任务性质:选修课目的:使学生学习、掌握生物信息学的先进理论知识和技术。
掌握信息时代彼此相互学习、相互交流医学知识必不可少的现代工具和技术手段。
二、教学基本要求1.要求学生掌握生物信息学的基本理论知识和基本概念,熟悉生物信息学的相关技术方法,特别是分子生物学中常用的关键技术及常用软件。
2.考虑到生物信息学实践性很强的特点,结合生物医学实际,设计了一些实验供学生练习操作,以巩固所学的知识和技术。
要求学生熟悉生物信息学的常用网络技术方法,掌握网络技术基本要领。
三、教学内容及要求第一章生物信息学和医学信息学绪论1. 生物信息学和医学信息学的产生背景2.生物信息学和医学信息学的发展3.生物信息学和医学信息学的重要性4.生物信息学和医学信息学的研究内容第二章生物信息学和医学信息学的信息学基础1. 生物信息学和医学信息学中的计算机基础知识2. 生物信息学和医学信息学中的互联网基础知识第三章生物信息学的医学分子生物学基础1. 生物信息学和医学信息学中的分子生物学理论基础知识2. 生物信息学和医学信息学中的分子遗传学技术简介第四章生物信息学和医学信息学资源检索工具1. 生物信息学和医学信息学资源的通用新检索工具2. 生物信息学和医学信息学资源的专业搜索引擎3.综合运用搜索工具获得生物信息学和医学信息第五章生物信息学的互联网浏览和文件传输1. 生物信息学和医学信息学信息资源的网上浏览2.生物信息学和医学信息学信息资源的网上检索3.生物信息学和医学信息学信息资源的网上传输和交流4. 文档阅读和图像浏览第六章生物信息学的信息中心和数据库1. 生物信息学的重要信息中心2. 生物信息学的主要数据库第七章核酸序列比对分析1.核酸序列同源性分析2.酶切位点分析及物理图谱第八章生物信息学与核酸检测技术1.PCR 引物的设计与优化2.核酸杂交探针设计3.基因芯片与生物信息学第九章生物信息学与生物制药1.生物制药中的生物信息学2.核酸药物的设计第十章蛋白质结构与功能分析1. 蛋白质氨基酸序列的分析2.蛋白质基本结构与特性分析3. 蛋白质的高级结构、功能预测、功能域的判定第十一章基因组学与生物信息学1. 基因组结构分析2.基因的定位3.电子克隆。
乳腺导管癌差异表达基因的生物信息学分析熊萱;张远;李一;喻冬柯;童荣生【摘要】目的通过生物信息学的分析,比较乳腺导管癌和癌旁正常细胞的差异表达基因,挖掘筛选关键基因,为进一步的研究提供参考.方法通过利用ONCOMINE癌症微阵列数据库,挖掘差异表达基因,通过STRING、DAVID等工具使用生物信息学方法对其进行分析.结果挖掘出差异基因256个,其中不同分级的基因本体论(GO) 194类,京都基因与基因组百科全书数据库(KEGG)通路236种.这些基因主要与血管生成、Ⅰ型干扰素信号通路、蛋白结合等有关,参与了生物化学信号通路、癌症信号通路、细胞受体信号传导通路、促分裂素原活化蛋白激酶信号通路等.构建表达蛋白的蛋白与蛋白互相作用的网络图,提示这些基因的表达产物大部分存在密切的相互作用.结论通过对乳腺导管癌易感差异基因的分析,对其易感基因有了系统的认识,针对关键基因的大样本研究及网络化基因分析是未来的研究方向.【期刊名称】《贵州医药》【年(卷),期】2018(042)009【总页数】5页(P1027-1030,封3)【关键词】乳腺癌;导管癌;生物信息学【作者】熊萱;张远;李一;喻冬柯;童荣生【作者单位】四川省医学科学院/四川省人民医院/电子科技大学附属医院药学部& 个体化药物治疗四川省重点实验室,四川成都610072;四川省医学科学院/四川省人民医院/电子科技大学附属医院药学部 & 个体化药物治疗四川省重点实验室,四川成都610072;电子科技大学附属医院/四川省人民医院乳腺科,四川成都610072;四川省医学科学院/四川省人民医院/电子科技大学附属医院药学部 & 个体化药物治疗四川省重点实验室,四川成都610072;四川省医学科学院/四川省人民医院/电子科技大学附属医院药学部 & 个体化药物治疗四川省重点实验室,四川成都610072【正文语种】中文【中图分类】R318.04乳腺癌是全世界女性最常见的恶性肿瘤,根据国际癌症研究所(IARC)发布的2012年全球癌症报告数据显示,全球每年新发乳腺癌病例约为167.1万。
16Ungefapu H,Witt e D,aehpeP H.The role of smal l GTPascs of the Rhc/Rao family in TGF-j-SddceU EMT and cell motility in cancer 〔〕.Du Dyp,202;247(5):431-9017Li Y,Zhang T,Qin S,tt a.Effects of UPF1expression on EMT proces s by i—e/ng E cakhe/v,N cakhe/v,Vimentiv and Twist in a heuatocellulas capinoma cell/ne〔J〕.Mol MeU Rep,203;3(3): 213764301薛艳梅,王平,杜新芝,等■FOXC2基因多态性和2型糖尿病胰岛素抵抗的关系中国临床研究,202;31(0):357A31潘虹旭.Fvc2对骨和脂肪组织的调节作用研究进展中国骨质疏松杂志,2017;23(3):112-0.20He Y,Xie H,Yu P,et a.FOXC2promotes euithelial-meseuckymai Wansition and cisplatin psisSnce of non-small cell Ung cancer cells 〔J〕.Cancer Chemother Pharmacol,2018;12(6):1949A9.21Zhang H,Wu X,Xiac Y,et al.CoexpressSn of FOXK1and vimentiv promotes EMT,migration:and invasion in gast/c cancer cells〔J〕.J Moi Med,203;97(2):35A6.22金鑫,钱军,喻大军,等.FOXC-7,YBA在胃癌组织中的表达及在侵袭转移中的作用〔〕•四川大学学报:医学版,202;49(2):2156200[2519A9A2修回〕(编辑王一涵)利用生物信息学分析鼻咽癌关键基因和信号通路赵琳、何章彪、张欣2曹翠萍、(1商丘医学高等专科学校,河南商丘776000;2南阳医学高等专科学校)〔摘要〕目的通过生物信息学分析来确定鼻咽癌的关键途径和基因,并确定鼻咽癌增殖和发展的潜在分子机制。
山东医药2021年第61卷第5期人STN1蛋白结构、功能的生物信息学分析刘志佳,赵晓彤,赵雯月,柳杨,刘强中国医学科学院放射医学研究所,天津300192摘要:目的基于生物信息学分析人STN1蛋白的结构、功能。
方法从Uniprot 数据库中获取人STN1蛋白氨基酸序列,使用ProtParam 在线工具分析其理化性质,DNAMAN 软件分析其亲/疏水性,通过Genecar 网站查看其在细胞中的分布。
分别通过PSIPRED 网站、PDB 数据库、Uniprot 网站和NCBI Conserved Domain 数据库预测人STN1蛋白的二级结构、三级结构、结构域及保守结构域。
通过NCBI 网站及DNAMAN 软件对人STN1蛋白进行多重序列比对,通过MEGA 软件构建系统进化树。
利用GPS5.0软件预测人STN1蛋白的磷酸化及乙酰化位点,使用AmiGO2网站对人STN1蛋白进行基因本体(GO )分析,Reactome 在线工具查看其参与的信号通路。
通过STRING 数据库预测人STN1蛋白的相互作用蛋白,K -Means 算法对相互作用蛋白进行聚类分析。
结果人STN1蛋白由368个氨基酸组成,是一种偏酸性、不稳定、疏水的胞内蛋白,在进化过程中高度保守。
其由一个OB 结构域和两个wHTH 基序组成,其中wHTH 区域为人STN1蛋白的保守区;OB 结构域涵盖了大部分(77.8%)的磷酸化位点。
GO 分析显示,在分子功能方面,人STN1蛋白主要具有与蛋白质、DNA 结合的功能;在生物学途径方面,人STN1蛋白对端粒酶具有负调控作用,也是DNA 复制的正调控因子。
人STN1蛋白除可与TEN1、CTC1形成复合物外,还可与8个介体复合物亚基直接结合。
结论人STN1蛋白为偏酸性、不稳定、疏水的胞内蛋白,其组成包括一个OB 结构域和两个wHTH 基序,是参与基因组复制调控和维持端粒稳态的重要蛋白。
关键词:人STN1蛋白;结构;功能;生物信息学doi :10.3969/j.issn.1002-266X.2021.05.007中图分类号:R73-3文献标志码:A文章编号:1002-266X (2021)05-0026-05Bioinformatics analysis of structure and function of human STN1protein LIU Zhijia ,ZHAO Xiaotong ,ZHAO Wenyue ,LIU Yang ,LIU QiangInstitute of Radiation Medicine ,Chinese Academy of Medical Sciences ,Tianjin 300192,ChinaAbstract :Objective To analyze the structure and function of human STN1protein based on bioinformatics.Meth⁃odsWe obtained the amino acid sequence of human STN1protein from Uniprot database ,used ProtParam online tool toanalyze its physical and chemical properties ,DNAMAN software to analyze its affinity/hydrophobicity ,and checked its dis⁃tribution in cells through the Genecar website.The secondary structure ,tertiary structure ,domain and conserved domain of human STN1protein were predicted by PSIPRED ,PDB ,Uniprot and NCBI Conserved Domain ,respectively.Multiple sequence alignments of human STN1protein were carried out through NCBI website and DNAMAN software ,and a phylo⁃genetic tree was constructed through MEGA software.We employed GPS5.0software to predict the phosphorylation andacetylation sites of human STN1protein ,used the AmiGO2to perform gene ontology (GO )analysis on human STN1pro⁃tein ,and employed the Reactome online tool to view the signal pathways which they participated in.The interacting pro⁃teins of human STN1protein were predicted by STRING database ,and the K -Means algorithm was used to cluster the inter⁃acting proteins.ResultsThe human STN1protein was composed of 368amino acids.It was an acidic ,unstable ,andhydrophobic intracellular protein that was highly conserved during evolution.It consisted of an OB domain and two wHTHmotifs ,where the wHTH region was a conserved region of human STN1protein ;the OB domain covered most (77.8%)phosphorylation sites.GO analysis showed that in terms of molecular function ,human STN1protein mainly had the func⁃tion of binding to protein and DNA ;in terms of biological pathways ,human STN1protein had a negative regulatory effect on telomerase and was also a positive regulator of DNA replication.In addition to forming a complex with TEN1and CTC1,human STN1protein could also directly bind to eight mediator complex subunits.ConclusionsThe human STN1protein基金项目:国家自然科学基金面上项目(81772243);天津市自然科学基金面上项目(17JCYBJC42700);中国医学科学院医学与健康科技创新工程项目(2017-I2M -1-016)。
二倍体棉花热激转录因子HSFs家族全基因组生物信息学分析张华崇;闫振华;赵树琪;黄晓莉;戴宝生;李蔚【期刊名称】《江苏农业科学》【年(卷),期】2017(045)020【摘要】热激因子(heat shock factors,HSFs)是生物体内调节热激应答的一类转录因子,在热胁迫信号转导和耐热性的产生过程中发挥了重要的作用.从已释放的二倍体亚洲棉和雷蒙德氏棉全基因组测序结果中分别鉴定到42个和40个HSFs蛋白家族成员,运用生物信息学分析其序列特征、亚细胞定位、聚类分析和保守基序等.结果表明,亚洲棉HSFs蛋白长度116~526个氨基酸,分子量13748.4~60028.2 u,等电点4.40~8.75;雷蒙德氏棉HSFs蛋白长度为190~528个氨基酸,分子量21993.0~60413.6 u,等电点4.36~9.50.染色体定位显示二倍体棉花中的HSFs基因不均匀分布在13条染色体上;聚类分析表明,HSFs蛋白序列分为A、B、C 3类,每一亚类中二倍体棉花与拟南芥的蛋白具有较高的同源性,趋向于聚集在一起,且每个亚组具有相同或相似的保守基序类型及排列顺序.【总页数】8页(P35-42)【作者】张华崇;闫振华;赵树琪;黄晓莉;戴宝生;李蔚【作者单位】黄冈市农业科学院,湖北黄冈438000;黄冈市农业科学院,湖北黄冈438000;黄冈市农业科学院,湖北黄冈438000;黄冈市农业科学院,湖北黄冈438000;黄冈市农业科学院,湖北黄冈438000;黄冈市农业科学院,湖北黄冈438000【正文语种】中文【中图分类】Q755【相关文献】1.黄瓜全基因组热激转录因子(HSFs)的鉴定与表达分析 [J], 陈先知;王燕;史建磊;朱隆静;王克磊;徐坚2.铁皮石斛热激转录因子(Hsf)基因家族鉴定及生物信息学分析 [J], 韩利红;刘潮;张维维;李发;邓发虎;阮子恒3.铁皮石斛热激转录因子(Hsf)基因家族鉴定及生物信息学分析 [J], 韩利红; 刘潮; 张维维; 李发; 邓发虎; 阮子恒4.谷子bZIP转录因子家族的全基因组鉴定与生物信息学分析 [J], 卢平;武懿茂;武强强;李雪垠5.甜瓜热激转录因子(Hsf)基因家族鉴定及生物信息学分析 [J], 司修洋;梁文杰;罗澜;汪宇欣;刘大伟因版权原因,仅展示原文概要,查看原文内容请购买。
本栏目责任编辑:王力本期推荐小细胞肺癌相关基因的生物信息学分析张婕1,戴巍2,冯宇2,叶佳琪2(1.徐州医科大学生命科学学院,江苏徐州,221004;2.徐州医科大学医学信息与工程学院,江苏徐州,221004)摘要:运用生物信息学方法分析小细胞肺癌的相关基因,选取GEO 数据库基因芯片数据集GSE66635进行深入挖掘,通过GEO2R 筛选差异表达基因,并利用R 软件对其进行聚类分析、DAVID 数据库进行GO 功能和KEGG 通路富集分析、STRING 数据库和Cytoscape 软件构建蛋白质相互作用网络,最终得到6个关键基因:TP53,CCL2,FGF2,FOS ,FGFR4,PGF ,其所参与的生物学过程等可能与小细胞肺癌的发生、发展相关。
关键词:生物信息学;相关基因;小细胞肺癌中图分类号:R319文献标识码:A文章编号:1009-3044(2020)34-0014-03开放科学(资源服务)标识码(OSID ):小细胞肺癌(small cell lung cancer ,SCLC)是一类恶性程度高的肺癌,虽然只占肺癌的13%-15%,但是其死亡率极高[1]。
有关研究表明,SCLC 是多个分子水平改变累积的结果,单靶点的抑制对SCLC 的治疗作用有限[1]。
由于SCLC 的复杂性及其发病机制的不明确性导致研究人员无法确定靶向治疗的靶点,因此我们需要更深入地研究与SCLC 发生发展相关的基因。
随着精准医疗的发展,生物信息学分析技术的成熟为癌症的诊治提供更为广泛的空间。
由于生物信息学数据库及其分析软件的种类多样性和开放共享性,使得利用生物信息分析方法识别疾病相关的治疗靶基因成为可能。
其中,NCBI 的GEO 数据库中有着大量的基因芯片数据集,其具有更新快、大规模等优点,而且易于共享,避免在数据采集等方面浪费大量时间,因此在生命科学领域的研究中运用逐渐广泛[2]。
本研究通过生物信息学方法挖掘SCLC 基因芯片数据集GSE66625,利用计算机分析预测SCLC 的潜在相关基因,从分子层面探讨SCLC 可能的作用机制。
5. 论述CRISPR/CAS9和TALENs基因编辑的原理和各自的优缺点?(25分)
CRISPR/Cas9是细菌和古细菌在长期演化过程中形成的一种适应性免疫防御,可用来对抗入侵的病毒及外源DNA。
CRISPR/Cas9 系统通过将入侵噬菌体和质粒 DNA 的片段整合到 CRISPR 中,并利用相应的 CRISPR RNAs(crRNAs)来指导同源序列的降解,从而提供免疫性。
(1)原理:系统的工作原理是 crRNA( CRISPR-derived RNA )通过碱基配对与 tracrRNA (trans-activating RNA )结合形成 tracrRNA/crRNA 复合物,此复合物引导核酸酶 Cas9 蛋白在与 crRNA 配对的序列靶位点剪切双链DNA。
而通过人工设计这两种 RNA,可以改造形成具有引导作用的sgRNA (singleguide RNA ),足以引导 Cas9 对 DNA 的定点切割。
作为一种 RNA 导向的 dsDNA 结合蛋白,Cas9 效应物核酸酶是已知的第一个统一因子(unifying factor),能够共定位 RNA、DNA 和蛋白,从而拥有巨大的改造潜力。
将蛋白与无核酸酶的 Cas9( Cas9 nuclease-null)融合,并表达适当的 sgRNA ,可靶定任何 dsDNA 序列,而 sgRNA 的末端可连接到目标DNA,不影响 Cas9 的结合。
因此,Cas9 能在任何 dsDNA 序列处带来任何融合蛋白及 RNA,这为生物体的研究和改造带来巨大潜力。
(2)优缺点:CRISPR (Clustered Regularly Interspersed Short Palindromic Repeats)是细菌用来抵御病毒侵袭/躲避哺乳动物免疫反应的基因系统。
科学家们利用RNA引导Cas9核酸酶可在多种细胞(包括iPS)的特定的基因组位点上进行切割,修饰。
Rudolf Jaenisch 研究组将Cas9与Te1和Tet2特异的sgRNA共注射到小鼠的受精卵中,成功得到双基因敲除的纯合子小鼠,效率高达80%。
他们将Cas9/sgRNA 与带突变序列的引物共注射,能准确在小鼠两个基因引入所要的点突变。
在ES细胞中他们更是成功的一次敲除了五个基因。
与ZFN/TALEN相比,CRISPR/Cas更易于操作,效率更高,更容易得到纯合子突变体,而且可以在不同的位点同时引入多个突变。
但该系统是否有脱靶效应尚需进一步的研究。
TALENs(transcription activator-like (TAL) effector nucleases)的中文名为转录激活因子样效应物核酸酶,是基因组编辑核酸酶三大类之一。
它是实现基因敲除、敲入或转录激活等靶向基因组编辑的里程碑。
(1)原理:TALENs充分利用植物病原菌黄单胞菌(Xanthomonas)自然分泌的蛋白---即激活子样效应物(TAL effectors, TALEs)---的功能:该蛋白能够识别特异性DNA碱基对。
人们可以设计一串合适的TALEs来识别和结合到任何特定序列,如果再附加一个在特定位点切断DNA双链的核酸酶,就可以构建出TALEN,利用这种TALEN就可以在细胞基因组中引入新的遗传物质。
相对锌指核酸酶(zinc-finger nuclease, ZFN)而言,TALEN能够靶向更长的基因序列,而且也更容易构建。
但是直到现在,人们一直都没有一种低成本的而且公开能够获得的方法来快速地产生大量的TALENs。
(2)优缺点:相比于传统的锌指核酸酶(ZFNs)技术,TALENs具有独特的优势:设计更简单,特异性更高。
缺点有:具有一定细胞毒性,模块组装过程繁琐,
一般需要求助于外包公司。
但TALEN技术仍然是科研人员用于研究基因功能和潜在基因治疗应用的重要工具。