微生物分子生态学常用软件使用方法
- 格式:pdf
- 大小:1011.73 KB
- 文档页数:18
生物信息学软件的使用教程与数据分析生物信息学是一门结合生物学和计算机科学的学科,通过利用计算机科学和统计学的方法来研究生物学中的大规模生物分子数据。
在生物研究中,大量的生物信息数据被产生,如基因组测序数据、蛋白质结构数据、转录组数据等,这些数据的分析对于理解生物过程和疾病发生机制至关重要。
生物信息学软件是专门用于处理和分析这些生物信息数据的工具。
本文将介绍一些常见的生物信息学软件的使用教程和数据分析方法。
1. BLAST(Basic Local Alignment Search Tool):BLAST是最常用的序列比对工具之一,用于在数据库中寻找类似序列或通过序列相似性比对两个或多个序列。
BLAST可以用于查找一个给定的序列是否存在于一个已知的数据库中,也可用于快速比较两个序列的相似性,并寻找具有高度相似性的区域。
在使用BLAST时,首先需要选择合适的数据库,然后输入待比对的序列,设置相似性阈值和其他参数,最后运行BLAST程序并分析结果。
2. NCBI(National Center for Biotechnology Information)工具:NCBI提供了许多生物信息学工具,如BLAST、Entrez等。
Entrez是一个可检索多种生物信息学数据库的工具,包括GenBank(存储核酸序列)、PubMed(存储科学文献摘要与索引)、Protein(蛋白质序列数据库)等。
通过使用NCBI提供的工具,可以比对和分析大量的生物序列和相关的生物信息。
使用NCBI工具时,可以通过访问NCBI网站或使用命令行工具来查询和分析数据。
3. R和Bioconductor:R是一种用于统计计算和数据可视化的自由软件环境,而Bioconductor是一个在R环境中为生物学研究提供的开源生物信息学软件包。
R和Bioconductor提供了丰富的统计和生物信息学分析方法,可用于分析基因表达数据、基因组测序数据、蛋白质结构数据等。
Q1.怎么查找序列保守区?A1:很多人查找序列保守区,一般通过序列多重比对后,肉眼判断序列保守区,但此法难免太主观,不具重复性,且选择的保守区无法受统计上的显著性检验。
其实,实现这一目的,可以使用DnaSP--> “Analysis” -->“Conserved DNA region”...【Raindy 注】设计简并引物,用此法,简单易用,强烈推荐...Q2. 多个 FASTA格式保存的单条序列如何批量快速合并为一个文件?A2 :一条条添加,费时费劲,且容易出错。
解决的办法有两个:一是可以通过DNAMAN 的“多重序列比对”后导出功能,即:添加序列所在的目录,或全选相关文件,进行多重比对,导出Clustal aln 文件,然后再转换为FASTA;二是使用我们2012年新开发的序列火枪手套件的“Seq Merger.exe” 即可快速实现合并。
Q3. 如何解决 Clustalx 多重比对(*.Aln格式)后转为MEGA 格式时提示出错的问题?A3:检查所转换 MEGA 的 *.meg 文件最后几行内容是否有*号,全部删减之即可。
因为Clustalx 多重比对后,程序会自动添加一致序列。
Q4. 为什么DNAMAN软件的很多功能菜单都显示无法使用?A4:DNAMAN软件的精华在于通道(Channel)的应用,遇到功能菜单呈灰度无法使用时,不妨将序列载入通道后再试试...Q5. 如何让多重比对美观显示又不占篇幅?A5:推荐使用Web Logo (/logo.cgi)或 Sequence Logo之类的在线工具处理。
其实这类工具还有一个妙用-可用于设计简并引物,简并序列一目了然,如下图的第7个碱其位点,G/A=R。
Q6. 如何在多重比对序列的上方显示对应的蛋白质二级结构?A6:使用 ESPript(http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi)对多重比对序列着色的同时,上传预测的蛋白质结构文件*.pdb 即可,效果如下图所示,也可以下载《马铃薯Y病毒pipo基因的分子变异及结构特征分析》一文参考。
分子生物学实验中的分析软件使用方法介绍随着科技的发展和进步,分子生物学实验的数据量不断增加,对于这些大量的数据进行分析成为了科研工作者不可或缺的一部分。
为了更好地处理和解读这些数据,科研人员们使用各种分析软件来辅助他们的研究工作。
本文将介绍一些常用的分析软件及其使用方法。
一、基因序列分析软件基因序列分析软件是分子生物学实验中最常用的软件之一,它们用于分析DNA或RNA序列以及蛋白质序列。
其中,NCBI Blast是一种非常常用的基因序列比对软件,它可以通过将待比对的序列与已知的序列数据库进行比对,从而确定序列的相关性和相似性。
使用NCBI Blast,我们可以快速找到与我们研究对象相关的序列信息。
二、基因表达分析软件基因表达分析软件用于分析基因在不同组织或条件下的表达水平,以及基因调控网络等。
在这方面,R语言是一种非常强大的工具。
通过使用R语言中的各种包和函数,我们可以对基因表达数据进行聚类分析、差异表达分析、通路富集分析等。
同时,R语言还提供了丰富的数据可视化功能,可以帮助我们更好地展示和解读实验结果。
三、蛋白质结构分析软件蛋白质结构分析软件主要用于预测蛋白质的三维结构以及模拟蛋白质的动力学行为。
其中,Swiss-PdbViewer是一种常用的蛋白质结构可视化软件,它可以帮助我们观察和分析蛋白质的结构特征。
而GROMACS则是一种常用的分子动力学模拟软件,它可以模拟蛋白质在不同环境下的运动轨迹,帮助我们理解蛋白质的功能和机制。
四、基因组学分析软件基因组学分析软件主要用于处理和分析整个基因组的数据,包括基因组序列、基因组注释以及基因组变异等。
在这方面,Ensembl是一种非常常用的基因组分析软件。
它提供了大量的基因组数据和工具,可以帮助我们进行基因组注释、基因组比对以及基因组变异的分析。
五、细胞图像分析软件细胞图像分析软件用于分析和处理细胞图像数据,帮助我们了解细胞的形态和功能。
其中,ImageJ是一种非常流行的细胞图像分析软件,它提供了丰富的图像处理和分析工具,可以帮助我们进行细胞计数、细胞形态分析以及细胞追踪等。
生物信息学工具的使用教程及其在生态保护中的应用随着生物学研究的快速发展,生物信息学成为了解析生物学大数据和推动生物研究的重要工具之一。
生物信息学工具通过利用计算机技术和统计学分析,能够从海量的生物学数据中提取有意义的信息。
本文将介绍几种常用的生物信息学工具及其在生态保护领域的应用。
一、BLAST:快速定位序列相似性BLAST(Basic Local Alignment Search Tool)是一种广泛应用于基因组学、生物信息学和生物工程的序列比对工具。
BLAST可以通过指定一个查询序列,快速地在数据库中搜索相似的序列。
它可以用于比对DNA序列、蛋白质序列甚至整个基因组来寻找相似性。
在生态保护中,BLAST可以用于快速鉴定物种和确定无脊椎动物在某一区域的遗传多样性。
通过将采集到的样品DNA序列与已知的DNA数据库进行BLAST比对,可以精确地鉴定物种和评估其种群结构。
二、PhyloBayes:系统发育推断PhyloBayes是一种基于贝叶斯统计方法的系统发育分析工具。
它能够根据DNA或蛋白质序列的比对结果,利用基因演化模型构建物种间的系统进化关系。
与传统的最大似然方法相比,PhyloBayes能够更准确地还原物种的演化历史。
在生态保护中,PhyloBayes可以用于研究物种的起源和演化关系,评估物种的多样性和分布格局。
通过对不同物种的系统发育分析,可以揭示它们之间的种属关系,为生态保护工作提供指导。
三、R语言和Python:数据分析和可视化R语言和Python是两种常用的科学计算语言,它们广泛应用于生物信息学中的数据分析和可视化。
R语言拥有强大的统计分析和可视化软件包,而Python则具有丰富的科学计算库,使得二者成为生物信息学工具开发和应用的首选语言。
在生态保护中,R语言和Python可以用于生物群落分析、物种分布建模和环境数据处理。
通过对野外调查数据的统计分析和可视化,可以更好地了解物种多样性和环境变化,帮助制定生态保护策略。
PHYLIP使用下面介绍几个软件的使用。
首先是PHYLIP。
其是多个软件的压缩包,下载后双击则自动解压。
当你解压后就挥发现PHYLIP的功能极其强大,主要包括五个方面的功能软件:i,DNA 和蛋白质序列数据的分析软件。
ii,序列数据转变成距离数据后,对距离数据分析的软件。
iii,对基因频率和连续的元素分析的软件。
iv,把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。
v,按照DOLLO简约性算法对序列进行分析的软件。
vi,绘制和修改进化树的软件。
在此,我主要对前两种功能软件进行说明。
我们现在有几个序列如下:Mo3ATGTATTTCGTACA TTACTGCCAGCCACCA TGAATATTGCACGGTACCATMo5ATGTATTTCGTACA TTACTGCCAGCCACCA TGAATATTGTACGGTACCATMo6ATGTATTTCGTACA TTACTGCCAGCCACCA TGAATATTGTACGGTACCATMo7ATGTATTTCGTACA TTACTGCCAGCCACCA TGAATATTGTACAGTACCA TMo8ATGTATTTCGTACA TTACTGCCAGCCACCA TGAATATTGTACAGTACCATMo9ATGTATCTCGTACATTACTGCCAGCCACCA TGAATATTGTACGGTACCATMo12ATGTATTTCGTACA TTACTG CCAGCCACCA TGAATATTGTACGGTACCA TMo13ATGTATCTCGTACATTACTGCCAGCCACCA TGAATATTGTACGGTACCAT要对这8个序列进行进化树分析,按照上面的步骤,首先用CLUSTALX排列序列,输出格式为*.PHY。
用记事本打开如下图:图中的8和50分别表示8个序列和每个序列有50个碱基。
然后,打开软件SEQBOOT,如下图:按路径输入刚才生成的*.PHY文件,并在Random number seed (must be odd) ?的下面输入一个4N+1的数字后,屏幕显示如下:图中的D、J、R、I、O、1、2代表可选择的选项,键入这些字母,程序的条件就会发生改变。
在互联网上,有很多软件可以解决对单个基因进行研究的分子生物实验人员从立项到最后写论文的实际问题。
以下是在对相同作用的很多软件进行比较后,推荐给一线实验人员使用的Windows应用软件。
一、资料收集整理阶段二、序列分析、实验设计模拟阶段三、实验操作和数据分析阶段四、文章写作和结果发表阶段五、分子生物学实验室常用数据库一、资料收集整理本阶段需要查找某个项目专题的文章,并写出对该专题的综述,以便对自己所要做的课题的现状有一个基本的了解。
★推荐软件:Reference Manager 10.0同类参考软件:Endnote 6.0二、序列分析、实验设计模拟1.综合性软件这类软件要求对本阶段上述的大部分功能均具备,而且这类软件在一些专项分析上仍有绝对优势。
★推荐软件:DNASTAR同类参考软件:Vector NTI Suite 6.0、Omiga 2.0、DNASIS 2.5、DNATools 5.12.制酶分析可能是最简单的功能了,用普通的文本搜索也能找出相应的序列位点。
正因如此,我们希望软件在结果输出上有更完美的表现。
另外几乎所有的软件都没有考虑在酶切位点前应该有保护碱基,所以该分析通过,并不能在实验中总能通过。
★推荐软件:DNAssist 1.0同类参考软件:Primer Premier 5.0、Vector NTI Suite 6.0和其他多种软件3.引物设计引物设计一般包括用于检测和用于进一步分子操作的引物。
其中用于分子操作的在原来序列上设计,加上接头和保护碱基。
但几乎所有软件都没有考虑接头和保护碱基的设计。
因此能否对假定的引物进行各种属性的分析,参考各种结果,最后找到合适的引物序列便成为选择软件的最关键。
★推荐软件:Primer3同类参考软件:Primer Premier 5.0,Vector NTI Suite 6.0 DNAClub、Oligo 5.04.序列比对序列比对包括部分完全相同序列查找和序列相似性排列两类。
附录3分子生态学统计软件介绍分子生态学是研究生命系统与环境系统相互作用的分子基础与分子机理的崭新的分子生物学与生态学的交叉学科,是从基因、蛋白质、酶等生物分子活动规律来阐释生态规律进化、生态过程、适应和演变历程(Burke et al ,1992; Bachmann et al ,1994)。
这些研究通常会产生大量而复杂的分子数据,选择合适的统计方法对正确的解释科学现象是非常重要的。
以下就介绍几类常用的分子生态学软件。
3.1 遗传多样性与遗传结构分析软件遗传多样性是生物多样性的基础,丰富的遗传多样性可以提供很多宝贵的遗传资源。
因此为了对天然群体的遗传多样性研究,分子生态学专家开发出了一系列的评估软件,用于计算和检测生物群体基因变异的度量和遗传指标,其中用得比较广泛的有POPGENE 、STRUCTURES 、GENEPOP 、GenAlEx 6、NTSYSpc 、FSTAT 等。
POPGENE 是由Francis Yeh 等人开发的用共显性和显性标记来研究群体内和群体间的遗传多样性。
这个软件操作较简单,功能也比较全,主要包括计算广泛的遗传学数据如等位基因频率、遗传多样性、遗传距离、G -statistics 、F -statistics 等以及复杂的遗传学数据基因流、中性检测、连锁不平衡、多位点结构等。
新版本的POPGENE 还可用来分析数量遗传变异以及提供更高质量的系统聚类图。
POPGENE 下载地址:http://www.ualberta.ca/~fyeh/download.htmFSTAT 软件包是Jérôme Goudet 开发的用于计算共显性标记的遗传多样性和遗传分化参数。
主要功能如下:检测样本和总体水平上的基因频率,观察和期望基因型,等位基因数,基因丰富度;检测整体水平上以及每个样本或位点是否处于哈温平衡; Nei's (1987)的遗传多样性和遗传分化的估计值和 Weir & Cockerham (1984)每个等位基因,每个位点以及总体上的Capf (Fit), theta (F st )和smallf (F is)的估计值;检测R- statistics (Slatkin , 1995),5 将原始数据转化成Genepop 的格式等。
常用分子生物学软件的入门介绍一、基因芯片:1、基因芯片综合分析软件。
ArrayVision 7.0一种功能强大的商业版基因芯片分析软件,不仅可以进行图像分析,还可以进行数据处理,方便protocol的管理功能强大,商业版正式版:6900美元。
Arraypro 4.0Media Cybernetics公司的产品,该公司的gelpro, imagepro一直以精确成为同类产品中的佼佼者,相信arraypro也不会差。
phoretix™Array Nonlinear Dynamics公司的基因片综合分析软件。
J-express挪威Bergen大学编写,是一个用JAVA语言写的应用程序,界面清晰漂亮,用来分析微矩阵(microarray)实验获得的基因表达数据,需要下载安装JAVA运行环境JRE1.2后(5.1M)后,才能运行。
2、基因芯片阅读图像分析软件ScanAlyze 2.44斯坦福的基因芯片基因芯片阅读软件,进行微矩阵荧光图像分析,包括半自动定义格栅与像素点分析。
输出为分隔的文本格式,可很容易地转化为任何数据库。
3、基因芯片数据分析软件Cluster斯坦福的对大量微矩阵数据组进行各种簇(Cluster)分析与其它各种处理的软件。
SAMSignificance Analysis of Microarrays 的缩写,微矩阵显著性分析软件,EXCEL软件的插件,由Stanford大学编制。
4.基因芯片聚类图形显示TreeView 1.5斯坦福开发的用来显示Cluster软件分析的图形化结果。
现已和Cluster成为了基因芯片处理的标准软件。
FreeView是基于JAVA语言的系统树生成软件,接收Cluster生成的数据,比Treeview增强了某些功能。
5.基因芯片引物设计Array Designer 2.00DNA微矩阵(microarray)软件,批量设计DNA和寡核苷酸引物工具常用分子生物学软件的入门介绍二、RNA二级结构。
常用分子生物学软件(二)引言概述:随着分子生物学研究的不断深入,分析和处理分子生物学数据的需求日益增长。
为了满足这一需求,许多常用的分子生物学软件被广泛应用于实验室和研究机构中。
本文将介绍一些常用的分子生物学软件,以帮助研究人员更好地理解和应用这些工具进行数据分析和实验设计。
正文:1. 序列分析软件1.1 BLAST:用于快速比对蛋白质或核酸序列,帮助确认其他物种中是否存在与查询序列相似的序列。
1.2 ClustalW:用于多序列比对分析,可以对多个序列进行比较,并生成比对结果。
2. 基因表达和调控软件2.1 DESeq2:用于差异表达分析,可以识别和分析基因在不同样本或条件下的表达差异。
2.2 MEME:用于寻找和分析DNA、RNA或蛋白质序列中的共同模otif,帮助识别某些转录因子的结合位点。
3. 蛋白质结构预测软件3.1 SWISS-MODEL:基于比对分析和模板结构预测,可以预测目标蛋白质的三维结构。
3.2 Phyre2:利用比对、结构推理和模板模拟方法,用于蛋白质序列到结构的预测。
4. 分子模拟软件4.1 GROMACS:用于分子动力学模拟的软件套件,可以模拟蛋白质、核酸和膜蛋白等生物分子的运动和相互作用情况。
4.2 AMBER:常用的分子模拟软件,用于模拟和分析生物大分子的结构、动力学和能量。
5. 生物网络分析软件5.1 Cytoscape:用于构建和分析复杂网络的开源软件平台,尤其适用于生物学领域中的生物网络分析。
5.2 STRING:用于生物网络分析和预测蛋白质相互作用的在线工具,可以帮助解析基因或蛋白质之间的关系网络。
总结:本文介绍了常用的分子生物学软件,包括序列分析、基因表达和调控、蛋白质结构预测、分子模拟和生物网络分析等方面的工具。
这些软件的使用可以帮助研究人员更好地理解、分析和解释分子生物学数据,促进科学研究的进展和创新。
实验七微生物分子生态学常用软件使用方法微生物生态学研究中测序已经成为一项常规的必不可少的分析手段,实验后常常会得到大量的核酸序列,有的是细菌基因组上随机的序列片断,有的是16S rRNA基因的克隆文库,有的是功能基因序列等等,如此海量的序列数据,需要进行正确、快速和有效的分析,熟练掌握各种生物学软件的使用方法就显得尤为重要。
这里我们主要介绍如何进行序列同源性分析,如何构建系统进化树,如何对克隆文库进行分析,如何对DNA指纹图谱进行比较分析,介绍相关软件的使用方法。
一、实验原理这里简要介绍序列数据分析过程中用到的软件:BLAST是NCBI(the National Center for Biotechnology Information)的一项服务。
BLAST在网络上可以直接使用,我们可以提交序列,并与NCBI数据库(GenBank+EMBL+DDBJ+PDB sequences)进行比对,之后会将一系列的结果返回给用户。
GeneTool可以进行核酸分析,本文中主要用于去除载体序列。
ClustalX 1.8:广泛使用的多序列比对程序,在ClustalW多序列比对程序的基础上增加了图形用户界面。
输入为多序列的Fasta格式文件,进行多序列全局比对生成结果的同时,在指定文件夹生成“.dnd”和“.aln”格式文件。
PhyloDraw 0.8:构建进化树的绘图工具,它支持多种多序列比对软件的Multiple Alignment 结果。
本实验采用ClustalX进行多序列比对,生成“.dnd”格式的比对文件,最后用PhyloDraw 画出序列进化树。
它支持Unrooted tree(无根树)、Rooted tree(有根树)、Radial tree(放射状树)、Rectangle cladogram(矩形进化分支树)、Slated cladogram和Phylogram(序列进化树)。
这些都是不同的树型,结果是一致的。
☆分子生物实验必备的软件介绍分子生物实验必备软件在互联网上,有很多软件可以解决分子生物实验人员从立项到最后写论文的实际问题。
本文提供了对相同作用的很多软件进行比较后推荐给一线实验人员使用的软件。
一、资料收集整理阶段。
在这一阶段,需要查找某个专题的文章,并写出对该专题的综述,以便对自己所要做的课题的现状有一个基本的了解。
推荐软件:Reference Manager 9.0优点:可以在线通过查找关键词搜索PubMed和609个Z39.50数据库中的专业资料,保存查找的资料为本地文件。
资料内容和记录分上下两个屏幕,如有全文或想连接网络时点击一个键就可以到相应的全文文章和摘要。
可以直接在WORD中查找资料,插入引用,并在文章中对引用格式化}用的参考资料格式有很强的用户自定义功能,可以符合各种杂志对引用格式的要求,资料内容和记录分上下两个屏幕(不用在引用时多窗口切换)。
缺点:没有非常明显的缺点。
同类参考软件:Endnote 3.1.2二、序列分析、实验设计阶段。
这一阶段包括限制酶分析、引物设计、同源序列比较、质粒作图、结构域(motif) 查找、RNA 二级结构预测、蛋白二级结构分析、克隆策略图谱、三维结构显示等方面的内容。
1 、综合性软件。
这类软件要求对本阶段上述的大部分功能均具备,但这类软件大多在专项分析上没有优势。
推荐软件:Omiga 2.0优点:你所能想到的大部分对核酸蛋白的序列分析功能,它大多具备。
而且有很舒适的表达方式。
如果你不喜欢装备各种专业性强的软件,而希望用一个综合性的软件代替的话,就选择它吧。
本阶段的大部分功能它都有。
另外,该软件还提供了一个很有特色的类似于核酸限制酶分析的. 白分析,对蛋白进行有关的多肽酶处理后产生多肽片段。
缺点:文件实在太大了。
要完全下载所有有关软件的话,需20多M ,而且每个功能并不十分完美,只能说可以解决问题。
同类参考软件:DNASIS 2.5 DNATools 5.12 、限制酶分析。
生物信息学分析工具的操作指南与使用技巧近年来,随着生物学研究的向深度学习和大数据方向转变,生物信息学分析工具越来越重要。
这些工具能够处理和解读庞大的生物信息数据,从而提供对基因、蛋白质和其他生物分子功能的深入了解。
为了帮助研究者更好地应用这些工具,本文将提供生物信息学分析工具的操作指南与使用技巧。
一、 BLASTBLAST(Basic Local Alignment Search Tool)是最常用的生物信息学工具之一,用于比对基因或蛋白质序列并寻找相似性。
以下是使用BLAST的操作指南:1. 登录NCBI(National Center for Biotechnology Information)网站,选择"BLAST"选项卡。
2. 选择合适的BLAST程序,如nucleotide BLAST(用于比对核苷酸序列)或protein BLAST(用于比对蛋白质序列)。
3. 输入待比对的序列或上传序列文件。
4. 选择适当的数据库进行比对。
例如,对于人类基因,可以选择"Human genome"数据库。
5. 调整BLAST参数,如期望阈值(E-value)和比对长度,以优化结果。
6. 提交任务并等待结果。
BLAST将返回比对结果和相似性分数。
使用技巧:- 选择正确的数据库,以确保比对结果具有生物学相关性。
- 调整参数以满足特定的研究需求,如提高灵敏度或选择严格的相似性阈值。
- 分析比对结果时,关注较高的BLAST分数和较低的E-value,以确定最相关的序列。
二、DNA序列编辑器DNA序列编辑器是生物信息学研究中常用的工具,用于编辑、操作和分析DNA序列。
以下是使用DNA序列编辑器的操作指南:1. 下载和安装合适的DNA序列编辑器,如ApE(A plasmid Editor)或SnapGene。
2. 打开编辑器并创建新项目。
3. 在序列窗口中输入或粘贴DNA序列。
分子生物学软件简要功能介绍在进展分子生物学研究时,常需要用到各种计算机软件。
这些软件种类不少,功能大致一样,到底使用哪个,其实可根据各人的使用习惯来选择。
如下的软件,大局部可在网上找到全功能的版本或各种演示版或试用版,只要以软件名为关键词用搜索引擎搜索就可以了。
网上也有此类各种软件的总结。
下面为此类软件的简单介绍:1.三维分子类2.DNA分析3.RNA分析4.蛋白质分析5.生化教学6.生化工程7.序列格式转换8.引物分析9.序列综合分析10.进化树分析11.质粒绘图12.图像处理13.数据处理14.检索与阅读15.基因芯片16.其他功能软件17.化学绘图18.化学应用19.在线综合工具20.在线蛋白工具21.RNA analysis22.在线引物设计RASMOL:观看生物分子3D微观立体结构RasTop:为RasMol 的图形用户界面软件CHIME:直接在浏览器中观看3D分子MolMol:将pdb等格式的蛋白文件通过微调,存成普通的图形文件raswin.exe.gz:rasmol(win).1 rasmol新版本与汉化版本CrystInfo:用来快速、容易地构建、观察与检查晶体3D结构PDViewer:PDB格式文件的查看程序Weblab Viewlite:三维分子浏览工具与大量分子文件例子Weblab ViewerPro:三维分子浏览工具ICMLite:三维分子浏览工具,有一些其他软件没有的功能VMD:三维分子浏览工具,可以进展动态显示3D:3D分子结构观察软件WPDB:PDB文件检索显示分析软件DTMM:三维分子模型显示、编辑与构建程序Mole:高性能的大分子三维图形显示计算工具gopenmol:显示并分析分子结构与其特性POV-Rayv:生成三维图像工具软件MolPOV:将PDB文件转化为POV格式文件的软件Mol2Mol:分子文件格式转换软件PovChem:将PDB文件转化为POV格式的文件Ortep-3 for Windows:生成分子的热椭圆形点图PLATON:通用结晶学软件工具Mage:读取并演示Kinemage格式文件的专用软件 Prekin :将PDB格式文件转换为Kinemage格式文件Swiss-Pdb Viewer:PDB文件显示与分析软件DINAMO:蛋白序列排队比拟编辑与三维模型构建工具PCMoleeule2 Lite:查看PDB格式文件的免费软件StrukEd :化学分子编辑与三维模型生成软件JMVC:使用JAVA技术编写的三维分子查看器ReView:读取与分析XYZ格式三维分子文件Oscail:用来处理、定义与检查小分子单晶的软件包Moilin:分子构建与观察软件Tinker:与Moilin配套的DOS下的分子设计建模Biodesigner:免费的分子建模与显示软件MoluCAD:全功能的分子建模与显示工具软件 Viewer Activex Control:三维分子显示控件MarvinView:JAVA语言编写的化学分子二维与三维显示程序ACD/3D Viewer for ISIS:免费的ISISDraw三维显示插件Amira:高等三维显示建模系统AmiraMol:Amira 2.3 相应的显示三维分子的增强工具Visualize:分子建模和研究软件包ScientificGL:C++OpenGLAPI三维分子开发工具Sojourner:找出小蛋白的最小能量构形并实时演示的软件DNAClub:DNA处理软件JaMBW:分子生物学软件包DNATool:功能很全面的DNA序列分析工具包pDRAW:DNA分析与绘图软件,可绘制线性或环形DNA图ANNHYB:用来帮助进展PCR引物设计与基因探针设计的软件RESTRICTION ANALYSIS:限制酶消化工具ABIView:ABI格式文件显示与编辑软件Chromas:ABI格式文件显示与编辑软件Sequence viewer:获取与观察从GSDB获取的DNA序列数据与其关联特性的工具DNAssist:DNA序列分析工具DNAProbe:核苷酸序列设计工具DnaSP:DNA序列种群遗传学分析软件DFW:DNA分析软件Artemis R4:以Java语言写成的序列查看工具’ACT R1:以Java语言写成的序列比拟查看器GDA:主要用来进展不连续基因数据的统计分析 RDP:从一组排队比拟(Align)的核酸序列中查找潜在的重组体软件Sequencher:装配DNA小片段为大的连续序列或毗连(序列)群"Contig"软件MehCalc:自动计算DNA序列热力学数据的Excel电子表格宏软件基因探索者:中文界面的功能集成、高效、快捷的基因分析软件ConsInspector:DNA蛋白结合位点预测识别软件MatInd与Matlnspector:快速匹配DNA序列与共有序列的软件工具GBuilder:JAVA语言编制的用来分析与显示DNA序列的软件GenomePixelizer:帮助理解基因组中的簇基因(C1ustermggene)之间的相互关系的软件LabBook Genomic XML Viewer:图形化显示并处理GenBank序列数据的免费软件Gene Construetion Kit 2 :管理并显示克隆策略中的分子构建过程软件Genalysis:比拟基因组或大量基因序列的工具软件RNAdraw:RNA二级结构分析软件RNAstructure:预测RNA 级结构图RnaViz:RNA二级结构图绘制程序ANTHEPROT:蛋白序列分析软件包pSAAM:蛋白序列分析软件包VHMPT:螺旋状膜蛋白拓扑结构观察与编辑软件aminoXpress:免费的多功能蛋白分析软件包mmp.zip:将生化代谢中的各种途径用图表的形式表示出来linpath.zip:线性酶反响模拟软件protlab:蛋白质纯化仿真软件MOLMED.ZIP:生化根底概念演示教学程序Biochem:生化教学文件photo:光合作用教学程序Adrenalin:肾上腺素在肝糖原代谢中的作用演示Virtual Cell Lab:多媒体细胞生物学教学程序brd.zip:生物反响器(发酵罐)设计软件BioStat:BioStatB发酵罐控制程序PenSimv:青霉素发酵模拟软件BioProSim:发酵实时模拟软件vised:序列输入分析和格式转换软件ForCon:多序列文件格式转换软件SeqVerter:序列格式转换软件GeneStudio LE Version:序列格式显示、编辑与转换工具软件FASTA/BLAST SCAN:FASTA与BLAST查询输出文件的处理软件Revp:序列格式转换软件primer Premier 5.0:引物设计工具Oligo:引物分析著名软件Primer Designer:专门用 pASK-IBA~pPR-IBA表达载体免费的引物设计辅助软件Array Designer:批量设计DNA和寡核苷酸引物工具Beacon Designer:PCR定量分析分子信标(Molecularbeacon)设计软件NetPrimer:基于WEB界面的引物设计程序pcgene:分子生物应用软件 MACAW:多序列构建与分析软件Clustal W:用来对核酸与蛋白序列进展多序列比拟的软件Clustal X:ClustalWWindows界面程序FASTA:数据库中查找同源序列软件GeneDoc:对序列进展相关分析等操作BLAST与Blastcl3:数据库中查找类似序列的软件与客户端软件SeqPup 0.9:生物分子序列编辑与分析软件K-Estimator 5.5:进化基因学研究软件,评估两条核酸序列核苷酸替代数BioEdit:序列编辑器与分析工具软件DAMBE:综合性序列工具软件LaserGene:综合性序列工具软件SeaView:图形化多序列队列编辑器 Jalview:用Java语言写的多序列队列编辑器DNASIS:序列综合分析工具Genamics Expression:是一个DNA与蛋白序列分析工具Vector NTIViewer:载体查看软件Jellyfish:多功能序列分析软件ProSeq:核酸序列编辑与种群遗传学分析软件Gap4 database viewer:Gap4基因装配数据库读取显示软件SMS:DNA与蛋白序列分析与格式化在线工具集合Omiga:核酸与蛋白序列综合性分析软件Staden:综合序列分析工具软件包Vector NTISuite:综合性蛋白核酸分析工具包INCA:Java脚本语言写成的BLAST服务器客户端程序ISYS:NCGR开发的用JAVA语言写成的数个不同类生物信息软件与数据库的软件集合平台DNA Scriptor:DNA与蛋白序列综合分析软件Sequence Quickie-Calc:非常紧凑的分子生物学工具软件PhyloGrapher:用来显示与研究相类似的基因与蛋白序列之间的进化关系的软件phylip:进化树分析软件,并可绘制进化树TreeView:进化树处理软件GeneTree:比拟基因与种系进化树的程序NDE:用来编辑NEXUS格式文件的程序TreeMap:用来可视化地比拟主、从进化树的程序Spectrum:分析进化信息而不用将之转化为进化树的软件Phyltools:计算与处理进化树数据的软件tree-puzzle:核酸序列、蛋白序列相似性分析与进化树构建工具ATV:JAVA语言编写的显示"New Hampshire"与NHX格式的进化树文件软件TREECON:构建和绘制进化树的软件包ProBiosys比拟表现型分类法数据和分析计算核酸序列数据距离值的软件Plasmid Processor:绘制质粒图软件Plasmid ProcessorPro:绘制质粒图软件,与Plasmid Processor是同一个作者WinPlas:质粒绘图软件商业版DMUP:环状质粒绘图软件测试版Plasmid Toolkit:质粒绘制软件pDRAW:DNA分析与绘图软件,可绘制线性或环形DNA图SimVector:质粒图绘制软件Image Tool:科学用途的处理图像软件Image J:用Java语言写成的科学用途的处理图像软件Cross Checker:基因指纹图分析软件ALFmap:ALF(Amersham Pharmacia)图像格式转换软件Band Leader:凝胶图像处理软件Scion lmage:图像处理与分析工具OSIRIS:通用医学图像处理与分析软件Melanie 3 Viewer:免费Melanie图像查看器Smart Draw:流程图绘制软件演示版GIMPWin:图像处理自由软件ChromoZoom:比拟两个图像的一样与不同之处软件bandscan:蛋白凝胶电泳图像分析软件SigmaScanPro:图像分析软件30天全功能演示版SigmaGel:凝胶图像分析软件TotalLab:图像分析软件Lablmage:凝胶图像分析软件GelDiff:定量比拟两个2D凝胶图像的不同之处的JAVA软件Timediff:分析蛋白/基因表达图谱时间序列的JAVA软件QuantiScan:使用简单功能专一的凝胶扫描、分析软件PDQuest:分析2维凝胶并生成数据库的标准软件CurveExpert:用于ELISA标准曲线拟合的软件Cliekh Graph:实验数据作图软件Statistica:专业统计软件GraphPad PRISM:著名的数据处理软件NoSA:中文非典型数据统计分析系统CrossGraphs:多变量数据库图形显示软件SigmaPlot:绘图和数据分析软件包30天全功能评估版SYSTAT:数据统计分析与作图的利器30天全功能演示版SigmaStat:智能统计软件30天全功能演示版PeakFit:自动别离、拟合与分析非线性数据软件TableCurve:自动两维曲线拟合与经验公式查找软件TableCurve :自动三维曲面拟合与经验公式查找软件SPSS:非常权威且有名的数据统计处理软件30天全功能演示版Origin:易于使用的科学用途数据绘图与数据分析处理工具软件DATb:进展生物曲线拟合与数据分析的免费软件数据作图助手:对实验结果进展数据分析和作图的专业软件PatentIn:用于将序列专利提交给美国国家专利与商标局的辅助软件Checker:用于将序列专利提交给美国国家专利与商标局的辅助软件ica32t.exe:中国生物学文献数据库检索客户端软件PathDB检索程序:(代谢途径数据库)检索程序PubCrawler:Medline文献库与GenBank核酸序列库检索软件NetRoseBrowser:PDG格式浏览器Book Express:专门用于超星数字图书下载的工具软件EndNote:专业参考文献查询软件Reference Manager:专业参考文献查询软件Procite:参考资料检索管理软件Sequin:数据库GenBank,EMBL,DDBJ查询软件MiniViewer:数图阅览器presslt:G(NLC)〞JPG转换功能软件Refs:参考文献管理软件Scholars Aid:文献参考资料等日常资料的整理软件paperworks:免费的参考文献管理软件KD:知识仓库建库管理系统AMADA:用来组织、研究、显示、分析微数组(Microarray)数据软件ScanAlyze:进展微矩阵荧光图像分析软件Cluster:对大量微矩阵数据组进展分析处理的软件TreeView:用图形来显示Cluster软件分析的结果软件AMAD:微数组数据库ArrayMakerv:Stanford大学Brown实验室提供的基因芯片研究全套设备相配套的软件与文档J-Express:分析微矩阵(Microarray)实验获得的基因表达数据的软件digitizer:图形数字化软件,可以将曲线图转化为数据与等式Graph Paper:坐标纸打印软件DynaFit:酶动力学数据或配体—受体结合数据处理软件Migrate:从遗传学角度,估算人口移民率程序arlequin:人口遗传学软件正交设计助手:正交实验设计辅助工具软件FBAT:家族遗传相联检验的统计程序GGT32:图形化基因型表示软件CERVUS:使用共显性标记数据推断亲缘关系的软件Jarnac:代谢过程模拟软件包Gepasi:化学与生物化学反响动力学仿真与优化软件BCT:微生物趋向性模拟程序StochSim:随机生物化学反响模拟软件Bio_MW:生物化学分子量计算软件MatchCode:将蛋白和核酸序列进展简单匹配和格式化输出的中文软件Map Manager:回交、杂交与重组自交系分析遗传作图实验结果的软件MolEco:以遗传学方法评估杂乱交配频率的软件Canvas:绘图软件免疫室管理系统:中文免疫室综合软件Cyrillic:家谱绘图软件Frozen Cell Stock Monitor:用来管理储存在液氮容器中的生物样品(例如细胞系、血清等等)的程序MICE:虚拟动物饲养设施,用来帮助管理饲养设施中的实验动物软件DBsolve:代谢与酶—受体结合模拟软件boxit:管理生物样品的数据库系统GRR:检测系谱误差(pedigreeerrors)的应用软件健康药霸:药典类的软件AceDB:基因组数据库软件MAPL98、DIAL98与GEST98:El本学者编制的几个统计基因学(StatisticalGenetics)软件PED:系谱(Pedigree)绘制软件PEDRAW:系谱(Pedigree)绘制软件quantiRT:内置宏程序,用来辅助定量RT-PCR实验的Excel文件BateView:管理与追踪小型的实验鼠生殖群体的Excel文件MassXpert:帮助科学家预测与分析从蛋白组学研究中获得的蛋白质质谱数据的软件MestRe-C与MestRe-D:分析、显示与仿真1D与2D磁共振图谱的软件ACD/SpecViewer:免费光谱数据显示软件ACD/MR Viewer:ACD/HNMR用来显示ACD/NMR Predictors预测的所绘化学结构式Viewer:磁共振图谱文件的免费软件WinMDIver:分析流式细胞仪数据文件的免费软件TestDNA:根据成分值生成细胞周期FCS文件的免费工具软件Cylchred:细胞周期分析(CELLCYCLEANALYSIS)软件gX-Path Vision:生成、编辑与显示生物代谢途径的工具软件生物五笔:生物医学专业输入法ACD/CHEMSKETCH:绘制分子结构的免费软件与其汉化版Chemfont:化学符号与TureType字体,可以在Word中直接插入文章中clip.zip:化学图片集,含有近400幅与化学有关的GIF图片ISIS DRAW:绘制化学结构式的免费软件AutoNom:ISIS/Draw软件的插件(自动生成符合IUPAC命名规如此的化合物名称) ChemWindows:绘制化学结构式的免费软件MarvinSketch:JAVA语言编写的小巧好用的化学结构式绘制程序ACD/Structure Drawing Applet:绘制化学结构式免费JAVA小程序ChemPen:绘制化学结构式软件ChemPen+:绘制化学结构式软件ChemPen:绘制化学结构式软件mmcalc.exe:分子量计算器hxfc.zip:化学方程式配平软件cmcalc10.exe:化学试剂制备计算器alkne.exe:有机化学命名练习程序chembl32.zip:Windows95下的免费化学方程式配平程序 periodic.zip:小巧的元素周期表ptab32.zip:高级元素周期表CAF:计算机辅助配方软件CFT:化学式教师元素屋:查询112种元素的各个信息的中文软件化学反响方程式编辑器:制作化学反响方程式、离子方程式、分子式、离子式等CRS:化学反响方程式配平器Model ChemLabv:化学实验教育软件与其汉化版periodic.exe:免费的元素周期表化学品电子手册:一个综合性的化学品手册Biology Workbench:基于WEB的生物学综合工具sewer:网上常用在线工具集合,本地版BCM Search Launcher:蛋白序列二级结构预测综合站点DAS:蛋白跨膜预测服务器、输入蛋白序列,预测跨膜区域TopPred:蛋白预测服务器提供的膜蛋白拓扑学预测在线工具SOSUI:膜蛋白分类和二级结构预测在线工具PSIpred-MEMSAT:进展二级结构预测与跨膜拓朴结构预测HMMTOP:预测蛋白序列的跨膜螺旋与拓扑结构服务器SMART:提供蛋白序列,在结构域数据库中查询/显示出其结构域与跨膜区等TMpred:预测蛋白序列跨膜区TMHMM:预测蛋白的跨膜螺旋The PredictProtein server:提供蛋白数据库查询,预测蛋白各种结构的服务SPLIT:膜蛋白二级结构预测服务器PRED-TMR:提供基于SwissProt数据库统计分析的预测蛋白跨膜片段的服务CoPreThi:基于INTERNET的JAVA程序,预测蛋白的跨膜区TMAP:提供预测蛋白跨膜片段的服务21.RNA analysisPattern Search and Discovery:巴斯德研究所提供的常用RNA在线分析工具DNA sequence analysis:巴斯德研究所提供的常用特征序列查询工具Search Genes and Coding Regions:巴斯德研究所提供的常用DNA在线分析工具Oligonucleotide Calculator:巴斯德研究所提供的基因与编码区查找工具解链温度计算器:JAVA语言写的寡核苷酸计算器,给出核酸序列,计算GC百分比、解链温度、长度、分子量。
RASMOL简明使用说明IntroductionRasMol是一个分子图像软件,利用它可以很方便地、用多种方法、交互式地显示蛋白质、核酸和有机小分子的结构,对于演示、教学以及制作高质量的图形都有很大的用途。
RasMol具有不同的版本,可以在Microsoft Windows, Apple Macintosh, UNIX和VMS上运行。
在Windows中的程序称为RasWin。
运行RasMol之后,屏幕上会出现一个显示窗口和一个命令窗口。
其中,显示窗口用于显示分子的三维结构,并有下拉式的菜单可供执行多种显示功能;命令窗口可用于显示信息,并可供用户键入各种RasMol支持的命令,作为对菜单功能的完善和补充。
用户可以利用鼠标交互式地、即时地操作分子。
主要用法为:Mouse left key: X, Y axis rotationMouse right key: X, Y axis translationMouse left key + shift: ScalingMouse right key + shift: Z axis rotationFrequently used menu in RASMOL:File:Open: 打开一个存储着分子结构的文件(PDB格式或MOL2格式)Close: 关闭已打开的文件,擦去显示窗口中的分子Edit:Select: 激活分子中所有的原子作为显示的对象Display:Wireframe: 点线图Backbones: 显示大分子的主链Sticks: 棍棒图Spacefill: 空间填充图Ball & Stick: 球棍图Ribbons: 大分子飘带图Strands: 大分子线带图Cartoons: 大分子卡通图Colours:Monochrome: 单色图CPK: 按原子类型着色Carbon light grey Oxygen red Hydrogen whiteNitrogen light blue Sulphur yellowPhosphorous orange Chlorine greenBromine brown Metals dark greyChain: 按大分子中不同的链着以不同的颜色Structure: 按大分子中不同的二级结构单元着以不同的颜色Alpha helices magentaBeta sheets yellowTurns pale blueOthers whiteOptions:Exports:可以把显示窗口中当前的显示输出为GIF, BMP, Postscript等各种格式的图形文件,可供记录或打印输出。
实验七微生物分子生态学常用软件使用方法微生物生态学研究中测序已经成为一项常规的必不可少的分析手段,实验后常常会得到大量的核酸序列,有的是细菌基因组上随机的序列片断,有的是16S rRNA基因的克隆文库,有的是功能基因序列等等,如此海量的序列数据,需要进行正确、快速和有效的分析,熟练掌握各种生物学软件的使用方法就显得尤为重要。
这里我们主要介绍如何进行序列同源性分析,如何构建系统进化树,如何对克隆文库进行分析,如何对DNA指纹图谱进行比较分析,介绍相关软件的使用方法。
一、实验原理这里简要介绍序列数据分析过程中用到的软件:BLAST是NCBI(the National Center for Biotechnology Information)的一项服务。
BLAST在网络上可以直接使用,我们可以提交序列,并与NCBI数据库(GenBank+EMBL+DDBJ+PDB sequences)进行比对,之后会将一系列的结果返回给用户。
GeneTool可以进行核酸分析,本文中主要用于去除载体序列。
ClustalX 1.8:广泛使用的多序列比对程序,在ClustalW多序列比对程序的基础上增加了图形用户界面。
输入为多序列的Fasta格式文件,进行多序列全局比对生成结果的同时,在指定文件夹生成“.dnd”和“.aln”格式文件。
PhyloDraw 0.8:构建进化树的绘图工具,它支持多种多序列比对软件的Multiple Alignment 结果。
本实验采用ClustalX进行多序列比对,生成“.dnd”格式的比对文件,最后用PhyloDraw 画出序列进化树。
它支持Unrooted tree(无根树)、Rooted tree(有根树)、Radial tree(放射状树)、Rectangle cladogram(矩形进化分支树)、Slated cladogram和Phylogram(序列进化树)。
这些都是不同的树型,结果是一致的。
下面简要说明Blast、Fasta、Cluastx、PhyloDraw等进行序列比对以及构建进化树的算法等,作为深入研究的理论基础。
DNA序列的比对是生物信息学的基础之一,寻找序列相似性的过程称为序列比对。
系统进化推断是通过生物间可观测的性质来建立物种之间进化关系假说的方法。
我们的目的是构建系统进化树,它已成为相似性比对为基础表示进化关系的很直观的方法。
系统进化树是严格的二叉树,二叉分支假设极大的简化了建树算法。
在系统进化树中,序列之间的进化距离可以作为树枝长度的度量。
构建系统进化树的方法很多,主要有以下四种方法:(1)基于成对距离比对的系统进化树:这种方法能够生成有根的树,这种方法首先通过定义每一对序列之间的距离矩阵初始化,然后按照距离分组,最后建立从树枝到树根的树。
(2)基于相邻连接的系统进化树:这种方法不仅根据距离矩阵搜索最小的成对距离,而且会搜索使整个树高最小的相邻集,最适合于进化距离较短的情况。
(3)基于最大节约法的系统进化树:这种方法是从一系列可能的树中找到一个需要最少的核苷酸替换就可以解释所看到差异的树。
(4)基于最大似然法的系统进化树:这是一种概率法,它通过在信息位点的每种可能的进化改变的概率排列并使树的总概率最大化来寻找最佳选择。
最常见的UPGMA ,它的全称是使用算数平均数的未加权对群法(Unweighted Pair Group Method with Arithmetic),该算法属于基于成对距离比对生成系统进化树算法。
z UPGMA 算法描述:初始化过程 :(1) 为每个物种建立一个群(Cluster);(2) 每个群的大小赋初值n i =1,即只包括一个物种;(3) 计算任意两个群之间的距离ij D ,采用二维数组存储该距离矩阵;(4) 输出树为T ,为每个物种分配一个叶结点。
循环过程:每一个循环都能将将其中两个群合成为一个群(1) 遍历所有距离值,找出具有最近距离D ij 的两个群i 和j ;(2) 创建一个新的群(ij),它共有j i (ij)n n n +=个物种;(3) 连接树上的i 和j 到一个新的结点,该结点对应于新的群(ij),连接i 和j 的树枝长度为2,ji D ;(4) 按照下面公式计算从新的群到其它每个群的距离(不包括i 和j )k j ji j k i j i i D n n n D n n n k ij D ,,()(),(+++= (5) 删除距离矩阵中i 和j 的记录,添加新的记录D (ij),k(6) 返回1直到只剩下一个群;综上所述,该算法主要思想是首先将每个序列被分配到自己的群中,从树的零高度开始这个序列的分支,找出距离最近的两个群合并为一个群,直到剩下一个群为之。
树枝的长度反应两者之间的距离,即进化时间的长短,构造的顺序是从树枝到树根逐渐构造。
二、实验目的分析实验数据,大量的序列数据信息分析整理,进行同源性比较、构建进化树、分析指纹图谱的相似性等。
三、实验材料(1)以本室的序列数据为例,介绍相关软件的使用方法。
(2)生物学软件:如上列举的软件。
四、操作步骤4.1 序列分析及进化树构建4.1.1. 去除载体序列,目标序列经克隆(以克隆到 Promega 公司生产的pGEM-T载体为例)通用引物(T7/SP6)测序后,测序结果中带有部分载体序列,在进行序列分析以前,要首先去除载体序列,可以使用DNAMAN和GeneTool等等,这里以GeneTool为例进行说明。
下图是GeneTool软件的主界面:将需要去载体序列的文件(Raw Sequence)打开,搜索EcoR I 酶切位点 GAATTC (pGEM-T easy 载体两端均有该位点),以下图为例,上游和下游的序列均用蓝色标出从上游位点向后第5个碱基开始,下游位点向前第11个碱基开始为我们的目标片断,选中之后输出,保存为FASTA格式的”TXT”文件,这样就完成了我们去载体序列的过程。
4.1.2. 到GenBank数据库中进行Blastn分析, 找到其Closest Relatives:打开/BLAST/如下图所示:选择做Nucleotide-nucleotide BLAST (Blastn)弹出界面:将要比对的序列填入Search中,下面以GenBank中公开的NC_003045序列(Bovine coronavirus, complete genome)为例进行分析。
参数可以采用默认值,之后点击BLAST,以可以得到下图的结果:其中Query = (31,028 letters)表示我们序列全长为31028bp,查询的ID为1089336352-4777-118277223650.BLASTQ4,点击Format开始搜索GenBank数据库,采用Blast的方法,并将结果返回给用户,下表显示了GenBank 中和序列NC_003045做Blast之后得到的序列,从上到下同源性降低。
下图表示AF391541.1序列和NC_003045序列的配对情况。
我们可以将排在最前面的(1-2条)序列下载下来,这就是与测许序列亲缘关系最近的序列信息(Closest Relatives)。
值得注意的是,有时候序列之间是反向匹配的,我们需要将测许序列顺过来,使其方向从小到大,这样就完成了第二步——在数据库中寻找同源序列。
4.1.3. 通过Clustalx软件和PhyloDraw构建系统进化树。
第二步中,我们可以将一个文库中测序得到的每个序列都到GenBank中找到与其相似的同源性最高的序列,用这些序列进行构建进化树时,进化树中将包含大量已知序列,可以作为目标序列进化地位的参考。
在下图的范例中,我们L-46c、L-33c、L-18、L-67、L-92、L-ASa、L-ASb、L-46d、L-33d均为我们实验室测序得到的序列,有了从GenBank中得到的亲缘关系较近的序列,生成的进化树中能够一目了然地看到这些未知序列的分类地位。
以下介绍如何使用ClustalX软件和PhyloDraw构建系统进化树首先,将所有的要构建系统进化树的序列存储到一个文件中,采用FASTA格式,FASTA 格式又称为Pearson格式,这是比较简单而使用最多的序列格式。
序列文件的第一行是由大于符号开头的任意文字说明,主要为标记序列用,从第二行开始为序列本身。
碱基名称大小写均可,如下所示:> sequence1acttaaaaagattttctatctacggatagttagctctttttctagaccttgtctactcaattcaactaaacagaaattttgtccttccttccggccgcatgttcatgctgctggaagctg> sequence2acttaaaaagattttctatctacggatagttagctctttttctagaccttgtctactcaattcaactaaacagaaattttgtccttccttccggccgcatgttcatgctgctggaagctg> sequence3acttaaaaagattttctatctacggatagttagctctttttctagaccttgtctactcaattcaactaaacagaaattttgtccttccttccggccgcatgttcatgctgctggaagctg其次,使用ClustalX打开这个存储多个序列的文件之后做Alignment,将输出“.dnd”格式的文件作为PhyloDraw的输入。
最后,使用PhyloDraw打开上一步生成的“.dnd”文件,可以有不同的树型供选择:Unrooted tree Rooted treeRadial tree Phylogram通过上面的去除载体序列,到GenBank下载Closest relatives序列,以及最后的构建进化树三个步骤,就完成了对序列进行分析的一个主要工作。
4.2 使用RDP在线分析数据及构建进化树RDP(Ribosomal Database Project)主要是提供关于核糖体相关的序列数据,它可以实现在线的构建进化树,序列比对等。
实验中得到的16S rRNA序列信息可以在线使用RDP 进行分析。
下面简要介绍如何在线使用RDP分析序列并构建系统进化树。
打开/cgis/phylip.cgi这是一个通过web接口提供Phylip和weighbor 服务的程序。
我们可以使用这个程序来创建距离矩阵(相似性矩阵)和构建系统进化树。
我们可以使用自己的序列和RDP数据库中序列结合在一起构建系统进化树,步骤如下:1.编辑要构建进化树的数据集合Edit Data Set:首先将序列上传到RDP中,点击Edit Data set,之后,可以通过browse打开本地序列,见下面的左图。