blast简介及其应用(精)
- 格式:ppt
- 大小:3.10 MB
- 文档页数:76
简介Blast,全称Basic Local Alignment Search Tool,即"基于局部比对算法的搜索工具",由Altschul等人于1990年发布。
Blast能够实现比较两段核酸或者蛋白序列之间的同源性的功能,它能够快速的找到两段序列之间的同源序列并对比对区域进行打分以确定同源性的高低。
Blast的运行方式是先用目标序列建数据库(这种数据库称为database,里面的每一条序列称为subject),然后用待查的序列(称为query)在database中搜索,每一条query与database 中的每一条subject都要进行双序列比对,从而得出全部比对结果。
Blast是一个集成的程序包,通过调用不同的比对模块,blast实现了五种可能的序列比对方式:blastp:蛋白序列与蛋白库做比对,直接比对蛋白序列的同源性。
blastx:核酸序列对蛋白库的比对,先将核酸序列翻译成蛋白序列(根据相位可以翻译为6种可能的蛋白序列),然后再与蛋白库做比对。
blastn:核酸序列对核酸库的比对,直接比较核酸序列的同源性。
tblastn:蛋白序列对核酸库的比对,将库中的核酸翻译成蛋白序列,然后进行比对。
tblastx:核酸序列对核酸库在蛋白级别的比对,将库和待查序列都翻译成蛋白序列,然后对蛋白序列进行比对。
Blast提供了核酸和蛋白序列之间所有可能的比对方式,同时具有较快的比对速度和较高的比对精度,因此在常规双序列比对分析中应用最为广泛。
可以毫不夸张的说,blast是做比较基因组学乃至整个生物信息学研究所必须掌握的一种比对工具。
下载NCBI提供免费下载,网址:ftp:///blast/executables/release/,可根据自己得机器选择相应操作系统的版本。
安装直接解压缩包即可。
解压缩命令:zcat *.tar.gz | tar xvf -使用Blast的运行分为两个步骤:第一,建立目标序列的数据库;第二,做blast比对。
NCBI中Blast种类及利用简介NCBI中Blast种类简介1. Blast Assembled Genomes在一个选择的物种基因组序列中去搜索。
2.Basic Blast2.1 nucleotide blast--- 用核酸序列到核酸数据库中进行搜索,包括3个程序2.1.1 Blastn----核酸序列(n)到核酸序列数据库中搜索,是一种标准的搜索。
2.1.2 megablast----该程序利用“模糊算法”加速了比较速度,能够用于快速比较两大系列序列。
能够用来搜索一匹ESTs序列和大的cDNA或基因组序列, 适用于由于测序或其他缘故形成的轻微的不同的序列之间的比较2.1.3 discontiguous megablast----与megablast不同的是要紧用来比较来自不同物种之间的相似性较低的不合序列。
2.2 Protein Blast2.2.1 Blastp ---蛋白质序列到蛋白质序列数据库中搜索,是一种标准的搜索。
2.2.2 psi-blast---位点特异迭代BLAST —用蛋白查询来搜索蛋白资料库的一个程式。
所有被BLAST发觉的统计有效的对齐被总和起来形成一个多次对齐,从那个对齐,一个位置特异的分值矩阵成立起来。
那个矩阵被用来搜索资料库,以找到额外的显著对齐,那个进程可能被反复迭代一直到没有新的对齐能够被发觉。
2.2.3 PHI-BLAST---以常规的表达模型为专门位置进行PSI - BLAST检索,找出和待查询序列具有一样的表达模型且具有同源性的蛋白质序列。
2.3 Translating BLAST2.3.1 blastx----先将待查询的核酸序列按6 种读框翻译成蛋白质序列,然后将翻译出的蛋白质序列与NCBI 蛋白质序列数据库比较。
2.3.2 tblastn-----先将核酸序列数据库中的核酸序列按6 种读框翻译成蛋白质序列,然后将待查询的蛋白质序列与翻译结果进行比较。
NCBI(美国国立生物技术信息中心)简介介绍理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。
通过只有四个字母来代表DNA化学亚基的字母表,出现了生命过程的语法,其最复杂形式就是人类。
阐明和使用这些字母来组成新的“单词和短语”是分子生物学领域的中心焦点。
数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝对的必须。
挑战在于发现新的手段去处理这些数据的容量和复杂性,并且为研究人员提供更好的便利来获得分析和计算的工具,以便推动对我们遗传之物和其在健康和疾病中角色的理解。
国立中心的建立后来的参议员Claude Pepper意识到信息计算机化过程方法对指导生物医学研究的重要性,发起了在1988年11月4日建立国立生物技术信息中心(NCBI)的立法。
NCBI是在NIH的国立医学图书馆(NLM)的一个分支。
NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。
NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。
它的使命包括四项任务:∙建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统∙实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究∙加速生物技术研究者和医药治疗人员对数据库和软件的使用。
∙全世界范围内的生物技术信息收集的合作努力。
NCBI通过下面的计划来实现它的四项目的:∙基本研究NCBI有一个多学科的研究小组包括计算机科学家,分子生物学家,数学家,生物化学家,实验物理学家,和结构生物学家,集中于计算分子生物学的基本的和应用的研究。
这些研究者不仅仅在基础科学上做出重要贡献,而且往往成为应用研究活动产生新方法的源泉。
他们一起用数学和计算的方法研究在分子水平上的基本的生物医学问题。
这些问题包括基因的组织,序列的分析,和结构的预测。
BLAST 应用专题实践摘要BLAST 采用一种局部的算法获得两个序列中具有相似性的序列。
BLAST中的常用程序有BLASTP(蛋白质序列到蛋白质库的查询)、BLASTX是核酸序列到蛋白库中的一种查询、BLASTN(核酸序列到核酸库中的一种查询)、TBLASTN(蛋白序列到核酸库中的一种查询)、TBLASTX(核酸序列到核酸库中的一种查询)。
BLAST与FASTA是当今最流行的两种比对程序,在生物学中被广泛应用。
本文主要介绍DNA序列比对和蛋白质序列比对。
ABSTRACTBLAST use a partial algorithm to find the similar sequences between two sequences. There are some common used program in the BLAST : BLASTP, BLASTX, BLASTN, TBASTN, TBLASTX. Today, BLAST and FASTA is two of the most popular comparing program, which is widely used in the biology field. This paper mainly introduces the alignment of DNA sequences and protein sequeces.一、前言Blast(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。
BLAST程序能迅速与公开数据库进行相似性序列比较。
BLAST结果中的得分是对一种对相似性的统计说明。
本文通过使用NCBI中的BLAST比对DNA序列和蛋白质序列,重点介绍了BLAST页面中各项参数的功能。
二、DNA序列比对2.1准备工作进入/Blast.cgi ,点击nucleotide blast 出现“Enter Query Sequence”的文本框,输入需要进行比对的序列,如选择:CCTCCCCCTTTGCTTTTTGCTCTCTTGTTAGTATATTAATTGTTTTCACTC TCTGAATCTTTTTTCCCCATTTCTTTGGCAGACATTTTTACTTGTCTTGGAAGAGTAG GTGAAGAGCTGTTTTTAGGACTCTTTGAAAGGGTACAGTATGGGTGACAGTCT>11462Query subrange 可以从需要比对的序列中截取一段,其中from和to代表起始和中指的位置。
美国国家生物技术信息中心(National Center of Biotechology Information ,NCBI) 充分利用Internet ,为用户提供了丰富的生物信息资源。
NCBI 的BLAST 程序是进行核酸序列和蛋白质序列相似性比较的优秀工具。
1 BLAST简介NCBIBLAST(Basic Local Alignment Search Tool ,局部对比基本检索工具) 是将核酸序列或蛋白质序列与可用的序列数据库进行相似性比较的一系列程序。
其核心是程序BLAST210。
BLAST是一个寻找序列间具有相似性的区段,进而比较它们之间结构和功能的工具,而不是仅仅比较整个序列的同源性。
BLAST的应用范围相当广泛,适用于核酸或蛋白质序列与可用的序列数据库之间的比较,也可用于几个序列间的比较:核酸- 核酸、核酸- 蛋白质、蛋白质- 蛋白质之间。
NCBI 的BLAST 提供了网页、电子邮件以及FTP 三种方式进行序列分析,使用十分方便。
2 各种BLAST介绍BLAST经过不断发展完善,有以下几种类型:1 Nucleotide BLASTNucleotide BLAST是输入核酸序列,用这些序列与其它核酸序列比较。
2.1.1 Standard nucleotide - nucleotide BLAST(标准核酸- 核酸BLAST):以三种格式(FASTA 格式、GenBank Accession 编码或GI编码) 的核酸序列与NCBI 核酸序列数据库作比较。
2.1.2 MEGABLAST:该程序使用“模糊算法”加快了比较速度,可以用于快速比较两大系列序列。
2.1.3 Search for short , nearly exact sequences (近似的短序列检索) :该检索和带有默认参数的Standard nucleotide - nucleotideBLAST很相似,是以短序列进行检索。
BLAST种类及使用方法BLAST(Basic Local Alignment Search Tool)是一种广泛使用的序列比对算法,可用于比较DNA,RNA或蛋白质序列的相似性。
它是生物信息学领域中最常用的工具之一,可以帮助研究人员识别新的序列,注释基因功能,鉴定物种间的进化关系等。
1.BLASTN:BLASTN用于比对DNA序列。
它可以将一个查询DNA序列与已知的DNA序列数据库进行比较,找到相似的序列。
BLASTN通常用于物种鉴定、基因组注释和寻找同源基因等方面的研究。
2.BLASTP:BLASTP用于比对蛋白质序列。
它可以将一个查询蛋白质序列与已知的蛋白质数据库进行比较,找到相似的蛋白质序列。
BLASTP 通常用于寻找同源蛋白质,预测蛋白质功能和结构,以及识别蛋白质家族等方面的研究。
3.BLASTX:BLASTX用于比对DNA序列与蛋白质数据库的比对。
它通过将DNA序列翻译成蛋白质序列,然后与已知的蛋白质数据库进行比对,找到相似的蛋白质序列。
BLASTX通常用于从未知的DNA序列中预测蛋白质编码区域,注释基因功能等方面的研究。
4. TBlastN:TBlastN用于比对蛋白质序列与DNA数据库的比对。
与BLASTX相反,TBlastN将已知的蛋白质序列与DNA数据库进行比对,找到相似的DNA序列。
TBlastN通常用于寻找蛋白质在基因组中的编码区域,确定启动子和转录因子结合位点等方面的研究。
5. TBlastX:TBlastX用于比对转录本与转录本数据库的比对。
它可以将一个查询转录本序列与已知的转录本数据库进行比对,找到相似的转录本。
TBlastX通常用于寻找新的转录本和预测基因表达模式等方面的研究。
使用BLAST有以下几个步骤:1.准备查询序列:将待比对的DNA、RNA或蛋白质序列准备成文本文件,确保序列格式正确,并确保序列长度适合比对任务。
2. 选择数据库:根据研究需求,选择适当的数据库。