蛋白分析
- 格式:doc
- 大小:45.50 KB
- 文档页数:10
差异蛋白分析方法差异蛋白分析是一种用于比较不同样本中蛋白质表达差异的方法。
在生物研究中,差异蛋白质的分析对于理解生物学过程的变化、疾病的发生和发展等具有重要意义。
下面将介绍几种常用的差异蛋白质分析方法。
1. 二维凝胶电泳(2-DE):二维凝胶电泳是一种常用的分离和定量蛋白质的方法。
首先,通过等电聚焦将蛋白质在电泳液中按照等电点(pI)分离出不同pI的谱点,然后,使用SDS-PAGE将蛋白质按照分子量分离出不同大小的谱点。
最后,通过染色或质谱分析技术进行蛋白质的可视化和鉴定。
该方法可以同时分析数千种蛋白质,对于差异蛋白质的筛选具有高通量和分辨率高的优势。
2. 差异凝胶电泳(DIGE):差异凝胶电泳是二维凝胶电泳的改进方法。
该方法利用荧光染料(如CyDye)对两组样本中的蛋白质进行荧光标记,然后将两组样本混合后共同进行电泳分离。
在同一个凝胶上,差异蛋白质的表达差异可以通过荧光信号强度的比较来确定。
相比于传统的二维凝胶电泳,DIGE方法的灵敏度更高,并且能够同时分析多个样本,适用于大规模样品分析。
3. 质谱分析:质谱分析是一种常用的蛋白质鉴定和定量方法。
主要有两种方法:基于质谱仪的定性分析和基于同位素标记的定量分析。
前者通过将蛋白质样品利用质谱仪进行断裂和离子化后,通过质谱图谱与数据库对比鉴定其潜在蛋白质;而后者则通过同位素标记技术(如TMT、iTRAQ等)对两组样品中的蛋白质进行标记,然后将标记样品混合后质谱分析,通过同位素峰的比较来定量差异蛋白质的表达水平。
4. 蛋白质芯片技术:蛋白质芯片是一种高通量和高灵敏度的蛋白质分析方法。
它利用固相支持介质上的已知蛋白质或蛋白质片段(如抗体、寡核苷酸)构建芯片,然后将样品中的蛋白质与芯片上的蛋白质发生特异性结合。
通过对芯片上信号的检测和分析,可以确定蛋白质的表达差异。
蛋白质芯片技术具有高通量、高灵敏度和高特异性等特点,可同时检测上千种蛋白质。
5. 高通量测序技术:高通量测序技术也可应用于差异蛋白质的分析。
三种分析蛋白结构域的方法蛋白质是生命体内重要的功能分子,它们通过其特有的三维结构来实现其功能。
蛋白结构域是指蛋白质结构中具有独立功能和收缩性的区域。
分析蛋白结构域的方法对于理解蛋白的功能和机制有重要意义。
以下是三种常用的分析蛋白结构域的方法。
第一种方法是比对分析。
比对分析是通过比对已知结构域的蛋白质序列和结构与待研究蛋白质序列和结构进行对比,以此来鉴定待研究蛋白质中的结构域。
比对分析常用的工具有BLAST和HMMER等。
BLAST(基本局部序列比对工具)通过比对两个蛋白序列的共同片段来确定相似性,可以帮助确定蛋白质的结构域。
HMMER(隐含马尔可夫模型比对工具)则建立了一个隐含马尔可夫模型,将待研究的蛋白质序列与已知结构域的蛋白质序列进行比对,以此来确定结构域。
第二种方法是结构预测。
结构预测是通过计算机程序对蛋白质序列进行建模,以预测其三维结构。
常见的结构预测方法有基于比对的序列相似性建模、基于物理力学的方法和基于机器学习的方法等。
基于比对的序列相似性建模方法通过比对已知结构域的蛋白质序列与待研究蛋白质序列来构建模型,以此来预测待研究蛋白质的结构域。
基于物理力学的方法则基于分子力学和物理化学原理,通过计算机模拟来推测蛋白质的结构。
基于机器学习的方法则使用已知结构域的蛋白质数据来训练算法,以此来预测待研究蛋白质的结构域。
第三种方法是功能簇分析。
功能簇分析是通过聚类算法来将蛋白质分为不同的簇,以确定其中的结构域。
常见的聚类算法有层次聚类、基于密度的聚类和K均值聚类等。
层次聚类是将样本逐步合并成不同的簇,直到达到预定的停止条件。
基于密度的聚类则是根据样本的密度将其分为不同的簇。
K均值聚类是将样本分为K个不同的簇,使得簇内的样本之间的差异最小化。
通过功能簇分析可以鉴定出具有相似功能的蛋白质结构域。
综上所述,比对分析、结构预测和功能簇分析是常用的分析蛋白结构域的方法。
这些方法能够帮助鉴定蛋白质中的结构域,进而理解其功能和机制。
蛋白检测方法蛋白是生物体内非常重要的一类生物大分子,它参与了生物体内的许多重要生命活动,包括细胞信号传导、酶活性调控、结构支持等。
因此,对蛋白进行检测和分析对于生命科学研究具有重要意义。
本文将介绍几种常见的蛋白检测方法,希望能够为科研工作者提供一些参考和帮助。
1. SDS-PAGE凝胶电泳。
SDS-PAGE凝胶电泳是一种常用的蛋白质分离和检测方法。
它通过聚丙烯酰胺凝胶电泳,根据蛋白质的分子量进行分离,然后通过染色或Western blotting等方法进行检测。
这种方法操作简单,成本低廉,可以快速得到蛋白质的分子量信息。
2. 免疫沉淀。
免疫沉淀是利用抗体对特定蛋白的特异性结合来进行蛋白的富集和检测。
通过将样品与特异性抗体结合,然后利用蛋白A/G琼脂糖或其他方法将抗体-蛋白复合物沉淀下来,最后进行Western blotting或质谱分析等方法进行检测。
3. 酶联免疫吸附实验(ELISA)。
ELISA是一种高灵敏度、高特异性的蛋白检测方法。
它利用酶标记的抗体对特定蛋白进行捕获和检测,通过底物的酶促反应产生可定量的信号。
ELISA方法广泛应用于临床诊断、生物医药研究等领域。
4. 质谱分析。
质谱分析是一种高分辨率、高灵敏度的蛋白质检测方法。
通过质谱仪对蛋白质进行分析,可以得到蛋白质的分子量、氨基酸序列、修饰信息等。
质谱分析方法适用于复杂混合物的蛋白质检测和鉴定。
5. 蛋白质芯片技术。
蛋白质芯片技术是一种高通量、高平行性的蛋白质检测方法。
它通过将大量的蛋白质捕获到芯片表面,然后利用荧光标记、质谱分析等方法进行检测。
蛋白质芯片技术在蛋白质相互作用、信号通路等研究中具有重要应用价值。
总结。
蛋白检测方法的选择应根据具体的实验目的、样品特性和实验条件来确定。
不同的方法各有优缺点,科研工作者应根据实际需求选择合适的方法进行蛋白检测和分析。
希望本文介绍的蛋白检测方法对您有所帮助,祝您的科研工作顺利!。
蛋白定量分析实验实验一双缩脲法测定蛋白质含量一.实验目的掌握双缩脲法定量测定蛋白质含量的原理和标准曲线的绘制。
二.实验原理在碱性溶液中,具有两个或两个以上肽键的化合物(如蛋白质)可与Cu2+结合生成紫色化合物(双缩脲反应),颜色深浅与蛋白质浓度成正比,故可用比色法测定蛋白质的浓度。
在一定条件下,未知样品的溶液与标准蛋白质溶液同时反应,并于520nm下比色,可以通过标准蛋白质的标准曲线求出未知样品的蛋白质浓度。
三.实验仪器及试剂容量瓶、试管、试管架、恒温水浴槽、吸量管、分光光度计、比色皿试剂:①标准酪蛋白溶液10mg/ml②双缩脲试剂: 溶解2.5g CuSO4·5H2O于100ml水中,加热溶解,取酒石酸钠10g、碘化钾5g,溶于500ml水中,再加5mol/L NaOH溶液300ml混合,倒入硫酸铜溶液,加水至1000ml③小鼠肝脏蛋白原浆四.实验内容(1)取小试管7支,编号,按下表注入溶液(2)混匀后,于37℃水浴中保温15min,在520nm波长下比色,以第6管调零点,测得各管的吸光度值为纵坐标,蛋白质的克数为横坐标,绘成曲线。
(3)按表中第七管的数据加入溶液,在37℃水浴中放置15min,测其吸光度,根据吸光度值查标准曲线即得出每100ml小鼠肝脏蛋白原浆溶液中蛋白质的克数。
五.实验数据记录及结果分析绘制曲线如下:由图可知,当吸光度为0.107时,相对应的蛋白质克数为1.38 mg,则100ml 小鼠肝脏蛋白原浆液中蛋白质克数为1.38 g。
实验二考马斯亮蓝法测定蛋白质含量一.实验目的掌握考马斯亮蓝法定量测定蛋白质含量的原理和方法;熟悉紫外分光光度计的使用。
二.实验原理考马斯亮蓝在游离状态下呈红色,当它与蛋白质结合后变为蓝色,在一定蛋白质浓度范围内,结合物在595 nm波长下有最大吸收峰,测其光的吸收量即可得结合蛋白质的量。
三.实验仪器及试剂仪器:分光光度计,试管,吸量管,比色皿试剂:①考马斯亮蓝试剂: 考马斯亮蓝G-250 100mg溶于50 ml 95%乙醇中,加入100ml 85%磷酸,用蒸馏水稀释至1000 ml。
一、实验目的1. 掌握蛋白质定量分析的基本原理和方法。
2. 学习使用紫外分光光度计进行蛋白质定量。
3. 了解不同蛋白质定量方法的优缺点,为后续实验提供参考。
二、实验原理蛋白质定量分析是生物化学实验中常用的技术之一,主要方法有直接紫外吸收法、Bradford法和Lorry法等。
本实验主要采用直接紫外吸收法和Bradford法进行蛋白质定量。
1. 直接紫外吸收法:蛋白质分子中含有共轭双键的酪氨酸和色氨酸,在280nm波长附近有特征吸收峰。
蛋白质溶液的光密度(OD)与蛋白质浓度呈正比,因此可以通过测定OD值来计算蛋白质浓度。
2. Bradford法:蛋白质与染料考马斯亮蓝G-250结合,在一定线性范围内,反应液595nm处吸光度的变化量与蛋白质量成正比,从而实现蛋白质定量。
三、实验材料与仪器1. 实验材料:蛋白质样品、标准蛋白质溶液、考马斯亮蓝G-250染料、双蒸水等。
2. 仪器:紫外分光光度计、电子天平、移液器、试管等。
四、实验步骤1. 标准曲线绘制(1)取6支试管,分别加入0、0.1、0.2、0.4、0.6、0.8、1.0ml标准蛋白质溶液,用双蒸水补至1.0ml。
(2)分别加入5ml考马斯亮蓝G-250染料,混匀。
(3)在595nm波长下测定各管吸光度值。
(4)以标准蛋白质浓度为横坐标,吸光度值为纵坐标,绘制标准曲线。
2. 蛋白质定量(1)取6支试管,分别加入0、0.1、0.2、0.4、0.6、0.8、1.0ml蛋白质样品,用双蒸水补至1.0ml。
(2)分别加入5ml考马斯亮蓝G-250染料,混匀。
(3)在595nm波长下测定各管吸光度值。
(4)根据标准曲线,计算蛋白质浓度。
五、实验结果与分析1. 标准曲线绘制绘制标准曲线,得到线性方程:y = 0.004x + 0.021,相关系数R² = 0.997。
2. 蛋白质定量根据标准曲线,计算蛋白质样品浓度,结果如下:样品1:0.5mg/ml样品2:1.0mg/ml样品3:1.5mg/ml样品4:2.0mg/ml样品5:2.5mg/ml样品6:3.0mg/ml六、讨论与心得1. 实验过程中,应注意操作规范,避免蛋白质样品污染。
蛋白质的定量和定性分析方法蛋白质是生物体内最重要的功能分子之一,对于研究生物体的结构和功能具有重要意义。
为了准确地了解蛋白质的含量和性质,在科学研究和实际应用中,我们需要使用定量和定性分析的方法来研究蛋白质。
一、定量分析方法1. 低里德伯法(Lowry method)低里德伯法是一种经典而广泛应用的蛋白质定量方法。
该方法利用蛋白质与碱式铜络合物在碱性条件下反应生成蓝色产物,通过比色法测定溶液的吸光度来计算蛋白质含量。
这是一种灵敏且相对简单的方法,适用于大多数蛋白质样品的定量分析。
2. 比色法(Colorimetric assay)比色法是一种常用的蛋白质定量方法,通过蛋白质与染料的结合来测定蛋白质浓度。
常用的染料有布拉德福蓝(Bradford)、库吉铃蓝(Coomassie Brilliant Blue)、BCA法(Bicinchoninic Acid assay)等。
这些染料与蛋白质结合后形成一种复色物,通过比色法测定溶液的吸光度可以定量分析蛋白质。
比色法具有操作简便、灵敏度高等特点,被广泛应用于蛋白质定量领域。
3. 分子标记法(Molecular tagging method)分子标记法是一种新兴的蛋白质定量方法,利用特定的分子标记物(如荧光染料、放射性示踪剂等)标记蛋白质,然后通过测定标记物的荧光强度或放射性信号来计算蛋白质浓度。
分子标记法具有高灵敏度、高特异性等优点,适用于微量蛋白质的定量测定。
二、定性分析方法1. SDS-PAGE(Sodium Dodecyl Sulfate Polyacrylamide Gel Electrophoresis)SDS-PAGE是一种常用的蛋白质定性分析方法,通过电泳将蛋白质在聚丙烯酰胺凝胶中分离出来。
在电泳过程中,蛋白质在SDS(十二烷基硫酸钠)的作用下具有相同的电荷密度,只受到大小的限制而移动。
蛋白质在凝胶中的分离程度取决于其分子量大小,可以通过对比标准品的迁移距离来估计样品中蛋白质的相对分子量。
蛋白鉴定分析报告1. 引言蛋白质是生物体内不可或缺的重要分子,其在细胞内扮演着各种生物学功能的角色。
蛋白质的结构和功能对于了解生物体的生命过程以及疾病的发生和治疗具有重要意义。
本报告旨在对某一蛋白质进行鉴定分析,并提供相关的数据和结果。
2. 实验方法在蛋白质鉴定分析中,我们采用了以下的实验方法:•样品准备:收集蛋白质样品,并进行必要的处理和预处理工作,如蛋白提取和纯化。
•SDS-PAGE:采用聚丙烯酰胺凝胶电泳(Sodium Dodecyl Sulfate-Polyacrylamide Gel Electrophoresis, SDS-PAGE)技术,对蛋白质样品进行分离。
•蛋白质染色:对SDS-PAGE分离后的蛋白质进行染色,以观察蛋白质的迁移位置和相对分子质量。
•质谱分析:采用质谱技术,如质谱仪和液相色谱质谱联用技术(Liquid Chromatography-Mass Spectrometry, LC-MS),对蛋白质进行分析和鉴定。
•数据处理和分析:对实验得到的数据进行处理和分析,包括蛋白质质量谱图的解析和蛋白质鉴定。
3. 结果与讨论3.1 SDS-PAGE分析结果在SDS-PAGE实验中,我们观察到蛋白质样品在凝胶上呈现出明显的迁移带。
根据迁移带的位置和相对分子质量,我们可以初步判断蛋白质的大小和纯度。
3.2 质谱分析结果在质谱分析中,我们获得了蛋白质的质谱图和相关的质谱数据。
通过对质谱图的解析和蛋白质鉴定数据库的比对,我们得到了蛋白质的鉴定结果。
根据质谱数据分析,我们确定了蛋白质的氨基酸组成、序列以及可能的修饰模式。
此外,我们还对蛋白质的结构和功能进行了初步的预测和分析。
3.3 结果讨论根据实验结果和分析,我们得出了以下的结论:•蛋白质的分子质量:根据SDS-PAGE实验结果和质谱分析数据,我们可以确定蛋白质的相对分子质量范围。
•蛋白质的鉴定结果:通过质谱分析,我们成功鉴定了蛋白质的氨基酸组成和序列,并预测了其可能的结构和功能。
蛋白质结构解析方法
1. X 射线衍射法,这就像是给蛋白质拍一张超级清晰的照片呀!你想想看,通过X 射线的照射,我们就能看清蛋白质的三维结构,那得多厉害啊,就像我们用高清相机拍出美丽的风景一样。
2. 核磁共振法,哇塞,这就仿佛是在和蛋白质进行一场深入的对话呢!它能告诉我们一个个原子的位置信息,是不是很神奇,就好比我们和好朋友聊天,能了解到对方内心的小秘密呀。
3. 冷冻电镜法,哎呀呀,这简直就是给蛋白质来个大特写嘛!能让我们看到极其细微的结构,这多让人兴奋啊,就像近距离观察一朵盛开的鲜花的每一个花瓣细节一样。
4. 质谱分析法,嘿,这不就是个厉害的检测神器嘛!可以分析蛋白质的组成成分呢,就像一个超级侦探能找出各种小线索一样哩。
5. 荧光光谱法,哇哦,这就好像是给蛋白质打上了独特的光芒呀!让我们能更好地了解它,这感觉是不是超酷的,就跟舞台上的聚光灯照亮演员一样。
6. 圆二色性光谱法,嘿嘿,这就如同给蛋白质穿上了一件能显示特征的衣服呀!通过它我们能知道蛋白质的结构特征呢,是不是很奇妙呀,就像我们根据一个人的穿着打扮来判断他的风格一样。
7. 氢氘交换法,呀,这相当于在研究蛋白质时给它来个特别的标记呢!能帮助我们深入探究其结构变化,这多有意思呀,就像给一个物品做个独特的记号一样。
8. 等温滴定量热法,哇,这可是能测量蛋白质相互作用的神奇方法呢!能让我们知道它们之间的关系,是不是超级棒,就像我们了解人与人之间是如何互动交往的一样。
我觉得这些蛋白质结构解析方法都太了不起啦,每一种都像是一把开启蛋白质奥秘的钥匙,让我们能不断深入了解这个神奇的微观世界!。
生物化学实验中的蛋白质分析技术蛋白质分析技术在生物化学实验中的应用在生物化学实验中,蛋白质分析技术是一项十分重要的技术。
蛋白质是生物体中最基本的分子组成部分之一,对于研究生物体的生化过程和功能具有重要意义。
本文将介绍几种常用的蛋白质分析技术,包括SDS-PAGE、Western Blot、质谱分析和免疫沉淀等。
重点讲述这些技术的原理、操作步骤以及其在生物化学实验中的应用。
一、SDS-PAGE技术SDS-PAGE(Sodium Dodecyl Sulfate Polyacrylamide Gel Electrophoresis)是一种常用的蛋白质分析技术,通过电泳的方式将蛋白质样品分离成不同的电泳带来研究其分子量和组成。
1. 原理:SDS-PAGE利用带负电荷的SDS使蛋白质样品具有净电荷,根据蛋白质分子量的不同,通过电泳的方式将蛋白质分离到聚丙烯酰胺凝胶中,然后用染色方法可视化蛋白质电泳带。
2. 操作步骤:制备凝胶、样品处理、电泳、染色等。
3. 应用:常用于估计蛋白质的分子量、纯度和相对表达水平等。
二、Western Blot技术Western Blot是一种用于检测特定蛋白质的技术,常用于研究蛋白质的表达、定位和相互作用等。
1. 原理:Western Blot主要由蛋白质电泳分离、转膜、蛋白质与抗体的特异性结合以及信号检测等步骤组成。
2. 操作步骤:SDS-PAGE分离蛋白质、转膜、抗体孵育、信号检测等。
3. 应用:常用于检测特定蛋白质在不同样品中的表达差异、研究蛋白质的翻译后修饰等。
三、质谱分析技术质谱分析技术是一种可以确定蛋白质分子量和氨基酸序列的方法,广泛应用于蛋白质鉴定和结构研究等领域。
1. 原理:质谱分析技术常用的方法有质谱图谱分析和串联质谱分析。
2. 操作步骤:样品制备、质谱分析、数据解析等。
3. 应用:常用于蛋白质的鉴定、研究蛋白质的翻译后修饰、蛋白质定量等。
四、免疫沉淀技术免疫沉淀技术是一种通过特异性抗体与特定蛋白质结合,进而将目标蛋白质从混合物中分离出来的方法,常用于研究蛋白质相互作用以及功能等。
生物信息学中的蛋白质分析技术蛋白质是生物体中不可或缺的重要分子,其功能包括酶催化、信号传递、结构支持等多种生命活动。
蛋白质分析是生物信息学研究中的重要领域之一,目的是从生物样品中获取有关蛋白质的信息。
这项技术不仅可以揭示蛋白质的结构和功能,还可以为医学诊断和药物研发提供重要的参考。
一、蛋白质分析的基本流程蛋白质分析的基本流程包括蛋白质提取、分离纯化、分析鉴定等几个步骤。
蛋白质提取是将目标蛋白从生物样品中提取出来,一般采用机械破碎、化学分解、超声波等方法。
分离纯化是将目标蛋白与其他蛋白分离开来,可以采用电泳、层析、过滤等方法。
分析鉴定则是对分离得到的蛋白进行化学、物理和生物学的分析,如质谱分析、核酸测序、免疫学检测等方法。
二、质谱分析技术的应用质谱分析是一种可以同时检测多种蛋白质组成和结构的方法,其技术基础是将蛋白质分离并进行离子化后进行质量分析。
这种方法被广泛地应用于蛋白质组学和蛋白质互作等领域。
在蛋白质组学中,将样品中的所有蛋白质分离并进行质谱分析,可以获得大量的信息,如蛋白质的数量、种类、分布和修饰状态等。
质谱分析技术的应用还包括蛋白质互作的研究。
蛋白质互作通常是指两个或多个蛋白质之间的相互作用,这在生物活动中非常重要。
质谱分析可以用来鉴定已知的蛋白质互作或发现新的蛋白质互作,这对于深入理解生物活动机理具有重要意义。
三、结构生物学的应用结构生物学是研究蛋白质三维结构的一种技术,其目的是探究蛋白质结构与功能之间的关系。
现有的结构生物学技术主要包括X射线晶体学、核磁共振和电子显微镜。
通过这些技术,可以确定单个蛋白质的原子结构,也可以确定蛋白质的超分子结构,如蛋白质-DNA复合物和蛋白质-蛋白质复合物等。
在药物研发方面,结构生物学的应用也非常广泛。
通过了解蛋白质的结构,可以设计出针对特定靶标的药物,并对药物与靶标之间的相互作用进行优化和改良。
四、生物信息学的应用生物信息学是将计算机和数学等方法应用于生物学研究的一种学科。
Gi:40644130 allene oxide cyclase 【Niootiana tabacum】丙二烯氧化环化酶(allene oxide cyclase, AOC)Gi:140083805 cytosolic class II small heatshock protein HSP17.5 【Rosa hybrid cultivar】Gi:289487897 Lasoorbate peroxidasa 【Bruguiera gymnorhiza】比如是核糖体16S, 18S,或ITS等DNA序列,一般在Blast n 中搜索,到底是用megablast,discontiguous megablast还是blastn要根据你的序列与数据库序列的相似性,一般首先用blastn,它对相似性要求较低,可发现大量相似序列,如果进一步要求,再选择megablast 等。
但是注意blastn搜索数据库对核酸序列相似性要求较高,如果序列保守性不高,比如新的RNA病毒的基因组序列,可能很难得到结果,这时需要用blastp 或Blast x等。
如果是编码蛋白的基因序列,可先将其翻译成蛋白(注意,一条序列理论上有六种编码可能)然后分别去blastp搜索蛋白数据库,当然,你也可直接将其在Blast x中搜索,Blast x会自动将六种编码可能分别翻译后搜索蛋白数据库。
Blastp/PSI-Blast/PHI-BLAST都是蛋白序列与蛋白序列之间的Blast比对。
1,Blastp: 标准的蛋白序列与蛋白序列之间的比对Standard protein BLAST is designed for protein searches.Blastp用于确定查询的氨基酸序列在蛋白数据库中找到相似的序列。
跟其它的Blast程序一样,目的是要找到相似的区域。
2,PSI-BLAST : 敏感度更高的蛋白序列与蛋白序列之间的比对PSI-BLAST is designed for more sensitive protein-protein similarity searches.Position-Specific Iterated (PSI)-BLAST,是一种更加高灵敏的Blastp程序,对于发现远亲物种的相似蛋白或某个蛋白家族的新成员非常有效。
当你使用标准的Blastp比对失败时,或比对的结果仅仅是一些假基因或推测的基因序列时("hypothetical protein" or "similar to..."),你可以选择PSI-BLAST重新试试。
3,PHI-BLAST : 模式发现迭代BLASTPHI-BLAST can do a restricted protein pattern search.PHI-BLAST, 模式发现迭代BLAST, 用蛋白查询来搜索蛋白数据库的一个程序。
仅仅找出那些查询序列中含有的特殊模式的对齐。
PHI的语法详细介绍看这里:/blast/html/PHIsyntax.htmlThe syntax for patterns in PHI-BLAST follows the conventions of PROSITE. When using the stand-alone program, it is permissible to have multiple patterns in a file separated by a blank line between patterns. When using the Web-page only one pattern is allowed per query.Valid protein characters for PHI-BLAST patterns:ABCDEFGHIKLMNPQRSTVWXYZUValid DNA characters for PHI-BLAST patterns:ACGTOther useful delimiters:[ ] means any one of the characters enclosed in the brackets e.g., [LFYT] means one occurrence of L or F or Y or T- means nothing (this is a spacer character used by PROSITE)x(5) means 5 positions in which any residue is allowed (and similarly for any other single number in parentheses after x)x(2,4) means 2 to 4 positions where any residue is allowed, and similarly for any other two numbers separated by a comma; the first number should be < the second number. can occur only at the end of a pattern and means nothing it may occur before a period (another spacer used by PROSITE) may be used at the end of the pattern and means nothing.When using the stand-alone program, the pattern should be in a file, with the first line starting:ID followed by 2 spaces and a text string giving the pattern a name. There should also be a line starting PA followed by 2 spaces followed by the pattern description.All other PROSITE codes in the first two columns are allowed, but only the HI code, described below is relevant to PHI-BLAST.Here is an example from PROSITE.ID CNMP_BINDING_2; PATTERN.AC PS00889;DT OCT-1993 (CREATED); OCT-1993 (DA TA UPDA TE); NOV-1995 (INFO UPDATE).DE Cyclic nucleotide-binding domain signature 2.PA [LIVMF]-G-E-x-[GAS]-[LIVM]-x(5,11)-R-[STAQ]-A-x-[LIVMA]-x-[STACV].NR /RELEASE=32,49340;NR /TOTAL=57(36); /POSITIVE=57(36); /UNKNOWN=0(0); /FALSE_POS=0(0);NR /FALSE_NEG=1; /PARTIAL=1;CC /TAXO-RANGE=??EP?; /MAX-REPEAT=2;The line starting ID gives the pattern a name. The lines starting AC, DT, DE, NR, NR, CC are relevant to PROSITE users, but irrelevant to PHI-BLAST. These lines are tolerated, but ignored by PHI-BLAST.The line starting PA describes the pattern as: one of LIVMF followed by G followed by E followed by any single character followed by one of GAS followed by one of LIVM followed by any 5 to 11 characters followed by R followed by one of STAQ followed by A followed by any single character followed by one of LIVMA followed by any single character followed by one of STACVIn this case the pattern ends with a period. It can end with nothing after the last specifying symbol or any number of > signs or periods or combination thereof.Here is another example, illustrating the use of an HI line.ID ER_TARGET; PATTERN. PA [KRHQSA]-[DENQ]-E-L>. HI (19 22) HI (201 204)In this example, the HI lines specify that the pattern occurs twice, once from positions 19 through 22 in the sequence and once from positions 201 through 204 in the sequence. These specifications are relevant when stand-alone HI-BLAST is used with the seedp option, in which the interesting occurrences of the pattern in the sequence are specified. In this case the HI lines specify which occurrence(s) of the pattern should be used to find good alignments.In general, the seedp option is more useful than the standard patternp option ONLY when the pattern occurs K > 1 times in the sequence AND the user is interested in matching to J < K of those occurrences. Then using the HI lines enables the user to specify which occurrences are of interest.Disclaimer Privacy statement1、基本概念相似性(Similarity)是指序列比对过程中用来描述检测序列和目标序列之间相同或相似碱基或氨基酸残基占全部比对碱基或氨基酸残基的比例的高低,属于量的判断。