精确对接和虚拟筛选工具eHiTS简介_update
- 格式:pdf
- 大小:1000.05 KB
- 文档页数:6
优化工具SeeSite使用说明文档I. 前言 (3)II. 基站扇形数据的制作 (4)1.数据格式 (4)2.基站扇形的制作 (5)3.TAB目录常见文件说明 (6)III. 菜单功能说明 (7)1.GoogleEarth 格式数据的制作 (7)2.更新家园卡data到表RFcon (8)3.导出临时创建的点数据集temp_point (9)4.通过导入Excel文件创建点 (9)5.导入话务或Region到表RFcon (10)6.添加话务到区块 (12)7.同站同邻频检查 (13)8.基于小区覆盖模型全网同频干扰检查(900M) (13)9.基于小区覆盖模型邻小区完整性检查(900M) (14)10.同频同色复用距离检查 (15)11.对BSC或LAC区域进行划分 (16)12.制作方块图 (17)13.制作1平方公里的话务专题图 (18)14.剔除选择小区同邻频的优选频点 (20)15.TEMS DT路测数据处理相关 (22)16.常用网优工具查询 (22)IV. 工具栏按钮使用说明 (24)1.全部关闭或打开缺省工程文件 (25)2.自动打开缺省路径基站数据 (25)3.擦除临时图层数据 (25)4.标注小区CI或标注干扰频点 (25)5.标注小区名 (26)6.显示小区的频点等规划信息或显示家园卡信息 (26)7.根CI或SITEID或模糊基站名定位小区定位临时点(快捷键:Ctrl + A) (27)8.查找某频点的同频和邻频小区 (30)9.显示900M频点列表(快捷键:Ctrl + Q ) (31)10.显示目标小区的周边同邻频干扰小区 (31)11.显示与目标小区最近同频同色小区及距离 (33)12.查看某一个区域中的同频同色的小区对 (33)13.显示目标小区的邻小区 (34)14.修改邻小区或修改小区家园卡 (35)15.显示目标小区的切入邻小区 (37)16.修改扇形属性或小区覆盖半径分析 (38)17.半自动频率规划(900M 和1800M) (39)18.根据干扰矩阵计算优选频点列表 (40)19.计算小区的最佳色码BSIC (42)20.通过参数新建基站 (43)21.通过点击地图在地图上新增点或新增基站 (43)22.快速制作LAC或BSC或Line或Traffic专题地图 (44)V. 常见问题或错误 (46)1.制作扇形图出错 (46)2.打开EXCEL制作时MapInfo自动关闭 (47)3.删除小区后,引起显示邻小区出错 (47)4.扇形数据删除 (47)5.修改小区参数 (47)6.修改基站位置、方位角或大小 (48)7.怎样规划新站数据 (48)8.在GoogleEarth地图中基站名显示乱码 (49)9.导入话务或Region到表RFcon出错 (49)I.前言MapInfo作为一个强大的GIS软件工具,在很多方面都得到了较好的应用,而在移动网路优化方面的应用,由于MapInfo无法提供一个很针对的软件功能,无法较好的适应移动网路优化的应用,目前的移动网路优化的应用,很多都是建立在MapInfo第三方工具的基础上进行的,因此,MapInfo对网络优化所起作用的大小,很大程度决定于MapInfo第三方工具功能是否强大,是否具有针对性的功能,同时,工具的特色功能,能够在一定程度上提供给网络优化人员一个简便的分析方法,同时,提高网络优化人员的优化网络的效率。
AutoDock和AutoDock Tools 使用教程一、分子对接简介及软件介绍1.分子对接理论基础所谓分子对接就是两个或多个分子之间通过几何匹配和能量匹配而相互识别的过程。
分子对接在酶学研究以及药物设计中具有十分重要的意义。
在酶激活剂、酶抑制剂与酶相互作用以及药物分子产生药理反应的过程中,小分子(通常意义上的Ligand)与靶酶(通常意义上的Receptor)相互互结合,首先就需要两个分子充分接近,采取合适的取向,使两者在必要的部位相互契合,发生相互作用,继而通过适当的构象调整,得到一个稳定的复合物构象。
通过分子对接确定复合物中两个分子正确的相对位置和取向,研究两个分子的构象,特别是底物构象在形成复合物过程中的变化,是确定酶激活剂、抑制剂作用机制以及药物作用机制,设计新药的基础。
分子对接计算是把配体分子放在受体活性位点的位置,然后按照几何互补、能量互补化学环境互补的原则来实时评价配体与受体相互作用的好坏,并找到两个分子之间最佳的结合模式。
分子对接最初思想起源于Fisher E.的“锁和钥匙模型”(图),认为“锁”和“钥匙”的相识别的首要条件是他们在空间形状上要互相匹配。
然而,配体和受体分子之间的识别要比“锁和钥匙”模型复杂的多。
首先,配体和受体分子的构象是变化的,而不是刚性的,配体和受体在对接过程中互相适应对方,从而达到更完美的匹配。
其次,分子对接不但要满足空间形状的匹配,还要满足能量的匹配。
配体和受体之间的通过底物分子与靶酶分子能否结合以及结合的强度最终是由形成此复合物过程的结合自由能变化ΔG bind 所决定的。
互补性(complementarity)和预组坦织(pre-organization)是决定分子对接过程的两个重要原则,前者决定识别过程的选择性,而后者决定识别过理的结合能力。
互补性包括空间结构的互补性和电学性质的互补性。
1958年Koshland提出了分子识别过程中的诱导契合(induced fit)概念,指出配体与受体相互结合时,受体将采取一个能同底物达到最佳结合的构象(图1)。
highlight_entities的使用方法全文共四篇示例,供读者参考第一篇示例:highlight_entities是一种在自然语言处理中常用的技术,用于识别和突出显示文本中的实体,例如人物、地点、组织等。
在信息抽取、语义分析和搜索引擎等应用中,highlight_entities可以帮助用户快速识别关键信息和重要实体,提高信息检索和浏览的效率。
本文将介绍highlight_entities的使用方法,并结合实际案例,详细说明该技术的原理和实现步骤。
1. 数据准备:首先需要准备待处理的文本数据,可以是一篇文章、一段对话或一个网页内容。
数据的质量和完整性对highlight_entities 的效果和准确性有重要影响,因此在数据准备阶段需尽量保证文本的完整性和准确性。
2. 实体标注:根据文本处理的需求和实际情况,定义需要标注和识别的实体类型,如人名、地名、机构名等。
可以利用已有的实体标注工具或通过自定义标注规则,对文本中的关键词和短语进行标注,并映射到对应的实体类型。
3. highlight_entities处理:利用highlight_entities工具或库对标注好的文本进行实体突出显示处理。
根据实体类型和标注信息,对文本中的关键词进行高亮显示或下划线标记,突出显示实体的位置和重要性。
可以根据需求定制不同的显示效果和样式,提高用户体验和可读性。
4. 实体关联:在highlight_entities处理的过程中,可以进一步分析实体之间的关联性和语义关系,对实体进行归类和聚类。
通过识别实体之间的关系,可以更深入地挖掘文本的含义和价值,为后续的信息抽取和语义分析提供参考和支持。
5. 结果展示:最后将处理好的文本结果展示给用户或应用程序。
用户可以根据实体标注和高亮显示的信息,快速了解文本内容和重点信息;应用程序可以根据实体识别和关联分析的结果,进一步处理和挖掘文本的语义信息,实现智能化的信息抽取和搜索功能。
Lucene很强大,这点在前面的章节中,已经作了详细介绍。
但是,无论多么强大的搜索引擎工具,在其后台,都需要一样东西来支援它,那就是网络爬虫Spi der。
网络爬虫,又被称为蜘蛛Spider,或是网络机器人、BOT等,这些都无关紧要,最重要的是要认识到,由于爬虫的存在,才使得搜索引擎有了丰富的资源。
Heritrix是一个纯由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源。
它来自于。
Heritrix最出色之处在于它的可扩展性,开发者可以扩展它的各个组件,来实现自己的抓取逻辑。
本章就来详细介绍一下Heritrix和它的各个组件。
10.1 Heritrix的使用入门要想学会使用Heritrix,当然首先得能把它运行起来。
然而,运行Heritrix并非一件容易的事,需要进行很多配置。
在Heritrix的文档中对它的运行有详细的介绍,不过尽管如此,笔者仍然花了大量时间,才将其配置好并运行成功。
10.1.1 下载和运行HeritrixHeritrix的下载页面为:/downloads.html。
从上面可以链接到SourceForge的下载页面。
当前Heritrix的最新版本为1.10。
(1)在下载完Heritrix的完整开发包后,解压到本地的一个目录下,如图10-1所示。
图10-1 Heritrix的目录结构其中,Heritrix所用到的工具类库都存于lib下,heritrix-1.10.1.jar是Her itrix的Jar包。
另外,在Heritrix目录下有一个conf目录,其中包含了一个很重要的文件:heritrix.properties。
(2)在heritrix.properties中配置了大量与Heritrix运行息息相关的参数,这些参数主要是配置了Heritrix运行时的一些默认工具类、WebUI的启动参数,以及Heritrix的日志格式等。
当第一次运行Heritrix时,只需要修改该文件,为其加入WebUI的登录名和密码,如图10-2所示。
软件介绍之Hisat2咱们《生信技能树》的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程!下面是100个lncRNA组装流程的软件的笔记教程一、Hisat2介绍Hisat是一种高效的RNA-seq实验比对工具。
它使用了基于BWT 和Ferragina-manzini (Fm) index 两种算法的索引框架。
使用了两类索引去比对,一类是全基因组范围的FM索引来锚定每一个比对,另一类是大量的局部索引对这些比对做快速的扩展。
比对原理可阅读文献原文:HISAT: a fast spliced aligner with low memory requirements.二、Hisat2设计原则1.优化了索引建立策略hisat2应用了基于bowtie2的方法去处理很多低水平的用于构建和查询FM索引的操作。
但是与其它比对器不同的是,该软件应用了两类不同的索引类型:代表全基因组的全局FM索引和大量的局部小索引,每个索引代表64000bp的区域。
以人类基因组为例,创建了约48000个局部索引,每一个索引与其相邻索引重叠1024bp,最终可以覆盖这个30亿个碱基的基因组。
这种存在交叉(overlap)的边界可以轻松的比对那些跨区域的read(可变剪切体)。
尽管有很多索引,但是hisat会把他们使用合适方法压缩,最终只占4GB左右的内存。
2.采用了新的比对策略RNA-seq产生的reads可能跨越长度比较大的内含子,在哺乳动物中甚至最长能达到1MB,同时外显子比较短,read也比较短。
当使用100-bp reads时,会有很多read(模拟数据中大概34%)跨两个外显子的情况。
为了更好的比对,将跨外显子的reads分成了三类:1)长锚定read,两个外显子中的每个都至少有16 bp;2)中间锚定read,一个外显子中具有8-15bp;3)短锚定read,仅与其中一个外显子比对上1-7bp。
术语模糊匹配导出精准匹配提取术语:模糊匹配导出与精准匹配提取一、模糊匹配导出在信息检索和数据处理领域,模糊匹配导出是一种常见的技术。
它指的是在输入内容与数据库或文档进行比对时,不要求完全一致,而是允许一定的差异或相似度。
这种方法能够更全面地检索相关信息,因此在大数据分析、搜索引擎优化等方面有着广泛的应用。
1. 模糊匹配概述模糊匹配的核心思想是允许输入内容与目标进行部分匹配,以便找到更多相关信息。
在实际应用中,模糊匹配可以通过编辑距离、相似度算法等技术来实现。
编辑距离是衡量两个字符串之间的相似程度,常用的有Levenshtein距离、Hamming距离等。
相似度算法则可以通过计算词语、短语或句子之间的相似度来实现模糊匹配。
2. 模糊匹配应用模糊匹配广泛应用于搜索引擎、拼写检查、语音识别、推荐系统等领域。
在搜索引擎中,用户输入的关键词可能存在拼写错误或同义词,通过模糊匹配技术能够更准确地给出搜索结果。
在拼写检查和语音识别中,模糊匹配可以帮助准确识别用户输入的信息。
而在推荐系统中,模糊匹配能够更全面地推荐相关内容,提高用户体验。
3. 模糊匹配的优势相比于精确匹配,模糊匹配有着更广泛的适用性。
它能够容忍输入信息的一定误差或变化,从而在实际应用中更具灵活性。
模糊匹配能够帮助用户发现他们可能没有意识到的相关信息,提高信息检索的全面性和准确性。
二、精准匹配提取与模糊匹配相对的是精准匹配提取,它要求输入信息与目标完全一致或高度相似。
在一些需要高度准确性的领域,如医学诊断、法律文书、工程设计等,精准匹配提取技术非常重要。
1. 精准匹配提取概述精准匹配提取的核心思想是确保输入内容与目标完全匹配或高度一致。
在实际应用中,精准匹配可以通过关键词匹配、正则表达式等技术来实现。
关键词匹配是指将输入内容与目标进行逐字比对,确保每个关键词都能匹配上。
而正则表达式则可以根据特定模式来提取符合要求的信息。
2. 精准匹配提取应用精准匹配提取在许多领域都有着重要的应用价值。
AutoDock和AutoDock Tools 使用教程一、分子对接简介及软件介绍1.分子对接理论基础所谓分子对接就是两个或多个分子之间通过几何匹配和能量匹配而相互识别的过程。
分子对接在酶学研究以及药物设计中具有十分重要的意义。
在酶激活剂、酶抑制剂与酶相互作用以及药物分子产生药理反应的过程中,小分子(通常意义上的Ligand)与靶酶(通常意义上的Receptor)相互互结合,首先就需要两个分子充分接近,采取合适的取向,使两者在必要的部位相互契合,发生相互作用,继而通过适当的构象调整,得到一个稳定的复合物构象。
通过分子对接确定复合物中两个分子正确的相对位置和取向,研究两个分子的构象,特别是底物构象在形成复合物过程中的变化,是确定酶激活剂、抑制剂作用机制以及药物作用机制,设计新药的基础。
分子对接计算是把配体分子放在受体活性位点的位置,然后按照几何互补、能量互补化学环境互补的原则来实时评价配体与受体相互作用的好坏,并找到两个分子之间最佳的结合模式。
分子对接最初思想起源于Fisher E.的“锁和钥匙模型”(图),认为“锁”和“钥匙”的相识别的首要条件是他们在空间形状上要互相匹配。
然而,配体和受体分子之间的识别要比“锁和钥匙”模型复杂的多。
首先,配体和受体分子的构象是变化的,而不是刚性的,配体和受体在对接过程中互相适应对方,从而达到更完美的匹配。
其次,分子对接不但要满足空间形状的匹配,还要满足能量的匹配。
配体和受体之间的通过底物分子与靶酶分子能否结合以及结合的强度最终是由形成此复合物过程的结合自由能变化ΔG bind所决定的。
互补性(complementarity)和预组坦织(pre-organization)是决定分子对接过程的两个重要原则,前者决定识别过程的选择性,而后者决定识别过理的结合能力。
互补性包括空间结构的互补性和电学性质的互补性。
1958年Koshland提出了分子识别过程中的诱导契合(induced fit)概念,指出配体与受体相互结合时,受体将采取一个能同底物达到最佳结合的构象(图1)。
1.1.1 全文检索系统结构根据全文检索技术和实现方法,结合需求,检索系统由以下三个部分组成:TRS全文数据库系统(TRS Database Server)TRS 全文检索网关(TRS Gateway)TRS信息发布应用服务器系统(TRS WAS)TRS全文数据库系统(TRS Database Server)采用TRS具有国际领先水平的信息检索和中文自然语言处理研究成果,具有傲视群雄的检索效果和查询性能,核心功能是对结构化和非结构化信息提供全文检索功能。
主要特点包括:●异构海量数据统一管理,非结构化和结构化数据联合检索●Native XML内核,实现全息检索●智能辅助检索,支持知识挖掘●精确计算,检索速度和准确性共达最优●动态索引实时更新,面向事务处理●支持Unicode编码,提供多语种查询引擎●多级机制保障,信息采集和检索高度安全●集群检索,保证高可靠性,随需轻松扩展规模TRS全文数据库系统(TRS Database Server)通过TRS全文检索网关,可以实现对关系数据库中文本对象字段的全文检索。
TRS内容分发服务器系统提供将数据库中的信息动态发布到Web服务器上,以为平台用户检索使用。
全文检索系统架构图如下所示:TRS信息发布应用服务器系统全文检索系统架构图1.1.2 全文检索网关TRS 全文检索系统采用开放的三层体系架构设计,整个系统基于主流的操作系统。
数据层主要为关系型数据库和TRS全文数据库,关系型数据库主要进行存储和管理,而全文数据库实现检索,利用TRS Gateway可以将关系型数据库的数据在TRS全文数据库中建立全文索引,以实现结构化和非结构化数据的全文检索。
TRS全文数据库是TRS 公司自主研发的具有知识产权的产品,为了能够更好的提供全文检索和智能检索等应用功能,它其中包括多种词典支持:分词词典、主题词典、停用词典等。
应用层主要依据TRS全文数据库提供的全文检索功能实现平台所需的检索需求,并为表现层提供检索服务。
e-pointer使用技巧
e-pointer是一个用于电子商务和在线营销的工具,它可以帮
助企业更好地理解和分析他们的网站访问者行为,从而提高用户体
验和销售转化率。
以下是一些e-pointer的使用技巧:
1. 行为分析,e-pointer可以跟踪和分析用户在网站上的行为,包括浏览页面、点击链接、停留时间等,通过这些数据可以了解用
户的兴趣和偏好,从而优化网站内容和布局。
2. 销售转化率优化,通过分析用户行为,e-pointer可以帮助
企业找出用户在购买过程中的瓶颈和障碍,进而优化购物流程和页
面设计,提高销售转化率。
3. 个性化推荐,e-pointer可以根据用户的行为数据,向其推
荐相关的产品或内容,从而提高用户体验和购买意愿。
4. A/B测试,e-pointer可以帮助企业进行A/B测试,比较不
同版本的页面或功能对用户行为和转化率的影响,从而找出最有效
的设计方案。
5. 实时监控,e-pointer可以实时监控网站访问者的行为,及时发现问题并进行调整,保持网站的最佳状态。
总之,e-pointer是一个强大的工具,通过深入分析用户行为数据,可以帮助企业优化网站内容和用户体验,提高销售转化率,从而实现更好的营销效果。
希望以上信息能够帮助你更好地使用e-pointer。
科普小文:计算机辅助药物设计之“分子对接技术”计算机辅助药物设计(CADD),作为现代药物研发的重要工具,在创新药物的开发过程中,不仅为药物的设计提供了很好的理论指导思路,而且还节省了大量的人力物力财力,可以说,CADD的应用,为化合物的成药起到了事倍功半的作用。
而分子对接技术,作为基于受体的药物设计的“核心”,在近些年得到了广泛的应用,值得进一步的研究和探索。
1.分子对接技术概念分子对接技术,作为计算机辅助药物设计的重要方法,通过化学计量学等学科支持,模拟分子的几何结构和分子间作用力,来进行分子间相互作用识别并预测受体-配体复合物结构,是近年来比较成熟的直接药物设计方法。
分子对接不仅可以研究配体(药物分子)与其受体(已知的靶蛋白或活性位点)之间的详细相互作用,预测其结合模式及亲合力,还可以用来发现并优化药分子对接的基础是生物大分子的结构,这些结构信息通常可以通过(homology2.子构象是变化的。
则可以结合。
能量匹配是分子间保持稳定结合的基础,当配体分子进入结合位点时,通过一定的程序计算它们之间的结合模式和结合能,并对结果进行打分,通过打分函数评判配体一受体的结合程度。
由于“锁-钥”原理的局限性,1958年D.E.Koshland提出了“诱导契合"学说,其核心内容为蛋白的活性位点通过与配体的相互作用而发生变化,即蛋白与底物契合并发生结构变化,该原理说明在分子对接的过程中,配体和受体均被视为柔性结构。
事实证明,将配体和受体视为柔性结构得到的对接结果相对而言更为准确。
3.分子对接技术都有哪些类别刚性对接即在对接计算的过程中,参与对接的分子的构象并不发生变化,只有分子的空间位置和姿态发生变化。
由于在刚性对接中,受体和配体的空间形状均被视为固定不变的,所以该方法简化程度较高,并且计算难度和计算量都较小,故适用于处理结构比较大的分子,一般应用于模型建立后的初步分析。
半柔性对接即在对接计算过程中,受体的构象是刚性的,固定不变,只允许配体的构象在一定范围内变化,如固定某些非关键部位的键角和键长等。
theharvester用法
TheHarvester是一款用于信息收集的开源工具,它可以帮助安
全研究人员和黑客收集有关特定目标的电子邮件地址、子域名、虚
拟主机和员工姓名等信息。
TheHarvester可以通过搜索引擎、公开
的资源和其他渠道来收集这些信息,以便进行安全评估和渗透测试。
使用TheHarvester时,你可以通过命令行输入相应的命令和参
数来执行不同的功能。
例如,你可以使用"-d"参数指定目标域名,
使用"-b"参数选择要使用的搜索引擎,使用"-f"参数指定输出文件
的格式等。
通过组合不同的参数,你可以定制TheHarvester的行为
以满足你的需求。
需要注意的是,使用TheHarvester进行信息收集可能涉及到法
律和道德问题,因此在使用该工具时务必遵守法律法规和道德规范,仅在合法授权的情况下使用该工具进行安全测试和研究。
总之,TheHarvester是一个功能强大的信息收集工具,但在使
用时需要谨慎对待,确保符合法律和道德要求。
希望这个回答能够
帮助你了解TheHarvester的基本用法。
批量Entrez技巧1. 介绍在生物信息学研究中,使用NCBI的Entrez数据库进行数据检索是非常常见的操作。
然而,当需要获取大量数据时,手动逐一进行检索和下载将会非常耗时和繁琐。
掌握批量Entrez检索的技巧是非常重要的。
2. 使用工具在进行批量Entrez检索时,可以使用一些编程工具来进行自动化操作,常用的工具包括Python的Biopython库和R语言中的rentrez包。
这些工具提供了方便的API接口,可以帮助我们轻松地进行批量数据检索和下载。
3. 批量检索的目的批量检索的目的可以是获取大量的文献、序列、基因表达数据等。
这些数据可以用于后续的分析和挖掘,为我们的研究提供重要的支持。
4. 批量检索的步骤进行批量Entrez检索的步骤大致分为以下几个部分:1) 确定检索关键词或ID列表首先需要确定我们要检索的内容,可以是文献的关键词、基因的ID列表、序列的Accession号等。
2) 编写程序根据确定的检索内容,我们可以通过编写相应的程序来实现自动化的检索和下载操作。
在程序中需要包括与Entrez数据库进行交互的API调用,以及数据的处理和保存等操作。
3) 运行程序将编写好的程序运行起来,程序会自动进行检索和下载操作,将所需的数据保存到本地文件中。
5. 注意事项在进行批量Entrez检索时,需要注意以下几个事项:1) 尊重NCBI的使用条款在进行大规模的数据获取时,需要遵守NCBI的相关使用条款,避免对数据库服务器造成过大的负担。
2) 数据安全性下载的数据需要妥善保存和管理,避免数据丢失或泄露。
3) 数据质量在获取大量数据时,需要注意数据的质量和准确性,尤其是在后续的分析和挖掘中。
6. 结语掌握批量Entrez检索的技巧可以极大地提高生物信息学研究的效率和智能化水平。
通过合理的使用工具和技术,我们可以轻松地获取大量的数据,为我们的研究提供强有力的支持。
希望以上介绍的批量Entrez技巧对大家有所帮助,也希望大家在使用过程中能够遵守相关的规定,做好数据的管理和维护工作。
高通量数据分析必备基因组浏览器使用介绍-1基因组浏览器是高通量测序分析的一个重要的可视化工具。
相比于最终提供的表格,基因组浏览器可以提供更多的信息,如直观展示突变位点、查看有无新转录本或新的可变剪接形式、查看peak的可信度、上下游基因、区域保守性、重复元件、蛋白结合motif等。
我们前面有测序数据可视化列举了4个常用的高通量数据可视化工具,详细介绍了IGV基因组浏览器可视化高通量测序数据和UCSC 基因组浏览器的安装使用。
最近几次将以华盛顿大学(DC)开发的EPGG基因组浏览器为主要工具 (目前主流浏览器之一,不同的功能更新分别发表于NBT, Nature method等杂志),介绍下基因组浏览器的基本展示内容、各部分含义、使用方式等。
基因组浏览器都可以按照位置或基因名字搜索,可进行局部放大和缩小。
虽然每个软件略有不同,但基本操作是通用的。
点一点,拽一拽,就都能用了。
初次接触一个软件,多一点耐心,多一点操作,其实没那么难。
基因信息展示包含基因的转录方向信息(箭头),基因结构信息(CDS, UTR, intron),基因功能描述信息等。
方向信息对我们识别转录起始位点及启动子区域和启动子上的ChIP peak至关重要。
另外还有个功能,基因只在基因组占1%,浏览起来不方便,Juxtapose模式可以只显示基因区,其它区域隐藏,这样截图或浏览起来都更方便。
重复元件是我们做分析时需要关注的一个点,最近Cell文章发现LINE元件(A LINE-1-Nucleolin Patnership Regulates Early Development and ESC Identity)是胚胎发育的关键。
如果我们的数据能在某个重复元件上有特殊分布,也可能催生重要发现呢。
“峰图”是最常见的展示形式,reads的分布有高有低,在基因组上形成层恋叠嶂的山峰状。
峰顶表示对应区域的表达、修饰或结合比较高。
除了峰形图,也可以展示热图、线图等。
精确对接和虚拟筛选工具eHiTS简介
分子对接是计算机辅助药物设计(CADD)的重要方法之一,其本质是配体和受体之间的识别过程。
eHiTS就为我们提供了这样一个进行分子对接研究的平台。
可以用来帮助我们研究配体和受体的相互作用模式和进行高通量虚拟筛选工作。
来自于加拿大SimBioSys公司的eHiTS是一款精确快速柔性对接软件。
其具有以下优点:
使用简单—自动预处理、自动考虑质子化状态等
速度很快—特殊算法和极强的并行化能力
结果精确—系统搜索算法和基于蛋白家族打分函数
可操控性—用户可以自己训练打分函数
目前eHiTS已经被Pfizer, Roche, Sanofi Aventis, Boehringer, Harvard Medicine, Berkeley等知名的制药企业和高校广泛使用。
一、成功应用案例
1. Petra等人用eHiTS对NCI数据库进行虚拟高通量筛选发现了3种新的醛酮还原酶1C1抑制剂
醛酮酸还原酶1C1是治疗多种癌症的一个重要靶点,Petra等用eHiTS对NCI数据库中的“Diversity set”数据库进行了高通量虚拟筛选。
将排名前50的小分子拿去测活,发现有3个小分子对于醛酮酸还原酶1C1具有较好的抑制活性,IC50值在微摩尔量级。
左边这张表就是获得三个有抑制活性小分子,及其IC50值;右边这张图是其中抑制活性最好的小分子NSC292213与受体的相互作用模式,其中洋红色的是晶体结构中的抑制剂,而亮蓝色的是筛选得到的有抑制活性的小分子,可以发现,NSC292213与晶体结构中的抑制剂的结合模式还是比较类似的。
Ref: Molecular and Cellular Endocrinology, 2009, 301, 245-250
2. Stephen等用eHiTS对虚拟肽库进行高通量筛选发现了新的脱氧核糖核酸酶1抑制肽
除了进行小分子抑制剂的筛选,eHiTS还可以用来
研究小肽抑制剂。
Stephen等就用eHiTS建立一套基于受
体的自动筛选虚拟肽库方法。
他们首先建立一个虚拟的
肽库,然后用eHiTS将这些虚拟库中小肽对接到受体,
将打分最高的由8个AA组成的小肽进行测活,发现其
对脱氧核糖核酸酶1具有很好的抑制活性,Ki值为0.16
微摩尔。
这张图是得到的抑制肽与脱氧核糖核酸酶1的
相互作用模式,其中红色是筛到的小肽,蓝色是受体。
Ref: Proteins: Structure, Function, and Bioinformatics, 2009,
76, 3, Pages 693 – 705 (IF: 3.26)
二、eHiTS 的精确度、富集能力和速度验证
我们知道一款对接软件的性能主要由精确度、富集能力和速度三方面决定,以下将从这三方面来介绍eHiTS 。
(一)精确度验证——能否找出正确的配体与受体的结合模式
2010 J. Comput. Chem.评价eHiTS 是最好的对接软件之一。
(二)富集能力验证——区分活性和非活性化合物能力
对接了1586个复合物晶体结构 92% 的打分最高构象RMSD < 2 Å
对接了69个复合物晶体结构
59个RMSD < 1.5 Å,eHiTS 表现最好
Ref :J. Med. Chem. 2004, 47. 558-565.
针对六个蛋白家族做了富集能力测试:
COX2, Estrogen Receptor, Thrombin, Gelatinase ,P38 Kinase, Neuraminidase
eHiTS 的富集能力始终表现的非常好和最稳定
(三)速度验证
三、eHiTS 的构象搜索算法和打分函数
eHiTS 通过系统搜索算法和基于蛋白家族binding site 的打分函数为我们提供了一个精确快速的分子对接研究平台。
可帮助我们研究配体和受体的相互作用模式和进行高通量虚拟筛选。
下面分别对eHiTS 的搜索算法和打分函数进行介绍: (一)构象搜索算法—系统搜索算法
如何既快速又全面获得对接中的构象一直是分子对接的难点之一,eHiTS 采用其独特的系统搜索算法很好地解决了该难点。
构象搜索的流程:
I .拆分:将配体拆分为刚性片段和柔性连接链
II .对接:将每个刚性片段分别对接到结合口袋中的所有位置
III .Pose 匹配,找出所有匹配活性口袋化学特征的构象,并进行重新连接成配体
IV .优化,对获得配体的构象进行局部的能量优化
V .评价,对获得的结果进行打分排序
第一步:eHiTS 将配体拆分为刚性片段和柔性的连接链,比如上边的这张图,其中红色的虚线方框就是拆
分得到的刚性片段,这里总共有三个刚性片段。
eHiTS 提供了不同的对接模式,以方便用户根据自己化合物库的大小进行选择;平均对接一个配体的时间在十几秒到几分钟之间。
eHiTS 具有超强的并行化能力,可以大大加快计算的速度。
第二步:eHiTS将得到的这些刚性片段分别对接到结合口袋中的所有位置
第三步:eHiTS将得到的构象与活性口袋化学特征进行一个快速匹配,并重新连接成配体
第四步:eHiTS对得到的配体构象进行局部能量优化,包括像形状的匹配、能量的匹配以及小分子内部的构象应变能
最后,对获得的结果进行打分排序,这需要用到打分函数eHiTS_Score。
eHiTS的搜索算法采用的系统搜索算法,搜索的构象可以覆盖到体系的任意势能面上,因此它得到的构象是非常全面和系统的;另外由于是将配体拆分成刚性片段和柔性链,这样大大提高了搜索构象的速度;而且也解决一些由于大的空间位阻而对接不到受体活性口袋中的问题。
(二)打分函数—eHiTS_Scroe
●打分函数的获得
eHiTS打分函数eHiTS_Score集合了经验的和知识的打分函数,是基于蛋白家族的打分函数,下面对打分函数的获得进行具体介绍:
首先从PDB库中收集了13,000复合物PDB,这里挑选的受体要最大程度的覆盖当前研究比较多的蛋白家族,配体要尽可能的具有多样性;然后进行聚类为500个家族,当然这个的分类并不是生物学上的关于蛋白家族的分类,而是根据受体活性口袋进行分类,即具有相似的活性口袋会被分到同一个家族。
然后对每个家族进行训练、优化打分函数,最后得到对应不同家族的打分函数。
eHiTS_Score综合考虑了统计和实验的打分函数,同时它将PDB文件里面温度因子项也考虑进来;并且可以很方便与其他的对接软件和评价工具进行联用。
●eHiTS_Score的打分项
eHiTS_Score的打分项包括两大部分:一个是表面点特征项,一个是补充的打分项。
如果配体和受体的表面点特征项相匹配的话会得到正分,如果不匹配的话会被罚分。
I.表面点特征项,总共23项:主要考虑的是金属相互作用、氢键受体、氢键供体、疏水相互作用、π-π堆积力等化学特征,评价配体和受体的化学特征的匹配情况。
II.补充的打分项,总共7项:包括空间位置、结合的深度、溶剂化作用等,评价配体和受体空间形状的匹配。
●eHiTS_tune—自定义打分函数
eHiTS_Score为我们提供了对打分函数进行自定义的工具eHiTS_tune。
用户可以针对自己所研究的蛋白体系来对打分函数进行重新的训练,包括像对接准确性的训练和富集能力的训练,从而得到专门针对自己研究蛋白体系的打分函数,这会使您得到更好的对接准确性和提高eHiTS的高通量筛选能力。
四、其他独特性能——高度自动化,容易使用
●eHiTS可在一次对接过程中考虑配体和受体所有可能的质子化状态
●自动修正PDB文件里面的一些格式错误
●会对提交的文件进行自动的预处理,包括去水,加氢等,不需要任何的手动预处理
●提供了一个进行可视化操作的工具CheVi,可以实现对接过程的可视化操作以及结果的查看、分
析
●可以考虑元素周期表里面的所有金属离子
因此,eHiTS在具有很好的精确度和很快速度的同时,也是一款非常易用的对接软件。