当前位置:文档之家› 如何查找基因的序列(全)

如何查找基因的序列(全)

如何查找基因的序列(全)
如何查找基因的序列(全)

如何查找基因序列?(转载)

(2010-08-01 11:47:41)

如何查找基因序列?

——在Genbank中寻找目的基因的实例

——献给受类似问题困扰的广大酷友,以及给我动力和信心发表原创帖的基因酷的朋友们。

酷友感言:网络的世界很精彩,网络的查询很无奈。为了我们的科学研究事业,为了我们能够顺利毕业,我们的广大酷友们在网络的海洋里遨游…遨游…咋就找不到彼岸呢?今天要设计这个基因的PCR引物,明天又要查那个基因的信息,那么大一张网,唉想起来就郁闷……鉴此,我们推出了利用Genbank查找基因序列的帖子,希望对大家有所帮助,并请大家多多指教!当然,如果您已经是此中高手,那就权当我是班门弄斧了,呵呵。

1. 根据文献

搞reasearch肯定要读文献的,如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在Genbank中的ID号,那就好办了,直接打开https://www.doczj.com/doc/134706901.html,,在Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框中,点“GO”,就可以找到他了。

举例说明,例如:在2003年JBC的文章(Conditional Knock-out of

Integrin-linked Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出现了“calreticulin (GenBank accession number gi 16151096)”,那么把“16151096”输入GO前面的文本框中,点“GO”,就可以找到该基因了(当然包括基因序列等相关信息)。

在出现了检索结果界面(下图)后,直接点击红箭头所指的 AY047586就可以看到基因的相关信息了...(呵呵,是不是有点太......easy 了)

这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多说了。点击 AY047586后出现的界面如下:如果你只想获得序列(例如去设计PCR引物的时候),那就可以选择FASTA,这样就得到了FASTA格式的序列文件,没有其他数字和格式的干扰。

(缩略图,点击图片链接看原图)这就是FASTA格式的序列:

(缩略图,点击图片链接看原图)2. 根据已经获得的基因的相关信息进行查找(待续......)

鼓励一下吧,累坏了正如路漫漫所说,如果只是知道基因的名字,怎么查序列呢?还是举例说明,比如我想做的基因名称是人的VEGF基因,那么怎么在Genbank中找到它呢?还是一步一步来...打开https://www.doczj.com/doc/134706901.html,/

在search后面的下拉框中选择Gene,然后在中间的文本框中输入基

因名称“VEGF”,点击GO...

搜索结果出来了,let me see... 啊,怎么这么多?689条,哪一条是我想要的基因呢?

(作者注:这也许是大多数人对Genbank的第一印象,即东西太多了,不知道是哪个。)

别急,咱们慢慢来,我就要亮出去伪存真的秘密武器了,呵呵点击箭头所指的Limits

Limits的意思其实就是高级检索,你可以在这里对检索词进行很多限制,这样能大大精简查询结果。

我们接着来,在Limits这个界面,先选择查询的限定范围。我们要找什么基因来着?想起来了,是人的VEGF基因,那就开始选择:先选Gene name(基因名称);然后再选择Limit by Taxonomy(生物分类限定)中的Homo sapiens(人类),然后再点击“GO”哇,只有一个结果,是不是搞定了?(呵呵,好有面子哦[])

直接点击基因名称“VEGFA”就可以看到有关基因的信息了。

需要指出的是,在Genbank中,基因有很多别名(Aliases),和Genbank 中记录的名称有可能不一致,大家要睁大眼睛哦。比如在这里,VEGFA 是Genbank中记录的基因名称,而它还有很多别名,比如MGC70609, VEGF(这就是我们要找的基因名称), VEGF-A, VPF;还有,在这里可以看到该基因在染色体上的位置...点击VEGFA后出现界面

再往下看,可以看到Genomic regions, transcripts, and products,这里显示了该基因在基因组中的位置,以及转录本的生成情况:

就看见了目的基因的mRNA的链接(如NM_001025366.1)和蛋白质的链接(如NP_001020537.2 )

这里得说两句,有的基因也许只有一个编码序列,但有的基因有很多的mRNA剪接体,但都是归在一个基因名称下面。比如,在VEGF基因下面有7个序列,分别是vascular endothelial growth factor A isoform a, isoform c, isoform d, isoform e, isoform f , isoform g, isoform b precursor ,但是哪个是自己想找的基因呢?这就需要根据你自己查阅的文献以及在这些基因序列后面的解释来确定了。

如果我想找的基因是第一个序列即isoform a, 就可以点击

NM_001025366.1,得到如下界面:

怎么,是不是很熟悉,下面的东西就不用我罗嗦了吧(砖头来了,我闪~~)总结一下

说来其实很简单,就是利用Genbank的检索功能。也许大家的检索文献能力很强,但是面对Genbank这个庞然大物有却些打怵,加之初涉基因,相关知识不足,所以很多时候都是费力无穷却无功而返。还是那句话,战略上藐视,实践中重视。多花些时间了解Genbank,不要上来就狂查一通。先把检索功能学习学习会更容易达到目的,磨刀不误砍柴工嘛,呵呵。

啥,就剩一句了?那好,谁把上网费给俺报了....

最后,如果你觉得这个帖子有点用处,帮忙顶一下,谢谢支持!非常优秀的一篇帖子,通过百度和站内搜索得出的结果却很有些令人困惑的地方,呵呵

如何查找基因的序列(全)

如何查找基因序列?(转载) (2010-08-01 11:47:41) 如何查找基因序列? ——在Genbank中寻找目的基因的实例 ——献给受类似问题困扰的广大酷友,以及给我动力和信心发表原创帖的基因酷的朋友们。 酷友感言:网络的世界很精彩,网络的查询很无奈。为了我们的科学研究事业,为了我们能够顺利毕业,我们的广大酷友们在网络的海洋里遨游…遨游…咋就找不到彼岸呢?今天要设计这个基因的PCR引物,明天又要查那个基因的信息,那么大一张网,唉想起来就郁闷……鉴此,我们推出了利用Genbank查找基因序列的帖子,希望对大家有所帮助,并请大家多多指教!当然,如果您已经是此中高手,那就权当我是班门弄斧了,呵呵。 1. 根据文献 搞reasearch肯定要读文献的,如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在Genbank中的ID号,那就好办了,直接打开https://www.doczj.com/doc/134706901.html,,在Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框中,点“GO”,就可以找到他了。 举例说明,例如:在2003年JBC的文章(Conditional Knock-out of

Integrin-linked Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出现了“calreticulin (GenBank accession number gi 16151096)”,那么把“16151096”输入GO前面的文本框中,点“GO”,就可以找到该基因了(当然包括基因序列等相关信息)。 在出现了检索结果界面(下图)后,直接点击红箭头所指的 AY047586就可以看到基因的相关信息了...(呵呵,是不是有点太......easy 了) 这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多说了。点击 AY047586后出现的界面如下:如果你只想获得序列(例如去设计PCR引物的时候),那就可以选择FASTA,这样就得到了FASTA格式的序列文件,没有其他数字和格式的干扰。 (缩略图,点击图片链接看原图)这就是FASTA格式的序列: (缩略图,点击图片链接看原图)2. 根据已经获得的基因的相关信息进行查找(待续......) 鼓励一下吧,累坏了正如路漫漫所说,如果只是知道基因的名字,怎么查序列呢?还是举例说明,比如我想做的基因名称是人的VEGF基因,那么怎么在Genbank中找到它呢?还是一步一步来...打开https://www.doczj.com/doc/134706901.html,/ 在search后面的下拉框中选择Gene,然后在中间的文本框中输入基

一步一步教你使用NCBI查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST序列比对等

一步一步教你使用 NCBI 查找DNA、mRNA、 cDNA、Protein、promoter、引物设计、BLAST 序列比对等 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用 BLAST 进行序列比对……,这些问题在 NCBI 上都可以方便的找到答案。现在我就结合我自己使用 NCBI的一些经历(经验)跟大家交流一下 BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下 NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的 mRNA、cDNA、蛋白序列 Part three 运用 STS 查找已经公布的引物序列 Part four 如何运用 BLAST 进行序列比对、检验引物特异性 特别感本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感,各位战友! 请大家对以下我发表的容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的 IL6(白细胞介素 6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为:https://www.doczj.com/doc/134706901.html,/mapview/index.html 在 search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示:

ncbi中查找基因序列的方法和三个登录号

ncbi中查找基因序列的方法和三个号码 一.例子:查找酿酒酵母(Saccharomyces cerevisiae)里的海藻糖合成酶基因(tps1) 即可出现很多条目,找到Saccharomyces cerevisiae的就是NC_001134了,点击后就进入该基因所在染色体的界面了,再在“编辑”中“查找”tps1就可以看该基因所在的位置,再点击CDS或者GeneID:852423都可以出现相关链接! 当然,如果你在文献查到目的蛋白的序列号如NP_009684.1或者GeneID:852423,那分别在Search后选择Protein或者Gene也可以出现相关链接! 二.基因CDS区界面的3个号码 https://www.doczj.com/doc/134706901.html,/entrez/viewer.fcgi?val=50593115&from=488899&to=490386& view=gbwithparts 找到后,我发现该界面有3个标记,一个是NC_001134 ,其次是gi:50593115,最后是FEATURES中的gene中的/db_xref= “GeneID:852423”,他们分别是什么号码,用在什么地方呢?尝试中,终于发现, 在Search“Nucleotide”或者“Core Nucleotide”时,for后面是NC_001134,最终go 到该基因所在染色体全长序列的信息,所以NC_001134应该是该染色体的登录号吧? 在Search“Nucleotide”或者“Core Nucleotide”时,for后面是50593115,最终go到该基因所在染色体全长序列的信息,所以50593115应该是该染色体的号吧? 在Search“Gene”时,for后面是852423,最终go到该基因的信息,所以852423应该是该基因的登录号吧?所以我们如果要记住目的基因在ncbi中的位置就记住这个GeneID! 其他像NP_009684当然是基因编码的蛋白质的登录号啦,不说了。 我们在文献中查到的基因往往给的是Gene ID 三.引物设计第一步--找编码序列的方法 在Search“Gene”时,for后面是852423,最终go到目的基因的信息

如何找基因全序

如何找基因全序

————————————————————————————————作者:————————————————————————————————日期:

利用Pubmed Map viewer查找基因序列、mRNA 序列、启动子(Promoter) 遗传分子统计2010-03-24 16:11:24 阅读759 评论0字号:大中小 下面以大鼠(rattus norvegicus)的结缔组织生长因子(C T G F)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址https://www.doczj.com/doc/134706901.html,/mapview/index.html在search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示: 2.点击“GO”出现如下页面:

3.在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框,在Gene 前面的小方框里打勾,然后点击Filter. 出现下图: 说明一下:1、染色体的红色区域即为你的目的基因所处位置。2、下面参考序列给出了三个,是不同的部门做出来的,经我验证,序列有微小的差异,但总体来说基本相同。尽

管你分别点击后,序列代码等有所差异,但碱基基本一致,不影响大家研究分析序列。现在普遍采用的是最上面的那个序列,这一条是世界范围的生物科学家用计算机合成的一个序列。我也推荐大家使用这个序列。 4.点击上述三条序列第一条序列(即reference)对应的"Genes seq",出现新的页面,页面下方为: 5.点击上图出现的“Download/View Sequence/Evidence ”,即下载查看序列等功能,结果如图所示: 先对上面这张图做点简要的说明,在Sequence Format(序列输出格式)后面是一个下拉式选择菜单,默认的为FASTA 格式,还有一个是GenBank 格式。我推荐大家选择GenBnak格式,因为这个格式提供了很多该基因的信息,而FASTA 格式只有基因序列。 6.在Sequence Format 后选择GenBank,然后点击下面的Display,目的基因的相关信息和序列就出现在眼前了。点击后如图所示(网页较大,只抓取一小部分以作示范):

如何查找一个基因的启动子序列

定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。一般查阅外文文献,老外从转录起始位点(Transcription Strart Site,TSS,记为+1位)开始上溯2K -3K的区间算做是启动子 区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。 票数 Do One Thing, And Do It Well. mybbff edited on 2005-07-22 08:41 ? ? ? ? 2005-05-07 11:23 分享 分享到哪里? ? ?

??? ? ? ? ? 下面以BCL-2基因为例,查找查找该基因的启动子区域,首先要找到该基因的基因组序列。去NCBI吧,在Search的下拉菜单里找到Gene,在检索项里输入Bcl-2,检索第一项就是bcl-2 for human,点进去看看啥样。。。 票数 Do One Thing, And Do It Well. ??

???2005-05-07 11:29 分享 分享到哪里? ? ? ? ? ? ? 首先你可以看到该基因的参考序列(reference sequence),然后看到bcl-2的位置和基因组背景。bcl-2上游是 PHLPP,下游是FVT1基因。在这个长长的网页的最后是已经注册的Bcl-2基因的信息。

票数 Do One Thing, And Do It Well. Revelation edited on 2005-05-07 11:59 ? ???2005-05-07 11:35 分享 分享到哪里? ? ? ? ? ? ? 看到基因组序列了么,点进去,根据序列信息自己就能定位转录起始位点,上游就是promoter了,简单吧。不!我觉得麻烦。有更简单的方法么?有!注意到在网页的开头有这么个链接么?HGNC:990

怎样使用NCBI搜索并下载基因序列

怎样使用NCBI搜索并下载基因序列 分步阅读 NCBI是生物学科经常使用的搜索引擎,其收纳了大量的基因和蛋白序列,可以对这些序列进行比对、设计引物等,功能非常强大,下面是小编经常使用的一个功能,即基因序列信息的查找和下载,希望和大家一起学习。 工具/原料 NCBI,基因序列,查找,下载 方法/步骤 1 打开NCBI 百度搜索键入“NCBI”,点击“搜索”,第一个就是官方主页,点击打开。 2 关键字查找 以H9亚型流感病毒HA基因下载为例,说明详细过程。 既然要下载基因序列,需要在栏目内找到“Nucleotide”,搜索栏内填入“Avian influenza virus H9 HA”,点击“search”。 3 添加限定词 点击搜索后,我们看到页面中间显示了很多关于“Avian influenza virus H9 HA”的基因序列,如果其中的一个符合你的要求,就可以下载。如何不符合你的要求,可以继续在搜索条内添加限定,比如添加“2010”,即2010年分离到的病毒。 4 序列选定 找到目标基因序列后,我们要将其下载下来。以给出第一个序列为例,点击序列前面的“小方格”,将其选定。 5 下载序列 选定后,点击页面右上角的“Send to”,选择“file”,再将format选择为“FASTA”格式,点击“Create file”,将序列下载到自定的文件夹内。 6 用DNAStar打开 下载的序列为FASTA格式,需要使用相关的软件打开,小编经常使用的是DNAStar中的Editseq,这个功能还是很强大的。 END 注意事项 NCBI 的功能非常强大,熟练使用才能快速找到目标序列。 觉得实用投个票呗,共同学习!

一步一步教你使用-NCBI-查找DNA、mRNA、cDNA、Protein、promoter、引物设计方案、BLAST-序列比对等

一步一步教你使用NCBI 查找DNA、 mRNA、cDNA、Protein、promoter、引 物设计、BLAST 序列比对等 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用 BLAST 进行序列比对……,这些问题在NCBI 上都可以方便的找到答案。现在我就结合我自 己使用NCBI的一些经历(经验)跟大家交流一下BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的mRNA、cDNA、蛋白序列 Part three 运用STS 查找已经公布的引物序列 Part four 如何运用BLAST 进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的IL6(白细胞介素6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为:https://www.doczj.com/doc/134706901.html,/mapview/index.html 在search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示:

如何在genbank中查找一基因的序列

如何在genbank中查找一基因的序列 1、在GeneBank 中查找基因序列只要输入accession号就可以了,下面网址就是一个基因的全部序列信息的例子,https://www.doczj.com/doc/134706901.html,/Sitemap/samplerecord.html,在记录的末尾有各种记录的详细说明,如果你没有accession号,可以把你手头的编号用source等信息源转换成accession号,中文教程太古老了,如果你是初学者一定要养成看英文文献的习惯,要是特别想看中文翻译的话,书店里随便一本生物信息学书里都会介绍数据库的,不过有些翻译过来的东西真的很别扭,希望对你有帮助。 2、关于在GeneBank中查找序列我有几点体会: 最直接、最简单的方法是手头有基因的accession号; 如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉丁全名),基因名称尽可能详细,避免搜出一些不相关的信息; 搜索的时候建议先用NCBI的Gene数据库搜索,这样得到的accession号是属于NCBI工作人员重新整理过的Refseq的序列,这样会比较可靠;当然这个要看你的分析目的,如果你是要对该序列进行下游的分子生物学操作or分析,选这种序列我觉得会比较好,如果是要进行多序列的分析or其他目的需要全面分析该序列的,可能需要其他序列做补充,但是我觉得序列越多问题越说不清楚,因为毕竟不是自己的序列,如果Gene数据库里没有收录,那就只有在Nucleotide数据库里找了,但是还是建议采用Refseq的序列,Refseq序列特征如下: Accession prefix Molecule type Comment AC_ Genomic Complete genomic molecule, alternate assembly NC_ Genomic Complete genomic molecule, reference assembly NG_ Genomic Incomplete genomic region NT_ Genomic Contig or scaffold, clone-based or WGSa NW_ Genomic Contig or scaffold, primarily WGSa NS_ Genomic Environmental sequence NZ_b Genomic Unfinished WGS NM_ mRNA NR_ RNA XM_c mRNA Predicted model XR_c RNA Predicted model AP_ Protein Annotated on AC_ alternate assembly NP_ Protein YP_c Protein XP_c Protein Predicted model ZP_c Protein Predicted model, annotated on NZ_ genomic records a Whole Genome Shotgun sequence data. b An ordered collection of WGS for a genome. c Computed. 其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物最好有起始密码子和终止密码子; 其他未尽事宜大家补充!

如何在NCBI查找基因序列

如何查找基因序列?——在Genbank中寻找目的基因的实例 1. 根据文献 搞reasearch肯定要读文献的,如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了 该基因在Genbank中的ID号,那就好办了,直接打开https://www.doczj.com/doc/134706901.html,,在Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框中,点“GO”, 就可以找到他了。 举例说明,例如:在2003年JBC的文章(Conditional Knock-out of Integrin-linked Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出现了“calreticulin (GenBank accession number gi 16151096)”,那么把“16151096”输入GO 前面的文本框中,点“GO”,就可以找到该基因了(当然包括基因序列等相关信息)。见附图 在出现了检索结果界面(下图)后,直接点击红箭头所指的AY047586就可以看到基因的相关信息了...

这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多说了。 点击 AY047586后出现的界面如下:

下面还有...... 如果你只想获得序列(例如去设计PCR引物的时候),那就可以选择FASTA,这样就得到了FASTA格式的序列文件,没有其他数字和格式的干扰。

一步一步教你使用NCBI查找DNA、mRNA、cDNA

一步一步教你使用 NCBI 查找DNA、mRNA、cDNA、... 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用BLAST 进行序列比对……,这些问题在 NCBI 上都可以方便的找到答案。现在我就结合我自 己使用 NCBI的一些经历(经验)跟大家交流一下 BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下 NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的 mRNA、cDNA、蛋白序列 Part three 运用 STS 查找已经公布的引物序列 Part four 如何运用 BLAST 进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的 IL6(白细胞介素 6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为: https://www.doczj.com/doc/134706901.html,/mapview/index.html 在 search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示:

2.点击“GO”出现如下页面: 3.在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框,在Gene 前面的小方框里打勾,然后点击Filter. 出现下图:

一步一步教你使用NCBI查找DNA

一步一步教你使用NCBI 查找DNA、mRNA、cDNA、Protein、promoter、引物设计、BLAST 序列比对等 最近看到很多战友在论坛上询问如何查询基因序列、如何进行引物设计、如何使用 BLAST 进行序列比对……,这些问题在 NCBI 上都可以方便的找到答案。现在我就结合我自己使用 NCBI的一些经历(经验)跟大家交流一下 BCBI 的使用。希望大家都能发表自己的使 用心得,让我们共同进步! 我分以下几个部分说一下 NCBI 的使用: Part one 如何查找基因序列、mRNA、Promoter Part two 如何查找连续的 mRNA、cDNA、蛋白序列 Part three 运用 STS 查找已经公布的引物序列 Part four 如何运用 BLAST 进行序列比对、检验引物特异性 特别感谢本版版主,将这个帖子置顶! 从发帖到现在,很多战友对该帖给与了积极的关注,在此向给我投票的(以及想给我 投票却暂时不能投票的)各位战友表示真诚的感谢,谢谢各位战友! 请大家对以下我发表的内容提出自己的意见。关于NCBI 其他方面的使用也请水平较高 的战友给予补充 First of all,还是让我们从查找基因序列开始。 第一部分利用Map viewer 查找基因序列、mRNA 序列、 启动子(Promoter) 下面以人的 IL6(白细胞介素 6)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址为:https://www.doczj.com/doc/134706901.html,/mapview/index.html 在 search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示:

如何在genbank中查找一基因的序列.docx

如何在 genbank 中查找一基因的序列 1、在 GeneBank 中查找基因序列只要输入accession号就可以了,下面网址就是一个基因的全部序列信 息的例子,,在记录的末尾有各种记录的详细说明,如果你没有accession 号,可以把你手头的编号用source 等信息源转换成accession号,中文教程太古老了,如果你是初学者一定要养成看英文文献的习惯,要是 特别想看中文翻译的话,书店里随便一本生物信息学书里都会介绍数据库的,不过有些翻译过来的东西真 的很别扭,希望对你有帮助。 2、关于在GeneBank中查找序列我有几点体会: 最直接、最简单的方法是手头有基因的accession号; 如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉丁全名),基因名称尽可能详细,避免搜出一些不相关的信息; 搜索的时候建议先用NCBI 的 Gene数据库搜索,这样得到的 accession 号是属于 NCBI工作人员重新整理过的 Refseq 的序列,这样会比较可靠;当然这个要看你的分析目的,如果你是要对该序列进行下游的分子生 物学操作 or 分析,选这种序列我觉得会比较好,如果是要进行多序列的分析or 其他目的需要全面分析该序列的,可能需要其他序列做补充,但是我觉得序列越多问题越说不清楚,因为毕竟不是自己的序列,如 果 Gene 数据库里没有收录,那就只有在Nucleotide数据库里找了,但是还是建议采用Refseq 的序列,Refseq 序列特征如下: Accession prefix Molecule type Comment AC_Genomic Complete genomic molecule, alternate assembly NC_Genomic Complete genomic molecule, reference assembly NG_Genomic Incomplete genomic region NT_Genomic Contig or scaffold, clone-based or WGSa NW_Genomic Contig or scaffold, primarily WGSa NS_Genomic Environmental sequence NZ_b Genomic Unfinished WGS NM_mRNA NR_RNA XM_c mRNA Predicted model XR_c RNA Predicted model AP_Protein Annotated on AC_ alternate assembly NP_Protein YP_c Protein XP_c Protein Predicted model ZP_c Protein Predicted model, annotated on NZ_ genomic records a Whole Genome Shotgun sequence data. b An ordered collection of WGS for a genome. c Computed. 其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物最好有起始密码子和终止密码子; 其他未尽事宜大家补充!

如何查找一个基因的启动子序列

如何查找一个基因的启动子序列 发表者:刘小丰(访问人次:6102) 刘小丰收集整理 定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。 区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。 这项搜寻要从UCSC基因组浏览器开始,网址为 https://www.doczj.com/doc/134706901.html,/cgi-bin/hgGateway。以编码pendrin (PDS)的基因为例来说明上述问题。PDS与耳蜗的异常发育、感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。 进入UCSC的主页后,在Organism的下拉菜单中选择Human,然后点击Browser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在assembly的下拉菜单中选择Dec. 2001,在position框中键入pendrin,然后点击Submit。返回的页面结果显示一个已知的基因和两个mRNA序列。继续点击mRNA序列的登录号AF030880,出现包含这个mRNA区域的图解概要。为了获得这个区域更清晰的图像,点击紧靠zoom out的1.5X按钮。最后点击页面中部的reset all按钮,使各个路径的设置恢复默认状态。 然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视图利用页面底部的Track Controls按纽,将一些路径设置为hide模式(即不显示),其他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full模式(每个特征有一个分开的线条,最多达300)。在考虑这些路径内究竟存在那些资料之前,对这些路径的内容和表现做一个简要的讨论是必要的,许多这些讨论是由外界提供给UCSC的。下面是对基因预测方法的更进一步讨论,这些信息也可以在其他地方找到。 对于Known Genes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码外显子,以短的垂直线或块状表示5′端和3′端非翻译区。 起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。 Known Genes来自LocusLink内的mRNA参照序列,已经利用BLAT程序将这些序列与基因组序列进行比对排列。 Acembly Gene Predictions With Alt-splicing路径是利用Acembly程序将人类mRNA 和EST序列数据与人类基因组序列进行比对排列而来的。Acembly程序试图找到mRNA与基因组序列的最好的比对排列以及判断选择性剪接模型。假如有多于1个的基因模型具有统计学意义,则它们都全部显示出来。有关Acembly的更多信息可以在NCBI的网站找到(https://www.doczj.com/doc/134706901.html,/IEB/Research/Acembly/)。 Ensembl Gene Predictions路径由Ensembl提供。Ensembl基因通过许多方法来预测,包括与已知mRNA和蛋白质进行同源性比较,ab initio基因预测使用GENSCAN和基因预测HMMs。 https://www.doczj.com/doc/134706901.html,/ensembl/ Fgenesh++ Gene Predictions路径通过寻找基因的结构特征来预测基因内部的外显子,例如剪接位点的给位和受位的结构特征,利用一

如何找基因全序列

利用Pubmed Map viewer查找基因序列、mRNA 序列、启动子(Promoter) 遗传分子统计2010-03-24 16:11:24 阅读759 评论0字号:大中小 下面以大鼠(rattus norvegicus)的结缔组织生长因子(C T G F)为例讲述一下具体的操作步骤 1.打开Map viewer 页面,网址https://www.doczj.com/doc/134706901.html,/mapview/index.html在search 的下拉菜单里选择物种,for 后面填写你的目的基因。操作完毕如图所示: 2.点击“GO”出现如下页面:

3.在步骤二图示的右下角有一个Quick Filter,下面是让你选择的几个复选框,在Gene 前面的小方框里打勾,然后点击Filter. 出现下图: 说明一下:1、染色体的红色区域即为你的目的基因所处位置。2、下面参考序列给出了三个,是不同的部门做出来的,经我验证,序列有微小的差异,但总体来说基本相同。尽

管你分别点击后,序列代码等有所差异,但碱基基本一致,不影响大家研究分析序列。现在普遍采用的是最上面的那个序列,这一条是世界范围的生物科学家用计算机合成的一个序列。我也推荐大家使用这个序列。 4.点击上述三条序列第一条序列(即reference)对应的"Genes seq",出现新的页面,页面下方为: 5.点击上图出现的“Download/View Sequence/Evidence ”,即下载查看序列等功能,结果如图所示: 先对上面这张图做点简要的说明,在Sequence Format(序列输出格式)后面是一个下拉式选择菜单,默认的为FASTA 格式,还有一个是GenBank 格式。我推荐大家选择GenBnak格式,因为这个格式提供了很多该基因的信息,而FASTA 格式只有基因序列。 6.在Sequence Format 后选择GenBank,然后点击下面的Display,目的基因的相关信息和序列就出现在眼前了。点击后如图所示(网页较大,只抓取一小部分以作示范):

如何查找基因序列

如何查找基因序列? ——在Genbank中寻找目的基因的实例 1. 根据文献 搞reasearch肯定要读文献的,如果你曾经在文献中看到过你感兴趣的基因,而且文中还提到了该基因在Genbank中的ID号,那就好办了,直接打开https://www.doczj.com/doc/134706901.html, ,在Search后的下拉框中选择Nucleotide,把Genbank ID号输入GO前面的文本框中,点“GO”,就可以找到他了。 举例说明,例如:在2003年JBC的文章(Conditional Knock-out of Integrin-linked Kinase Demonstrates an Essential Role in Protein Kinase B/Akt Activation)中出现了“calreticulin (GenBank accession number gi 16151096)”,那么把“16151096”输入GO 前面的文本框中,点“GO”,就可以找到该基因了(当然包括基因序列等相关信息)。 在出现了检索结果界面(下图)后,直接点击红箭头所指的AY047586就可以看到基因的相关信息了...(呵呵,是不是有点太......easy了) 这里需要指出一下,在显示基因的页面右侧有一个Link,点击后出现一个小菜单,里面是与该基因相关的链接,很有用的,值得一个一个地去看看,这里我就不多说了。 点击AY047586后出现的界面如下: 如果你只想获得序列(例如去设计PCR引物的时候),那就可以选择FASTA,这样就得到了FASTA格式的序列文件,没有其他数字和格式的干扰。

设计引物原则以及如何查找基因序列

引物设计原则: 1.找出这种细胞物种的PTN全长核苷酸序列 2.采用primer premier 5.0软件设计引物设计应注意如下要点: ● 1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致 其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应[2]。 ● 2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易 导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加[2]。 ● 3. 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错 配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A[3][4]。另外,引物二聚体或发夹结构也可能导致PCR 反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物[2]。 ● 4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的 GC含量不能相差太大[2][5]。 ● 5. 引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有 多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method) [6][7]。 ● 6. ΔG值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳 定性。应当选用3’端ΔG值较低(绝对值不超过9),而5’端和中间ΔG值相对较高的引物。引物的3’端的ΔG值过高,容易在错配位点形成双链结构并引发DNA聚合反应 [6]。 ●7. 引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带, 并且降低引物有效浓度而使PCR反应不能正常进行[8]。 ●8. 对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的 载体的相应序列而确定。如果文献上的这个基因跟你是同一物种来源的话是可以运用别人的引物 看看他的引物是基因组的还是cDNA的。cDNA的可以直接用。基因组的就再看看了好的引物对实验进程不会延缓 我觉得在涉及引物只要遵循以下的原则,一般是没什么问题!我是从来不借助什么专业软件来设计,按照自己的需要选取就是了,一般20bp,不浪费!到目前还没有失败过! 引物设计和选择目的DNA序列区域时可遵循下列原则: (1) 引物长度约为16-30bp,太短会降低退火温度影响引物与模板配对,从而使非特异性增高。太长则比较浪费,且难以合成。 (2) 引物中G+C含量通常为40%-60%,可按下式粗略估计引物的解链温度Tm=4(G+C)+2(A+T). (3) 四种碱基应随机分布,在3'端不存在连续3个G或C,因这样易导致错误引发。 (4) 引物3'端最好与目的序列阅读框架中密码子第一或第二位核苷酸对应, 以减少由于密码子摆动产生的不配对。 (5) 在引物内, 尤其在3'端应不存在二级结构。 (6) 两引物之间尤其在3'端不能互补, 以防出现引物二聚体, 减少产量。两引物间最好不存在4个连续碱基的同源性或互补性。 (7) 引物5'端对扩增特异性影响不大, 可在引物设计时加上限制酶位点、核糖体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等. 通常应在5'端限制酶位点外再加1-2个保护碱基。 (8) 引物不与模板结合位点以外的序列互补。所扩增产物本身无稳定的二级结构, 以免产生

在genbank中查找一基因的序列

如何在genbank中查找一基因的序列

————————————————————————————————作者:————————————————————————————————日期:

如何在genbank中查找一基因的序列 1、在GeneBank 中查找基因序列只要输入accession号就可以了,下面网址就是一个基因的全部序列信息的例子,https://www.doczj.com/doc/134706901.html,/Sitemap/samplerecord.html,在记录的末尾有各种记录的详细说明,如果你没有accession号,可以把你手头的编号用source等信息源转换成accession号,中文教程太古老了,如果你是初学者一定要养成看英文文献的习惯,要是特别想看中文翻译的话,书店里随便一本生物信息学书里都会介绍数据库的,不过有些翻译过来的东西真的很别扭,希望对你有帮助。 2、关于在GeneBank中查找序列我有几点体会: 最直接、最简单的方法是手头有基因的accession号; 如果没有就需要明确两个重要的内容,即基因名称及物种信息(如果有最好是拉丁全名),基因名称尽可能详细,避免搜出一些不相关的信息; 搜索的时候建议先用NCBI的Gene数据库搜索,这样得到的accession号是属于NCBI工作人员重新整理过的Refseq的序列,这样会比较可靠;当然这个要看你的分析目的,如果你是要对该序列进行下游的分子生物学操作or分析,选这种序列我觉得会比较好,如果是要进行多序列的分析or其他目的需要全面分析该序列的,可能需要其他序列做补充,但是我觉得序列越多问题越说不清楚,因为毕竟不是自己的序列,如果Gene数据库里没有收录,那就只有在Nucleotide数据库里找了,但是还是建议采用Refseq的序列,Refseq序列特征如下: Accession prefix Molecule type Comment AC_ Genomic Complete genomic molecule, alternate assembly NC_ Genomic Complete genomic molecule, reference assembly NG_ Genomic Incomplete genomic region NT_ Genomic Contig or scaffold, clone-based or WGSa NW_ Genomic Contig or scaffold, primarily WGSa NS_ Genomic Environmental sequence NZ_b Genomic Unfinished WGS NM_ mRNA NR_ RNA XM_c mRNA Predicted model XR_c RNA Predicted model AP_ Protein Annotated on AC_ alternate assembly NP_ Protein YP_c Protein XP_c Protein Predicted model ZP_c Protein Predicted model, annotated on NZ_ genomic records a Whole Genome Shotgun sequence data. b An ordered collection of WGS for a genome. c Computed. 其他值得考虑的是,对于真核生物最好找注释为全长的mRNA序列,原核生物最好有起始密码子和终止密码子; 其他未尽事宜大家补充!

基因的mRNA序列的查找方法

mRNA1 Homo sapiens cytotoxic T-lymphocyte-associated protein 4 (CTLA4), transcript variant 1, mRNA NCBI Reference Sequence: NM_005214.4 FASTA Graphics Go to: LOCUS NM_005214 2033 bp mRNA linear PRI 01-APR-2012 DEFINITION Homo sapiens cytotoxic T-lymphocyte-associated protein 4 (CTLA4), transcript variant 1, mRNA. ACCESSION NM_005214 XM_001129541 XM_001129550 XM_001129561 VERSION NM_005214.4 GI:339276048 KEYWORDS . SOURCE Homo sapiens (human) ORGANISM Homo sapiens Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini; Catarrhini; Hominidae; Homo. REFERENCE 1 (bases 1 to 2033) AUTHORS Ryden,A., Bolmeson,C., Jonson,C.O., Cilio,C.M. and Faresjo,M. TITLE Low expression and secretion of circulating soluble CTLA-4 in peripheral blood mononuclear cells and sera from type 1 diabetic children JOURNAL Diabetes Metab. Res. Rev. 28 (1), 84-96 (2012) PUBMED 22218756 REMARK GeneRIF: Low protein concentrations of circulating soluble CTLA-4 and a positive correlation between soluble CTLA-4 mRNA and protein were seen in IDDM, in parallel with a negative correlation in healthy subjects REFERENCE 2 (bases 1 to 2033) AUTHORS Rabe,H., Lundell,A.C., Andersson,K., Adlerberth,I., Wold,A.E. and Rudin,A. TITLE Higher proportions of circulating FOXP3+ and CTLA-4+ regulatory T cells are associated with lower fractions of memory CD4+ T cells in infants JOURNAL J. Leukoc. Biol. 90 (6), 1133-1140 (2011) PUBMED 21934066 REMARK GeneRIF: FOXP3+ or CTLA-4+ regulatory T cells may modulate CD4+ T cell activation and homing receptor expression in children. REFERENCE 3 (bases 1 to 2033) AUTHORS Olive,D., le Thi,S., Xerri,L., Hirsch,I. and Nunes,J.A. TITLE [The role of co-inhibitory signals driven by CTLA-4 in immune system]

相关主题
文本预览
相关文档 最新文档