批量开发SSR标记软件MISA的介绍
- 格式:doc
- 大小:148.00 KB
- 文档页数:3
利用MISA结合primer3进行SSR引物设计(Python version)一、何为SSR?SSR(simple sequence repeats)即简单重复序列,也称为微卫星DNA (microsatellite DNA),在真核生物基因组中广泛存在,一般是以1-6bp组成较低程度的重复序列,主要以2-3个核苷酸为重复单位如(GA)n、(AC)n和(GAA)n等。
从进化角度看物种间重复序列的差异是自然选择的结果。
因此鉴定SSR在基因组分析中有重要意义。
微卫星在原核生物和真核生物基因组中随机分布,而且该标记呈共显性,符合孟德尔遗传模式,易于操作,具有高度重复性和可靠性,显示出较强的多态性等优点,使其在遗传连锁图谱构建、遗传多样性检测、基因定位及分子标记辅助选择等领域有重要应用。
SSR通常可以分为基因组SSR和EST-SSR两大类。
GenomicSSR是基于基因组序列开发的,开发起来费时费力,而且因为探针的缘故,种类比较局限;EST-SSR是指存在于表达的基因序列内的SSR,不包括存在于内含子及非表达的调控区等之中的SSR,通常三个碱基重复的占多数,与不引起基因翻译过程中移码现象的发生相一致,EST-SSR有更强的种属转移性。
不过一般EST-SSR的重复序列要短于基因组中的SSR,而且从EST中筛选的微卫星要比从基因组中筛选的微卫星多态性低。
二、何为MISA?MISA (MI cro SA tellite identification tool) 是一款鉴定简单重复序列的软件,用perl语言写成,输入文件为FASTA格式。
下载软件:解压缩后,有两个文件:misa.pl,misa.ini。
misa.pl为主程序文件,misa.ini为配置文件。
将misa.pl所在文件夹添加至系统环境变量中:misa.ini文件指定了misa的参数,使用时必须放在当前文件夹下,其内容为:同时需要下载primer3输入文件更改脚本(p3_in.pl)与primer3结果文件更改脚本(p3_out.pl):三、对番茄1号染色体进行SSR引物设计1. Using misa.pl to find out all MIcroSAtellite sites in the input fasta file2. Extract the flank sequence of microsatellite sites with 150 bp plus throughbedtools getfasta3. Find out the microsatellite sites using the newly fasta file generated bybedtools4. Creates the Primer3 input file through the revised p3_in.pl5. Design SSR primers by Primer36. Parses the Primer3 output file through the revised p3_out.pl四、用python重新对p3_in.pl与p3_out.pl进行改写perl语言的符号实在有些非人性,我将这两个文件更改为python版本:primer3_in.py语法:primer3_out.py 语法:。
Botanical Research 植物学研究, 2017, 6(3), 86-95Published Online May 2017 in Hans. /journal/br https:///10.12677/br.2017.63013文章引用: 杨帅, 李慧, 侯欣, 张丽. 大规模开发及特性分析十字花科SSR 分子标记及其数据库的构建[J]. 植物学研究,Large-Scale Development and Character Analysis of SSR Markers and Database Build in BrassicaceaeShuai Yang 1,2*, Hui Li 2, Xin Hou 1, Li Zhang 1*1College of Plant Protection, Shandong Agricultural University, Taian Shandong 2College of Life Sciences, Jinan University, Jinan ShandongReceived: May 4th , 2017; accepted: May 21st , 2017; published: May 24th, 2017AbstractBrassicaceae is an important family in the plant kingdom. The Simple Sequence Repeats (SSRs) play a vital role in the study of Brassicaceae. By using 13 known sequenced Brassicaceae species with bioinformatics and comparative genomics methods, a total of 1,786,619 SSR loci and 1,919,464 pair of primers have been developed. The results show that the SSRs are widely distributed in the Brassicaceae species’ genomes, 1 - 3 bases duplication have a high ratio among these genomes and gene sequences, AT/TA repeats units have a high numbers in all of the 2 base duplication. In addi-tion, 435,414 specific SSR primers could be used to analyze the correlation between the species of Brassicaceae. 11 pairs of universal primers’ developed shows that there exist some consistent base fragments and could be amplified across different species. In this study, we constructed the world’s first SSR molecular marker database platform (BSSRD, Brassicaceae Simple Sequence Re-peats Database /BSSRD ) which will play an important role in the con-struction of genetic map, gene mapping and genetic breeding of Brassicaceae.KeywordsBrassicaceae, SSR, Specific Primers, Universal Primers, Database大规模开发及特性分析十字花科SSR 分子标记及其数据库的构建杨 帅1,2*,李 慧2,侯 欣1,张 丽1*1山东农业大学植物保护学院,山东 泰安 2济南大学生命科学院,山东 济南*通讯作者。
园艺学报,2015,42 (2):341–349.Acta Horticulturae Sinicadoi:10.16420/j.issn.0513-353x.2014-0882;http://www. ahs. ac. cn 341刺梨转录组SSR信息分析及其分子标记开发鄢秀芹,鲁敏,安华明*(贵州大学农学院,贵州省果树工程技术研究中心,贵阳 550025)摘 要:利用MISA软件筛选刺梨(Rosa roxburghii Tratt)转录组测序获得的106 590条Unigene,共检测出21 711个SSR位点,分布于18 155条Unigene中,出现频率为20.37%,平均分布距离为1.68 kb。
优势重复基序为三核苷酸、四核苷酸和二核苷酸,分别占总SSR位点的26.87%、26.77%和24.93%。
AG/CT与AAG/CTT分别是二核苷酸与三核苷酸的优势重复基元,分别占总SSR重复类型的17.80%和11.55%。
以不同主导重复基元类型设计合成42对SSR引物,并以刺梨及其他蔷薇属种质的基因组DNA为模板对其有效性及通用性进行初步验证,筛选出具有清晰扩增产物的引物23对,并且均在同属材料中通用。
选取16份贵州刺梨资源对筛选出的引物进行多态性检测,获得12对具有多态性的引物。
以上结果表明,刺梨转录组测序产生的Unigene信息可作为开发SSR标记的有效来源,获得的大批量SSR标记可为刺梨及其近缘种的遗传多样性分析和遗传图谱构建提供更加丰富可靠的标记选择。
关键词:刺梨;SSR;转录组中图分类号:S 661.9 文献标志码:A 文章编号:0513-353X(2015)02-0341-09 Analysis on SSR Information in Transcriptome and Development of Molecular Markers in Rosa roxburghiiYAN Xiu-qin,LU Min,and AN Hua-ming*(College of Agriculture,Guizhou University,Guizhou Engineering Research Center for Fruit Crops,Guiyang 550025,China)Abstract:One hundred and six thousand five hundred and ninety unigenes from fruit transcriptome of Rosa roxburghii Tratt were screened using MISA software. A total of 21 711 SSRs that occurred in 18 155 unigenes were identified,and the frequency of these SSRs was 20.37% and mean distance was 1.68 kb in the unigenes. Trinucleotide,tetranucleotide and dinucleotide were major types,accounting for 26.87%,26.77% and 24.93%,respectively. AG/CT,AAG/CTT were respectively most frequent motifs in dinucleotide and trinucleotide repeats,accounting for 17.80% and 11.55%,respectively. Using the Primer 3.0,42 primers were designed and synthesized based on different dominant motifs types,and verified with R. roxburghii germplasms for validity and Rosa germplasms for transferability. The results showed that the products of 23 primers are clear and effective,23 pairs could be transferable to Rosa germplasms and 12 pairs were polymorphic among the 16 R. roxburghii germplasms. The results indicated that the unigenes generated from transcriptome sequencing in R. roxburghii can be used as an effective source to收稿日期:2014–11–13;修回日期:2015–01–22基金项目:国家自然科学基金项目(31360475);贵州省重大科技专项项目(黔科重大专项字20136006-1);贵州大学研究生创新基金项目(研农2014004)* 通信作者Author for correspondence(E-mail:anhuaming@)Yan Xiu-qin,Lu Min,An Hua-ming.Analysis on SSR information in transcriptome and development of molecular markers in Rosa roxburghii. 342Acta Horticulturae Sinica,2015,42 (2):341–349. development SSR markers. The large quantities of SSR markers will provide more reliable markers for map structure,analysis of genetic polymorphism for R. roxburghii and its closely related species.Key words:Rosa roxburghii;SSR;transcriptome简单序列重复(Simple sequence repeat,SSR)是一类由1 ~ 6个碱基组成的基元串联重复而成的DNA序列(Tautz,1989)。
EST-SSR 引物开发步骤1、首先计算机安装PC 版perl 程序,然后从GenBank/dbEST (http://www.ncbi.nlm.nih/entrez)中以FASTA 格式下载该种中所有的EST 序列,共29830 条。
2、利用Blastclust(v.2.2.10;http://www. /web/newsltr/spring04/blastlab.htm)软件,对这些EST 序列进行冗余性查找,利用CD_HIT(http:///cd-hit/)快速批量去冗余序列。
3、利用est_timmer(http://pgrc.ipk-gatersleben.de/misa/)去除EST 序列中过短的序列(<100bp)和过长的序列(>700bp)以及mRNA 的“帽子”和“尾巴”(A或T)。
4、利用misa.pl(http://pgrc.ipk-gatersleben.de/misa/)识别和定位SSR,其中配置文件misa.ini 用来设置识别SSR 标记的标准。
5、利用primer3 模块批量设计SSR 引物,引物设计的主要参数是,引物长度20~26bp;退火温度Tm 值48℃~65℃;(G+C)含量30%~70%;PCR 扩增产物长度大于150bp。
6、利用MacV ector7.0 软件对所设计的引物进行验证,引物由上海生工生物技术有限公司合成。
Genome-SSR 的引物开发步骤1、通过Genbank数据库,检索相近种的全基因组序列。
保存成FAST格式。
2、利用SSRHunter1.3搜索基因组序列中的简单重复序列信息位点。
3、选取信息位点核苷酸重复基序为2~6个的序列为靶标序列,利用软件Primer Premier 5.0设计SSR引物,引物设计的主要参数是,引物长度20~26bp;退火温度Tm 值48℃~65℃;(G+C)含量30%~70%;PCR 扩增产物长度大于150bp。
利用EST-SSR标记鉴定大白菜杂交种纯度的研究张庶;周新成;李利斌;刘立锋;李化银;宋梅芳;高建伟;高玲【摘要】利用EST-SSR分子标记技术,选用自主开发的3对EST-SSR引物,对13个大白菜品种的总DNA进行了PCR扩增.结果表明:EST-SSR标记可以体现品种内的一致性、亲本问以及品种间的多态性,具有共显性、稳定性和可重复性的特点;EST-SSR标记可以快速、准确地鉴别大白菜品种的真实性和杂交种纯度,为大白菜种子质量的高效检测提供科学依据.【期刊名称】《天津农业科学》【年(卷),期】2010(016)006【总页数】4页(P1-4)【关键词】大白菜;种子纯度;鉴定;EST-SSR标记【作者】张庶;周新成;李利斌;刘立锋;李化银;宋梅芳;高建伟;高玲【作者单位】山东省农业科学院蔬菜研究所山东省设施蔬菜生物学重点实验室,国家蔬菜改良中心山东分中心,山东,济南,250100;青岛农业大学生命科学学院,山东,青岛,266109;山东省农业科学院蔬菜研究所山东省设施蔬菜生物学重点实验室,国家蔬菜改良中心山东分中心,山东,济南,250100;山东省农业科学院蔬菜研究所山东省设施蔬菜生物学重点实验室,国家蔬菜改良中心山东分中心,山东,济南,250100;山东省农业科学院蔬菜研究所山东省设施蔬菜生物学重点实验室,国家蔬菜改良中心山东分中心,山东,济南,250100;山东省农业科学院蔬菜研究所山东省设施蔬菜生物学重点实验室,国家蔬菜改良中心山东分中心,山东,济南,250100;山东省农业科学院蔬菜研究所山东省设施蔬菜生物学重点实验室,国家蔬菜改良中心山东分中心,山东,济南,250100;山东省农业科学院蔬菜研究所山东省设施蔬菜生物学重点实验室,国家蔬菜改良中心山东分中心,山东,济南,250100;青岛农业大学生命科学学院,山东,青岛,266109;青岛农业大学生命科学学院,山东,青岛,266109【正文语种】中文【中图分类】S634.1大白菜(Brassica rapa L.ssp.pekinensis,AA 染色体组,2n=20)为十字花科芸薹属植物,原产于中国,是中国和东亚国家的主要蔬菜之一。
生物技术进展 2023 年 第 13 卷 第 6 期 821 ~ 826Current Biotechnology ISSN 2095‑2341进展评述Reviews线粒体SSR 分子标记在植物中的应用进展张兰兰1 , 李才华1 , 方雨竹1 , 宋岩1 , 康婉琳1 , 李志宇1 , 张晓1 * , 张锐2 *1.长春理工大学生命科学技术学院,长春 130022;2.中国农业科学院生物技术研究所,北京 100081摘 要:线粒体简单重复序列(mitochondrion simple sequence repeat ,mtSSR)是近年发展起来的一种新型的分子标记技术,兼具SSR 标记多态性高、分布广泛、共显性和植物线粒体基因组母系遗传、结构进化速率快等优点,在群体遗传结构、基因流动进化、物种演化、胞质遗传特性、种群分类等方面具有重要应用。
根据国内外已有的研究成果,综述了mtSSR 植物群落分析、胞质类型鉴定等方面的研究进展,并对植物mtSSR 数据库进行了总结,以期为利用mtSSR 技术进行植物研究提供参考。
关键词:植物;线粒体SSR ;分子标记DOI :10.19586/j.20952341.2023.0074 中图分类号:Q943 文献标志码:AProgress on the Application of Mitochondrial SSR Molecular Markers in PlantsZHANG Lanlan 1 , LI Caihua 1 , FANG Yuzhu 1 , SONG Yan 1 , KANG Wanlin 1 , LI Zhiyu 1 ,ZHANG Xiao 1 * , ZHANG Rui 2 *1.School of Life Science and Technology , Changchun University of Science and Technology , Changchun 130022, China ;2.Biotechnology Research Institute , Chinese Academy of Agricultural Sciences , Beijing 100081, ChinaAbstract :Mitochondrial simple sequence repeat (mtSSR ) is a new molecular marker technology developed in recent years. It not only has the advantages of high polymorphism , wide distribution and codominance of SSR markers , but also has the advantages of maternal inheritance and rapid structural evolution of plant mitochondrial genome. It has important applications in population genetic structure , gene flow evolution , species evolution , cytoplasmic genetic characteristics , population classification and other aspects. Based on existing research results both domestically and internationally ,the article reviewed the research progress of mtSSR molecular markers on plant population classification and cytoplasm identification , and summarized the plant mtSSR databases ,which aimed to provid reference for using mtSSR technology in plant research.Key words :plant ; mitochondrial SSR ; molecular marker简单序列重复(simple sequence repeats ,SSR ),又称微卫星DNA (microsatellite DNA )或短串联重复序列(short tandem repeats ,STR ),是由1~6 bp 短核苷酸为基本重复单位首尾相连而成。
批量开发SSR标记软件:MISA的介绍
Posted on 12 五月2009 by 柳城,阅读605 简洁版
MISA工具提供批量识别和定位简单重复序列(SSR),EST序列或是基因组序列都可以。
另外,还提供一个与批量设计引物Primer3的接口工具,通过这个工具,可以把MISA识别出来的SSR,转为Primer3需要的格式,从而方便批量设计引物。
网址:http://pgrc.ipk-gatersleben.de/misa/
注:要运行MISA,首先要确保已经装了Perl
下面分别介绍一下几个工具(.pl是perl文件的后缀名):
1,misa.pl
用法:perl misa.pl <FastaFile> (注:<>要去掉。
下同)
FastaFile是放序列的一个文件名,全路径,注意不要有中文名或空格。
Fasta格式。
另外配套一起的还有一个文件misa.ini,这是一个配置文件,设置识别SSR标记的标准。
注意路径。
路径错了就会提示错误,找不到该文件。
2,est_trimmer.pl
这是对EST序列而言的,可以去除EST序列中短的序列和两端不明确的碱基。
用法(例子):perl est_trimmer.pl ESTs -amb=2,50 -tr5=T,5,50 -tr3=A,5,50 -cut=100,700
3,Primer3 的接口工具
p3_in.pl - 创建Primer3的输入文件。
用法:perl p3_in.pl <FASTAfile.misa>
p3_out.pl - 解析Primer3设计引物后的输出文件。
用法:p3_out.pl <FASTAfile.p3out> <FASTAfile.misa>
注:FASTAfile.misa文件是MISA的输出文件
FASTAfile.p3out是primer3的输出文件
大概就是这些,很不错的软件。
具体问题具体分析,一些细节问题这里就不讲了。
需要的话就琢磨琢磨。
本文详细出处参考:/457/
本文详细出处参考:/457/
本文详细出处参考:/457/
F:\>perl p3_in.pl CMS-CWhole.FASTA.misa。