《生物信息学》大作业参考模板-2016
- 格式:pdf
- 大小:1000.22 KB
- 文档页数:15
生物信息学课堂操作练习一、生物信息学科的发展和研究内容通过下列internet上的自教课程,初步了解不同的数据库和分析工具/2can/Education二、生物数据库1. 熟悉各种数据库。
2. 重点了解GenBank和SWISS-PROT所包含的各种功能和适用范围。
三、关键词或词组为基础的数据库检索1. 熟练掌握Entrez检索体系。
2. 查找与水稻抗病基因Xa21有关的资料(1) 由多少碱基构成?编码多少个氨基酸?(2) exon和intron的位置?(3) 是否有3-D structure数据?1) 由多少碱基构成?编码多少个氨基酸?4623b.p., 1025A.a.;2) exon和intron的位置?Exon: 24~2700,3543~3943 intron: remaining;3) 是否有3-D structure数据?没有.3. 查找C. elegans基因组的资料。
(1) chromosome I的测序是否已完成?(2) 已知的chromosome I的序列有多少碱基?序列发表在哪份杂志上?期号和页码?1) chromosome I的测序是否已完成?完成.2) 已知的chromosome I的序列有多少碱基? 序列发表在哪份杂志上? 期号和页码? 15.0724Mb.p.(15072421b.p.), Science 1999 Jan 1;283(5398):35.4. 查看人类基因组第1染色体上基因的分布。
/mapview/maps.cgi?ORG=hum&MAPS=ideogr,est,loc&LINKS= ON&VERBOSE=ON&CHR=15. 查看Arabidopsis的系谱树,以及Arabidopsis第1染色体上的序列。
比较Arabidopsis基因组的资料提供形式与人类基因组有什么不同(/Taxonomy/Browser/wwwtax.cgi?id=3701,/mapview/maps.cgi?taxid=3702&chr=1)貌似没什么区别……比较Arabidopsis基因组的资料提供形式与人类基因组有什么不同。
生物信息学(五篇范例)第一篇:生物信息学生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。
它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。
其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。
具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。
基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。
从生物信息学研究的具体内容上看,生物信息学应包括这3个主要部分:(1)新算法和统计学方法研究;(2)各类数据的分析和解释;(3)研制有效利用和管理数据新工具。
生物信息学是一门利用计算机技术研究生物系统之规律的学科。
目前的生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。
生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。
1990年代以来,伴随着各种基因组测序计划的展开和分子结构测定技术的突破和Internet的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。
对生物信息学工作者提出了严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?生物信息学的另一个挑战是从蛋白质的氨基酸序列预测蛋白质结构。
这个难题已困扰理论生物学家达半个多世纪,如今找到问题答案要求正变得日益迫切。
诺贝尔奖获得者W.Gilbert在1991年曾经指出:“传统生物学解决问题的方式是实验的。
生物信息学实验作业一1、了解NCBI、DDBJ、EMBL上网的方法自学各网站相关介绍。
答:(1)、NCBI: (National Center of Biotechnology Information,简称NCBI)美国国立生物技术信息中心。
其主页为:。
NCBI 是在NIH的国立医学图书馆(NLM)的一个分支。
NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。
NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。
NCBI有一个多学科的研究小组包括计算机科学家,分子生物学家,数学家,生物化学家,实验物理学家,和结构生物学家,集中于计算分子生物学的基本的和应用的研究。
他们一起用数学和计算的方法研究在分子水平上的基本的生物医学问题。
这些问题包括基因的组织,序列的分析,和结构的预测。
在1992年10月,NCBI承担起对GenBank DNA序列数据库的责任。
NCBI 受过分子生物学高级训练的工作人员通过来自各个实验室递交的序列和同国际核酸序列数据库(EMBL和DDBJ)交换数据建立起数据库。
同美国专利和商标局的安排使得专利的序列信息也被整合。
BLAST是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。
BLAST能够在小于15秒的时间内对整个DNA数据库执行序列搜索。
NCBI提供的附加的软件工具有:开放阅读框寻觅器(ORF Finder),电子PCR,和序列提交工具,Sequin和BankIt。
所有的NCBI数据库和软件工具可以从WWW 或FTP来获得。
NCBI还有E-mail服务器,提供用文本搜索或序列相似搜索访问数据库一种可选方法。
主要任务:(1)建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统(2)实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究(3)加速生物技术研究者和医药治疗人员对数据库和软件的使用。
生物信息学作业1. Align the leghemoglobin protein from soy bean and myoglobin from human with global and local alignment software (ex. needle and water) respectively and interpret the results.ANSWER:(1)Use Needle to Align the two sequence:Aligned_sequences: 2# 1: CAA38024.1# 2: NP_001157488.1# Matrix: EBLOSUM62# Gap_penalty: 10.0# Extend_penalty: 0.5# Length: 203# Identity: 43/203 (21.2%)# Similarity: 58/203 (28.6%)# Gaps: 90/203 (44.3%)# Score: 30.0(2)Use Water to Align the two sequence:Aligned_sequences: 2# 1: CAA38024.1# 2: NP_001157488.1# Matrix: EBLOSUM62# Gap_penalty: 14# Extend_penalty: 4# Length: 32# Identity: 11/32 (34.4%)# Similarity: 15/32 (46.9%)# Gaps: 0/32 ( 0.0%)# Score: 35两种软件虽然使用同一罚分标准但得分不同。
因为Needle程序实现标准pairwise全局比对,而Water则是局部比对。
全局比对因为是比对全长序列,所以空位罚分多,得分较局部比对低。
2. Evaluate the significance of the local protein alignment score of question 1 with PRSS and interpret the result.参数如下:Statistics: (shuffled [200]) MLE statistics: Lambda= 0.1886; K=0.0575statistics sampled from 1 (1) to 200 sequencesParameters: VT160 matrix (16:-7), open/ext: -12/-2在两个不同网站选不同矩阵均未得到E值,原因可能是两条序列的同源性很低。
生物信息学实验作业试验一一.找到编码拟南芥(arabidopsis)phyA(光敏色素A)基因的核酸序列编号, 并记录查找过程。
GI:224576211步骤1.进入NCBI主页2.搜索arabidopsis phyA3.Arabidopsis thaliana phytochrome A (PHYA) gene, partial cds4.VERSION:GI:224576211二.以phyA为检索词,在pubmed数据库中分别检索在题目和关键词字段中含有该检索词的文献,记录检索出的条目数目。
Results: 614三.仔细阅读所查询核酸序列在NCBI和EMBL数据库中格式的解释,理解各字段的含义,并比较NCBI 与EMBL中序列格式的异同。
实验二一.分析你感兴趣核酸序列的分子质量、碱基组成。
Composition 35 A; 25 C; 35 G; 15 T; 0 OTHERPercentage: 32% A; 23% C; 32% G; 14% T; 0%OTHERMolecular Weight (kDa): ssDNA: 34.26 dsDNA: 67.8二.列出你所分析核酸序列(或部分序列)的互补序列、反向序列、反向互补序列、DNA双链序列和RNA 序列。
R S1 ACTACTCGAG AAGCAGCGAC AGAGGCGTTA GCCCGCTCAG CAGACTGGCA GTTCTCTACC61 GACAAAAAAG AGGTAGGAGG CACAGTAATG ATACAGGCGT AGCAGGAGGGC S1 CCCTCCTGCT ACGCCTGTAT CATTACTGTG CCTCCTACCT CTTTTTTGTC GGTAGAGAAC61 TGCCAGTCTG CTGAGCGGGC TAACGCCTCT GTCGCTGCTT CTCGAGTAGTR C S1 TGATGAGCTC TTCGTCGCTG TCTCCGCAAT CGGGCGAGTC GTCTGACCGT CAAGAGATGG61 CTGTTTTTTC TCCATCCTCC GTGTCATTAC TATGTCCGCA TCGTCCTCCCD DNA S1 GGGAGGACGA TGCGGACATA GTAATGACAC GGAGGATGGA GAAAAAACAG CCATCTCTTGCCCTCCTGCT ACGCCTGTAT CATTACTGTG CCTCCTACCT CTTTTTTGTC GGTAGAGAAC61 ACGGTCAGAC GACTCGCCCG ATTGCGGAGA CAGCGACGAA GAGCTCATCATGCCAGTCTG CTGAGCGGGC TAACGCCTCT GTCGCTGCTT CTCGAGTAGTRNA S1 GGGAGGACGA UGCGGACAUA GUAAUGACAC GGAGGAUGGA GAAAAAACAG CCAUCUCUUG61 ACGGUCAGAC GACUCGCCCG AUUGCGGAGA CAGCGACGAA GAGCUCAUCA三.列出核酸序列的限制性酶切位点分析结果(酶及识别位点)。
结论一:这是什么基因1.该基因为人的CD226 抗原分子(CD226),染色体定位18号染色体67624232 -67530192基因标识符:NM_006566.22.功能:细胞粘附功能,整合素结合,蛋白结合,蛋白激酶结合;参与细胞粘合,细胞识别,细胞因子产生,正向调控Fc受体介导的刺激性信号通路,正向调控免疫球蛋白介导的免疫反应,正向调控肥大细胞的活化正向调控NK细胞介导的细胞毒性,正向调控NK细胞介导的针对肿瘤细胞靶标的细胞毒活性,调节免疫反应,信号转导等途径。
结论二:编码的蛋白质序列是怎样的蛋白标识符:"NP_006557.2" 336 aa蛋白序列为:MDYPTLLLAL LHVYRALCEE VLWHTSVPFA ENMSLECVYP SMGILTQVEWFKIGTQQDSI AIFSPTHGMV IRKPYAERVY FLNSTMASNN MTLFFRNASE DDVGYYSCSL YTYPQGTWQK VIQVVQSDSF EAAVPSNSHI VSEPGKNVTL TCQPQMTWPV QAVRWEKIQP RQIDLLTYCN LVHGRNFTSK FPRQIVSNCS HGRWSVIVIP DVTVSDSGLY RCYLQASAGE NETFVMRLTV AEGKTDNQYT LFVAGGTVLL LLFVISITTI IVIFLNRRRR RERRDLFTES WDTQKAPNNY RSPISTSQPT NQSMDDTRED IYVNYPTFSR RPKTRV结论三:有没有功能保守的结构序列?该蛋白有Ig的保守结构序列结论四;:它的功能是?功能:细胞黏附相关受体,淋巴细胞信号转导,CTL和NK介导的细胞毒性和淋巴因子分泌亚单元结构:与PVR和PVRL2相互作用亚细胞定位:细胞膜,Ⅰ类信号传播膜蛋白组织特异性:外周血T细胞表达序列:包含2个Ig-like C2型(免疫球蛋白样)结构域结论五:在真核生物中保守吗?在酵母中不存在其同源物,在一些灵长类动物存在一些同源性较高的序列,在其他的哺乳动物如:褐家鼠,野猪等中也存在一些同源性较高的序列。
生物信息学作业生物信息学试题1、构建分子系统树的主要方法有哪些?并简要说明构建分子进化树的一般步骤。
(20分)答:(1)构建进化树的方法包括两种:一类是序列类似性比较,主要是基于氨基酸相对突变率矩阵(常用PAM250)计算不同序列差异性积分作为它们的差异性量度(序列进化树);另一类在难以通过序列比较构建序列进化树的情况下,通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立结构进化树(2)序列比对——选取所需序列——软件绘制具体如下:a测序获取序列或者在NCBI上搜索所需的目的序列b在NCBI上做blast:比对相似度较高的基因,并以fast格式下载,整合在*txt文档中。
c比对序列,比对序列转化成*meg格式d打开保存的*meg格式文件,构建系统进化树2、氨基酸序列打分矩阵PAM和BLOSUM中序号有什么意义?它们各自的规律是什么?(10分)(1)PAM矩阵:基于进化的点突变模型,如果两种氨基酸替换频繁,说明自然界接受这种替换,那么这对氨基酸替换得分就高。
一个PAM就是一个进化的变异单位, 即1%的氨基酸改变。
BLOSUM矩阵:首先寻找氨基酸模式,即有意义的一段氨基酸片断,分别比较相同的氨基酸模式之间氨基酸的保守性(某种氨基酸对另一种氨基酸的取代数据),然后,以所有60%保守性的氨基酸模式之间的比较数据为根据,产生BLOSUM60;以所有80%保守性的氨基酸模式之间的比较数据为根据,产生BLOSUM80。
(2)PAM用于家族内成员相比,然后把所有家族中对某种氨基酸的比较结果加和在一起,产生“取代”数据(PAM-1 );PAM-1自乘n次,得PAM-n。
PAM-n中,n 越小,表示氨基酸变异的可能性越小;相似的序列之间比较应该选用n值小的矩阵,不太相似的序列之间比较应该选用n 值大的矩阵。
PAM-250用于约 20%相同序列之间的比较。
BLOSUM-n中,n越小,表示氨基酸相似的可能性越小;相似的序列之间比较应该选用n 值大的矩阵,不太相似的序列之间比较应该选用n值小的矩阵。
生物信息学实验作业试验一一.找到编码拟南芥(arabidopsis)phyA(光敏色素A)基因的核酸序列编号, 并记录查找过程。
GI:224576211步骤1.进入NCBI主页2.搜索arabidopsis phyA3.Arabidopsis thaliana phytochrome A (PHYA) gene, partial cds4.VERSION:GI:224576211二.以phyA为检索词,在pubmed数据库中分别检索在题目和关键词字段中含有该检索词的文献,记录检索出的条目数目。
Results: 614三.仔细阅读所查询核酸序列在NCBI和EMBL数据库中格式的解释,理解各字段的含义,并比较NCBI 与EMBL中序列格式的异同。
实验二一.分析你感兴趣核酸序列的分子质量、碱基组成。
Composition 35 A; 25 C; 35 G; 15 T; 0 OTHERPercentage: 32% A; 23% C; 32% G; 14% T; 0%OTHERMolecular Weight (kDa): ssDNA: 34.26 dsDNA: 67.8二.列出你所分析核酸序列(或部分序列)的互补序列、反向序列、反向互补序列、DNA双链序列和RNA 序列。
R S1 ACTACTCGAG AAGCAGCGAC AGAGGCGTTA GCCCGCTCAG CAGACTGGCA GTTCTCTACC61 GACAAAAAAG AGGTAGGAGG CACAGTAATG ATACAGGCGT AGCAGGAGGGC S1 CCCTCCTGCT ACGCCTGTAT CATTACTGTG CCTCCTACCT CTTTTTTGTC GGTAGAGAAC61 TGCCAGTCTG CTGAGCGGGC TAACGCCTCT GTCGCTGCTT CTCGAGTAGTR C S1 TGATGAGCTC TTCGTCGCTG TCTCCGCAAT CGGGCGAGTC GTCTGACCGT CAAGAGATGG61 CTGTTTTTTC TCCATCCTCC GTGTCATTAC TATGTCCGCA TCGTCCTCCCD DNA S1 GGGAGGACGA TGCGGACATA GTAATGACAC GGAGGATGGA GAAAAAACAG CCATCTCTTGCCCTCCTGCT ACGCCTGTAT CATTACTGTG CCTCCTACCT CTTTTTTGTC GGTAGAGAAC61 ACGGTCAGAC GACTCGCCCG ATTGCGGAGA CAGCGACGAA GAGCTCATCATGCCAGTCTG CTGAGCGGGC TAACGCCTCT GTCGCTGCTT CTCGAGTAGTRNA S1 GGGAGGACGA UGCGGACAUA GUAAUGACAC GGAGGAUGGA GAAAAAACAG CCAUCUCUUG61 ACGGUCAGAC GACUCGCCCG AUUGCGGAGA CAGCGACGAA GAGCUCAUCA三.列出核酸序列的限制性酶切位点分析结果(酶及识别位点)。
生物信息学分析范文生物信息学的应用非常广泛,主要包括基因组学、蛋白质组学和转录组学等方面。
在基因组学中,生物信息学可以用于预测基因的结构和功能,鉴定基因的变异和突变,以及研究基因的演化和分布。
在蛋白质组学中,生物信息学可以用于预测蛋白质的结构和功能,鉴定蛋白质的修饰和相互作用,以及研究蛋白质的表达和调控。
在转录组学中,生物信息学可以用于分析基因的转录和表达,鉴定基因的调控元件和信号通路,以及研究基因的功能和调控网络。
生物信息学的方法主要包括序列比对、结构预测和功能注释等方面。
序列比对是生物信息学中最常用的方法之一,它可以用于比较不同物种或样本的基因组、蛋白质或RNA序列,以及分析它们的相似性和差异性。
结构预测是生物信息学中另一个重要的方法,它可以用于预测蛋白质的三维结构,以及分析蛋白质的稳定性和功能。
功能注释是生物信息学中最有挑战性的方法之一,它可以用于预测基因或蛋白质的功能、鉴定代谢途径和信号通路,以及研究基因或蛋白质的功能调控网络。
生物信息学在基因组学中的应用非常广泛。
通过分析基因组的序列和结构,生物信息学可以用于预测基因的结构和功能,鉴定基因的变异和突变,以及研究基因的演化和分布。
例如,通过比对不同物种或样本的基因组序列,可以鉴定基因的保守区域和编码区域,以及分析它们的相似性和差异性。
同时,生物信息学还可以预测基因的启动子、转录因子结合位点和DNA甲基化位点,以及研究基因的调控网络和表达模式。
生物信息学在蛋白质组学中的应用也非常重要。
通过分析蛋白质的序列和结构,生物信息学可以用于预测蛋白质的结构和功能,鉴定蛋白质的修饰和相互作用,以及研究蛋白质的表达和调控。
例如,通过比对不同物种或样本的蛋白质序列,可以鉴定蛋白质的保守区域和功能域,以及分析它们的相似性和差异性。
同时,生物信息学还可以预测蛋白质的二级结构、三级结构和配体结合位点,以及研究蛋白质的功能调控网络和信号通路。
生物信息学在转录组学中的应用也越来越重要。
《生物信息学》作业题目(郝柏林)1、试估计地球上出现智人以来,人们所讲过的“字”的总和不超过10的多少次方?2、试计算10µg大肠杆菌基因组DNA样品中包含多少个DNA大分子?已知1个E. coli. 基因组DNA=4.64×106bp,1bp650 dalton(分子量);1molH 原子=N A个H原子=1g,N A =6×1023。
3、正态分布下,1-4个标准差()范围所覆盖的(即±1~4)概率分别为多少?4、假设赌场的骰子中99%是好的,即P(D fair)=99/100,1%是做过手脚的,即P(D load)=1/100,如果使用的是做过手脚的骰子,则出6点的概率为1/2。
问:(1)在投骰子时连续出了3个6点,你有多大把握说所用的骰子是做过手脚的?(2)如果你要用99%的把握说骰子是做过手脚的,则在投骰子时需要连续出多少个6点?5、某一序列为gtgcaatcagactgataattgccacgatcag(L=31),问该序列是否为CpG island?已知下列转移矩阵:a+ c+ g+ t+P (+)a+ 0.180 0.274 0.426 0.120c+ 0.171 0.367 0.274 0.188g+ 0.161 0.339 0.375 0.125t+ 0.079 0.355 0.384 0.1826、 从地点A 到地点B 有多条路线,每条路线都要收取(或得到)一定的过路费(如图):试问从地点A 到地点B 的哪条路线得钱最多?7、 请分别用动态规划法(dynamic programming )Needleman-Wunsch 和Smith-Waterman 算法对下列两条蛋白质序列进行联配,并写出联配方案: P1=HEAGAWGHEE, P2=PAWHEAE其中替换矩阵选用BLOSUM50(女生)和BLOSUM62(男生)(见下表,其中括号中的数字属于BLOSUM62),空位(gap)罚分设定为8(女生)和9(男生)。
生物信息学基础大作业报告报告主题系统发育树的构建方法和研究进展班级计科0901 姓名王海颖总学号 0304090111目录目录 ........................................................................................................................................... - 2 - 一引言.. (3)二系统发育树的构建方法 (3)2.1概括介绍 (3)2.2具体介绍 (4)2.2.1 基于距离的方法 (4)2.2.2 最大简约法 (4)2.2.3 最大似然法 (5)2.2.4 贝叶斯树估计方法 (7)三系统发育树的改进算法 (7)3.1 遗传算法和模拟退火算法 (7)3.2古DNA序列构建生物系统发育树 (7)3.2 基于28S rDNA序列构建侧耳属系统发育树 (7)3.3 基于全蛋白质组的微生物构建系统发育树 (8)3.4 一种基于线粒体完全基因组的熵密度分布的脊椎动物系统发育树构建方法 (8)四评价方法的改进 (8)4.1遗传算法和模拟退火算法的改进 (8)4.2 用EM算法进行参数估计 (8)4.2 乙型肝炎病毒C基因区序列的系统发育树分析 (9)4.3 矿区的氧化亚铁硫杆菌新菌系的鉴定. (10)4.4 55株芽孢杆菌16S rRNA基因序列测定与系统发育学分析 (10)4.5酸马奶中乳杆菌Lb.casei.Zhang和ZLl2—1的16S rDNA基因序列及聚类分析11 五结束语 (11)参考文献 (11)一.引言:二十一世纪,生命科学和信息科学都处于科学技术的主导地位,二者的融合使得一个新的领域——生物信息学产生了。
生物信息学是在生命科学的研究中,以计算机科学知识为辅导工具对生物信息进行存储、检索和分析的科学。
它是当今生命科学和自然科学的重大前沿领域之一。
大作业题目及评分标准
题目:系统发育树构建方法的研究进展
要求:
1.查阅图书馆馆藏数据库CNKI,万方或者维普数据库,总结系统发育树
的构建方法;
2.分析他人在系统发育树构建方法的改进方面做出的贡献;
3.参考文献不少于15篇。
4.小四号,宋体,行距1.25倍,A4纸不少于5页。
5.提交时间2011年12月23日(16周周五)上午8~11:30,过期不候。
评分标准:
优:能够查阅大量的参考文献,完整的总结系统发育树的构建方法,并对他人在系统发育树构建方法改进方面的研究工作进行归纳总结,列出参考文献数不少于15篇,论述清楚,结构合理。
良:能够查阅大量的参考文献,并总结系统发育树的构建方法,能够归纳总结他人的研究工作,列出的参考文献数不少于15篇,论述较清楚,结构较合理。
中:能够较完整的总结系统发育树的构建方法,基本能够归纳他人的研究工作,列出的参考文献数少于15篇,论述基本清楚,结构基本合理。
及格:基本能够总结出系统发育树的构建方法,基本能够归纳他人的研究工作,列出的参考文献少于15篇,论述基本清楚,结构基本合理。
不及格:只能部分的总结系统发育树的构建方法,不能归纳他人的研究工作,论述不清楚,结构不合理。
研究生《医学生物信息学》作业班级:专业:姓名:一、实验目的:(1)掌握中文文献全文的检索和获得方法。
(2)掌握Pubmed数据库文献的检索和交大图书馆英文数据库全文的获得方法。
(3)掌握核酸序列搜索的方法。
(4)掌握核酸序列相似性分析的方法。
(5)掌握PCR引物设计软件的原理、使用及特点。
(6)掌握蛋白质序列搜索的方法。
(7)掌握蛋白质序列分析常用软件的使用方法。
二、研究背景:AIB1基因为近年来发现的p160类固醇受体转录共激活因子SRC-1家族成员,是新定义的一个原癌基因[1]。
该基因表达的蛋白在许多生物学过程中发挥重要作用,如细胞生长,增殖,分化,性成熟,女性生殖功能等[2]。
近年发现,该基因的表达异常与多种肿瘤的发生发展有关,以在乳腺癌中研究最多。
AIB1基因的高表达与乳腺癌的发生和发展有关[3]。
AIB1蛋白通过与雌激素受体相互作用,能强烈地增强雌激素受体的促进靶基因转录的效应,进而引起细胞增殖和肿瘤形成,此外,AIB1蛋白还在多条信号传导通路中发挥作用[4]。
AIB1基因(amplified in breast cancer1)又称为ACTR,TRAM1,RAC3,SRC3,NCoA3,P/CIP等。
本人选择其为研究对象。
三、实验方法、步骤及结果:1.在中国知网(CNKI)中查找中文文献:2.在PubMed中查找英文文献:登陆NCBI主页,网址:/guide/,选择gene数据库4. 使用NCBI网站中的BLAST工具进行序列比对登陆/,选择核酸序列比对nucleotide BLAST,界面显示如下,输入登录号,AF012108,点击“BLAST”。
结果如下:共有2条核苷酸序列和2条基因组序列和其匹配:第一条核苷酸序列为“Homo sapiens nuclear receptor coactivator 3 (NCOA3), transcript variant 2, mRNA”,登录号:NM_006534。
生物信息学作业1.选择一段蛋白质序列,设计一对兼并引物用来克隆其编码基因,并对引物作出分析。
人胰岛素序列:FVNQHLCGSHLVEALYLVCGERGFFYTPKT(B链)结论:3’- NGGNGTRTARAARAANCC -5’ 5’- TNTAYYTNGTNTGYGGNGA -3’两者评分都是100分,表明引物品质完美;长度18,19稍短,但克隆的DNA链也仅90bp,故长度适合;Tm值76.1℃,符合要求△G相差不足4Kcal/mol所以可以使用。
Step1:打开primer premier 5.0 输入蛋白质链,转化为DNA链。
获得DNA链。
2.选择一段基因,预测期编码RNA的二级结构,并分析功能。
取一段基因:ACGCG GGCGG GCATG TGGGC AGCTT TACCC AGTGC TACTG TGCTG GCCAGCACTG AAACA GGGGC ACTGG TTTGG GGTGG ATGAA GGGTA GAAGT GCAAGTTCCA TTGCC TGTGC AATCC CTGCC TTGCT CAGAC CCTGC TCACT CCTCAGGCCC CATCA GCCCC TCAAC TCTGC TAACC ATGGT GGTAG AAATC AGCTACAATA AACCC TGGAG CCAGT AAAAA AAAAA AAAAA AAAAA AAAAA AAAGT点击Fold as RNA点击START点击Draw Stuclture得到RNA二级结构RNA功能预测打开网址http://sidirect2.rnai.jp/输入DNA序列得出结论:。
山东大学生命科学学院2012~2013学年第一学期期末考试试卷(研究实践型)考试科目: 《生物信息学》适用类别: 本科院系:生命科学学院专业:年级:2010级姓名:kengnidiancom学号:第1页,共22页考试说明和要求1.试卷内容布局包括七部分:目录、引言、实践资源(使用的软件和数据库)、实践方法、实践结果和讨论、参考文献、心得与致谢。
(要求使用此论文模板创建规范统一答卷,详见模板使用说明,请从此模板第3页开始答卷;参考文献要求借助专业软件按《微生物学报》样式统一进行参考文献格式化;请于12月23日前提交电子版(发至邮箱:lzf-204@)和请于12月25-26日提交纸质版(微生物楼北楼玻璃房377室)答卷;团队讨论或受他人帮助请在致谢中说明体现)2.实践素材:完整目的基因groel被克隆入表达载体PET-32a的Nde I与Hind III酶切位点切点中,得到重组克隆PET-32a-groel,利用载体通用引物“T7 promoter”和“T7 terminator primer #69337-3”对重组克隆进行测序,得到序列采集结果“PET-32a-groel__T7.ab1”和“PET-32a-groel__T7ter.scf”。
3.实践要求:(实践方法和结果部分请提供说明问题的关键截图)●对序列采集结果“PET-32a-groel__T7.ab1”和“PET-32a-groel__T7ter.scf”进行基本处理,得到无污染的完整目的基因groel,结果中展示最终的contig装配截图;●设计合适的引物,实现将完整目的基因groel克隆插入表达载体PET-32a的Nde I与HindIII酶切位点的切点中,结果中展示引物参数信息及待送公司合成的引物序列订单;●参考“pET-32a”图谱及其序列文件,绘制(用作测序模板的)重组克隆PET-32a-groel的载体图谱,生成重组载体图谱PET-32a-groel.vec并在结果中展示导出的PET-32a-groel 图谱;●参考“groel information.txt”信息,将得到的完整目的基因groel模拟提交数据库,生成groel.sqn文件并在结果中展示完整的内容信息。
《生物信息学》上机作业题目:对人血红蛋白(HBA1)编码基因序列的生物信息分析目录引言 .............................................................................................................................................. - 1 -1 正文......................................................................................................................................... - 2 -1.1 NCBI上对相关核苷酸序列的查找............................................................................ - 2 -1.2 BLAST运行及其结果.................................................................................................. - 2 -1.3 BLASTX运行及其结果................................................................................................ - 6 -2 其他软件的运行及其结果..................................................................................................... - 8 -2.1 Clustal W运行及其结果 ............................................................................................. - 9 -2.2 MEGA4.0运行及其结果............................................................................................. - 10 -结论 ............................................................................................................................................ - 10 -引言血红蛋白又称血色素,是红细胞的主要组成部分,能与氧结合,运输氧和二氧化碳。