实用生物信息技术课程教学实例_罗静初
- 格式:pdf
- 大小:2.20 MB
- 文档页数:10
《实用生物信息技术》课程教学实例以下四题,可根据本人课题实际情况,选择其中一道或两道1.豌豆开花后特异表达基因及其编码内膜蛋白ppf11)参看文献(zhuetal.,1998),及pubmed数据库中豌豆开花后如上所述抒发基因ppf1有关研究论文,详述ppf1序列特征、抒发特异性,以及可能将的生物学功能。
2)检索uniprot数据库中豌豆内膜蛋白ppf1,总结该序列条目的一般注释信息、序列注释信息、数据库交叉链接。
3)找到拟南芥中ppf1同源蛋白alb3,通过数据库交叉链接,下载其编码基因在拟南芥资源库araport和tair中的注解信息,表明基因组定位、基因结构、气门剪辑方式、抒发特异性、突变体,及其所编码的蛋白质的功能、亚细胞定位、非政府特异性、SMF蛋白、结构域特征,以及有关的文献资源。
4)利用读码框分析程序,分析并提取ppf1全长mrna序列中编码区核苷酸序列和所编码的氨基酸序列。
5)利用密码子统计数据程序,分析豌豆ppf1和拟南芥中同源基因alb3密码子采用特征;利用内乌酶分析程序,分析豌豆ppf1基因的酶切位点;利用引物设计程序,设计ppf1基因mrna序列的引物。
6)利用protscale蛋白质序列特征波形图显示工具,分析ppf1不同区域疏水和亲水、柔性和刚性、溶剂可及性、空间位阻、二级结构等序列特征。
7)利用多种跨膜螺旋预测程序,预测ppf1跨膜螺旋,并比较预测结果的优劣;利用alpha-螺旋轮表明程序,绘制跨膜螺旋的螺旋轮,表明跨膜区的序列特征。
8)利用predicprotein蛋白质结构和功能预测网站,预测ppf1二级结构、无规卷曲、溶剂可及性、亚细胞定位、突变位点敏感性。
9)利用phyre2网站,预测拟南芥ppf1三维空间结构,用runinvestigator工具分析预测结果,与所用模板展开序列和结构比对。
10)通过以上ppf1及其同源蛋白alb3实例,说明核酸和蛋白质序列分析思路和方法,以及分析结果对下一步实验研究的作用。
实用生物信息技术课程期末总结中国农业科学院研究生院2011年6月25日姓名_________学号____________电话____________ 座位号_____邮箱___________________ 得分______ (按学号为文件名保存为WORD 2003文档,如82101102464.DOC,8月25日前发送至caas11s@)1.以与你研究课题相关的关键词____________________________,检索NCBI免费书籍:(1)可在____本书中检索到相关信息,其中前三本书中相关条目共____条,表____个,图_____幅;(2)与你研究方向最相关的书为_____________________________________________________________________(3)根据检索到得信息,简述你对上述关键词的理解(用中文,可用图表表示)。
2.以与你研究课题相关的关键词____________________________,检索PubMed文献摘要数据库:(1)检索到论文总数____篇,其中包括综述____篇;(2)上述检索果中,国内作者发表的____篇,农科院作者发表的____篇,你所在研究所发表____篇;(3)上述检索结果中,最近5年发表的____篇,其中可全文免费下载的____篇;(4)列出检索结果中你最感兴趣的1-3篇文献的PubMeD ID____________________________________________,相关核酸或蛋白质序列登录号为________________________________________________________________(5)结合PubMed网站帮助文档和用户指南,总结PubMed文献检索的策略和经验。
3.浏览Molecular of the Month网站:(1)该网站收集的生物大分子为哪六个大类?(2)和你研究方向相关的大类中包括哪几个子类?(3)阅读你最感兴趣的蛋白质分子的小文章,利用SwissPDBViewer等蛋白质结构分析软件,简述该蛋白质的结构特点,说明其结构与功能的关系。
初中生物教学案例应用实例第一篇范文在初中生物教学中,通过具体的案例应用实例,可以帮助学生更好地理解和掌握生物学知识。
以下是一些初中生物教学案例应用实例的介绍。
案例一:植物的生长与繁殖在教授植物的生长与繁殖这一章节时,教师可以以水稻的生长为例。
首先,教师可以引导学生观察水稻的生长过程,从种子发芽到成熟稻谷的整个过程。
学生可以通过观察水稻的生长变化,了解植物的生长周期和生长需求。
接着,教师可以引导学生研究水稻的繁殖方式,例如通过种子繁殖和无性繁殖。
学生可以通过实验或观察,了解不同繁殖方式对水稻生长的影响。
通过这个案例,学生可以更深入地理解植物的生长和繁殖过程,提高他们的实践观察能力。
案例二:动物的分类与特征在教授动物的分类与特征这一章节时,教师可以以鸟类为例。
首先,教师可以引导学生观察不同种类的鸟类,例如鹦鹉、老鹰和孔雀等。
学生可以通过观察鸟类的形态特征,如羽毛颜色、鸟喙形状和脚的形状等,来学习和掌握动物分类的方法。
接着,教师可以引导学生研究鸟类的生态习性,例如它们的栖息地、食物来源和繁殖行为等。
学生可以通过观察鸟类的行为,了解不同种类鸟类的特征和适应环境的方式。
通过这个案例,学生可以更好地理解和掌握动物的分类和特征,培养他们的观察和分析能力。
案例三:人体的结构与功能在教授人体的结构与功能这一章节时,教师可以以心脏为例。
首先,教师可以引导学生了解心脏的结构,例如心脏的四个腔室、心脏瓣膜的作用等。
学生可以通过观察心脏的模型或图片,理解心脏的结构和功能。
接着,教师可以引导学生学习心脏的功能,例如心脏如何将血液泵送到全身、心脏的跳动频率等。
学生可以通过实验或观察,了解心脏的重要性和作用。
通过这个案例,学生可以更深入地理解人体的结构和功能,提高他们的生物学知识水平。
案例四:生态系统与环境保护在教授生态系统与环境保护这一章节时,教师可以以海洋生态系统为例。
首先,教师可以引导学生了解海洋生态系统的组成,例如海洋生物、海洋环境和海洋资源等。
实用生物信息技术课程期末总结中国农业科学院研究生院暑期班2010年7月5日姓名_________学号____________电话____________ 座位号_____邮箱___________________ 得分______ (按学号为文件名保存为WORD 2003文档,如82101092373.DOC,8月31日前发送至caas10ss@,邮件主题用学号)1. PubMed文献检索1)结合本课程斑头雁血红蛋白或癌胚抗原实例,说明如何利用PubMed进行文献检索,如何通过检索结果获取蛋白质序列和结构等其它数据库信息。
2)检索PubMed文献摘要数据库,找出最近3年内该数据库收录的你所在实验室或研究所发表的论文,列出第1作者、通讯作者、期刊名和PMID。
2.UniProt数据库检索1)以人血红蛋白或癌胚抗原为例,简述UniProt蛋白质序列数据库检索方法。
2)以你熟悉的蛋白质为例,简述UniProt/Swiss-Prot数据库中该序列条目的序列特征信息、文献信息和数据库交叉链接。
3.SRS数据库检索1)以血红蛋白或癌胚抗原为例,说明如何利用SRS进行检索并对检索结果进行分析。
2)以你熟悉的蛋白质和核酸序列为例,说明如何利用SRS扩展检索方法中的序列特征表信息选项确定该序列所包含的序列特征信息。
4.BLAST数据库搜索1)以血红蛋白为例,说明如何利用NCBI BLAST获取人珠蛋白超家族(Globin superfamily)所有成员,并对搜索结果进行分析。
2)以你熟悉的核酸和蛋白质序列为例,说明如何利用NCBI BLAST进行数据库搜索并对搜索结果进行分析。
5.WebLab/Jemboss生物信息分析平台1)以豌豆内膜蛋白PPF-1为例,说明如何利用WebLab或Jemboss进行序列分析,说明分析结果。
2)结合自己从事或所在实验室正在进行的研究课题,利用WebLab或Jemboss进行序列分析,说明分析结果。
初中生物信息技术与学科教学融合教学案例2介绍本文档将介绍一个初中生物信息技术与学科教学融合的教学案例。
通过将生物学知识与信息技术相结合,可以激发学生的研究兴趣,提高他们对生物学的理解和应用能力。
目标1. 使用生物信息技术工具分析和解释生物学数据;2. 运用信息技术来探究和解决生物学问题;3. 培养学生的信息素养和科学思维能力。
教学内容教学内容将针对以下主题展开:1. DNA序列分析:教师可以引导学生使用在线DNA序列比对工具,分析并比对不同物种的DNA序列,了解基因的相似性和差异性。
2. 基因组浏览:教师可以使用基因组浏览器软件,让学生探索基因组上的各种特征和结构,理解基因组的组成和功能。
3. 生物信息数据库:教师可以引导学生利用生物信息数据库,查找和分析相关的生物学数据,如基因组数据、蛋白质序列等。
教学步骤1. 导入:教师介绍生物信息技术的背景和意义,以及本节课的研究目标。
2. 研究:教师向学生介绍具体的生物信息技术工具和软件,并演示其使用方法。
3. 实践:学生分组进行实践活动,使用生物信息技术工具进行生物学数据的分析和解释。
4. 分享:每个小组向全班展示他们的实践成果和发现,进行讨论和交流。
5. 总结:教师和学生共同总结本节课的研究成果,并展望未来的研究和应用方向。
教学评价教学评价将重点考察学生对生物信息技术的理解和应用能力。
评价方式可以包括以下项目:1. 实践活动报告:学生需要撰写实践活动报告,详细记录实验过程和结果,并对结果进行分析和解释。
2. 小组展示评价:每个小组的展示和讨论可以作为评价的一部分,考察学生的表达能力和团队合作能力。
3. 口头回答问题:教师可以提出相关问题,要求学生口头回答,考察学生对于知识的理解和运用能力。
结论通过生物信息技术与学科教学融合的教学案例,我们可以激发学生的研究兴趣,提高他们的信息素养和科学思维能力。
这种教学方法能够更好地培养学生的创新思维和解决问题的能力,为他们未来的研究和工作打下良好的基础。
生物信息学实验指导书重庆邮电大学生物信息学实验指导书生物信息教学部谭军编重庆邮电大学生物信息学院前言生物信息学是上世纪90年代初人类基因组计划(HGP)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。
目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。
生物信息学作为新型交叉应用学科,可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势,充分展现投入少、见效快、起点高的特色,推动学校学科建设和本科教学水平。
本实验指导书中的8个实验均设计为综合性开发实验,面向生物信息学院全体本科学生和研究生,以及全校对生物信息学感兴趣的其他专业学生开放。
生物信息学实验室将提供系统的保障,包括采用mail服务器和linux帐号管理等进行实验过程管理和支持。
限选《生物信息学及实验》的生物技术专业本科生至少选择其中5个实验,并不少于8个学时,即为课程要求的0.5个学分。
其他选修者按照课时和学校相关规定计算创新学分。
实验一熟悉生物信息学网站及其数据的生物学意义实验目的:培养学生利用互联网资源获取生物信息学研究前沿和相关数据的能力,熟悉生物信息学相关的一些重要国内外网站,及其核酸序列、蛋白质序列及代谢途径等功能相关数据库,学会下载生物相关的信息数据,了解不同的数据文件格式和其中重要的生物学意义。
实验原理:利用互联网资源检索相关的国内外生物信息学相关网站,如:NCBI、SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因组研究所、北大生物信息学中心等,下载其中相关的数据,如fasta、genbank格式的核算和蛋白质序列、pathway等数据,理解其重要的生物学意义。
实验内容:1.浏览和搜索至少10个国外和至少5个国内生物信息学相关网站,并描述网站特征;2.下载各网站的代表性数据各10条(组)以上,并说明其生物学意义;3.讨论各网站适合做何种生物信息学研究的平台,并设计一个研究设想。
初中生物信息化教学设计”一、教学任务及对象1、教学任务本教学设计旨在针对初中生物课程,以信息化教学手段为支撑,提高学生对生物学科的兴趣,深化对生物学概念的理解,培养学生科学探究的能力。
具体任务包括:利用多媒体和网络资源,设计生动、直观的课堂教学活动,帮助学生掌握生物学基础知识;运用信息技术,开展探究性学习,引导学生主动探索生物世界的奥秘;结合生活实际,培养学生的生物技术应用意识,提高学生的生物科学素养。
2、教学对象本教学设计针对的教学对象为初中学生,他们具备一定的信息素养,对生物学科有一定兴趣,但在探究性学习、生物学概念理解等方面仍有待提高。
此外,学生之间存在个体差异,因此在教学过程中,需要关注不同学生的学习需求,因材施教,使每个学生都能在信息化教学环境中获得成长。
二、教学目标1、知识与技能(1)理解并掌握生物学基础知识,如细胞的结构与功能、生物的分类与进化、生态系统的基本概念等。
(2)学会运用信息技术手段,如搜索引擎、在线学习平台等,获取生物学相关信息,提高信息处理能力。
(3)掌握科学探究的基本方法,如观察、实验、数据分析等,并能运用这些方法进行生物学科相关问题的探究。
(4)培养生物技术应用意识,了解生物技术在生活中的应用,如基因工程、生物制药等。
2、过程与方法(1)通过信息化教学手段,引导学生主动参与课堂学习,培养学生自主学习的能力。
(2)采用小组合作、讨论交流等形式,培养学生团队协作能力和沟通能力。
(3)设计富有挑战性的探究活动,激发学生的求知欲,培养学生解决问题的能力。
(4)运用多媒体、网络资源等,丰富教学手段,提高课堂教学效果。
3、情感,态度与价值观(1)培养学生对生物学科的兴趣,激发学生的学习热情,使其乐于探索生物世界的奥秘。
(2)培养学生尊重生命、关爱环境的意识,提高学生的生态保护观念。
(3)通过生物科学史的学习,了解生物学家们的贡献,培养学生崇尚科学、追求真理的精神。
(4)结合生活实际,让学生认识到生物学科与现实生活的紧密联系,培养学生的社会责任感。
目录“生物信息学”课程教学大纲 (1)“预防医学概论”课程教学大纲 (4)“全科医学教育”课程教学大纲 (4)“环境医学”课程教学大纲 (5)“医用电子显微技术”课程教学大纲 (6)“机能综合实验设计”课程教学大纲 (32)“医学分子遗传学导论”课程教学大纲 (34)“生物信息学”课程教学大纲英文名称:Introduction to Medical Bioinformatics课程编号:BASM2017学时:32 学分:1.5适用对象:临床医学专业五、七年制,预防医学、法医学、口腔医学专业先修课程:分子生物学、计算机网络基础使用教材及参考书:[1]楚雍烈主编,《医用生物信息学概论》,陕西科学技术出版社,2005年[2]罗静初主编,《生物信息学》,北京大学出版社,2002年一、课程性质、目的和任务性质:选修课目的:使学生学习、掌握生物信息学的先进理论知识和技术。
掌握信息时代彼此相互学习、相互交流医学知识必不可少的现代工具和技术手段。
二、教学基本要求1.要求学生掌握生物信息学的基本理论知识和基本概念,熟悉生物信息学的相关技术方法,特别是分子生物学中常用的关键技术及常用软件。
2.考虑到生物信息学实践性很强的特点,结合生物医学实际,设计了一些实验供学生练习操作,以巩固所学的知识和技术。
要求学生熟悉生物信息学的常用网络技术方法,掌握网络技术基本要领。
三、教学内容及要求第一章生物信息学和医学信息学绪论1. 生物信息学和医学信息学的产生背景2.生物信息学和医学信息学的发展3.生物信息学和医学信息学的重要性4.生物信息学和医学信息学的研究内容第二章生物信息学和医学信息学的信息学基础1. 生物信息学和医学信息学中的计算机基础知识2. 生物信息学和医学信息学中的互联网基础知识第三章生物信息学的医学分子生物学基础1. 生物信息学和医学信息学中的分子生物学理论基础知识2. 生物信息学和医学信息学中的分子遗传学技术简介第四章生物信息学和医学信息学资源检索工具1. 生物信息学和医学信息学资源的通用新检索工具2. 生物信息学和医学信息学资源的专业搜索引擎3.综合运用搜索工具获得生物信息学和医学信息第五章生物信息学的互联网浏览和文件传输1. 生物信息学和医学信息学信息资源的网上浏览2.生物信息学和医学信息学信息资源的网上检索3.生物信息学和医学信息学信息资源的网上传输和交流4. 文档阅读和图像浏览第六章生物信息学的信息中心和数据库1. 生物信息学的重要信息中心2. 生物信息学的主要数据库第七章核酸序列比对分析1.核酸序列同源性分析2.酶切位点分析及物理图谱第八章生物信息学与核酸检测技术1.PCR 引物的设计与优化2.核酸杂交探针设计3.基因芯片与生物信息学第九章生物信息学与生物制药1.生物制药中的生物信息学2.核酸药物的设计第十章蛋白质结构与功能分析1. 蛋白质氨基酸序列的分析2.蛋白质基本结构与特性分析3. 蛋白质的高级结构、功能预测、功能域的判定第十一章基因组学与生物信息学1. 基因组结构分析2.基因的定位3.电子克隆。
信息技术初中生物教学设计案例教学设计案例:信息技术与生物学的融合一、教学目标:1.通过信息技术的应用,激发学生对生物学科的兴趣;2.培养学生的信息技术能力,提高他们获取、整理和分析生物学知识的能力;3.培养学生的创新思维和解决问题的能力;4.规范学生对信息技术的使用,增强他们的信息素养。
二、教学内容:1.生物学常识的介绍和学习:种类、构造、功能等;2.信息技术的常见工具与应用;3.信息技术在生物学中的应用。
三、教学过程:1.导入(10分钟)教师以一个生物学的科普小视频文献引入,激发学生对生物学科的兴趣,并提出信息技术与生物学的结合能为我们带来哪些便利。
2.生物学常识学习(30分钟)a.教师简要介绍生物学的基本概念、种类、构造、功能等方面的知识点。
b.使用PPT展示生物学知识的图表和模型,帮助学生对生物学常识进行综合整理。
c.学生分组进行讨论,制作生物学的知识问答游戏,利用信息技术工具(如PPT或在线答题平台)呈现。
3.信息技术常见工具与应用介绍(20分钟)a. 教师通过视频和示范,介绍信息技术中的常见工具,如计算机、网络、手机等,以及应用软件,如Word、Excel、PowerPoint等。
b.学生观看视频教学后,自主使用这些工具进行实践和探索,掌握其基本操作技能。
4.信息技术在生物学中的应用案例(40分钟)a.教师介绍信息技术在生物学中的应用案例,如基因测序、生物数据分析、生物信息学等。
b.学生分组选择一个感兴趣的应用案例,展开调研和研究,并撰写小论文或制作展示PPT,介绍该应用案例的原理、方法和应用领域。
c.学生展示成果,与其他小组进行交流和讨论,互相学习。
5.总结与评价(10分钟)学生和教师共同总结本节课所学内容,并进行评价。
学生展示成果是否能够体现信息技术与生物学的结合,是否充分发挥了创造性和解决问题的思维。
四、教学评价:1.学生自主制作的生物学知识问答游戏,检验学生对生物学常识掌握的程度;2.学生的实践操作与调研成果,评价学生对信息技术工具和应用的掌握程度;3.学生的论文或展示PPT,评价学生对信息技术与生物学融合的理解和应用能力。
自2000年起,本人在北京大学和中国农业科学院研究生院开设“实用生物信息技术”课程[1]。
本课程以从事分子生物学实验研究的硕士或博士研究生为教学对象,重点介绍最基本、最常用的生物信息技术和方法,主要包括:(1)蛋白质和核酸序列相似性比对;(2)蛋白质序列数据库UniProt 和核酸序列数据库RefSeq 高级检索;(3)NCBI 数据库相似性搜索工具Blast 的应用;(4)利用MEGA 软件构建分子系统发生树;(5)利用Swiss -PdbViewer 软件显示、比较和分析蛋白质三维空间结构。
本文以人、小鼠、大鼠、斑头雁、灰雁几个不同物种的血红蛋白序列和结构为例,介绍这些常用生物信息技术和方法的具体应用。
学生通过这些实例,能够初步掌握这些方法的具体应用,并能举一反三,将这些方法用于自己的课题研究,学会如何利用丰富的网络生物信息资源和分析工具解决自己正在进行或即将开始的研究课题中的实际问题。
1 序列比对1.1 研究背景血红蛋白是人体血液中重要蛋白质分子,其主收稿日期:2015-03-26作者简介:罗静初,男,教授,研究方向:生物信息学;E -mail :luojc@实用生物信息技术课程教学实例罗静初(北京大学生命科学学院 北京大学蛋白质与植物基因研究重点实验室 北京大学生物信息中心,北京 100871)摘 要: 介绍“实用生物信息技术”研究生课程的5个教学实例。
以血红蛋白序列和结构为例,介绍常用生物信息技术和分析方法,包括蛋白质和核酸序列相似性比对、蛋白质和核酸序列数据库检索、Blast 数据库相似性搜索、分子系统发生树构建,以及蛋白质结构比较分析等。
关键词: 生物信息技术;血红蛋白;序列比对;数据库检索;Blast 数据库搜索;系统发生树构建;蛋白质结构比较分析DOI :10.13560/ki.biotech.bull.1985.2015.07.001Teaching Examples of Applied Bioinformatics CourseLuo Jingchu(College of Life Sciences ,The State Key Laboratory of Protein and Plant Gene Research ,Center for Bioinformatics ,Peking University ,Beijing 100871)Abstract: In this article, we introduce the basic bioinformatics analysis methods and tools taking the hemoglobin as an example. The methods include :1)protein and DNA sequence alignment ;2)advanced search for UniProt and RefSeq database ;3)Blast database similarity search ;4)phylogenetic tree construction under MEGA ;5)protein structure comparison using Swiss -PdbViewer.Key words: bioinformatics ;hemoglobin ;sequence alignment ;database query ;Blast database similarity search ;phylogenetic tree construction ;protein structure comparison编者按: 自2000年起,罗静初教授在北京大学生命科学学院和中国农业科学院研究生院开设“实用生物信息技术”课程,教学方法以上机实习为主,指导学生利用丰富的生物信息网络数据资源和软件工具,结合自己的研究课题,进行生物信息分析。
本文以血红蛋白为例,介绍常用生物信息技术与方法的具体应用,对生物信息领域科研人员具有一定参考价值。
网络出版时间:2015-06-26 16:39网络出版地址:/kcms/detail/11.2396.Q.20150626.1639.002.html要生物学功能为运送氧气。
血红蛋白分子为异源四聚体,可结合4个铁卟啉色素分子。
成人血红蛋白分子由两个α-亚基和两个β-亚基组成。
人类基因组中编码α-亚基的血红蛋白基因有两个,位于16号染色体短臂的α-珠蛋白基因簇中,其编码区核苷酸序列相同,所编码的蛋白质序列自然也相同,各含142个氨基酸残基。
与人一样,小鼠和大鼠的血红蛋白也是四聚体,α-亚基也由142个氨基酸组成。
小鼠和大鼠同属啮齿类动物,其共同祖先距今约2 500万年。
而人属于灵长类动物,与啮齿类分歧时间约为9 500万年。
对这3个物种α-血红蛋白氨基酸序列及其编码基因的核苷酸序列进行比对,可探索血红蛋白分子及其编码基因演化的特点。
1.2 比对方法和结果从国际蛋白质序列数据库UniProt 中分别提取人和小鼠α-血红蛋白的FastA 格式序列,其序列条目名称分别为HBA_HUMAN(人)、HBA_MOUSE(小鼠)。
序列比对的软件很多,北京大学生物信息中心开发的综合序列分析平台WebLab (http:///)包括200多个程序[2]。
利用WebLab 中基于Needleman -Wunsch 全局序列图1中上方为统计值,包括序列长度(LENGTH)、比对分值(SCORE)、相同位点(IDENTITY)、相似位点(SIMILARITY)和空位数(GAPS)。
下方为两条序列的具体比对结果,“|”表示相同位点、“:”表示相似位点,“.”表示不同位点。
所谓相似位点,是指该位点的两个氨基酸理化性质较接近,如苏氨酸“T”和丝氨酸“S”、缬氨酸“V”和异亮氨酸“I”等。
按上述方法,分别对人/小鼠、人/大鼠、小鼠/大鼠3个物种α-血红蛋白进行序列比对,结果如表1所示。
图1 人和小鼠血红蛋白α-亚基氨基酸序列比对输出结果比对算法的程序Needle,采用默认蛋白质计分矩阵BLOSUM62和默认空位罚分值(起始空位罚分10.0,延伸空位罚分0.5),比对结果如图1所示。
表1 人、小鼠、大鼠血红蛋白α-亚基氨基酸序列比对结果物种 序列名登录号得分相同位点(比例) a 相同加相似位点(比例) b人 / 小鼠HBA_HUMAN / HBA_MOUSE P69905 / P01942648122/142(85.9%)131/142(92.3%)人 / 大鼠HBA_HUMAN / HBA_RAT P69905 / P01946587111/142(78.2%)120/142(84.5%)小鼠 / 大鼠HBA_MOUSE / HBA_RATP01942 / P01946632120/142(84.5%)127/142(89.4%)注:a :相同位点个数占全长序列的比例;b :相同加相似位点个数占全长序列的比例从NCBI 参考序列数据库中提取这3个物种α-血红蛋白基因编码区序列,用WebLab 中的Needle 程序进行序列比对,注意选择核苷酸替换矩阵EDNAFULL,将起始空位罚分改为20.0,延伸空位罚分改为2.0,比对结果如表2所示。
1.3 结果分析表1为3个物种血红蛋白α-亚基氨基酸序列比对结果。
出乎意料的是,人和小鼠α-血红蛋白共有122个相同位点,占全长142个位点的85.9%;而小鼠与大鼠之间的相同位点数为120个,占全长84.5%。
换句话说,同为啮齿类的小鼠和大鼠,血红蛋白序列相似性低于啮齿类和灵长类。
之所以出现这一结果,原因有许多,其中最主要的是密码子简并性,即同一氨基酸在不同物种或不同基因中可能由不同密码子编码,蛋白质序列相似性高低可能与其编码核苷酸的相似性高低并不一致。
这3个物种血红蛋白编码基因的编码区核苷酸序列比对结果(表2)显示,小鼠和大鼠之间的序列相似性为89.3%,高于小鼠和人之间的序列相似性81.6%。
2 数据库高级检索2.1 研究背景研究表明,有些基因在一个物种中只有一个拷珠蛋白(α-globin)和1630 kb,ε、γ2、1个假γ2在胎表2 人、小鼠、大鼠α-珠蛋白编码区核苷酸序列比对结果物种 基因名 登录号得分相同位点(比例)a空位数人 / 小鼠HsHBA1 / MmHba-a1NM_000558 / NM_0082181434350/429(81.6%)0人 / 大鼠HsHBA1 / RnHba1NM_000558 / NM_0130961335339/429(79.0%)0小鼠 / 大鼠MmHba-a1 / RnHba1NM_008218 / NM_0130961731383/429(89.3%)0注:a:图2 人α-珠蛋白和β-珠蛋白基因家族染色体定位2.2 检索方法上述α和β-珠蛋白基因编码的血红蛋白氨基酸序列,均存放在国际蛋白质序列数据库UniProt中。
利用该数据库提供的高级检索功能,可以快速有效地检索到这些蛋白质序列条目。
具体检索步骤如下:(1)点击UniProt数据库主页上方检索框右侧Advanced下拉式菜单,打开弹出式高级检索子窗口(图3-A)。
(2)点击高级检索窗口最上方下拉式选择菜单中的All,选择Protein Name[DE],在其右侧的文本输入框中输入血红蛋白的英文Hemoglobin。
(3)点击第2个下拉式选择菜单中的All,选择基因名Gene Name[GN],在其右侧的文本输入框中输入血红蛋白的基因名缩写hb(不分大小写),并在后加通配符星号,即hb*。
(4)点击该选择菜单输入框右侧增加选择项符号“+”,弹出第3个选择菜单(图3-B)。
(5)点击第3个选择菜单中的All,选择物种名Organism[OS],在其右侧输入Human,系统列出该数据库中与输入文本Human相关的所有物种,选择Human[9606]。
9606为人在NCBI分类学数据库中的登录号。
(6)点击检索窗口右下侧检索按钮(图标为放大镜),提交检索策略,页面显示UniProt数据库中收录的所有人血红蛋白序列条目。
(7)点击页面左侧Reviewed图标,页面显示检索结果(图3-C)。
而TrEMBL子库中的数据条目总数为90 860 905条。
显然,这两个子库的数据量差别极大。
点击UniProt 网站主页面下方UniProt data栏目下的Statistics图标,可以找到这两个子库的统计资料文档UniProt/Swiss-Prot statistics和UniProt/TrEMBL statistics,文档中有许多图表,详细叙述这两个子库的基本情况。