生物信息学电子资料总汇(大全5篇)
- 格式:docx
- 大小:35.98 KB
- 文档页数:19
生物信息学(五篇范例)第一篇:生物信息学生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。
它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。
其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。
具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。
基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。
从生物信息学研究的具体内容上看,生物信息学应包括这3个主要部分:(1)新算法和统计学方法研究;(2)各类数据的分析和解释;(3)研制有效利用和管理数据新工具。
生物信息学是一门利用计算机技术研究生物系统之规律的学科。
目前的生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。
生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。
1990年代以来,伴随着各种基因组测序计划的展开和分子结构测定技术的突破和Internet的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。
对生物信息学工作者提出了严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?生物信息学的另一个挑战是从蛋白质的氨基酸序列预测蛋白质结构。
这个难题已困扰理论生物学家达半个多世纪,如今找到问题答案要求正变得日益迫切。
诺贝尔奖获得者W.Gilbert在1991年曾经指出:“传统生物学解决问题的方式是实验的。
大学生物信息学专业-复习资料整理一、名词解释:生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。
利用数学知识建立各种数学模型;利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。
二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。
FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。
genbank序列格式:是GenBank数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。
该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释:第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。
Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。
BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。
P94查询序列(querysequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。
P98打分矩阵(scoringmatrix):在相似性检索中对序列两两比对的质量评估方法。
包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。
P29空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。
P29空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影响,序列中的空位的引入不代表真正的过化事件,所以要对其进行罚分,空位罚分的多少直接影响对比的结果。
第一章生物信息学是生命科学、计算机科学、现代信息科学、数学、物理学以及化学等多个学科交叉结合形成的一门新学科,是利用信息技术和数学方法对生命科学研究中的生物信息进行存储。
检索和分析的科学。
1982年创建了GenBank数据库。
(1)序列数据资源:储存了生物信息学研究的原始数据,是生物信息学存在和发展的基础。
(2)序列比对与比对搜索:相似性分析是生物信息学最早涉及的问题之一。
常用的分析方法是序列比对。
(3)基因组结构注释(4)分子系统发生分析:系统发生关系是表示物种进化关系的参考依据。
通过分析分子水平的序列数据,可以了解物种系统发生的关系,目前常用树的形式来表示不同物种间的进化关系。
(5)蛋白质结构:蛋白质的空间结构是其行使功能的基础。
(6)蛋白质序列分析与功能预测。
(7)微阵列数据分析:微阵列是一种重要的基因表达高通量检测技术。
(8)蛋白质组数据分析:高通量的蛋白质组工程能够大范围地确定蛋白质功能,能确定蛋白质在哪种特殊的生理条件下会出现,还能确定那些蛋白质之间有相互作用。
(9)疾病相关研究:寻找疾病相关基因是认识疾病发生机理、研制疾病的基因诊断与防治手段的基础,也是人类基因组研究的重要手段。
(10)SNP芯片及深度测序数据分析。
视黄醇结合蛋白是一个相对分子质量小、被大量分泌的蛋白质,能结合血液中的视黄醇。
性质:①在多个物种中有许多蛋白质和RBP4同源,包括人、小鼠和鱼总的蛋白质。
②也有许多人类蛋白质额RBP4紧密相关,它们和RBP4的家族成为lipocalin家族——一群多样的小配体结合蛋白,它们倾向于分泌到细胞外空间。
③有细南的lipealin 蛋白,它们在对抗生素的抗性中起作用。
编码细菌lipocalin 的基因可能是一古老基因,它通过水平基因转移的过程进人真核生物基因组。
④些lipocalin 蛋白的表达水平受到显著的调控。
⑤lipealin 蛋白小而丰富,并且是可溶性的,它们的生物化学性质已被详细研究,许多蛋白质的三维结构也以x线晶体街射的方法被解析出来。
1.生物信息学(Bioinformatics):是研究生物信息的采集,处理,存储,传播,分析和解释等各方面的学科。
新兴的交叉学科。
PS:生物分子至少携带着三种信息–遗传信息–与功能相关的结构信息–进化信息2.生物信息学主要研究两种信息载体: DNA和蛋白质(1)遗传信息的载体——DNADNA通过自我复制,在生物体的繁衍过程中传递遗传信息;基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状。
(2)蛋白质的结构决定其功能蛋白质功能取决于蛋白质的空间结构蛋白质结构决定于蛋白质的序列(这是目前基本公认的假设),蛋白质结构的信息隐含在蛋白质序列之中。
3.序列数据库有哪些?特点?如何检索?(1)基因组序列数据库:Genome Database(GDB)数据库:包括人、鼠、斑马鱼和果蝇4种真核生物基因组的注释分析。
由EMBL - EBI和Sanger研究所联合开发。
UCSC Genome Browser:加州大学圣克鲁兹分校建立,包括各种脊椎和无脊椎动物,以及主要模式生物的基因组数据。
(2)核酸序列数据库:EMBL DDBJ GenBank三个数据库每天互相交换数据,GenBank可通过NCBI的检索系统Entrez获取,Entrez集成来自主要DNA和蛋白序列数据库的数据,包括物种、基因组、定位、蛋白结构和结构域等信息。
(3)蛋白质序列数据库:UniProt IPI Nr4序列标签位点STS序列标签位点(sequence-tagged site),是已知核苷酸序列的DNA片段,是基因组中任何单拷贝的短DNA序列,长度在100~500bp之间。
任何DNA序列,只要知道它在基因组中的位置,都能被用作STS标签。
5.CDS和ORF的区别(1)开放读码框是从一个起始密码子开始到一个终止密码子结束的一段序列;不是所有读码框都能被表达出蛋白产物,或者能表达出占有优势或者能产生生物学功能的蛋白。
生物信息学资料生物信息学绪论1.HGP通过国际合作,用15年时间(1990~2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA的全部核苷酸序列,定位约2.5万基因,并对其它生物进行类似研究。
2.我国自主产权的全基因组测序计划水稻(2002)家鸡(2004)家蚕(2004)家猪(2012)大熊猫(2009)3.生物信息学的概念采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。
收集、加工、储存:计算机科学家分析、解释:生物学家4.生物信息学的发展历史20世纪50年代,生物信息学开始孕育20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来20世纪70年代,生物信息学的真正开端(序列比对算法)20世纪80年代初期,生物信息分析方法的发展20世纪80年代以后,生物信息服务机构和数据库20世纪90年代后,HGP促进生物信息学的迅速发展1956: 美国田纳西州首次召开了“生物学中的理论研讨会”;1962: Zucherkandl和Pauling研究了序列变化与进化的关系,开创了一个新的领域——分子进化;1967: Dayhoff研制出蛋白质序列图集,即后来著名的蛋白质信息源PIR;1970: Needleman和Wunsch提出了著名的序列比对算法,是生物信息学发展中最重要的贡献;1970: Gibbs和McIntyre发表著名的矩阵打点做图法;1978: Gingeras等人研制了核酸序列中酶切位点识别程序;1981: Smith和Waterman提出了著名的公共子序列识别算法,同年Doolittle提出了关于序列模式的概念;1982: GenBank第3版本正式发行;1983: Wilbur和Lipman发表了数据库相似序列搜索算法;1986: 日本核酸序列数据库DDBJ诞生;1986: 蛋白质数据库SWISS-PROT诞生;1988: 美国国家生物技术信息中心NCBI诞生;1988: 成立欧洲分子生物学网络(EMBNet),EMBL数据库诞生;1988: Person和Lipman发表了著名的序列比较算法FASTA;1990: 快速相似性序列搜索算法BLAST问世,1987年BLAST的改进版本PSI-BLAST投入使用1996: Affymetrix生产出第1块DNA芯片。
Conting(叠连群):又译作连续克隆系。
为搞清某段DNA的排列顺序而建立的一组克隆。
被克隆的DNA小片段有相互邻接并部分重叠的关系,从而可以完全覆盖该段DNA,一个这样的克隆群即为一个conting。
功能域:蛋白质中具有某种特定功能的部分,它在序列上未必是连续的。
某蛋白质中所有功能域组合起来决定着该蛋白质的全部功能。
基因组:某一物种的一套完整染色体组中的所有遗传物质。
其大小一般以其碱基对总数表示。
基因组学:从事基因组的序列测定和表征描述,以及基因活性与细胞功能关系的研究。
人类基因组计划:HGP主要目标:提供公开的完全的高质量的含有30亿bp的人类基因组全序列。
生物信息学:是分子生物学,信息技术与科学,物理学,数学等学科交叉,结合的产物。
其研究核心是基因组信息学及蛋白质组学。
序列标签位点:人类基因组中只出现一次的位置和序列已知的长度约为200~~500bp的特定DNA序列。
人工神经网络:是对人类大脑特性的一种描述。
简单地讲,它是一个数字模型,可以用电子线路来实现,也可以用计算机程序来模拟,是人工智能研究的一种方法。
一级数据库:数据库中的数据直接来源于试验获得的原始数据,只经过简单的归类整理和注释。
二级数据库:根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建具有特殊生物学意义和专门用途的二次数据库。
直系同源:是指来自于不同物种的由垂直家系(物种形成)进化而来基因,并且典型的保留与原始基因有相同的功能旁系同源:指同一基因组(或同系物种的基因组)中,由于始祖基因的加倍而横向产生的几个同源基因,可能会进化出新的与原来有关的功能。
分子钟:某一种蛋白质在不同物种间的取代数与所研究的物种间的分歧时间接近正线性关系,从而将分子水平的这种恒速变异称为“分子钟”。
蛋白质组:由一个细胞或一个组织的基因所表达的全部相应的蛋白质数据库查询:指对序列,结构以及各种二次数据库中的注释信息进行关键词匹配查找数据库搜索:是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。
生物信息学的文章1. “Computational Biology and Bioinformatics: An Introduction”,作者:Michael Ashburner 和 Kevin Knight,发表于 2000 年的《Nature Genetics》杂志。
这篇文章介绍了计算生物学和生物信息学的基本概念、方法和应用,强调了它们在基因组学和后基因组学研究中的重要性。
2. “Bioinformatics: The Machine Learning Approach”,作者:Andreas D. Baxevanis 和 Bonnie F.宽广,发表于 2001 年的《ACM Computing Surveys》杂志。
这篇文章综述了机器学习在生物信息学中的应用,包括序列分析、蛋白质结构预测、基因表达数据分析等方面。
3. “Biological Sequence Analysis: Probabilistic Models and Algorithms”,作者:Richard Durbin 等人,发表于 1998 年的 《Journal of Computational Biology》杂志。
这篇文章介绍了生物序列分析的概率模型和算法,包括隐马尔可夫模型、动态规划算法等,是生物信息学领域的经典之作。
4. “Genome-Wide Association Studies: Detecting Associations with Common Disease”,作者:Matthew Stephens 等人,发表于 2009 年的《Nature Reviews Genetics》杂志。
这篇文章综述了基因组范围关联研究 GWAS)的方法和应用,以及其在复杂疾病研究中的潜力和挑战。
5. “Network Biology: Understanding the Cell's Functional Organization”,作者:Hernan Garcia-Oliva 和 Alfonso Valencia,发表于 2009 年的《Nature Reviews Genetics》杂志。
生物信息学复习资料生物信息学复习资料第一讲生物信息学绪论1、生物信息学诞生于计算机初创时期,1956年在美国田纳西州的Gatlinburg召开了首次―生物学中的信息理论讨论会‖2、20世纪80年代末―林华安‖博士创造了‖bioinformatics‖一词3、数据库的构建:1979年美国Genbank数据库;1982年欧洲分子生物实验室EMBL核酸序列数据库;1984年日本国家级核酸序列数据库DDBJ4、专业机构:1988年美国成立了―生物技术信息中心‖(NCBI);欧洲生物信息学研究所(EBI)于1993年构建.5、生物信息学产生的背景(1)、传统生物学和现代生物学都是一门实验学科,生物学的发展需要数学模型的介入(2)、海量生物学数据信息的产生(2002年8月,Genbank中的序列量已达18197000,而碱基对数达22617000000,且以每秒220对的速度增加),数据的分析处理成为生物学发展的―瓶颈‖(3)、新的生物学研究模式的出发点应是理论:从理论出发,再回到实验中追踪或验证这些理论假设6、生物信息学定义(广义):应用信息科学的方法和技术,研究生物体系和生命过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。
狭义:应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。
一般提到的―生物信息学‖是就指这个狭义的概念,更准确地说,应该是分子生物信息学(Molecular Bioinformatics)7、生物信息学研究的主要对象——两种信息载体:DNA分子和蛋白质分子(1)遗传信息的载体——DNA遗传信息的载体主要是DNA,控制生物体性状的基因是一系列DNA片段,生物体生长发育的本质就是遗传信息的传递和表达(2)蛋白质的结构决定其功能蛋白质功能取决于蛋白质的空间结构,蛋白质结构决定于蛋白质的序列(这是目前基本共认的假设),蛋白质结构的信息隐含在蛋白质序列之中。
生物信息学电子资料总汇(大全5篇)第一篇:生物信息学电子资料总汇生物信息学(2000以后)下载1.《生物信息学手册》郝柏林等11.《生物信息学:序列与基因组分析》原版钟扬等译16.生物信息学课件教程(河北农业大学)17.生物信息学讲义(西南交通大学)18.简明生物信息学基础实验讲义30-40.《生物信息学导论》课程-北京大学理论生物学中心61.蛋白质的结构预测与分子设计来鲁华等from=isnom(2分)62.探索--基因组学、蛋白质组学和生物信息学-孙之荣主译63.计算生物学和系统生物学基础讲义利用X射线晶体衍射图及核磁共振谱解析同源建模DNA微阵列与聚类分析基于计算的蛋白质组注释基于计算的蛋白质设计蛋白质结构预测方法:同源建模与折叠识别...分子建模:方法及应用蛋白质结构与分类导论蛋白质二级结构预测RNA二级结构预测DNA序列进化DNA序列分析中的马尔科夫模型与隐马尔科DNA模体建模与识别DNA序列比较与比对基因组序列与DNA序列分析文献讨论多序列比对 II多序列比对I绪论-序列比对与动态规划64.华南农业大学——生物信息学65.《计算机辅助药物分子设计》 [徐小杰等]66.生物信息学导论-数据库厦门大学67.计算机辅助药物设计陈凯先第二篇:生物信息学生物信息学是上世纪90年代初人类基因组计划(HGP)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。
目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。
生物信息学作为新型交叉应用学科,可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势,充分展现投入少、见效快、起点高的特色,推动学校学科建设和本科教学水平。
本实验指导书中的8个实验均设计为综合性开发实验,面向生物信息学院全体本科学生和研究生,以及全校对生物信息学感兴趣的其他专业学生开放。
生物信息学实验室将提供系统的保障,包括采用mail服务器和linux帐号管理等进行实验过程管理和支持。
限选《生物信息学及实验》的生物技术专业本科生至少选择其中5个实验,并不少于8个学时,即为课程要求的0.5个学分。
其他选修者按照课时和学校相关规定计算创新学分。
实验一熟悉生物信息学网站及其数据的生物学意义实验目的:培养学生利用互联网资源获取生物信息学研究前沿和相关数据的能力,熟悉生物信息学相关的一些重要国内外网站,及其核酸序列、蛋白质序列及代谢途径等功能相关数据库,学会下载生物相关的信息数据,了解不同的数据文件格式和其中重要的生物学意义。
利用互联网资源检索相关的国内外生物信息学相关网站,如:NCBI、SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因组研究所、北大生物信息学中心等,下载其中相关的数据,如fasta、genbank格式的核算和蛋白质序列、pathway等数据,理解其重要的生物学意义。
实验内容:1.浏览和搜索至少10个国外和至少5个国内生物信息学相关网站,并描述网站特征;2.下载各网站的代表性数据各10条(组)以上,并说明其生物学意义;3.讨论各网站适合做何种生物信息学研究的平台,并设计一个研究设想。
实验报告:1.各网站网址及特征描述;2.代表性数据的下载和生物学意义的描述;3.讨论:这些生物信息学相关网站的信息资源,可以被那些生物信息学研究所利用。
参考书目:《生物信息学概论》罗静初等译,北京大学出版社,2002;《生物信息学手册》郝柏林等著,上海科技出版社,2004;《生物信息学实验指导》胡松年等著,浙江大学出版社,2003。
实验二利用BLAST进行序列比对实验目的:了解BLAST及其子程序的原理和基本参数,熟练地应用网络平台和Linux计算平台进行本地BLAST序列比对,熟悉BLAST结果的格式和内容并能描述其主要意义,同时比较网上平台和本地平台的优缺点。
实验原理:利用实验一下载的核算和蛋白质序列,提交到NCBI或者其他拥有BLAST运算平台的网页上,观察其基本参数设定库文件类型,并得到计算结果;同时在本地服务器上学会用formatdb格式化库文件,并输入BLAST命令进行计算,获得结果文件。
实验内容:1.向网上BLAST服务器提交序列,得到匹配结果;2.本地使用BLAST,格式化库文件,输入命令行得到匹配结果;3.对结果文件进行简要描述,阐述生物学意义。
实验报告:1.阐述BLAST原理和比对步骤;2.不同类型BLAST的结果及其说明;3.讨论:不同平台运行BLAST的需求比较。
参考书目:《生物信息学概论》罗静初等译,北京大学出版社,2002;《生物信息学实验指导》胡松年等著,浙江大学出版社,2003。
实验三利用ClustalX(W)进行多序列联配实验目的:掌握用Clustal X(W)工具及其基本参数,对具有一定同源性和相似性的核酸与蛋白质序列进行联配和聚类分析,由此对这些物种的亲缘关系进行判断,并且对这些序列在分子进化过程中的保守性做出估计。
实验原理:首先对于输入的每一条序列,两两之间进行联配,总共进行n*(n-1)/2次联配,这一步通过一种快速的近似算法实现,其得分用来计算指导树,系统树图能用于指导后面进行的多序列联配的过程。
系统树图是通过UPGMA方法计算的。
在系统树图绘制完以后,输入的所有序列按照得分高低被分成n-1个组,然后再对组与组之间进行联配,这一步用Myers和Miller算法实现。
实验内容:1.明确软件所支持的输入文件格式,搜集整理出合适的数据;2.在Windows环境运行Clustal X,在Linux环境运行Clustal W;3.实验结果及分析,用TREEV32或Njplotwin95生成NJ聚类图。
实验报告:1.整理好的符合Clustal的序列数据;2.提交数据网页记录和各步骤记录;3.提供聚类图和多序列联配图,并说明意义。
参考书目:《生物信息学概论》罗静初等译,北京大学出版社,2002;《生物信息学实验指导》胡松年等著,浙江大学出版社,2003。
实验四 ESTS分析实验目的:熟悉使用一系列生物信息学分析工具对测序得到ESTs序列数据进行聚类处理,由此对获得表达基因的丰度等相关信息,并且对这些表达基因进行功能的初步诠释,为后续实验通过设计RACE引物获得全长基因,以及进一步的功能注释和代谢途径分析做好准备。
实验原理:首先用crossmatch程序去除ESTs原始序列中的载体成分和引物成分,然后用phrap生成congtig和singlet,用blast程序进一步将有同源性的contig和singlet进行功能聚类,最后通过blast对聚类获得的cluster进行功能注释。
在实验过程中将用到一些本实验室写好的perl程序用于连接各数据库和工具软件。
实验内容:1.运行CodonCode Aligner程序,并用它建立工程文件,导入例子文件夹里面的数据;练习对序列的各种查看方式。
2.使用CodonCode Aligner程序里的Clip Ends, Trim Vector, Assemble等功能,完成序列的剪切、去杂质、组装工作。
实验报告:1.实验各步骤记录和中间结果文件;2.举例简要说明结果文件中数据的生物学意义。
参考书目:《生物信息学概论》罗静初等译,北京大学出版社,2002;《基因表达序列标签(EST)数据分析手册》胡松年等著,浙江大学出版社,2005。
实验五利用Primer Premier5.0设计RACE引物实验目的:熟悉PCR引物设计工具Primer Premier5.0的一些基本功能,能够根据实验需要选择相应的引物设计方法设计PCR引物。
实验原理:PCR实验是当代分子生物学的基本实验之一,由于目标序列和实验目的的不同,相应设计引物的要求也不一样。
本实验延续ESTs分析结果,对于其中需要获得全长的基因进行RACE引物的设计,及5’和3’RACE引物,配合接头序列设计单向引物,并模拟练习通过连接获得全长的基因CDS序列。
最后设计已知全长基因序列的PCR扩增引物。
实验内容:1.从网站下载并安装Primer Premier5.0;2.从 GenBank 中任意获取一个 DNA 序列,设计出该序列的合适引物;实验报告:1.实验各步骤使用的数据、运算平台、结果文件记录;2.比较不同引物设计平台和不同PCR实验的差别;参考书目:《生物信息学概论》罗静初等译,北京大学出版社,2002;《生物信息学实验指导》胡松年等著,浙江大学出版社,2003。
实验八 perl程序的安装、编写、调试实验目的:培养学生能在windows和Linux两种平台安装perl解释器、编写perl程序以及debug和运行的能力,熟悉perl语言基本语法,学会熟练编写和运用perl程序进行基础生物信息学研究。
实验原理:Perl语言是一门通用的脚本语言,具有强大的字符串处理功能,是生物信息学研究的强大帮手,学会了perl语言,就能方便地处理生物信息学研究中遇到的各种字符串文本,促进研究的快速进行。
实验内容:1.下载perl程序在Windows和Linux下的安装包并进行安装;2.编写简单的perl程序,并学会debug;3.编写具有简单功能的碱基处理perl程序。
实验报告:1.perl解释器安装方法;2.perl解释器debug方法;3.讨论:perl语言在生物信息学研究中所起到的积极作用。
参考书目:《PERL 编程24学时教程》(美)皮尔斯著王建华等译,机械工业出版社,2000;《生物信息学手册》郝柏林等著,上海科技出版社,2004;《生物信息学实验指导》胡松年等著,浙江大学出版社,2003第三篇:生物信息学浅谈对生物信息学的认识摘要生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学, 是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。
经过一学期的学习,我学到了很多很有用的知识,给我印象最深的有序列比对、蛋白质结构分析、核酸序列分析、数据库及数据库检索等内容。
关键字:生物信息学认识基因组学数据库时光飞逝,一学期马上就要结束了,本学期的专业选修课也即将结束。
在上课之前,我一直认为生物信息学就是在讲关于人类及动物的基因,以及基因之间的差别。
但是,刚上了几节课,我就发现生物信息学根本不是我想象的那么简单,就这样我怀着对自己的怀疑和对这门课的好奇走进了这门课。
生物信息学是一门新兴的、正在迅速发展的交叉学科,美国国家基因组研究中心认为, 生物信息学是一个代表生物学、数学和计算机的综合力量的新兴学(Bioinformatics is an emerging scientific discipline representing the combined power of biology,mathematics, and computers)。