当前位置:文档之家› 生物信息 名词解释

生物信息 名词解释

生物信息 名词解释
生物信息 名词解释

逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。

全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装。

单核苷酸多态性(SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。

遗传图谱又称连锁图谱,它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。

物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。

转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。

比较基因组学:全基因组核苷酸序列的整体比较的研究。特点是在整个基因组的层次上比较基因组的大小及基因数目、位置、顺序、特定基因的缺失等。

环境基因组学:研究基因多态性与环境之间的关系,建立环境反应基因多态性的目录,确定引起人类疾病的环境因素的科学。

宏基因组是特定环境全部生物遗传物质总和,决定生物群体生命现象。

转录组即一个活细胞所能转录出来的所有mRNA。研究转录组的一个重要方法就是利用DNA芯片技术检测有机体基因组中基因的表达。而研究生物细胞中转录组的发生和变化规律的科学就称为转录组学。

蛋白质组学:研究不同时相细胞内蛋白质的变化,揭示正常和疾病状态下,蛋白质表达的规律,从而研究疾病发生机理并发现新药。

蛋白组:基因组表达的全部蛋白质,是一个动态的概念,指的是某种细胞或组织中,基因组表达的所有蛋白质。

代谢组是指是指某个时间点上一个细胞所有代谢物的集合,尤其指在不同代谢过程中充当底物和产物的小分子物质,如脂质,糖,氨基酸等,可以揭示取样时该细胞的生理状态。代谢物行为更密切地反映出细胞所处的环境,该环境依赖于细胞所摄取的营养状况,所接触的药物和污染物以及其它影响细胞健康的外在因子情况。

代谢物组学是在后基因组学时代兴起的一门跨领域学科,其主要目标是定量的研究生命体对外界刺激、病理生理变化、以及本身基因突变而产生的其体内代谢物水平的多元动态反应。代谢组学通过现代化学的仪器分析技术测机体整个代谢产物谱的变化,并通过多元统计分析方法研究整体的生物学功能状况。

一个细胞内,基因、RNA、代谢物与蛋白质之间存在着大量的相互作用,构成细胞的相互作用组,及信号转导网络或调控网络。这些令人无法想象的复杂图谱,用系统生物学的术语来描述就是相互作用组学。

蛋白质相互作用组学研究的重要方法:酵母双杂交、噬茵体展示技术、等离子共振技术、荧光能量转移技术、蛋白质阵列技术、免疫共沉淀技术、pull-down技术等。

结构基因组学主要目的是试图在生物体的整体水平上(如全基因组、全细胞或完整的生物体)测定出(以实验为主、包括理论预测)全部蛋白质分子、蛋白质-蛋白质、蛋白质-核酸、蛋白质-多糖、蛋白质-蛋白质-核酸-多糖、蛋白质与其他生物分子复合体的精细三维结构,以获得一幅完整的、能够在细胞中定位以及在各种生物学代谢途径、生理途径、

信号传导途径中全部蛋白质在原子水平的三维结构全息图。

生物信息学的主要研究内容:生物学数据的收集、存储、管理与提供,基因组序列信息的提取和分析,功能基因组相关信息分析,生物大分子结构模拟和药物设计,生物信息分析的技术与方法研究,应用与发展研究。

计算生物学/生物信息学的主要理论方法:基于数据挖掘(知识发现)的方法,基于模拟分析的方法。

系统生物学是一个试图整合不同层次信息以理解生物系统如何行使功能的学术领域。通过研究某生物系统各不同部分之间的相互关系和相互作用(例如,与细胞信号传导,代谢通路,细胞器,细胞,生理系统与生物等相关的基因和蛋白网络),系统生物学期望最终能够建立整个系统的可理解模型。

合成生物学是一门建立在系统生物学、生物信息学等学科基础之上,并以基因组技术为核心的现代生物科学。

生物信息学常用方法:Database Search,Multiple Sequence Alignment,Algorithms。

生物学数据库应满足5个方面的主要需求(1)时间性(2)注释(3)支撑数据(4)数据质量(5)集成性

生物学数据库几个明显的特征:(1)数据库的更新速度不断加快,数据量呈指数增长趋势(2)数据库使用频率增长更快(3)数据库的复杂程度不断增加(4)数据库网络化(5)面向应用(6)先进的软硬件配置。

一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释。

二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的二次数据库。

分子生物信息数据库,归纳起来,大体可以分为4个大类,即基因组数据库、核酸和蛋白质一级结构数据库、生物大分子(主要是蛋白质)三维空间结构数据库,以及由上述3类数据库和文献资料为基础构建的二次数据库。

基因组数据库来自基因组作图,序列数据库来自序列测定,结构数据库来自X射线衍射和核磁共振等结构测定。这些数据库是分子生物学的基本数据资源,通常称为基本数据库、初始数据库,也称一次数据库。

序列数据库是分子生物信息数据库中最基本的数据库,包括核酸和蛋白质两类,以核苷酸碱基顺序或氨基酸残基顺序为基本内容,并附有注释信息。

国际著名的生物信息中心

NCBI National Center for Biotechnology Information (US)

EBI European Bioinformatics Institute (EU)

HGMP Human Genome Mapping Project Resource Centre (UK)

ExPASy Expert of Protein Analysis System (Switzerland )

国际上“权威”的核酸序列数据库:欧洲分子生物学实验室的EMBL ,美国生物技术信息中心的GenBank ,日本遗传研究所的DDBJ。三个数据库中的数据基本一致,仅在数据格式上有所差别,对于特定的查询,三个数据库的响应结果一样。这三个数据库是综合性的DNA和RNA序列数据库,每条记录代表一个单独、连续、附有注释的DNA或RNA片段。

蛋白质序列数据库:SWISS-PROT(欧洲),PIR(美国)

蛋白质结构数据库:PDB(protein data bank),美国,目前最主要的蛋白质分子结构数据库

蛋白质结构分类数据库:SCOP (Structural Classification of Proteins),英国医学研究委员会分子生物学实验室和蛋白质工程中心,CA TH( Class, Architecture, Topology, Homology)

英国伦敦大学

基因组信息二级数据库:TransFac(真核生物基因转录调控因子数据库),德国

蛋白质序列二级数据库:Prosite(蛋白质序列功能位点数据库),瑞典

蛋白质二级结构数据库:DSSP (Definition of Secondary Structure of Proteins)蛋白质二级结构构象参数数据库,FSSP (Families of Structural Similar Proteins) 蛋白质家族数据库,HSSP(Homology Derived Secondary Structure of Proteins) 同源蛋白质数据库酶的分类数据库Enzyme

不同数据库的序列格式:1 GenBank中DNA序列格式,2 EMBL序列格式,3 SwissProt 序列格式,4 FASTA序列格式,5 NBRF序列格式,6 Intelligenetics序列格式,7 GCG序列格式,8 PIR/CODATA序列格式,9 Plain/ASCII.Staden序列格式,10 ASN.1序列格式,11 GDE 格式。

冗余数据至少可能导致以下3个潜在的错误:如果一组DNA或氨基酸序列包含了大量非常相关序列族,则相应的统计分析将偏向这些族,在分析结果中,这些族的特性被夸大;序列间不同部分的显著相关可能是在数据样本抽样时是有偏的和不正确的;如果这些数据是被用于预测,则这些序列将使预测方法—如人工智能方法—发生偏离。

序列数据的偏差或人为假象主要来自实验过程,这与其它科学数据的情况相同。这些人为假象主要来自以下几个方面:载体序列污染:在测序列等实验过程中,载体序列可能造成污染,致使序列记录数据中包含了载体序列;异源序列污染:有研究表明一些人类cDNA 测序结果在实验过程中被酵母和细菌序列污染;序列的重排和缺失;重复因子污染:cDNA 克隆方法有时会受到逆转录因子(如Alus)的影响;测序误差和自然多态性:测序过程存在一定的误差概率。解决方法:选择合适的数据库;一个聪明的略策是用可能污染数据记录的序列(如载体)去估计误差程度;一些去除污染的专门软件系统已被研制出来,如EBI网站便提供了去除载体污染的在线服务。

BLAST是由美国国立生物技术信息中心(NCBI)开发的一个基于序列相似性的数据库搜索程序。BLAST是“局部相似性基本查询工具”(Basic Local Alignment Search Tool)的缩写。

一个序列模体是一段局部保守的区域或由一组序列共有的短的序列模式。

模体指用于预测分子功能、结构特征或家族关系的模式。

3 main methods of alignment:Automatic,Manual,Combined。

状态空间搜索,就是将问题求解过程表现为从初始状态到目标状态寻找这个路径的过程。

常用的状态空间搜索有深度优先和广度优先。广度优先是从初始状态一层一层向下找,直到找到目标为止。深度优先是按照一定的顺序前查找完一个分支,再查找另一个分支,以至找到目标为止。

系统发生学:(Phylogenetic systematics系统分类学、cladistics遗传分类学) 是基于生物进化史的生物分类方法。

系统发生树构建步骤:(1)序列比对(2)确定替换模型(3)构建系统发生树(4)评价所建立的树。

名词解释:

基序:英文motif的缩写。也翻译为“模序”,“模体”,DNA,蛋白质等生物大分子中的保守序列。

数据库:数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务;数据的存储独立于使用它的程序;对数据库插入新数据,修改

和检索原有数据均能按一种公用的和可控制的方式进行。当某个系统中存在结构上完全分开的若干个数据库时,则该系统包含一个“数据库集合”。

Entrez:美国国家生物技术信息中心所提供的在线资源检索器。该资源将GenBank序列与其原始文献出处链接在一起。Entrez 是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。Entrez中的数据库包括:Entrez 中核酸数据库为:GenBank, EMBL, DDBJ 蛋白质数据库为:Swiss-Prot, PIR, PFR, PDB ORF:开放阅读框(ORF)是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。编码一个蛋白质的外显子连接成为一个连续的ORF。当一个新基因被识别,其DNA序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。这是因为在没有其它信息的前提下,DNA序列可以按六种框架阅读和翻译(每条链三种,对应三种不同的起始密码子)。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA 序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。

BLAST:BLAST (Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。BLAST的功能:BLAST对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。BLAST还能发现具有缺口的能比对上的序列。

基因组注释:基因组注释(Genome annotation) 是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。

基因家族;同一物种中结构与功能相似,进化起源上密切相关的一组基因。

什么是生物信息学?研究的内容包括哪几个方面?

生物信息学:为拓展生物学、医学、行为学和卫生学数据的用途,而进行有关计算机方法手段的研究、开发与应用,包括此类数据的采集、存贮、整理、归档、分析与可视化。

主要包括:生物学数据的收集、存储、管理与提供

基因组序列信息的提取和分析

功能基因组相关信息分析

生物大分子结构模拟和药物设计

生物信息分析的技术与方法研究

应用与发展研究

非编码RNA: 迄今为止,细胞中的rRNA、tRNA、snRNA(小核RNA)、asRNA(反义RNA)、snoRNA(核仁小分子RNA)、miRNA、piRNA都是非编码“垃圾”DNA合成的。它们参与到基因活化、基因沉默、基因印记、剂量补偿、蛋白合成与功能调节、代谢调控等众多生物学过程中。

生物信息-名词解释

逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。 全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装。 单核苷酸多态性(SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。 遗传图谱又称连锁图谱,它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。 物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。 转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。 比较基因组学:全基因组核苷酸序列的整体比较的研究。特点是在整个基因组的层次上比较基因组的大小及基因数目、位置、顺序、特定基因的缺失等。 环境基因组学:研究基因多态性与环境之间的关系,建立环境反应基因多态性的目录,确定引起人类疾病的环境因素的科学。 宏基因组是特定环境全部生物遗传物质总和,决定生物群体生命现象。 转录组即一个活细胞所能转录出来的所有mRNA。研究转录组的一个重要方法就是利用DNA芯片技术检测有机体基因组中基因的表达。而研究生物细胞中转录组的发生和变化规律的科学就称为转录组学。 蛋白质组学:研究不同时相细胞内蛋白质的变化,揭示正常和疾病状态下,蛋白质表达的规律,从而研究疾病发生机理并发现新药。 蛋白组:基因组表达的全部蛋白质,是一个动态的概念,指的是某种细胞或组织中,基因组表达的所有蛋白质。 代谢组是指是指某个时间点上一个细胞所有代谢物的集合,尤其指在不同代谢过程中充当底物和产物的小分子物质,如脂质,糖,氨基酸等,可以揭示取样时该细胞的生理状态。代谢物行为更密切地反映出细胞所处的环境,该环境依赖于细胞所摄取的营养状况,所接触的药物和污染物以及其它影响细胞健康的外在因子情况。 代谢物组学是在后基因组学时代兴起的一门跨领域学科,其主要目标是定量的研究生命体对外界刺激、病理生理变化、以及本身基因突变而产生的其体内代谢物水平的多元动态反应。代谢组学通过现代化学的仪器分析技术测机体整个代谢产物谱的变化,并通过多元统计分析方法研究整体的生物学功能状况。 一个细胞内,基因、RNA、代谢物与蛋白质之间存在着大量的相互作用,构成细胞的相互作用组,及信号转导网络或调控网络。这些令人无法想象的复杂图谱,用系统生物学的术语来描述就是相互作用组学。 蛋白质相互作用组学研究的重要方法:酵母双杂交、噬茵体展示技术、等离子共振技术、荧光能量转移技术、蛋白质阵列技术、免疫共沉淀技术、pull-down技术等。 结构基因组学主要目的是试图在生物体的整体水平上(如全基因组、全细胞或完整的生物体)测定出(以实验为主、包括理论预测)全部蛋白质分子、蛋白质-蛋白质、蛋白质-核酸、蛋白质-多糖、蛋白质-蛋白质-核酸-多糖、蛋白质与其他生物分子复合体的精细三维结构,以获得一幅完整的、能够在细胞中定位以及在各种生物学代谢途径、生理途径、

淘宝常用专业术语、名词解释

淘宝常用专业术语、名词解释 【基础统计类】 1、浏览量(PV):店铺各页面被查看的次数。用户多次打开或刷新同一个页面,该指标值累加。 2、访客数(UV):全店各页面的访问人数。所选时间段内,同一访客多次访问会进行去重计算。 3、收藏量:用户访问店铺页面过程中,添加收藏的总次数(包括首页、分类页和宝贝页的收藏次数)。 4、浏览回头客:指前6天内访问过店铺当日又来访问的用户数,所选时间段内会进行去重计算。 5、浏览回头率:浏览回头客占店铺总访客数的百分比。 6、平均访问深度:访问深度,是指用户一次连续访问的店铺页面数(即每次会话浏览的页面数),平均访问深度即用户平均每次连续访问浏览的店铺页面数。【月报-店铺经营概况】中,该指标是所选月份日数据的平均值。 7、跳失率:表示顾客通过相应入口进入,只访问了一个页面就离开的访问次数占该入口总访问次数的比例。 8、人均店内停留时间(秒):所有访客的访问过程中,平均每次连续访问店铺的停留时间。 9、宝贝页浏览量:店铺宝贝页面被查看的次数,用户每打开或刷新一个宝贝页面,该指标就会增加。 10、宝贝页访客数:店铺宝贝页面的访问人数。所选时间段内,同一访客多次访问会进行去重计算。 11、宝贝页收藏量:用户访问宝贝页面添加收藏的总次数。 12、入店页面:单个用户每次浏览您的店铺时查看的第一个页面为入店页面。 13、出店页面:单个用户每次浏览您店铺时所查看的最后一个页面为出店页面。 14、入店人次:指从该页面进入店铺的人次。 15、出店人次:指从该页面离开店铺的人次。 16、进店时间:用户打开该页面的时间点,如果用户刷新页面,也会记录下来。 17、停留时间:用户打开本店最后一个页面的时间点减去打开本店第一个页面的时间点(只访问一页的顾客停留时间暂无法获取,这种情况不统计在内,显示为“—”)。 18、到达页浏览量:到达店铺的入口页面的浏览量。 19、平均访问时间:打开该宝贝页面到打开下一个宝贝页面的平均时间间隔。(用户访问该宝贝页后,未点击该页其他链接的情况不统计在内,显示为“—”) 20、全店宝贝查看总人次:指全部宝贝的查看人次之和。 21、搜索次数:在店内搜索关键词或价格区间的次数。

生物名词解释整理

1. 双名法:每种生物的学名采用属名和种名命名 2. 蛋白质的四级结构、多肽:在含有两条或多条多肽链的蛋白质中,各条多肽链因其排列顺序而彼此关联。 多个氨基酸以肽键链接起来形成的就是多肽 3. 胞间连丝:植物细胞壁上有孔,相邻细胞的细胞膜伸入孔中,光面内质网也彼此相通,即成胞间连丝。可以沟通相邻细胞。 4. 叶绿体基粒内囊体:叶绿体内有一系列排列整齐的扁平囊,这些扁平囊称为类囊体。有规律地重叠在一起的,是基粒类囊体。基粒类囊体堆叠成基粒。 5. 开放维管束:指双子叶植物和裸子植物茎的维管束,在韧皮部和木质部之间有束内形成层,维管束之间存在束间形成层,形成层连接成圆环状,能不断增生,使茎增粗,所以称为开放维管束 6. 微体:一种特殊的细胞器。体积比溶酶体小,由单层膜包围,其内含有极细的颗粒状物质,中央常有一高电子密度的核心结晶。 7. 五界分类系统:即将生物分为:原核生物界,原生生物界,植物界,真菌界,动物界 8. 生物膜:围绕在细胞表面的质膜,各种细胞器的膜和核膜总称为生物膜系统 9. 氧化磷酸化:由呼吸底物脱下的氢,通过呼吸链电子传递到达氧,所发生的ADP磷酸化行程ATP的作用,成为氧化磷酸化作用。 10. 辅酶:结合蛋白酶类分子由蛋白质部分和非蛋白质部分组成,非蛋白质部分(有机分子或金属离子)称酶的辅基(即辅酶)。 11. 系统发育:指生物种族发展史,也即生物进化的历史。 12. 遗传学第三定律:即基因的连锁和交换定律。 原来为同一亲本所具有的两个性状,在F2中常常有连系在一起遗传的倾向,这种现象称为连锁。减数分裂中,同源染色体的非姐妹染色单体之间会发生交换而导致基因的交换现象。 13. 同源染色体:体细胞中,成对染色体的两个成员,它们的形态和结构是相同的,在减数分裂中能相互配对,这样的一对染色体称为同源染色体。 14. 细胞周期:亲代细胞分裂完成到子代细胞分裂结束所经历的一个完整细胞世代称为细胞周期 15. 输导组织:植物体内运输水分和各种营养物质的组织。 16. 维管形成层:裸子植物和双子叶植物的根茎中,位于木质部和韧皮部之间的分生组织,可以不断产生次生木质部和次生韧皮部 17. 病毒:由一个核酸分子(DNA或RNA)与蛋白质构成或仅由蛋白质构成的非细胞形态的靠寄生生活的生命体。 18. 共质体途径和质外体途径:水、无机离子(小分子)和大分子穿过生活细胞的胞间连丝,顺离子浓度梯度进行的运输途径是共质体途径。 水液(大分子)在相邻细胞的细胞壁和细胞间隙中运行是质外体途径。 19. 孢子生殖:是由母体先形成专管生殖的特定部分,然后由孢子囊产生许多孢子的生殖方式。孢子囊成熟时孢子三处,遇到适宜条件就萌发成新个体 20. 双受精现象:被子植物中,两个精子分别与卵细胞和极核融合的现象 21. 生活史:被子植物的生活史指包括无性世代(植物体以产生孢子进行生殖)和有性世代(以产生配子进行生殖) 22. 重组率:杂合体产生重组型配子的频率,也即重组型配子数占配子总数的百分率 23. 噬藻体:侵染蓝藻的病毒(不确定) 24. 菌根:指土壤中某些真菌与植物根的共生体(不确定)

生物信息学复习题及答案

生物信息学复习题 名词解释 1. Homology (同源):来源于共同祖先的序列相似的序列及同源序列。序列相似序列并不一定是同源序列。 (直系同源):指由于物种形成的特殊事件来自一个共同祖先的不同物种中的同源序列,它们具有相似的功能。 (旁系(并系)同源):指同一个物种中具有共同祖先,通过基因复制产生的一组基因,这些基因在功能上的可能发生了改变。基因复制事件是促进新基因进化的重要推动力。 (异同源):通过横向转移,来源于共生或病毒侵染而产生的相似的序列,为异同源。 Score:The sum of the number of identical matches and conservative (high scoring) substitutions in a sequence alignment divided by the total number of aligned sequence characters. Gap总是不计入总数中。 6.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 7. E值:得分大于等于某个分值S的不同的比对的数目在随机的数据库搜索中发生的可能性。衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义,E值越接近零,越不可能找到其他匹配序列。 值:得分为所要求的分值比对或更好的比对随机发生的概率。它是将观测得到的比对得分S,与同样长度和组成的随机序列作为查询序列进行数据库搜索进行比较得到的HSP(高分片段对)得分的期望分布联系起来计算的。通常使用低于来定义统计的显著性。P=1-e-E 9.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法,是序列相似性分析的基础,其不同的选择将会出现不同的分析结果。 10.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。 :美国国家生物技术信息学中心,属于美国国立医学图书馆的一部分,具有BLAST, Entrez ,GenBank等工具,还具有PubMed文献数据库。另外还具有Genome, dbEST, dbGSS , dbSTS, MMDB, OMIM, UniGene, Taxonomy, RefSeq, etc. 序列格式:是将DNA或者蛋白质序列表示为一个带有大于号(>)开始的核苷酸或者氨基酸序列的新文件,其中大于号后可以跟上序列的相关信息,其他无特殊要求。 13genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释,主要包含生物功能或数据库信息;第三部分是feature,对序列的注释;第四部分是序列本身,以“统发生树(Phylogenetic tree )是研究生物进化和系统发育过程中的一种用树状分支图来概括各种生物之间亲缘关系,是一种亲缘分支分类方法。在树中,每个节点代表其各分支的最近共同祖先,而节点间的线段长度对应演化距离(如估计的演化时间)。是用来研究物种进化与多样性的基础,是相近物种相关生物学数据的来源。17.基因树与物种树:物种树反映一组物种进化历程的系统树,其中每一个内部节点就代表一个物种形成的过程,而基因树则是代表来源于不同物种的单个同源基因的差异构建的系统树,而其内部的一个节点则代表一个祖先基因分化为两个新的独特的基因序列的事件。基因

职业卫生常见专业术语名词解释

职业卫生常见专业术语名词解释 职业卫生(Occupational health) 是研究劳动条件对劳动者健康的影响,以劳动者的健康在职业活动过程中免受有害因素侵害为目的的工作领域,研究改善劳动条件的一门学科,其首要的任务是识别、评价和控制不良的劳动条件,以及在法律、技术、设备、组织制度和教育等方面采取相应措施以保护劳动者的健康。 职业病(Occupational diseases)是指职工因受职业性有害因素的影响而引起的,由国家以法律法规形式规定并经国家指定的医疗机构确诊的疾病。 职业禁忌证(Occupational contraindication)是指某些疾病(或某种生理缺陷),其患者如从事某种职业,便会因职业性危害因素而使病情加重或易于发生事故,则称此疾病(或生理缺陷)为该职业的职业禁忌证。 急性中毒(acute poisoning)是指职工在短时间内摄入大量有毒物质,发病急,病情变化快,致使暂时或永久丧失工作能力或死亡的事件。 有害物质(harmful substances)化学的、物理的、生物的等能危害职工健康的所有物质的总称。 有毒物质(toxic substances)作用于生物体,能使机体发生暂时或永久性病变,导致疾病甚至死亡的物质。

危害因素(hazardous factors)能对人造成伤亡或对物造成突发性损坏的因素。 有尘作业(dusty work)作业场所空气中粉尘含量超过国家卫生标准中粉尘的最高容许浓度的作业。 有毒作业(toxic work)作业场所空气中有毒物质含量超过国家标准中有毒物质的最高容许浓度的作业。 职业接触限值:(OELs)指职业性有害因素的接触限量标准、指劳动者在职业活动过程中,长期反复接触,对机体不引起急性或慢性有害健康影响的容许接触水平。 最高容许浓度(MAC):指任何有代表性的采样测定均不得超过的浓度。 时间加权平均阈限值(TLV—TWA):指正常8小时工作日的时间加权平均浓度。 短时间接触限值(TLV—STEL):这是在不超过TWA的情况下,指每次接触时间不得超过15分钟的时间加权平均浓度。此浓度指在8小时内任何时间均不得超过的浓度。

生物学名词解释大全

生物学名词解释大全(中英) sample 样本:提供群体信息的亚单位,样本要求大小合适,并随机取样才具有代表性。 sampling error 样本误差:在一个小样本中预期的比例会发生随机改变的现象。 satellite DNA卫星DNA:真核生物基因组中的一种高度重复顺序,富含A-T ,当进行CsCl密度梯度离心时,基因组呈现一条宽的带,而在其上方高度重复顺序显示了单独的一条细带,故称卫星DNA。 scaffold attachmentation region (SARs) :骨架附着区:DNA上的特异位置,附着在染色体的骨架上。 secondary law 第二定律:见自由组合定律(independent assortment)。 secondary nondisjunction 次极不分离:初极不分离产生的雌性后代中X染色体再度不分离。 second-site mutation 第二位点突变:见抑制基因突变(suppressor mutation)。 selection coefficient 选择系数:计算对一种基因型的选择相对强度。 selection differential 选择差数:在自然和人工选择中,被选择亲代的表型平均值和未被选择的群体平均表型之间的差异。 self-assembly 自组装、自动装配:由亚基按特定的模式自动聚集成某种功能结构的过程。 self-fertilization (selfing) 自体受精:同一个体产生的雌性和雄性配子相互结合。 self-splicing 自我剪接:某些前体RNA分子内含子的切除,此过程在有的生物中是蛋白依赖性反应。 semiconservative replication mode 半保留复制模型:在DNA复制两条子DNA链中,每条双链都含有一条亲代的单链。 semidiscontinuous 半不连续(复制):DNA复制时前导链上DNA的合成是连续的,后随链上是不连续的,故称半不连续复制。 sense codon 有义密码子:mRNA上相对一个氨基酸的密码子。 Sequence Tagged Site, (STS)序列位置标签:一段短的DNA序列(200-500个碱基对),这种序列在染色体上只出现一次,其位置和碱基顺序都是已知的。在PCR反应中可以检测处STS来,STS适宜于作为人类基因组的一种地标,据此可以判定DNA的方向和特定序列的相对位置。ETS是cDNA上的STS。 sex chromosome 性染色体:在真核生物中和性别相关的染色体,如X, Y和Z,W。这些

生物信息学名词解释资料

1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。 2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。 3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。 5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI 的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。 6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。P94 7.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。P98 8.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29 10.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影 响,序列中的空位的引入不代表真正的进化事件,所以要对其进行 罚分,空位罚分的多少直接影响对比的结果。P37 11.E值:衡量序列之间相似性是否显著的期望值。E值大小说明了 可以找到与查询序列(query)相匹配的随机或无关序列的概率,E 值越接近零,越不可能找到其他匹配序列,E值越小意味着序列的 相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意 义。P95 12.低复杂度区域:BLAST搜索的过滤选项。指序列中包含的重复 度高的区域,如poly(A)。 13.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列, Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y) 加点,如果两条序列完全相同则会形成一条主对角线,如果两条序 列相似则会出现一条或者几条直线;如果完全没有相似性则不能连 成直线。 14.多序列比对:通过序列的相似性检索得到许多相似性序列,将这 些序列做一个总体的比对,以观察它们在结构上的异同,来回答大 量的生物学问题。 15.分子钟:认为分子进化速率是恒定的或者几乎恒定的假说,从而 可以通过分子进化推断出物种起源的时间。 16.系统发育分析:通过一组相关的基因或者蛋白质的多序列比对或 其他性状,可以研究推断不同物种或基因之间的进化关系。 17.进化树的二歧分叉结构:指在进化树上任何一个分支节点,一个 父分支都只能被分成两个子分支。 系统发育图:用枝长表示进化时间的系统树称为系统发育图,是 引入时间概念的支序图。 18.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中 的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制 证据的情况下,具有共同祖先和相同功能的同源基因。) 19.旁系(并系)同源:指同一个物种中具有共同祖先,通过基因重 复产生的一组基因,这些基因在功能上可能发生了改变。(书:由于 基因重复事件产生的相似序列。) 20.外类群:是进化树中处于一组被分析物种之外的,具有相近亲缘 关系的物种。 21.有根树:能够确定所有分析物种的共同祖先的进化树。 22.除权配对算法(UPGMA):最初,每个序列归为一类,然后找 到距离最近的两类将其归为一类,定义为一个节点,重复这个过程, 直到所有的聚类被加入,最终产生树根。 23.邻接法(neighbor-joining method):是一种不仅仅计算两两比 对距离,还对整个树的长度进行最小化,从而对树的拓扑结构进行 限制,能够克服UPGMA算法要求进化速率保持恒定的缺陷。 24.最大简约法(MP):在一系列能够解释序列差异的的进化树中 找到具有最少核酸或氨基酸替换的进化树。 25.最大似然法(ML):它对每个可能的进化位点分配一个概率, 然后综合所有位点,找到概率最大的进化树。最大似然法允许采用 不同的进化模型对变异进行分析评估,并在此基础上构建系统发育 树。 26.一致树(consensus tree):在同一算法中产生多个最优树,合并 这些最优树得到的树即一致树。 27.自举法检验(Bootstrap):放回式抽样统计法。通过对数据集多 次重复取样,构建多个进化树,用来检查给定树的分枝可信度。 精品文档

房地产专业术语(名词解释)

十一、房地产专业术语 1、问:什么是商品房? 答:是指在市场经济条件下,通过出让方式取得土地使用权后开发建设的房屋,均按市场价出售。商品房根据其销售对象的不同,可以分为外 销商品房和内销商品房两种。 2、问:什么是外销房? 答:外销商品房是由房地产开发企业建设的,取得了外销商品房预(销)售许可证的房屋,外销商品房可以出售给国内外(含港、澳、台)的 企业,其他组织和个人。 3、问:什么是内销房? 答:内销商品房是由房地产开发企业建设的,取得了商品房销售许可证的房屋,内销商品房可以出售给当地企事业单位和居民。 4、问:什么是复式住宅? 答:复式住宅是受跃层式住宅启发而创造设计的一种经济型住宅。这类住宅在建造上仍每户占有上下两层,实际是在层高较高的一层楼中增建 一个1.2米的夹层,两层合计的层高要大大低于跃层式住宅(复式为 3.3米,而一般跃层为5.6米),复式住宅的下层供起居用,炊事、进 餐、洗浴等,上层供休息睡眠和贮藏用,户内设多处入墙式壁柜和楼 梯,中间楼板也即上层的地板。因此复式住宅具备了省地、省工、省 料又实用的特点,特别适合子三代、四代同堂的大家庭居住,既满足 了隔代人的相对独立,又达到了相互照应的目的。 5、问:什么是跃层式住宅? 答:跃层式住宅是近年来推广的一种新颖住宅建筑形式。这类住宅的特点是,内部空间借鉴了欧美小二楼独院住宅的设计手法,住宅占有上下 两层楼面,卧室、起居室、客厅、卫生间、厨房及其它辅助用房可以 分层布置,上下层之间的交通不通过公共楼梯而采用户内独用小楼梯 联接。跃层式住宅的优点是每户都有二层或二层合一的采光面,即使 朝向不好,也可通过增大采光面积弥补,通风较好,户内居住面积和 辅助面积较大,布局紧凑,功能明确,相互干扰较小。

高中生物名词解释

绪论 1、应激性:任何生物体对外界的刺激都能发生一定的反应。趋向有利刺激,逃避不利刺激。 2、反射:人和动物在神经系统的参与下,对体和外界环境的各种刺激所发生的规律性的反应。 细胞的化学成分 3、原生质:是细胞的生命物质。它的主要成分是蛋白质、脂类和核酸。细胞是由原生质构成的。构成细胞的这一小团原生质又分化为细胞膜、细胞质和细胞核等部分。 4、结合水:水在细胞中以两种形式存在。一部分与细胞的其他物质结合,叫结合水。结合水是细胞结构的组成成分。 5、自由水:大部分以游离的形式存在,可以自由流动,叫自由水。 6、缩合:氨基酸分子互相结合的方式是:一个氨基酸分子的羧基(—COOH)和另一个氨基酸分子的氨基(—NH2)相连接,同时失去一分子的水,这种结合方式叫缩合。 7、肽键:连接两个氨基酸分子的那个键(—NH—CO—)叫做肽键。 8、二肽:由两个氨基酸分子缩合而成的化合物,叫做二肽。 9、多肽:由多个氨基酸分子缩合而成的含有多个肽键的化合物,叫做多肽。 10、核酸:核酸最初是从细胞核中提取出来的,呈酸性,因此叫做核酸。 11、脱氧核糖核酸:核酸可以分为两大类:一类是含有脱氧核糖的,叫做脱氧核糖核酸,简称DNA. 12、核糖核酸:另一类是含有核糖的,叫做核糖核酸,简称RNA. 细胞的结构和功能 13、显微结构:在普通光学显微镜中能够观察到的细胞结构。 14、亚显微结构:又称超微结构。指在普通光学显微镜下观察不能分辨清楚的细胞各种微细结构。 15、细胞膜:又称原生质膜或质膜,是细胞的原生质体分化形成,并位于其外表面的一层极薄的膜结构。

16、膜蛋白:指细胞各种膜结构中蛋白质成分。 17、载体蛋白:膜结构中与物质运输有关的一种跨膜蛋白质。这种膜运输蛋白质具有专一的结合部位,对所结合的物质具有高度选择性,只能同专一物质结合的特性类似于酶同底物的反应。当某种载体蛋白的外端表面的结合部位与专一性物质结合后,载体蛋白分子就发生构象变化,将该物质分子运转到膜的表面,随之释放到细胞质中。 18、细胞质:在细胞膜以、细胞核以外的原生质,叫做细胞质。在光学显微镜下观察活细胞,可以看到细胞质是透明的胶状物,细胞质主要包括基质和细胞器。 19、细胞质基质:细胞质呈液态的部分是基质。 20、细胞器:细胞质中具有特定功能的各种亚细胞结构的总称。 21、染色质:在细胞核中分布着一些容易被碱性染料染成深色的物质,这些物质是由DNA和蛋白质组成的。在细胞分裂间期,这些物质成为细长的丝,交织成网状,这些丝状物质就是染色质。 22、染色体:在细胞分裂期,细胞核长丝状的染色质高度螺旋化,缩短变粗,就形成了光学显微镜下可以看见的染色体。 细胞分裂 23、细胞周期:连续分裂的细胞,从上一次分裂完成时开始,到下一次分裂完成时为止,这是一个细胞周期。一个细胞周期包括两个阶段:分裂间期和分裂期。 24、分裂间期:从细胞在上一次分裂结束之后到下一次分裂之前,是分裂间期。 25、分裂期:在分裂间期结束之后,就进入分裂期。 新代概述 26、新代:生物体与外界环境之间物质和能量的交换,以及生物体物质和能量的转变过程,叫做新代。 27、同化作用(合成代):在新代过程中,生物体把从外界环境中摄取的营养物质转变成自身的组成物质,并储存能量,这叫做同化作用。 28、异化作用(分解代):生物体把组成自身的一部分物质加以分解,释放出其中的能量,并把代的最终产物排出体外,这叫做异化作用。

生物名词解释

BOD:在特定条件下,水中的有机物和无机物进行生物氧化时所消耗溶解氧的质量浓度。 COD:化学需氧量,是在一定条件下,用一定的强氧化剂处理水样时所消耗的氧化剂的量,以氧的毫克/升表示。DNA复制:首先DNA的双螺旋解开,其次以每条DNA链作为模板,通过碱基配对的原则合成与之互补的一条新链的过程。 DNA聚合酶:以反向平行的DNA链为模板催化合成新链DNA。 EMP途径:又称糖酵解途径,是绝大多数生物所共有的一条代谢途径,它以1分子 葡萄糖为基质,约经过10步反应而产生2分子丙酮酸,2分子NADH+H+和2分子ATP的过程。 氨化作用:是指有机态N被微生物降解形成NH3的过程。 氨化作用:在微生物的作用下,有机氮化合物的脱氨基产氨的过程。 巴氏消毒法:采用60-70℃的温度处理15-30min的消毒方法。 半知菌:对其有性繁殖阶段不了解的一类真菌。 伴孢晶体:伴随芽孢形成的同时,苏云金杆菌细胞的另一端形成的对鳞翅目昆虫有毒性的蛋白质晶体物质。 被动扩散:营养物质依赖其在胞外及胞内的浓度梯度,由浓度高的胞外向胞内扩散的过程。 鞭毛:细菌由细胞膜穿过细胞壁伸出胞外的细长的丝状物。是细胞的运动器官。 表面活性剂:具有降低表面张力效应的物质叫做表面活性剂。它改变细胞的稳定性和透性,使细胞内的物质逸出细胞外,从而引起微生物的死亡。 表面酶:分布于细胞表面,不能在其细胞培养液中起作用的酶。 病毒粒子:成熟的或结构完整的,有感染性的病毒个体。 产甲烷菌:严格厌氧条件下,利用H2还原CO2生成甲烷的细菌。 初生菌丝:由担子菌的孢子萌发形成的菌丝。 初生菌丝体:担子菌的孢子直接萌发而成的菌丝体,一般不会繁殖成为子实体。 纯培养:是指在实验室条件下,从一个微生物细胞繁殖得到的后代。 次级代谢:微生物为了避免初级代谢过程中某种中间产物积累造成的毒害而产生的一类有利于生存的代谢类型。 次生菌丝体:担子菌中由两个性别不同的初生菌丝结合而成的菌丝体。 促进扩散:以细胞内外的浓度梯度为动力,在载体物质参与下,物质从浓度高的胞外向浓度低的胞内扩散。 单纯扩散:微生物吸收营养物质的一种方式。以营养物质在细胞外胞内的浓度梯度为动力进行营养物质的吸收。 对数生长期:细胞代谢活性最强,新细胞物质组成最快,分裂形成的新细胞生命力旺盛,每次分裂的间隔时间(即世代时)最短而稳定,单位时间内细胞数量呈倍比增加。 多污带排污口的下游水色暗灰,含有大量有机物,溶解氧极少环境恶劣生物种类很少以细菌为主。 发酵:微生物或细胞在不需要氧的条件下转化物质的形态并将底物中的化学能转移产生ATP的一种方式。 发酵:有两个含义,广义发酵泛指任何利用好氧或厌氧微生物来生产有用代谢产物或食品、饮料等产品的生产方式。狭义发酵指在无氧条件下,基质脱氢后所产生的还原力[H]未经呼吸链传递而直接交给某内源中间代谢产物,以实现基质水平磷酸化产能的一类生物氧化反应。基质水平磷酸化的特点是基质在氧化过程中脱下的电子不经电子传递链的传递,而是通过酶促反应直接交给基质本身氧化的产物,同时将反应过程中释放的能量交给ADP,合成ATP。此种作用的最终产物是中间体的还原物,不再进行分解,因此,发酵不是彻底的氧化作用,产能效率低。 反硝化细菌:反硝化作用是指微生物还原硝酸产生气态氮的过程。 反硝化作用:微生物还原NO3-产生气态氮的过程称为反硝化作用。 放线菌:介于细菌与丝状真菌之间而又接近于细菌的一类多核单细胞的丝状原核微生物。 分批培养:将少量的细菌接种到一定体积的液体培养基中,在适宜的条件下培养,最后一次性收获的过程。 分生孢子:分生孢子是由菌丝分枝顶端细胞或者由菌丝分化成的分生孢子梗的顶端细胞分割缢缩而成的单个或者成簇的孢子。 分生孢子梗:真菌中一种产生分生孢子的菌丝结构。 辅酶:全酶的一部分,起传递电子、原子、化学基团的作用。 富营养化:由于水体中污染物的积累特别是氮、磷的营养过剩,促使水体中藻类的过量生长。 革兰氏染色:是1884年由丹麦的Gram发明的,细菌鉴别的重要染色方法。通过革兰氏染色法可将细菌区分为G+和G 根际微生物:生长在植物根系直接作用土壤范围内的微生物。 根圈效应:植物根圈土壤的微生物在数量、种类和活性上都明显优于非根圈土壤微生物的现象。

生物信息学名词解释(原创)

名词解释(笔者承认偷了点懒,只是把能在网上找到的都整合在一张上面了,此整理仅适合开卷考试) 基因表达(gene expression):基因通过转录和翻译,产生蛋白质产物和直接转录RNA参与生物功能的过程。 基因调控:涉及基因的启动关闭、活性的增加或减弱,发生在转录阶段、转录后加工阶段和翻译阶段。 负调控(Negative control):阻遏蛋白(repressor protein)结合在受控基因上时不表达,不结合时就表达的形式。 正调控(Positive control):基因表达的活化物( activators )结合在受控基因上时,激活基因表达,不结合时就不表达的形式。 一次数据库:记录实验的结果和一些初步的解释。 二次数据库:对一次数据库的数据进行分析和提炼加工后形成的、便于使用的数据库。 空位罚分 (gap penalty ):序列比对分析时为了反映核酸或氨基酸的插入或缺失等而插入空位并进行罚分,以控制空位插入的合理性。 Consensus sequence:共有序列,指多种原核基因启动序列特定区域内,通常在转录起始点上游-10及-35区域存在一些相似序列。 FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 Similarity相似性:是直接的连续的数量关系,是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比列的高低。 genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。 模体(motif):短的保守的多肽段,含有相同模体的蛋白质不一定是同源的,一般10-20个残基。 查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。 打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。 空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。 PDB:PDB中收录了大量通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子的三维结构,记录有原子坐标、配基的化学结构和晶体结构的描述等。PDB数据库的访问号由一个数字和三个字母组成(如,4HHB),同时支持关键词搜索,还可以FASTA程序进行搜索。 Prosite:是蛋白质家族和结构域数据库,包含具有生物学意义的位点、模式、可帮助识别蛋白质家族的统计特征。 PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;PROSITE还包括根据多序列比对而构建的序列统计特征,能更敏感地发现一个序列是否具有相应的特征。 PIR:是一个集成了关于蛋白质功能预测数据的公共资源的数据库,其目的是支持基因组蛋白质研究。SWLSS—MODE:是目前最著名的蛋白质三级结构预测服务器,建立在已知生物大分子结构基础上,利用同源建模的方法对未知序列的蛋白质三级结构进行预测。 E值:衡量序列之间相似性是否显著的期望值。E值大小说明了可以找到与查询序列(query)相匹配的随机或无关序列的概率,E值越接近零,越不可能找到其他匹配序列,E值越小意味着序列的相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意义。 点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列,Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y)加点,如果两条序列完全相同则会形成一条主对角线,如果两条序列相似则会出现一条或者几条直线;如果完全没有相似性则不能连成直线。 多序列比对:通过序列的相似性检索得到许多相似性序列,将这些序列做一个总体的比对,以观察它们在

(完整版)生物化学名词解释大全

第一章蛋白质 1.两性离子:指在同一氨基酸分子上含有等量的正负两种电荷,又称兼性离子或偶极离子。 2.必需氨基酸:指人体(和其它哺乳动物)自身不能合成,机体又必需,需要从饮食中获得的氨基酸。 3.氨基酸的等电点:指氨基酸的正离子浓度和负离子浓度相等时的pH 值,用符号pI表示。 4.稀有氨基酸:指存在于蛋白质中的20 种常见氨基酸以外的其它罕见氨基酸,它们是正常氨基酸的衍生物。 5.非蛋白质氨基酸:指不存在于蛋白质分子中而以游离状态和结合状态存在于生物体的各种组织和细胞的氨基酸。 6.构型:指在立体异构体中不对称碳原子上相连的各原子或取代基团的空间排布。构型的转变伴随着共价键的断裂和重新形成。 7.蛋白质的一级结构:指蛋白质多肽链中氨基酸的排列顺序,以及二硫键的位置。 8.构象:指有机分子中,不改变共价键结构,仅单键周围的原子旋转所产生的原子的空间排布。一种构象改变为另一种构象时,不涉及共价键的断裂和重新形成。构象改变不会改变分子的光学活性。 9.蛋白质的二级结构:指在蛋白质分子中的局部区域内,多肽链沿一定方向盘绕和折叠的方式。 10.结构域:指蛋白质多肽链在二级结构的基础上进一步卷曲折叠成几个相对独立的近似球形的组装体。 11.蛋白质的三级结构:指蛋白质在二级结构的基础上借助各种次级键卷曲折叠成特定的球状分子结构的构象。 12.氢键:指蛋白质在二级结构的基础上借助各种次级键卷曲折叠成特定的球状分子结构的构象。 13.蛋白质的四级结构:指多亚基蛋白质分子中各个具有三级结构的多肽链以适当方式聚合所呈现的三维结构。 14.离子键:带相反电荷的基团之间的静电引力,也称为静电键或盐键。15.超二级结构:指蛋白质分子中相邻的二级结构单位组合在一起所形成的有规则的、在空间上能辨认的二级结构组合体。 16.疏水键:非极性分子之间的一种弱的、非共价的相互作用。如蛋白质分子中的疏水侧链避开水相而相互聚集而形成的作用力。 17.范德华力:中性原子之间通过瞬间静电相互作用产生的一种弱的分子间的力。当两个原子之间的距离为它们的范德华半径之和时,范德华力最强。 18.盐析:在蛋白质溶液中加入一定量的高浓度中性盐(如硫酸氨),使蛋白质溶解度降低并沉淀析出的现象称为盐析。 19.盐溶:在蛋白质溶液中加入少量中性盐使蛋白质溶解度增加的现象。20.蛋白质的变性作用:蛋白质分子的天然构象遭到破坏导致其生物活性丧失的现象。蛋白质在受到光照、热、有机溶剂以及一些变性剂的作用时,次级键遭到破坏导致天然构象的破坏,但其一级结构不发生改变。 21.蛋白质的复性:指在一定条件下,变性的蛋白质分子恢复其原有的天然构象并恢复生物活性的现象。 22.蛋白质的沉淀作用:在外界因素影响下,蛋白质分子失去水化膜或被中和其

生物有关名词解释

名词解释 1. 细胞周期:包括细胞有丝分裂过程和两次分裂之间的间期。其中有丝分裂过程分为:①.DNA合成前期(G1期);②.DNA合成期(S期);③. DNA合成后期(G2期);④.有丝分裂期(M期)。 2. 原核细胞:一般较小,约为1~10mm。细胞壁是由蛋白聚糖(原核生物所特有的化学物质)构成,起保护作用。细胞壁内为细胞膜。内为DNA、RNA、蛋白质及其它小分子物质构成的细胞质。细胞器只有核糖体,而且没有分隔,是个有机体的整体;也没有任何内部支持结构,主要靠其坚韧的外壁,来维持其形状。其DNA存在的区域称拟核,但其外面并无外膜包裹。各种细菌、蓝藻等低等生物由原核细胞构成,统称为原核生物。 3. 真核细胞:比原核细胞大,其结构和功能也比原核细胞复杂。真核细胞含有核物质和核结构,细胞核是遗传物质集聚的主要场所,对控制细胞发育和性状遗传起主导作用。另外真核细胞还含有线粒体、叶绿体、内质网等各种膜包被的细胞器。真核细胞都由细胞膜与外界隔离,细胞内有起支持作用的细胞骨架。 4. 染色质:是指染色体在细胞分裂的间期所表现的形态,呈纤细的丝状结构,含有许多基因的自主复制核酸分子。 染色体:是指染色质丝通过多级螺旋化后卷缩而成的一定形态结构。细菌的全部基因包容在一个双股环形DNA构成的染色体内。真核生物染色体是与组蛋白结合在一起的线状DNA双价体;整个基因组分散为一定数目的染色体,每个染色体都有特定的形态结构,染色体的数目

是物种的一个特征。(染色体:指任何一种基因或遗传信息的特定线性序列的连锁结构。) 5. 染色单体:由染色体复制后并彼此靠在一起,由一个着丝点连接在一起的姐妹染色体。 6. 姐妹染色单体:二价体中的同一各染色体的两个染色单体,互称姐妹染色单体,它们是间期同一染色体复制所得。 7. 非姐妹染色单体:单体二价体的不同染色体之间的染色单体互称非姐妹染色单体,它们是同源染色体这些间期各自复制所得。 8. 联会:减数分裂中,同源染色体的配对过程。 9. 同源染色体:生物体中,形态和结构相同的一对染色体,成为同源染色体。 10. 异源染色体:生物体中,形态和结构不同的各对染色体互称为异源染色体。 12. 染色体组:指包含有一套对于生物体的生命活动所不可缺少的,最小限度的基因群的一组染色体。 13. 着丝点:在细胞分裂时染色体被纺锤丝所附着的位置。一般每个染色体只有一个着丝点,少数物种中染色体有多个着丝点,着丝点在染色体的位置决定了染色体的形态。 14. 染色粒:在有丝分裂和减数分裂前期的染色体,由DNA丝局部螺旋化而产生颗粒状结构。 15. 染纽:指某些生物中(玉米、紫苜蓿),位于染色体的末端或中间的特别大的染色粒。

生物信息学名词解释(0001)

生物信息学名词解释

1.生物信息学:研究大量生物数据复杂关系的学科,其特征是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型; 利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。 2.二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。 3.FASTA序列格式:是将DNA或者蛋白质序列表示为一个带有一些标记的核苷酸或者氨基酸字符串,大于号(>)表示一个新文件的开始,其他无特殊要求。 4.genbank序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录的信息(描述符);第二部分包含注释;第三部分是引文区,提供了这个记录的科学依据;第四部分是核苷酸序列本身,以“//”结尾。 5.Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI 的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。 6.BLAST:基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较。P94 7.查询序列(query sequence):也称被检索序列,用来在数据库中检索并进行相似性比较的序列。P98 8.打分矩阵(scoring matrix):在相似性检索中对序列两两比对的质量评估方法。包括基于理论(如考虑核酸和氨基酸之间的类似性)和实际进化距离(如PAM)两类方法。P29 9.空位(gap):在序列比对时,由于序列长度不同,需要插入一个或几个位点以取得最佳比对结果,这样在其中一序列上产生中断现象,这些中断的位点称为空位。P29 10.空位罚分:空位罚分是为了补偿插入和缺失对序列相似性的影 响,序列中的空位的引入不代表真正的进化事件,所以要对其进行 罚分,空位罚分的多少直接影响对比的结果。P37 11.E值:衡量序列之间相似性是否显著的期望值。E值大小说明了 可以找到与查询序列(query)相匹配的随机或无关序列的概率,E 值越接近零,越不可能找到其他匹配序列,E值越小意味着序列的 相似性偶然发生的机会越小,也即相似性越能反映真实的生物学意 义。P95 12.低复杂度区域:BLAST搜索的过滤选项。指序列中包含的重复 度高的区域,如poly(A)。 13.点矩阵(dot matrix):构建一个二维矩阵,其X轴是一条序列, Y轴是另一个序列,然后在2个序列相同碱基的对应位置(x,y) 加点,如果两条序列完全相同则会形成一条主对角线,如果两条序 列相似则会出现一条或者几条直线;如果完全没有相似性则不能连 成直线。 14.多序列比对:通过序列的相似性检索得到许多相似性序列,将这 些序列做一个总体的比对,以观察它们在结构上的异同,来回答大 量的生物学问题。 15.分子钟:认为分子进化速率是恒定的或者几乎恒定的假说,从而 可以通过分子进化推断出物种起源的时间。 16.系统发育分析:通过一组相关的基因或者蛋白质的多序列比对或 其他性状,可以研究推断不同物种或基因之间的进化关系。 17.进化树的二歧分叉结构:指在进化树上任何一个分支节点,一个 父分支都只能被分成两个子分支。 系统发育图:用枝长表示进化时间的系统树称为系统发育图,是 引入时间概念的支序图。 18.直系同源:指由于物种形成事件来自一个共同祖先的不同物种中 的同源序列,具有相似或不同的功能。(书:在缺乏任何基因复制 证据的情况下,具有共同祖先和相同功能的同源基因。) 19.旁系(并系)同源:指同一个物种中具有共同祖先,通过基因重 复产生的一组基因,这些基因在功能上可能发生了改变。(书:由于 基因重复事件产生的相似序列。) 20.外类群:是进化树中处于一组被分析物种之外的,具有相近亲缘 关系的物种。 21.有根树:能够确定所有分析物种的共同祖先的进化树。 22.除权配对算法(UPGMA):最初,每个序列归为一类,然后找 到距离最近的两类将其归为一类,定义为一个节点,重复这个过程, 直到所有的聚类被加入,最终产生树根。 23.邻接法(neighbor-joining method):是一种不仅仅计算两两比 对距离,还对整个树的长度进行最小化,从而对树的拓扑结构进行 限制,能够克服UPGMA算法要求进化速率保持恒定的缺陷。 24.最大简约法(MP):在一系列能够解释序列差异的的进化树中 找到具有最少核酸或氨基酸替换的进化树。 25.最大似然法(ML):它对每个可能的进化位点分配一个概率, 然后综合所有位点,找到概率最大的进化树。最大似然法允许采用 不同的进化模型对变异进行分析评估,并在此基础上构建系统发育 树。 26.一致树(consensus tree):在同一算法中产生多个最优树,合并 这些最优树得到的树即一致树。 27.自举法检验(Bootstrap):放回式抽样统计法。通过对数据集多 次重复取样,构建多个进化树,用来检查给定树的分枝可信度。

相关主题
文本预览
相关文档 最新文档