当前位置：文档之家› 系统发育分析

系统发育分析

本科生毕业论文（设计）

题目: 基于线粒体COX2基因的几种鲤科鱼丹亚科(Danioninae)鱼类的系统发育分析

郑重声明

本人的毕业论文(设计)是在指导老师的指导下独立撰写并完成的。毕业论文(设计)没有剽窃、抄袭、造假等违反学术道德、学术规范和侵权行为，本人愿意承担由此产生的各种后果；直至法律责任，并可以通过网络接受公众的查询。特此声明。

毕业论文作者(签名)：

年月日

中文摘要 ............................................................................................. 错误！未定义书签。英文摘要(Abstract) ............................................................................. 错误！未定义书签。

1 前言 ................................................................................................. 错误！未定义书签。

1.1 鲤科简介及其系统学研究现状 .................................................. 错误！未定义书签。

1.1.1 鲤科的分类特征 ....................................................................... 错误！未定义书签。

1.1.2 鲤科的分类系统 ....................................................................... 错误！未定义书签。

1.1.3 研究现状 ................................................................................... 错误！未定义书签。

1.2 线粒体基因组(mtDNA) ............................................................... 错误！未定义书签。

1.2.1 鱼类线粒体基因组的结构组成和特点 ................................... 错误！未定义书签。

1.2.2 线粒体DNA序列分析在鲤科系统学研究的应用 ................ 错误！未定义书签。

1.2.3 线粒体蛋白编码基因的特点 ................................................... 错误！未定义书签。

1.2.4 mtDNA用于系统发育分析的优点 .......................................... 错误！未定义书签。

1.3 本研究的目的和意义 .................................................................. 错误！未定义书签。

2 材料与方法 ..................................................................................... 错误！未定义书签。

2.1 方案论证 ...................................................................................... 错误！未定义书签。

2.1.1 分子系统学概述 ....................................................................... 错误！未定义书签。

2.1.2 分子系统发育研究方法 ........................................................... 错误！未定义书签。

2.2 过程论述 ...................................................................................... 错误！未定义书签。

2.2.1 实验数据的获取 ....................................................................... 错误！未定义书签。

2.2.2 实验数据处理和分析 ............................................................... 错误！未定义书签。

2.2.3 建树 ........................................................................................... 错误！未定义书签。

3 实验结果分析 ................................................................................. 错误！未定义书签。

3.1 本实验所研究的8种鱼的分类 .................................................. 错误！未定义书签。

3.2 鲤科鱼类COX2基因序列分析.................................................. 错误！未定义书签。

3.2.1 COX2基因序列多态位点及信号位点..................................... 错误！未定义书签。

3.2.3 COX2基因的遗传密码及其氨基酸组成................................. 错误！未定义书签。

3.2.4 COX2基因的遗传距离............................................................. 错误！未定义书签。

3.2.5 利用COX2基因进行的系统发育重建................................... 错误！未定义书签。

3.2.6 三种建树方法结果比较和总结 ............................................... 错误！未定义书签。

4 讨论 ................................................................................................. 错误！未定义书签。

4.1 分子标记的有效性问题 .............................................................. 错误！未定义书签。

4.2 各种建树方法的评估 .................................................................. 错误！未定义书签。

4.3 系统发育信号的评估 .................................................................. 错误！未定义书签。参考文献 ............................................................................................. 错误！未定义书签。附录 ..................................................................................................... 错误！未定义书签。致谢 ..................................................................................................... 错误！未定义书签。

基于线粒体COX2基因的几种鲤科鱼丹亚科(Danioninae)

鱼类的系统发育分析

摘要：鲤科是鲤形目中种类最多的一个科，本科鱼类为各国重要的养殖鱼类，多数可食用，还可作为观赏鱼。因此，鲤科的系统学研究不仅具有理论意义，而且在鱼类资源的利用上具有现实意义。

本研究从NCBI网站基因数据库中获得8种鲤科鱼类的线粒体基因，其中鱼丹亚科5种，以COX2作为分子标记，利用ClustalX 1.83,MEGA 4.1等系统发育分析软件对基因序列的碱基组成、碱基替换、密码子使用频率、氨基酸组成、遗传距离等进行了统计分析；通过碱基替换饱和性分析等方法进行了信号检验，结果显示所测定的序列都具有较强的系统发育信号；采用邻接法(NJ)、最小进化法(ME)和最大简约法(MP)对鲤科进行系统发育重建。最后获得如下结论：

(1) 测定的8种鱼的COX2序列具有较高的A+T含量，说明线粒体DNA的COX2基因中存在明显的碱基组成偏向性。

(2) 对序列进行替换饱和性分析后，结果表明第一、三位碱基替换尚未达到饱和。碱基替换中颠换以T-A、C-A最多，其中转换以T-C替换数目最多。

(3) 鲤科8种鱼COX2密码子以A、T结尾频率高，第三位是G的的密码子使用较少。编码同一个氨基酸的不同同义密码子通常有不同的频率，说明COX2在密码子的使用上具有偏向性。

(4) 利用距离法建出的NJT和MET如下((((Gymnocypris przewalskii ganzihonensis，Gymnocypris eckloni)，Sinocyclocheilus grahami)，(Yaoshanicus arcus，Nicholsicypris normalis))，(Salmostoma bacaila，(Raiamas guttatus，Aspidoparia morar)));利用简约法建出的MPT如下：(((((Raiamas guttatus，Aspidoparia morar)，Salmostoma bacaila)，(Yaoshanicus arcus，Nicholsicypris normalis))，(Gymnocypris przewalskii ganzihonensis，Gymnocypris eckloni))，Sinocyclocheilus grahami)。

(5) COX2作为分子标记3种方法所建的系统树都完全解析，外群和内群的单系性成立，因此适合作为鲤科鱼类亚科及以下分类阶元的系统发育分析分子标记。

关键词：鲤科；鱼丹亚科；蛋白编码基因；分子进化；系统发育分析

Phylogenetic Analysis of Some Fish of the Cyprinid Subfamily (Danioninae) Based on Mitochondrial COXII Abstract: Cyprinidae is the biggest family in the Cypriniformes. The fish of Cyprinidae has been the important farmed fish in various countries, most of which are edible and can be used as ornamental fish. Therefore, the systematics study of Cyprinidae has not only theoretical significance but also practical significance on the utilization of fish resource.

8 fish from Cyprinidae are chosen as the experimental object, 5 of which are from Danioninae. The complete mitochondrial gene sequence of the fish have been acquired and downloaded from Genebank. COX2is chosen as molecular marker that is a kind of protein-encoding gene. The base composition, codon usage frequency, amino acid composition and genetic distance of these sequences have been analyzed via some bio-softwares such as ClustalX 1.83, MEGA 4.1. Phylogenetic signal have been tested through base subsituation saturation analysis. Results show that strong phylogenetic signal exist in these sequences (datasets). We reconstructed the phylogenetic relationships through NJ, ME and MP in MEGA 4.1 for Cyprinidae. Conclusions were showed below:

(1) Gene sequence of COX2 of the whole 8 fish show that COX2 has higher contents in A+T than G+C, we can conclude that COX2 has obvious bias in base composition.

(2) After the substitution saturation analysis of datasets, it revealed that replacement of base in the first and third place was not up to the saturation, transversion mainly occurs in T-A and C-A, transition frequently occurs in T-C.

(3) The codon usage is biased in COX2. When the third sites is A or T, the codon has higher usage frequence. Different synonymous codon which encode the same amino acid have different usage frequence.

(4)NJT and MET built by distance method are as follows: ((((Gymnocypris przewalskii ganzihonensis, Gymnocypris eckloni), Sinocyclocheilus grahami), (Yaoshanicus arcus, Nicholsicypris normalis)), (Salmostoma bacaila, (Raiamas guttatus, Aspidoparia morar))). MPT built by parsimony shows: (((((Raiamas guttatus, Aspidoparia morar), Salmostoma bacaila), (Yaoshanicus arcus, Nicholsicypris normalis)),

(Gymnocypris przewalskii ganzihonensis, Gymnocypris eckloni)), Sinocyclocheilus grahami).

(5) Phylogenetic trees built by 3 building method are analytical completely while COX2serves as a molecular marker, monophyly was established between ingroup and outgroup, therefore , COX2is suitable to serve as the molecular marker of subfamily of Cyprinidae and the following taxa in phylogenetic analysis.

Keywords: Cyprinidae; Danioninae; Protein-encoding gene; Molecular envolution; Phylogenetic analysis

1 前言

1.1 鲤科简介及其系统学研究现状

鲤科隶属于辐鳍亚纲(Actinopterygii)鲤形目(Cypriniformes)，鲤科鱼类是鲤形目中最大的类群[1]，约有200多属，2000多种。我国有鲢、鲤、裂腹鱼、鳅鮀、鳊、雅罗鱼、鲴、鳑鲏、鲃、鮈共10个亚科，共有132属，532种和亚种。鲤科鱼类的观赏鱼也是种类繁多，大、中、小型鱼都有，约有1600多种，我国约产370种。本科鱼类全部为淡水鱼，不仅种类繁多，其分布也广泛，为了分类学上的方便，众多学者根据形态、骨骼特征或染色体组型将鲤科鱼类分为不同的亚科。不过亚科划分并没有根据严格的系统发育系统学的理论和方法，对亚科单系既没有用近裔共性加以定义，也没有建立分支系统图，只是将鲤科中近裔特征明显的类群，而那些特征不甚明显的类群却留在了雅罗鱼亚科和鱼丹亚科，亚科鱼类的系统发育研究是目前鲤科鱼类系统学研究中的难点之一。近年来，迅速增加的DNA序列分析为亚科鱼类的系统发育研究提供了另一条较为客观的途径。因此，鲤科的系统学研究不仅具有理论意义，而且在鱼类资源的利用上具有现实意义。

1.1.1 鲤科的分类特征

本科鱼外观体型差异极大。一般为纺锤形或长形，侧扁或稍侧扁，口由前上颔骨与下颔骨组成，能伸缩。上下颔皆无齿，但由最后一对鳃之腹面特化成1至3行咽头齿，每行少于8枚齿，与头骨腹面的角质后垫形成咀嚼构造。通常具有1至2对须或无须。背鳍1枚，其前部有2至4根不分枝鳍条，腹鳍腹位，尾鳍叉形或深叉形。体被圆鳞，少数种类鳞片变小或退化。腹鳍基部一般均具有狭长腋鳞[2]。

1.1.2 鲤科的分类系统

由于巨大的物种数量，要为鲤科鱼类建立一个完整的系统发育系统是非常困难的。鲤科鱼类的分类自从1817年Cuvier建立以来就不断地得到了修订和重排。Bonaparte，Bleeker和Gunther从中辨识出许多亚类群。基于胡须的分布形态类型和神经分布，Howes把鲤科分为鲤亚科、鮈亚科、波鱼亚科(没有或偶然具有胡须)、雅罗鱼亚科、鳑鲏亚科、鲌亚科和Alburninae亚科。目前这一观点很流行。但基于形态学特征的系统发育研究仅见陈湘粦等人的工作，他们把鲤科分为10个亚科并分为两个支系：雅罗鱼系(Leuciscini) (((Acheilognathinae, Gobioninae) ((Xenocyprinae, Cultrinae)Leuciscinae))Danionina)和鲃系(Barbini): (Tincinae (Labeoninae (Cyprininae,

Barbinae)))，并将鳅鮀亚科和裂腹鱼亚科分别归入鮈亚科和鲃亚科。鲤科鱼类物种数目众多，分布范围广，外部形态差异非常显著，这都使得鲤科鱼类的分类学研究比较困难，对其进行分支分析也是一项具有挑战性的工作。基于形态学或解剖学性状，分类学家们识别出了数目不同的亚科，但对亚科间的系统关系缺乏了解，还需要进一步研究[3]。

鲤科的分类系统基本上基于形态学研究，因而缺乏一个完整的系统发育框架。由于取样上的制约，近来的分子系统学研究对鲤科分类系统所做的修订也十分有限。鲤科系统发育关系和分类学中的一些关键问题仍需进一步澄清。首先，鲤科中大多数已命名亚科的单系性并没有得到分子或形态证据的证实。对于形态学研究识别的一些亚科，如波鱼亚科和雅罗鱼亚科，它们的单系性没有得到分子证据的支持。其次，以前的研究在鲤科中波鱼亚科、丁鱥亚科和鱊亚科的系统位置问题上没能取得一致。而近来的分子分析中，因为相应节点的统计检验支持率偏低，鲤科亚科间的关系也没有得以解决。再次，尽管鲤科的二分支分类，即雅罗鱼系和鲤系(或鲃系)已广为接受，但这两个分支内部的高阶元类群间的关系还需要进一步研究[4]。

为了合理利用渔业资源和扩大养殖品种以进一步发展生产，一些生产、科研及大专院校相继开展了对淡水鱼类资源的调查、引种驯化、杂交育种等工作。在这些工作中，正确鉴定鱼类的种名和统一使用鱼类的名称非常重要。鲤科鱼类在我国的分布很广，种类最多，经济意义也较大，常规鱼类分类法的工作量大，判定过程也十分复杂。西南农业大学基础科技学院采用Turbo PROLOG语言，研究并设计出中国鲤科鱼类的分类专家系统，并完成了该系统中知识库的表达及推理机的设计工作。中国鲤科鱼类有12个亚科、122个属、451个种或亚种。其主要分类判别树[5]为:

1.1.3 研究现状

1.1.3.1 鲤科鱼分类研究回顾

对于鲤科的分类，早期是根据其形态结构进行分类。但传统的依据形态特征推论系统发生关系事实上有一定的局限性，其中一个明显弊端就是很难排除可能受到趋同适应的干扰。近年来，国内外已有一些学者从细胞、蛋白质分子水平、分子直接测序研究鲤科鱼类的系统发生关系[6]。

朱元鼎1932年在美国进修期间，就着手用比较解剖学的方法，对鲤科分类进行深入研究。1935年他的博士论文《中国鲤科鱼类之鳞片、咽骨与牙齿的比较研究》发表后，引起了国内外学术界广泛重视。他在这篇论文中，深入地研究了中国鲤科鱼类鳞片、咽骨和牙齿的构造，探讨了这些构造在系统分类中的价值，以及形态变化和鱼类演化的关系，从而提出了中国鲤科鱼类分类系统的意见，并发现了7个鲤科鱼类的新属。为开拓鱼类分类学研究领域与鱼类分类的新途径作出了贡献。该论文所具的独创性的见解，受到国内外学术界的广泛重视。当时，日本的鱼类学学者用“元鼎骨”指称鲤科鱼类的咽骨。至今该论文仍是国内外研究鲤科鱼类必不可少的重要参考文献。鱼类分类学的发展，从外部形态特征区分，逐步深入到内部解剖特征的区分。朱元鼎将他精湛的比较解剖学的造诣，运用在鱼类分类学的研究上，从而发现了大量新种、新属、新亚科，提出和建立了有关鱼类新的分类系统，并在鱼类的演化和系统发育方面，屡树创见。

王绪桢[7]等对异鳍的骨骼形态进行了详细的描述并与鳃亚科及姻亚科代表种的骨骼特征进行了比较。结果显示异姻与鳃亚科鱼类在骨骼学性状上缺乏共同特征，一系列的离征却表明它与现生姻亚科鱼类紧密相关。这些离征包括：咽骨形态独特，前臂略长或与后臂等长；下咽齿侧扁，有明显的咀嚼面；基枕骨具有向下弯曲的基枕骨突，咽突面发达，椭圆形且向前突出；穿行于基枕骨的背大动脉通道接近咽突长；副蝶骨具有发达的龙骨突；前上领骨短宽，下边缘为软骨；上领骨外侧具突起；齿骨前背缘有外侧角等。异绷之置于鳃亚科仅依据他们在围眶骨系的形态及排列上的相似性，而它和姻亚科鱼类具有的一些共同离征表明它们可以形成姐妹群。因此，异姻属在鲤科中的分类位置应该更加接近绷亚科。

桂建芳[8]等人从细胞学的角度，通过鲤科雅罗鱼亚科7属7种鱼的核型分析，以及与其他有关鲤科鱼类核到的比较，对它们的染色休进化方式，和与此有关的鲤科鱼类的系统关系也进行了初步探讨，根据他们分析的结果，同一亚科的草鱼和赤眼鳝的核型有较多的相似之处，青鱼的核型与它们的也相接近，而鳊亚科、鲴亚科和鲢亚科

鱼类的核型却亦具有和它们类似的特点，如：(1) 染色体二倍数都是48；(2) 具有较多的中部和亚中部着丝点染色体，NF相对地较高；(3) 存在一对明显最大的染色体。这些共同的核型特征是目前已有核型报道的鲤科鱼中，另外一些类群所不具有的。同时他们的实验结果表明，蛛鱼、撼鱼和鳍鱼等雅罗鱼亚科鱼类的染色体组型也与此不同。根据上述的比较分析，他们认为，与鲤科鱼中其他一些类群相比，鳊亚科、鲴亚科和鲢亚科鱼类与雅罗鱼亚科中的青鱼、草鱼和赤眼鳟等鱼类具有较近的亲缘关系，它们可能属于同一进化分支。这跟前人关于鳊、鲴二亚科由鲃亚科鱼类进化而来的看法是矛盾的，这一问题值得进一步研究。

何舜平[9]采用DNA随机扩增分析(Random Applified Polym ophic DNA, 即RAPD)探讨稀有鮈鲫的系统分类位置，他采用20个随机引物,对五种鲤科鱼类,即稀有鮈鲫、中华细鲫、麦穗鱼、唐鱼和草鱼的基因组进行了RAPD，研究结果表明在所研究的物种中，稀有鮈鲫与中华细卿和唐鱼有更近的亲缘关系。RAPD技术即随机扩增的多态性DNA技术，是建立在PCR技术基础上的一种检测基因组DNA多态性的方法其基本原理是PCR聚合酶链式反应，引物是单个随机的寡核昔酸单链如果基因组在被PCR扩增区域曾发生过DNA片段的插人、缺失或碱基对的突变，就可能导致这些特定结合位点的分布，发生相应的变化或者扩增区段长度发生变化，因而使PCR产物增加缺少或发生分子量的改变这种DNA的多态性可作为系统发育的表征。RAPD被较多的作者用来进行不同分类单元的遗传距离系统分类和系统发育研究从RAPD研究果的UPGMA聚类分析可以看出，稀有鲍鲤与中华细卿首先聚在一起，而后草鱼与麦穗鱼聚在一起，然后稀有鮈鲫和中华细鲫与唐鱼聚在一起；最后草鱼+麦穗鱼才和稀有鮈鲫+中华细鲫+唐鱼相聚。该分析结果与陈湘舞鲤科宗系发生基本一致，从而可以认为稀有鲍鲤与唐鱼、中华细鲫等鱼丹亚科鱼类有更近的亲缘关系。

何舜平[10]采用PCR技术获得了14种主要分布于东亚的低等鲤科鱼类细胞色素b基因的全序列。所得1140bp细胞色素b基因序列与10种取自GenBank，分布在北美和欧洲的相关鲤科鱼类的同一基因序列一起排序后，得到了24种鲤科鱼类的DNA序列矩阵。此矩阵经过最大似然(maximum likehhood)法计算后获得了低等鲤科及相关种类的系统发育分支图解。分支系统图显示鲤科的雅罗鱼亚科和鱼丹亚科鱼类并不形成单系类群，鱼丹亚科鱼类中的马口鱼、鱼鼠等是原始的鲤科鱼类，处于分支图的基部。而其余的鱼丹亚科鱼类则分散分布于不同的类群中。细鲫、瑶山鲤形成一个单元群。唐鱼、稀有鲫与鮈属有较近的亲缘关系。鱼丹属与鱼丹亚科其余种类毫不相干。雅罗鱼

亚科分为两个互不相干的单系群。北美、西伯利亚和欧洲的雅罗鱼，雅罗鱼属(Leuciscus)，拟鲤属(Rutilus)，鱼岁属(Phoxinus)，N.crysole，OPeopoeodus emilae有较近的亲缘关系，而分布于中国南部的雅罗鱼如青鱼、草鱼、赤眼缚和蟾鱼等有共同的起源。

1.1.3.2 系统学研究进展

分子系统学研究就是在一系列分子实验技术和计算机技术发展与结合的基础上诞生的。20世纪70年代由于限制性内切酶的发现，DNA快速测序方法的发明、分子生物学及其技术以迅猛的速度发展。80年代PCR技术的产生和发展加速了分子生物学在生物学各领域的广泛应用。之后，人们采用分子生物学技术，以DNA为材料，通过随机扩增多态DNA(RAPD)技术和限制性片段多态性(RFLP)技术以及对srRNA，COI，12S rRNA，16SrRNA，nad5，c ytb等序列的测定，来进行鲤科分类学的研究。在鲤科鱼类分子系统学研究中，线粒体基因组的应用非常广泛。它是目前研究鲤科鱼类系统发育、种群遗传变异和分化以及难以用外部形态特征来区分的近缘种和种下分类单元鉴定等应用最为广泛的遗传物质之一[11]。

1.2 线粒体基因组(mtDNA)

1.2.1 鱼类线粒体基因组的结构组成和特点

从已报道的161种鱼类mtDNA的全序列可知，鱼类mtDNA分子大小范围在15561-18705bp之间，鱼类线粒体DNA(Mitochondrial DNA, mtDNA)同其他脊椎动物的mtDNA一样，呈共价闭合环状，包括一条重链，一条轻链，是细胞核外具自主复制、转录和翻译能力的遗传因子。与核DNA相比，鱼类mtDNA具有分子小、结构简单、进化速度快、不同区域进化速度存在差异等特点，是一个相对独立的复制单位。正是由于鱼类mtDNA具有这些特点，使其成为鱼类进化遗传学、分子生态学、遗传多样性及其保护生物学等研究的重要标记。随着分子生物学技术向生物学各研究领域的渗透，以mtDNA作为分子标记，已成为鱼类群体遗传结构与系统演化关系研究中的重要工具。当前，对鱼类mtDNA研究的热点包括mtDNA的信息、结构和功能遗传，mtDNA在系统进化中的应用，mtDNA在起源进化及群体遗传分化中的应用，不同生物mtDNA的进化等[12]。

1.2.2 线粒体DNA序列分析在鲤科系统学研究的应用

系统发育分析是系统学研究的热点，分子系统发育研究采用的数据通常是DNA

序列，线粒体DNA序列是目前研究鲤科系统发育、种群遗传变异和分化，以及难以用外部形态特征来区别的近缘种、种下分类单元鉴定等中应用最为广泛的遗传物质之一。通过对包含有不同遗传信息的DNA序列的研究，可以对形态分类不能解决的类群的系统关系进行分析和探讨，还可对传统的分类系统进行验证。其中Simons[13]等人和Gilles[14]等人用细胞色素b和12SrRNA、16SrRNA基因序列对北美和欧洲的鲤科鱼类，何舜平等人用RAPD对东亚鲤科鱼类进行了一系列研究。细胞色素b基因已大量地应用到各类生物的系统发育中，有许多成功的经验和可供比较的序列，运用细胞色素b基因序列变异来探讨东亚低等鲤科，主要是鱼丹亚科和雅罗鱼亚科鱼类的系统发育问题。

1.2.3 线粒体蛋白编码基因的特点

鱼类mtDNA主要包括37个编码基因(13个疏水蛋白基因、2个rRNA基因、22个tRNA编码基因)、1个负责复制和转录起始的控制区(D-loop)和1个轻链复制起始区。疏水蛋白基因编码的多肽包括了与线粒体内膜相结合的酶复合体的亚单位：细胞色素b(Cytb)、2个ATP合成酶的亚单位(ATPase6和ATPase8)、3个细胞色素c(Cytc)氧化酶的亚单位(COⅠ、COⅡ和COⅢ)和7个氢化辅酶I(NADH)脱氢酶的亚单位(ND1、ND2、ND3、ND4、ND4L、ND5和ND6)。2个rRNA基因为12S和16SrRNA基因。22个tRNA 基因编码的氨基酸自控制区按顺时针方向依次为:Pro、Thr、Glu、Leu、Ser、His、Arg、Gly、Lys、Asp、Ser、Tyr、Cys、Asn、Ala、Trp、Met、Ile、Glu、Leu、Val 和Phe。mtDNA的2条链分别为重链H和轻链L，其中L链仅编码ND6和7个tRNA，其余基因皆由H链编码。仅有少数鱼类的mtDNA存在特殊情况，海七鳃鳗(Petromyzon marinus)、淡水七鳃鳗(Lampetra fluviatilis)和溪鳉(Rivulus marmoratus)的组成成分基本上与其他鱼类相同，其不同主要在于结构上的差异，如tRNAThr和tRNAGlu两个基因将海七鳃鳗和淡水七鳃鳗的非编码区隔开，而溪鳉具有两个基本一致的非编码区，这在鱼类mtDNA的研究中是第一次发现。这种结构上的差异，显示脊椎动物mtDNA特异性基因结构的建立是在其进化历程的早期阶段形成的[15]。

1.2.4 mtDNA用于系统发育分析的优点

(1) 提取工艺简单：mtDNA的分子质量小，结构较简单，无重复DNA，转座子，假基因和内含子等复杂因素。细胞中有较高的拷贝数、容易提取、提纯和分析。

(2) 具母系遗传特性：因遗传过程中严格遵守母系遗传方式，避免了双亲遗传方式引起的随机性，只需少量个体材料就能反映群体的遗传结构。

(3) 进化速度快：线粒体基因组自身缺乏修补机制，复制过程中易产生序列取代的变异，从而进化速率比核DNA快5-10倍[16, 17]。与核DNA相比更适合作进化生物学研究。特别有较低阶元研究方面的优势，是核DNA无法比拟的。

1.3 本研究的目的和意义

本研究采用从核酸数据库GenBank中下载鱼丹亚科鱼类5个种的线粒体全基因序列及鲤亚科3个种的全线粒体基因序列进行分析，并利用各种软件建立系统发育树，对鲤科鱼丹亚科的系统发育关系进行研究。同时探讨线粒体COX2作为分子标记在研究鲤科鱼丹亚科系统发育关系中的有效性问题。希望通过对鱼丹亚科部分种线粒体基因组的分析，为研究鱼丹亚科以及鲤科类群的系统发育关系提供新的信息和分子方面的数据。

系统发育分析

实习四: 系统发育分析－PHYLIP, MEGA, MrBayes 实习目的 1. 学会使用PHYLIP，MEGA和MrBayes构建进化树 2. 学会分析建树结果，体会各种方法差异实习内容：一、PHYLIP PHYLIP网址： https://www.doczj.com/doc/ae6425144.html,/PHYLIP.html PHYLIP是一个免费的系统发育树构建软件，它的功能比较全面，可用距离法、最大简约法和最大似然法分别进行建树，还可以对进化树可靠性进行检验。PHYLIP没有多序列比对功能，所以先要用其它序列比对软件完成序列比对，并保存为phy格式后，才可提交给PHYLIP 进行分析。 1.1 比对序列的准备 1．将教学材料里demo sequence.zip文件解压到D盘根目录下，分别用其中的mRNA和protein序列学习进化树构建。首先我们用实习2学过的多序列比对软件对序列进行比对。这里以CLUSTAX为例来说明。强烈建议：将你的所有同源核酸（或蛋白质）序列存到一个文本文档里，将”>”之后那行只保留物种名称，或物种名称_蛋白（或基因）名称，方便后面分析比较。 2．用CLUSTALX进行多条序列比对，在Alignment - output format option选中PHYLIP 格式，对序列进行比对（Alignment - Do complete alignment）。将生成的phy文件保存，此文件可以用写字板打开浏览，里面内容是多条序列比对结果。（Figure 1.1）

Figure 1.1 用clustalx进行多条序列比对及生成的phy文件 3．双击解压PHYLIP-3.69.zip文件，得到三个文件夹，其中doc文件夹里是关于所有PHYLIP 子程序的使用说明，exe文件夹里是直接可以使用的可执行程序，src文件夹里是所有程序的源代码。 4．打开PHYLIP的exe文件夹，将上步保存的phy文件复制到exe文件夹中。 5．上课时我们是先将序列用某种方法建树后，然后做bootstrap检验，看树的可靠性。但

环境系统课程设计资料

环境系统课程设计《环境系统分析A》课程设计姓名学号专业名称提交日期 2016年1月12日

第一章任务书 (3) 1.1课程设计目的 (3) 1.2课程设计要求 (3) 1.2.1环境质量要求 (3) 1.2.2报告主要研究内容 (3) 第二章课程设计内容 (4) 2.1总论 (4) 2.1.1设计依据 (4) 2.1.2评价因子 (4) 2.2项目 (4) 2.2.1热电厂 (4) 2.2.1.1背景介绍 (4) 2.2.1.2模型运用 (6) 2.2.1.3分析模型 (8) 2．2.2污水厂 (8) 2.2.2.1背景介绍 (8) 2.2.2.2模型运用 (9) ①污水厂处理前水质 (9) ②污水厂处理后 (11) 2.2.2.3分析模型 (11) 第三章应对措施 (12) 3.1对热电厂所采取的措施 (12) 3.1.1增加烟囱物理高度 (12) 3.1.2使用除硫除尘设备: (12) 3.1.3其他措施 (13) 3.2对污水处理采取的措施 (13) 第四章课程设计总结 (14) 第五章附录 (15) 5.1小组分工 (15) 5.2大气环境质量标准（部分） (15) 5.3地表水环境质量标准（部分） (16)

第一章任务书 1.1课程设计目的环境系统分析以模型化为手段描述环境系统的特征，模拟和揭示环境系统分析的发展与变化规律，并通过最优化对系统的结构与运行做出最佳选择。而本课程设计是《环境系统分析》课程学习之后的设计训练，目的在于让学生们把理论运用于实践。设计内容主要在以前布置的水环境质量模式与大气环境质量模式大作业的工作基础上展开。通过课程设计，可以了解求“水环境污染物”与“大气环境污染物”的污染贡献估算所需的主要资料、应做的主要工作、所用的主要模式、工作的一般步骤等等，并锻炼在微机上求解的实际工作能力。 1.2课程设计要求 1.2.1环境质量要求某城郊区域（假设原来无任何大气和水污染物）要进行国家级经济开发示范建设，先行开发项目有污水处理厂和热电厂，为保证开发区的大气环境质量和水环境质量达标，必须对该二厂排放的大气污染物和水污染物进行控制。控制标准如下：（1）大气环境质量控制在国家一级标准（2）水环境质量控制在地表水III类标准 1.2.2报告主要研究内容（1）调查、统计水、大气环境资料。（2）使用相应的河流/水质模型以及大气质量模型进行水环境质量、大气环境质量（污染状况）分析，并做出相应的计算过程。（3）列举污染预测结果为保证达标需要采取的相应的措施手段。（4）课程设计的结果分析、结论及讨论。

环境系统工程总复习

环境系统工程总复习 1环境问题的特点跨领域：社会学、工程学、经济学、生态学、环境化学、环境地理学、环境物理学等。多系统：①自然保护系统、环境管理系统、监测系统、污染控制系统。②污染源发生和处理系统。这些系统互相联系、互相作用。多层次：流域环境系统、区域环境系统、城市环境系统、水、气、声污染控制系统等不同层次的系统。多因素：多输入、多变量。(多变污染源，迁移转化影响因素多) 随机性：时间、空间、数量上均带有随机性。多目标：有时是费用、质量等同时寻优。动态的：随时间在变化，周期性很长的开放性的系统。 2环境问题的解决只靠单项技术已不能圆满解决复杂的环境问题，更不能达到最优，必须综合分析，系统设计规划，就需借助系统工程处理法。 ①研究环境系统内部各组成部分之间的对立统一关系，寻求最佳的污染防治体系； ②研究环境质量与社会经济发展的对立统一关系，建立与环境保护相协调的经济结构与经济布局。主要内容一、环境系统分析概述二、数学模型概述三、环境质量基本模型四、内陆水体水质模型五、大气质量基本模型六、环境质量评价模型七、习题练习环境系统分析概述一、系统的概念：（书）系统是由两个或两个以上相互独立又相互制约、执行特定功能的元素组成的有机整体。（ppt）由若干元素组成；这些元素相互独立又相互制约；作为一个整体具有特定功能。二、系统的基本特性即系统的特点：相关性、目的性、环境适应性、集合性、阶层性、整体性

三、什么是系统分析系统分析：对研究对象进行有目的、有步骤的探索，通过分解与综合的反复协调，寻求系统目标的最佳方案。分解和综合是系统分析的基本方法，也是系统分析的两个主要环节。分解：研究和描述组成系统的各个要素的特征，掌握各要素的变化规律。模型化过程，研究描述环境系统主要功能的逻辑模式(定性的)和数学模式(定量的)；综合：研究各要素之间的联系和有机组合，达到系统的总目标最优。最优化过程，利用数学模式进行最优化分析。四、系统分析的一般步骤：（书）1明确问题；2设立目标；3收集资料；4建立模型；5制定系统评估标准；6综合分析。（ppt）明确问题，设立目标收集资料、制定方案分析计算、评价比较检验核实，作出决策五、系统分析的主要原则：科学性原则、整体性原则、综合性原则六、环境系统分析环境系统： (1)定义：广义：指地球表面包括非生物和生物的各种环境因素及其相互关系的总和。狭义：在研究人与环境这个矛盾的统一体时，把由两个或两个以上环境污染及控制有关的要素组成的有机整体。 (2) 环境系统的分类和组成污染物的发生及迁移过程：污染物发生系统、污染物输送系统、污染物处理系统、接受污染物的环境系统环境管理功能：环境监测系统、环境执法系统、环境规划管理系统、环境统计与排污收费管理系统环境保护对象：保护区系统、大气污染控制系统、水污染控制系统、城市生态环境系统环境系统分析：应用系统分析方法来解决环境保护领域的问题主要内容：环境系统可行性研究分析环境工程经济分析

环境系统分析课程教学设计

《环境系统分析A》课程设计姓名学号专业名称提交日期 2016年1月12日

分子发育系统学

一、本研究的目的和意义本研究采用从核酸数据库GenBank中下载斑腿蝗科部分种的线粒体ND2基因序列及部分其他种属的ND2基因序列进行分析，并利用各种软件建立系统发育树，对斑腿蝗部分类群之间的系统发育关系进行研究。尝试以较多的分子序列资料得出较为全面而可信的系统发育关系。希望通过对斑腿蝗部分种线粒体基因组的分析，为研究斑腿蝗科的系统发育关系提供新的信息。二、斑腿蝗科昆虫ND2基因序列分析对所获得的8条序列进行正反链序列互补检测、校对，用MEGA6.0进行比对和分析，发现没有碱基的插入和缺失。三、ND2基因序列多态位点及信号位点表1密码子不同位点碱基频率 Domain: Data T(U) C A G Total T-1 C-1 A-1 G-1 Pos #1 T-2 C-2 A-2 G-2 Pos #2 T-3 C-3 A-3 G-3 Pos #3 Xenocatantops -brachycerus 33.5 17.2 38.6 10.7 1023 30 14.1 41.3 14.7 341 45 22.9 20.2 11.4 341 25 14.7 54.3 5.9 341 Prumna -arctica 35.8 15.1 39.1 10.1 1029 33 11.7 42.3 13.1 343 46 22.4 19.2 12 343 28 11.1 55.7 5.2 343 Traulia -szetschuanensis 33.6 17.4 37.5 11.4 1023 29 15.2 41.1 14.4 341 48 20.5 19.6 12.3 341 24 16.4 51.9 7.6 341 Ognevia -longipennis 36.2 15.9 37.6 10.3 1023 32 14.4 40.5 13.5 341 48 22 18.8 11.1 341 29 11.4 53.7 6.2 341 Kingdonella -bicollina 36.8 14.9 38.8 9.5 1021 35 12 40.2 12.9 341 46 23.5 17.9 12.1 340 29 9.1 58.2 3.5 340 Shirakiacris -shirakii 33.5 18.1 37.6 10.8 1023 31 13.5 42.5 12.6 341 47 21.7 19.1 12.6 341 23 19.1 51.3 7 341 Filchnerella -beicki 33 17.7 37.2 12 1023 29 14.4 40.2 16.1 341 45 23.5 19.6 11.7 341 25 15.2 51.9 8.2 341 Humphaplotropis -culaishanensis 32.8 17.9 37 12.3 1023 28 15.5 40.5 16.1 341 45 24 19.9 11.1 341 26 14.1 50.4 9.7 341 Avg. 34.4 16.8 37.9 10.9 1024 31 13.8 41.1 14.2 341.3 46 22.6 19.3 11.8 341.1 26 13.9 53.4 6.7 341.1 四、ND2基因的碱基替换在8种蝗虫的ND2基因中，碱基替换表现出明显的差异。见表2。从全数据集看：两种转换（T-C、A-G）的频率和大于四种颠换（T-A、T-G、C-A、C-G）

常见系统发育软件使用

常见系统发育软件使用方法 Xie Lei BJFU 1 Paup MP流程: Mac 准备nex文件(interleave和noninterleave均可) → 存入新建文件夹→拖入paup或用paup打开→ execute → log file → cstatus → tstatus → hsearch → define outgroup → roottrees → savetrees → describetrees →contree(save to file) →save pict→bootstrap(save tree file) →print bootstrap tree→save pict. →stop log. PC版操作，可将附录批处理文件容粘贴至nex文件后面，execute即可。 2 Paup ML 流程：Mac 准备nex文件(interleave和noninterleave均可) → 存入新建文件夹→拖入paup或用paup打开→execute→从modeltest软件中打开paupblock运算检测模型→生成score file→打开modeltest中的bin读取score数据→生成结果文档→存档并打开此文档→AIC→将begin paup的运算模块贴至原nex数据文件后面→重新将其拖入paup运行→选择ML运算模式→hsearch→打印树图→save pict. →bootstrap. PC版操作，可将附录5批处理文件容粘贴至nex文件后面，execute即可。 3 Garli运算ML流程：准备nex文件(interleave) → 存入新建文件夹→拖入paup或用paup打开→execute→输出noninterleave文档（若直接是noninterleave上述过程省略，又如果是PC机paup，无菜单操作，可在paup命令行中输入附录1*的命令回车即可生成noninterleave数据）。使用noninterleave文档（数据中类群名称不得有单引号，空格，所有方括号中容删除）→新建文件夹存入→按照流程2进行modeltest→在苹果机上打开Garli→

系统发育分析

本科生毕业论文（设计）题目: 基于线粒体COX2基因的几种鲤科鱼丹亚科(Danioninae)鱼类的系统发育分析

郑重声明本人的毕业论文(设计)是在指导老师的指导下独立撰写并完成的。毕业论文(设计)没有剽窃、抄袭、造假等违反学术道德、学术规范和侵权行为，本人愿意承担由此产生的各种后果；直至法律责任，并可以通过网络接受公众的查询。特此声明。毕业论文作者(签名)：年月日

目录中文摘要 ............................................................................................. 错误！未定义书签。英文摘要(Abstract) ............................................................................. 错误！未定义书签。 1 前言 ................................................................................................. 错误！未定义书签。 1.1 鲤科简介及其系统学研究现状 .................................................. 错误！未定义书签。 1.1.1 鲤科的分类特征 ....................................................................... 错误！未定义书签。 1.1.2 鲤科的分类系统 ....................................................................... 错误！未定义书签。 1.1.3 研究现状 ................................................................................... 错误！未定义书签。 1.2 线粒体基因组(mtDNA) ............................................................... 错误！未定义书签。 1.2.1 鱼类线粒体基因组的结构组成和特点 ................................... 错误！未定义书签。 1.2.2 线粒体DNA序列分析在鲤科系统学研究的应用 ................ 错误！未定义书签。 1.2.3 线粒体蛋白编码基因的特点 ................................................... 错误！未定义书签。 1.2.4 mtDNA用于系统发育分析的优点 .......................................... 错误！未定义书签。 1.3 本研究的目的和意义 .................................................................. 错误！未定义书签。 2 材料与方法 ..................................................................................... 错误！未定义书签。 2.1 方案论证 ...................................................................................... 错误！未定义书签。 2.1.1 分子系统学概述 ....................................................................... 错误！未定义书签。 2.1.2 分子系统发育研究方法 ........................................................... 错误！未定义书签。 2.2 过程论述 ...................................................................................... 错误！未定义书签。 2.2.1 实验数据的获取 ....................................................................... 错误！未定义书签。 2.2.2 实验数据处理和分析 ............................................................... 错误！未定义书签。 2.2.3 建树 ........................................................................................... 错误！未定义书签。 3 实验结果分析 ................................................................................. 错误！未定义书签。 3.1 本实验所研究的8种鱼的分类 .................................................. 错误！未定义书签。 3.2 鲤科鱼类COX2基因序列分析.................................................. 错误！未定义书签。 3.2.1 COX2基因序列多态位点及信号位点..................................... 错误！未定义书签。 3.2.3 COX2基因的遗传密码及其氨基酸组成................................. 错误！未定义书签。 3.2.4 COX2基因的遗传距离............................................................. 错误！未定义书签。 3.2.5 利用COX2基因进行的系统发育重建................................... 错误！未定义书签。

环境系统分析教程认识与感受

环境系统分析教程认识与感受环境系统分析是以环境质量的变化规律、污染物对人体和生态的影响、环境自净能力以及有关环境工程技术原理为依据，运用系统工程学的理论和方法，研究如何建立起一个合理的环境污染预防控制系统的数学模型，并研究如何利用它来分析各种污染控制过程可调因素（或各种可替换方案）对环境目标或费用、能耗等的影响，以及寻求最优决策方案。环境系统分析的建立是汇聚在诸多理论基础如环境科学、环境经济学、环境工程学和系统工程学的基本理论（如运筹学）等和专门技术基础如数学建模、计算科学、环境影响评估方法、生命周期评估、系统化的图与网络分析方法之上的。环境系统分析是进行环境影响评价（尤其是区域或战略环境影响评价）、环境规划、环境决策等环境管理工作的重要工具和途径，在与环境科学的交叉学科中也得到广泛应用。环境系统分析是环境科学与工程的基础学科之一，它以模型化为主要手段描述环境系统特征，模拟和揭示环境系统的发展与变化规律及其与社会经济系统的关系，并通过最优化与科学决策方法对环境系统的结构与运行、对环境-人类社会经济的协调发展做出最佳选择。通过学习我们需要了解污染物在水体和大气中的迁移、扩散和变化规律，建立相应的环境系统模型；了解湖泊、水库水体富营养化的原因和水体富营养化的控制技术；掌握建立环境数学模型的一般知识；掌握区域性环境污染控制系统规划的基本原理和方法；建立采用最优化技术求解水污染控制系统规划问题的概念，并有能力解决一般性问题。通过对这门课程

的学习，我们对环境系统的分析方法有了一定的了解，它的最大特征是追求环境系统的最优化。环境系统分析的最优化方法的选用主要有对确定性问题，可采用线性规划、动态规划、非线性规划、整体规划等。对非确定性问题，可用马尔可夫过程，排队论，对策论等方法进行最优化。有的系统优化问题还应用网络理论、图论和模糊数学等进行最优化。在这门课程中我们学习了白箱模型；黑箱模型；灰箱模型；环境质量基本模型等模型。学习怎样利用这些模型合理的处理实际问题。环境系统分析是一门综合性很强的课程，其中涉及到数学、物理、化学、生物学、工程等相关领域的背景知识。抽象性和逻辑性强，不易学习。通过老师的教学，建立和强化了我们的系统意识，了解了系统分析方法学并认识环境系统内部各组成部分之间、环境质量和社会经济发展之间的对立统一关系，从而建立起环境系统中各要素的数学模型以及系统的最优化模型，以寻求最佳的污染防治体系以及最佳的经济结构和经济布局，实现经济效益、环境效益和社会效益的统一。

系统发育树构建方法优劣

1．邻接法邻接法(neighbor-joiningmethod，NJ)由Saitou和Nei(1987)提出，NJ法是基于最小进化原理经常被使用的一种算法，它不检验所有可能的拓扑结构，能同时给出拓扑结构和分支长度。在重建系统发生树时，它取消了UPGMA法所做的假定，认为在进化分支上，发生趋异的次数可以不同。最近的计算机模拟已表明它是最有效的基于距离数据重建系统树的方法之一。该方法通过确定距离最近(或相邻)的成对分类单位来使系统树的总距离达到最小。它的特点是重建的树相对准确，假设少，计算速度快，只得一棵树。其缺点主要表现在将序列上的所有位点等同对待，且所分析序列的进化距离不能太大。故NJ法适用于进化距离不大，信息位点少的短序列。邻接法在距离建树中经常会用到，而不用理会使用什么样的优化标准。完全解析出的进化树是通过对完全没有解析出的“星型”进化树进行“分解”得到的，分解的步骤是连续不断地在最接近(实际上是最孤立的)的序列对中插入树枝，而保留进化树的终端。于是，最接近的序列对被巩固了，而“星型”进化树被改善了，这个过程将不断重复。这个方法相对而言很快，也就是说，对于一个50个序列的进化树，只需要若干秒甚至更少。 2．最大简约法最大简约法(maximum parsimony method，MP)最早是基于形态特征分类的需要发展起来的，具体的算法有许多不同版本，其中有些已被广泛地应用于分子进化研究中。利用MP方法重建系统发生树，实际上是一个对给定OTUs其所有可能的树进行比较的过程。对某一个可能的树，首先对每个位点祖先序列的核苷酸组成做出推断，然后统计每个位点用来阐明差异的核苷酸最小替换数目。在整个树中，所有信息简约位点最小核苷酸替换数的总和称为树的长度(常青和周开亚，1998)。MP法是一种优化标准，这种标准遵循“奥卡姆剃刀原则(Occam’S Razor principle)”：对数据最好的解释也是最简单的，而最简单的所需要的特别假定也最少。MP法基于进化过程中所需核苷酸(或氨基酸)替代数目最少的假说，对所有可能正确的拓扑结构进行计算并挑选出所需替代数最小的拓扑结构作为最优系统树，也就是通过比较所有可能树，选择其中长度最小的树作为最终的系统发生树，即最大简约树(maximum parsimony tree)。与其他建树方法相比，MP法无需引入处理核苷酸或者氨基酸替代时所必需的假设(替代模型)。同时，MP法对于分析某些特殊的分子数据(如插入序列和插入／缺失)有用。在分析的序列位点上没有回复突变或平行突变，且被检验的序列位点数很大的时候，MP法能够获得正确的(真实)系统树。但MP法推导的树不是唯一的，在分析序列上存在较多的回复突变或平行突变，而被检验的序列位点数又比较少的时候，最大简约法可能会出现建树错误。故MP法适用于序列残基差别小，具有近似变异率，包含信息位点比较多的长序列。 3．最大似然法最大似然法(maximum likelihood method，MI。)是20世纪60年代末期由于对地生物信息学分析实践震波和水声信号等处理的需要而发展起来的一种非线性谱估计方法。最早由凯佩用这种方法对空间阵列接收信号进行频率波数谱估值，后来推广到对时问信号序列的功率谱估值。最大似然法最早应用于系统发育分析是在对基因频率数据的分析上。其原理是考虑到每个位点出现残基的似然值，将每个位置所有可能出现的残基替换概率进行累加，产生特定位点的似然值。MI。法对所有可能的系统发育树都计算似然函数，似然函数值最大的那棵树即为最可能的系统发育树。利用最大似然法来推断一组序列的系统发生树，需首先确定序列进化的模型，如Jukes—Cantor模型、Kimura二参数模型及一般二参数模型等。在进化模型选择合理的情况下，MI。法是与进化事实吻合最好的建树算法。其缺点是计算强度非常大，极为耗时。

系统发育树构建方法研究_冯思玲

中图分类号:TP39 文献标识码:A 文章编号:1009-2552(2009)06-0038-03 系统发育树构建方法研究冯思玲 (海南大学信息科学技术学院,海口570228) 摘要:系统发育树的构建与分析是生物信息学中的一个重要分支。研究系统发育树可以重建祖先序列和估计分歧时间。对构建系统发育树的四种方法进行概述,主要包括基于距离的方法,简约法(MP),最大似然法(ML)和贝叶斯树估计方法。并对基于这些方法的软件进行简要介绍,最后对系统发育树构建技术中的难点问题进行分析。关键词:系统发育树;基于距离方法;简约法;最大似然法;贝叶斯树估计方法Research on method of the construction of phylogenetic trees FENG Si ling (School of Information Science&Technology,Hainan University,Haikou570228,China) Abstract:The construction and analysis of phylogenetic trees is an important part in bioinformatics.The main objectives of studying the construction of phylogenetic trees can reconstruct ancestors sequences and estimate the time of divergence.The four methods about construc ting phylogenetic trees are described,which are based on distance method,parsimony method,maximum likelihood methods and Bayesian tree estimate methods. The software package based on these methods is briefly introduced,at last the difficult points about tree building techniques are analyzed. Key words:phylogenetic trees;distance based methods;parsimony method;maximum likelihood methods; Bayesian tree estimate methods 0 引言系统发育树也称系统进化树(phylogenetic tree),它是用类似树状分支的图来表示各种(类)生物之间的亲缘关系,通过对生物序列的研究来推测物种的进化历史。主要是通过DNA序列,蛋白质序列,蛋白质结构等来构建系统发育树,或者通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立结构进化树。研究系统发育树的目的可以重建祖先序列性状;估计来自于同一个祖先的不同生物之间的分歧时间;识别和疾病关联的突变等。近些年随着基因数据的爆炸增长,系统发育树的构建越来越流行。基于分子的进化研究已经应用到许多方面,如基因进化,物群划分,交配系统,父亲身份测试,环境监视以及已经转移物种的疾病源的研究等。从数学的观点看,系统发育树是一颗树叶有标签的有根二叉树,根表示祖先序列。系统发育树主要是它的拓扑结构和分支长度。分支长度表示突变的时间。拓扑表示树的分支模式,有N个叶子可生成无根树的数目根据Schroder公式有(2N-5)!!,对每个无根树有(2N-3)种可能的分枝。因此,有根树的树目是(2N-3)(2N-5)!!=(2N-3)!![1]。系统发育树的叶子在生物上称作操作分类单元OTU(operational taxonomic units),OTU代表构建的系谱的不同生物。构建系统发育树所用的数据用矩阵X N K表示,N表示氨基酸或核苷酸的序列数,即有N个叶子的树。K表示序列的字符数(列数)。构建树分析主要有二步:第一步用X N K矩阵产生树 T并收稿日期:2009-03-06 基金项目:海南省自然科学基金项目(80637);海南大学校科研基金项目(kyjj0609) 作者简介:冯思玲(1973-),女,讲师,硕士,研究方向为生物信息学算法研究。 38

分子系统发育分析

分子系统发育分析Molecular Phylogenetics 杨茜北京大学生命科学学院 2011-01-09

提纲2345案例：分析NADH1序列系统发育的基本概念系统发育树的构建方法系统发育分析的软件参考和推荐书目 elines 5 1

系统发育的相关概念系统发育学研究物种进化和系统分类系统发育分析推断或评估这些进化和分类关系系统发育树通过系统发育分析所推断出来的进化关系一般用分支图来描述

系统发育(Phylogeny) 系统发育分析是研究物种进化和系统分类的一种方法，其常用一种类似树状分支的图形来概括各种（类）生物之间的亲缘关系，这种树状分支的图形称为系统发育树。系统发育树描述了同一谱系的进化关系，包括了分子进化、物种进化以及分子进化和物种进化的综合。通过系统发育树，我们可以找到亲缘关系最近的物种或者基因，探索基因的功能，追溯基因的起源。在现代系统发育学研究中，研究的重点已经不再是生物的形态学特征或者其他特性，而主要是序列信息。虽然已有了大量的用于系统发育的算法、过程和计算机程序，但是这些方法的可靠性和实用性还是依赖于数据的结构和大小。系统发育分析一般没有实验基础，因为系统发育的发生过程都是已经完成的历史，只能去推断或者评估，而无法重现。

系统发育分析的概念性步骤系统发育分析生物数据序列比对建立替代模型构建系统发育树评估系统发育树

选择序列时的注意事项 1.序列有指定的来源并且正确无误 2.序列是同源的，即所有的序列都起源于同一祖先序列 3.样本序列之间的差异包含了足以解决感兴趣的问题的信息位点。 4.样本序列是随机进化的。 5.序列中的每一个位点的进化都是独立的。

自己总结的有关系统发育的各个分析方法

Mrbayes3.1 1、输入"filename.nex"文件：将生成的"filename.nex"文件放在Mrbayes同一目录下，打开Mrbayes，在Mrbayes> 后输入exe filename.nex。 2、设定模型和参数：输入lset nst=6 rates=invgamma，其中，lset是model set（模型设置）命令，nst=6即将替代模型设置为GTR（General Time Reversible普通时间可逆）模型，rates=invgamma是将位点间差异比率设为invgamma。 3、运算：输入mcmc ngen=10000 samplefreq=10，保证在后面的可能性分布中probability distribution至少取到1000个样品。默认取样频率：every 100th generation。如果分裂频率分支频率split frequencies的标准偏差standard deviation在100,000代generations以后低于0.01，当程序询问：“Continue the analysis? (yes/no)”，回答no；如果高于0.01，yes继续直到该值低于0.01。 4、结果查看：输入sump burnin=250（在此为1000个样品，即任何相当于你取样的25％的值），参数总结summarize the parameter，程序会输出一个关于样品（sample）的替代模型参数的总结表，包括mean，mode和95 % credibility interval of each parameter，要保证所有参数PSRF（the potential scale reduction factor）的值接近1.0，如果不接近，分析时间要延长。输入sumt burnin=250，即舍弃250个老化样本后对各进化树进行总结。程序会输出一个具有每一个分支的posterior probabilities的树以及一个具有平均枝长mean branch lengths的树。这些树会被保存在一个可以由treeview等读取的树文件中。 Modeltest3.7 1、将modelblockPAUPb10.txt全部粘贴到分析文件filename.nxe（记事本打开）后面，重命名为test.model.nex。 2、用PAUP打开test.model.nex，开始运算，生成两个文件（同一目录下），model.scores和modelfit.log。 2、将Modeltest3.7win.exe和分析文件model.scores放在同一目录下。（此前，可以先安装DOShere软件）在包括以上两文件的文件夹，右键，选择Command Prompt Here。 3、输入Modeltest3.7win.exe 4、输入Modeltest3.7win.exeoutfile，生成outfile文件。 5、记事本打开outfile文件，文件给出了两个最优模型。 Phyml_win32建ML树 1、将Phyml_win32.exe和分析文件filename.phy放在同一个文件夹下 2、打开Phyml_win32.exe，输入filename.phy 3、输入B，输入1000，即1000次重复 4、输入M，选择模型 5、输入Y，运算

环境系统分析第一章思考题与参考答案

《环境系统分析》第一章思考题与参考答案 1.简述系统分析的基本原理和方法。参考答案：系统分析是针对所研究的问题的整体，对组成系统的各个要素及其外部条件进行全面的、互相联系的和发展的研究，以找出解决问题的最佳方案或替代方案。为此，系统分析过程必须遵循整体性原理、最优性原理、阶层性原理、动态性原理和环境适应性原理。整体性原理是指，构成系统的各个元素是以系统最优为总目标结合在一起的，各个元素的状态及状态之间的联系都必须服从这一总目标。整体性原理是系统分析最主要、最基本的原理。最优性原理是指系统分析的结果应力求系统的最优解，通过调整各元素之间的相互关系来寻求系统的最佳结构。阶层性原理是指任何一个系统都存在着层次结构，这种结构形成了系统内部各元素的主次和重要性程度，是形成有序系统的重要依据。动态性原理是指一个系统总是处在不断运动发展之中，必须用发展的观点来探寻系统的最优解。环境适应性原理是指一个系统总是处在外部环境的约束之中，只有适应环境才能生存和发展，环境适应性是建立系统约束的重要依据。系统分析的基本方法是分解、综合和评价的反复协调，达到系统的最优化。分解和综合是系统分析的两个主要环节。分解就是研究和描述组成系统的各个要素的特征，掌握各要素的变化规律，也就是模型化；综合是研究各要素之间的联系和有机组合，达到系统的总目标最优，也就是最优化。 2.系统的各个特征在最优化模型中各起着什么作用？参考答案：整体性特征是构造系统模型的出发点，只有那些与系统有关的元素及其变量才能进入模型；相关性特征是识别模型内部各元素之间的关系、构成系统模型的基础；目的性特征则是建立系统目标和目标体系的指导和依据；阶层性特征表明模型中各个变量的层次关系，是辨别变量重要性的依据；环境适应性则为建立系统外部约束条件提供了基础。 3.数学模型在系统分析中起什么作用？系统分析是否一定要应用数学模型？参考答案：数学模型是系统分析的工具和手段，这具体表现在三个方面：抽象化：运用数学方法对现实世界进行抽象，通过数学符号及各种表达形式建立研究客体的内部规律及其与外部的联系，从而可以运用数学规律来解决实际问题。定量化：用数学模型表达系统各元素之间的定性和定量的关系，为系统设计和系统实施提供依据。最优化：通过最优化数学模型，对系统各元素之间的关系求得最优组合。作为一种思想方法的应用，系统分析不一定要应用数学模型。但作为定量化的分析，以求得问题的最优解，就必须应用数学模型。随着系统科学的发展和计算机应用的日益普及，数学模型的应用将会越来越广泛。

(环境管理)SQL系统环境

第8章SQL系统环境本章主要讨论数据库的设计步骤以及每个步骤用到的方法。数据库的设计主要有四个步骤：需求分析、概念设计、逻辑设计和物理设计。本章的主要知识点包括：学习要点1、嵌入式SQL 学习要点2、有关事物的嵌入式SQL 学习要点3、SQL环境学习要点4、数据库的完整性学习要点5、SQL中的安全和用户权限学习要点1、嵌入式SQL 1、什么是嵌入式SQL 当一个程序既要访问数据库，又要处理数据时，把SQL语言嵌入程序设计语言即宿主语言中，将SQL语言访问数据库的功能和宿主语言的数据处理功能相结合，是目前解决该问题的最有效途径。这样使用的SQL称为嵌入式SQL。 2、如何实现嵌入式SQL对于不同的DBMS和宿主语言，实现嵌入式SQL的方法基本相同，只是在一些特殊的地方略有差异。实现嵌入式SQL语言主要是实现说明部分的嵌入和执行部分的嵌入。以SQL嵌入C语言为例说明实现嵌入式SQL的方法。说明部分C语言和SQL语言之间是通过共享变量来进行数据的传送。共享变量是由宿主语言程序定义、用SQL的DECLARE语句说明，以后可在SQL语句中引用的宿主语言变量。共享变量需用以“EXEC SQL”为前缀的说明语句说明，在说明语句的结尾加“；”。在SQL语句中引用共享变量时，每个共享变量前要加“：”。在共享变量中，有一个系统定义的特殊变量，称为SQLSTA TE。在每执行一个SQL语句时，都要返回一个SQLSTA TE代码，来表示这个SQL语句是否执行成功等情况。当SQLSTATE为全零时，表示SQL语句执行成功；当SQLSTATE为“02000”时，表示SQL语句已执行，但未找到元组。所有SQL语句中用到的共享变量，除系统定义的（例如SQLSTA TE）以外，都必须在宿主程序中进行说明。说明语句的开头行为： EXEC SQL BEGIN DECLARE SECTION；说明语句的结束行为： EXEC SQL END DECLARE SECTION；在一个说明语句中定义几个共享变量，它们都是按照C语言的数据类型和格式进行定义的。 EXEC SQL BEGIN DECLARE SECTION； char sno[6],sname[20]； int sage； char SQLSTATE[6]； EXEC SQL END DECLARE SECTION；执行部分插入语句的格式为：