当前位置：文档之家› 数据库结构分类

数据库结构分类

1、层次数据库结构

层次数据库结构将数据通过一对多或父结点对子结点的方式组织起来。一个层次数据库中，根表或父表位于一个类似于树形结构的最上方，它的子表中包含相关数据。层次数据库模型的结构就像是一棵倒转的树。

优点：

?快速的数据查询

?便于管理数据的完整性

缺点：

?用户必须十分熟悉数据库结构

?需要存储冗余数据

2、网状数据库结构

网状数据库结构是用连接指令或指针来组织数据的方式。数据间为多对多的关系。矢量数据描述时多用这种数据结构。

优点：

?快速的数据访问

?用户可以从任何表开始访问其他表数据

?便于开发更复杂的查询来检索数据

缺点：

?不便于数据库结构的修改

?数据库结构的修改将直接影响访问数据库的应用程序

?用户必须掌握数据库结构

3、关系数据库结构

这就目前最流行的数据库结构了。数据存储的主要载体是表，或相关数据组。有一对一、一对多、多对多三种表关系。表关联是通过引用完整性定义的，这是通过主码和外码（主键或外键）约束条件实现的。

优点：

?数据访问非常快

?便于修改数据库结构

?逻辑化表示数据，因此用户不需要知道数据是如何存储的

?容易设计复杂的数据查询来检索数据

?容易实现数据完整性

?数据通常具有更高的准确性

?支持标准SQL语言

缺点：

?很多情况下，必须将多个表的不同数据关联起来实现数据查询

?用户必须熟悉表之间的关联关系

?用户必须掌握SQL语言

4、面向对象数据库结构

它允许用对象的概念来定义与关系数据库交互。值得注意的是面向对象数据库设计思想与面向对象数据库管理系统理论不能混为一谈。前者是数据库用户定义数据库模式的思路，后者是数据库管理程序的思路。

面向对象数据库中有两个基本的结构：对象和字面量。对象是一种具有标识的数据结构，这些数据结构可以用来标识对象之间的相互关系。字面量是与对象相关的值，它没有标识符。

优点：

?程序员只需要掌握面向对象的概念，而不要掌握与面向对象概念以及关系数据库有关的存储

?对象具有继承性，可以从其他对象继承属性集

?大量应用软件的处理工作可以自动完成

?从理论上说，更容易管理对象

?面向对象数据模型与面向对象编程工具更兼容

缺点：

?由于面向对象数据库不支持传统的编程方法，所以用户必须理解面向对象概念

?目前面向对象数据库模型还没有统一的标准

?由于面向对象数据库出现的时间还不长，稳定性还是一个值得关注的焦点

5、另外

还有两种：古老的平面文件数据库结构和较新的对象关系数据库结构。当然现在还有人用纯XML文档作数据库。

Oracle数据库的空间数据类型

Oracle数据库中空间数据类型随着GIS、CAD/CAM的广泛应用，对数据库系统提出了更高的要求，不仅要存储大量空间几何数据，且以事物的空间关系作为查询或处理的主要内容。Oracle数据库从9i开始对空间数据提供了较为完备的支持，增加了空间数据类型和相关的操作，以及提供了空间索引功能。 Oracle的空间数据库提供了一组关于如何存储，修改和查询空间数据集的SQL schema与函数。通过MDSYS schema规定了所支持的地理数据类型的存储、语法和语义，提供了R-tree空间数据索引机制，定义了关于空间的相交查询、联合查询和其他分析操作的操作符、函数和过程，并提供了处理点，边和面的拓扑数据模型及表现网络的点线的网络数据模型。 Oracle中各种关于空间数据库功能主要是通过Spatial组件来实现。从9i版本开始，Oracle Spatial空间数据库组件对存储和管理空间数据提供了较为完备的支持。其主要通过元数据表、空间数据字段（即SDO_GEOMETRY字段）和空间索引来管理空间数据，并在此基础上提供一系列空间查询和空间分析的函数，让用户进行更深层次的GIS应用开发。Oracle Spatial使用空间字段SDO_GEOMETRY存储空间数据，用元数据表来管理具有SDO_GEOMETRY字段的空间数据表，并采用R树索引和四叉树索引技术来提高空间查询和空间分析的速度。 1、元数据表说明。 Oracle Spatial的元数据表存储了有空间数据的数据表名称、空间字段名称、空间数据的坐标范围、坐标参考信息以及坐标维数说明等信息。用户必须通过元数据表才能知道ORACLE数据库中是否有Oracle Spatial的空间数据信息。一般可以通过元数据视图（USER_SDO_GEOM_METADATA）访问元数据表。元数据视图的基本定义为： ( TABLE_NAME V ARCHAR2(32), COLUMN_NAME V ARCHAR2(32), DIMINFO MDSYS.SDO_DIM_ARRAY, SRID NUMBER

蛋白质序列分析

蛋白质序列、性质、功能和结构分析基于网络的蛋白质序列检索与核酸类似，从NCBI或利用SRS系统从EMBL 检索。 1、疏水性分析 ExPASy的ProtScale程序（https://www.doczj.com/doc/2a753672.html,/cgi-bin/protscale.pl）可用来计算蛋白质的疏水性图谱。输入的数据可为蛋白质序列或SWISS-PROT数据库的序列接受号。也可用BioEdit、DNAMAN等软件进行分析。 2、跨膜区分析蛋白质跨膜区域分析的网络资源有： TMPRED：https://www.doczj.com/doc/2a753672.html,/software/TMPRED_form.html PHDhtm: http:www.embl-heidelberg.de/Services/sander/predictprotein/predictpro tein.html MEMSAT: ftp://https://www.doczj.com/doc/2a753672.html, 3、前导肽和蛋白质定位一般认为，蛋白质定位的信息存在于该蛋白自身结构中，并且通过与膜上特殊受体的相互作用得以表达。这就是信号肽假说的基础。这一假说认为，穿膜蛋白质是由mRNA编码的。在起始密码子后，有一段疏水性氨基酸序列的RNA片段，这个氨基酸序列就称为信号序列（signal sequence）。蛋白质序列的信号肽分析可联网到http://genome.cbs.dtu.dk /services/SignalP/或其二版网址 http://genome.cbs.dtu.dk/services/SignalP-2.0/。该服务器也提供利用 e-mail进行批量蛋白质序列信号肽分析的方案（http://genome.cbs.dtu.dk/services /SignalP/mailserver.html），e-mail 地址为signalp@ genome.cbs.dtu.dk。蛋白质序列中含有的信号肽序列将有助于它们向细胞内特定区域的移动，如前导肽和面向特定细胞器的靶向肽。在线粒体蛋白质的跨膜运输过程中，通过线粒体膜的蛋白质在转运之前大多数以前体形式存在，它由成熟蛋白质和N端延伸出的一段前导肽或引肽（leader peptide）共同组成。迄今有40多种线粒体蛋白质前导肽的一级结构被阐明，它们约含有20~80个氨基酸残基，当前体蛋白跨膜时，前导肽被一种或两种多肽酶所水解转变成成熟蛋白质，同时失去继续跨膜能力。前导肽一般具有如下性质：①带正电荷的碱性氨基酸（特别是精氨酸）含量较丰富，它们分散于不带电荷的氨基酸序列中间；②缺失带负电荷的酸性

蛋白质结构分析原理及工具-文献综述

蛋白质结构分析原理及工具（南京农业大学生命科学学院生命基地111班）摘要：本文主要从相似性检测、一级结构、二级结构、三维结构、跨膜域等方面从原理到方法再到工具，系统地介绍了蛋白质结构分析的常用方法。文章侧重于工具的列举，并没有对原理和方法做详细的介绍。文章还列举了蛋白质分析中常用的数据库。关键词：蛋白质；结构预测；跨膜域；保守结构域 1 蛋白质相似性检测蛋白质数据库。由一个物种分化而来的不同序列倾向于有相似的结构和功能。物种分化后形成的同源序列称直系同源，它们通常具有相似的功能；由基因复制而来的序列称为旁系同源，它们通常有不同的功能[1]。因此，推测全新蛋白质功能的第一步是将它的序列与进化上相关的已知结构和功能的蛋白质序列比较。表一列出了常用的蛋白质序列数据库和它们的特点。表一常用蛋白质数据库网址可能有更新氨基酸替代模型。进化过程中，一种氨基酸残基会有向另一种氨基酸残基变化的倾向。氨基酸替代模型可用来估计氨基酸替换的速率。目前常用的替代模型有Point Accepted Mutation (PAM)矩阵、BLOck SUbstitution Matrix (BLOSUM)矩阵[2]、JTT模型[3]。序列相似性搜索工具。序列相似性搜索又分为成对序列相似性搜索和多序列相似性搜索。成对序列相似性搜索通过搜索序列数据库从而找到与查询序列相似的序列。分为局部联配和全局联配。常用的局部联配工具有BLAST和SSEARCH，它们使用了Smith-Waterman 算法。全局联配工具有FASTA和GGSEARCH，基于Needleman-Wunsch算法。多序列相似性搜索常用于构建系统发育树，这里不阐述。表二列举了常用的成对序列相似性比对搜索工具

数据库结构分类

1、层次数据库结构层次数据库结构将数据通过一对多或父结点对子结点的方式组织起来。一个层次数据库中，根表或父表位于一个类似于树形结构的最上方，它的子表中包含相关数据。层次数据库模型的结构就像是一棵倒转的树。优点： ?快速的数据查询 ?便于管理数据的完整性缺点： ?用户必须十分熟悉数据库结构 ?需要存储冗余数据 2、网状数据库结构网状数据库结构是用连接指令或指针来组织数据的方式。数据间为多对多的关系。矢量数据描述时多用这种数据结构。优点： ?快速的数据访问 ?用户可以从任何表开始访问其他表数据 ?便于开发更复杂的查询来检索数据缺点： ?不便于数据库结构的修改 ?数据库结构的修改将直接影响访问数据库的应用程序 ?用户必须掌握数据库结构 3、关系数据库结构这就目前最流行的数据库结构了。数据存储的主要载体是表，或相关数据组。有一对一、一对多、多对多三种表关系。表关联是通过引用完整性定义的，这是通过主码和外码（主键或外键）约束条件实现的。

优点： ?数据访问非常快 ?便于修改数据库结构 ?逻辑化表示数据，因此用户不需要知道数据是如何存储的 ?容易设计复杂的数据查询来检索数据 ?容易实现数据完整性 ?数据通常具有更高的准确性 ?支持标准SQL语言缺点： ?很多情况下，必须将多个表的不同数据关联起来实现数据查询 ?用户必须熟悉表之间的关联关系 ?用户必须掌握SQL语言 4、面向对象数据库结构它允许用对象的概念来定义与关系数据库交互。值得注意的是面向对象数据库设计思想与面向对象数据库管理系统理论不能混为一谈。前者是数据库用户定义数据库模式的思路，后者是数据库管理程序的思路。面向对象数据库中有两个基本的结构：对象和字面量。对象是一种具有标识的数据结构，这些数据结构可以用来标识对象之间的相互关系。字面量是与对象相关的值，它没有标识符。优点： ?程序员只需要掌握面向对象的概念，而不要掌握与面向对象概念以及关系数据库有关的存储 ?对象具有继承性，可以从其他对象继承属性集 ?大量应用软件的处理工作可以自动完成 ?从理论上说，更容易管理对象 ?面向对象数据模型与面向对象编程工具更兼容缺点：

数据库数据类型的使用与区别

数据库数据类型的使用与区别整型数据类型: 1、INT （INTEGER） INT （或INTEGER）数据类型存储从-2的31次方（-2 ，147 ，483 ，648）到2的31次方-1 （2 ，147 ，483，647）之间的所有正负整数。每个INT 类型的数据按4 个字节存储，其中1 位表示整数值的正负号，其它31 位表示整数值的长度和大小。 2、SMALLINT SMALLINT 数据类型存储从-2的15次方（ -32， 768）到2的15次方-1（ 32 ，767 ）之间的所有正负整数。每个SMALLINT 类型的数据占用2 个字节的存储空间，其中1 位表示整数值的正负号，其它15 位表示整数值的长度和大小。 3、TINYINT TINYINT数据类型存储从0 到255 之间的所有正整数。每个TINYINT类型的数据占用1 个字节的存储空间。 4、BIGINT BIGINT 数据类型存储从-2^63 （-9 ，223， 372， 036， 854， 775， 807）到2^63-1（ 9， 223， 372， 036 ，854 ，775， 807）之间的所有正负整数。每个BIGINT 类型的数据占用8个字节的存储空间。浮点数据类型: 浮点数据类型用于存储十进制小数。浮点数值的数据在SQL Server 中采用上舍入（Round up 或称为只入不舍）方式进行存储。所谓上舍入是指，当（且仅当）要舍入的数是一个非零数时，对其保留数字部分的最低有效位上的数值加1 ，并进行必要的进位。若一个数是上舍入数，其绝对值不会减少。如：对3.14159265358979 分别进行 2 位和12位舍入，结果为 3.15 和3.141592653590。 1、REAL 数据类型 REAL数据类型可精确到第7 位小数，其范围为从-3.40E -38 到3.40E +38。每个REAL类型的数据占用4 个字节的存储空间。 2、FLOAT FLOAT数据类型可精确到第15 位小数，其范围为从-1.79E -308 到1.79E +308。每个FLOAT 类型的数据占用8 个字节的存储空间。 FLOAT数据类型可写为FLOAT[ n ]的形式。n 指定FLOAT 数据的精度。n 为1到15 之间的整数值。当n 取1 到7 时，实际上是定义了一个REAL 类型的数据，系统用4 个字节存储它；当n 取8 到15 时，系统认为其是FLOAT 类型，用8 个字节存储它。 3、DECIMAL DECIMAL数据类型可以提供小数所需要的实际存储空间，但也有一定的限制，您可以用2 到17 个字节来存储从-10的38次方-1 到10的38次方-1 之间的数值。可将其写为DECIMAL[ p [s] ]的形式，p 和s 确定了精确的比例和数位。

几种数据库类型说明及发展历史

几种数据库类型说明及发展历史 1.IBM 的DB2 作为关系数据库领域的开拓者和领航人，IBM在1977年完成了System R 系统的原型，1980年开始提供集成的数据库服务器—— System/38，随后是SQL/DSforVSE和VM，其初始版本与SystemR研究原型密切相关。DB2 forMVSV1 在1983年推出。该版本的目标是提供这一新方案所承诺的简单性，数据不相关性和用户生产率。1988年DB2 for MVS 提供了强大的在线事务处理（OLTP）支持，1989 年和1993 年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2 Universal Database 6.1则是通用数据库的典范，是第一个具备网上功能的多媒体关系数据库管理系统，支持包括Linux在内的一系列平台。 2.Oracle Oracle 前身叫SDL，由Larry Ellison 和另两个编程人员在1977创办，他们开发了自己的拳头产品，在市场上大量销售，1979 年，Oracle公司引入了第一个商用SQL 关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一，其产品支持最广泛的操作系统平台。目前Oracle 关系数据库产品的市场占有率名列前茅。 https://www.doczj.com/doc/2a753672.html,rmix Informix在1980年成立，目的是为Unix等开放操作系统提供专业的关系型数据库产品。公司的名称Informix便是取自Information 和Unix的结合。Informix第一个真正支持SQL语言的关系数据库产品是Informix SE （StandardEngine）。InformixSE是在当时的微机Unix环境下主要的数据库产品。它也是第一个被移植到Linux上的商业数据库产品。 4.Sybase Sybase公司成立于1984年，公司名称“Sybase”取自“system”和“database”相结合的含义。Sybase公司的创始人之一Bob Epstein 是Ingres 大学版（与System/R同时期的关系数据库模型产品）的主要设计人员。公司的第一个关系数据库产品是1987年5月推出的Sybase SQLServer1.0。Sybase首先提

数据库表结构设计参考

表名外部单位表（DeptOut）列名数据类型（精度范围）空/非空约束条件外部单位ID 变长字符串(50) N 主键类型变长字符串(50) N 单位名称变长字符串(255) N 单位简称变长字符串(50) 单位全称变长字符串(255) 交换类型变长字符串(50) N 交换、市机、直送、邮局单位邮编变长字符串(6) 单位标识(英文) 变长字符串(50) 排序号整型(4) 交换号变长字符串(50) 单位领导变长字符串(50) 单位电话变长字符串(50) 所属城市变长字符串(50) 单位地址变长字符串(255) 备注变长字符串(255) 补充说明该表记录数约3000条左右，一般不做修改。初始化记录。表名外部单位子表（DeptOutSub）列名数据类型（精度范围）空/非空约束条件外部子单位ID 变长字符串(50) N 父ID 变长字符串(50) N 外键单位名称变长字符串(255) N 单位编码变长字符串(50) 补充说明该表记录数一般很少表名内部单位表（DeptIn）列名数据类型（精度范围）空/非空约束条件内部单位ID 变长字符串(50) N 主键类型变长字符串(50) N 单位名称变长字符串(255) N 单位简称变长字符串(50) 单位全称变长字符串(255) 工作职责排序号整型(4) 单位领导变长字符串(50) 单位电话（分机）变长字符串(50) 备注变长字符串(255)

补充说明该表记录数较小（100条以内），一般不做修改。维护一次后很少修改表名内部单位子表（DeptInSub）列名数据类型（精度范围）空/非空约束条件内部子单位ID 变长字符串(50) N 父ID 变长字符串(50) N 外键单位名称变长字符串(255) N 单位编码变长字符串(50) 单位类型变长字符串(50) 领导、部门排序号Int 补充说明该表记录数一般很少表名省、直辖市表（Province）列名数据类型（精度范围）空/非空约束条件ID 变长字符串(50) N 名称变长字符串(50) N 外键投递号变长字符串(255) N 补充说明该表记录数固定表名急件电话语音记录表（TelCall）列名数据类型（精度范围）空/非空约束条件ID 变长字符串(50) N 发送部门变长字符串(50) N 接收部门变长字符串(50) N 拨打电话号码变长字符串(50) 拨打内容变长字符串(50) 呼叫次数Int 呼叫时间Datetime 补充说明该表对应功能不完善，最后考虑此表表名摄像头图像记录表（ScreenShot）列名数据类型（精度范围）空/非空约束条件ID 变长字符串(50) N 拍照时间Datetime N 取件人所属部门变长字符串(50) N 取件人用户名变长字符串(50) 取件人卡号变长字符串(50) 图片文件BLOB/Image

蛋白质数据库

生物芯片北京国家工程研究中心湖南中药现代化药物筛选分中心暨湖南涵春生物有限公司常用数据库名录 1、蛋白质数据库 PPI - JCB 蛋白质与蛋白质相互作用网络 ?Swiss-Prot - 蛋白质序列注释数据库 ?Kabat - 免疫蛋白质序列数据库 ?PMD - 蛋白质突变数据库 ?InterPro - 蛋白质结构域和功能位点 ?PROSITE - 蛋白质位点和模型 ?BLOCKS - 生物序列分析数据库 ?Pfam - 蛋白质家族数据库 [镜像： St. Louis (USA), Sanger Institute, UK, Karolinska Institutet (Sweden)] ?PRINTS - 蛋白质 Motif 数据库 ?ProDom - 蛋白质结构域数据库 (自动产生) ?PROTOMAP - Swiss-Prot蛋白质自动分类系统 ?SBASE - SBASE 结构域预测数据库 ?SMART - 模式结构研究工具 ?STRING - 相互作用的蛋白质和基因的研究工具

?TIGRFAMs - TIGR 蛋白质家族数据库 ?BIND - 生物分子相互作用数据库 ?DIP - 蛋白质相互作用数据库 ?MINT - 分子相互作用数据库 ?HPRD - 人类蛋白质查询数据库 ?IntAct - EBI 蛋白质相互作用数据库 ?GRID - 相互作用综合数据库 ?PPI - JCB 蛋白质与蛋白质相互作用网络 2、蛋白质三级结构数据库 ?PDB - 蛋白质数据银行 ?BioMagResBank - 蛋白质、氨基酸和核苷酸的核磁共振数据库?SWISS-MODEL Repository - 自动产生蛋白质模型的数据库 ?ModBase - 蛋白质结构模型数据库 ?CATH - 蛋白质结构分类数据库 ?SCOP - 蛋白质结构分类 [镜像: USA | Israel | Singapore | Australia] ?Molecules To Go - PDB数据库查询 ?BMM Domain Server - 生物分子模型数据库 ?ReLiBase - 受体/配体复合物数据库 [镜像： USA] ?TOPS - 蛋白质拓扑图 ?CCDC - 剑桥晶体数据中心 (剑桥结构数据库 (CSD))

常见主流数据库的分类与详细比较

常见主流数据库分类 1、IBM 的DB2 DB2是IBM著名的关系型数据库产品，DB2系统在企业级的应用中十分广泛。截止2003年，全球财富500强（Fortune 500）中有415家使用DB2，全球财富100强（Fortune100）中有96家使用DB2，用户遍布各个行业。2004年IBM的DB2就获得相关专利239项，而Oracle 仅为99项。DB2目前支持从PC到UNIX，从中小型机到大型机，从IBM到非IBM（HP及SUN UNIX 系统等）的各种操作平台。 IBM绝对是数据库行业的巨人。1968年IBM在IBM 360计算机上研制成功了IMS这个业界第一个层次型数据库管理系统，也是层次型数据库中最为著名和最为典型的。1970年，IBM E.F.Codd发表了业界第一篇关于关系数据库理论的论文“A Relational Model of Data for Large Shared DataBanks”，首次提出了关系模型的概念。1974年，IBM Don Chamberlin和Ray Boyce通过System R项目的实践，发表了论文“SEQUEL：A Structured English Query Language”，我们现在熟知SQL就是基于它发展起来的。IBM 在1983年发布了DATABASE 2（DB2）for MVS（内部代号为“Eagle”），这就是著名的DB2数据库。2001年IBM以10亿美金收购了Informix的数据库业务，这次收购扩大了IBM分布式数据库业务。2006 DB2 9作为第三代数据库的革命性产品正式在全球发布。作为关系数据库领域的开拓者和领航人，IBM在1977年完成了System R系统的原型，1980年开始提供集成的数据库服务器——System/38，随后是SQL/DSforVSE 和VM，其初始版本与SystemR研究原型密切相关。 DB2 forMVSV1 在1983年推出。该版本的目标是提供这一新方案所承诺的简单性，数据不相关性和用户生产率。1988年DB2 for MVS 提供了强大的在线事务处理（OLTP）支持，1989 年和1993 年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2 Universal Database 6.1则是通用数据库的典范，是第一个具备网上功能的多媒体关系数据库管理系统，支持包括Linux在内的一系列平台。 2、Oracle Oracle 前身叫SDL，由Larry Ellison 和另两个编程人员在1977创办，他们开发了自己的拳头产品，在市场上大量销售，1979 年，Oracle公司引入了第一个商用SQL 关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一，其产品支持最广泛的操作系统平台。目前Oracle关系数据库产品的市场占有率名列前茅。 Oracle公司是目前全球最大的数据库软件公司，也是近年业务增长极为迅速的软件提供与服务商。IDC(Internet Data Center)2007统计数据显示数据库市场总量份额如下：Oracle 44.1% IBM 21.3%Microsoft 18.3% Teradata 3.4% Sybase 3.4%。不过从使用情况看，BZ Research的2007年度数据库与数据存取的综合研究报告表明76.4%的公司使用了Microsoft

SQL数据库修改表结构

S Q L数据库修改表结构-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

SQL数据库修改表结构修改表结构包括：增加字段、删除字段、增加约束、删除约束、修改缺省值、修改字段数据类型、重命名字段、重命名表。所有这些动作都是用 ALTER TABLE 命令执行的。 1、增加字段 ALTER TABLE products ADD description text; 你也可以同时在该字段上定义约束，使用通常的语法： ALTER TABLE products ADD description text CHECK (description <> ''); 实际上，所有在CREATE TABLE里描述的可以应用于字段之选项都可以在这里使用。不过，我们要注意的是缺省值必须满足给出的约束，否则ADD 将会失败。另外，你可以在你正确填充了新字段的数值之后再增加约束（见下文）。 2、删除字段要删除一个字段，使用下面这样的命令： ALTER TABLE products DROP COLUMN description; 不管字段里有啥数据，都会消失。和这个字段相关的约束也会被删除。不过，如果这个字段被另外一个表的外键所引用，PostgreSQL 则不会隐含地删除该约束。你可以通过使用 CASCADE 来授权删除任何依赖该字段的东西：ALTER TABLE products DROP COLUMN description CASCADE; 3、增加约束要增加一个约束，使用表约束语法。比如： ALTER TABLE products ADD CHECK (name <> ''); ALTER TABLE products ADD CONSTRAINT some_name UNIQUE (product_no); ALTER TABLE products ADD FOREIGN KEY (product_group_id) REFERENCES product_groups; ALTER TABLE Teacher add constraint df_sex default('男') for sex 要增加一个不能写成表约束的非空约束，使用下面语法： ALTER TABLE products ALTER COLUMN product_no SET NOT NULL; 这个约束将立即进行检查，所以表在添加约束之前必须符合约束条件。 4、删除约束要删除一个约束，你需要知道它的名字。如果你给了它一个名字，那么事情就好办了。否则系统会分配一个生成的名字，这样你就需要把它找出来

SWISS-MODEL_蛋白质结构预测教程

SWISS-MODEL 蛋白质结构预测 SWISS-MODEL是一项预测蛋白质三级结构的服务，它利用同源建模的方法实现对一段未知序列的三级结构的预测。该服务创建于1993年,开创了自动建模的先河,并且它是讫今为止应用最广泛的免费服务之一。同源建模法预测蛋白质三级结构一般由四步完成： 1. 从待测蛋白质序列出发，搜索蛋白质结构数据库（如PDB,SWISS-PROT等），得到许多相似序列（同源序列），选定其中一个（或几个）作为待测蛋白质序列的模板； 2. 待测蛋白质序列与选定的模板进行再次比对，插入各种可能的空位使两者的保守位置尽量对齐； 3. 建模：调整待测蛋白序列中主链各个原子的位置，产生与模板相同或相似的空间结构——待测蛋白质空间结构模型； 4. 利用能量最小化原理，使待测蛋白质侧链基团处于能量最小的位置。最后提供给用户的是经过如上四步（或重复其中某几步）后得到的蛋白质三级结构。 SWISS-MODEL工作模式 SWISS-MODEL服务器是以用户输入信息的最小化为目的设计的，即在最简单的情况下，用户仅提供一条目标蛋白的氨基酸序列。由于比较建模程序可以具有不同的复杂性，用户输入一些额外信息对建模程序的运行有时是有必要的，比如，选择不同的模板或者调整目标模板序列比对。该服务主要有以下三种方式: ?First Approach mode(简捷模式）：这种模式提供一个简捷的用户介面：用户只需要输入一条氨基酸序列，服务器就会自动选择合适的模板。或者，用户也可以自己指定模板（最多5条），这些模板可以来自ExPDB 模板数据库（也可以是用户选择的含坐标参数的模板文件）。如果一条模板与提交的目标序列相似度大于25%，建模程序就会自动开始运行。但是，模板的可靠性会随着模板与目标序列之间的相似度的降低而降低，如果相似度不到50%往往就需要用手工来调整序列比对。这种模式只能进行大于25个残基的单链蛋白三维结构预测。 ?Alignment Interface（比对界面）：这种模式要求用户提供两条已经比对好的序列，并指定哪一条是目标序列，哪一条是模板序列（模板序列应该对应于ExPDB模板数据库中一条已经知道其空间结构的蛋白序列）。服务器会依据用户提供的信息进行建模预测。 ?Project mode(工程模式）：手工操作建模过程：该模式需要用户首先构建一个DeepView工程文件，这个工程文件包括模板的结构信息和目标序列与模板序列间的比对信息。这种模式让用户可以控制许多参数，例如：模板的选择，比对中的缺口位置等。此外，这个模式也可以用于“first approach mode简捷模式”输出结果的进一步加工完善。此外，SWISS-MODEL还具有其他两种内容上的模式： ?Oligomer modeling(寡聚蛋白建模):对于具有四级结构的目标蛋白,SWISS-MODEL提供多聚模板的模式，用于多单体的蛋白质建模。这一模式弥补了简捷模式中只能提交单个目标序列,不能同时预测两条及以上目标序列的蛋白三维结构的不足。 ?GPCR mode(G蛋白偶联受体模式)：是专门对7次跨膜G蛋白偶联受体的结构预测。

数据库语言分类

什么是DQL、DML、DDL、DCL SQL(Structure Query Language)语言是数据库的核心语言。 SQL的发展是从1974年开始的，其发展过程如下： 1974年-----由Boyce和Chamberlin提出，当时称SEQUEL。 1976年-----IBM公司的Sanjase研究所在研制RDBMS SYSTEM R 时改为SQL。 1979年-----ORACLE公司发表第一个基于SQL的商业化RDBMS产品。1982年-----IBM公司出版第一个RDBMS语言SQL/DS。 1985年-----IBM公司出版第一个RDBMS语言DB2。 1986年-----美国国家标准化组织ANSI宣布SQL作为数据库工业标准。SQL是一个标准的数据库语言，是面向集合的描述性非过程化语言。它功能强，效率高，简单易学易维护（迄今为止，我还没见过比它还好学的语言）。然而SQL语言由于以上优点，同时也出现了这样一个问题：它是非过程性语言，即大多数语句都是独立执行的，与上下文无关，而绝大部分应用都是一个完整的过程，显然用SQL完全实现这些功能是很困难的。所以大多数数据库公司为了解决此问题，作了如下两方面的工作：(1)扩充SQL，在SQL中引入过程性结构；(2)把SQL嵌入到高级语言中，以便一起完成一个完整的应用。二. SQL语言的分类 SQL语言共分为四大类：数据查询语言DQL，数据操纵语言DML，数据定义语言DDL，数据控制语言DCL。 1. 数据查询语言DQL 数据查询语言DQL基本结构是由SELECT子句，FROM子句，WHERE 子句组成的查询块： SELECT <字段名表> FROM <表或视图名> WHERE <查询条件> 2 .数据操纵语言数据操纵语言DML主要有三种形式： 1) 插入：INSERT 2) 更新：UPDATE 3) 删除：DELETE 3. 数据定义语言DDL 数据定义语言DDL用来创建数据库中的各种对象-----表、视图、索引、同义词、聚簇等如： CREATE TABLE/VIEW/INDEX/SYN/CLUSTER | | | | |

产品表与分类表数据库设计

原文地址：https://www.doczj.com/doc/2a753672.html,/index.php/archives/95/ 问题的提出：网上商城对产品进行了很多分类，不同的分类产品又有不同的属性，比如，电脑的属性有：CUP，内存，主板，硬盘等等，服装的属性有：布料，尺寸，颜色等等，那么产品表以及产品分类表应该如何设计才能满足不同类型产品的区别呢？解决方案： 1、产品分类表的设计第一种设计思路：使用树形结构，递归的形式，可以对产品进行N级分类，只要你喜欢，树形结构在数据库的设计中经常用到，比如功能菜单表等。以下是一个简单的产品分类表。说明：上级类别ID为该表的外键，并关联到本级类别ID，这样就可以对产进行N级分类了，这种设计思想十分灵活，是无限分类中最常用到的。第二种设计思路：定义N个类别表，并对他们进行关联，如图：

说明：这种设计在项目中没有人会使用它，因为产品的分类是不固定的，很难在数据库设计的时候确定类别表的个数，很不灵活。不过省分城市分类有用这样子的设计 2、产品表的设计第一种设计思路：直接在产品表预留N个字段，用到的时候直接插入数据，如图可行性：会产生很多字段的冗余，并且不知道到底需要多少个字段，数据类型也不能确定，可行性比较低，但是这种设计也有它的优点，就是表的数量少，其他的优点我实在找不出来了，所以，在项目中这种设计思想也不会用到。第二种设计思路：在提及这种设计思路前，首先得了解数据表可以分为两种结构，一种是横表，也就是我们经常用到的表结构，另外一种是纵表，这种结构平时我们用到的表少，所以我也是今天通过请教别人才知有这种表结构的。什么是纵表，它有哪些优点和缺点呢？通过两张图片对比来了解或许会更清楚横表的结构：纵表的结构：可以看出横表的优点是很直观，它是根据现行业务逻辑定制，设计简单，易操作，缺点是当业务逻辑发生拓展时，大多情况下要更改表的结构。纵表的数据让人看

蛋白质结构预测在线软件

蛋白质预测分析网址集锦? 物理性质预测：? Compute PI/MW?? ?? SAPS?? 基于组成的蛋白质识别预测? AACompIdent???PROPSEARCH?? 二级结构和折叠类预测? nnpredict?? Predictprotein??? SSPRED?? 特殊结构或结构预测? COILS?? MacStripe?? 与核酸序列一样，蛋白质序列的检索往往是进行相关分析的第一步，由于数据库和网络技校术的发展，蛋白序列的检索是十分方便，将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。? 由NCBI检索蛋白质序列? 可联网到：“”进行检索。? 利用SRS系统从EMBL检索蛋白质序列? 联网到：”，可利用EMBL的SRS系统进行蛋白质序列的检索。? 通过EMAIL进行序列检索?

当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时，可采用EMAIL方式进行序列检索。? 蛋白质基本性质分析? 蛋白质序列的基本性质分析是蛋白质序列分析的基本方面，一般包括蛋白质的氨基酸组成，分子质量，等电点，亲水性，和疏水性、信号肽，跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如，疏水性图谱可通知来预测跨膜螺旋。同时，也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标（其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。? 疏水性分析? 位于ExPASy的ProtScale程序（?）可被用来计算蛋白质的疏水性图谱。该网站充许用户计算蛋白质的50余种不同属性，并为每一种氨基酸输出相应的分值。输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号。需要调整的只是计算窗口的大小（n）该参数用于估计每种氨基酸残基的平均显示尺度。? 进行蛋白质的亲/疏水性分析时，也可用一些windows下的软件如，bioedit,dnamana等。? 跨膜区分析? 有多种预测跨膜螺旋的方法，最简单的是直接，观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域，但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性。这些技术主要是基于对已知

整理(蛋白质序列数据库)

蛋白质序列数据库我们可以根据基因组序列预测新基因，预测编码区域，并推测其产物（即蛋白质）的序列。因此，随着基因组序列的不断增长，蛋白质序列也在不断增加。 PIR 历史上，蛋白质数据库的出现先于核酸数据库。在1960年左右，Dayhoff和其同事们搜集了当时所有已知的氨基酸序列，编著了《蛋白质序列与结构图册》。从这本图册中的数据，演化为后来的蛋白质信息资源数据库PIR（Protein Information Resource）。 PIR是由美国生物医学基金会NBRF（National Biomedical Research Foundation）于1984年建立的，其目的是帮助研究者鉴别和解释蛋白质序列信息，研究分子进化、功能基因组，进行生物信息学分析。它是一个全面的、经过注释的、非冗余的蛋白质序列数据库。所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分类。PIR提供一个蛋白质序列数据库、相关数据库和辅助工具的集成系统，用户可以迅速查找、比较蛋白质序列，得到与蛋白质相关的众多信息。目前，PIR已经成为一个集成的生物信息数据源，支持基因组研究和蛋白质组研究。至2004年，PIR 有近30万个蛋白质的登录数据项，包括来自不同生物体的蛋白质序列。除了蛋白质序列数据之外，PIR还包含以下信息：（1）蛋白质名称、蛋白质的分类、蛋白质的来源；（2）关于原始数据的参考文献；（3）蛋白质功能和蛋白质的一般特征，包括基因表达、翻译后处理、活化等；（4）序列中相关的位点、功能区域。对于数据库中的每一个登录项，有与其它数据库的交叉索引，包括到GenBank、EMBL、DDBJ、GDB、MELINE等数据库的索引。PIR中一个具体的登录项如图4.4所示。

常见主流数据库的分类与详细比较

1、IBM 的DB2 DB2是IBM著名的关系型数据库产品，DB2系统在企业级的应用中十分广泛。截止2003年，全球财富500强（Fortune 500）中有415家使用DB2，全球财富100强（Fortune100）中有96家使用DB2，用户遍布各个行业。2004年IBM的DB2就获得相关专利239项，而Oracle 仅为99项。DB2目前支持从PC到UNIX，从中小型机到大型机，从IBM到非IBM（HP及SUN UNIX 系统等）的各种操作平台。 IBM绝对是数据库行业的巨人。1968年IBM在IBM 360计算机上研制成功了IMS这个业界第一个层次型数据库管理系统，也是层次型数据库中最为著名和最为典型的。1970年，IBM 发表了业界第一篇关于关系数据库理论的论文“A Relational Model of Data for Large Shared DataBanks”，首次提出了关系模型的概念。1974年，IBM Don Chamberlin和Ray Boyce通过System R项目的实践，发表了论文“SEQUEL：A Structured English Query Language”，我们现在熟知SQL就是基于它发展起来的。IBM 在1983年发布了DATABASE 2（DB2）for MVS （内部代号为“Eagle”），这就是著名的DB2数据库。2001年IBM以10亿美金收购了Informix 的数据库业务，这次收购扩大了IBM分布式数据库业务。2006 DB2 9作为第三代数据库的革命性产品正式在全球发布。作为关系数据库领域的开拓者和领航人，IBM在1977年完成了System R系统的原型，1980年开始提供集成的数据库服务器——System/38，随后是SQL/DSforVSE和VM，其初始版本与SystemR研究原型密切相关。 DB2 forMVSV1 在1983年推出。该版本的目标是提供这一新方案所承诺的简单性，数据不相关性和用户生产率。1988年DB2 for MVS 提供了强大的在线事务处理（OLTP）支持，1989 年和1993 年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。最近推出的DB2 Universal Database 则是通用数据库的典范，是第一个具备网上功能的多媒体关系数据库管理系统，支持包括Linux在内的一系列平台。 2、 Oracle Oracle 前身叫SDL，由Larry Ellison 和另两个编程人员在1977创办，他们开发了自己的拳头产品，在市场上大量销售，1979 年，Oracle公司引入了第一个商用SQL 关系数据库管理系统。Oracle公司是最早开发关系数据库的厂商之一，其产品支持最广泛的操作系统平台。目前Oracle关系数据库产品的市场占有率名列前茅。 Oracle公司是目前全球最大的数据库软件公司，也是近年业务增长极为迅速的软件提供与服务商。IDC(Internet Data Center)2007统计数据显示数据库市场总量份额如下：Oracle % IBM %Microsoft % Teradata % Sybase %。不过从使用情况看，BZ Research的2007年度数据库与数据存取的综合研究报告表明%的公司使用了Microsoft SQL Server，不过在高端领域仍然以Oracle，IBM，Teradata为主。

数据库表结构文档

数据库表结构文档 1 表名 USERS (系统用户) 主键 USERID 序号字段名称字段说明类型位数属性备注 1 USERID 用户账号 Int 非空主键,自增 2 LOGINNAME 登陆账户 Varchar 32 非空唯一键 3 USERNAME 用户姓名 Varchar 32 非空 4 PASSWORD 登陆口令 Varchar 32 非空 5 FLAG 用户状态 Varchar 1 6 非空 1、正常2、退休 3、离职 6 ROLEID 角色账号 SmallInt 短整型 2 表名 PERSONALDATA (用户个人基本信息) 主键 USERID 序号字段名称字段说明类型位数属性备注 1 USERID 用户账号 Int 非空主键,与USERS一对一 2 IDCARD 身份证 Varchar 20 可空 3 USERNAME 用户姓名 Varchar 32 可空允许冗余，提高查询性能 4 SEX 用户性别 Nchar 1 可空一个汉字，check约束在(男，女) 5 BIRTH 出生年月Varchar 20 可空数据库中日期都设日计为字符串，方便操作，以下一样 6 CALLBE 职称系列 Varchar 16 可空与BASEDATAS表关联 7 CALLCONCRETELY 职称具体 Varchar 16 可空与BASEDATAS表关联

现职称任职8 NOWCALLDATE Varchar 20 可空时间 9 LONGEVITY 资历 Varchar 16 可空与BASEDATAS表关联 10 NOWSTATION 现岗位 Varchar 16 可空与BASEDATAS表关联 11 NSENGAGETIME 现岗位聘Varchar 20 可空任时间 12 BELONGTOCOLLEGE 所属学院 Varchar 16 可空与BASEDATAS表关联 13 BELONGTODEPARTMENT 所属部门 Varchar 16 可空与BASEDATAS表关联 14 POLITYVISAGE 政治面貌 Varchar 16 可空与BASEDATAS表关联 15 ATTENDJOBTIME 参加工作Varchar 20 可空时间 16 FINALSTUDY 最后学历 Varchar 16 可空与BASEDATAS表关联 17 FINALDEGREE 最后学位 Varchar 16 可空与BASEDATAS表关联 18 FINALSDDEMO 最后学历Text 可空学位说明 19 IDENTITYS 身份 Varchar 16 可空与BASEDATAS表关联(教学人员和非教学人员) 20 CALLDETAIL 职称详细 Varchar 可空与BASEDATAS表关联 21 FILLINTIME 填入时间 Varchar 20 可空 22 FINALMODIFYTIME 最后修改Varchar 20 可空时间 23 CHECKSTATE 审核状态 Varchar 16 非空与BASEDATAS表关联(1、已审核2、未审核3、已作废) 24 CHECKUSER 审核人 Int 可空领导对个人资料进