数据库体系结构

  • 格式:doc
  • 大小:306.50 KB
  • 文档页数:22

下载文档原格式

  / 22
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据库体系结构数据库如何处理一个查询

当应用程序向PostgreSQL系统提交一个查询时,一般要经过五个阶段:

联接阶段

一旦建立起来一个联接,客户端进程就可以向后端服务器进程发送查询了。查询是通过纯文本传输的,也就是说在前端不做任何分析处理。服务器分析查询,创建执行规划,执行该规划并且通过已经建立起来的联接把检索出来的记录返回给客户端。

分析阶段

解析器的功能就其目的性来说,就是检查从应用程序(客户端)发送过来的查询,核对语法并创建一个查询分析树(querytree)。

重写阶段

重写系统是一个位于分析器阶段和规划器/优化器之间的模块。它接收分析阶段来的查询树且搜索任何应用到查询树上的规则,(规则存储在系统表里)并根据给出的规则体进行转换。

重写系统的一个应用就是实现视图。当一个查询访问一个视图时(也就是说,一个虚拟表),重写系统改写用户的查询,使之成为一个访问在视图定义里给出的基本表的查询。

优化阶段

规划器/优化器的任务是创建一个优化了的执行规划。它首先合并对出现在查询里的关系进行扫描和连接所有可能的方法。这样创建的所有路径都导致相同结果,而优化器的任务就是计算每个路径的开销并且找出开销最小的那条路径。

执行阶段

接受规划器/优化器传过来地查询规划然后递归地处理它,抽取所需要的行集合。执行器就是对应于上面所提到的查询引擎中的执行处理客户端发来的请求(Executor),它是查询引擎的核心模块。

执行器实际上是一个需求-拉动地流水线机制。每次调用一个规划节点地时候,它都必须给出更多的一个行,或者汇报它已经完成行的传递。

针对不同的SQL查询类型,执行器会有不同的执行方案,而这些方案的选择是按照执行器机制进行的。

数据库总体架构图PostgreSQL的总体架构图

●Postmaster:它主要负责在客户端第一次发送请求给服务器的时候建立一个服务器端进程。也就是上图中的Listener。

●Listener:也就是每个客户端对应的服务器端进程,它的主要作用是和客户端进行通信,获取客户端的sql语句,并把查询结果返回给客户端。

●Optimizer:查询优化器,主要功能是分析客户端提交的sql语句,给出所有的执行路径,并从中找出一个最优的方案,最后把这个执行方案交给执

行器。

●Buffer Manager:缓冲管理器,主要功能是对共享缓冲区和本地缓存区进行管理。

服务器体系结构图

●SQL客户端接口负责在客户端和服务器端通信,对应服务器体系结构图中的libpq。

●系统控制管理器负责初始化和控制整个PostgreSQL系统,对应服务器体系结构图中的Postmaster和Postgres。

●查询引擎是最主要的子系统,负责解析、优化和执行处理客户端发来的请求,对应服务器体系结构图中由Parser、Traffic Cop、Rewrite、Choose Path

& Generate Plan、Executor和Utility Commands组成的部分。

●数据字典存储在系统关系中,存储着系统运行必要的信息和对象的定义信息,并提供处理创建删除对象的接口,对应服务器体系结构图的Catalog。

●存储管理器负责管理内存和磁盘,提供存取数据库的数据的功能,对应服务器体系结构图的Storage Managers。

●存取方法和事务管理器控制着逻辑的数据存取和数据库的ACID特性实现,对应服务器体系结构图的Access Methods。

●库和实用工具程序为其他子系统提供功能上的支持对应服务器体系结构图的Utilities和Nodes/Lists。

完整的数据库查询原理

第一步:应用程序把查询SQL语句发给服务器端执行

我们在数据层执行SQL语句时,应用程序会连接到相应的数据库服务器,把SQL语句发送给服务器处理。

第二步:服务器解析请求的SQL语句

1、SQL计划缓存,经常用查询分析器的朋友大概都知道这样一个事实,往往一个查询语句在第一次运行的时候需要执行特别长的时间,但是如果你马上或者在一定时间内运行同样的语句,会在很短的时间内返回查询结果。

原因:

●服务器在接收到查询请求后,并不会马上去数据库查询,而是在数据库中的计划缓存中找是否有相对应的执行计划,如果存在,就直接调用已经编

译好的执行计划,节省了执行计划的编译时间。

●如果所查询的行已经存在于数据缓冲存储区中,就不用查询物理文件了,而是从缓存中取数据,这样从内存中取数据就会比从硬盘上读取数据快很

多,提高了查询效率.数据缓冲存储区会在后面提到。

2、如果在SQL计划缓存中没有对应的执行计划,服务器首先会对用户请求的SQL语句进行语法效验,如果有语法错误,服务器会结束查询操作,并用返回相应的错误信息给调用它的应用程序。

注意:此时返回的错误信息中,只会包含基本的语法错误信息,例如select 写成selec等,错误信息中如果包含一列表中本没有的列,此时服务器是不会检查出来的,因为只是语法验证,语义是否正确放在下一步进行。

3、语法符合后,就开始验证它的语义是否正确,例如,表名,列名,存储过程等等数据库对象是否真正存在,如果发现有不存在的,就会报错给应用程序,同时结束查询。

4、接下来就是获得对象的解析锁,我们在查询一个表时,首先服务器会对这个对象加锁,这是为了保证数据的统一性,如果不加锁,此时有数据插入,但因为没有加锁的原因,查询已经将这条记录读入,而有的插入会因为事务的失败会回滚,就会形成脏读的现象。

5、接下来就是对数据库用户权限的验证,SQL语句语法,语义都正确,此时并不一定能够得到查询结果,如果数据库用户没有相应的访问权限,服务器会报出权限不足的错误给应用程序,在稍大的项目中,往往一个项目里面会包含好几个数据库连接串,这些数据库用户具有不同的权限,有的是只读权