数据库讲义
- 格式:doc
- 大小:1.38 MB
- 文档页数:9
《数据库系统讲义》第1章绪论第一节数据库系统概述1.1.1 数据、数据库、数据库管理系统、数据库系统数据、数据库、数据库管理系统和数据库系统是与数据库技术密切相关的四个基本概念。
一、数据(DATA)数据是数据库中存储的基本对象。
数据在大多数人头脑中的第一个反应就是数字。
其实数字只是最简单的一种数据,是数据的一种传统和狭义的理解。
广义的理解,数据的种类很多,文字、图形、图像、声音、学生的档案记录、货物的运输情况等,这些都是数据。
可以对数据做如下定义:描述事物的符号记录称为数据。
描述事物的符号可以是数字,也可以是文字、图形、图像、声音、语言等,数据有多种表现形式,它们都可以经过数字化后存入计算机。
为了了解世界,交流信息,人们需要描述这些事物。
在日常生活中直接用自然语言(如汉语)描述。
在计算机中,为了存储和处理这些事物,就要抽出对这些事物感兴趣的特征组成一个记录来描述。
例如:在学生档案中,如果人们最感兴趣的是学生的姓名、性别、年龄、出生年月、籍贯、所在系别、入学时间,那么可以这样描述:(李明,男,21,1972,江苏,计算机系,1990)因此这里的学生记录就是数据。
对于上面这条学生记录,了解其含义的人会得到如下信息:李明是个大学生,1972年出生,男,江苏人,1990年考入计算机系;而不了解其语义的人则无法理解其含义。
可见,数据的形式还不能完全表达其内容,需要经过解释。
所以数据和关于数据的解释是不可分的,数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。
二、数据库(DataBase,简称DB)数据库,顾名思义,是存放数据的仓库。
只不过这个仓库是在计算机存储设备上,而且数据是按一定的格式存放的。
人们收集并抽取出一个应用所需要的大量数据之后,应将其保存起来以供进一步加工处理,进一步抽取有用信息。
在科学技术飞速发展的今天,人们的视野越来越广,数据量急剧增加。
过去人们把数据存放在文件柜里,现在人们借助计算机和数据库技术科学地保存和管理大量的复杂的数据,以便能方便而充分地利用这些宝贵的信息资源。
操作系统、数据库、中间件第一章操作系统介绍1.1操作系统的定义操作系统(Operating System—缩写为OS)是一种系统软件。
它管理计算机系统的全部软硬件资源和对程序的执行进行控制,还能使用户方便使用硬件提供的计算机功能,也使硬件的功能发挥得更好。
操作系统的基本特征:1)并发性:多任务、多进程、多线程。
2)共享性:互斥访问、同时访问。
3)虚拟性:把一个物理上的对象变成多个逻辑意义的对象。
操作系统理论研究者有时把操作系统分成四大部分:驱动程序:最底层的、直接控制和监视各类硬件的部分,它们的职责是隐藏硬件的具体细节,并向其他部分提供一个抽象的、通用的接口。
内核:操作系统内核部分,通常运行在最高特权级,负责提供基础性、结构性的功能。
接口库:是一系列特殊的程序库,它们职责在于把系统所提供的基本服务包装成应用程序所能够使用的编程接口(API),是最靠近应用程序的部分。
例如,GNU C 运行期库就属于此类,它把各种操作系统的内部编程接口包装成ANSI C和POSIX 编程接口的形式。
外围:是指操作系统中除以上三类以外的所有其他部分,通常是用于提供特定高级服务的部件。
例如,在微内核结构中,大部分系统服务,以及UNIX/Linux中各种守护进程都通常被划归此列。
总结:操作系统是靠近硬件的第一层软件,是对硬件功能的首次扩充。
1.2操作系统的发展历程和分类其发展历程如下:操作系统分类根据不同的分类方法具有不同的操作系统分类。
1、应用领域可分为桌面操作系统、服务器操作系统、嵌入式操作系统;2、所支持用户数可分为单用户操作系统(如MSDOS、OS/2、Windows)、多用户操作系统(如UNIX、Linux、Windows Server);3、源码开放程度可分为开源操作系统(如Linux、FreeBSD)和闭源操作系统(如Mac OS X、Windows);4、存储器寻址宽度、架构可以将操作系统分为8位、16位、32位、64位、128位的操作系统。
数据库营销知识讲义一、数据库营销的进展在短短的二十年里,中国经济在从计划经济向市场经济转型的过程中,也逐步由稀缺经济向过剩经济过渡。
中国百姓对商品的需求已经从饥不择食地大量抢购到货比三家的“挑挑剔剔”。
生活日益丰富的人们,已不再领情于、甚至厌倦于铺天盖地的商品信息的侵染;同时,也不再满足于基本的生活需要,更加注重的是具有个性化与人情味的产品与服务。
市场将被区隔成一个个更小的消费者群,即对公司的一个或者多个品牌有关系或者感兴趣的一组消费者。
市场细分越来越重视消费者的兴趣与感受。
针对这种状况,更需要营销者时刻关注消费者需求的变化,及时与消费者沟通,迅速采取措施,满足不断变化的消费者需求。
基于此,由稀缺经济导致的大规模生产与与之相应的传统营销方式将面临着严峻的考验,代之而来的是更加灵活的生产方式与与之相应的各类新的营销方式的涌现与迅速普及,如数据库营销、整合营销。
顾客是企业关注的焦点,如何争取与留住顾客是企业营销工作的主题。
这就需要营销者站在顾客的立场上及时熟悉顾客的需求及其变化。
依照消费者的价值观念来设计、生产、定位产品。
应该看到,如今的顾客更加重视优良的服务与体贴的关怀,失去顾客往往不是产品的质量问题,而是顾客对服务的不满,因此,产品的服务化与服务的产品化已经高度融合在了一起;提供优良的服务,建立起顾客对企业的忠诚,就需要把消费者的价值观念贯穿于企业的整个经营过程中,企业的各个部门将被高度地整合起来,以顾客为中心开展工作;另一方面,消费者的需求、价值观念又会在与市场环境的互动中不断的改变着,而且这种变化的频率越来越高,要使企业习惯这样的变化,很显然,那种传统的单向沟通的营销方式已经力不从心,需要新的双向沟通的营销方式取而代之,建立起顾客与企业间的长期稳固的互动关系。
好在信息技术的进展为这种双向沟通的方式提供了强有力的支持,信息共享使企业的各个部门、顾客与各类环境因素融为一体,这就使得能够与顾客对话的起源于直复营销的数据库营销应时而生。
7.3 概念结构设计•1、什么是概念结构设计将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定概念结构设计是整个数据库设计的关键2、概念结构的特点• (1) 能真实、充分地反映现实世界有丰富的语义表达能力,能表达用户的各种需求。
•(2) 易于交流和理解,从而可以用它和不熟悉计算机的用户交换意见。
•(3) 要易于更改。
当应用环境和应用要求改变时,概念模型要能很容易的修改和扩充以反映这种变化。
•(4) 易于向各种数据模型转换。
3、概念结构设计的方法与步骤自顶向下首先定义全局概念结构的框架,然后逐步细化自底向上首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构逐步扩张首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构混合策略将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。
常用策略–自顶向下地进行需求分析–自底向上地设计概念结构自底向上设计概念结构的步骤第1步:抽象数据并设计局部视图第2步:集成局部视图,得到全局概念结构4、数据抽象抽象是对实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述概念结构是对现实世界的一种抽象三种常用抽象1. 分类(Classification)▪定义某一类概念作为现实世界中一组对象的类型▪抽象了对象值和型之间的“is member of”的语义2. 聚集(Aggregation)▪定义某一类型的组成成分▪抽象了对象内部类型和成分之间“is part of”的语义3. 概括(Generalization)▪定义类型之间的一种子集联系▪抽象了类型之间的“is subset of”的语义▪继承性5、实体-联系方法(E-R方法)entity-relationship approach⏹实体型⏹用矩形表示,矩形框内写明实体名。
⏹属性⏹用椭圆形表示,并用无向边将其与相应的实体连接起来⏹联系⏹联系本身:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n)5、局部视图设计设计分E-R图的步骤:⒈选择局部应用在多层的数据流图中选择一个适当层次的数据流图,作为设计分E-R图的出发点通常以中层数据流图作为设计分E-R图的依据⒉逐一设计分E-R图任务▪将各局部应用涉及的数据分别从数据字典中抽取出来▪参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码▪确定实体之间的联系及其类型(1:1,1:n,m:n)两条准则:▪(1)属性不能再具有需要描述的性质。
即属性必须是不可分的数据项,不能再由另一些属性组成▪(2)属性不能与其他实体具有联系。
联系只发生在实体之间6、E-R图实例:学籍管理局部应用中主要涉及的实体包括学生、宿舍、档案材料、班级、班主任。
那么,这些实体之间的联系又是怎样的呢?由于一个宿舍可以住多个学生,而一个学生只能住在某一个宿舍中,因此宿舍与学生之间是1:n的联系。
由于一个班级往往有若干名学生,而一个学生只能属于一个班级,因此班级与学生之间也是1:n的联系。
由于班主任同时还要教课,因此班主任与学生之间存在指导联系,一个班主任要教多名学生,而一个学生只对应一个班主任,因此班主任与学生之间也是1:n的联系。
而学生和他自己的档案材料之间,班级与班主任之间都是1:1的联系。
接下来我们需要进一步斟酌该E-R图,做适当调整。
在一般情况下,性别通常作为学生实体的属性,但在本局部应用中,由于宿舍分配与学生性别有关,根据准则2,应该把性别作为实体对待。
* 数据存储“学生登记表”,由于是手工填写,供存档使用,其中有用的部分已转入学生档案材料中,因此这里就不必作为实体了。
这样,得到学籍管理局部应用的分E-R图,如图所示。
为节省篇幅,该E-R图中省略了各个实体的属性描述。
这些实体的属性分别为:学生:{学号,姓名,出生日期,}档案材料:{档案号,……}班级:{班级号,学生人数}班主任:{职工号,姓名,性别,是否为优秀班主任}宿舍:{宿舍编号,地址,人数}教室:{教室编号,地址,容量} 其中有下划线的属性为实体的码。
同样方法,我们可以得到课程管理局部应用的分E-R图,如图6-13所示。
各实体的属性分别为:学生:{姓名,学号,性别,年龄,所在系,年级,平均成绩}课程:{课程号,课程名,学分}教师:{职工号,姓名,性别,职称}教科书:{书号,书名,价钱}教室:{教室编号,地址,容量}7、视图的集成各个局部视图即分E-R图建立好后,还需要对它们进行合并,集成为一个整体的数据概念结构即总E-R图。
多个分E-R图一次集成一次集成多个分E-R图,通常用于局部视图比较简单时缺点比较复杂,实现难度较大逐步集成用累加的方式一次集成两个分E-R图缺点:每次只集成两个分E-R图,实现难度有所降低集成局部E-R图的步骤1.合并分E-R图,生成初步E-R图消除冲突–属性冲突–命名冲突–结构冲突冲突的种类–属性冲突属性值的类型:学号在一个视图中可能当作字符串,在另一个视图中可能当作整数。
取值范围取值集合不同–命名冲突同名异义:不同意义的对象在不同的局部应用中具有相同的名字异名同义(一义多名):同一意义的对象在不同的局部应用中具有不同的名字–结构冲突同一对象在不同应用中具有不同的抽象同一实体在不同分E-R图中所包含的属性个数和属性排列次序不完全相同实体之间的联系在不同局部视图中呈现不同的类型2. 修改与重构消除不必要的冗余,设计生成基本E-R图–分析方法–规范化理论冗余的数据是指可由基本数据导出的数据冗余的联系是指可由其他联系导出的联系冗余数据和冗余联系容易破坏数据库的完整性,给数据库维护增加困难消除不必要的冗余后的初步E-R图称为基本E-R图分析方法以数据字典和数据流图为依据根据数据字典中关于数据项之间的逻辑关系效率VS冗余信息 (P222)但并不是所有的冗余数据与冗余联系都必须加以消除,有时为了提高效率,不得不以冗余信息作为代价。
因此在设计数据库概念结构时,那些冗余信息必须消除,那些冗余信息允许存在,需要根据用户的整体需求来确定。
如果人为地保留了一些冗余数据,则应把数据字典中数据关联的说明作为完整性约束条件。
规范化理论函数依赖的概念提供了消除冗余联系的形式化工具. 确定分E-R图实体之间的数据依赖,并用实体码之间的函数依赖表示。
求FL的最小覆盖GL,差集为D = FL-GL。
逐一考察D中的函数依赖,确定是否是冗余的联系,若是,就把它去掉。
▪(1) 冗余的联系一定在D中,而D中的联系不一定是冗余的;▪(2) 当实体之间存在多种联系时要将实体之间的联系在形式上加以区分。
解决方法是根据应用的语义对实体联系的类型进行综合或调整。
下面我们来看看如何生成学校管理系统的初步E-R图。
我们着重介绍学籍管理局部视图与课程管理局部视图的合并。
这两个分E-R图存在着多方面的冲突:∙班主任实际上也属于教师,也就是说学籍管理中的班主任实体与课程管理中的教师实体在一定程度上属于异名同义,可以应将学籍管理中的班主任实体与课程管理中的教师实体统一称为教师,统一后教师实体的属性构成为:教师:{职工号,姓名,性别,职称,是否为班主任}∙将班主任改为教师后,教师与学生之间的联系在两个局部视图中呈现两种不同的类型,一种是学籍管理中教师与学生之间的指导联系,一种是课程管理中教师与学生之间的教学联系,由于指导联系实际上可以包含在教学联系之中,因此可以将这两种联系综合为教学联系。
∙在两个局部E-R图中,学生实体属性组成及次序都存在差异,应将所有属性综合,并重新调整次序。
假设调整结果为:∙学生:{学号,姓名,出生日期,年龄,所在系,年级,平均成绩}解决上述冲突后,学籍管理分E-R图与课程管理分E-R图合并为初步E-R图。
修改与重构,生成基本E-R图修改、重构初步E-R图以消除冗余主要采用分析方法。
除分析方法外,还可以用规范化理论来消除冗余。
图6-17是进行修改和重构后生成的基本E-R图。
8. 数据库概念设计总结· 用E-R数据模型进行概念设计,首先必须根据需求说明,确认实体、联系和属性。
·采用E-R方法进行数据库的概念设计,可以分成三步进行:首先设计局部E-R图;然后合并各局部E-R图,并解决可能存在的冲突,得到初步E-R图;最后修改和重构初步E-R图,消除其中的冗余部分,得到最终的全局E-R图,即概念模式。
o设计全局E-R模式的目的不在于把若干局部E-R模式形式上合并为一个E-R模式,而在于消除冲突使之成为能够被全系统总所有用户共同理解和接受的统一的概念模型解:(1)关系模式如下:学生:S(Sno,Sname,Sbirth,Dept,Class,Rno)班级:C(Class,Pname,Dept,Cnum,Cyear)系:D(Dept,Dno,Office,Dnum)学会:M(Mname,Myear,Maddr,Mnum)(2)每个关系模式的最小函数依赖集如下:A、学生S (Sno,Sname,Sbirth,Dept,Class,Rno) 的最小函数依赖集如下:SnoàSname,SnoàSbirth,SnoàClass,ClassàDept,DEPTàRno传递依赖如下:由于SnoàDept,而DeptàSno ,DeptàRno(宿舍区)所以Sno与Rno之间存在着传递函数依赖。
由于ClassàDept,Dept à Class,DeptàRno所以Class与Rno之间存在着传递函数依赖。
由于SnoàClass,ClassàSno,ClassàDept所以Sno与Dept之间存在着传递函数依赖。
B、班级C(Class,Pname,Dept,Cnum,Cyear)的最小函数依赖集如下:ClassàPname,ClassàCnum,ClassàCyear,PnameàDept.由于ClassàPname,PnameàClass,PnameàDept所以C1ass与Dept之间存在着传递函数依赖。
C、系D(Dept,Dno,Office,Dnum)的最小函数依赖集如下:DeptàDno,DnoàDept,DnoàOffice,DnoàDnum根据上述函数依赖可知,Dept与Office,Dept与Dnum之间不存在传递依赖。