第13讲-数据模型及范式
- 格式:ppt
- 大小:300.50 KB
- 文档页数:40
2022年西南医科大学信息管理与信息系统专业《数据库概论》科目期末试卷B(有答案)一、填空题1、SQL Server中数据完整性包括______、______和______。
2、数据库内的数据是______的,只要有业务发生,数据就会更新,而数据仓库则是______的历史数据,只能定期添加和刷新。
3、完整性约束条件作用的对象有属性、______和______三种。
4、如图所示的关系R的候选码为;R中的函数依赖有;R属于范式。
一个关系R5、在数据库系统封锁协议中,一级协议:“事务在修改数据A前必须先对其加X锁,直到事务结束才释放X锁”,该协议可以防止______;二级协议是在一级协议的基础上加上“事务T在读数据R之前必须先对其加S锁,读完后即可释放S锁”,该协议可以防止______;三级协议是在一级协议的基础上加上“事务T在读数据R之前必须先对其加S锁,直到事务结束后才释放S锁”,该协议可以防止______。
6、在SQL Server 2000中,新建了一个SQL Server身份验证模式的登录账户LOG,现希望LOG在数据库服务器上具有全部的操作权限,下述语句是为LOG授权的语句,请补全该语句。
EXEC sp_addsrvrolemember‘LOG’,_____;7、设某数据库中有作者表(作者号,城市)和出版商表(出版商号,城市),请补全如下查询语句,使该查询语句能查询作者和出版商所在的全部不重复的城市。
SELECT城市FROM作者表_____SELECT城市FROM出版商表;8、设有关系模式R(A,B,C)和S(E,A,F),若R.A是R的主码,S.A是S的外码,则S.A的值或者等于R中某个元组的主码值,或者______取空值,这是规则,它是通过______和______约束来实现的。
9、设某数据库中有商品表(商品号,商品名,商品类别,价格)。
现要创建一个视图,该视图包含全部商品类别及每类商品的平均价格。
通俗易懂数仓建模—Inmon范式建模与Kimball维度建模在数据仓库领域,有两位大师,一位是“数据仓库”之父B i l l I n m o n,一位是数据仓库权威专家R a l p h K im ba l l,两位大师每人都有一本经典著作,I n m o n大师著作《数据仓库》及K im ba l l大师的《数仓工具箱》,两本书也代表了两种不同的数仓建设模式,这两种架构模式支撑了数据仓库以及商业智能近二十年的发展。
今天我们就来聊下这两种建模方式——范式建模和维度建模。
本文开始先简单理解两种建模的核心思想,然后根据一个具体的例子,分别使用这两种建模方式进行建模,大家便会一目了然!一、两种建模思想对于In mo n和K i m ba l l两种建模方式可以长篇大论叙述,但理论是很枯燥的,尤其是晦涩难懂的文字,大家读完估计也不会收获太多,所以我根据自己的理解用通俗的语言提炼出最核心的概念。
范式建模范式建模是数仓之父In mo n所倡导的,“数据仓库”这个词就是这位大师所定义的,这种建模方式在范式理论上符合3N F,这里的3N F与O L T P中的3N F还是有点区别的:关系数据库中的3N F是针对具体的业务流程的实体对象关系抽象,而数据仓库的3N F是站在企业角度面向主题的抽象。
I n m o n模型从流程上看是自上而下的,自上而下指的是数据的流向,“上”即数据的上游,“下”即数据的下游,即从分散异构的数据源-> 数据仓库-> 数据集市。
以数据源头为导向,然后一步步探索获取尽量符合预期的数据,因为数据源往往是异构的,所以会更加强调数据的清洗工作,将数据抽取为实体-关系模型,并不强调事实表和维度表的概念。
维度建模K i m b al l模型从流程上看是自下而上的,即从数据集市-> 数据仓库-> 分散异构的数据源。
K i mb a l l是以最终任务为导向,将数据按照目标拆分出不同的表需求,数据会抽取为事实-维度模型,数据源经E T L转化为事实表和维度表导入数据集市,以星型模型或雪花模型等方式构建维度数据仓库,架构体系中,数据集市与数据仓库是紧密结合的,数据集市是数据仓库中一个逻辑上的主题域。
1.数据科学的三大支柱与五大要素是什么?答:数据科学的三大主要支柱为:Datalogy (数据学):对应数据管理 (Data management)Analytics (分析学):对应统计方法 (Statistical method)Algorithmics (算法学):对应算法方法 (Algorithmic method)数据科学的五大要素:A-SATA模型分析思维 (Analytical Thinking)统计模型 (Statistical Model)算法计算 (Algorithmic Computing)数据技术 (Data Technology)综合应用 (Application)2.如何辨证看待“大数据”中的“大”和“数据”的关系?字面理解Large、vast和big都可以用于形容大小Big更强调的是相对大小的大,是抽象意义上的大大数据是抽象的大,是思维方式上的转变量变带来质变,思维方式,方法论都应该和以往不同计算机并不能很好解决人工智能中的诸多问题,利用大数据突破性解决了,其核心问题变成了数据问题。
3.怎么理解科学的范式?今天如何利用这些科学范式?科学的范式指的是常规科学所赖以运作的理论基础和实践规范,是从事某一科学的科学家群体所共同遵从的世界观和行为方式。
第一范式:经验科学第二范式:理论科学第三范式:计算科学第四范式:数据密集型科学今天,是数据科学,统一于理论、实验和模拟4.从人类整个文明的尺度上看,IT和DT对人类的发展有些什么样的影响和冲击?以控制为出发点的IT时代正在走向激活生产力为目的的DT(Data Technology)数据时代。
大数据驱动的DT时代由数据驱动的世界观大数据重新定义商业新模式大数据重新定义研发新路径大数据重新定义企业新思维5.大数据时代的思维方式有哪些?“大数据时代”和“智能时代”告诉我们:数据思维:讲故事→数据说话总体思维:样本数据→全局数据容错思维:精确性→混杂性、不确定性相关思维:因果关系→相关关系智能思维:人→人机协同(人 + 人工智能)6.请列举出六大典型思维方式;直线思维、逆向思维、跳跃思维、归纳思维、并行思维、科学思维7.大数据时代的思维方式有哪些?同58.二进制系统是如何实现的?计算机用0和1来表示和存储所有的数据,它的基数为2,进位规则是“逢二进一”,用1表示开,0表示关9.解释比特、字节和十六进制表示。
数据库复习基本知识1、数据库的4个基本概念:数据(描述事物的符号记录)、数据库(长期存储在计算机内、有组织的、可共享的大量数据的集合。
数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享概括的讲,数据库数据具有永久存储、有组织和可共享三个基本特点)、数据管理系统(DBMS)和数据库系统(DBS)2、数据库系统的特点:数据结构化(数据库系统实现整体数据的结构化,这是数据库的主要特征这一,也是数据库系统与文件系统的本质区别)、数据的共享性高、冗余度低且易扩充(数据共享可以大大减少数据冗余,节约存储空间,数据共享还能够避免数据之间的不相容性与不一致性)、数据的独立性高(物理独立性和逻辑独立性)、数据由数据库管理系统统一管理和控制(必须具备的4各控制功能1、数据的安全性保护2、数据的完整性检查3、并发控制4、数据库恢复)3、数据库的定义:数据库是长期存储在计算机内有组织、大量、共享的数据集合。
它可以提供各种用户共享,具有最小冗余度和较高的数据独立性。
数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。
4、两大数据模型:1、概念模型(也称信息模型,主要用于数据库设计)2、数据模型(包括逻辑模型和物理模型逻辑模型主要用于数据库管理系统的实现)数据模型应满足三方面的要求:1、能比较真实的模拟现实世界2、容易为人所理解3、便于在计算机上实现<5、概念模型:它是按用户的观点来对数据和信息建模,主要用于数据库设计,从现实世界到概念模型的转换是由数据库设计人员完成的。
6、数据模型:它是对现实世界数据特征的抽象。
是用来描述数据、组织数据和对数据进行操作的。
数据模型是数据库系统的核心和基础。
包括逻辑模型(主要包括层次模型、网状模型、关系模型等。
它是按计算机系统的观点对数据建模,主要用于数据库管理系统的实现)和物理模型(对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方方法是面向计算机系统的)从概念模型到逻辑模型的转换可以有数据可设计人员完成,也可以用数据可设计工具协助设计人员完成;从逻辑模型到物理模型的转换主要由数据库管理系统完成。
第13讲古代中国的商业经济和经济政策知能提升课Ⅰ“富商大贾周流天下”——古代中国的商业经济授课提示:对应学生用书第118页一、古代中国商业的发展春秋战国出现繁荣的商业中心汉代商运活跃唐代商船中有所谓“俞大娘航船”宋元海外商运发展迅速,中国商品远销到东亚、南亚、西亚以及东欧、北非等地区明清①在京城、省城和大商埠出现了会馆②会馆的出现,与按地域结成的商帮有关,晋商和徽商的势力最大秦代对“市”进行严格管理汉代进行集中贸易的“市”有专门的管理机构南北朝“草市”出现,政府设“草市尉”实行行政管理唐朝乡村集市“草市”逐渐演进为相对集中的地方商业中心;“夜市”比较繁荣宋朝“市”突破了空间和时间上的限制,商业活动不再受到官吏的直接监管明清都市中的商业区已经相当繁华战国时期城市已经出现称作“市井”的商业区汉代以繁荣的“市”为重要标志的全国性的商业中心已经形成唐代除长安、洛阳的商业最为繁荣外,扬州、杭州、湖州也是商业发达的都会宋代都市商业繁盛清代苏州、盛泽镇非常繁荣,还有汉口镇、佛山镇等1.货币的发展(1)原始社会末期到夏:天然贝壳。
货币是商品交换的产物,产生于原始社会末期。
最早的货币是实物货币,五谷、布帛、农具、陶器、海贝等充当过货币。
贝类坚固耐磨、便于携带和计数,因而流通最广。
(2)商周:出现骨贝、铜贝等人造币。
随着商品交换的频繁,货币需求量增大,自然海贝无法满足需求。
在商代晚期,出现青铜仿贝(我国最早的金属铸币)。
铜币的出现,标志着自然货币向人工货币转变。
(3)春秋战国:诸侯各自造币,以青铜为主,也有黄金和白银。
春秋战国时期,由于诸侯割据,货币形状很多,如铲币(赵)、刀币(齐)、环钱(秦)、蚁鼻钱(楚)等。
(4)秦到唐:统一币制。
圆形方孔式的“秦半两”通行天下,汉代铸“五铢钱”(通行七百多年),唐高祖铸“开元通宝”(之后货币的范式)。
秦始皇统一中国后,“以秦币同天下之币”,圆形方孔的半两铜钱在全国的通行(大宗交易用黄金),结束了货币形状各异、重量悬殊的杂乱状态。
数据库原理习题及答案(总共5套)模拟试题(⼀)⼀、填空题(30分)1.数据的独⽴性包括数据的物理独⽴性和数据的逻辑独⽴性。
2.数据的物理独⽴性是指当数据的存储结构(或内模式)改变时,通过系统内部的⾃动映象功能或转换功能,保持了数据的全局逻辑结构(或模式)不变。
3.数据模型由三部分组成:数据结构数据操作完整性约束4.⼀个学⽣可以同时借阅多本图书,⼀本图书只能由⼀个学⽣借阅,学⽣和图书之间为1:n(⼀对多)的联系。
5.⼀个关系模型由若⼲个关系模式组成。
6.在选择运算所得到的结果关系中,所含的元组数不多于原关系中的元组数。
7.SQL语⾔具有对数据的定义查询操纵控制等四个⽅⾯的功能。
8.设X→Y是关系模式R的⼀个函数依赖,并且Y是X的⼦集,则称X→Y是平凡函数依赖。
9.在⼀个关系模式中,若⼀个属性或属性组K完全函数决定整个元组,则称K为该关系的⼀个候选关键字。
10.如果⼀个关系R中的所有⾮主属性都不传递依赖于任何候选关键字,则称关系R属于第三范式,记作R∈3NF。
11.⼀个关系模式为Y(X1,X2,X3,X4),假定该关系存在如下函数依赖:X1←→X2,X1→X3,X1→X4,则该关系属于BCNF。
12.假定⼀个E-R图包含有A实体和B实体,并且从A到B存在着1∶n的联系,则转换成关系模型后,包含有3个关系模式。
13.实现系统案例,防⽌⾮法破坏数据,所采⽤的数据保护措施有:⽤户标识和鉴定、存取控制定义视图审计数据加密14.恢复的实现技术有:数据转储和登录⽇志⽂件。
13、15.____分布式数据库___________是⼀个逻辑上统⼀、地域上分布的数据集合。
16.关系中能唯⼀标识元组,且⼜不含多余属性称为___候选键_____________。
17.在概念结构设计中先,定义全局概念结构的框架,然后逐步细化。
这种⽅法称为_____________⾃顶向下⽅法___________。
18.分布式数据库系统中透明性层次越⾼,应⽤程序的编写越简单。
二、填空题1.2.2 信息技术促使传统的信息管理向___知识___管理发展。
1.2.6 信息是关于__客观事实___的__可通信___的知识。
2.2.5 管理信息系统绝不只是一个技术系统,而是把人包括在内的人机系统,因而它是一个___社会___系统。
2.2.6 管理信息系统按其所能处理的管理数据和提供的决策服务程度可分为三类:事务处理系统、管理信息系统和__决策支持系统___。
2.2.9 管理信息系统为了对不同的管理层提供不同的信息,在层次上可以分为:执行控制层、管理控制层和__战略决策层__。
2.2.10 管理信息系统的一个生命周期划分为四个阶段:系统分析、系统设计、系统实施和__系统评价___。
2.2.16 ERP的核心是__ MRPⅡ___。
3.2.18 在数据库技术中,使用数据模型的概念描述数据库的语义和结构,一般可分为两类:概念数据模型和__结构___数据模型。
3.2.39 在数据库技术中,数据模型分为概念数据模型和结构数据模型,常用的实体-联系模型(E-R模型)属于___概念___数据模型。
5.2.1 诺兰阶段模型把信息系统的成长过程划分为初装、_蔓延__、控制、__集成_、数据管理和成熟等六个阶段。
5.2.4 开发管理信息系统的策略有_自下而上_和_自上而下_两种。
5.2.16 结构化系统开发方法可分为系统分析、_系统设计_和_系统实施_三个阶段。
6.2.3 可行性分析的内容包括技术可行性、_管理__可行性和__经济_可行性。
6.2.5 系统分析阶段主要完成新系统的_逻辑_设计,系统设计阶段主要完成新系统的_物理_设计。
6.2.15 数据按动态特性可分为固定值属性、_固定个体变动_属性和_随机变动_属性三类。
6.2.20 数据项又称__数据元素__,是数据的__最小单位__。
6.2.32 描述管理业务流程的图表有__管理业务流程图_和_表格分配图__等。
7.2.3 确定校验位值的方法有算数级数法、_几何级数法_和质数法等。