数据库技术的研究领域及技术前沿
- 格式:doc
- 大小:37.50 KB
- 文档页数:10
一、选题背景及意义:数据库技术主要研究如何存储、使用和管理数据 ,是计算机技术中开展最快、应用最广的技术之一。
作为计算机软件的一个重要分支,数据库技术一直是倍受信息技术界关注的一个重点。
尤其是在信息技术高速开展的今天,数据库技术的应用可以说是深入到了各个领域。
当前,数据库技术已成为现代计算机信息系统和应用系统开发的核心技术,数据库已成为计算机信息系统和应用系统的组成核心,更是未来信息高速公路的支撑技术之一。
因此,为了更好的认识和掌握数据库技术的现状及开展趋势,本文对有关数据库开展的文献进行了收集整理,以求在对现有相关理论了解、分析的根底上,对数据库开展进行综合论述,对数据库技术开展的总体态势有比拟全面的认识,从而推动数据库技术研究理论的进一步开展。
二、论文综述然而历史的开展总是在我们不经意间产生转折,所有重大技术的产生及开展都有其生存的土壤。
40年前数据库的诞生并不是关系型数据库,第一代的数据库第一次实现了数据管理与应用逻辑的别离,采用层次结构来描述数据,是层次型数据库(IM)。
第二代数据库奠基于上世纪70年代E.F Codd博士提出的关系型理论以及QL语言的创造。
实现了数据建模和数据操作处理的标准化,关系型数据库在其后的20多年的时间取得了长足的开展,得到了广泛的应用。
技术的演进主要集中在性能、扩展性和平安性等方面的提升,其根本的理论框架和技术理念并没有大的变化。
与之相反,在过去的20多年里,IT产业发生了重大的变化和一系列技术及理念的创新。
数据库所生存的外部土壤随着Internet以及在网络环境下IT系统互联互通相互协作的趋势,对信息管理技术提出了新的挑战。
2、国内研究的综述:《移动数据库技术研究综述》《Web数据库技术综述》《Web与数据库技术》《数据库技术开展趋势》三、论文提纲(一)数据库技术概论1、数据库技术概念及类型2、数据库技术开展历程3、数据库技术应用(二)数据库技术开展现状------关系数据库技术仍然是主流1、开展现状概述2、Oracle概念及应用3、Acce概念及应用4、QL概念及应用5、DB2概念及应用6、开展现状总结(三)数据库技术开展的趋势1、下一代数据库技术的开展主流面向对象的数据库技术与关系数据库技术2、演绎面向对象数据库技术3、数据库技术开展的新方向非结构化数据库4、数据库技术开展的又一趋势数据库技术与多学科技术的有机结合5、未来数据库技术及市场开展的两大方向数据仓库和电子商务6、数据库技术的实践性开展面向专门应用领域的数据库技术(四)当代与未来数据库研究的热点数据挖掘、知识发现与数据仓库1、数据挖掘技术2、数据仓库技术3、知识发现技术4、小结5、结论四、论文写作进度安排(一)开题报告:论文题目、系别、专业、年级、姓名、导师(二)目的意义和国内研究概况(三)论文的理论依据、研究方法、研究内容(四)研究结论(五)预期的结果(六)进度安排。
数据挖掘的发展趋势及未来的研究方向一、数据挖掘简介近十几年来,信息数据增长之巨大已到了令人咂舌地步,大型数据库、数据仓库被用于商业管理、政府办公、科学研究和工程开发等等。
于是,我们又面临了新的问题:如何从中及时发现有用的知识,提高信息利用率?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据只能成为包袱,甚至垃圾。
因此,数据挖掘技术应运而生。
我们可以把数据挖掘理解为:数据挖掘就是从海量的数据(包括结构化和非结构化)中挖掘出隐含在其中的、事先不为人知的、潜在的、有用信息和知识的技术。
这些信息是可能有潜在价值的,是用户感兴趣的、可理解、可运用的,支持决策,可以为企业带来利益,或者为科学研究寻找突破口。
二、数据挖掘的功能数据挖掘综合了各个学科技术,有很多的功能,当前主要功能如下:(1)分类:按照分析对象的属性、特征,建立不同的组类来描述事物。
例如:银行部门根据以前的数据将客户分成了不同的类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应的贷款方案。
(2)聚类:识别出分析对内在的规则,按照这些规则把对象分成若干类。
例如:将申请人分为高度风险申请者,中度风险申请者,低度风险申请者。
(3)关联规则和序列模式的发现:关联是某种事物发生时其他事物会发生的这样一种联系。
例如:每天购买尿布的人也有可能购买啤酒,比重有多大,可以通过关联的支持度和可信度来描述。
与关联不同,序列是一种纵向的联系。
例如:今天银行调整利率,明天股市的变化。
(4)预测:把握分析对象发展的规律,对未来的趋势做出预见。
例如:对未来经济发展的判断。
(5)偏差的检测:对分析对象的少数的、极端的特例的描述,揭示内在的原因。
例如:在银行的100万笔交易中有500例的欺诈行为,银行为了稳健经营,就要发现这500例的内在因素,减小以后经营的风险。
需要注意的是:数据挖掘的各项功能不是独立存在的,在数据挖掘中互相联系,发挥作用。
多模态数据库处理技术研究及应用随着信息化时代的到来,数据越来越多,同时也越来越复杂。
一个有用的数据库应该能够存储和处理各种类型的数据,包括文本、图像、音频和视频。
多模态数据库技术就是为了满足这个需求而产生的。
本文将重点介绍多模态数据库处理技术研究及应用。
一、多模态数据库的概念多模态数据库是指能够存储和处理多种媒体类型数据的数据库。
传统数据库只能处理结构化数据,比如表格和关系,而多模态数据库可以包括非结构化数据,比如图像和音频。
同时,多模态数据库还可以支持多种查询语言和多种数据表示方式。
多模态数据库已经广泛应用于许多领域,比如智能交通、智能家居以及医疗健康。
通过将不同信息整合到一个数据库中,并且可以通过多种方式查询这些信息,多模态数据库可以极大地提高数据的效率和准确性。
二、多模态数据库处理技术1. 数据入库多模态数据库的第一步是将数据存储在数据库中。
这需要开发者选择一个适当的数据库管理系统,通常使用的有关系型数据库和非关系型数据库两种。
关系型数据库适用于存储结构化数据。
它们使用表格来表示数据,同时需要按照一定的规则约束数据的类型和格式。
常用的关系型数据库有MySQL、Oracle、SQL Server等。
非关系型数据库适用于存储非结构化数据。
它们不需要约束数据格式,通常使用键值对、文档、图表等数据结构来储存数据。
常用的非关系型数据库有MongoDB、Redis等。
2. 多模态数据表达多模态数据库可以包含文本、图像、音频和视频等多种形式的数据。
为了存储这些数据,需要在数据库中指定适当的数据类型。
通常使用的数据类型有以下几种:文本类型:用于存储文本数据,通常将文本编码为Unicode格式。
二进制大对象类型(BLOB):用于存储非图像和非音频数据,比如XML文件、Word文档等。
图像类型:用于存储图像数据,像素矩阵通常以二进制数据的形式存储在数据库中。
音频和视频类型:用于存储音频和视频数据,通常使用特定的格式,比如MP3、WAV、MOV等。
数据库技术的发展现状及趋势一、本文概述随着信息技术的迅猛发展,数据库技术作为信息技术的核心组成部分,已经深入到各行各业,成为了现代社会运转不可或缺的基础设施。
本文旨在全面探讨数据库技术的当前发展现状,以及未来可能的发展趋势。
我们将从数据库技术的历史沿革出发,分析当前主流数据库技术的特点和应用场景,然后深入探讨数据库技术在云计算、大数据等新技术背景下的创新应用,最后展望数据库技术的未来发展趋势,以期对数据库技术的发展提供全面的理解和前瞻性的思考。
在本文中,我们将重点关注数据库技术的性能优化、可扩展性、安全性、智能化等方面的发展现状,并深入探讨这些技术如何满足现代社会对数据处理的高效率、高可靠性、高安全性的需求。
我们也将关注数据库技术在应对数据爆炸式增长、数据类型多样化、数据处理实时化等挑战方面的创新实践。
通过本文的阐述,我们希望能够为数据库技术的研究者、开发者、使用者提供一个清晰的技术发展脉络,以及对未来技术发展的预见和启示。
我们也希望通过本文的探讨,能够促进数据库技术的进一步发展,推动信息技术在各个领域的应用创新,为构建数字中国、智慧社会提供强大的技术支持。
二、数据库技术的发展历程数据库技术的发展历史可以追溯到上世纪60年代,经历了从简单到复杂、从集中式到分布式、从关系型到非关系型等多个阶段。
初始阶段(1960s-1970s):在60年代末期,随着计算机技术的兴起,数据库技术开始萌芽。
此时,数据库主要以层次模型(Hierarchical Model)和网状模型(Network Model)为主,这些模型主要用于处理大规模、复杂的数据结构。
关系型数据库阶段(1970s-1990s):随着关系理论的发展,关系型数据库(RDBMS,Relational Database Management System)开始崭露头角。
以SQL(Structured Query Language)为基础,关系型数据库提供了统一的数据查询和操作方式,极大地简化了数据处理和管理的复杂性。
国内智库研究的知识图谱现状、热点及趋势基于CSSCI期刊的文献计量分析一、本文概述随着信息技术的飞速发展,知识图谱作为一种重要的知识表示与发现工具,在多个领域中都展现出了巨大的潜力和应用价值。
近年来,国内智库研究逐渐兴起,成为政策制定、学术研究和公众关注的热点。
智库研究不仅关注国内外政治、经济、社会等重大问题,还致力于提供科学的决策支持和政策建议。
在这样的背景下,了解国内智库研究的知识图谱现状、热点及趋势显得尤为重要。
本文旨在通过文献计量分析的方法,基于CSSCI期刊的智库研究相关文献,深入剖析国内智库研究的知识图谱现状、热点及趋势。
本文将对CSSCI期刊中智库研究领域的文献进行系统的收集与整理,构建智库研究的知识图谱。
通过文献计量分析,揭示智库研究的热点领域、研究前沿和学术影响力。
结合当前国内外形势和政策需求,探讨智库研究的发展趋势和未来展望。
本文的研究不仅有助于深化对国内智库研究领域的认识,还能为政策制定者、学者和公众提供有价值的参考信息。
本文的研究方法和结果也可为其他领域的知识图谱构建和文献计量分析提供借鉴和启示。
二、文献综述近年来,随着大数据和知识图谱技术的快速发展,越来越多的学者和研究机构开始运用这些方法对国内智库研究进行深入探索。
知识图谱作为一种可视化的知识表达工具,能够有效地揭示知识领域的内在结构和关联。
通过对CSSCI期刊中的智库研究文献进行计量分析,可以系统地了解国内智库研究的知识图谱现状、热点及趋势。
在知识图谱构建方面,国内学者已经取得了一系列的研究成果。
他们运用不同的方法和技术,如文本挖掘、共词分析、社会网络分析等,构建了涵盖不同主题和领域的知识图谱。
这些图谱不仅揭示了智库研究的学科分布、研究热点和发展趋势,还为后续的智库研究提供了有力的理论支撑和实践指导。
在智库研究的热点方面,通过对CSSCI期刊文献的计量分析,可以发现一些显著的研究主题和关键词。
例如,政策研究、决策咨询、国际关系等主题一直是智库研究的重点。
万方系列数据库入口深入探索电脑技术的前沿知识随着信息技术的迅速发展,大数据和人工智能已成为当前电脑技术的前沿领域。
作为一种重要的信息处理工具,数据库在应对大数据时起着关键作用。
而在众多数据库中,万方系列数据库以其卓越的性能和强大的功能备受推崇。
本文将深入探索万方系列数据库的入口及其应用,并剖析其中的前沿知识。
一、万方系列数据库入口1.1 万方数据知识服务平台万方数据知识服务平台是万方数据库的主要入口。
该平台提供了多种功能:学术期刊搜索、学位论文检索、会议论文搜索、专利搜索、标准检索等。
用户可以通过这些功能快速获取所需的学术和科研资源。
1.2 万方专业数据库万方专业数据库是一个涵盖各个领域的重要数据库集合,包括文史哲、经济管理、工程技术、农林科学、医药卫生等。
用户可以通过该数据库深入了解特定领域的研究成果和前沿知识。
二、万方系列数据库应用2.1 学术研究与科研支持万方系列数据库为学者和科研人员提供了丰富的学术资源,帮助他们进行科学研究。
研究人员可以通过万方数据库收集文献资料、浏览最新研究成果,提高研究效率和质量。
2.2 企业决策与市场分析万方系列数据库不仅服务于学术界,也对企事业单位具有重要意义。
企业可以通过数据库获取市场调研数据、行业报告和竞争对手信息,为决策提供支持和参考。
2.3 教育教学支持万方系列数据库在高校和科研院所中被广泛应用于教育教学活动。
教师可以通过数据库获取最新的教育研究成果、经典教材和教学案例,提高教学水平和教学效果。
三、万方系列数据库的前沿知识3.1 大数据管理与应用随着互联网的快速发展,大数据已成为信息时代的重要特征。
万方系列数据库通过强大的数据存储和管理功能,支持大数据的存储、处理和分析,为大数据应用提供了基础。
3.2 云计算与分布式存储随着云计算技术的兴起,数据库正向着云化和分布式方向发展。
万方系列数据库通过优化存储结构和算法,提高了数据库的性能和可扩展性,满足了云计算环境下的需求。
学术研究前沿:探索新科技发展方向引言科技是人类社会发展的驱动力,不断涌现的新科技为我们开拓了更广阔的未来。
随着科技的不断突破和创新,学术研究也在不断拓展新的前沿领域。
在这个信息爆炸的时代,我们需要关注并探索那些将引领未来科技发展方向的学术研究前沿。
本文将引入一些当前热门的新兴科技领域,探讨它们的应用和未来发展趋势。
1. 人工智能和机器学习人工智能(Artificial Intelligence,简称AI)和机器学习(Machine Learning)是目前科技研究中最为炙手可热的领域之一。
随着大数据和计算能力的提升,人工智能技术愈发成熟,广泛应用于各个行业。
1.1 深度学习和神经网络深度学习(Deep Learning)是机器学习领域中的一个重要分支,它通过构建多层神经网络模型来模拟人脑的工作机制。
深度学习技术已经在图像识别、自然语言处理等诸多领域取得了突破性进展。
未来,深度学习将继续发展,为更广泛的应用领域提供支持。
1.2 机器学习在医疗领域的应用机器学习在医疗领域有着巨大的潜力。
通过利用大数据和机器学习技术,可以实现对疾病的早期预测、个性化治疗等。
例如,可以利用机器学习算法对患者的多种数据进行分析,以帮助医生制定更准确的诊断和治疗方案。
2. 量子计算和量子通信量子计算(Quantum Computing)和量子通信(Quantum Communication)被认为是未来科技发展的重要方向。
量子技术的应用将带来巨大的突破和改变。
2.1 量子计算的潜力量子计算利用量子力学的特性进行计算,以极快的速度解决传统计算无法处理的问题。
例如,量子计算可用于破解复杂的密码算法、优化复杂的问题以及模拟量子系统等。
虽然量子计算技术目前仍处于发展初期,但其潜力无疑是巨大的。
2.2 量子通信的安全性量子通信利用了量子特性的独特性质,它具有不可伪造性和不可破解性。
量子通信技术将大大提高通信的安全性,有效地抵御窃听和破解行为。
数据科学与大数据技术的前沿研究近年来,数据科学与大数据技术领域的研究备受关注。
在信息时代的浪潮下,海量的数据被快速地产生、积累和传播,对人们的生产生活带来了巨大的影响。
数据科学与大数据技术的前沿研究涉及数据处理、数据挖掘、机器学习以及人工智能等多个方面。
本文将分析目前数据科学与大数据技术的前沿研究,以期为相关领域的研究人员提供一定的参考。
一、数据处理与存储技术数据科学与大数据技术的前沿研究之一是数据处理与存储技术。
面对海量的数据,如何高效地处理和存储这些数据成为了研究的重点。
传统的关系型数据库往往无法应对大数据环境下的查询需求,因此一些新的数据处理与存储技术得到广泛关注,例如分布式文件系统、NoSQL数据库和列式数据库等。
这些技术能够提供高容量、高性能和高可扩展性的数据存储方案,满足大数据环境下的需求。
二、数据挖掘与机器学习数据挖掘与机器学习是数据科学与大数据技术的另一个前沿研究方向。
通过运用各种算法和模型,从海量数据中挖掘出有用的信息和知识,帮助人们做出明智的决策。
例如,聚类算法可以将相似的数据进行分组,分类算法可以对数据进行标记分类,关联规则算法可以发现数据之间的关联关系。
此外,机器学习算法在诸多领域取得了重要的成就,例如自然语言处理、计算机视觉以及推荐系统等。
三、人工智能与深度学习在数据科学与大数据技术的研究中,人工智能与深度学习是备受瞩目的热点方向。
人工智能领域的关键技术之一就是深度学习,通过构建深度神经网络,可以自动从数据中学习特征和模式。
深度学习在图像识别、语音识别、自然语言处理等领域有了广泛的应用,为人们提供了更准确的智能服务。
四、数据可视化与交互技术数据可视化与交互技术也是数据科学与大数据技术的前沿研究之一。
海量的数据需要通过可视化的方式直观地展示出来,使人们能够更好地理解和分析数据。
同时,交互技术能够让用户与数据进行更直接、更灵活的互动。
数据可视化与交互技术的研究旨在提供更友好、更高效、更个性化的用户体验,使人们能够更好地利用大数据。
《数据挖掘研究现状及发展趋势》篇一一、引言数据挖掘(Data Mining)是一门综合了统计学、机器学习、数据库技术等多个学科的交叉学科,它旨在从大量数据中提取有价值的信息和知识。
随着信息技术的快速发展,数据挖掘技术已经成为了许多领域的重要研究课题。
本文将探讨数据挖掘的当前研究现状以及其未来的发展趋势。
二、数据挖掘的研究现状1. 国内外研究现状国内在数据挖掘领域的研究起步较晚,但近年来发展迅速。
国内学者在数据挖掘算法、应用领域等方面取得了许多重要成果。
同时,政府和企业对数据挖掘的重视程度不断提高,推动了相关领域的发展。
国外在数据挖掘领域的研究起步较早,已经形成了较为完善的理论体系和实际应用。
许多国际知名的学术会议和期刊都设有数据挖掘专区,为研究者提供了交流和学习的平台。
2. 主要研究方向目前,数据挖掘的主要研究方向包括分类、聚类、关联规则挖掘、时序分析等。
分类和聚类是数据挖掘中最常用的两种方法,用于对数据进行分类和分组。
关联规则挖掘则是从大量数据中找出项集之间的关联关系。
时序分析则主要用于对时间序列数据进行预测和分析。
此外,还有一些新兴的研究方向,如深度学习在数据挖掘中的应用等。
三、数据挖掘的应用领域数据挖掘的应用领域非常广泛,包括金融、医疗、电商、物流等众多领域。
在金融领域,数据挖掘可以用于风险评估、欺诈检测等;在医疗领域,可以用于疾病诊断、患者管理等方面;在电商和物流领域,可以用于推荐系统、路线规划等。
此外,数据挖掘还可以应用于能源、农业等领域。
四、数据挖掘的发展趋势1. 技术发展随着技术的不断发展,数据挖掘将更加注重人工智能和机器学习技术的应用。
深度学习等新兴技术将进一步推动数据挖掘的发展,使其能够处理更加复杂的数据和提取更加有价值的信息。
同时,随着云计算和大数据技术的发展,数据挖掘将更加注重数据的实时性和高效性。
2. 跨学科融合未来,数据挖掘将更加注重跨学科融合。
与统计学、机器学习、数据库技术等学科的交叉融合将更加紧密,形成更加完善的理论体系和实际应用。
数据库技术的研究领域1、DBMS软件的研制DBMS本身及周边软件系统;支持新的数据类型,如非格式化数据:声音、图象;面向对象;多媒体2、数据库设计数据库设计的方法、工具、理论;数据模型、建模;CA数据库设计方法、设计规和标准。
3、数据库理论关系的规代理论;关系数据理论;数据库逻辑演绎和知识推理、并行算法;演绎数据库、知识库、数据仓库数据库技术新进展第一代:网状、层次数据库:支持格式化数据模型(有序树、有向图)第二代:关系数据库系统:支持关系模型,(关系代数、关系理论),属于语法模型(无法表达数据对象的语义)第三代:面向对象模型为主要特征的数据库系统:更丰富的数据模型更强大的数据管理传统数据库系统的局限性1.面向机器的语法数据模型2.数据类型简单、固定3.结构与行为完全分离4.阻抗失配5.被动响应6.存储、管理的对象有限7.事务处理能力较差第三代数据库技术的特点1.对象标识(与码不同,为系统全局唯一)2.封装(消息传递来存取)3.类和类层次(有根的有向非环图)4.继承(单继承和多重继承)在面向对象的设计环境中加入数据库功能,如ORIEN,CLOS等使传统数据库系统支持面向对象的数据模型,如ORACLE8,INFORMIX9等分布式数据库1.数据的物理分布性2.数据的逻辑整体性3.数据的分布独立性(分布透明性)4.场地自治和协调5.数据的冗余和冗余透明性并行数据库1.共享存结构(紧耦合全对称多处理器SMP系统)容易实现;负载均衡;伸缩性不佳;可用性不好。
(CPU高效地扩充至32个)2.共享磁盘结构(松耦合群集机cluster系统)消除存瓶颈;磁盘瓶颈仍在;能动缓存瓶颈;CPU最多在到数百个。
3.无共享资源结构(大规模并行处理MMP和SMP群集机系统)负载均衡难;伸缩性极佳;高可用性;难实现。
并行粒度1.不同用户事务间的并行性多进程或多线程处理用户请求2.同一事务不同查询间的并行性判断查询的不相关性3.同一查询不同操作间的并行性对多表的并行处理4.同一操作的并行性对同一表的不同存储的并行处多媒体数据库1.实现对格式化和非格式化多媒体数据的存储、管理和查询能够表示多种媒体的数据2.能够协调处理各种媒体数据,正确识别各种媒体数据之间在空间或时间上的关联。
3.比传统数据管理系统更强的适合非格式化数据查询的搜索功能特种事务处理与版本管理能力主动数据库1.根据数据库的当前状态,主动适时地做出反应,执行某些操作,向用户提供有关信息。
2.通常采用的方法:在传统数据库中嵌入ECA(事件-条件-动作)规则主动数据库的数据模型和知识模型执行模型条件检测事务调度(难题:执行时间估计的代价模型)体系结构系统效率3.概念不成熟,技术待研究对象-关系数据库1.允许用户扩充基本数据类型2.能够在SQL中支持复杂对象3.能够支持子类对超类的各种特性的继承,支持数据继承和函数继承,支持多重继承,支持函数重载4.能够提供功能强大的通用规则系统,而且规则系统与其他的对象-关系能力是集成为一体的。
(如规则中的事件和动作可以是任意的SQL语句)数据仓库1.操作型处理(OLTP联机事务处理)事务处理,数据库联机的日常操作。
关心响应时间、数据的安全性和完整性2.分析型处理(OLAP联机分析处理)管理人员的决策分析3.OLTP应用与DSS应用处理明显冲突性能特性不同(存取频度高,操作处理时间短;连续运行,消耗大量系统资源)数据集成问题(细节数据;集成数据)数据动态集成问题(静态集成不能反映动态变化;动态集成周期刷新)历史数据问题(事务处理不利用;分析处理相当重要)数据综合问题(细节数据量大影响分析效率;细节数据不利于分析;综合和冗余控制)数据仓库的特征1.面向主题2.集成3.稳定4.随时间变化5.基于数据库技术的DSS解决方案6.DW+OLAP+DM工程数据库处理复杂结构和涵的工程对象以及工程领域量的“非经典”应用1.支持复杂多样的工程数据的存储和集成管理2.支持复杂对象(如图形数据)的表示和处理3.支持变长结构数据实体的处理4.支持多种工程应用程序5.支持模式的动态修改和扩展6.支持设计过程中多个不同数据库版本的存储和管理7.支持工程长事务和嵌套事务的处理和恢复统计数据库用来对统计数据进行存储、统计(如求数据的平均值、最大值、最小值、总和等、分析的数据库系统1.微数据:描述是个体或事件的信息;2.宏数据:综合统计数据,可以来自应用领域,也可以来自微数据的综合分析。
空间数据库1.描述空间位置和点、线、面、体特征的拓朴结构的位置数据及描述这些特征的性能的属性数据为对象的数据库2.位置数据为空间数据;属性数据为非空间数据数据库前沿技术介绍数据库指的是以一定方式储存在一起、能为多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。
传统数据库,以关系型数据库为主要代表,如MySQL、Microsoft SQL Server、Oracle 等。
一、传统的关系型数据库技术(1)MySQLMySQL软件采用了双授权政策,它分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型的开发都选择MySQL作为数据库。
在新版MySQL5.6里做了如下修改:改进的InnoDB 存储引擎,增加全文索引能力;提升子查询性能;同步复制功能增强,引入多线程复制特性;引NoSQL特性,可直接使用Memcached API 操作InnoDB数据。
(2)Microsoft SQL ServerMicrosoft SQL Server是由美国微软公司所推出的关系数据库解决方案,最新的版本是SQL Server 2012,SQL Server 2012主要改进在于:通过Always On提供所需运行时间和数据保护;通过列存储索引获得突破性和可预测的性能;通过用于组的新用户定义角色和默认架构,帮助实现安全性和遵从性;通过列存储索引实现快速数据恢复,以便更深入地了解组织;通过SSIS改进、用于Excel的Master Data Services 外接程序和新Data Quality Services,确保更加可靠、一致的数据;通过使用SQL Azure 和SQL Server 数据工具的数据层应用程序组件(DAC) 奇偶校验,优化服务器和云间的IT和开发人员工作效率等。
(3)OracleOracle Database,又名Oracle RDBMS,或简称Oracle,是甲骨文公司的一款关系数据库管理系统,到目前仍在数据库市场上占有主要份额。
新版的Oracle Database 12c版本里有了如下的改进:PL/SQL性能增强,类似在匿名块中定义过程,现在可以通过WITH语句在SQL 中定义一个函数,采用这种方式可以提高SQL调用的性能;放宽多种数据类型长度限制;TOP N的语句实现;临时UNDO:将临时段的UNDO独立出来,放到TEMP表空间中,优点包括:减少UNDO 产生的数量;减少REDO产生的数量;在ACTIVE DATA GUARD上允许对临时表进行DML操作等。
二、最新的非关系型数据库技术随着互联网Web2.0 的兴起,传统的关系数据库在应付Web2.0 ,特别是超大规模和高并发的社交网络类型的Web2.0 纯动态已经显得力不从心,暴露出了很多问题。
在新的应用背景下发展起来了新的数据库技术:NoSQL。
NoSQL指的是非关系型的分布式数据库,不支持原子性、一致性、隔离性、持久性的数据库设计模式,它对并发的大规模访问有着效率上的优势,NoSQL的主要代表有:BigTable,MongoiDB,Cassandra 等。
(1)BigTableBigTable是一种压缩的、高性能的、高可扩展性的,基于Google 文件系统的数据存储系统,用于存储大规模结构化数据,适用于云计算。
BigTable不是传统的关系型数据库,不支持JOIN这样的SQL语法,BigTable更像今日的NoSQL的Table-oriented,优势在于扩展性和性能。
它现今已成为Google的应用程序,像是MapReduce就常通过BigTable来存储或更改数据,其他还有Google地图、YouTube 视频等都用到了BigTable。
(2)MongoDBMongoDB是一个基于分布式文件存储的数据库,由C++语言编写,旨在为Web应用提供可扩展的高性能数据存储解决方案。
它是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系型数据库的。
MongoDB最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。
国外The New York Times、趋势科技公司等已经将MongoDB作为数据库应用之一。
(3)CassandraCassandra是一个混合型的非关系的数据库,类似于Google的BigTable,其主要功能比Dynomite(分布式的Key-Value存储系统)更丰富,但支持度却不如文档存储MongoDB。
Cassandra最初由Facebook开发,后转变成了开源项目。
它是一个网络社交云计算方面理想的数据库。
著名社交Facebook用Cassandra存储Inbox,而Twitter公司已经公开宣布正在向Cassandra迁移,思科公司也将Cassandra作为数据库应用之一。
经过这几年的飞速发展,新的数据库技术已经逐渐落地成为数据库市场的强劲力量,Oracle等传统数据库厂商,也在MySQL 5.6等新版本数据库中增强对NoSQL的支持,相信随着信息技术的不断发展,新的数据库技术会有更大的发展,传统的数据库必须有相应的改变和升级才能适应信息时代的发展。