厦门大学数据库实验室httpdblabxmueducn
- 格式:ppt
- 大小:1.66 MB
- 文档页数:38
厦门大学林子雨编著《大数据技术原理与应用》教材配套上机练习图计算框架Hama的基础操作实践(版本号:2016年1月18日版本)主讲教师:林子雨厦门大学数据库实验室二零一六年一月(版权所有,请勿用于商业用途)目录目录1作业题目 (1)2作业目的 (1)3作业性质 (1)4作业考核方法 (1)5作业提交日期与方式 (1)6作业准备 (1)6.1、Hama计算框架的安装配置 (1)6.2、用Hama计算模型实现寻找最大独立集问题算法 (3)7作业内容 (9)8实验报告 (9)附录1:任课教师介绍 (9)附录2:课程教材介绍 (10)《大数据技术原理与应用》图计算框架Hama基础操作实践上机练习说明主讲教师:林子雨E-mail: ziyulin@ 个人主页:/linziyu1作业题目图计算框架Hama基础操作实践。
2作业目的旨在让学生了解Pregel图计算模型,并学会用Pregel的开源实现Hama实现一些基本操作。
3作业性质课后作业,必做,作为课堂平时成绩。
4作业考核方法提交上机实验报告,任课老师根据上机实验报告评定成绩。
5作业提交日期与方式图计算章节内容结束后的下一周周六晚上9点之前提交。
6作业准备请阅读厦门大学林子雨编著的大数据专业教材《大数据技术原理与应用》(官网:/post/bigdata/),了解图计算的概念与意义。
6.1、Hama计算框架的安装配置A pache Hama是Google Pregel的开源实现,与Hadoop适合于分布式大数据处理不同,Hama主要用于分布式的矩阵、graph、网络算法的计算。
简单说,Hama是在HDFS 上实现的BSP(Bulk Synchronous Parallel)计算框架,弥补Hadoop在计算能力上的不足。
(1). 安装好合适版本的jdk和hadoop,并且进行测试,保证他们能用。
(2). 下载hama安装文件,从/downloads.html处下载合适的版本,我当时下的是0.6.4版本的。
“北大法宝”数据库使用通知为了方便厦门大学校园网用户检索各类法律信息,厦门大学图书馆与北大英华公司向厦门大学校园网用户提供“北大法宝”数据库的开放使用,厦门大学校园网用户均享有北大法律网VIP会员访问权限。
凡是在本大学提供IP段范围内的终端用户,无需输入用户名和密码,即可直接访问“北大法宝”如下数据库。
由于设定了并发用户数量,当访问“北大法宝”如下数据库的用户数量达到最大值时,其他用户需要等待在访问用户退出时方能进行访问。
如您在使用中遇到任何问题可发邮件bdfb@与我们联系。
●/“北大法宝”----中文在线“北大法宝”----中国法律检索系统,自1985年诞生于北大法律系,是国内最早的法律信息检索系统,独创多项国内唯一、国际领先的信息处理技术,曾被列为国家科委重点科技项目,并荣获过省部级科技进步奖。
产品由北京大学法制信息中心专家精心研发,与北大英华联合,经过9次版本升级到目前的3.1智能版,全面收录1949年至今44万多件(数据不断更新)法律文件,是目前最专业、最先进的法律法规数据库,客户遍布全国各地,并有相当多的国外客户,市场占有率遥遥领先。
●/“北大法宝”----英文在线“北大法宝”----中国法律英文译本库,由北京大学法律翻译研究中心与北大英华联合推出,建库于2000年,译文包括北京大学法律翻译研究中心翻译的文本、国家立法机关提供的官方译本及经有关机构授权使用的译本,经过多层审校,最大程度地保证了英文译本的质量。
该英文译本数据库库也是中国法律内容最全、更新速度最快的英文译本库。
●/Case/“北大法宝”----司法案例“北大法宝”----中国司法案例数据库,由民事案例、刑事案例及行政案例3个数据库组成。
全面精选收录我国大陆法院的各类案例,根据用户需求提供全方位检索、导航功能,并独家推出个案系统呈现、案例帮助系统及刑事比对功能。
同时在“北大法宝”法条联想功能的基础上,进一步实现法规与案例的全方位的联想功能,使用户在最短时间内了解与本案相关的理论、实务方面的知识。
Google Spanner (中文版)翻译者:厦门大学计算机系教师林子雨翻译时间:2012年9月E-mail: ziyulin@ 个人主页:/linziyu【摘要】:Spanner是谷歌公司研发的、可扩展的、多版本、全球分布式、同步复制数据库。
它是第一个把数据分布在全球范围内的系统,并且支持外部一致性的分布式事务。
本文描述了Spanner的架构、特性、不同设计决策的背后机理和一个新的时间API,这个API可以暴露时钟的不确定性。
这个API及其实现,对于支持外部一致性和许多强大特性而言,是非常重要的,这些强大特性包括:非阻塞的读、不采用锁机制的只读事务、原子模式变更。
【关键词】Google Spanner, Bigtable, distributed database【全文目录结构】1. 介绍2. 实现2.1 Spanserver软件栈2.2 目录和放置2.3 数据模型3. TrueTime4. 并发控制4.1 时间戳管理4.2 细节5. 实验分析5.1 微测试基准5.2 可用性5.3 TrueTime5.4 F16. 相关工作7. 未来的工作8. 总结致谢参考文献1 介绍Spanner是一个可扩展的、全球分布式的数据库,是在谷歌公司设计、开发和部署的。
在最高抽象层面,Spanner就是一个数据库,把数据分片存储在许多Paxos[21]状态机上,这些机器位于遍布全球的数据中心内。
复制技术可以用来服务于全球可用性和地理局部性。
客户端会自动在副本之间进行失败恢复。
随着数据的变化和服务器的变化,Spanner会自动把数据进行重新分片,从而有效应对负载变化和处理失败。
Spanner被设计成可以扩展到几百万个机器节点,跨越成百上千个数据中心,具备几万亿数据库行的规模。
应用可以借助于Spanner来实现高可用性,通过在一个洲的内部和跨越不同的洲之间复制数据,保证即使面对大范围的自然灾害时数据依然可用。
我们最初的客户是F1[35],一个谷歌广告后台的重新编程实现。
厦门大学计算机科学系本科生课程《数据库系统原理》作业及答案
第1章绪论
第1次作业
绘制E-R图
厦门大学数据库实验室
二零一六年二月
目录
目录
1习题1 (1)
2习题2 (2)
附录1:任课教师介绍 (2)
厦门大学计算机科学系本科生课程
《数据库系统原理》第1章第1次作业
绘制E-R图
主讲教师:林子雨
E-mail: ziyulin@ 个人主页:/linziyu
1习题1
学校中有若干系,每个系有若干班级和教研室,每个教研室有若干教员,其中有的教授和副教授每人各带若干研究生;每个班有若干学生,每个学生选修若干课程,每门课可由若干学生选修。
请用E-R图画出此学校的概念模型。
【答案】
2 习题2
某工厂生产若干产品,每种产品由不同的零件组成,有的零件可用在不同的产品上。
这些零件由不同的原材料制成,不同零件所用的材料可以相同。
这些零件按所属的不同产品分别放在仓库中,原材料按照类别放在若干仓库中。
请用 E 一 R 图画出此工厂产品、零件、材料、仓库的概念模型。
【答案】
附录1:任课教师介绍
林子雨(1978-),男,博士,厦门大学计算机科学系助理教授,主要研究领域为
数据库,实时主动数据仓库,数据挖掘.
主讲课程:《数据库系统原理》《大数据技术原理与应用》
办公地点:厦门大学海韵园科研2号楼
E-mail: ziyulin@
个人主页:/linziyu 数据库实验室网站:。