[硕士论文] 虚拟天文台数据访问服务(VO-DAS)之任务调度研究及VO-DAS的应用
- 格式:pdf
- 大小:1.84 MB
- 文档页数:72
分类号密级:UDC 编号:中国科学院研究生院硕士学位论文中国虚拟天文台可视化设计及实现邵惠娟指导老师:赵永恒研究员中国科学院国家天文台申请学位级别: 硕士学科专业名称:天体物理论文提交日期: 2004年6月论文答辩日期:2004年7月培养单位:中国科学院国家天文台学位授予单位:中国科学院研究生院答辩委员会主席:阎保平中国科学院研究生院研究生论文中国虚拟天文台可视化设计及实现作者邵惠娟指导老师赵永恒学科专业天体物理研究方向天文数据处理方法申请学位硕士培养单位国家天文台二〇〇四年六月National Astronomical Observatory Chinese Academy of SciencesDesign and Realization ofVisualization forChinese Virtual ObservatoryH u i j u a n S h a oA d v i s o r:P r o f.Y o n g h e n g Z h a oJune 2004摘要随着地面和空间观测站的建立、探测器灵敏度的提高、望远镜口径的增大,天文界正面临着“数据雪崩”的问题。
如何通过现代计算机软硬件和网络系统有效地对这些PB量级的数据进行存储、计算、统计、分析和显示,成为天文学面临的一大问题。
在这样的背景下,虚拟天文台应运而生。
各国虚拟天文台正致力于通过数据网格来实现海量分布式数据的管理和统一访问等功能。
数据可视化是虚拟天文台中必不可少的一部分。
它能够从大量的数据中提取有用的信息,或者得到其他方式的不容易察觉的数据特征,以用户需要的形式展现给用户。
最主要的是它能够通过网络,通过表格、图形、图像、视频甚至虚拟现实方式给用户以直观的感受。
本文着重阐述了对天文星表数据和天文图像的可视化设计及实现方法。
天文星表包括Hipparcos,Tycho2,GSC1.2,GSC2.2,USNO A2.0,USNO B1.0,UCAC2等天文学家常用的星表;星图包括DSS-I全天星图。
崔辰州:“数据驱动的天文科普”人生作者:王军礼来源:《科学中国人》2017年第11期虽然说科普是科学家的责任和社会担当,但其实很少有科学家将科普做得很好,不过在2013年的时候我见识到了一位将科普做得很好的科学家。
在许多人眼里他是名副其实的“天文学家”:国家天文台博士毕业后留台工作,从助理研究员、副研究员、研究员到信息与计算中心主任。
他通过新兴信息技术手段将天文学数据结合,主持创建了中国虚拟天文台(China-VO),他是谁呢?他就是崔辰州。
而实际上,崔辰州的人生还远不止这些。
离不开的天文科普每个人都有一个梦想,每个人都有一种热爱。
有多少人从孩提时代开始就树立了成为科学家的伟大志向,然而又有多少人一直坚持最初的梦想和曾经的热爱,最终走到了理想的彼岸呢?我想,崔辰州就是一个代表,他和儿时的我们一样,对星空怀揣敬畏和无限遐想。
出于对天文的热爱与坚持,在崔辰州决定从事天文领域研究的那时起,就与天文科普结下了不解之缘。
20年如一日,他把自己最美好的年华都奉献给了天文学的研究与科普。
1997年,也就是崔辰州大学本科毕业的那一年,他考入国家天文台攻读天体物理硕士学位,攻读硕士期间他学习成绩十分优异,曾获得2000年度的中国科学院刘永龄奖学金。
2000年9月,崔辰州开始在国家天文台攻读天文技术与方法博士学位,期间获得中国科学院研究生奖学金以及北京天文学会颁发的天文科普奖,他的博士论文《中国虚拟天文台系统设计》是国际上第一篇研究虚拟天文台的博士论文,为建设中国虚拟天文台奠定了坚实的理论基础。
以此,博士毕业后崔辰州留台工作,一直致力于“虚拟天文台”“数据驱动的天文科普”“云计算、网格技术”“银河系结构与演化”等天文学相关领域的研究。
他已在N e w A s t r o n o m y,Chinese Science Bulletin,Progress in Astronomy,SPIE,Proceedings of the International Astronomical Research & Technology等国际知名期刊和会议上发表论文100多篇,编著专著《虚拟天文台:天文学研究的工具与技术》,参编《英汉天文学名词》。
第49卷第3期2008年7月天文学报A C T A A ST R oN oM I C A SI N I C AV oL49N o.3J ul.,2008中国虚拟天文台交叉证认工具的开发和应用*高丹+张彦霞赵永恒(中国科学院国家天文台北京100012)摘要随着空间和地面巡天项目的发展,天文数据呈指数增长,天文学已发展到全波段的天文学时代.为了应对形势的需要,虚拟天文台应运而生.为了使天文学家做起科学来更方便快捷,虚拟天文台项目开发了各种实用工具.在数据融合方面,中国虚拟天文台项目开发了交叉证认工具.该工具主要实现了两个服务:一个是服务器端两星表交叉证认;另一个是用户上传星表与服务器端星表交叉证认.前者两星表直接进行交叉证认,后者则先将本地数据自动入库再进行交叉证认.程序还实现了对交叉证认结果的分类和参数的自由选择等功能,以及与可视化工具v()Pl ot的集成.该工具以客户端/服务器端模式的w e b网页形式发布.此工具为多波段数据融合提供了便利,是对两个大星表交叉证认工作的预研究.在以后的工作中,将不断地更新和完善该工具,并将在此基础之上进一步开发统计分析和数据挖掘等工具.关键词方法:数据分析,方法:统计,天文数据库,星表,巡天中图分类号:P114;文献标识码:A1引言随着科学技术的发展,天文学步入了数据丰富的时代,数据以T B、甚至PB量级计量.天文数据覆盖了从伽玛射线、X射线、紫外、光学、红外到射电等波段,天文学发展成为全波段天文学.各个波段的数据是高度相关的.若要获得对天体或天文现象更深入全面的认识和理解,需要在多波段的高维参数空间内进行探索和研究.融合的数据通常能促进新的天体、现象或规律的发现.例如:可见光波段与射电波段数据的融合发现了类星体.而来自不同项目、波段和时间的各种数据的共同属性只有位置,因而若想融合各个波段的数据,位置交叉证认是关键.通过证认可以对天体的物理性质、演化规律获得更全面系统的认识,加深对证认源的新的天文理解,为统计分析、数据挖掘做准备.而研究天体在多维参数空间中的分布,提取的天体的信息越多,越有利于天体的分类.另外,通过多波段交叉证认,增加了发现新天体的概率.天体多波段交叉证认是L A M O s T项目(t he L ar ge Sky A r ea M ul t i一0bj ect Fi ber Spe ct r osc opi c T e l e sc ope,LA M O ST)的科学目标的三大核心课题之一[1],也是要求数据融合的虚拟天文台项目的底层技术之一[2-3].正是基2007一06—26收到原稿,2008一01一07收到修改稿*国家自然科学基金(10473013,90412016,10778724)资助项目十gaoda n2008@gr Il ai l.c om3期高丹等:中国虚拟天文台交叉证认工具的开发和应用349于这些因素,我们更加需要开发切实可行的、方便友好的交叉证认工具,一方面解决天文学家由于无法方便地获得大量多波段数据而难以进行多波段数据研究的课题;另一方面为中国虚拟天文台项目探讨从底层的数据到融合数据再到数据的可视化和挖掘提供技术支持.2国外研究现状随着计算机、互联网技术的发展,海量的天文数据有了比较好的归档,并提供了互联网服务.世界上已有多家天文数据中心和虚拟天文台项目在天文数据存储、查询和分析等方面做了大量的工作,并开发了一系列实用工具.其中不少的工具可以实现交叉证认服务.目前,国外常用的交叉证认工具有:vi zi eR、Si m bad、A1adi n、M A ST、E SO、N ED、O penSkyQ ue r y、TO PCA T等.vi zi eR现已收集了5000多个星表[4。
分类号密级UDC编号华中师范大学硕士学位论文虚拟天文台数据访问服务(VO-DAS)之任务调度研究及VO-DAS的应用田海俊指导教师郑小平教授、赵永恒研究员、崔辰州副研究员华中师范大学物理科学与技术学院申请学位级别硕士学科专业名称理论物理论文提交日期2007年6月论文答辩日期2007年6月培养单位物理科学与技术学院学位授予单位华中师范大学答辩委员会主席Job Scheduling Research in Virtual Observatory Data Access Service(VO-DAS)andVO-DAS ApplicationHai-Jun TianSupervisor:Prof.Xiao-Ping Zheng&Prof.Yong-Heng Zhao&Dr.Chen-Zhou CuiHuaZhong Normal UniversityMay,2007Submitted in total fulfilment of the requirements for the degree of Masterin Theory of Physics摘要天文观测数据资源具有时间跨度大、数据量大、存储管理分散、管理工具驳杂等特点。
如何提供给天文学家一个统一访问这些分布存放的异构数据资源的方案,是虚拟天文台的一个重要研究课题。
计算机与互联网技术的飞速发展,网格技术、XML技术、语义网技术等全新IT技术的涌现,以及在此技术背景下,国际虚拟天文台联盟(IVOA)依据天文自身的特点不断提出并完善的各种规范标准,使得海量、分布式、多波段天文数据的无缝融合和处理成为可能。
对于异地异构数据的统一访问,我们基于开放网格服务架构(OGSA)提出了一种网格的解决方案:使用OGSA-DAI技术实现了对异地异构的天文星表数据、图像数据和光谱数据的统一封装(DataNode);利用ADQL语言完成对任务的统一描述;基于WSRF框架完善了对数据资源、计算资源以及存储资源的任务调度。
我们设计的虚拟天文台数据访问服务(VO-DAS)实现了对数据资源、计算资源、存储资源的自动发现以及异地异构数据的联合访问并对访问结果进行数据分析的一体化工作模式,这将使天文数据源的多波段交叉证认、海量数据分析及对分析结果的可视化等成为可能。
VO-DAS支持国际虚拟天文台联盟(IVOA)的各项相关标准,使得它具有良好的互操作性,它的对外接口简单实用、可以针对不同需求的天文数据用户发展出多种网格应用产品。
论文以VO-DAS的任务调度及其实现为重点,分别对VO-DAS的设计模式、Session 机制、生命周期、资源销毁、异常处理等模块进行了详细的阐述,并从多个角度分别给出了系统的设计图。
为了验证以OGSA-DAI为基础的天文数据访问的可行性和性能,我们采用两个科学范例对VO-DAS原型进行了实验。
论文最后以VO-DAS对China-VO Ephemeris WS计算平台的扩展为例,介绍了VO-DAS外部接口的扩展方法,以及VO-DAS在星历计算方面的应用,并简要阐述了VO-DAS在其他方面的科学应用。
关键词:虚拟天文台,数据访问,网格技术,OGSA-DAIAbstractThe resources of observed data in astronomy have such characters as large time span,great quantity of data,break-up storage and management,heterogeneous man-agement tool,and so on.An important research subject of the virtual observatory is about how to provide the astronomers with a programme on visiting these resources stored in different organisms.The great development of the computer and the internet technology,the emerge of the totally up-to-date IT technology,such as grid technology,XML technology, semantic network technology,and so on,and on this technology background,ac-cording to the character of astronomy itself,the International Virtual Observatory Alliance(IVOA)continuously put forward and make them perfect various standard document,this make it possible the merge monolithic of the astronomy data which great capacity,break-up and multiple wave band.As for consolidated visit to the resources stored in different organisms,basing on OGSA,we put forward a solution programme for the grid:making use of the OGSA-DAI technology,we can carry out the DataNode of the astronomy data about the surface of the stars,the picture data and the spectrum data in different organisms; taking advantage of ADQL language,we can go through with the description of the whole task;grouding on WSRF structure,we can make it perfect in dispatching tasks of the data resources,caculation resources and storage resources.The VO-DAS that we have designed bring into effect the close-coupled work pattern:auto-discover the data resources,caculation resources and storage resources,visite the resources stored in different organisms and data-analyse the result,this will make it possible the multiple wave band cross-authentication,the data-analysis and the visualisation of the analysis result.VO-DAS support all the related standards of the IVOA,this makes it have excellent operability,its external interface is simple and practical,it can develop various grid application products aimed at different demands of different astronomy data clients.Focusing on diapatching VO-DAS tasks and bringing it into effect,we elaborate on the modules of VO-DAS,such as its design mode,Session organisms,life cycle, resources destroying,exception handling,and so on,and put forward the blue prints of the system indifferent angles.To verify the feasibility and performance of the visitto the astronomy data basing on OGSA-DAI,we adopt two scientific model to test the prototype of VO-DAS.Take for example the expansion of the VO-DAS to the caculation platform of the China-VO Ephemeris WS,we introduce the expansion method of VO-DAS’exterior interface,and VO-DAS’application in the caculation of the star calendar,and we also elaborate on VO-DAS’application in the scientific applications in the otherfields.Keywords:Virtual Observatory,Data Access Service,Grid,OGSA-DAI目录目录iv第一章引言11.1虚拟天文台研究背景[1] (1)1.2国内外研究现状[3] (3)1.3VO-DAS的研究意义 (4)1.4论文组织结构 (4)第二章关键技术和概念综述62.1网格技术 (6)2.1.1开放式网格体系结构(OGSA)[8] (6)2.1.2OGSA的基础访问结构 (6)2.1.3开放式网格服务基础结构(OGSI)[13] (8)2.1.4Web服务资源框架(WSRF)[14] (9)2.2网格技术在国内外现状 (11)2.3网格相关的中间件 (12)2.3.1Globus Toolkit[15] (12)2.3.2OGSA-DAI[16] (13)2.4国际虚拟天文台联盟(IVOA)及其相关规范 (17)2.4.1IVOA天文数据查询语言(ADQL)[17] (17)2.4.2简单图像访问规范(SIA)[18]、简单光谱访问规范(SSA)[19]..192.4.3FITS、VOTable等天文格式规范 (20)第三章基于WSRF的数据访问服务(VO-DAS)223.1VO-DAS的需求分析 (22)3.2VO-DAS的框架[24] (23)3.2.1VO-DAS五种访问接口 (23)3.2.2VO-DAS两大核心模块 (23)3.2.3天文数据查询语言(ADQL) (25)3.2.4数据查询 (26)3.2.5数据分析 (27)3.2.6数据分发 (27)3.2.7服务的信息注册与信息发现 (27)3.2.8数据格式 (27)3.2.9VO-DAS的运行环境 (27)3.2.10VO-DAS的性能 (27)第四章VO-DAS任务调度研究与实现294.1多任务调度的几种可能方案 (29)4.2VO-DAS任务调度方案的设计 (29)4.2.1VO-DAS的Session机制 (29)4.2.2VO-DAS的生命周期控制 (30)4.2.3VO-DAS的资源销毁 (31)4.2.4数据查询设计 (32)4.2.5数据的分析 (35)4.2.6系统的状态监控 (36)4.2.7VO-DAS异常处理 (37)4.2.8VO-DAS安全机制 (37)4.3VO-DAS任务调度的实现和测试 (38)4.3.1结构图(以三个DataNode为例) (38)4.3.2类图 (38)4.3.3序列图 (38)4.3.4测试方案和测试结果 (39)4.4和国外同类虚拟天文台系统的比较 (40)第五章VO-DAS的功能扩展及其应用485.1基于VO-DAS平台可视化日食带的中心食带 (48)5.1.1China-VO Ephemeris WS计算平台[31] (48)5.1.2VO-DAS的功能扩展 (50)5.1.3通过VO-DAS可视化中心食带 (52)5.2VO-DAS其他应用 (53)第六章总结与展望54附录A JDL的xml表述形式55参考文献57发表文章目录60致谢61表格1.1国际各国虚拟天文台项目 (3)4.1VO-DAS的部分异常列表 (38)插图2.1Web Services结构图 (7)2.2一个典型的Web Services调用过程 (8)2.3从WSDL中生成stubs文件 (9)2.4GT4结构图 (13)2.5数据服务资源DSR、数据资源访问门DRA以及数据资源DR(以关系型数据资源为例)三者之间的关系 (15)2.6一次SQL查询,OGSA-DAI各模块间的交互 (15)2.7OGSA-DAI体系结构图 (16)3.1VO-DAS设计图 (24)4.1VO-DAS Session机制 (30)4.2同步查询工作流 (33)4.3异步查询工作流 (33)4.4联合查询工作流 (34)4.5VO-DAS结构图(以三个DataNode为例) (41)4.6VO-DAS类图 (42)4.7VO-DAS的启动 (43)4.8VO-DAS的关闭 (43)4.9VO-DAS的元数据查询 (44)4.10VO-DAS的同步查询 (44)4.11VO-DAS的异步查询 (45)4.12VO-DAS上传数据 (46)4.13VO-DAS的数据分析 (47)5.1China-VO Ephemeris WS功能结构图 (50)5.2Activity生命周期的序列图 (51)5.32008年03月12日之后,第一次中心食食带 (52)5.42006年08月12日之前,最后一次中心食食带 (53)第一章引言1.1虚拟天文台研究背景[1]四百年前伽利略首次把望远镜指向太空,使人类摆脱了仅能用肉眼直接观测太空的历史,为从哥白尼开始的天文学革命提供了大量的科学证据。