当前位置:文档之家› 基于大数据环境的科学数据共享模式研究

基于大数据环境的科学数据共享模式研究

基于大数据环境的科学数据共享模式研究
基于大数据环境的科学数据共享模式研究

收稿日期:2013-07-12 修回日期:2013-09-11

基金项目:江苏高校哲学社会科学研究重点项目 江苏省 十二五’时期数字文化产业之数字内容服务模式研究”(编号:2011ZDIXM 011)系列成果之一三

作者简介:左建安(1988-),男,硕士研究生,研究方向:数字图书馆建设与评价相关研究;陈 雅(1965-),女,博士,教授,研究方向:图书馆法二知识管理及数字图书馆建设等相关研究三

四信息资源与信息服务四

基于大数据环境的科学数据共享模式研究

*

左建安 陈 雅

(南京大学信息管理学院 南京 210093)

摘 要 科学数据是科学研究的重要成果,对国家建设二科学研究和民众生活都具有重要的意义三在大数据环境下,科学数据共享也越来越迫切三本文指出大数据时代科学数据共享的四种模式:国家政策驱动二部门之间交换二企业发展带动以及国际组织参与模式,四种模式相互交叉和渗透三此外,对我国科学数据共享提出了相应的建议,完善相关的法律政策,协调科学数据共享与知识产权保护的矛盾三关键词 大数据 科学数据 共享模式 公众需求 数据开放

中图分类号 G 350 文献标识码 A 文章编号 1002-1965(2013)12-0151-04

The Analysis on Sharing Mode of Scientific Data in the Environment of Big Data

Zuo Jian 'an Chen Ya

(School of Information Management ,Nanjing University ,Nanjing 210093)

Abstract Scientific data are the important achievements of scientific research and have very important significance for nation -building ,scientific studies and public life.Especially in the environment of big data ,scientific data sharing has become increasingly urgent.This pa?per points out four modes of scientific data sharing :national policy -driven ,exchange between departments ,enterprise development -driv?en and participation of international organizations in the environment of big data.Also ,it puts forward the corresponding proposals for sci?entific data sharing in China.

Key words big data scientific data sharing mode public 's demand open data

0 引 言

科学数据是科学研究的重要成果,对科技创新二经济发展和国家安全具有重要的战略意义三我国已于2002年启动 科学数据共享工程”,力求构建面向全社会的共享服务体系,而科学数据共享模式随着时代和环境的变化而发展和改变三本文拟对大数据环境下的科学数据共享模式进行探究,以便为我国科学数据共享工作的开展提供一定的参考三

1 概述

 1.1 大数据环境下的信息特征分析 数据无处不

在,随着社交网络二电子商务以及移动通信的发展,数字信息从各种各样的传感器二测试仪器二模拟实验室二文化娱乐企业和个人使用的数字终端中源源不断地涌

出,一个大规模生产二分享和应用数据的时代正在开启三 大数据”一词由英文 Big Data ”翻译过来三麦肯锡全球研究所报告‘大数据:创新二竞争和生产力的下一个前沿“对 大数据”的定义为:大数据指的是大小超出常规的数据库工具获取二存储二管理和分析能力的数据集三

大数据走近人们视野不久,但业界公认的,大数据有四个 V ”字开头的特征:Volume (容量),Variety

(种类),Velocity (速度)和最重要的Value (价值)三Volume 是指大数据巨大的数据量与数据完整性,数据量级已从TB 发展至PB 乃至ZB ,可称海量二巨量乃至超量三Variety 则意味着数据类型繁多,越来越多的表现为网页二图片二视频二图像等半结构化和非结构化数据信息三Velocity 是指数据传递速度快时效高,更快地满足实时性需求三Value 则是大数据的终极意

第32卷 第12期2013年12月 情 报 杂 志JOURNAL OF INTELLIGENCE Vol.32 No.12

Dec. 2013

义 满足人类的需求,在尽可能短的时间内发掘其价值[1]三在IBM2013技术峰会上,牛津大学网络学院互联网治理与监管专业教授二大数据权威咨询顾问维克托四迈尔四舍恩伯格博士表示,他理解的大数据有三个特点,即全体二混杂和相关关系:全体意味着要去研究和现象有关的所有数据点;混杂意味着不去追求特别的精确性,而会去满足于某种大的方向;相关关系是指对事实的态度更多地从因果关系转向相关关系三 1.2 科学数据的概念分析 科学数据是人类社会从事科技活动所产生的原始观测数据二探测数据二试验数据二实验数据二调查数据二考察数据二遥感数据二统计数据二研究数据以及相关的元数据和按照某种需求系统加工的数据,具有科学价值和使用价值[2]三科学数据是信息时代一种特殊的社会资源,具有明显的潜在价值和可开发价值,并在应用过程中得以增值三很显然,大数据这一宽泛的概念是包括科学数据,科学数据也是大数据的内容之一三

2 大数据环境下科学数据的信息共享需求

 2.1 国家战略需求 大数据环境的到来,使得数据成为一种资产,正成为与物质资产和人力资本相提并论的重要生产要素三科学数据这一具有战略意义的资源,更是成为了社会的重要资产三一个国家和企业的发展在很大程度上取决于其科技创新和技术创新水平,而对科学数据进行系统的综合分析是实现科技进步与创新的重要方式三无论是资源二能源的开发,还是高新技术产业化,无不是在科学数据的积累与支持下,实现理论与技术创新的结果三特别是在以知识为基础的经济中,使越来越多的知识产品以各种方式驱动着经济的快速增长,以知识二信息和数据应用为主要目的信息管理二加工与发布成为迅速发展的产业,在现代信息技术引领下正在拉动 数字经济”[3],也就是现在正在发生的 大数据经济”三长期以来,我国已经积累了较为丰富的科学数据资源,但大多数仍存于资料堆或档案柜中,没有经过有效的整理和建库,数字化程度较低,很多数据库往往局限于本部门二本单位使用,甚至个人使用,造成了科技资源的巨大浪费三所以打破科学数据壁垒,实施科学数据共享,是国家发展战略的必然要求三2012年3月29日,奥巴马政府宣布启动‘大数据研究和发展计划“,同时组建 大数据高级指导小组”,涉及美国国家科学基金二国家卫生研究院二能源部二国防部等6个联邦政府部门,宣布将启动2亿美元的投资计划,提高从大量数据中访问二组织二收集发现信息的工具和技术水平三这使得美国成为全球首个将大数据从商业行为上升到国家意志和国家战略的国家三 2.2 科学研究的要求 当前的科学是多学科交叉的科学,是围绕数据展开的全球研究,并将越来越依赖于数据三科学研究的本身就是科学数据的生产过程,一些科学数据就是及其重要的研究成果三科学数据资源既是研究的成果与积累,又是支持更为复杂的创新研究所不可替代的资源存量三尤其在大数据时代,科学数据量激增,科学研究越来越依赖于系统的二高可信度的基础科学数据分析三21世纪以来全球科技活动不断增强,一系列重大科学工程的兴起二复杂科学问题研究的提出二大型科学研究计划的产生,导致前所未有的国际合作局面的形成,也导致了全球范围内对科技信息资源交流二互通的客观需求三因此,实现科学数据的共享,科学家就可以不需受限于数据的来源二格式以及国界,也不必质疑科学技术对于数据处理与存储的能力,可在全球海量的科学数据中发掘创新的潜力三

 2.3 科学数据的公众化需求 大数据环境下,科学数据的需求不仅仅局限于政府二科研单位以及企业,社会公众也越来越需要科学数据三科学数据对于社会公众,不仅仅可以提高自身知识水平和科学素养,也是日常生活中不可或缺的重要信息资源三如今个人电脑二智能手机及其它掌上智能设备的普及,互联网的应用和发展,使得公众对这些基本的科学数据获取的需求更为强烈三例如随着智能手机的普及,许多驾驶员使用手机装载的定位系统确定行车路线三和传统的定位系统不同,这些通过智能手机定位的信息都传递和保存在大数据库中三这些海量数据不仅能像传统的交通信息一样让人们了解某一个时段一条路上的车流量,还能明晰的标示出这条路上每个时段的每一辆车从何处来二往何处去,并记录每辆车的停车情况三同时,现有技术也能够支撑信息的反馈,即可以向车辆驾驶者和乘客发布拥堵预警二拥堵状况和停车场分布和占用情况等信息三同样地,在医疗健康领域,大规模复杂数据已经变得很普遍,通过对大量病人的各类数据进行挖掘分析,有助于更有效地找出疾病成因,进而提供有针对性的预防二诊断和治疗措施三尽管社会公众大多数是非专业人士,但可见在大数据时代,公众对科学数据的质量要求是越来越高,对科学数据的发布渠道二发布频率二表现形式等的要求也会越来越高三

3 基于大数据环境的科学数据共享模式研究科学数据按基本社会属性分类,可分为战略性科学数据二公益性科学数据以及商业性科学数据三相应地,目前科学数据共享模式主要表现为国家制约的公益性无偿共享模式和市场制约的产业化运行模式三前者强调数据的公开和公益性共享,后者强调保护数据产权和商品性质三具体来讲,有以下四种模式三

 3.1 国家政策驱动模式 借鉴国际科学数据共享

四251四 情 报 杂 志 第32卷

经验,美国就是典型的国家政策驱动模式三早在1991年6月美国总统事务办公厅就发布了 全球变化研究数据管理政策”,该政策的核心就是实行 完全与开放”的科学数据共享三美国政府在科学数据共享方面根据投资来源的不同,严格区分两种不同的数据共享机制三政府拥有二生产和政府资助生产的数据纳人到

完全与开放”的共享机制,即除涉及危害国家安全二影响政府政务和公务员个人隐私的数据外,其他都必须公开三私营公司投资生产的数据纳入到 平等竞争”市场化共享机制三在这两种不同共享机制中,美国联邦政府均起到主导的作用,所不同的是采取的方式和管理的环节不同三两种机制互相补充,促进全社会对科学数据的获取二共享和广泛应用三对于国有科学数据,由国家统筹规划数据共享机制与体系,提供数据共享工作预算和保障,以及相关政策法规的制定二完善和监察三 完全与开放”的科学数据共享政策,使得一度曾各自为政的混乱的数据管理走向了有序运作的轨道,科学家从得不到数据的抱怨走向数据的全面应用,科学数据的开发水平和开发能力逐步提高,惠及了地球科学二生命科学二材料科学等各个领域,也极大地刺激了美国经济的发展三人类社会在大数据环境下,数据开放也已成为潮流三2009年,https://www.doczj.com/doc/8a208362.html,网络平台在美国正式上线,按原始二地理数据和数据工具三个门类开放数据,截至2012年11月,https://www.doczj.com/doc/8a208362.html,共开放388 529项原始数据和地理数据,汇集了1264个应用程序和软件工具二103个手机应用插件三欧盟开放数据战略(Open Data Strategy)于2010年11月由欧盟委员会首次提出,并于2011年11月底被欧盟数字议程采纳,基本概念是公共经费支持的信息应该得到最广泛的使用,其中科学数据的开放是其全面开放数据政策的重要组成部分[4]三

 3.2 部门之间交换模式 科学数据的共享首先应该从生产科学数据的部门共享开始三为避免重复生产,科研单位内部之间以及各科研单位之间的科学数据,在不侵犯知识产权的情况下,要努力做到共享的第一步三以数据和信息为基础的经济二社会和科学发展中,一般情况下没有哪一个部门能够总是拥有某项科研活动需要的所有数据产品,尤其对于广大的科学社区,其研究内容广泛,对开放共享有着强烈的需求,研究过程中往往需要来自多个数据生产部门的不同区域二不同时期二不同尺度二不同学科的数据资源[5]三因此部门之间的数据交换就显得急需和迫切三例如,地震工作部门各单位收集并存档的各种地震科学数据,其他部门或单位为保障重大工程的地震安全而专门建设和管理的专用地震监测台网和强震动监测设施所收集并存档的地震科学数据,均属于共享范围[6]三浙江省地理空间数据交换公共服务平台项目目前是全国首家省级地理空间数据交换平台,由浙江省政府和国家测绘地理信息局合作共建二省测绘与地理信息局承建三该平台实现了浙江全省地理空间信息资源在各部门之间的交换与共享,已为近30家省级部门二市县用户和企事业单位提供相关地理信息服务,支持了40个业务应用系统[7,8]三

 3.3 企业发展带动模式 现代企业的发展离不开信息和数据的支持,同样地,企业的发展也能促进信息和数据的传播与分享三一个企业的发展需要科学的发展方案,也需要科学数据来做产品的进一步研发以及科技成果的转化三大数据环境中数据积累量二数据分析能力二数据驱动业务而非流程驱动业务的能力将是决定企业生死存亡的关键三数据的重要性使得企业必将收集和分析海量的各种类型的数据,并快速获取影响未来的信息,在这一过程中,企业就会做出益于科学数据共享的决策与措施,例如由企业出资的科学合作项目的开发,有企业参与的科学资源共享平台的构建,以及企业自建商业性的科学数据库三只有学术和产业价值融合,才能真正发挥科学数据的应用价值三虽然学术界和产业界关注的价值点并不完全一致,但仍存在一些共性三发现和利用其中的共性,对解决科学数据共享中出现的问题很重要三跨界合作是积极且有意义的尝试,学术界可以致力于基础技术的研究,盈利模式的分析则由企业去完成三同时,学术界和产业界在某些交叉领域形成竞争也是一种良性模式三一些大企业会对前沿技术和数据积累追踪最新的学术成果,甚至自己做学术研究,学术界也在积极推进产业化思考三 3.4 国际组织参与模式 随着人们对科学数据共享意识的提高,越来越多的国际组织参与进来,进行国际间的交流与合作,满足国际社会对科学数据共享的需求三在国际科学联合会(ICSU)的组织下,1957年成立了世界数据中心(World Data Center),开展地球科学二空间科学和环境科学领域数据的收集二整理二系统化二标准化及交流服务等活动三世界数据中心不仅在地球科学二空间科学和环境科学领域积极推进了数据管理和共享,还积极参与许多重大的国际科学计划,为人类科学事业的发展作出了贡献三国际科技数据委员会(Committee on Data for Science and Technology)成立于1966年,其宗旨是提高科学数据的质量,推动对科学数据的收集二交换二服务和共享三CODATA致力于提高对整个科技领域有重要变化的数据的质量二可靠性二管理与可访问性,向科学家和工程师提供对国际数据活动的访问,促进直接合作,并利用互联网初步构建了全球范围内的科学数据交换体系三CODATA 通过建立标准格式促进数据交换二共享,并协调各国数

四351四

 第12期 左建安,等:基于大数据环境的科学数据共享模式研究

据项目,定期召开国际数据学术会议,扩大国际对科学数据共享的认识和深入探讨数据共享等方面的问题三

4 我国科学数据共享在大数据环境中的思考

以上这四种科学数据共享模式相互交叉和渗透,在大数据环境下继续存在并向深远发展三应该说我国的科学数据资源是十分丰富的,近年来国家各有关部门相继成立了专门的信息中心,如国家基础地理信息中心二国家海洋信息中心二国土资源部信息中心二国家气象信息中心等等,这些信息中心成为政府部门向社会提供公益性二基础性服务的重要窗口三我国目前需要的是从政策法规二技术规范二组织管理各个层面保证科学数据共享工作的顺利进展三

首先,科学数据共享离不开完善的科学数据管理政策法规的保障三对于法规政策的出台相比于欧美发达国家,我国政府发布的程度还远远不够,应对大数据的挑战,政府必须出台更多关于科学数据共享和数据开放的相关法律政策,把科学数据共享上升为国家战略的高度三科学数据难以共享成为科学研究的一大障碍,在大数据环境下其带来的负面效应会被继续放大三我国的政府科研项目一直都没有数据公开和共享的要求,科学数据零散地掌握在各个科研单位和研究小组内部,这不仅不利于科研活动的展开,对国家的科研投入来说也是一种巨大的浪费三因此,必须由国家出面,建立科研数据共享的机制和环境三目前,我国政府已经编制了 科学数据共享工程建设规划”,制定了‘科学数据共享条例“‘国家科技计划项目科学数据汇交办法“‘科学数据共享工程管理办法“‘科学数据共享工程试点遴选和检查评估办法“和‘科学数据分类分级共享及其发布策略“等一系列数据共享的政策法规三

其次,必须解决科学数据共享工作中产生的知识产权保护问题三我国在科学数据的产权归属与分享的层面上,长期存在着权益二利益和责任不清的问题三

这一方面挫伤了科学数据生产者的积极性,减少了科学数据存量的增长;另一方面,出现把科学数据当作本单位或个人财产的问题,阻碍科学数据共享的有效运行三因此,要对不同投资主体的科学数据进行产权界定,保护数据投资者二创造者的合法权益,同时规范产权交易,促进科学数据的广泛传播与使用三

再次,与国外发达国家相比,我国科学数据共享的实践相对不足,数据共享的技术与设施还比较薄弱,共享水平和范围都有待加强,特别是参与国际合作项目还不够广泛和深入三因而,我国科技界应积极参与国际组织的相关活动和国际合作项目,借鉴国外科学数据共享的成功经验和好的做法,充分利用国际资源提升我国科学数据共享水平三只有这样才能提高我国科学数据共享水平,让科学数据真正走出封闭的实验室,走向社会,走向世界三

参考文献

[1] 赵国栋.大数据的定义和特征[EB /OL ].[2013-05-07].ht?

tp ://https://www.doczj.com/doc/8a208362.html, /s /blog _537e 497a 01019pi 3.html.[2] 江 洪,钟永恒.国际科学数据共享研究[J ].现代情报,2008,(11):56-58.

[3] 黄鼎城,郭增艳.科学数据共享管理研究[M ].北京:中国科学

技术出版社,2002:36-37.

[4] 欧盟委员会副主席Neelie Kroes :希望每个欧洲人都参与数字

化[EB /OL ].[2013-05-23].http ://www.open https://www.doczj.com/doc/8a208362.html, /5f 00653e 83b 753d 652a 86001/20125e 74/46708/6b 2776df 59d 454584f 1a 526f 4e 3b 5e 2dneelie

-kroes

-

5e 0c 671b 6bcf 4e 2a 6b 276d 324eba 90fd 53c 24e 0e -65705b 575316.[5] 刘润达,赵 辉,李大玲.科学数据共享平台之数据联盟模式初探[J ].中国基础科学,2010,12(6):27-32.[6] 地震科学数据共享管理办法[EB /OL ].[2013-05-07].ht?tp ://https://www.doczj.com/doc/8a208362.html, /policy /gxbf.htm.

[7] 浙江建成全国首家省级地理空间数据平台[EB /OL ].[2013-06-07].http ://https://www.doczj.com/doc/8a208362.html, /html /2013-02/22/content _

21927.htm.

[8] 张永强,孙 燕,易善桢,李 丹.构建数字城市地理空间数据

共享机制[J ].计算机技术与发展,2007,17(3).

(责编:贺小利

)

(上接第159页)

参考文献

[1] Big data [EB /OL ].http ://https://www.doczj.com/doc/8a208362.html, /wiki /big -data.

[2] Big data [EB /OL ].http ://https://www.doczj.com/doc/8a208362.html, /it -glossary /big

-data.

[3] 涂子沛.大数据[M ].桂林:广西师范大学出版社,2012:57.

[4] 邬贺铨.大数据时代的机遇与挑战[J ].求是,2013(4):47-

49.

[5] 王文超,石海明,曾华锋.刍议大数据时代的国家信息安全[J ].国防科技,2013(2):1-5.

[6] (英)维克托四迈尔-舍恩伯格,肯尼斯四库克耶著;盛杨燕,

周涛译.大数据时代[M ].杭州:浙江人民出版社,2013:195-200.

[7] 刘新年,王晓民,任 博.大数据时代下,如何保护隐私权[N ].检察日报,2013-08-23(5).

[8] 冯 伟.大数据时代信息安全面临的挑战与机遇[N ].科技日

报,2013-06-24(1).

[9] 齐爱民.个人信息保护法研究[J ].河北法学,2008(4):15-33.

[10]王利明.民法(第五版)[M ].北京:中国人民大学出版社,2012:515.[11]梅绍祖.个人信息保护的基础性问题研究[J ].苏州大学学报,2005(2):25-30.[12]丰家卫.方周大战拷问大数据时代隐私安全[N ].中国青年

报,2012-11-02(5).

(责编:刘影梅)

四451四 情 报 杂 志 第32卷

基于大数据环境的科学数据共享模式研究

作者:左建安, 陈雅, Zuo Jian'an, Chen Ya

作者单位:南京大学信息管理学院 南京 210093

刊名:

情报杂志

英文刊名:Journal of Intelligence

年,卷(期):2013(12)

本文链接:https://www.doczj.com/doc/8a208362.html,/Periodical_qbzz201312028.aspx

极地科学手抄报图片、资料

“极地科学手抄报图片、资料”下载方法:在图片上面点击右键,选择“图片另存为”即可。极地科学手抄报图片极地科学手抄报资料地球的南北两端,是这个星球上最寒冷的地方。当海洋结冰的时候,也意味着极地最冷季节的到来。即使是生活在这里习惯了寒冷的动物大多数也难以抵挡冬日的严寒,有谁能度过这世界上最冷的寒冬,它们又经历了怎样的冬天呢?每年的四月,海水开始慢慢的被冰雪堆积覆盖,当海面最后完全被冰封成一片的时候,南极可怕的冬天就真的来临了。企鹅企鹅被称为这片冰雪大陆的主人,是这里最主要的一种生物。在南极有七种企鹅,当冬天的脚步渐渐邻近的时候,大多数的企鹅便纷纷上路了,它们要去北方相对温暖的海域躲避即将到来的严寒。帝企鹅也上路了,但是它们的目的地却是南极最寒冷的南部。那里四面环山,没有任何的食物,科学家在那里测到的温度最低时曾经达到过零下89度。帝企鹅是南极企鹅中个头最大的一种,它的身高有一米二,体重能达到40公斤,因为具有王者之相,而被称为帝企鹅,是惟一终年生活在南极本土的企鹅。南部这片极地最寒冷的地区,是帝企鹅延续了千万年的古老的繁殖地,在生命的8年时间里,它们将有6次往返于这里找寻爱人,繁衍后代。在很长的时间里,人们对于它们这种奇怪的行为感到费解,它们之所以选择这里来延续企鹅家族的命脉,是因为这里没有气候的突变,也很少天敌的袭击,环境相对稳定。但是如此的低温寒冷,没有食物的恐怖地带,小企鹅如何降生的呢?站在冰封的海面上,帝企鹅也感受到了南极暴风雪强大的威力,在比12级大风还猛烈3倍的暴风雪中,它们也只能选择依靠群体的力量,紧紧地相拥在一起,抵御寒冷。而企鹅妈妈就在这冰天雪地里产下了企鹅蛋。产卵后它们就把蛋交给企鹅爸爸来孵化,离开这里去几百公里外的海域为丈夫和即将出生的孩子寻找食物。高大的帝企鹅皮下脂肪比其他企鹅要厚很多,正是这厚厚的羽毛,给企鹅蛋提供了最温暖的巢穴,雄企鹅把蛋放在自己的脚和肚皮之间,令人难以置信的是,在周围零下五十多度的环境里,这里的温度竟然能够达到零上38度。维德尔海豹当冰封的海面的温度在可怕的零下50度徘徊的时候,冰面下的水中世界也是寒冷刺骨。冻结的海是无穷尽的世界,冰层下是一个阴森奇妙的静止空间,无论是生活在陆地还是水中的动物,海水结冰对于它们都是极大的考验。维德尔海豹整个冬天都只能呆在冰面下的海水里。维德尔海豹是著名的潜水专家,能深入到海中四五百米的深处觅食。但是即使潜水时间再长也需要呼吸,海水中虽然躲过了冰面上肆虐的暴风雪,但是冰面上提供呼吸的冰洞,在零下几十度的低温下却很容易被冻结,整个冬天,它只有不停地一次又一次地游上来,拼命用自己的牙齿刮擦掉呼吸口冻结的海冰。它们的牙齿被磨出了血,磨损的很厉害,以至于不能捕猎,甚至于不能进食,因此,原本有20多年寿命的维德尔海豹有很多在10几岁时就死掉了,这是个残酷的冬天,却也是生活在寒冷的极地不得不付出的代价。鳞虾在寒冷的海水中,生物的生长缓慢而艰难,海绵和海星的寿命都要超过四十年。小小的鳞虾也感到了―――。南极磷虾大多生活在海水50米以内的表层。冬天的海水刺骨难耐,食物短缺,在这些月份里,由于海水结冰,它们只能靠吃从冰层上刮擦下来的海藻活着。最不可思议的是,磷虾为了减少能量的消耗,能够收缩身体,把自己恢复到幼年时期的样子,以度过寒冬。鳞虾是企鹅和海豹最爱的美食,这片海域的鳞虾为帝企鹅妈妈提供了足够的食物,远方的丈夫和孩子在等待着它们,它们必须要回去了。这时候小帝企鹅已经破壳而出了,在漫长的100多天,雄企鹅只靠吃雪来补充水分,靠消耗体内的脂肪来维持生命,它们的个子矮了二十厘米,体重减轻了几十斤,它们必须要去几百公里以外的地方觅食,而吃饱食物的企鹅妈妈要用肚中积存的食物继续喂养小企鹅。直到春天到来,小企鹅有了独立生活的能力,它们一家才能团聚,到外海生活。因为帝企鹅这种在严寒中特殊的繁殖习惯,所以整个的繁殖抚养过程只能是由爸爸妈妈共同承担。帝企鹅能在世界上最寒冷的地方繁衍后代,被称为生物界的奇迹。而第二年的冬天它们依然会再来这里,赴这个寒冷的约会。当南极的生命迎来盼望已久的温暖季节的时候,北极的冬天却到来了。南极是四面环海的冰雪大陆,而北极是被陆地围绕的海洋,生物更容易到达,因此北极的生物种类要比南极多一些,它的温度也

环境保护部政务信息资源共享管理暂行办法-环境保护部信息中心

附件 环境保护部政务信息资源共享管理 暂行办法 第一章总则 第一条为加快推进环境保护部政务信息系统整合和政务信息资源共享,提高行政效能,提升服务水平,充分发挥政务信息资源共享在深化改革、职能转变中的重要作用,依据《国务院关于印发政务信息资源共享管理暂行办法的通知》(国发〔2016〕51号)、《国务院办公厅关于印发政务信息系统整合共享实施方案的通知》(国办发〔2017〕39号)、《生态环境大数据建设总体方案》(环办厅〔2016〕23号)等文件,制定本办法。 第二条本办法所称政务信息资源,是指环境保护部机关各部门,各派出机构、直属单位(以下简称各单位)在依法履行职责过程中制作和获取,以一定形式记录、保存的文件、资料、图表、模型和数据等各类信息资源,包括直接或通过第三方依法采集的、依法授权管理的和因履行职责需要依托政务信息系统形成的信息资源等。环境保护部政务信息资源属于国家公共资源。 第三条本办法用于规范各单位之间的信息共享工作,以及与国家其他政务部门之间的信息共享工作,包括因履行职责需要使用

或提供信息资源的行为。 第四条政务信息资源共享应遵循以下原则: (一)共享为原则、不共享为例外。各单位形成的各类政务信息资源应予以共享, 特殊情况下不予共享的,须提供相关法律、法规和政策依据。 (二)需求导向、无偿使用。因履行职责需要使用共享政务信息资源的单位(以下简称使用单位)提出明确的共享需求和信息使用用途,产生和掌握共享政务信息资源的单位(以下简称提供单位)应及时响应并无偿提供共享服务。 (三)统一标准、统筹建设。按照国家及环境保护部政务信息资源相关标准进行政务信息资源的采集、存储、交换和共享工作,统筹建设政务信息资源目录体系和共享交换体系。 (四)建立机制、保障安全。建立政务信息资源共享管理机制和信息共享工作评价机制,加强对信息采集、共享、使用全过程的授权管理和安全保障,确保共享信息安全。 第五条环境保护部政务信息资源共享平台(以下简称共享平台),包括部政务内网共享平台(环境保护部电子政务综合平台)和部政务专网共享平台(环境信息资源中心),部政务内网共享平台按照涉密信息系统分级保护要求,依托国家电子政务内网建设和管理,部政务专网共享平台按照国家网络安全等级保护第三级要求,依托国家电子政务外网建设和管理。环境保护部政务信息资源通过共享平台在部内实现共享,通过国家数据共享交换平台(以下简称国

国家科学数据管理办法

《科学数据管理办法》印发(附全文)2018年04月03日17:04 来源: 中商产业研究院 分享到: 9855 人参与讨论 我来说两句 手机免费看资讯 财富号入驻直达 中商情报网讯:国务院办公厅印发科学数据管理办法的通知,通知显示,为进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好支撑国家科技创新、经济社会发展和国家安全,根据《中华人民共和国科学技术进步法》、《中华人民共和国促进科技成果转化法》和《政务信息资源共享管理暂行办法》等规定,制定本办法。 学数据主要包括在自然科学、工程技术科学等领域,通过基础研究、应用研究、试验开发等产生的数据,以及通过观测监测、考察调查、检验检测等方式取得并用于科学研究活动的原始数据及其衍生数据。

以下为《科学数据管理办法》全文 第一章总则 第一条为进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好支撑国家科技创新、经济社会发展和国家安全,根据《中华人民共和国科学技术进步法》、《中华人民共和国促进科技成果转化法》和《政务信息资源共享管理暂行办法》等规定,制定本办法。 第二条本办法所称科学数据主要包括在自然科学、工程技术科学等领域,通过基础研究、应用研究、试验开发等产生的数据,以及通过观测监测、考察调查、检验检测等方式取得并用于科学研究活动的原始数据及其衍生数据。 第三条政府预算资金支持开展的科学数据采集生产、加工整理、开放共享和管理使用等活动适用本办法。 任何单位和个人在中华人民共和国境内从事科学数据相关活动,符合本办法规定情形的,按照本办法执行。 第四条科学数据管理遵循分级管理、安全可控、充分利用的原则,明确责任主体,加强能力建设,促进开放共享。 第五条任何单位和个人从事科学数据采集生产、使用、管理活动应当遵守国家有关法律法规及部门规章,不得利用科学数据从事危害国家安全、社会公共利益和他人合法权益的活动。 第二章职责 第六条科学数据管理工作实行国家统筹、各部门与各地区分工负责的体制。 第七条国务院科学技术行政部门牵头负责全国科学数据的宏观管理与综合协调,主要职责是: (一)组织研究制定国家科学数据管理政策和标准规范; (二)协调推动科学数据规范管理、开放共享及评价考核工作;

中国的极地科学考察事业【VIP专享】

中国的极地科学考察事业 我国极地科学考察起步于80年代初期,与早期先进国家差距一个世纪。自1984年我国首次组队开展南极科学考察并成功建立我国第一个南极科学考察基地----中国南极长城站(南纬62°13',西经58°58',距北京距离约15701千米)至今,已走过了20个年头。继1985年建成长城站后,又于1989年2月在东南极大陆的拉斯曼丘林地(南极圈内)成功建成第二个常年科学考察基地----中国南极中山站(南纬69°22',东经76°23',距北京距离约12553千米)。我国已在北极建成了中国北极科学考察站。在不久的将来,我国还将在南极内陆冰盖上建立科学意义更深远的第三个考察站。 从1984年至2004年的20年中,我国以长城、中山两个常年考察站和极地科学考察船作为考察基地,广泛开展了极地气象学、地质与地球物理学、海洋学、生物学、高空大气物理学、测绘学、环境科学和人类医学等多学科考察,取得了令世人赞叹的科研成果,培养了一大批极地科研人员和后勤技术队伍,通过他们的艰辛工作和拼搏奉献,在短短的20年中使我国的极地科学考察研究工作跨了三大步,将100年的差距缩短到了零的距离。 不可接近的DomeA 南极是一块被厚厚冰盖所覆盖的大陆。DomeA是南极内陆距海岸线最遥远的一个冰穹,也是南极内陆冰盖海拔最高的地区,最高海拔4039米,气候条件极端恶劣,被称为“不可接近之极”。 从科学考察价值和极地话语权角度来看,南极一共有四个必争之点:极点、冰点、磁点和高点。其中三个点已经被美国、法国、前苏联抢占———美国占据“南极点”,建立了阿蒙森·斯科特站;法国占据“南极磁点”,建立了迪蒙·迪维尔站;前苏联占据“南极冰点”,测到了零下89℃的全球最低气温,建立了东方站;现在,人类在南极仅剩有一个点,那就是:DomeA。 DomeA是南极内陆距海岸线最遥远的一个冰穹,也是南极内陆冰盖海拔最高的地区,最高海拔4039米,气候条件极端恶劣,被称为“不可接近之极”。从科学考察价值和极地话语权角度来看,南极一共有四个必争之点:极点、冰点、磁点和高点。其 中三个点已经被美国、法国、前苏联抢占———美国占据“南极点”,建立了阿蒙森·斯科特站;法国占据“南极磁点”,建立了迪蒙·迪维尔站;前苏联占据“南极 冰点”,建立了东方站;现在,人类在南极仅剩有一个点,那就是:DomeA。 据介绍,东南极冰盖以DomeC—DomeB—DomeA—DomeF为分冰岭,其中DomeA是这一分冰岭的最高点,占据最重要的位置。与国外已开展工作的DomeF等地点相比,DomeA地区的冰盖是原始堆积形成的,储存着全球的气候和大气环境信息。DomeA地区也是南极冷源的中心区,可望获得近期地球表面的最低温度,在这里能够观测到在地 球其他地区无法观测到的气候环境变化信息与特殊的自然现象。因此,DomeA在科学上的意义是地球上其他任何科学观测站所无法代替的。

国家人口健康科学数据共享平台 运行服务实施方案

国家人口健康科学数据共享平台 运行服务实施方案 (征求意见稿) 二○一○年八月

目 录 第一章 目标与原则 (2) 一、目标 (2) 二、原则 (2) 第二章 组织管理体系 (3) 一、主管部门 (3) 二、理事会 (3) 三、专家委员会和用户委员会 (3) 四、人口健康平台管理中心 (4) 五、科学数据中心 (5) 第三章 任务与分工 (6) 一、制定发展规划和年度工作计划 (6) 二、标准规范的制修订与宣贯 (7) 三、数据资源管理 (7) 四、网络运行和资源站点管理 (9) 五、国际合作 (9) 第四章 共享服务 (10) 一、服务内容 (10) 二、服务方式 (12) 三、分级管理与分类服务 (13) 四、服务承诺 (14) 第五章 监督与评价 (15) 一、自我评价 (15) 二、网络监测 (15) 三、用户评价 (15) 四、综合考评 (15) 第六章 保障措施 (16) 一、政策与制度保障 (16) 二、设施与条件保障 (16) 三、人员保障 (17) 四、经费保障 (17)

国家人口健康科学数据共享平台 运行服务实施方案 (征求意见稿) 为贯彻落实《科学技术进步法》,根据科技部、财政部《关于进一步推动国家科技基础条件平台开放共享工作的通知》精神,保障国家人口健康科学数据共享平台(以下简称“人口健康平台”)持续稳定运行服务,充分发挥人口健康领域科技资源的作用,提升我国人口健康领域的科技创新能力,促进《国家中长期科学和技术发展规划纲要(2006-2020年)》全面落实,特制定本实施方案。 第一章 目标与原则 一、目标 按照统一标准规范、统一资源规划和统一技术架构,实行“逻辑上高度统一,开放共享;物理上合理分布,分工合作”的运行服务机制。人口健康平台承担起国家科技重大专项、科技计划、重大公益专项等人口健康领域科学数据汇交、数据加工、数据存储、数据挖掘和共享服务的任务。服务于科技创新、政府管理决策,医疗卫生事业发展。为创新型医学人才培养和健康产业发展提供科学数据共享服务,从而提高我国医疗卫生服务整体水平和国际竞争力。 二、原则 人口健康平台依托国家级科研院所,以需求为导向,以数据资源建设为核心,以共享服务为目的,面向全社会开放共享。 1.开放共享原则:凡是纳入人口健康平台的科学数据资源必须向

仁爱科普版初中地理七年级下册《极地科学考察与环境保护》学案

《极地科学考察和环境保护》学案 一、学习目标 认识开展极地科学考察和保护极地环境的重要性。 二、重点难点 重点:两极地区进行科学考察的时间和意义。 难点:理解两极地区进行科学考察和环境保护的意义。 三、导学问题 (一)天然的实验室 1、南极洲是地球上唯一没有、没有、未经人类雕琢的大陆。南极洲和北冰洋的使之成为科学家进行、、、海洋、生物、等方面的科学研究的广阔天然实验室。 2、在极地考察方面,迄今为止已有多个国家在南极洲建立了多个科学考察试验站。我国于1985年、1989年和2009年,分别在和南极大陆建立了长城站、中山站和站。2004年,我国第一个北极科学考察站——站,正式落成。 (二)人类共同的财富 1、南极洲和北冰洋是人类共同的财富。由于人类的,极地的生态环境受到了威胁。20世纪60年代少数渔业发达国家在南极大陆周围海域捕杀,在北冰洋海域捕 杀、等海洋生物。20世纪80年代以后,少数渔业发达国家又在南极大陆周围海域捕捞,直接威胁到鲸、海豹、海鸟的生存。 2、为了保护南极地区的生态环境,和平利用南极地区,冻结各国领土等方面的要求,1959年12月1日部分国家签订了《》,我国在年5月正式加入了该条约,1985年被纳入国。2011年6月20日至7月1日,第34届《》协商会议在举行,讨论了南极环境保护、南极旅游、生物勘探等问题。 3、整理预习过程中遇到的问题,使用“学乐师生”APP拍照,分享给全班同学。 四、参考资料 1、长城站 长城站建成于1985年2月20日,坐落在南设得兰群岛乔治王岛;地理位置为:南纬62度13分59秒,西经58度58分52秒。

长城站所在的乔治王岛,是南设得兰群岛中最大的一个岛屿。北面邻德雷克海峡,与南美洲的合恩角相距960公里;南面隔着布兰斯菲尔德海峡与南极半岛相望,距离约130公里。在该岛上,除长城站外,还有其他国家设立的7个考察站。与中国站相邻的有:智利的费雷站,俄罗斯的别林斯高晋站,乌拉圭的阿蒂加斯站和韩国的世宗王站。 长城站占地面积约2.5平方公里。站区系火山岩组成的丘陵地形,呈台阶型,西高东低,平均海拔高度10米.地表由卵砾石和砂石组成,平均1.2米以下为永久冻土层。 长城站的气温据1985年以来观测资料表明:夏季代表月一月平均气温为1.3℃,最高为11.7℃,最低为-2.7℃;冬季代表月七月份平均气温-8℃,最高为2.6℃,最低为-26.6℃。年降水量630毫米左右,以降雪为主。暴风雪频繁是长城站的最大特点,每年大风((17米/秒)日数在60天以上,最大风速可达40.3 米/秒。 长城站现有大型永久建筑10座,包括生活栋,科研栋、气象栋、文体栋,发电栋,综合库,食品库等。夏季可容纳60人左右考察,冬季可供20人左右越冬考察。 越冬期间的主要常规科考观测项目有:气象、高分辨卫星云图接收、地震、电离层观测。 2、中山站 中山站简称中山站,是中国在南极洲建立的科学考察站之一,建立于1989年2月26日,中国赴南极考察队在南极大陆的拉斯曼谷陵上,建成了中国南极中山站。站址距北京12553.160千米。(69°22'24"S, 76°22'40"E)。它以中国民主革命的伟大先驱者孙中山先生的名字命名。中山站位于东南极大陆伊丽莎白公主地拉斯曼丘陵的维斯托登半岛上,其地理坐标为南纬69度22分24秒、东经76度22分40秒,与北京的方位角为32度30分50秒。中山站所在的拉斯曼丘陵,地处南极圈之内,位于普里兹湾东南沿岸,西南距艾默里冰架和查尔斯王子山脉几百千米,是进行南极海洋和大陆科学考察的理想区域。离中山站不远处有澳大利亚的劳基地和俄罗斯的进步站。 中山站位于南极大陆沿海,气象要素的变化与长城站差别较大,比长城站寒冷干燥,更具备南极极地气候特点。中山站年平均气温零下l0摄氏度左右,极端最低温度达下36.4摄氏度;中山站地区受来自大陆冰盖的下降风影响,常吹东南偏东风,8级以上大风天数达174天,极大风速为43.6米/秒;降水天数162天,年平均湿度54%,全年晴天的天数要长城站多得多。中山站有极昼和极夜现象,连续白昼时间54天,连续黑夜时间58天。中国在南极所建立的两个考察站都设有气象站,都已在世界气象组织注册,全年对各气象要素进行不间断的观测。建筑和生活设施中山站建站十年来,经过多次扩建,现也初具规模,有各种建筑15座,建筑面积2700平方米,其中包括办公栋、宿舍栋、气象栋、科研栋和文体娱乐栋,以及发电栋、车库等。

数据科学与大数据技术专业解读与就业分析 高考政策数据救专业解析

数据科学院大数据技术专业解读与就业分析 什么是大数据? 进入互联网时代,中国的网民人数已超7亿,大数据的应用涉及到生活的方方面面。 例如,你在网站上买书,商家就会根据你的喜好和其他购书者的评价给你推荐另外的书籍;手机定位数据和交通数据可以帮助城市规划;甚至用户的搜索习惯和股市都有很大关系。 在谈到大数据的时候,人们往往知道的就是数据很大,但大数据≠大的数据。对外经济贸易大学信息学院副院长华迎教授介绍:“现在的大数据包括来自于多种渠道的多类数据,其中主要来源网络数据。数据分析不是新的,一直都有,但是为什么叫大数据呢?主要是因为网络数据的格式、体量、价值,都超出了传统数据的规模。对这些海量信息的采集、存储、分析、整合、控制而得到的数据就是大数据。大数据技术的意义不在于掌握庞大的数据信息,而在于对这些数据进行专业化处理,通过‘加工’实现数据的‘增值’,更好地辅助决策。”数据科学与大数据技术专业 本科专业中和大数据相对应的是“数据科学与大数据技术”专业,它是2015年教育部公布的新增专业。2016年3月公布的《高校本科专业备案和审批结果》中,北京大学、对外经济贸易大学和中南大学3所高校首批获批开设“数据科学与大数据技术”专业。随后 第二年又有32所高校获批“数据科学与大数据技术”专业。两次获批的名单中显示,该专业学制为四年,大部分为工学。 “数据科学与大数据技术是个交叉性很强的专业,很难说完全归属于哪个独立的学科。所以,不同的学校有的是信息学院申报,有的是计算机学院牵头申报,有的设在统计学院,还有的在经管学院。像北京大学这个专业是放在理学下,授予理学学位。大多数是设在工学计算机门类下,授予的是工学学位。”华迎教授说:“数据科学很早就存在,是个比较经典

国家科学数据共享工程技术标准

国家科学数据共享工程技术标准 XXXXXX—2005 国家科学数据中心建设技术规范 中华人民共和国科学技术部 二〇〇五年八月

前言 制定本规范诣在指导国家科学数据中心的建设,以满足科学数据共享工程技术平台总体设计的要求,确保各国家科学数据中心之间的互联互通和数据共享,并满足面向用户提供数据服务的基本技术要求。 本规范由中华人民共和国科学技术部基础研究司提出并负责解释。 本规范起草工作由中国地质科学院信息中心牵头,国土资源部信息中心、国家信息中心、中国测绘科学院四维公司、北京理工大学信息安全重点实验室、中国科学院计算技术研究所、华仪公司等单位参加。 本规范主要起草人:李晓波、戴爱德、徐枫、张子平、王国复、宦茂盛、徐宝龙、朱新周、胡昌振、许承东、常青、曹存根等。 I

目次 前言.............................................................................................................................................................................I 1范围. (1) 2规范性引用文件 (1) 3术语和定义 (1) 4缩写词 (2) 5总体要求 (3) 5.1总体要求 (3) 5.2建设原则 (3) 5.3总体结构与运行服务模式 (4) 6技术平台 (4) 6.1互联网接入环境 (4) 6.2局域网基本环境 (5) 6.3网络服务器与存储设备 (5) 6.4数据库平台 (5) 6.5数据服务基础平台 (5) 6.6信息安全设施 (6) 6.7机房及电源设备 (6) 7数据资源 (6) 7.1科学数据资源的调查与规划 (6) 7.2科学数据的汇集与处理 (6) 7.3科学数据的存储与运行维护 (7) 7.4科学数据产品的加工 (7) 7.5科学数据的质量保证 (8) 7.6科学数据的元数据 (9) 8数据共享与服务 (9) 8.1数据共享的分级分类 (9) 8.2目录服务 (9) 8.3内容服务 (10) 8.4功能服务 (10) 9信息安全 (10) 9.1基础设施安全 (10) 9.2软件安全 (11) 9.3数据安全 (11) 9.4非技术防护措施 (11) 1

最全的气象类网址

最全的气象类网址 数值预报类: 1. https://www.doczj.com/doc/8a208362.html,/天气在线,集成多种数值预报模式可供参考。 2. https://www.doczj.com/doc/8a208362.html,.tw/V5/forecast/nwp/nwp_data.htm台湾气象局数值模式 3. http://www.ecmwf.int欧洲中期天气预报中心数值模式 4. http://www.kma.go.kr/ema/ema03/gdps_eng.html韩国气象局GDAPS T426/L40模式 5. https://www.doczj.com/doc/8a208362.html,.hk/nwp/nwpc.htm香港天文台电脑模式预测天气图 6. https://www.doczj.com/doc/8a208362.html,/research/nwp/numerical/operational/index.html英国气象局全球数值模式 7. https://https://www.doczj.com/doc/8a208362.html,/PUBLIC/WXMAP/美国海军大气模式(nogaps) 8. https://www.doczj.com/doc/8a208362.html,/sz/qh1.asp国家海洋环境预报中心数值预报 9. https://www.doczj.com/doc/8a208362.html,/nmc/treeNavigator.do?type=TyphoonForecast中国气象局台风数值模式 10. http://ddb.kishou.go.jp/grads.html日本气象厅数值模式(JMA GSM based on GrADS) 11. https://www.doczj.com/doc/8a208362.html,.hk/WRF/香港城市大学WRF中尺数值模式 12. https://www.doczj.com/doc/8a208362.html,上海台风研究所数值预报网 气候数据类: 1. https://www.doczj.com/doc/8a208362.html,/index.jsp中国气象科学数据共享服务网 2. https://www.doczj.com/doc/8a208362.html,/cn/国家气候中心 3. https://www.doczj.com/doc/8a208362.html,/cru/data自1856年全球5°×5°网格温度资料。(P. D. Jones) 4. https://www.doczj.com/doc/8a208362.html,/data全球100个小区的温度资料。(J. E. Hansen) 5. https://www.doczj.com/doc/8a208362.html,/cru/data自1900年全球格点降水资料。(Hulme) 6.(https://www.doczj.com/doc/8a208362.html,/Monitoring/DailyMonitoring/glbtmeana/glbtmeana2006122 7.gif)全球每日平均气温距平(提示修改日期即可获得近期每日数据,把两个glbtmeana均改成glbtmean便可获得全球每日平均气温实况) 如上面网址的图片为

32.基于地理信息系统(GIS)省级环境空间数据共享平台的构建

基于地理信息系统(GIS)省级环境空间数据共享平台构建作者:李宁;作者单位:贵州省环境监控中心;550002 总项目名称:贵州省重大科技专项《“数字环保”关键技术研究及应用示范》项目;项 目编号:黔科合重大专项字[2012]6007号; 课题3:环境污染源动态监测数据挖掘技术研究 摘要 为确保贵州省“十二五”环境保护工作的顺利开展,加强对重点污染源的实时监管,进一步提升贵州省环境保护信息化水平,促进“数字环保”建设,从根本上消除数据重复采集、不能共享等问题,按照贵州省环境保护厅的实际要求进行环境空间数据共享平台的建设,保证地理信息系统渗透贯穿于贵州省环境空间数据共享平台和各信息化应用系统之中。通过整合基础地理信息数据、环境专题空间数据及关联的各类环境管理业务数据,实现业务数据库与地理空间信息的关联,形成了空间信息共享在线服务体系,有效提高了环保业务的综合管理能力与分析决策能力。本文主要结合地理信息系统对环境空间数据共享平台的建设流程、部署框架及特色进行详细的阐述。 1.引言 随着全球信息化的发展,各领域的信息化进程不断深入,国家信息化建设不断推进,这对我国的环境信息化建设提出了迫切的要求[1]。目前贵州省环保部门的信息化领域还相对狭窄,网上办事能力还不够强,服务相对滞后,环境保护压力逐步加大,环境保护管理工作难度与日俱增。作为省环保厅日常业务的基础性技术保障,现有信息化应用系统已不能完全满足当前各项管理工作的需要,亟待升级和完善。而“数字环保”将重点解决该省数据重复采集、不能共享等问题,努力实现环境信息的一数一源、一源多用、数据共享,最终环境信息服务将覆盖环保业务的全部流程,实现环境业务管理信息化、管理信息资源化和信息服务规范化。 目前,环境数据库建设和共享研究一直没有系统地开展,数据分散于各部门,大多以文档、原始数据的方式存在,没有统一的元数据标准,也缺乏应有的处理

科学数据共享关键问题探索

第26卷第5期 2007年9月地理科学进展PROGRESSINGEOGRAPHYVol.26,No.5Sept.,2007 收稿日期:2007-06;修订日期:2007-07. 基金项目:国家科技基础条件平台,地球系统科学数据共享网(2006DKA32300)。 作者简介:刘润达,男(1980-),河南许昌人,博士生。研究方向:科学数据共享,网络信息资源整合技术等。 科学数据共享关键问题探索 ———以地球系统科学数据共享网为例 刘润达1,2,诸云强1 (1.中国科学院地理科学与资源研究所,北京100101;2.中国科学院研究生院,北京100039) 摘要:作为科学基础设施,科学数据共享平台建设可促进科技原始性创新,提高国家科技竞争 能力。本文回顾我国近年推动科学数据共享方面的工作,指出科学数据共享实施过程中所遇到的 主要问题;针对这些问题,在共享理念、数据资源整合和平台建设三个方面探索科学数据共享今 后发展的重点和工作方法。具体结合地球系统科学数据共享网建设实践,提出搭建科学数据交换 平台,构建科学数据共享联盟;将科学数据共享与科研项目相结合,实行主动服务;建立强大的科 学数据搜索引擎;重视文档、信息服务等。 关键词:数据共享;科学数据;数据联盟;数据中介 1引言 科学数据作为现代科学可持续发展的重要资源,与科技创新是密不可分的[1]。为促进科学数据资源的共享和交换,许多发达国家和国际组织都开展了一系列的基于计算机网络的科学数据共享的研究和实践,目的是将长期积累的科学数据为本国以及全球的可持续发展等研究提供数据支撑服务。例如世界数据中心(WDC,WorldDataCenter)等国际组织的成立,在世界范围内进行科学数据共享的工作[2,3];美国及欧洲的一些发达国家建立了国家级科学数据中心群和数据共享服务网络[4 ̄6],如NASA主持的DAACs,全球变化数据和信息系统,全球变化主目录(GCMD)等。我国自上世纪80年代起就开始在多个层面上推动科学数据的共享。1982年,中国科学院提出了“科学数据库及其信息系统”建设项目,经过20多年的发展已经成为综合性的科学信息服务系统;1989年,中国科学院联合有关部门和科研机构,组建了世界数据中心中国中心(WDC-D)和国际科技数据委员会中国委员会;1999年,科技部在科技基础性工作专项中陆续启动了一批数据资源建设,同时还就数据共享中的若干技术问题委托WDC-D开展研究;2001年,科技部主持完成了《实施科学数据共享工程,增强国家科技创新能力》的调研报告,对我国目前科学数据共享存在的主要问题和可能解决的办法等一系列问题进行了详细的调查研究。同年年底,科技部和中国气象局联合召开新闻发布会,宣布气象数据共享试点正式启动,从而在国家层面上,翻开了我国科学数据共享新的一页;2002年6月,科技部向国务院提出了关于启动科技基础条件平台建设的建议,把建立科

【同步练习】《极地科学考察与环境保护》(科普社)

《极地科学考察与环境保护》同步练习 1.我国已在南极建立了4个科学考察站.南极考察一般选择在() A.3﹣5月 B.6﹣8月 C.9﹣11月 D.12﹣次年2月 2.一探险队,历经千辛万苦到达了地球上的某一点,环顾四周,发现前后左右均为北方,你认为他们站在了() A.北极点 B.北极圈 C.南极点 D.南极圈 3.2011年11月3日,随着“雪龙”号破冰船缓缓离开天津码头,标志着我国第28次南极科学考察暨第5次南极天文科学考察正式拉开序幕。目前我国在南极洲已经建立了3个科学考察站。根据上述材料和所学知识,回答问题。 我国南极科学考察站的建站时间都选择在1月至2月的主要原因是() A.此时是南极的暖季,白昼长 B.此时南极最为寒冷,冰层坚硬,地基牢固 C.此时南极冰雪全部融化,地面裸露,方便选址

D.此时南极出现极夜现象,风雪小 4.保护与和平利用地球上最后一片净土——南极洲,下面哪一项做法是正确的() A.建设居民点,大量移民 B.南极地区矿产资源丰富,应大力开采 C.可以大规模捕鲸,丰富食物资源 D.各国加强合作,履行《南极条约》 5.当前两极地区的冰层正在不断变薄,其原因可能是() A.全球气候变暖B.两极地区降水减少 C.两极地区陆地增厚D.两极地区风速增大 6.2014年2月8日,我国南极泰山站正式建成开站.这是继长城站、中山站、昆仑站之后中国的第四个南极科学考察站.关于南极地区,说法正确的是() A.四个科学考察站均有极昼极夜现象 B.降水丰富,是地球上淡水资源最丰富的地区 C.建站时间选择在1月至2月的主要原因是此时南极是暖季,又处于极昼期. D.海豹是南极的特有动物。 7.2014年2月8日,中国南极泰山站建成投入使用。下列关于南极地区的叙述,不正确的是() A.南极地区的气候特点是酷寒、多狂风、降水稀少 B.南极地区淡水资源丰富 C.企鹅是南极地区的代表动物 D.我们放暑假时正是考察南极地区的最佳时期 8.2016年我国计划再次对南极冰盖进行科学考察,你认为选择什么时间段最恰当() ~7月 A.11~3月B.9~12月C.6~8月D.3 9.读下图,“南极地图”,回答问题。

数据科学与大数据技术专业人才培养方案

数据科学与大数据技术专业人才培养方案 (2018级) 一、专业基本情况 专业名称:数据科学与大数据技术专业代码:0080910T 学科门类:工学专业类:计算机类 二、业务培养目标 数据科学与大数据技术专业培养能服务于社会主义现代化建设需要的德、智、体、美全面发展,“基础厚、口径宽、能力强、素质高”的专门技术人才。所培养的人才应具有构建大数据平台和大数据分析处理方面的基础理论知识和技术综合应用能力,能从事大数据信息系统分析设计、开发和管理维护工作。 三、业务培养要求 数据科学与大数据技术专业,旨在培养具有大数据思维、运用大数据思维及分析应用技术的大数据人才。掌握计算机理论和大数据处理技术,从大数据应用的三个主要层面(即数据管理、系统开发、海量数据分析与挖掘)系统地培养学生掌握大数据应用中的各种典型问题的解决办法,学生将受到科学实验和科学思维的基本训练,使学生具有良好的科学素养,实际提升学生解决实际问题的能力,具有将领域知识与大数据技术融合、创新的能力,能够从事大数据研究和开发应用的人才。结合林业行业和其他行业的大数据应用典型案例,培养学生具有一定的林业和其他行业应用的大数据应用能力和背景。 四、毕业生应获得的知识和能力 1、具有坚实的自然科学基础,较好的人文、艺术、外语和社会科学基础知识。 2、具有数据科学与大数据技术专业的宽厚的理论知识和技术基础,主要包括构建大数据平台和大数据分析处理方面的基础理论知识和技术综合应用能力等。 3、具有创新意识和独立获取知识的能力。 4、通过本专业领域的工程实践训练,具有较强的分析问题、解决问题的能力及实践技能,具有从事与本专业有关的研究、设计、开发及组织管理的能力。 5、掌握资料查询、文献检索及运用现代信息技术获取相关信息的基本方法。 五、主干学科 数据科学与大数据技术、计算机科学与技术 六、主要课程 Python程序设计、高等数学、线性代数、概率论与数理统计、应用物理、算法设计与分析、数据科学导论、计算机网络原理、离散数学、操作系统与Linux应用、数据结构、数据库原理及应用、非关系数据库技术、数据采集与网络爬虫、大数据与云计算平台技术、大数据挖掘与分析技术、机器学习、林业大数据应用实践、深度学习及其应用、Web程序设计、数据可视化技术等。 七、学制与授予学位 学制:四年 授予学位:工学学士

数据共享与交换平台解决方案

数据共享与交换平台解决方案 、方案概述随着信息社会的到来,计算机网络环境和分布处理技术的深入发展。信息系统中的数据源所呈现的形式也日益繁多,在这些数据中有模式固定的结构化数据,也有无模式的无序数据。这种无论是已知确定来自数据库的数据或是来自网络上的各式各样结构不固定、不完全或不规则的数据,都给信息系统在向国民经济信息化发展的过程中产生了很大的障碍。因此,完成不同数据的共享与交换成为各个企业与部门进行信息交换时所必须要解决的重要问题。主要原理如下图: 、主要工具 1. 工具简介数据集成的目的就是要运用一定的技术手段将系统中的数据按一定的规则组织成为一个整体,使得用户能有效地对其进行操作。 数据处理的对象是系统中的各种异构数据库中的数据或者无格式数据,而数据集成的主要过程则是建立完善的数据仓库,以及采用数据挖掘技术获取更多数据信息。ETL作为数据库级的数据集成工具,擅长大量数据的迁移,能从多个数据 源中抽取数据,然后进行数据转换和加载,最终得到统一的、完备的主题数据库或数据仓库,原来分散的应用仍独立运作。 ETL中三个字母分别代表的是Extract、Transform、Load,即抽取、转换、加载。 数据抽取:从源数据源系统抽取目的数据源系统需要的数据; 数据转换:将从源数据源获取的数据按照业务需求,转换成目的数据源要求的形式,并对错误、不一致的数据进行清洗和 加工。 数据加载:将转换后的数据装载到目的数据源。 ETL原本是作为构建数据仓库的一个环节,负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中 间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。一个简单的ETL 体系结构如图所示。 2. ETL关键技术 数据抽取数据抽取是从数据源中抽取数据的过程。实际应用中,数据源较多采用的是关系数据库。从数据库中抽取数据一般有以 下几种方式: 全量抽取:全量抽取类似于数据迁移或数据复制,它将数据源中的表或视图的数据原封不动的从数据库中抽取出来,并转换 成自己的ETL 工具可以识别的格式。 增量抽取:增量抽取只抽取自上次抽取以来数据库中要抽取的表中新增或修改的数据。在ETL使用过程中。增量抽 取较全量抽取应用更广。目前增量数据抽取中常用的捕获变化数据的方法有:触发器、时间戳、全表比对、日志对比。数据转换和加工 从数据源中抽取的数据不一定完全满足目的库的要求,例如数据格式的不一致、数据输入错误、数据不完整等等,因此有必要对抽取出的数据进行数据转换和加工。数据的转换和加工可以在ETL引擎中进行,也可以在数据抽取过程中利 用关系数据库的特性同时进行。相比在ETL引擎中进行数据转换和加工,直接在SQI语句中进行转换和加工更加简单清晰,性能更高。对于SQL语句无法处理的可以交由ETL引擎处理。 数据装载 将转换和加工后的数据装载到目的库中通常是ETL过程的最后步骤。装载数据的最佳方法取决于所执行操作的类型以及需要装入多少数据。当目的库是关系数据库时,一般来说有两种装载方式:1) 直接SQL语句进行insert、update、delete操作;2)采用批量装载方法,如bcp、bulk、关系数据库特有的批量装载工具或api 。 3. 主流ETL工具 ETL工具从厂商来看分为两种,一种是数据库厂商自带的ETL工具,如Oracle warehouse builder >Oracle Data Integrator 。另外一种是第三方工具提供商,如Kettle 。 Oracle Data Integrator (ODI):ODI主要定位于在ETL和数据集成的场景里使用,ODI能够检测事件,一个事件可以触发 ODI的一个接口流程,从而完成近乎实时的数据集成。ODI的主要功能特点有:使用CD*为变更数据捕获的捕获方式、代

地震科学数据共享工程技术标准

地震科学数据共享工程技术标准 EDS/T3—2005 地震科学数据数据库建库指南 Guidelines for the establishment of earthquake-related databases (试用稿) (本稿完成日期:2006年2月20日) 200X-XX-XX发布 200X-XX-XX实施 中国地震局发布

前言 本标准是《地震科学数据》系列标准的第三项,该系列标准的结构为: ——地震科学数据元数据编写指南; ——地震科学数据数据模式编写指南; ——地震科学数据数据库建库指南; ——地震科学数据数据元目录; 本标准由中国地震局地震科学数据共享工程标准组提出并归口。 本标准起草单位:中国地震台网中心、中国地震局地球物理研究所。 本标准主要起草人:代光辉、顾左文、赵仲和、冯义钧、周克昌、黄志斌、吴敏、杨辉、赵宇彤、纪寿文、田丰。

目次 引言 (4) 1 范围 (5) 2 规范性引用文件 (5) 3 术语和定义 (5) 4 共享地震数据库体系结构 (6) 5 共享地震数据库建库原则 (7) 6 共享地震数据库管理系统配置 (7) 7共享地震数据库表结构设计 (8) 8 共享地震数据库数据入库软件开发 (8) 9 共享地震数据库质量保证 (8) 10 共享地震数据库安全保障 (9) 11 共享地震数据库元数据编写 (9) 12共享地震数据库数据模式编写 (9) 13 共享地震数据库建库文档编写 (9)

引言 关于建立数据库的一般性要求和方法已在相关规程、规范和IT技术资料中有充分的论述,本标准不涉及建立数据库的一般性问题,只是根据科学数据共享工程的要求和地震数据的特点,对建立地震科学数据共享数据库所涉及的全局性问题做统一的规定,或提出基本要求和原则。 随着工程的实施,本标准的内容会进行修改和扩充,有些内容可以进一步细化,形成相应的技术标准和规范。

科学数据共享工程简介

科学数据共享工程简介 科学数据是人类社会科技活动所产生的基本数据、资料,以及按照不同需求而系统加工的数据产品和相关信息,具有明显的潜在价值和可开发价值,并在应用过程中得以增值,是信息时代最基本、最活跃、影响面最宽的科技资源。 科学数据共享工程是在国家科技基础条件平台统一规划、政策调控和相应法规的保障下,应用现代信息技术,整合离散的科学数据资源,构建面向全社会的网络化、智能化的管理与共享服务体系,实现对科学数据资源的规范化管理及其高效利用。从而为科技进步与创新、政府决策、经济增长、社会发展和国家安全提供科学数据资源的强有力支撑。它具有公益性、基础性、持续性和基于现代信息技术的数据内容服务的明显特征,是国家科技基础条件平台的重要组成部分,是国家创新体系中急需发展的现代科技基础设施之一。 国家科技基础条件平台建设,是政府促进科技进步与创新的一项举措。科学数据共享工程作为国家科技基础条件平台建设的组成部分,旨在整合离散的科学数据资源,构建面向全社会的网络化、智能化的管理与共享服务体系。如同电子政务、电子商务、电子媒体、网络教育一样,科学数据共享工程又是信息化建设的重要任务,是一项复杂的系统工程,一项全新的管理工程,它的建设需要动员全社会的力量共同努力。并以此带动社会信息化,推动信息产业化。 一、科学数据共享工程建设的指导思想 科学数据共享工程建设的指导思想是:以邓小平理论和“三个代表”重要思想为指导,围绕全面提升国家科技创新能力,实现推进现代化建设的国家目标,以科技创新为动力,以需求为导向,以政策、法规为保障,充分发挥国家长期布局的数据采集系统和各类国家科技计划项目产生与积累的科学数据资源优势,构建面向全社会的共享服务体系,实现科学数据资源的规范化管理与高效利用。以共享促进应用,最大限度地发挥科学数据的潜在价值,强化对科技进步与创新的支撑能力。建设有利于科学数据共享的管理、政策和法律环境,增强科学数据共享管理的科学性、协调性和有效性,带动社会信息化,推动信息产业化。特别注意把《工程》建设与科技创新和国家整体发展紧密结合;把科学数据共享工作与提高政府公共服务能力相结合;强化数据资源整合开发与充分利用现代信息技术和国家信息基础设施相结合;最大限度实现科学数据共享与安全保证相结合。 二、科学数据共享工程建设的原则 根据科学数据共享工程建设的上述指导思想,考虑我国科学数据资源及其共享状况,科学数据共享工程建设的原则是: 统筹规划,资源共享。切实加强国家层面的宏观管理,优化《工程》的顶层设计,以投入的增量资源带动和激活存量资源,充分利用现有网络基础设施、相关业务系统和数据信息资源,加强与国家重大科技计划、专项相结合,加强与各部门、地方发展规划相结合,进而提高数据资源的整合效能。完善科学数据管理与服务体系的布局,促进互联互通、资源共享。 联合建设,统一标准。充分发挥部门、地方政府和全社会的积极性,政府主导,加强协调,避免重复建设,以有效共享为基点,机制创新,联合推动。加快推进科学数据共享工作的标准化、规范化,当前要切实抓好共享技术平台,统一标准,统一规范,健全法制,建设面向全社会的科学数据共享服务系

相关主题
文本预览
相关文档 最新文档