当前位置:文档之家› 元数据格式汇总

元数据格式汇总

元数据格式汇总
元数据格式汇总

元数据格式汇总iii

1. DC(都柏林核心元数据)

2. CDWA(艺术作品描述目录)

3. V AR Core(可视资源委员会核心元数据)

4. CDF(频道定义格式)

5. ROADS元数据(主题信息服务的资源组织和发现)

6. IEEE LOM(IEEE学习对象元数据)

7. BibTex(科技文献书目资源格式)

8. GEM(教育资源网关)

9. CIMI(博物馆信息计算机交换标准框架)

10. REACH元数据格式

11. EAD(编码文档描述)

12. ONIX(在线信息交换)

13. EELS(工程电子化图书馆)

14. EEVL(爱丁堡工程虚拟图书馆)

15. FGDC(联邦地理数据委员会)

16. GILS(政府信息定位服务)

17. MARC(机读目录格式)

18. MOA2(美国的创建II)

19. MCF(元内容框架)

20. PICA+(荷兰图书馆自动化中心)

21. PICS(网络内容选择平台)

22. TEI Header(文本编码先导计划)

23. SOIF(概略对象交换格式)

24. IAFA/WHIOS++Templates(因特网匿名FTP文件库版式)

25. ICPSR SGML Codebook(政治和社会研究方面的校际联盟)

26. LDAP DIF(轻便型目录获取协议)

27. RFC 1807(书目记录格式)

28. URCs(统一资源特征)

29. SGML(通用标准标记语言)

30. Warwick Framework(Warwick框架)

31. Web Collections(网站集合)

32. XML(可扩展标记语言)

33. RDF(资源描述框架)

1.DC(都柏林核心元数据)

名称:Dublin Core Metadata,DC

简介:都柏林核心元数据是一个由计算机专家、网络专家和图书馆专家等人员所组成的非正式小组开发的,目的是要建立一个广泛的元数据元素集,可以描述任何网络信息资源,并足够的简单以至任何作者无需专门的培训就可以创建自己文件的元数据。DC具有创建和维护简单、广为理解的句法、系统互用性、可扩展性等特点。目前,DC已经拥有15个基本元素,并可以使用TYPE 和SCHEME限定词以及LINK参照对元素进行扩展。

网址:https://www.doczj.com/doc/998010659.html,

2.CDWA(艺术作品描述目录)

名称:The Categories for the Description of Works of Art

简介:艺术作品描述目录(CDWA)由AITF(the Art Information Task Force)于1996年开发,主要为提供和使用艺术信息的团体(如博物馆和档案馆)描述艺术作品(包括其图像)提供结构化工具。它的描述重点在于“可动”的对象及其图像,包括来自不同时期和地理范围的油画、雕刻、陶艺、金属制品、家具、设计、表演艺术等等。该元数据有26个主要类目,每一个类目有其子类目,包括主题、记录、管理等项目。

网址:https://www.doczj.com/doc/998010659.html,/gii/cdwa/

3.V AR Core(可视资源委员会核心元数据)

名称:Visual Resources Association Core

简介:美国可视资源委员会(VAR)为了规范描述可视文化作品及其图像资源,颁布了此项标准,2000年6月已经出版到第三版。可视作品主要指绘画、雕塑、表演、乐曲、文艺作品、建筑物、建筑设计或其他含有文化含义的物品等,这些物品可以独立存在,也可以由多个部分组成。元数据描述的对象可以是这些物品的复制品或代表物,可以是幻灯、照片、录相或各种数字化形式。一个作品可以拥有多个数字化形式。该方案含有17个核心元素。

4.CDF(频道定义格式)

名称:Channel Definition Format

简介:频道定义格式由微软公司在1997年三月提出。作为一个开放的专门说明,CDF允许网页出版商实现从任何自动传输的WEB服务器到相容的接受程序之间提供快速更新的信息集合或频道。CDF使用XML,并对XML和Web Collections进行了扩展,面向的用户是创建网页的个人或机构。它使用一个简单句法创见频道,因而除了WEB服务器和CDF适应的浏览器之外,不需要任何技术支持。

网址:https://www.doczj.com/doc/998010659.html,/pub/WWW/TR/WD-xml-961114.html

5.ROADS元数据(主题信息服务的资源组织和发现)

名称:Resource Organisation And Discovery in Subject-based services

简介:是英国高等教育领域对互联网信息资源进行收集组织并提供检索服务的系统,其主要目标是建立一个主题信息网关,帮助信息服务机构快速构建能够有效组织和检索专业领域信息的系统。

ROADS系统利用一组元数据应用模版(Metadata Templates)来定义和组织描述不同类别资源所需的元数据,并且有一套注册系统负责支持重用这些元数据模版、元素,并实现这些不同类别资源在元数据语义方面的互操作。

6.IEEE LOM(IEEE学习对象元数据)

名称:IEEE Learning Object Metadata

简介:由IEEE学习技术标准委员会P1848.12学习对象元数据工作组建立,用以完整、充分地描述一个学习对象的特征。定义了学习对象模型,学习对象元数据的语法和语义,目的在于使用最小属性集完成对学习对象的管理、检索和评估,并且便于将来对其属性进行扩展。

7.BibTex(科技文献书目资源格式)

名称:

简介:BibTex是描述科技文献书目资源的格式,是LaTeX的一部分(LaTeX是文件打印设置系统)。BibTex是一个单独的程序,通过从一个书目数据库获取信息从而产生文件的来源列表。主要用在科学和学术界以及工业领域。

网址:ftp://https://www.doczj.com/doc/998010659.html,/tex-archive/biblio/bibtext/distribs/doc/

8.GEM(教育资源网关)

名称:the Gateway to Educational Materials

简介:,美国教育部支持,致力于组织和整合美国各类网站上的教育资源,以便人们方便地检索和获取。项目复用了DC15个元素,并扩展了8个新元素。

9.CIMI(博物馆信息计算机交换标准框架)

名称:A Standards Framework for the Computer Interchange of Museum Information

简介:CIMI是博物馆信息计算机交换标准框架,完整的框架包含交换协议、交换格式、低层网络和通信以及内容数据标准。现阶段CIMI的主要计划是CHIO(Cultural Heritage Information Online,文化遗产联机信息),主要目标是提供对各类博物馆信息的记录方式,包括展览目录的全文本、展品文字解释(wall texts)、图象以及传统的文献类信息。CHIO包括两个部分:CHIO结构(包括内容数据标准及其格式)和CHIO存取(access)。前者使用SGML,后者使用Z39.50。

网址:https://www.doczj.com/doc/998010659.html,/pub/sgml/ead

10.R EACH元数据格式

名称:RLG REACH Element Set

简介:1997年美国研究图书馆协会RLG(Research Library Group)为探索有效组织博物馆信息、提供博物馆资源在线服务而提出了这个元数据格式,包含20个基本元素。

11.E AD(编码文档描述)

名称:Encoding Archival Description,EAD

简介:编码文档描述是SGML的一个专用数据类型(DTD)。美国国会图书馆网络开发/MARC标准办公室是它的维护机构,美国档案管理员协会(SAA,the Society of American Archivists)是该标准的所有者。EAD主要用于描述档案和手稿资源(manuscripts collections),并利用网络检索和获取档案手稿类信息资源。相对于提供概括性描述和整体存取的MARC记录,EAD意在提供具体细节的描述和存取。EAD还提供“发现辅助”(美国使用“发现辅助”-finding aids-英国使用“详细目录”-detailed catalogues),力图提供一个完整、等级式的描述结构,并主要为具有知识组织和档案实践的人们所设计。高层元素主要包括:头标;前面事项;档案描述。每一个高层元素又包括多个小项以及若干细项。

网址:ftp://https://www.doczj.com/doc/998010659.html,/pub/sgml/ead

12.O NIX(在线信息交换)

名称:Online Information eXchange

简介:是一种描述、传递和交换出版物元数据的国际性标准,克服了MARC在支持电子贸易EDI 和电子商务方面的不足。由出版商、发行商、零售商、图书馆以及在这条供应链上其他环节的经营者共同制定,参加者有许多出版发行行业的国际协会和巨头。目前的版本是2001年7月形成的ONIX2.0版。

13.E ELS(工程电子化图书馆)

名称:the Engineering Electronic Library

简介:工程电子化图书馆是瑞典大学技术图书馆的一个合作计划,为网络信息资源的质量评价提供一个信息系统。EELS使用的元数据是该计划所专有的。目前,该格式只由图书馆员与信息专家使用。EELS格式包括11个属性.

网址:http://www.ub2.lu.se/eel/eelhome.html

14.E EVL(爱丁堡工程虚拟图书馆)

名称:EEVL,Edinburgh Engineering Virtual Library

简介:爱丁堡工程虚拟图书馆是欧洲电子图书馆计划(eLib, the Electronic Libraries Programme)资助的计划,目的是为工程领域的高质量信息资源提供主题查询网关。它的元数据格式为该计划专有,包括22个属性,用于专门描述网络资源。

网址:https://www.doczj.com/doc/998010659.html,/pubs.html

15.F GDC(联邦地理数据委员会)

名称:FGDC,the Federal Geographic Data Committee

简介:联邦地理数据委员会在1992年建立了一个地理数据文件的术语和定义集合,并在1994年通过数字化地理元数据的内容标准(Content Standards for Digital Geospatial Metadata),名为CSDGM,但通常仍叫做FGDC。FGDC包括300多个元素,包括7个主要段和3个辅助段。国家地理信息交换所(National Geospatial Data Clearinghouse)作为主题化信息网关利用FGDC 实现数字化地理数据的发现、评价和下载。

网址:https://www.doczj.com/doc/998010659.html,/Metadata/metahome.html

16.G ILS(政府信息定位服务)

名称:the Government Information Locator Services, GILS

简介:政府信息定位服务由美国联邦政府建立,面向普通公众和政府用户提供如何定位和查找由许多政府机构产生的有用信息,因此它的用户非常广泛,许多国家的政府机构,如加拿大、澳大利亚等正密切注视美国的GILS计划。

网址:https://www.doczj.com/doc/998010659.html,/public/gils/prof_v2.html

17.M ARC(机读目录格式)

名称:MARC

简介:机读目录格式是图书馆描述、存储、交换、处理以及检索信息的基础,经过不断发展已被图书馆用来描述和存取电子信息资源,例如扩展MARC格式的“电子位置及提取方式字段”(即856字段,可重复)可利用MARC记录描述网络化电子资源(包括网页、电子期刊、telnet系统、FTP站点等)的特征、连接方式和提取要求。最近,有关机构还开展了MARC与SGML等元数据格式互操作性的试验。

网址:https://www.doczj.com/doc/998010659.html,/marc/marc.html

18.M OA2(美国的创建II)

名称:the Making Of America II

简介:美国的创建项目起始于1995年,由美国Digital Library Federation支持,最初由米歇根大学和康乃尔大学合作进行,对美国南北战争以前关于美国社会历史的珍贵书刊进行扫描,提供电子版本服务。因此这个元数据标准主要是关于数字图像的元数据,分结构性元数据、管理型元数据等,对图像数字图书馆的资源加工、管理和元数据元素的选取、元数据方案的制定具有很好的参考作用。

19.M CF(元内容框架)

名称:Meta Content Framework,MCF

简介:元内容框架,由网景公司于1997年6月提交给W3C。它是过去多项元数据工作(如XML、CDF、PICS、Web Collection)发展的结果,产生了一个“数据模型和相应的交换格式”,足够强大以适应任何应用。MCF主要应用于:描述WEB站点或频道集合的结构;贯穿email;PIM功能;分布式注解和创作;交换相关于商业的信息,如价格、存货清单、送货日期。

网址:https://www.doczj.com/doc/998010659.html,/mcf/NOTE-MCF-XML.html

20.P ICA+(荷兰图书馆自动化中心)

名称:The Dutch Center for Library Automation,PICA

简介:荷兰图书馆自动化中心为荷兰图书馆以及许多德国图书馆网络提供共享编目、馆际互借以及文件传送等服务,建有NCC/IBL系统,它提出了基于MARC的文献数据库和其他信息资源描述格式。

网址:https://www.doczj.com/doc/998010659.html,/metadata/desire

21.P ICS(网络内容选择平台)

名称:Platform for Internet Content Selection,PICS

简介:网络内容选择平台始于1995年8月,最初用于帮助父母和老师控制儿童获取网络资源,后来作为一项技术规范,使用户能够轻松找到合适的内容又避免那些对自己或儿童不适合、不需要的内容。该规定易于创建和获取,标记各种系统以及相关的内容选择和过滤机制,从而允许不同的人和机构以最适合各自观点的方式标记网页内容。PICS技术规范最终在1996年初完成,此后PICS被结合到一系列产品中,例如基于PICS的评级服务和过滤工具被大量地开发出来。

网址:https://www.doczj.com/doc/998010659.html,/issue9/pics

22.T EI Header(文本编码先导计划)

名称:the Text Encoding Initiative,TEI

简介:文本编码计划开始于1987年,其目标是定义一个表现电子化文本资料的通用格式,使研究者能交换和重复使用资源,不受软件、硬件和应用领域的限制。美欧的许多学术团体已加入到该计划中,并组成多个委员会考虑编码的各个方面。TEI Header作为TEI格式中元素定义部分,基于SGML/DTD,可作为TEI文件的一部分,或作为独立的元数据存在。

网址:ftp://https://www.doczj.com/doc/998010659.html,/pub/ota/TEI/doc/teij31.sgml

23.S OIF(概略对象交换格式)

名称:the Summary Object Interchange Format,SOIF

简介:概略对象交换格式,是科罗拉多大学Harvest体系的一部分。SOIF记录由Harvest搜集器产生,并由Harvest代理使用,用于用户搜索,提供了由Harvest搜索器找到的资源的概况。在1996年3月,网景公司宣布在其目录服务器中使用SOIF,其它搜索引擎也准备支持SOIF。

网址:https://www.doczj.com/doc/998010659.html,/afs/https://www.doczj.com/doc/998010659.html,/public/tr

-g/Harvest/user-manual/nodel51.html

24.I AFA/WHIOS++Templates(因特网匿名FTP文件库版式) 名称:IAFA Templates,Internet Anonymous FTP Archive Templates

简介:因特网匿名FTP文件库版式是由IETE(Internet Engineering Taskforce)的IAFA研讨班设计的,目的是建立一个记录格式,可以被FTP文件库管理员用来描述来自这些文件库的各种资源。IAFA版式通过描述FTP文件内容和服务实现对FTP文件库的有效获取。最初的打算是FTP 站点管理员能让每一个访问该站点的用户获得该版式描述的信息。如果FTP站点使用普通的索引和目录指南,那么类似Harvest那样的软件就能自动检索记录。现在,IAFA版式已开发出使用whois++协议实现FTP文件库的检索和获取,同时还具有在多个数据库之间搜索的能力。IAFA的支持者已经扩展了最初目标,立足设计一个足够简单的记录格式,能被参加创建网络资源的个人和机构所使用。

网址:https://www.doczj.com/doc/998010659.html,/mark/projects/iafa/iafa.txt

25.I CPSR SGML Codebook(政治和社会研究方面的校际联

盟)

名称:ICPSR,Interuniversity Consortium for Political and Social Research

简介:政治和社会研究方面的校际联盟,在1995年建立了一个委员会,针对社会科学研究团体对国际性Codebook标准的需要,开发描述社会科学数据集的结构化信息集。一个Codebook通常包括结构、内容、数据文件或数据集的信息,该委员会力图覆盖社会科学中各类数据集和数据集系统,其Codebook中的元素是从社会科学调查、研究、档案和技术团体中使用的一系列使用指南和标准中选取的。

网址:https://www.doczj.com/doc/998010659.html,/codebook.html

26.L DAP DIF(轻便型目录获取协议)

名称:LDAP,the Lightweight Directory Access Protocol

简介:轻便型目录获取协议为那些在OSI低层中无法运行目录获取协议的机器提供获取X.500

目录服务的方式。LDIF,即LDAP数据交换格式(LDAP Data Interchange Format)已被网景公司采用,它声明要将LDAP结合到它的网景导航器(Netscape Navigator)中,这意味着WWW的用户将拥有一个被直接传送到用户桌面的目录搜索和检索协议,这相对于目前通过第三者进行搜索和检索工作的现状,的确是一个进步。

网址:https://www.doczj.com/doc/998010659.html,/~rsug

27.R FC 1807(书目记录格式)

名称:A Format for Bibliographic Records, 1995

简介:由R. Lasher和D. Cohen在1995年提出的方案,用以描述计算机科学技术报告和以FTP 等网络资源形式存储在网络服务器中的文档。万维网协会(W3C)的许多技术标准文档均以RFC 开头,意为Request For Comment,从字面上看并不是标准,文档内容中也常常说明RFC文档不是标准,然而许多RFC确实是实实在在的事实标准。RFC1807的具体版本格式被称为TR-v2.1,取代了1992年的RFC1357。该格式被NCSTRL:Networked Computer Science Technical Reference Library等项目应用,其优点在于文档的创建和阅读都很容易,可使用任何文本编辑器,不需要专门的程序。

网址:https://www.doczj.com/doc/998010659.html,/htbin/rfc/rfc1807.html

28.U RCs(统一资源特征)

名称:URCs,Uniform Resource Characteristics/Citation

简介:统一资源特征用于识别:关于联机资源编目信息的长术语;连接元数据或描述信息的标准方式;作为将URN分解到URL的过程信息;选择资源时的应用信息。URC的目的在于全面确保电子资源的机器可检索性。

网址:https://www.doczj.com/doc/998010659.html,/URI

通用置标方案

29.S GML(通用标准标记语言)

名称:Standard Generalized Markup Language,SGML

简介:通用标准标记语言作为国际标准(ISO8879,1986),利用通用方式和元标识语言(meta language)对文献内容和结构进行标记,实现对各类文献结构和内容的系统化标准化描述,从而建立起通用数字化文献。SGML文献由SGML前言(SGML prolog)和SGML例示(SGML Instance)组成,其中SGML前言包括SGML陈述(SGML Declaration)和文献类型定义(Document Type Definition,DTD)。DTD由描述标记的一系列标记定义组成,包括元素定义(element declaration)、属性定义(attribute declaration)、实体定义(entity declaration)和注释定义(notation declaration),不同类别文献将有不同的DTD。目前,SGML广泛应用于文件及元数据格式的编码,成为众多元数据格式的基础。

网址:https://www.doczj.com/doc/998010659.html,/sgml/sgml.html

30.W arwick Framework(Warwick框架)

名称:Warwick Framework

简介:Warwick框架是一个集合元数据对象的结合性结构。它是在由UKOLN和OCLC联合举办的第二届元数据研讨班上提出的,用于交换元数据包。一个包(package)是用于某专门目的的元数据对象。一个基于DC的记录就可以是一个包,一个GILS记录也是一个包。这种结构是模型化的,允许不同类型的元数据类型:是可扩展的,允许新的元数据类型;是分布式的,允许参考外部元数据对象;是递归性的,允许元数据对象处理信息内容和有与之相联系的元数据对象。

网址:https://www.doczj.com/doc/998010659.html,:80/Dienst/Repository/2.0/B-

ody/ncstrl.cornell%2fTR96-1593/html

31.W eb Collections(网站集合)

名称:Web Collections

简介:网站集合作为XML的应用之一,1997年3月向W3C提出,用于描述网页资源的性质,建立一个标准元数据框架。它主要集中在传统的HTML页面,其具体描述在文本上类似于HTML.Web Collections可有广泛用途,如网页、网页组、电子邮件提取、PIM功能、调度、内容标记以及分布式创建等等.

网址:https://www.doczj.com/doc/998010659.html,/TR/NOTE-XMLsub-mit.html

32.X ML(可扩展标记语言)

名称:eXtensible Markup Language,XML

简介:可扩展标记语言由Generic SGML编辑调查委员会(在W3C赞助下)于1996年开发出来的,由Sun Microsystem的Joe Bosak负责。XML是SGML的一个应用文档或限制格式,但不是一个固定格式,因而是“可扩展”的。XML本身不仅仅是一个标记语言,还是一个元语言,允许用户设计自己的标记语言。XML实际上定义了一个简单的SGML语言集,用现在在HTML中可能的方式实现普通SGML文件的使用、接受和处理。作为标记语言的元语言,XML可以运用到广泛的领域,MCF、RDF、Web Collections都使用XML作为基本的句法。

网址:https://www.doczj.com/doc/998010659.html,/pub/WWW/TR/WD-xml-961114.html

33.R DF(资源描述框架)

名称:Resource Description Framework,RDF

简介:资源描述框架,是一个基于组(group-based)的元数据计划,由W3C(World Wide Web Consortium)开发,通过多个致力于元数据发展的组织的共同努力,开发出一个强大、灵活的元数据框架,能运用于广泛领域,确保元数据之间互操作性。可以说,RDF是处理元数据的基础。RDF可以用于资源发现,为搜索引擎提供更强大的功能;用于编目,描述内容以及内容之间的关系;用于智能软件,实现知识共享和交流;用于内容分级,用于描述表示一个逻辑文件的“页面集”;用于描述网页的“智力属性权利”;用于表现用户“秘密爱好”以及网站“秘密政策”等等。RDF的“数字化标识”是为电子商务等应用建立“可信赖网页”的关键。元数据的用户,如搜索引擎、目录编制以及浏览器可采用RDF以改善网络资源的组织状况。

网址:https://www.doczj.com/doc/998010659.html,/TR/REC-rdf-syntax/

参考文献

i

http://202.114.9.3/lib/dllib.nsf/1ce930115fcd2e7048256c9a0006f537/45ba08f01d4d9b8248256c9f

000e24ac?OpenDocument

ii张晓林《元数据研究与应用》北京图书馆出版社2002年5月

元数据的概念

元数据的概念 元数据(Metadata),即关于数据的数据,是对数据和信息资源进行描述的信息。通常认为,元数据是为了更为有效地管理和使用数据而对它进行说明的信息。所以元数据与其描述的数据内容有着密切联系,不同领域的数据的元数据在内容 上差异很大。地理空间数据的元数据是地理空间的空间数据和属性数据以外的描述地理信息空间数据集的内容、质量、状态和其它特性的一类数据,它是实现地理空间信息共享的核心标准之一。其中,对空间数据某一特征的描述,称为一个空间元数据元素。空间元数据是一个由若干复杂或简单的元数据项组成的集合。它与非空间元数据的主要区别在于其内容中包含大量与空间位置有关的描述性信息。 研究元数据的作用和意义 元数据可用来帮助数据提供者和数据使用者解决数据转换、沟通和理解的问题。归纳起来,元数据主要有下列几个方面的作用: 1)、用来组织、管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解 2)、提供数据存储、数据分类、数据内容、数据质量及数据分发等方面的信息,帮助数据使用者查询检索所需地理空间数据 3)、用来建立空间信息的数据目录和数据交换中心,提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息 4)、通过空间元数据,人们可以接受并理解空间信息,帮助数据使用者了解数据, 以便就数据是否能满足其需求作出正确的判断并与自己的空间信息集成在一起,进行不同方面的科学分析和决策。 元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。元数据对于建立空间数据交换网络是十分重要的,往往网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分节点元数据库,帮助潜在的用户找到其特定应用所需要的数据,实现数据共享。 一个完整的元数据系统通常包括三部分,即元数据标准、元数据管理工具和元数据库。不同的元数据库可能采用不同的管理工具,唯一能够在不同数据管理软件间交换元数据的途径是统一元数据标准,只有在统一的标准前提下,才能跨越操作系统平台和数据库软件平台进行数据的互操作,实现数据共享。 DIF 元数据标准

行业分类(统计)

行业分类(统计)

行业分类 第一部分行业分类的有关概念和原则 一、经济活动 国民经济行业分类是按照各单位(或劳动者)从事的经济活动进行分类。一般情况下,一个单位至少有两种类型的经济活动,一种是对外提供产品或劳务的活动,一种是为保障单位正常运转所从事的辅助活动。单位对外提供的活动往往也不是单一的,有主要活动和次要活动之分。在划分行业时,首先要明确单位从事的哪些是主要活动,哪些是次要活动,哪些是辅助活动。 (一)主要活动 当一个单位对外从事两种或两种以上的经济活动时,占其单位收入份额最大的一种活动为主要活动。 在实际工作中,有些活动的增加值份额较确定,则可依次按照主营业务活动收入、全年营业收入、从业人员确定单位的主要活动。凡有主营业务收入的,按照主营业务收入确定单位的主要活动;如果没有主营业务收入的,按照以下方法确定单位的主要活动,采矿、制造、电力、燃气及水的生产和供应等活动按照销售收入判断。 (二)次要活动 一个单位对外从事的所有经济活动中,除主要活动以外的经济活动为次要活动。或者说,是占单位收入份额不是最大的那些活动。 (三)辅助活动 辅助活动是保证本单位主要活动和次要活动正常运转而进行的一种内部活动,一般不对外提供产品和劳务。如水、电气的供应活动、企业产品的销售活动、通信及网络管理活动、财务管理、人员管理活动等。 二、国民经济行业的划分原则 一个行业(或产业)是指从事相同性质的经济活动的所有单位的集合。 (一)一般性原则 国民经济行业分类采用经济活动的同质性原则划分行业类别。即每一个行业类别都按照相同性质的经济活动归类,而不是依据行政事业编制、会计制度和部门管理归类。

元数据与元数据标准现状

元数据与元数据标准现状 福建省空间工程研究中心黄瑞垠 目前国内外研究领域对元数据含义的理解虽然存在认识深浅的区别,但总体上达成了共识[[i]]。学者们大都认可“元数据是关于数据的数据”或“描述数据的数据”的观点,但对于其具体含义,又有不同阐述。张晓林等[[ii]]认为“元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源、评价资源、追踪资源在使用过程中的变化,实现简单高效地管理大量网络化数据,实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理”。肖珑[[iii]]认为元数据“是用于提供某种资料的有关信息的结构化数据(Structured data)”。张智雄[[iv]]将元数据定义为“描述任何Internet数据和资源,促进Internet信息资源的组织和发现的数据”。李郎达[[v]]引用国际图联对元数据的定义:“Metadata即描述资料的资料,可用来协助对网络电子资源的辨识、描述、指示其位置的任何资料”。 根据以上定义,参考其他学者的观点,关于元数据,可小结如下: (1)元数据的目标:元数据的根本目标是使数据库更易于使用,或为计算机辅助软件工程(CASE)服务。 (2)元数据的内容:元数据包括对数据集的描述;对数据集中各数据项(来源、数据所有者、数据生产历史)等的说明;数据质量的描述,如:数据精度、分辨率、源数据的比例尺等;数据处理信息,如量纲的转换等;数据转换方法;数据库更新、集成的方法等等。 (3)元数据的性质:元数据是数据的描述性数据;对不同领域的数据库,元数据的内容有很大差异;元数据应尽可能反映数据的特征及规律。 (4)元数据的作用:通过元数据可以检索、访问数据库,可以有效利用计算机的系统资源,可以对数据进行加工处理和二次开发等。 在此基础上,我们将元数据概括为以数据高效利用和交换为目的的数据集说明性数据,它主要包括对数据集、与数据集相关信息、数据集各数据项说明以及数据用户访问、检索、更新数据库的方法,同时元数据也包括基于不同数据领域,如何尽可能全面反映基本数据的信息。

专门数字对象描述元数据规范

专门数字对象描述元数据规范 研制工作手册 (试行) 《专门数字对象描述元数据规范》子项目组 2003年3月 为了保证子项目组研制的各种元数据规范在功能、数据结构、格式、语义语法等方面的一致性和整体性,同时也为了今后在更大范围内实现与其他系统或数字图书馆的互操作和数据共享,项目组特制定本手册。 手册主要内容包括: 1,描述元数据的定义及功能 2,元数据规范的设计原则 3,描述元数据的基本结构、元素组成与扩展规则 4,描述体系与定义方法 5,元数据规范应用的相关规则 6,设计流程与工作规范 7,文档规范 本手册为试行稿,其中很多内容尚需在实际工作过程进行修订,涉及到核心元素集、元素定义方法、扩展规则、描述体系等方面的内容,将与“基本描述元数据规范”子项目组进一步探讨后确定。各工作小组可暂时按此执行,在执行过程中如有问题,可向子项目组提出,并在子项目组会议上讨论修改并通过。 一、描述元数据的定义及功能 描述元数据:即用于描述或标识数字对象内容的元数据。 设计描述元数据规范时,要充分考虑和实现元数据的下列功能: 描述:对信息对象的内容、属性等的描述,是元数据最基本的功能,为信息对象的检索与利用奠定了基础。 定位:即有关信息资源的位置方面的信息,如DOI、URL、URN等的记录,由此可知信息对象之所在,有利于信息的发现和检索。 管理:对信息对象的权限管理(版权、所有权、使用权)的揭示和描述。 检索:在描述过程中,将信息对象中的重要信息抽出标引并加以组织,建立它们之间的关系,为用户提供多层次、多途径的检索体系,从而有利于用户发现其真正需要的信息。 评估和选择:由于元数据的描述,使用户在不必浏览信息对象本身的情况下,对信息对象有了基本了解和认识,可以对其价值进行评估,从而决定信息的取舍。 交互:包括与编目人员和用户之间的交互。元数据在结构上呈现出一定的开放性,允许

CELTS-42基础教育教学资源元数据规范1

基础教育教学资源元数据应用规范 (CELTS-41) 教 育信息化技术标准 CELTS-42 基础教育教学资源元数据规范 CELTS-42 CD1.6 教育部教育信息化技术标准委员会 发布

目录 1 概述 (2) 1.1 目的 (2) 1.2 范围 (2) 2 规范性引用文件 (2) 3 术语定义与缩略语 (3) 3.1 本应用规范使用的基础术语 (3) 3.2 缩略语 (5) 4 元数据元素属性定义 (6) 4.1 元数据元素的属性描述 (6) 4.2 数据元素定义的规定 (7) 5 元数据结构 (7) 5.1 元数据的基本结构 (7) 5.2 元数据元素及定义 (7) 6 限定词汇与编目词汇表 (11) 6.1 限定词汇 (11) 6.2 本规范的限定词与编目方式定义 (14) 6.3 受控词汇和编目方案 (22) 6.4 一致性 (29) 7 参考文献 (31) 附录 A 供参考的部分教育学科课程分类第三级词汇表(课程内容) (33) A.1 语文课程内容分类 (33) A.2 数学课程内容分类 (34) A.3 英语课程内容分类 (37) A.4 地理课程内容分类 (38) A.5 历史课程内容分类 (39) A.6 化学课程内容分类 (40) A.7 物理课程内容分类 (43) A.8 生物课程内容分类 (48) A.9 信息技术课程内容分类 (49) A.10 音乐课程内容分类 (50) A.11 美术课程内容分类 (50)

CELTS-42基础教育教学资源元数据规范 1 概述 1.1 目的 本规范提供一个面向基础教育的教学资源数据模型。制定本规范旨在对希望在学校、企业、其他机构和个人的教学资源中使用元数据的用户提供一套资源编目准则,以使读者能快速、有效地在国家基础教育资源库及门户网站中检索到所需的教学资源,广泛地实现资源共享。 1.2 范围 本规范在《CELTS-3学习对象元数据:信息模型规范》(以下简称《学习对象元数据规范》)的基础上,结合我国基础教育的实际,定义了一组面向基础教育的教学资源元数据元素。 本规范依照教育部颁布的《义务教育课程设置实验方案》、《义务教育各学科课程标准(实验稿)》以及《学习对象元数据规范》,同时参考《都柏林核心集元数据(DCMES)》、《中国图书馆图书分类法》、美国GEM项目及澳大利亚EdNA项目的词汇分类方法,定义了一组用于元数据元素编目的受控词汇及相应的词汇表。 本规范通过与《学习对象元数据规范》的元素间映射来实现与CELTS的一致性。 本规范包括﹕ ?概述 ?规范性引用文件 ?术语定义与缩略语 ?元数据元素属性定义 ?元数据结构 ?限定词汇及编目词汇表 ?一致性 ?参考文献 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本应用规范的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本应用规范。然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本应用规范。 ?ISO 639:规定人类语言表示方法的国际标准。 ?ISO 646:规定ASCII字符集的国际标准。 ?ISO 8601:规定日期和时间表示方法的国际标准。 ?ISO 3166:规定国家名称表示方法的国际标准。

数据仓库与数据挖掘课后习题答案

数据仓库与数据挖掘 第一章课后习题 一:填空题 1)数据库中存储的都是数据,而数据仓库中的数据都是一些历史的、存档的、归纳的、计算的数据。 2)数据仓库中的数据分为四个级别:早起细节级、当前细节级、轻度综合级、高度综合级。3)数据源是数据仓库系统的基础,是整个系统的数据源泉,通常包括业务数据和历史数据。4)元数据是“关于数据的数据”。根据元数据用途的不同将数据仓库的元数据分为技术元数据和业务元数据两类。 5)数据处理通常分为两大类:联机事务处理和联机事务分析 6)Fayyad过程模型主要有数据准备,数据挖掘和结果分析三个主要部分组成。 7)如果从整体上看数据挖掘技术,可以将其分为统计分析类、知识发现类和其他类型的数据挖掘技术三大类。 8)那些与数据的一般行为或模型不一致的数据对象称做孤立点。 9)按照挖掘对象的不同,将Web数据挖掘分为三类:web内容挖掘、web结构挖掘和web 使用挖掘。 10)查询型工具、分析型工具盒挖掘型工具结合在一起构成了数据仓库系统的工具层,它们各自的侧重点不同,因此适用范围和针对的用户也不相同。 二:简答题 1)什么是数据仓库?数据仓库的特点主要有哪些? 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支

持管理决策。 主要特点:面向主题组织的、集成的、稳定的、随时间不断变化的、数据的集合性、支持决策作用 2)简述数据挖掘的技术定义。 从技术角度看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程。 3)什么是业务元数据? 业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够读懂数据仓库中的数据 4)简述数据挖掘与传统分析方法的区别。 本质区别是:数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和实用三个特征。 5)简述数据仓库4种体系结构的异同点及其适用性。 a.虚拟的数据仓库体系结构 b.单独的数据仓库体系结构 c.单独的数据集市体系结构 d.分布式数据仓库结构

新产业新业态新商业模式统计分类2018

新产业新业态新商业模式统计分类(2018) 一、分类目的 根据党中央、国务院关于加快发展新产业新业态新商业模式(简称“三新”)的要求,为科学界定“三新”活动范围,满足统计上监测“三新”经济活动规模、结构和质量等需要,制定本分类。 二、分类范围 本分类的范围包括:现代农林牧渔业、先进制造业、新型能源活动、节能环保活动、互联网与现代信息技术服务、现代技术服务与创新创业服务、现代生产性服务活动、新型生活性服务活动、现代综合管理活动。 三、分类原则 (一)以党中央、国务院关于加快发展“三新”的有关要求为指导,根据《中华人民共和国国民经济和社会发展第十三个五年规划纲要》《国务院关于印发〈中国制造2025〉的通知》(国发〔2015〕28号)、《国务院关于积极推进“互联网+”行动的指导意见》(国发〔2015〕40号)和《国务院关于大力推进大众创业万众创新若干政策措施的意见》(国发〔2015〕32号)等文件中有关“三新”活动的阐述,确定“三新”活动的范围和分类。 (二)参照《战略性新兴产业分类(2017)》(试行)、《高技术产业(制造业)分类(2017)》《高技术产业(服务业)分类(2018)》《国家科技服务业统计分类(2015)》等

相关统计分类标准,重点体现先进制造业、互联网+、创新创业、跨界综合管理等“三新”活动。 (三)以现行《国民经济行业分类》(GB/T 4754-2017)为基础,对其中符合“三新”特征的有关活动进行再分类。 (四)注重实际可操作性,立足现行统计制度和方法,充分考虑数据的可获得性,以保证统计部门能够采集到“三新”活动的数据。 四、结构和编码 本分类采用线分类法和分层次编码方法,将“三新”活动划分为三层,分别用阿拉伯数字编码表示。第一层为大类,用2位数字表示,共有9个大类;第二层为中类,用4位数字表示,共有63个中类;第三层为小类,用6位数字表示,共有353个小类。 本分类代码结构: ×××××× (数字)小类顺序码 小类代码 (数字)中类顺序码 中类代码 (数字)大类代码 五、有关说明 (一)本分类建立了与《国民经济行业分类》的对应关系,在国民经济行业类别中仅部分活动属于“三新”统计分类的,行业

元数据的标准

元数据的标准 1、数字图书馆资源组织框架 2. 元数据开发应用框架 元数据的基本意义Metadata(元数据)是“关于数据的数据”; 元数据为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具;元数据为分布的、由多种数字化资源有机构成的信息体系(如数字图书馆)提供整合的工具与纽带。 离开元数据的数字图书馆将是一盘散沙,将无法提供有效的检索和处理。 3. 元数据应用环境 3.1 Metadata的应用目的 (1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。 (3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。 (4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。 3.2 Metadata在不同领域的应用根据不同领域的数据特点和应用需要,90年代以来,许多Metadata格式在各个不同领域出现 例如: 网络资源:Dublin Core、IAFA Template、CDF、Web Collections 文献资料:MARC(with 856 Field),Dublic Core 人文科学:TEI Header 社会科学数据集:ICPSR SGML Codebook 博物馆与艺术作品:CIMI、CDWA、RLG REACH Element Set、VRA Core 政府信息:GILS 地理空间信息:FGDC/CSDGM 数字图像:MOA2 metadata、CDL metadata、Open Archives Format、VRA Core、NISO/CLIR/RLG Technical Metadata for Images 档案库与资源集合:EAD 技术报告:RFC 1807 连续图像:MPEG-7 3.3 Metadata格式的应用程度 不同领域的Metadata处于不同的标准化阶段: 在网络资源描述方面,Dublin Core经过多年国际性努力,已经成为一个广为接受和应用的事实标准;在政府信息方面,由于美国政府大力推动和有关法律、标准的实行,GILS已经

浅谈数据仓库中的元数据管理技术

浅谈数据仓库中的元数据管理技术 孙力君仇道霞方峻峰宋楠 山东省烟草公司信息中心 摘要:数据仓库是数据库的发展方向之一,对企业管理和决策支持起着重要的辅助作用。简要介绍了数据仓库和元数据的基本概念,重点阐述了元数据的概念、作用、CWM标准、来源,并就元数据具体应用进行了初步的研究和探讨。 关键词:数据仓库;元数据; 1. 引言 随着市场竞争的越来越激烈,烟草行业的信息化建设不断的深入发展,全行业形成了“以信息化带动烟草行业现代化建设”的基本共识,明确了“统一标准、统一平台、统一数据库、统一网络”,逐步实现系统集成、资源整合、信息共享的信息化建设总体要求,走过了“由基础性向应用性、由局部性向全局性、由分散性向集中性建设”的三个转变历程,初步形成了“数字烟草”的行业信息化建设格局,既对行业数据中心的建设提出了迫切的要求,也为行业数据中心建设奠定了坚实的基础。 随着数据库技术尤其是数据仓库技术的发展,人类能更容易获得自己需要的数据和信息,由于元数据是数据仓库中非常重要的组成部分,因此讨论和研究元数据在数据仓库中的作用和应用,具有非常重要的意义。 元数据管理是山东烟草数据中心建设的重要组成部分,元数据管理平台为用户提供高质量、准确、易于管理的数据,它贯穿数据中心构建、运行和维护的整

个生命周期。同时,在数据中心构建的整个过程中,数据源分析、ETL过程、数据库结构、数据模型、业务应用主题的组织和前端展示等环节,均需要通过相应的元数据的进行支撑。元数据管理的生命周期包括元数据获取和建立、元数据的存储、元数据浏览、元数据分析、元数据维护等部分。 通过元数据管理,形成整个系统信息数据资的准确视图,通过元数据的统一视图,缩短数据清理周期、提高数据质量以便能系统性地管理数据中心项目中来自各业务系统的海量数据,梳理业务元数据之间的关系,建立信息数据标准完善对这些数据的解释、定义,形成企业范围内一致、统一的数据定义,并可以对这些数据来源、运作情况、变迁等进行跟踪分析。完善数据中心的基础设施,通过精确把握经营数据来精确把握瞬息万变的市场竞争形式,使山东烟草在市场竞争中保持优势。 总的来说,元数据管理平台集成相关的元数据,形成企业的全局数据视图,提供企业级共享元数据的平台,是烟草业务系统的基础设施,对业务系统的发展、应用和数据质量的提升有着深远影响。 2.数据仓库概述 目前有关数据仓库的概念有多种,其中最经典的,引用最为广泛的定义是W.H.Inmon在《Building the Data Warehouse》一书中给出的,他指出:“数据仓库是面向主题的、集成的、随时间变化的、非易失的数据集合,用于支持管理层的决策过程”。[1] 之所以要引入数据仓库,是因为随着信息时代的到来,如何从大量已存在的数据中提取出自己所感兴趣的信息并进行分析和预测越来越成为企业管理者和决策者所关心的问题。为了更好的进行管理和决策,许多企业都选择了数据仓库,利用数据仓库可以对各种源数据进行抽取、清理、加工

数据元的规范与标准化框架

数据元的规范与标准化框架 数据表示和管理的基本概念 .数据元 数据元是称之为数据的一个广义概念的特殊成员。总而言之,数据是事实、想法或命令的一种表示数据被收集、组织、记录、处理和存放在一个可检索的表中。数据还必须适用于以人工或自动方式进行交换、解释及加工处理。 有许多结构用于数据组织与管理,如数据合成、实体、文件、对象类、对象、记录、关联、关系、行、段、主体域、表以及元组。它们与数据元并不具有相似性,但可以包括或通过一些数据库实现或逻辑建模来等同于数据元的支持。 字节和位也是数据的构件,尽管它们被用于电子媒体中数据元的注册,但并不等同于数据元。在数据库中,数据元可以作为信息组(符号组、域)或字符列来处理。在的数据模型中,它是一个属性(见图)。在某特定的相关环境中被视为不可分割时,一个数据元则被作为一个单独的数据单位在自然界中,它是数据的单位,表示关于对象类的单独事实。(如:一个被赋值“”和“”的字符码表示了“雇员”这一对象类的婚姻状态的属性)。在其使用范围内,它不可能被分解为更多且具有有用含义的基本信息组。因而,数据元可被定义为在用户论述领域内是与用户相关的。数据元是自然界中对象类特性以电子或书面形式的表示。 表示 一个特性可由能够被人们解释的某一符号集来体现。一个单独的特性可由几个交替的数据元甚至数据元组(通常称之为数据合成,有时也称之为数据元集或数据元链)来表示。这样,一个特性可以由数据元组构成的数据合成或一个单独的数据元表征。 常用法 所有数据从业者和理论家都会涉及数据元的概念。无论用什么方法或技术,数据元都是整个软件开发生命周期()的公用纽带。在的早期阶段,它们曾被视为实体(或对象类)的属性在的后期,具体的数据值被赋予它们的实例作为符号组或字符列。在的任一阶段,对于软件的生产者和用户来说,数据元是可识别的数据元是数据共享和共同持有的最小单元。一些数据元得以共享的信息系统成分有)企业信息模型)数据模型)数据流程图)数据库设计(模式、文件、表格))接口规范)计算机程序 1.2.1数据模型中的数据元 在数据建模出现之前,“数据元”这个术语已被普遍使用。用于表示指导企业商务信息的数据单元传统上被称之为数据元。数据建模的演进就是为捕捉这些数据表示的语义提供一种有效的方法。图描述了用于中的数据元结构和术语与一些更为传统数据建模术语的关联在一个

数据仓库中元数据的管理

数据仓库中元数据的管理M etadata M anagem en t i n a Data W arehouse 同济大学计算机科学与工程系(上海200092) 史金红 吴永明 【摘要】 介绍了数据仓库中四种基本类型的元数据,说明了不同类型元数据的收集和维护方法,并着重对分布式元数据的集成和管理进行了详细的阐述。 关键词:数据仓库,数据商场,决策支持,元数据 【Abstract】 T h is p ap er in troduces fou r typ es of m etadata and the m ethods of co llecting and m ain tain ing them.It focu ses on the m etadata m anagem en t and in tegrity. Key words: da ta warehouse,da ta mart, dec ision support,m etada ta 1 引言 随着社会的发展和计算机技术的进步,人们已不满足于用计算机只作简单的数据处理和事务处理。进一步用现有的数据进行分析和推理,从而为决策提供依据的需求导致了决策支持系统(D SS)的出现。90年代以来计算机技术、网络技术和数据库技术的迅速发展为D SS提供了必要的技术环境, OL T P和办公自动化普遍应用积累的大量数据为D SS提供了必要的数据基础,日趋激烈的市场竞争促进了各级管理和决策人员对D SS的实际需求,因此自从1991年W.H.Inm on提出数据仓库的概念和1993年E.F.Codd提出OLA P概念以来,已有许多商品化的数据仓库管理系统和联机分析处理工具软件面市。以上诸因素的共同作用促成许多公司、机构纷纷为提高自己的竞争能力建立数据仓库系统以进行决策支持。 元数据是成功的数据仓库的重要组成部分,它可以帮助数据仓库项目小组明确而全面地理解潜在数据源的物理布局以及所有数据元的业务定义,帮助数据仓库用户有效地使用仓库中的信息,帮助数据库管理员了解某些表的变化将对数据仓库产生怎样的影响以及不同商业过程对应的应用等等。项目小组在开发过程中应当识别元数据并将它收入到元数据商店中,实施适当的过程捕作企业数据结构和应用的变化,从而修改相应的元数据,并向用户提供适当的工具访问元数据。 2 元数据的基本类型 元数据按照其用户可以分为技术元数据和商业元数据。技术元数据提供给数据仓库的技术人员,数据仓库技术人员在仓库的开发和维护中使用这类元数据。商业元数据是商业用户在仓库中寻找他们所需商业信息的一个辅助。但是,技术人员可能也需要访问几种类型的商业元数据,如和商业用户讨论信息需求和建立企业的数据模型。同样,商业用户也需要尝试高水平的技术元数据。 元数据按其内容可以分为四个基本类型: 1)关于数据仓库潜在数据来源的信息,包括现有的业务系统、可得到的外部数据和目前手工维护的信息。例如,一个组织可以从中识别数据来源的潜在仓库数据源有:几个现有的应用程序,由财务部门保存的基于PC机的电子报表,从某一卖主处购买的销售数据,目前由顾客服务部门在纸上保存的顾客联系记录。 2)关于数据模型的信息,包括业务实体、关系、企业规则和企业数据模型。 3)关于业务数据与仓库数据结构间的映射信息。只要那些来源中的一个数据元与仓库建立了映射关系,就应该记录下这些数据元间的逻辑联系以及发生的任何变换或变动。 4)关于数据仓库中信息的使用情况。了解这类信息对更好地调整仓库性能、更多地利用现有查询以及理解仓库中的信息怎样用于解决企业问题是很重要的。 3 元数据的收集和维护 在适当的时间收集适当的元数据是成功实施元数据驱动的数据仓库的基础。为保证较高的准确

国家统计局-行业分类标准47347

[1]农、林、牧、渔业 [01]农业 [02]林业 [03]畜牧业 [04]渔业 [05]农、林、牧、渔服务业 [2]采矿业 [06]煤炭开采和洗选业 [07]石油和天然气开采业 [08]黑色金属矿采选业 [09]有色金属矿采选业 [10]非金属矿采选业 [11]其他采矿业 [3]制造业 [13]农副食品加工业 [14]食品制造业 [15]饮料制造业 [16]烟草制品业 [17]纺织业 [18]纺织服装、鞋、帽制造业 [19]皮革、毛皮、羽毛(绒)及其制品业 [20]木材加工及木、竹、藤、棕、草制品业[21]家具制造业 [22]造纸及纸制品业 [23]印刷业和记录媒介的复 制 [24]文教体育用品制造业 [25]石油加工、炼焦及核燃 料加工业 [26]化学原料及化学制品制 造业 [27]医药制造业 [28]化学纤维制造业 [29]橡胶制品业 [30]塑料制品业 [31]非金属矿物制品业 [32]黑色金属冶炼及压延加 工业 [33]有色金属冶炼及压延加 工业 [34]金属制品业 [35]通用设备制造业 [36]专用设备制造业 [37]交通运输设备制造业 [39]电气机械及器材制造业 [40]通信设备、计算机及其 他电子设备制造业 [41]仪器仪表及文化、办公 用机械制造业 [42]工艺品及其他制造业 [43]废弃资源和废旧材料回 收加工业 [4]电力、煤气及水的生产和 供应业 [44]电力、热力的生产和供 应业 [45]煤气生产和供应业 [46]水的生产和供应业 [5]建筑业 [47]房屋和土木工程建筑业 [48]建筑安装业 [49]建筑装饰业 [50]其他建筑业 [6]交通运输、仓储及邮政业 [51]铁路运输业 [52]道路运输业 [53]城市公共交通业 [54]水上运输业 [55]航空运输业 [56]管道运输业 [57]装卸搬运和其他运输服 务业 [58]仓储业 [59]邮政业 [7]信息传输、计算机服务和 软件业 [60]电信和其他信息传输服 务业 [61]计算机服务业 [62]软件业 [8]批发和零售业 [63]批发业 [65]零售业 [9]住宿和餐饮业 [66]住宿业 [67]餐饮业 [10]金融业 [68]银行业 [69]证券业 [70]保险业 [71]其他金融活动 [11]房地产业 [72]房地产业 [12]租赁和商务服务业 [73]租赁业 [74]商务服务业 [13]科学研究、技术服务和 地质勘查业 [75]研究与试验发展 [76]专业技术服务业 [77]科技交流和推广服务业 [78]地质勘查业 [14]水利、环境和公共设施 管理业 [79]水利管理业 [80]环境管理业 [81]公共设施管理业 [15]居民服务和其他服务业 [82]居民服务业 [83]其他服务业 [16]教育 [84]教育 [17]卫生、社会保障和社会 福利业 [85]卫生 [86]社会保障业

电子文件元数据规范

电子文件元数据规范 1 范围 本规范适用于九省区各级国家档案馆、各级党政机关、社会团体、企事业单位对电子文件进行以保证凭证性为目的的管理活动。其他社会组织可参照执行 在电子文件管理过程中使用元数据可实现以下目的: ——确保并证明归档电子文件的真实性、完整性与有效性,从而保证其凭证价值; ——有利于归档电子文件的保护,实现长期保存; ——在异构的信息系统中对归档电子文件进行规范、有效的管理,保证归档电子文件的可捕获、可收集、查长期利用; ——对归档电子文件及馆(室)藏档案数字化资源进行集成管理,实现有效、方便地查询、检索与利用。 2 规范性引用文件 下列文件中的条款通过本规范的引用而成为本规范的条款。凡是注明日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范,然而,鼓励根据本规范达成协议的各方研究是否可使用这些文件的最新版本。 GB 2312-1980 信息交换用汉字编码字符集基本集 GB/T 3760-1995 文献叙词标引规则 GB/T 3792.1-1983 文献著录总则 GB/T 7156-2003 文献保密等级代码 GB/T 7408-2005 数据元和交换格式信息交换日期和时间表示法 GB/T 9704-1999 国家行政机关公文格式 GB/T 11714-1997 全国组织机构代码编制规则 GB/T 11821-2002 照片档案管理规范 GB/T 13959-1992 文件格式与代码编制方法 GB/T 13967-1992 全宗单 GB/T 15418-1994 档案分类标引规则 GB 18030-2000 信息技术信息交换用汉字编码字符集基本集的扩充 GB/T 18894-2002 电子文件归档与管理规范 DA/T 1-2000 档案工作基本术语 DA/T 12-1994 全宗卷规范 DA/T 13-1994 档号编制规则 DA/T 18-1999 档案著录规则 DA/T 19-1999 档案主题标引规则 DA/T 22-2000 归档文件整理规则 DA/T 31-2005 纸质档案数字化技术规范 《中华人民共和国电子签名法》 中办发[1996]14号中国共产党机关公文处理条例 国发﹝2000﹞23号关于发布《国家行政机关公文处理办法》的通知 国档发[1987]4号关于颁发《编制全国档案馆名称代码实施细则》的通知 国家档案局第6号令《电子公文归档管理暂行办法》,2003年7月28日 国家档案局第8号令《机关文件材料归档范围和文书档案保管期限规定》,2006年12月19日ISO 15489 Information and documentation—Records management ISO 23081-1 Information and documentation – Records Management Processes – Metadata for Records—Part 1: Principles

元数据管理方案

元数据管理方案

元数据管理方案 1.1元数据抽取 为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取。经过元数据自动抽取,用户能够方便、快捷地获得大量的元数据信息。 1.1.1抽取的对象 元数据抽取主要针正确对象有以下几种: 已有目录:已建业务应用系统中现有的目录资源。 数据库:各种数据库资源,包括关系型数据库、XML数据库等。 格式化电子文件:电子文件,例如Word、PDF、XLS等文件。 1.1.2元数据抽取的流程 元数据抽取的流程有4个主要步骤,分别为: 数据源信息获取:解决要从哪个数据源获得元数据的问题。 内容/结构分析:解决要从数据源中获得哪些元数据的问题。 元数据提取:解决如何从数据源中获取元数据的问题。 存储入库:解决元数据存储的问题。

1.1.3电子文档的元数据抽取 对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理。 针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程: ●整理归档 对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统一整理,根据公开共享的前提进行集中,这种集中能够是物理上集中的,也能够是逻辑上集中的。但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目。各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的。在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可。 ●根据安全级别,建立相应的访问机制 由于受到安全级别的限制,因此对于需要共享的数据要进行安全方面的限制,限制的手段能够有:用户名/密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失。 ●编目处理

数据仓库元数据管理

1.1.1 第一章元数据概论 企业的计算机系统每年会产生很多数据,很多企业面临着这样的困境,难以有效的管理大量的、繁杂的、不一致的数据,并方便地访问、利用这些数据进行辅助决策。 建立数据仓库提供一个方法,把数据转化为有用的、可信赖的信息,支持商业决策。建立数据仓库一个重要的工作是元数据管理。元数据(Metadata)就是数据的数据,用于建立、管理、维护和使用数据仓库。。元数据管理是企业级数据仓库中的关键组件,贯穿于建立数据仓库的整个过程。 元数据使得用户可以掌握数据的历史情况,如数据从哪里来?流通时间有多长?更新频率是多大?数据元素的含义是什么?对它已经进行了哪些计算、转换和筛选等等。在需求不确定情况下,在瞬间万变的商业环境下,元数据可以更好的支持需求的变化,降低项目风险。 通常把元数据分为技术元数据(Technical Metadata)和业务元数据(Business Metadata)。技术元数据是描述关于数据仓库技术细节的数据,这些元数据应用于开发、管理和维护数据仓库;业务元数据从商业和业务的角度描述数据仓库的数据,提供了良好的语义层定义,业务元数据使业务人员能够更好的理解数据仓库分析出来的数据。 元数据贯彻于建立数据仓库的整个过程,不只是ETL过程需要元数据的支持。 图1 元数据的应用 在使用元数据的同时,随着数据仓库市场的发展,业界出现许多数据仓库管理和分析的工具,各种工具使用不同的元数据标准来表示和处理,不同系统之间的迁移、数据交换变得困难。于是,我们希望用一种单一的元数据标准,使得各种组织的元数据具有单一的元模型(MetaModel),因此,需要建立一种标准使得不同的数据仓库和商业智能系统之间可以相互交换元数据。 1.1.2 第二章元数据标准 1.1. 2.1 一、元数据标准CWM OMG于2001年颁布元数据标准CWM 1.0(Common Warehouse Metamodel Version 1.0)。CWM定义一个描述数据源、数据目的、转换、分析的元数据框架,以及定义建立和管理数据仓库的过程和操作,提供使用信息的继承。 目前宣布支持CWM的厂商包括:IBM、Oracle、Hyperion、Dimension EDI、Genesis IONA、HP、NCR和Unisys等。 CWM基于3个工业标准: UML - Unified Modeling Language,OMG建模标准; MOF - Meta Object Facility,OMG建立元模型和模型库的标准,提供在异构环境下的数据交换的接口; XMI - XML Metadata Interchange,OMG元数据交换标准。 UML在CWM中得到充分的应用,担任3个不同的角色: 1),UML用来做为与MOF对应的meta-metamodel。UML相当于MOF Model,,UML Notation和OCL(Object Constraint Language),被用来做为建模语言、图形符号、约束语言,

体育产业统计分类

体育产业统计分类() 一、分类目的 为加快推动体育产业发展,科学界定体育产业的统计范围,建立体育产业统计调查制度,依据《国务院关于加快发展体育产业促进体育消费的若干意见》(国发〔〕号)、《国务院关于印发全民健身计划(年)的通知》(国发〔〕号)和《国务院办公厅关于加快发展健身休闲产业的指导意见》(国办发〔〕号),以《国民经济行业分类》()为基础,制定本分类。 二、概念界定和分类范围 体育产业是指为社会提供各种体育产品(货物和服务)和体育相关产品的生产活动的集合。分类范围包括:体育管理活动,体育竞赛表演活动,体育健身休闲活动,体育场地和设施管理,体育经纪与代理、广告与会展、表演与设计服务,体育教育与培训,体育传媒与信息服务,其他体育服务,体育用品及相关产品制造,体育用品及相关产品销售、出租与贸易代理,体育场地设施建设等个大类。 三、编制原则 (一)以国务院有关文件为指导。本分类主要依据《国务院关于加快发展体育产业促进体育消费的若干意见》《国务院关于印发全民健身计划(年)的通知》和《国务院办公厅关于加

快发展健身休闲产业的指导意见》提出的重点任务,确定体育产业的基本范围。 (二)以《国民经济行业分类》为基础。本分类以《国民经济行业分类》()为基础,是对国民经济行业分类中符合体育产业特征的有关活动的再分类。 (三)突出我国体育活动的特点。本分类突出了我国体育活动的特点和实际发展现状,充分考虑了体育产业发展中的新业态和新模式。 四、结构和编码 本分类采用线分类法和分层次编码方法,将体育产业划分为三层,分别用阿拉伯数字编码表示。第一层为大类,用位数字编码表示,共有个大类;第二层为中类,用位数字编码表示,前两位为大类代码,共有个中类;第三层为小类,用位数字编码表示,前三位为中类代码,共有个小类。 代码结构: ×××× (数字)小类顺序码 小类代码 (数字)中类顺序码 中类代码 (数字)大类代码 五、有关说明 3 / 11

林业科学数据元数据标准

林业科学数据元数据标准(V3.10版) 1 主题内容与适应范围 本标准规定了用来描述林业科学数据集及提供信息服务所需要的信息,包括林业科学数据共享元数据内容框架和林业科学数据共享元数据标准。提供了有关林业科学数据集的标识、内容、分发、数据质量、数据表现、参照系和元数据参考信息等内容。 本标准适用于林业科学数据集元数据整理、建库、汇编、公布及共享服务。 本标准的元数据分为两级,即核心元数据和详细元数据。核心元数据规定了描述数据集最关键的信息内容。在核心元数据的基础上,考虑林业科学研究的特点,建立满足林业科学数据共享建设的详细元数据。用户能够在核心元数据的基础上,依照具体需求和数据的实际情况选用、扩充详细元数据内容,建立相应级不的元数据库。 2 规范性引用文件

下列规范性引用文件通过本部分的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。然而,鼓舞依照本标准达成协议的各方,研究是否可使用这些文件的最新版本。然而不注日期的引用文件,其最新版本适用于本标准。ISO和IEC成员维护目前有效国际标准的注册。 科学数据共享工程技术标准—科学数据共享元数据标准内容1.4 SDS/T 2112—2004 科学数据共享工程技术标准 GB/T 1.1—2000 标准化工作导则 GB/T 7408-1994 数据元和交换格式信息交换日期和时刻表示方法 GB/T 4880.2-2000 语种名称代码第2部分:3字母代码 GB/T 2260-2002 中华人民共和国行政区划代码 GB/T 7156-1987 文献保密等级代码 SDS/T 2111—2004 元数据标准化原则与方法 SDS/T 2122—2004 科学数据共享工程数据分类编码 ISO 19115 地理信息—元数据(Geographic

《元数据的作用 [元数据的构成方式]》

《元数据的作用[元数据的构成方式]》 (徐枫宦茂盛)通过元数据的描述,能够使信息资源的使用者了解数据的内容、特征、作用、获取方式等信息。元数据是关于数据的数据,在建立信息资源目录体系的过程中,元数据主要是对信息资源从外部特征进行而非从内部结构进行描述。通俗地讲,元数据就是信息资源的标签或卡片,通过元数据的描述,可以使信息资源的使用者能够了解数据的内容、特征、作用、获取方式等信息,能够对信息资源是否满足特定的应用需求做出适当的评价,并根据评价的结果决定是否采取进一步的措施来获取该信息资源。 元数据是信息资源目录体系建立的基础,构建一个信息资源目录体系首要和基础性的工作就是建立描述各个信息资源的元数据库,元数据库中存储的是描述各种来源、各种类型的信息资源的描述信息。无论用户以何种方式查询信息资源目录,包括以分类目录的形式进行查询、或者以多关键词的形式进行查询,其本质都是对后台元数据库的检索,只是从表现层提供了不同形式的人机查询接口。根据所描述的信息资源对象的不同,可以建立不同的元数据库,分别对各类信息资源进行描述。 元数据的组成 为能够对信息资源进行准确和高效的描述,元数据本身具有自身的逻辑结构。一般来说,元数据本身是层次化、树状结构的。处于树状结构最底端的叶子节点称之为元数据元素,包含了元数据元素的节点称之为元数据实体,当然元数据实体也可以只包含元数据实体。根

据实际需求,元数据实体或者元数据元素可以多次出现。例如,信息资源可以有不同的分类,可以按照信息资源的来源进行分类,也可以按照信息资源的不同应用主题进行分类,因此,“信息资源分类”元数据实体就可以出现多次。 元数据一般分三个方面对信息资源进行描述。 一是对信息资源基本内容的描述。包括信息资源的标题、摘要、关键词等基本信息。标题是信息资源的名称,通过标题使用者能够初步掌握信息资源的基本范围。其次,使用者可以通过摘要,了解信息资源的主要内容、用途等各种信息。一般情况下,用户主要通过摘要作为信息资源适用性评价的主要依据。所以,在信息资源元数据的著录过程中,摘要的填写一般都由专业人员完成,只有专业人员才能够对信息资源的内容有准确的把握和深入的理解,能够提供有关信息资源内容的更加权威的解释。根据信息资源对象的不同,描述信息资源基本内容的元数据实体和元数据元素还可以进行有选择的增加。例如,描述空间信息资源时,可以增加空间参照系、图示表达等元数据实体,描述科学数据资源时需要增加数据质量等元数据实体。 二是对信息资源的获取方式进行描述。包括信息资源的分发者信息、信息资源的在线获取地址信息等。通过提供分发者联系信息,使用者可以直接联系信息资源的分发部门,这对于不能直接在网络上进行数据交换的信息资源获取非常有效。其次,使用者还可以通过信息资源的在线地址来下载、查询、浏览信息资源。使用者甚至可以提供专门的电子订单处理系统,并将入口信息加入到元数据内容中,方便

相关主题
文本预览
相关文档 最新文档