大数据时代的国家数字图书馆建设-中国国家图书馆

  • 格式:pdf
  • 大小:2.95 MB
  • 文档页数:32

下载文档原格式

  / 32
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

大数据时代的国家数字图书馆建设

国家图书馆

魏大威

四、一、

三、

二、

全面提升大数据环境下的国家数字图书馆服务能力

以大数据理念实现国家数字图书馆的资源整合国家数字图书馆跨入大数据时代大数据时代的服务价值重塑

一、大数据时代的服务价值重塑

信息总量爆炸性增长导致信息形态发生变化

由大数据、云计算、物联网等关键技术引领的信息技术变革,影响到了社会生活的各个领域

利用大数据投放广告精准营销初期投放红酒广告财经频道貌似红酒目标客户高端人士的聚集地电商买家动态肖像系统数据分析常访问军事类博客的网民对红酒更感兴趣改变策略选取该网站博客频道中的军事类博客页面投放红酒广告一个投放周期结束后,有效转化率高达18%,而行业的平均水平却低于5%

案例

二True Car 哪

便

TrueCar之所以受到消费者的喜

爱,因为只是做了一件事情:

收集全美汽车销售商的数据,利

用大数据分析将车价透明化并发

布在自己的信息平台

将价格从低到高分为4个区间:罕见低价超值价格不错的价格超过市场均价的价格

第7页

二、国家数字图书馆跨入大数据时代

图书馆的大数据

是什么?一是多种类型的海量资源及庞大用户数据;

二是图书馆的生产数据和业务数据在根据数字资源生命周期在各业务系统间高速流转的数据体系;

三是通过图书馆海量数据满足用户的知识需求和个性化服务需求的价值体现

日益增大的数据量海量资源库图书馆传统的纸质文献和多样化数字资源共同构成了海量资源库,成为宝贵而丰富的知识资产。737.9TB

45.7TB

0%数字资源总量874.5TB

2013年底

网络信息采集量自建数字资源量外购中外文数据库共计273个

文津搜索元数据达2.9亿条

海量资源库图书馆传统的纸质文献和多样化数字资源共同构成了海量资源库,成为宝贵而丰富的知识资产。国家图书馆资源变化情况表年份数字资源总量(TB )馆藏特色资源数字化量(TB )网络资源采集量(TB )外购数据库量(个)外购中文数据库(个)外购外文数据库(个)2009年327.8239.116.6818886102

2010年480388182191051142011年561.345819.22221061162012年813.5694.930.7254121133︵

日益增大的数据量

服务终端

前端终端

︵一︶日益增大的数据量

服务终端

国家数字图书馆网站2013年总点击量达到10.36亿次 文津搜索系统月均页面访问次数为480万余次 读者门户对象数据月均访问210万余页 手机门户月均访问140万余次 Aleph 系统日均产生日志数据约20GB 文津搜索系统日均产生日志数据大于300GB

︵一︶日益增大的数据量

国家数字图书馆数据类型分布表

资源数据元数据、对象数据、书目数据、规范数据、馆藏数据、单册数据、关联数据用户数据用户个人信息数据、在服务中产生的不同维度的用户行为数据

业务数据各业务系统运转的业务数据,如:采访数据、缴送数据、征集数据、咨询数据等

管理数据

图书馆运转和服务中产生的各类管理数据,如项目建设数据、合同数据、财务数据、人事数据

︵二︶丰富多样的数据类型

资源类型包括电子图书、电子期刊、电子报纸、数据库、音视频资源、网络资源等。

资源来源既包括传统文献的数字化,也包括各种类型的原生数字资源,还包括其它异地存储为我所用的虚拟馆藏及大量网络资源

︵三︶完善的数据体系和高速的数据流

资源采集、组织、加工、发布、保存各系统构成完善的数据体系。 各系统之间存在着功能关联、功能互补、功能支持、数据交换、数据共享等关系。

数字资源服务软件平台建设

统一用户管理系统

数字资源存储与软硬件平台建设

全国信息资源元数据仓储

第15页

三、以大数据理念实现国家数字图书馆的资源整合

︵一︶资源整合原则

统筹规划、分步实施

资源整合原则

1

在国家数字图书馆资源建设与服务总体方针指导下,本着统一规划、统一布局和统一管理原则,结合大数据特点和资源现状,分阶段、有计划地实施。

︵一︶资源整合原则

统筹规划、分步实施资源整合原则

1以用户需求为导向,采取多种方式进行多层次整合,使整合后的资源更好满足用户的个性化需求

面向用户、需求牵引

2

︵一︶资源整合原则

统筹规划、分步实施资源整合原则

1对特色资源进行有序组织,形成一个完整的知识网络,使多样性的馆藏文献资源得到合理开发借鉴国内外先进的整合技术和经验,增强前瞻性意识,保证馆藏资源整合工作的可持续性和可扩展性。

面向用户、需求牵引2突出特色、博采众长

3

︵二︶资源整合思路

1. 建立超大型元数据仓储,构建资源利用新格局

•图书馆所处的信息环境迅速出现“E”化•大量的用户信息和行为数据、丰富的网络资源与数字化文献、知识数据库一起,构成了图书馆独有而珍贵的数字资产。•通过对各类资源元数据汇集和统一管理,盘活图书馆长期建设积累的数据和知识资产,从而形成科学、高效的统一数字资源服务体系。