大数据时代的国家数字图书馆建设-中国国家图书馆
- 格式:pdf
- 大小:2.95 MB
- 文档页数:32
图书馆的数字化转型与创新随着科技的不断发展和应用,图书馆也面临着数字化转型与创新的挑战与机遇。
数字化转型是指将传统图书馆通过应用数字技术与网络信息技术进行改造与升级,以更好地满足用户需求和提供更高效的服务。
本文将从数字化资源建设、数字阅读服务、智能化信息管理等方面探讨图书馆的数字化转型与创新。
一、数字化资源建设数字化资源建设是图书馆数字化转型的基础工作,它包括对纸质图书、期刊、报纸等纸质文献进行数字化扫描和存储,建立数字文献库,并进行资源的数字化加工与管理。
通过数字化资源建设,图书馆可以实现传统文献的数字化存储与传播,大大提高了图书馆的文献检索效率和资源利用率。
同时,数字化资源建设也为用户提供了更多元化的资源选择,满足了用户对多样化信息需求的要求。
二、数字阅读服务数字化转型使得图书馆的阅读服务面临了全新的机遇与挑战。
数字阅读服务主要包括数字图书馆、电子图书阅览与借阅、在线阅读以及数字资源的远程访问等。
数字图书馆通过提供数字化图书馆藏资源的检索、浏览和下载服务,使用户可以方便地利用网络随时随地访问图书馆的馆藏资源。
电子图书阅览与借阅则通过数字阅读设备或移动终端提供了更加方便的图书阅读体验,用户可以在线借阅和阅读图书,解决了实体图书和馆藏容量的限制,大大提升了资源利用率。
在线阅读通过提供数字化期刊、报纸等在线阅读服务,使用户可以随时随地阅读喜欢的刊物。
数字资源的远程访问则为用户提供了无时空限制的远程访问服务,减少了用户前往图书馆的成本,提高了服务效率。
三、智能化信息管理数字化转型为图书馆的信息管理提供了新的方式与工具,智能化信息管理成为图书馆数字化创新的重要方向。
智能化信息管理主要包括智能化检索服务、个性化推荐服务和知识图谱应用等。
智能化检索服务利用自然语言处理、机器学习等技术,通过对用户检索查询的分析,提供准确、快捷的检索服务,满足用户的信息需求。
个性化推荐服务则通过对用户的阅读行为与兴趣偏好进行分析,为用户推荐符合其兴趣的图书馆资源,提高了用户体验和访问粘性。
2018年第9期(总第172期)7摘要:本文对国家图书馆文献提供系统中的用户数据进行梳理,从用户的学历、职称、地区分布、行为习惯等维度统计分析,绘制出国家图书馆文献提供服务的用户画像,并基于此提出发展策略建议,以期为数字时代文献提供服务向个性化、精准化、智能化方向发展提供科学依据。
关键词:国家图书馆;文献提供;用户画像中图分类号:G252DOI :10.3772/j.issn.1673-2286.2018.09.005赵星(国家图书馆,北京 100081)用户统计分析*图书馆诞生之日起,就肩负着知识传播的重要使命。
馆际互借和文献传递服务作为信息资源共享的基本形式,是图书馆传播知识的有效途径,是图书馆核心价值的重要体现。
国家图书馆开展馆际互借与文献传递服务的历史悠久,早在20世纪50年代,国家图书馆就与国内200余家图书馆建立了馆际互借关系。
1997年,国家图书馆文献提供中心正式成立。
2009年,文献提供系统上线。
截至2017年12月31日,在该系统注册的用户数量已达10.12万人,基本涵盖各层级读者,既包括科研、教育机构,企事业单位等机构用户,也包括到馆和远程访问的个人用户。
如何对这些用户数据进行深入挖掘和利用,指导文献提供服务向智慧型知识服务发展,已经成为图书馆员亟待研究解决的问题。
大数据时代的到来,使得用户画像方法在互联网行业的产品运营和用户体验设计领域得到广泛应用。
用户画像(persona )的概念最早由交互设计之父Cooper [1]提出,“Personas are a concrete representation of target users ”,是指真实用户的虚拟代表,是建立在一系列属性数据之上的目标用户模型。
随着互联网的发展,用户画像逐步拓展为通过对用户的人口学特征、行为习惯等多维度信息进行综合分析挖掘,抽象出一个标签化的用户模型。
本文在统计分析国家图书馆文献提供系统中用户数据的基础上,绘制出国家图书馆文献提供服务用户画像,以期为数字时代文献提供服务向个性化、精准化、智能化方向发展提供科学依据。
中国国家数字图书馆工程总体设计魏大威;孙一钢【摘要】文章分析了我国数字图书馆建设的基本情况,在总结国家数字图书馆工程建设特点的基础上,以服务、资源、标准、技术四个方面作为总体设计中的出发点,详细论述了在国家数字图书馆工程中基础支撑环境、标准规范体系、应用支撑平台、业务应用系统、网管安全保障、数字资源建设的总体设计内容,最后笔者根据工作的实践提出了对于总体设计工作中所遇到问题的思考.该文为2008年第八期<国家数字图书馆工程>专刊的文章之一.【期刊名称】《数字图书馆论坛》【年(卷),期】2008(000)008【总页数】9页(P23-31)【关键词】国家图书馆;国家数字图书馆工程;数字图书馆;总体设计;服务;数字资源【作者】魏大威;孙一钢【作者单位】国家图书馆,北京,100081;国家图书馆,北京,100081【正文语种】中文【中图分类】G25进入21世纪后,信息技术的快速发展为数字图书馆的实践提供了机会,国内开始出现数字图书馆建设热潮,并逐渐升温,一些全国性、地区性的数字图书馆项目纷纷进行规划或立项建设,许多图书馆作为独立的个体也进行了数字图书馆建设的有益探索,而商业机构的介入则进一步推动了我国数字图书馆事业的发展。
中国高等教育数字图书馆(CADLIS)是由“中国高等教育文献保障系统”(CALIS)二期工程和基于“中美百万册图书计划”(CADAL)的文献数字化工程两个专题项目构成的行业性数字图书馆系统。
CADLIS包括数字资源体系、软硬件平台和运行服务体系。
数字资源体系建设除了继续扩大原有的联合目录、学位论文、期刊篇名数据库外,加大了全文文献库的建设。
国家科学数字图书馆(CSDL)是中国科学院知识创新工程的重大项目,其建设目标是为中国科学院全院科研人员提供远程访问的信息资源和服务体系。
CSDL提出了“资源到所、服务到人”的服务理念,CSDL的随易通服务,使用户在任何地点上网,均可查询用户所在单位购买开通的数据库,并且为用户提供权威、可靠的目录导航。
数字图书馆建设标准
数字图书馆作为信息化时代的重要组成部分,对于促进知识传播、文化交流和学术研究起着重要的作用。
为了建设一个高效、便捷、可持续发展的数字图书馆,我们需要遵循一定的建设标准。
首先,数字图书馆的建设需要具备高度的信息化技术支持。
这包括强大的服务器设备、高速的网络连接、稳定的数据库系统等基础设施的支持。
同时,数字图书馆还需要具备先进的信息检索与管理系统,以便用户能够方便快捷地检索到所需的文献资料。
其次,数字图书馆的建设需要注重文献资源的丰富性和多样性。
这包括数字化的图书、期刊、论文、报纸、音像资料等多种形式的文献资源,覆盖各个学科领域和丰富的内容类型。
此外,数字图书馆还应该积极开展文献资源的数字化工作,以便更好地保存和传承文化遗产。
另外,数字图书馆的建设还需要注重用户体验和服务质量。
这包括用户界面的友好设计、检索功能的智能化提升、个性化推荐服务的开展等方面。
数字图书馆还需要建立完善的文献资源共享机制,促进不同数字图书馆之间的资源共享与合作。
最后,数字图书馆的建设需要注重安全与保护。
这包括文献资源的合法获取与使用、用户隐私信息的保护、数据备份与灾难恢复等方面。
数字图书馆还需要建立健全的管理制度和规章,确保数字图书馆的正常运行和可持续发展。
总的来说,数字图书馆的建设标准需要综合考虑信息技术、文献资源、用户服务和安全保护等多方面因素,以期打造一个高效、便捷、可持续发展的数字化知识资源平台,为广大用户提供更好的学术支持和文化服务。
希望各个相关单位和机构能够共同努力,为数字图书馆的建设贡献自己的力量。
图书馆的数字化资源共建与共享案例近年来,随着数字技术的快速发展,图书馆的功能也发生了巨大的变化。
以往仅仅是传统的藏书馆,如今的图书馆已经成为数字化资源共建与共享的重要平台,为读者提供更丰富、更便捷的学术资源。
本文将以几个典型案例为例,探讨数字化资源在图书馆中的共建与共享。
一、国家图书馆数字化资源共享工程作为我国最重要的图书馆之一,国家图书馆一直致力于数字化资源共建与分享。
该馆将国内各大图书馆的数字化资源进行整合,建立了一个巨大的数字化图书馆平台,为读者提供了全球最大的中文电子数字资源库。
在这个平台上,读者可以免费阅读到大量的电子图书、期刊、报纸等各类学术资源,极大地满足了广大读者的阅读需求。
二、多校图书馆联合建设数字资源平台为了促进高校间的资源共享,许多高校图书馆积极响应数字化资源共建的理念,开展多校图书馆联合建设数字资源平台的实践。
这些平台实现了不同学校图书馆的数字化馆藏资源的整合和共享,提供了一站式检索和访问服务。
通过这种方式,读者可以从自己学校图书馆所没有的资源中获取信息,丰富了学术研究的内容。
三、图书馆与学术机构的数字资源合作案例许多图书馆与学术机构之间建立了紧密的合作关系,共同打造数字资源库。
比如,某大学图书馆与该校计算机科学与技术学院合作,共同建设了一套用于数字化资源管理与存储的系统。
通过这个系统,学院的教师和学生可以方便地上传、管理和访问学术资源,提高了资源利用的效率。
四、公共图书馆数字资源共享服务除了高校图书馆和国家图书馆以外,一些公共图书馆也积极参与到数字化资源共享的行动中。
例如,某市图书馆通过与数字出版机构的合作,在图书馆的官方网站上提供了大量的数字图书和期刊供读者免费在线阅读。
这种做法不仅丰富了馆藏资源,同时也提高了读者的阅读体验。
总结起来,图书馆的数字化资源共建与共享在各个领域都有着成功的案例。
国家图书馆数字化资源共享工程、多校图书馆联合建设数字资源平台、图书馆与学术机构的数字资源合作以及公共图书馆的数字资源共享服务等都为读者提供了更加全面、便捷的数字化学术资源。
大数据时代的国家数字图书馆建设国家图书馆魏大威四、一、三、二、全面提升大数据环境下的国家数字图书馆服务能力以大数据理念实现国家数字图书馆的资源整合国家数字图书馆跨入大数据时代大数据时代的服务价值重塑一、大数据时代的服务价值重塑信息总量爆炸性增长导致信息形态发生变化由大数据、云计算、物联网等关键技术引领的信息技术变革,影响到了社会生活的各个领域案例一利用大数据投放广告精准营销初期投放红酒广告财经频道貌似红酒目标客户高端人士的聚集地电商买家动态肖像系统数据分析常访问军事类博客的网民对红酒更感兴趣改变策略选取该网站博客频道中的军事类博客页面投放红酒广告一个投放周期结束后,有效转化率高达18%,而行业的平均水平却低于5%案例二True Car 哪里买车最便宜︖TrueCar之所以受到消费者的喜爱,因为只是做了一件事情:收集全美汽车销售商的数据,利用大数据分析将车价透明化并发布在自己的信息平台将价格从低到高分为4个区间:罕见低价超值价格不错的价格超过市场均价的价格第7页二、国家数字图书馆跨入大数据时代图书馆的大数据是什么?一是多种类型的海量资源及庞大用户数据;二是图书馆的生产数据和业务数据在根据数字资源生命周期在各业务系统间高速流转的数据体系;三是通过图书馆海量数据满足用户的知识需求和个性化服务需求的价值体现︵一︶日益增大的数据量海量资源库图书馆传统的纸质文献和多样化数字资源共同构成了海量资源库,成为宝贵而丰富的知识资产。
737.9TB45.7TB0%数字资源总量874.5TB2013年底网络信息采集量自建数字资源量外购中外文数据库共计273个文津搜索元数据达2.9亿条海量资源库图书馆传统的纸质文献和多样化数字资源共同构成了海量资源库,成为宝贵而丰富的知识资产。
国家图书馆资源变化情况表年份数字资源总量(TB )馆藏特色资源数字化量(TB )网络资源采集量(TB )外购数据库量(个)外购中文数据库(个)外购外文数据库(个)2009年327.8239.116.68188861022010年480388182191051142011年561.345819.22221061162012年813.5694.930.7254121133︵一︶日益增大的数据量服务终端前端终端︵一︶日益增大的数据量服务终端国家数字图书馆网站2013年总点击量达到10.36亿次 文津搜索系统月均页面访问次数为480万余次 读者门户对象数据月均访问210万余页 手机门户月均访问140万余次 Aleph 系统日均产生日志数据约20GB 文津搜索系统日均产生日志数据大于300GB︵一︶日益增大的数据量国家数字图书馆数据类型分布表资源数据元数据、对象数据、书目数据、规范数据、馆藏数据、单册数据、关联数据用户数据用户个人信息数据、在服务中产生的不同维度的用户行为数据业务数据各业务系统运转的业务数据,如:采访数据、缴送数据、征集数据、咨询数据等管理数据图书馆运转和服务中产生的各类管理数据,如项目建设数据、合同数据、财务数据、人事数据︵二︶丰富多样的数据类型资源类型包括电子图书、电子期刊、电子报纸、数据库、音视频资源、网络资源等。
资源来源既包括传统文献的数字化,也包括各种类型的原生数字资源,还包括其它异地存储为我所用的虚拟馆藏及大量网络资源︵三︶完善的数据体系和高速的数据流资源采集、组织、加工、发布、保存各系统构成完善的数据体系。
各系统之间存在着功能关联、功能互补、功能支持、数据交换、数据共享等关系。
数字资源服务软件平台建设统一用户管理系统数字资源存储与软硬件平台建设全国信息资源元数据仓储第15页三、以大数据理念实现国家数字图书馆的资源整合︵一︶资源整合原则统筹规划、分步实施资源整合原则1在国家数字图书馆资源建设与服务总体方针指导下,本着统一规划、统一布局和统一管理原则,结合大数据特点和资源现状,分阶段、有计划地实施。
︵一︶资源整合原则统筹规划、分步实施资源整合原则1以用户需求为导向,采取多种方式进行多层次整合,使整合后的资源更好满足用户的个性化需求面向用户、需求牵引2︵一︶资源整合原则统筹规划、分步实施资源整合原则1对特色资源进行有序组织,形成一个完整的知识网络,使多样性的馆藏文献资源得到合理开发借鉴国内外先进的整合技术和经验,增强前瞻性意识,保证馆藏资源整合工作的可持续性和可扩展性。
面向用户、需求牵引2突出特色、博采众长3︵二︶资源整合思路1. 建立超大型元数据仓储,构建资源利用新格局•图书馆所处的信息环境迅速出现“E”化•大量的用户信息和行为数据、丰富的网络资源与数字化文献、知识数据库一起,构成了图书馆独有而珍贵的数字资产。
•通过对各类资源元数据汇集和统一管理,盘活图书馆长期建设积累的数据和知识资产,从而形成科学、高效的统一数字资源服务体系。
︵二︶资源整合思路2. 完善统一发现与服务,实现大数据环境下的资源处理•大数据的多样性决定了不同来源的资源之间存在多种形式的结构差异和语义冲突。
•分布式文件系统、分布式并行计算和分布式数据库等技术为实现大数据环境下分布式和异构性资源的数据库存储与查询提供了新的思路。
︵二︶资源整合思路 2. 完善统一发现与服务,实现大数据环境下的资源处理MapReduce 是一种分布式并行运算的编程模型,基于它写出来的应用程序能够运行在由上千个机器组成的大型集群上,并以一种可靠容错的方式并行处理上T 级别的数据集︵二︶资源整合思路 2. 完善统一发现与服务,实现大数据环境下的资源处理分布式数据库技术方面,谷歌的BigT able 和Hadoop HBase 等非关系型数据库(NoSQL )通过使用“键—值”对、文件等非二维表的结构,具有对异构数据很好的包容性,适应非结构化数据的特点︵三︶资源整合思路 3. 利用语义和关联技术实现数字馆藏的组织和聚合•内容语义化,可把内容知识点变成计算机可理解处理的信息,以便后续聚合和分析•云服务与关联数据结合的资源管理和服务模式将图书馆数字资源进行链接并聚合,形成一个有序的知识服务体系。
•图书馆通过关联资源和服务聚集起来的云平台,不仅可以提高关联数据的处理效率,还能减少计算成本,有效实现区域内资源的传递和共享。
︵三︶资源整合思路 4. 结合数据分析技术实现数字资源的可持续发展通过大数据技术分析掌握掌握不同用户群体的资源和服务需求,了解馆藏资源的使用水平和流转状况通过对图书馆用户检索、浏览、点击、下载、评论、阅读学习笔记的相关数据构建“资源——用户”关系模型,按照用户的喜好和使用习惯向用户推荐具有针对性的O2O 信息服务。
通过对馆藏数字资源使用情况统计分析,对馆藏资源的使用和服务情况进行全面细致的了解,进而调整资源组织结构,提高数字资源建设水平和使用效率。
数据分析︵三︶资源整合思路 5. 扩大网络信息保存规模提升网络资源服务效力•面对网络信息海量规模和惊人的数据增长速度,网络信息采集与保存成为国家图书馆未来资源建设的重要组成部分•围绕相关技术、合作模式、资源及工程管理策略等方面进行探索,以规范化的采集流程和多元化的采集手段,实现对不同广度、深度的网络信息的采集、加工和管理,保证网络信息采集的完整性和时效性。
•对采集的网络信息数据,通过有效组织、分析与挖掘,提炼出有价值的内容,对外界提供知识服务和决策支持。
第26页四、全面提升大数据环境下国家数字图书馆服务能力(一)加大资源揭示力度实现知识服务科学梳理、有效整合数字资源,为社会公众提供更深层面、更细粒度的资源揭示,提供更快捷高效的查找、定位与获取目标信息的一站式服务;通过异构数字资源的融合、聚类和重组使资源从数据层的揭示与展现转向信息层、知识层的深度服务。
通过智能化技术挖掘数字资源的关联和价值,利用时间轴、地域轴等知识图谱可视化展示方式将资源呈现给用户依托融合的物联网、移动通信网以及互联网络进行传播,实现任何人、任何时间、任何地点、以任何方式接收任何媒体内容,使受众获得更及时、更多角度、更多听觉和视觉满足的数字图书馆服务体验。
(一)加大资源揭示力度实现知识服务(二)丰富资源展示方式增强用户体验利用大数据技术对用户及其行为数据进行收集、整理、分析,挖掘出用户与馆藏资源的关联关系,图书馆可以向用户推送具有针对性的数字资源内容与服务,同时用户也可根据个体的喜好和使用习惯定制相关信息服务。
(一)加大资源揭示力度实现知识服务(二)丰富资源展示方式增强用户体验(三)加强用户数据分析实现个性服务个性化服务针对性内容建立与数据库商、出版社、学术教育机构及图书档案界间的合作机制,实现数据共建共享的多方共赢推进全国范围图书馆数据的有效管理与整合,提高规模效应和服务水平(一)加大资源揭示力度实现知识服务(二)丰富资源展示方式增强用户体验(三)加强用户数据分析实现个性服务(四)促进业界合作建设实现共知共享结语第31页图书馆需要充分依托大数据技术,推动数字资源的整合和服务能力。
我们还面临着很多挑战,诸如数字资源长期保存、信息安全以及服务创新等。
我国的数字图书馆体系是由国家图书馆、各级公共图书馆、行业图书馆共同组成的,每个馆都是其中不可或缺的重要组成部分,需要图书馆界基于大数据环境下的新技术发展,通力协作,探索实践图书馆发展的新业态,激发生命力和活力,释放图书馆生态圈的新能量。
谢谢!Thanks。