利用信息生命周期理论管理图书馆视音频数据
- 格式:pdf
- 大小:165.59 KB
- 文档页数:3
图书馆、情报与文献学1、名词解释归档文件正确答案:归档文件,指立档单位在其职能活动中形成的、办理完毕、应作为文书档案保存的各种纸质文件材料。
2、名词解释图书馆目录数据库正确答案:主要针(江南博哥)对特定图书馆的馆藏图书资料等进行内容及存储地址的报道和揭示,也称“联机公用查询目录”(Online Public Access Catalogue,简称OPAC.。
3、名词解释自动抽词标引正确答案:指使用计算机自动抽取文本资源中表达文献主题的语词作为检索标识。
自动赋词标引、自动分类是在自动抽词的基础上,依据自然语言语词与控制词、分类号对应表和转换规则等,将自然语言的语词转换成规范化的语词和分类号。
4、名词解释参考信息源正确答案:是在大量普通文献信息资源的基础上,经过整序、提炼和浓缩而成的信息密集型文献信息资源。
它好比是集成度很高的信息库,能为人们提供丰富的知识信息。
5、名词解释电子文献传递服务正确答案:电子文献传递是在传统馆际互借和文献传递基础上发展起来的、网络传递电子化文献的服务方式。
6、名词解释文件生命周期理论正确答案:是研究文件从最初形成倒最终销毁或永久保存的整个运动过程、研究文件属性与管理者主题行为之间关系的一种理论,是对文件——档案运动过程和规律的客观描述和科学抽象。
7、名词解释词频分布定律正确答案:揭示单词在文献中的出现频率的规律。
也称为齐夫定律。
在一个给定的文献集合中,如果将单词按出现的频次递减排列,并用自然数依次给单词赋以登记序号1、2、3……那么,频次和等级序号之间的乘积为一个常数,其数学表达式为:f•r=C或者f=C/r其中f为某单词出现的频次,r为该单词相应的等级序号,C为常数,和被通缉的文献样本量有关,等于统计文献集合中出现频次最多的单词的频次。
8、名词解释数据检索正确答案:是以从文献中提取出来的各种数据为检索对象的一种确定性检索。
9、名词解释数字典藏正确答案:是搜集和存储数字化信息以供长期保存和使用的、具有存储和检索功能的信息资源系统。
2024年工商管理本科-市场信息学考试历年真题常考点试题带答案卷I一.综合检测题(共100题)1.姚经理提出的信息需求是什么?属于什么层次的信息需求?2.简述信息管理发展的各个阶段。
3.信息管理的中心内容包括对市场信息的()。
A.分析B.处理C.存储D.传递E.利用4.对称信息5.系统切换6.管理信息系统的功能有哪些?7.对数据库进行构架和组织通常采用的逻辑模型有()。
A.网状型B.层次型C.直线型D.关系型E.开放型9.诺兰阶段模型中各阶段顺序正确的是()。
A.初装、蔓延、控制、集成、数据管理、成熟B.初装、蔓延、控制、数据管理、集成、成熟C.初装、控制、蔓延、数据管理、集成、成熟D.初装、蔓延、控制、数据管理、成熟、集成10.派生信息11.如何理解信息具有普遍性特征?12.简述决策者进行决策的过程。
13.下列选项中,不属于现实信息资源形态的是()。
A.文献形态B.口语形态C.抽象形态D.实物形态14.“保住了秘密即保住了市场”,这是美国可口可乐公司的经营信条。
这反映了市场信息的()。
A.社会性B.时效性C.可传递性D.竞争性和保密性15.下列选项中,属于个人信息源特点的是()。
A.规范性B.直观性C.稳定性D.主观随意性16.信息使用深度的阶段包括()。
A.提高效率阶段B.存储阶段C.及时转化阶段D.收集阶段E.寻找机会阶段17.下列不属于关系型数据库软件的是()。
B.FoxproC.OracleD.Unix18.在信息系统中,原始信息收集的关键问题是()。
A.筛选、解释和查询B.完整、准确和及时C.可靠、稳定和安全D.分析、加工和提供19.下列选项中,属于实物信息源特点的是()。
A.及时性B.直观性C.稳定性D.系统性20.公益性信息资源21.简述电子数据交换(EDI)的定义及其优点。
22.“大数据”是指需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
中国国家数字图书馆工程总体设计魏大威;孙一钢【摘要】文章分析了我国数字图书馆建设的基本情况,在总结国家数字图书馆工程建设特点的基础上,以服务、资源、标准、技术四个方面作为总体设计中的出发点,详细论述了在国家数字图书馆工程中基础支撑环境、标准规范体系、应用支撑平台、业务应用系统、网管安全保障、数字资源建设的总体设计内容,最后笔者根据工作的实践提出了对于总体设计工作中所遇到问题的思考.该文为2008年第八期<国家数字图书馆工程>专刊的文章之一.【期刊名称】《数字图书馆论坛》【年(卷),期】2008(000)008【总页数】9页(P23-31)【关键词】国家图书馆;国家数字图书馆工程;数字图书馆;总体设计;服务;数字资源【作者】魏大威;孙一钢【作者单位】国家图书馆,北京,100081;国家图书馆,北京,100081【正文语种】中文【中图分类】G25进入21世纪后,信息技术的快速发展为数字图书馆的实践提供了机会,国内开始出现数字图书馆建设热潮,并逐渐升温,一些全国性、地区性的数字图书馆项目纷纷进行规划或立项建设,许多图书馆作为独立的个体也进行了数字图书馆建设的有益探索,而商业机构的介入则进一步推动了我国数字图书馆事业的发展。
中国高等教育数字图书馆(CADLIS)是由“中国高等教育文献保障系统”(CALIS)二期工程和基于“中美百万册图书计划”(CADAL)的文献数字化工程两个专题项目构成的行业性数字图书馆系统。
CADLIS包括数字资源体系、软硬件平台和运行服务体系。
数字资源体系建设除了继续扩大原有的联合目录、学位论文、期刊篇名数据库外,加大了全文文献库的建设。
国家科学数字图书馆(CSDL)是中国科学院知识创新工程的重大项目,其建设目标是为中国科学院全院科研人员提供远程访问的信息资源和服务体系。
CSDL提出了“资源到所、服务到人”的服务理念,CSDL的随易通服务,使用户在任何地点上网,均可查询用户所在单位购买开通的数据库,并且为用户提供权威、可靠的目录导航。
信息资源管理中的信息全生命周期管理在当今数字化时代,信息资源管理成为了各个组织和企业不可或缺的一部分。
信息资源管理的核心是对信息进行有效的收集、存储、处理和利用。
而信息全生命周期管理则是信息资源管理的重要组成部分,它涵盖了信息的产生、获取、传播、利用和销毁的全过程。
本文将探讨信息全生命周期管理的意义、挑战以及如何实施。
信息全生命周期管理的意义在于确保信息资源的高效利用和安全保护。
随着信息的不断增长和变化,如何管理信息成为了一个重要的问题。
信息全生命周期管理通过明确信息的生命周期,帮助组织建立起信息管理的规范和流程,确保信息资源的可靠性、可用性和可持续性。
同时,信息全生命周期管理也能够帮助组织合理利用信息资源,提高工作效率和决策质量。
然而,信息全生命周期管理也面临着一些挑战。
首先,信息的产生速度越来越快,信息量庞大且多样化,如何有效地管理这些信息成为了一个难题。
其次,信息的安全性问题也日益凸显,如何保护信息资源免受破坏、泄露和滥用成为了一个重要的任务。
此外,信息的存储和检索也需要面对技术和成本的挑战。
因此,实施信息全生命周期管理需要充分考虑这些挑战,并制定相应的策略和措施。
为了实施信息全生命周期管理,组织需要建立一套完整的管理体系和流程。
首先,组织应该明确信息的生命周期,并根据不同阶段的特点和需求制定相应的管理策略。
例如,在信息的产生阶段,组织可以通过建立信息采集和录入的规范,确保信息的准确性和完整性。
在信息的利用阶段,组织可以通过建立信息共享和协作平台,促进信息的交流和共享。
在信息的销毁阶段,组织应该采取安全可靠的方式进行信息的销毁,以防止信息泄露。
其次,组织需要借助信息技术来支持信息全生命周期管理。
信息技术可以提供各种工具和系统,帮助组织进行信息的收集、存储、处理和利用。
例如,组织可以使用文档管理系统来管理和检索文档,使用数据分析工具来分析和挖掘数据。
同时,组织还可以利用云计算和大数据技术来扩展信息资源的存储和处理能力。
图书馆工作中的数据管理与利用随着信息时代的到来,图书馆的角色不再局限于收藏和提供图书馆馆藏的服务,而是逐渐转变为信息资源中心,为用户提供各种形式的信息资源和知识服务。
数据在图书馆工作中扮演着至关重要的角色,有效的数据管理与利用能够提高图书馆工作的效率和用户满意度。
本文将从数据的搜集、整理、分析和利用等方面探讨图书馆工作中的数据管理与利用。
一、数据的搜集在图书馆工作中,数据的搜集是建立可靠数据管理系统的第一步。
图书馆可以通过以下方式收集数据:1.1 使用数据库收集数据图书馆可以利用自己的数据库系统,记录和存储各种数据,如图书馆馆藏信息、用户借阅记录、馆内使用情况等。
通过数据库的建立,可以方便地记录和管理各种数据,并能够进行快速和准确的检索。
1.2 利用调查问卷收集数据图书馆可以通过设计和开展调查问卷来收集用户的信息和需求。
通过调查问卷,图书馆可以获取用户对于图书馆服务的评价和建议,了解用户的需求和使用行为,从而优化图书馆服务。
1.3 利用统计数据收集数据图书馆可以通过统计数据的收集,了解图书馆的使用情况和馆藏资源的利用情况。
通过统计数据分析,图书馆可以了解用户的需求,优化馆藏资源的布局和采购计划,提高用户满意度。
二、数据的整理与分析搜集到的数据需要经过整理和分析才能发挥其真正的价值。
数据的整理与分析是图书馆工作中非常重要的环节。
2.1 数据的整理图书馆需要对搜集到的数据进行整理和分类,以便于后续的分析和利用。
数据的整理包括数据的清洗和去重,确保数据的准确性和一致性。
同时,数据的分类整理也能让图书馆更好地了解自身的馆藏和用户需求。
2.2 数据的分析在数据整理完成后,图书馆可以通过数据分析来获取更多有价值的信息。
数据分析可以帮助图书馆了解用户的借阅偏好、热门图书的流通情况、各类资源的利用率等。
通过数据分析,图书馆可以为用户提供更符合他们需求的服务和资源。
三、数据的利用数据在图书馆工作中的利用是为了更好地服务用户和提升工作效率。
福建师范大学22春“图书馆学”《管理信息系统》期末考试高频考点版(带答案)一.综合考核(共50题)1.关于信息新度的说法正确的是()A.把信息和数据之间的时间差称为新度B.信息的新度与条件信息有关C.信息的新度越大信息就越新D.信息的新度与运行信息无关参考答案:B2.现代企业无法离开的信息系统是()A.数据处理系统B.事务处理系统C.管理信息系统D.决策支持系统参考答案:B3.系统工程成功的三要素包括()。
A、合理的系统目标、系统性队伍、遵循系统工程的开发步骤B、合理的系统目标、系统性组织、遵循系统工程的开发团队C、合理的工程范围、系统性队伍、遵循系统工程的开发步骤D、合理的工程范围、系统性队伍、遵循系统工程的开发组织参考答案:A4.原型法的开发过程是多个阶段重复、不断演进的过程,这些阶段包括:分析、设计、编程、运行和()。
A.测试B.切换C.实施D.评价参考答案:D5.在管理信息中,作业信息的特征不包括大部分数据来自外部。
()A.正确B.错误参考答案:A6.在系统设计中使用U/C矩阵方法的主要目的是()A.确定系统边界B.确定系统内部关系C.确定系统与外部的联系D.确定系统子系统的划分参考答案:D7.下列不属于数据库中的知识发现的是()。
A.数据仓库B.数据商场C.数据挖掘D.数据字典参考答案:D8.结构化开发方法是迄今为止最传统、应用最广泛的一种系统开发方法。
请阐述结构化系统开发方法的开发过程及各阶段主要任务。
参考答案:用结构化系统开发方法开发一个系统,将整个开发过程划分为五个首尾相连接的阶段,一般称之为系统开发的生命周期,系统开发的生命周期分为系统规划、系统分析、系统设计、系统实施、系统运行和维护五个阶段。
系统规划的主要内容包括:企业目标的确定;解决目标的方式的确定;信息系统目标的确定;信息系统主要结构的确定;工程项目的确定;可行性研究等。
系统分析的内容包括:数据的收集、数据的分析、系统流程图的确定以及系统方案的确定等。
第一次作业第一章、信息管理的产生与发展一、填空题1、纵观人类信息管理活动所采用的手段与方法,信息管理活动的发展分为三个时期分别是:(古代信息管理活动时期)(近代信息管理活动时期和(现代信息管理活动时期)、近代信息管理活动时期)现代信息管理活动时期2、以( 第二次世界大战)结束为标志,信息管理活动进入了现代信息管理时期。
3、从信息管理的起源角度,有三个领域认为信息管理起源于它们的工作,分别是( 图书馆领域)、( 工商企业管理领域) 和( 政府行政管理领域) 三个领域。
4、从对信息管理理解的不同层面角度,信息管理具有两方面的特征,一方面是技术特征,另一方面是( 管理理念)特征,它们共同构成了信息管理的内涵与特色。
5、联合国科教文组织认定的图书馆四项职能是:保存人类文化遗产)(、(社会信息流整序)(传递情报、)(启发民智的文化教育)、。
6、人们对信息管理的认识与把握至少表达出五种不同的含义,分别有(信息内容管理)、信息媒体管理、计算机信息管理)(管理信息系统)(、、信息产业或行业队伍管理。
7、一般认为,信息管理思想的发展历史可分为四个阶段,分别是:传统管理()阶段,(信息系统管理)阶段,信息资源管理)阶段,知识管理)阶段。
((8、知识管理的发展始终围绕着(组织)(人)和(信息技术)这三个要素。
、9、全信息的三要素分别为(语法信息)(语义信息)语用信息()10、联合国经合组织(OECD)将知识分为四种类型,即()事实知识()(、)(、人际知识)。
原理知识技能知识人际知识二、选择题(有一个或多个正确答案)1、以下关于信息管理活各个时期的特点描述,正确的是(ACD )A、古代时期的信息管理活动没有形成社会规模,社会信息资源数量有限,以纸制手抄本及印刷本为主;B、古代时期信息存储的方式是开放的;C、近代信息管理时期以文献信息为中心,图书馆为主要场所;D、现代信息管理活动时期,整个社会的信息资源呈几何级数增长。
信息资源管理理论的继承与创新大数据与数据科学视角一、概述随着信息技术的飞速发展和大数据时代的来临,信息资源管理理论面临着前所未有的挑战和机遇。
传统的信息资源管理理论主要关注信息的组织、存储、检索和利用,而在大数据环境下,数据规模的海量性、类型的多样性、处理的高效性以及对价值发现的新需求,都对信息资源管理理论提出了新的要求。
从大数据与数据科学的视角出发,对信息资源管理理论进行继承与创新,既是适应时代发展的需要,也是推动信息资源管理学科发展的必然。
本文首先回顾了信息资源管理理论的发展历程,分析了其在大数据时代面临的挑战接着,从大数据与数据科学的视角出发,探讨了信息资源管理理论在数据获取、存储、处理、分析和利用等方面的创新结合实际应用案例,分析了创新后的信息资源管理理论在提升组织决策效率、优化资源配置、推动社会经济发展等方面的积极作用。
本文旨在为信息资源管理领域的研究者和实践者提供新的理论视角和实践指导,推动信息资源管理理论的不断发展和完善。
1. 信息资源管理理论的发展历程回顾信息资源管理理论自20世纪70年代后期在美国出现的信息资源管理(Information Resources Management, IRM)概念中孕育而生。
随着信息技术的迅猛发展和互联网的普及,信息资源管理逐渐发展成为一门独立的学科和管理理论。
其发展历程大致可以划分为几个阶段。
在初始阶段,信息资源管理主要关注纸质文献的管理,如图书馆的图书管理和档案馆的档案管理等。
这一时期,信息资源的获取和存储主要依靠人工方式,效率相对较低。
随着计算机技术的出现和普及,信息资源管理开始进入数字化时代。
在这一阶段,信息资源的获取、组织、存储和传输开始依赖计算机和互联网技术,极大地提高了信息处理的效率。
进入21世纪,特别是近年来,大数据技术的崛起为信息资源管理带来了新的挑战和机遇。
大数据是指规模庞大、类型多样的数据集合,其处理和分析需要借助先进的计算机技术和算法。
2221/345223【理论•探索】高校图书馆数据治理现实逻辑与路径探究•李琳(河北大学河北保定271022)[摘要]文章通过概念界定分析了数据治理概念应包含的主要特征,以及数据治理与数据管理的关系,阐述了高校图书馆数据治理的研究现状,从高校图书馆的数据特点和类型、信息资源建设的基本理论、图书馆的社会职能三个层面分析了高校图书馆数据治理的现实逻辑,并从数据意识、组织架构、制度体系、关键技术、资源平台等五个方面探讨了高校图书馆数据治理的路径,为展开深入研究提供借鉴。
[关键词]高校图书馆数据治理现实逻辑路径[中图法分类号]G254[文献标识码]A[文章编号]1023-7845(2221)23-0229-25[引用本文格式]李琳.高校图书馆数据治理现实逻辑与路径探究[J].高校图书馆工作,2221(3):29-33高校图书馆是服务于高校教学科研的信息中心和服务中心,其作为传统数据信息收集汇总、归纳整合、保管应用的专业信息机构,不但拥有专业化的数据管理团队,而且在馆藏资源数字化、数据库开发建设以及数据存储利用等方面都拥有着充足的实践经验和强大的技术支撑[]。
现阶段高校图书馆的信息系统和信息资源建设已得到充分发展,各类数据资源也已有了相当规模的积累,高校图书馆能否盘活这些数据资源,挖掘其资源价值,依赖于高校图书馆是否进行有效的数据治理。
数据治理不仅关系到高校图书馆能否真正实现服务创新和价值创造,更关系到图书馆事业是否可以稳定健康地持续发展。
1概念界定关于数据治理的定义,由于切入视角的不同和侧重方向的区别,迄今为止还没有形成统一的、标准的、可被大多数学者所认可的定义。
国外学者Rena Araham等使用开放编码的方法总结出数据治理概念应包含的六个特征,分别为:跨职能的、框架、战略性企业资产、决策权和责任、数据政策、标准和程序、合规监测[2]o概括起来即为:数据治理为将数据作为战略性企业资产进行管理提供了跨职能框架;数据治理为组织进行其数据的决策指定了决策权和责任;数据治理将数据政策、标准和过程形式化,并进行合规监测。
XXX档案局数字档案馆建设方案目录第一章概述 (6)第一节项目背景 (6)第二节建设必要性 (7)1.2.1 适应国家和地区信息化战略的要求 (7)1.2.2 贯彻落实“十二五”规划的需要 (8)1.2.3 电子政务发展的必然需要 (8)1.2.4 依法管理档案事业的需要 (8)1.2.5 提供档案工作社会地位的需要 (8)1.2.6 节约政务管理成本的需要 (9)1.2.7 提供档案利用服务的需要 (9)1.2.8 实现电子文件管理模式与国际接轨的需要 (9)第二章需求分析 (10)第一节现状分析与差距 (10)2.1.1 现状介绍 (10)2.1.2 存在的问题 (10)第二节需求总结 (11)2.2.1 硬件网络设施 (11)2.2.2 应用系统建设 (11)2.2.3 安全需求 (12)2.2.4 技术需求 (12)2.2.5 性能需求 (12)2.2.6 易用性需求 (12)第三章建设要求 (13)第一节建设目标 (13)3.1.1 总体目标 (13)3.1.2 分期目标 (13)第二节建设依据................................................... 错误!未定义书签。
3.2.1 信息生命周期管理理论 (13)3.2.3 ISO15489标准 (14)3.2.4 OAIS参考模型 (15)3.2.5 数字档案馆建设指南 (15)第三节建设原则 (15)第四节处理好不同的关系 (17)3.4.1 注重规划、分期实施 (17)3.4.2 立足现实、规模适度 (18)3.4.3 循序渐近,确保实效 (18)3.4.4 避免盲目,形成特色 (18)3.4.5 新旧兼顾,和谐统一 (18)3.4.6 硬软协调,不可偏废 (19)第四章建设方案 (19)第一节标准规范体系建设 (19)第二节基础设施建设 (20)4.2.1 机房建设 (20)4.2.2 网络设备配置 (22)第三节信息安全系统建设 (26)4.3.1 安全防护目标 (26)4.3.2 具体安全措施 (26)4.3.3 安全产品部署 (27)第四节信息资源库建设 (29)4.4.1 建设内容与方法 (29)4.4.2 本期建设方法 (31)第五节应用支撑系统设计 (34)4.5.1 操作系统 (34)4.5.2数据库 (35)4.5.3应用服务器(中间件) (35)4.5.4全文检索引擎 (35)4.5.6 PDF标准格式转换控件 (37)第六节数字档案馆应用建设............................... 错误!未定义书签。
如今各个校园都建立了自己视频监控系统,监控所产生的数据是非常大的,如何构建一个合理的存储体系,来适应不断增长的信息数据量,如何解决信息数据增长与管理能力相对不足,以及控制不断增长的成本。
1信息生命周期的提出美国著名信息资源管理专家霍顿曾提出,信息是有生命的,信息资源是一种具有生命周期的资源。
他认为,信息生命周期是指信息运动的自然规律,一般由信息需求的确定以及信息资源的生产、采集、传播、处理、存储和利用等阶段所组成。
笔者十分赞同信息具有生命并具有生命周期的提法。
在如今的信息社会,信息以成倍的速度无限增长,它同其他事物一样,并不是一个孤立不动的元素,它也像我们人类生命一样,有一个产生、发展和消亡的过程。
信息从它产生的那一刻起,就自然而然地进入了一个循环,经过收集、复制、访问、利用迁移、删除等多个环节,最终完成一个生命周期,周而复始。
对信息生命周期的划分有不同的标准,标准不一,划分的阶段也不同"有根据价值变化或作用变化来进行划分,也有根据利用的次数或使用频率来划分。
最常见的就是流行的“六分法”,将信息的生命周期分为信息的采集、存储、传输、加工、使用和销毁六个阶段。
2数据的引用模式图1从数据引用模式图(图1)可以看出,随着生命周期的推移,数据被引用的次数是不断下降的,其要求相应的时间也由毫秒级变为秒级甚至是分钟级,而数据总量却不断增加。
如果我们把所有的数据都存放在提供实时的,高性能的存储设备上,付出的成本将是非常高昂和难以承受的。
唯一能做的就是将不太活跃的数据迁移到较低成本的存储级别,从而为更具成本效益的存储管理打下基础。
与此相对应的文件生命周期理论在现实当中的运用实例之一便是“数据中心”的建立,用来保存处于半现行状态的数据,而对于完全失去现行效力的视频则进销毁。
从管理的角度看,数据生命周期理论和信息生命管理都是针对处于不同形态或者不同介质下,处于不同运动阶段的信息管理的方法论。
从这一点来说,二者在本质上是一致的,即降低管理成本,提高信息利用率。
基于大数据生命周期理论的读者隐私风险管理与保护框架构建马晓亭;陈臣【摘要】〔Abstract〕Readers’ big data security and privacy face a lot of challenges in the aspects of security architecture, data privacy risk management, personal data monitored all-day and all-round, reader data secondary used, and so on, traditional privacy preserving technologies are no longer meeting the needs of the library privacy protection in era of big data. This paper summarizes the problems of big data privacy in library, and analyzes the deifciency of the existing privacy protection mechanism, and constructions of the privacy risk management and protection framework for library readers based on big data life cycle theory.%图书馆读者大数据的安全和隐私保护面临着诸如安全架构、数据隐私风险管理、个人数据被全天候和全方位监视、读者大数据被二次利用等风险,传统的隐私保护技术已不适应大数据时代图书馆隐私保护需求。
文章总结归纳了大数据环境下面临的隐私问题,通过分析现有隐私保护机制的不足,构建基于大数据生命周期理论的图书馆读者隐私风险管理与保护框架。
利用信息生命周期理论管理图书馆视音频数据史敏鸽(长安大学图书馆技术部 陕西西安 710064)摘 要 运用信息生命周期管理理论,讨论分析分级存储技术在图书馆视频点播中的应用与管理,同时提出与之相适宜的分级存储体系构建策略。
关键词 信息生命周期 分级存储 Vo D 存储应用 随着多媒体技术、硬件存储技术及网络通信技术的发展,以千兆计算机局域网为基础,在多媒体图书馆网络信息系统中,作为多媒体应用的一个重要方面,视频点播(VoD)系统得到了迅速发展。
众所周知,VoD是一种最直接、最形象的交互式视频信息的服务方式,它可以大大增强信息服务的主动性和生动性。
系统能在用户需要时随时提供交互式视频信息服务,它具有提供给单个用户对大范围的影片、视频节目、多媒体课件等信息进行同时访问的能力,用户和被访问的资料之间高度的交互性使它更受用户的欢迎。
系统是一种多级服务器和多级网络交换的结构。
多媒体数据经过压缩、存储、检索和网络传输到达用户终端,用户终端完成节目解压缩和同步回放。
它的主要组成部分是节目采编录入系统,专业视频服务器、播控服务器和管理软件。
由于视频数字化后,数据量很大,视频服务器必须使用高速、宽带的SCSI接口硬盘或最先进的FC接口硬盘作为视音频数据存储介质,并支持磁盘阵列,支持可变帧大小技术,保证最佳的视音频节目质量,满足用户对各种信息的查阅。
随着图书馆馆藏视音频资料的增加,视频存储服务器的压力很大,为了解决此问题,我们馆在做点播服务项目时,就充分认识到该技术问题解决的重要性。
经过充分讨论研究后,我们决定利用信息生命周期理论原理,结合分级存储技术来解决视频点播数据的存储问题。
1 信息生命周期管理理论信息生命周期管理(I nf or mati on L ifecycle Man2 age ment,简称I L M)是St orageTek公司针对不断变化的存储环境推出的先进存储管理理念。
数据生命周期管理是一项复杂的系统工程,其存储架构的建立比较简单,最大的难题是现有应用系统中的数据是否可以按照生命周期实施分存储,以及满足当年数据、历史数据查询使用的具体要求。
1.1 信息生命周期管理的一般理论现在,人们已经认识到,信息也有自己的生命周期,也会随着在生命周期中所处的阶段不同而起起落落。
我们使用和管理的信息量每年成倍地增长。
这些信息不但需要保存较长的时间,而且需要对其进行查询。
为了以最低的成本实现信息价值最大化,人们已经开始将自动化网络存储基础设施与其综合服务和解决方案结合在一起,然后以此为基础制定出新的信息管理策略,这种新的信息管理策略称为信息生命周期管理。
采用这种新的信息管理方式意味着根据信息对用户的价值进行分类,然后制定相应的存储策略。
利用自动化网络存储基础设施将信息转移到相应的服务等级,以满足使用要求。
借助信息生命周期管理,人们能够在整个信息生命周期内充分发挥信息的潜力。
Legat o公司将信息生命周期划分为7个阶段,包括了数据从产生直至灭亡的全部过程。
具体为:业务需求、采集/组织、保护/恢复、复制/镜像、共享、迁移/归档、删除。
由于是一个周期的管理,因此,在这个周期的每个环节都要有相应的产品来满足需求。
在一定的时期,人们可能只会应用到其中的某个或某几个环节,但是,把整个信息系统作为一个整体来管理是一个必然的趋势。
I L M的核心就是针对不同数据的不同生命阶段,采用不同的存储策略和存储介质,其中近线存储是重要一环。
在数据备份中,利用近线存储概念,用软件实现磁盘与磁带的有机结合,用较低价格的磁盘作为备份设备或现有备份设备的补充。
从管理信息的角度出发,我们会根据信息生命周期的特点,将其存储在与自身价值相符的不同层次的架构里,通过有计划、主动地增加存储,不断降低复杂性并增加整个存储系统的可用容量。
1.2 信息生命周期管理的意义信息生命周期管理是针对信息作主动管理的策略,此策略是基于以业务为中心、以政策为基础。
39图1 信息的价值随时间变化示意图图1向我们清晰的展示信息价值随时间的推移,它教会我们如何去评估和管理信息的存储方式。
教育我们平衡信息价值和管理费用,根据数据所能提供的使用价值来决定存储费用。
信息从产生到使用直到灭亡,其全部过程都需要进行管理,因此,信息生命周期管理可以说是用户发展到一定阶段的存储需求,只不过它是一种很复杂的需求,具体来说,就是如何建立一个更完整、更具有价值的信息系统,能够完全满足用户对于数据的以下五种需求:随时访问、按时间恢复、方便的共享、所有数据受到适当的保护以及按照一定的时间规定管理数据。
2 分级存储技术分级存储管理(H ierarchical St orage Manage2 ment,HS M)是一种将离线存储与在线存储融合的技术。
它将高速、高容量的非在线存储设备作为磁盘设备的下一级设备,然后将磁盘中常用的数据按指定的策略自动迁移到磁带库等二级大容量存储设备上。
当需要使用这些数据时,分级存储系统会自动将这些数据从下一级存储设备调回到上一级磁盘上。
对于使用者来说,上述数据迁移操作完全是透明的,只是在访问磁盘的速度上略有怠慢,而在逻辑磁盘的容量上明显感觉大大提高了。
通俗地讲,数据迁移是一种可以把大量不经常访问的数据存放在磁带库、光盘库等离线介质上,只在磁盘阵列上保存少量访问频率高的数据的技术。
当那些磁带等介质上数据被访问时,系统自动地把这些数据回迁到磁盘阵列中;同样,磁盘阵列中很久未访问的数据被自动迁移到磁带介质上,从而大大降低投入和管理成本。
由此可见,分级存储管理更多从降低成本、不影响数据应用效果的角度解决数据的存储问题。
将最常用的信息放在最易取用的存储空间里,这样的分级存储管理可以帮助使用者实现信息在整个生命周期中的最大价值,而且能够节约成本。
2.1 分级存储的存储方式传统的数据存储一般分为在线(On-line)存储及离线(Off-line)存储两级存储方式。
分级存储管理是以数据生命周期的不同阶段来决定存储的位置,从而在在线存储与离线存储之间诞生了第三种存储方式———近线(Near-line)存储,使存储网络从“在线-离线”的两级架构向“在线-近线-离线”的三级架构演变。
近线存储的特点是性能接近在线存储,而成本接近离线存储。
众所周知,在线存储多采用高速磁盘阵列等存储设备,存取速度快,价格昂贵。
而离线存储采用磁带作为存储介质,其访问速度低,但能实现海量存储,同时价格低廉。
但是,这些数据逐年累积以后管理它们就成了一件十分困难的事情。
近年来,由于AT A硬盘的性能不断提高和其成本远远低于SCSI硬盘,使基于AT A硬盘的近线存储设备成为令人关注的领域。
随着信息生命周期管理的兴起,近线存储领域必将成为数据备份和数据保护中的重要一环。
2.2 分级存储技术的优点数据分级存储之所以重要,是因为它既能最大限度地满足用户需求,又可使存储成本最小化。
首先,分级存储可以将不经常访问的数据驻留在较低成本的存储器中,可综合发挥磁盘驱动器的性能优势与磁带的成本优势。
其次,分级存储可使不同性价比的存储设备发挥最大的综合效益。
再次,分级存储把很少使用的老数据迁移到辅助存储器中,或归档到离线存储池中,这样就无需反复保存,减少了存储的时间;同时提高了在线数据的可用性,使磁盘的可用空间维持在系统要求的水平上。
最后,进行分级存储后,数据移动到另外的存储器时,应用程序不需要改变。
存储实现分级以后,在线、近线与离线存储存放的数据使用价值不同,在同一级别存储内部,存放的数据也应该不同,实现每一级别内的分级存储。
如何将各个级别存储中数据统一管理起来便成了最为关键的问题。
3 利用信息生命周期理论管理图书馆VoD数据的必要性VoD视音频资料以其直观、形象、生动等自身优势而备受用户的青睐,图书馆的视音频数据需求增长迅速。
视音频数据通常是使用高速、宽带的SCSI 接口硬盘或最先进的FC接口硬盘作为视音频数据存储介质,所占存储空间大,费用高。
上面我们已经探讨过了,每条数据都是具有生命周期,不同的时期有其存在的不同价值。
刚上传新数据,访问频率最高,为读者带来的价值也高。
随着时间的推移,访问频率降低,数据的价值也随之下降,低访问频率的数据量远远超过高访问频率的数据量,如果图书馆全部用企业级存储产品来存储VoD数据,费用非常49高,也没有必要。
根据信息周期理论我们知道,不同时期的数据,提供给读者使用价值也是不同的。
图书馆应考虑如何以最低的成本获得最高的使用价值,而不是采用以往单纯的购买更多磁盘的解决方式,徒增存储费用和管理复杂程度。
同时,数据量的急剧增长,也使存储管理复杂性增加。
数据的分级存储是简化存储管理的需要。
通过设定优化的数据迁移规则,能使重要数据和常用数据在最短的时间内访问到,使极少使用的数据备份在廉价的海量存储器中。
4 信息生命周期理论在管理图书馆VoD数据的具体实现技术分级存储在很多情况下,它更多地用于分布式网络环境中。
数据分级存储的工作原理是基于数据访问的局部性。
通过将不经常访问的数据自动移到存储层次中较低的层次,释放出较高成本的存储空间给更频繁访问的数据,可以获得更好的性价比。
文件由HS M系统选择进行迁移,然后被拷贝到HS M介质上。
当文件被正确拷贝后,一个和原文件相同名字的标志文件被创建,但它只占用比原文件小得多的磁盘空间。
以后,当用户访问这个标志文件时,HS M系统能将原始文件从正确的介质上恢复过来。
分级存储可以有不同的实施方式,HS M根据两级或三级体系将动态迁移/回迁的数据分类,从而实现分级存储。
随着技术的发展,存储技术在视频数据存储中得到了广泛应用。
按照数据生命周期进行管理,能够有效地控制在线数据规模,提高数据访问效率,缩短或控制备份窗口,从而提高应用系统运行的整体效率和效果。
,实现视频数据的良性管理,最大限度的体现信息自身价值。
正是基于这样的考虑,我们在考虑数据存取和调用时,充分利用信息数据是具有生命周期原理,结合数据分级技术来实现图书馆数据存储架构。
长安大学图书馆由一个中心馆和三个分馆构成:校本部、雁塔校区分馆、小寨校区分馆、渭水校区分馆。
我们每个馆都提供本地化VoD点播服务,它们用作上传视频数据和点播服务。
同时,我们在图书馆中心机房有一台VoD共享目录服务器,四校区的点播服务内容和条目均能从此台服务器下载点播。
在这样典型分布式网络环境中,在物理层次上,我们按照数据生命周期将其数据存储架构做成在线存储、近线存储和离线存储三种模式。
VoD点播服务在线存储永久链接在具有很高的访问速度和良好的反应能力的服务器设备(即各分馆点播服务器)上,适合访问要求频繁,并且对反应和数据传输都要求较高的应用。
在点播服务实际应用中在线存储设备一般采用高性能的存储服务器,用于上传、播出的视音频数据。