Google数字图书馆计划及其影响分析

格式：doc
大小：38.15 KB
文档页数：35

下载文档原格式

/ 35

GOOGLE图书馆学习计划

GOOGLE图书馆学习计划一、引言随着互联网的快速发展，信息获取和知识学习的方式也发生了巨大的变化。

现在，人们往往更愿意通过网络来获取知识和信息，而不是传统的书籍和图书馆。

然而，尽管互联网能够提供大量的信息，但也存在质量参差不齐的问题，而且对于深入学习和研究来说，传统的书籍依然具有不可替代的价值。

因此，结合互联网和传统图书馆资源，能够更好地进行学习和研究。

GOOGLE图书馆作为一个在线资源库，为用户提供了大量的数字图书、期刊、报纸、学术论文等资源，成为了学术界和读者们的一个重要工具。

通过GOOGLE图书馆，用户不仅可以获取丰富的学术资源，还可以通过搜索、阅读等功能进行学习和研究。

二、GOOGLE图书馆的概况GOOGLE图书馆是一个由Google公司提供的数字图书馆服务，旨在为用户提供各种数字化的图书、期刊、论文等资源。

用户可以通过GOOGLE图书馆搜索引擎来查找并获取这些资源，同时也提供了在线阅读和下载的功能。

GOOGLE图书馆涵盖了多种学科领域的资源，涉及人文、社会、自然等多个领域，可以满足用户对于不同学科的学习和研究需求。

GOOGLE图书馆的特点和优势：1. 海量资源：GOOGLE图书馆涵盖了大量的数字化图书、期刊、报纸、学术论文等资源，覆盖了多个学科领域，用户可以通过搜索来获取所需的信息和资源。

2. 方便快捷：用户可以通过网络随时随地访问到GOOGLE图书馆的资源，并且可以通过在线阅读和下载等功能来获取所需的资料。

3. 文献检索：GOOGLE图书馆提供了强大的检索功能，用户可以通过关键词、作者、出版日期等多种方式来检索所需的文献资源。

4. 学术交流：用户可以通过GOOGLE图书馆来阅读和下载学术文献，从而更好地了解最新的研究成果和学术进展，同时也可以通过评论、分享等功能来进行学术交流和交流。

5. 免费开放：大部分的GOOGLE图书馆资源是免费开放的，用户可以免费获取并使用这些资源进行学习和研究。

美国HathiTrust数字图书馆项目与Google Books学术资源数字化对比研究

美国HathiTrust数字图书馆项目与Google Books学术资源数字化对比研究美国HathiTrust数字图书馆项目和Google Books学术资源数字化项目都是旨在提供大量数字化图书资源的重要项目。

本文将对这两个项目进行对比研究。

1. 目标用户HathiTrust数字图书馆项目的主要目标用户是学术研究者和学术机构，提供对数百万本数字化图书和其他文本资源的全面访问和利用。

Google Books学术资源的目标用户则更广泛，既包括学术研究者和学术机构，也包括普通读者，提供对千万级别的数字化图书和其他文本资源的访问和利用。

2. 数字化规模两个项目的数字化规模都非常大，但Google Books学术资源项目的数字化规模更大，涵盖了千万级别的图书和其他文本资源，而HathiTrust数字图书馆项目则涵盖了数百万本图书和其他文本资源。

3. 版权问题由于版权问题，Google Books学术资源项目只能提供有限的在线浏览和下载权限，一些图书仍然需要通过购买或借阅纸质书才能获取完整内容。

而HathiTrust数字图书馆项目则与许多学术机构和出版商合作，快速和全面地获取许可和权限，以提供更多的在线浏览和下载权限。

4. 可用性两个项目的可用性都很高，在线阅读和下载速度都很快。

Google Books学术资源项目在搜索和检索方面更强大，提供更多的搜索和排序选项，方便用户查找所需内容。

而HathiTrust数字图书馆项目则注重数字化文本的可持续性和长期保存，提供多种文件格式和元数据，可以在多种设备和平台上快速访问和利用。

综上，两个项目都是非常重要的数字化资源项目，具有不同的优势和目标用户。

无论你是学术研究者还是普通读者，都可以从这些项目中受益并获取所需的数字化文本资源。

大数据时代数字图书馆面临的机遇和挑战

大数据时代数字图书馆面临的机遇和挑战随着信息技术的迅猛发展和互联网的普及，数字图书馆已成为现代社会中不可或缺的资源。

在大数据时代，数字图书馆面临着新的机遇和挑战。

本文将就大数据时代数字图书馆所面临的机遇和挑战进行探讨。

一、机遇1. 数据资源丰富大数据时代，数字资源的丰富和多样化是数字图书馆面临的一大机遇。

通过数字化技术，数字图书馆可以收集、存储和管理各种类型的数字资源，包括电子书籍、期刊论文、音视频资料等。

这些丰富的数字资源为用户提供了更多元化的信息和知识，为数字图书馆的发展提供了新的动力。

2. 数据分析技术提升大数据时代的另一大机遇是数据分析技术的提升。

随着数据采集和处理技术的不断进步，数字图书馆可以通过数据挖掘、机器学习等技术有效地分析和利用大数据资源，为用户提供更加精准的信息检索和个性化的服务。

这为数字图书馆提供了更多的服务扩展和优化的可能性。

3. 服务创新和个性化大数据时代，数字图书馆可以通过数据分析技术，为用户提供更加个性化的服务。

通过分析用户的历史借阅记录、浏览偏好等数据，数字图书馆可以为用户推荐更为符合其兴趣和需求的资源，从而提高用户体验和满意度。

数字图书馆还可以利用大数据技术开展更多的创新服务，如数据可视化展示、数字资源共享平台等，丰富图书馆的数字资源和服务内容。

二、挑战1. 数据隐私和安全问题大数据时代，数字图书馆面临的首要挑战是数据隐私和安全问题。

数字图书馆在收集、存储和处理大量用户数据的必须保证用户数据的隐私安全，合法合规地使用和保护用户的个人信息。

数字图书馆需要加强数据安全管理和技术保障，建立健全的数据安全制度和机制，保护用户的隐私权益。

2. 数据管理和利用大数据时代，数字图书馆需要面对的挑战之一是如何有效地管理和利用大量的数字资源。

数字图书馆需要建立完善的数据管理体系和载体，包括数据存储、备份、检索和共享等方面的技术和机制，确保数字资源的安全和可持续使用。

数字图书馆还需要加强数据标准化和整合，提高数字资源的质量和价值。

图书馆数字资源的数据分析与利用

图书馆数字资源的数据分析与利用答案：图书馆数字资源的数据分析和利用可以帮助图书馆更好地了解读者需求、优化藏书策略、改进服务质量，提升图书馆整体运营效率。

在数字资源的数据分析方面，图书馆可以通过统计每个数字资源的访问量、下载量、阅读时长等数据，了解读者对不同资源的偏好和使用情况。

通过对这些数据进行分析，图书馆可以及时调整数字资源的采购和推荐策略，确保满足读者的需求。

此外，数据分析还可以帮助图书馆进行用户画像分析，了解读者的年龄、学科领域、借阅习惯等信息，为图书馆提供个性化的服务。

通过分析读者的借阅记录和搜索记录，图书馆可以为读者推荐更符合其兴趣和需求的数字资源，提升图书馆的服务水平和用户满意度。

在数字资源的利用方面，图书馆可以通过数据分析，发现数字资源的热门主题和热门关键词，为读者提供更精准的检索和推荐服务。

图书馆还可以利用数据分析的结果，开展数字资源的知识管理和信息组织工作，提高资源的利用率和价值。

综上所述，数据分析对图书馆数字资源的管理和利用至关重要，可以帮助图书馆更好地了解读者需求，优化服务质量，提升整体运营效率。

通过不断深化数据分析和利用，图书馆可以不断改进自身的数字化服务，为读者提供更丰富、更精准的数字资源，满足其学习和研究需求。

“Google与图书馆”研究的文献计量分析

Ｋｅｗｏｄ：ＧｏｇｅａｄＬｉｒｒ；ｔｔｔａｎｌｓ；ｅｉｗｙｒｓｏｌｎｂａｓｉｉｌａｙｉｒｖｅｙａｓｃａｓ
Ｇｏｇｅ作为１９ｏｌ９８年以私有股份公司形式创立
的美国上市公司，如今已经发展成为具有多项服务
“ ｏｌＧｏｇｅ与图书馆＂研究的文献计量分析
刘彩霞
（津科技大学图书馆，天津天３０９）０１２
摘要：对２０－２１００００年 “ ｏｌＧｏｇｅ与图书馆 ” 研究文献进行统计分析，结果显示，大量的研究文献主要集中在少
Ｂｉｌｍｅ＇ａｙｉｆｈｔａｎ “ ，ｏｌＬｉｒｒ ” ｂｉｏＵｉＡｎｌｓｓｔｅＳｕｙＯｃｏＣｏｇｅ＆ｂａｙ
ＬＩＣａ．ａＵｉｘｉ
（ｉｒｒ，ｉｊｉｅｓｙｏｉｎｅ＆ＴｃｎｌｙＴａｊ０２２ＣｉａＬｂａＴａｉＵｎｖｒｉｆｃｅｃｙｎｎｔＳｅｈｏｏ，ｉｉ３０２，ｈｎ）ｇｎｎ
ｓｅｔｅｄｃｎｒｌｔｆｔｅｒｓａｃ．ｈｅｅｒｈｍａｎｙｃｎｅｔａｅｎｔｅｆｌｗｉｇｔｒｅｔｐｃ：ｈｅｅｅｔｉｅｅｒｈＴｅｒｓａｃｉｌｏｃｎｒｔｄｏｈｏｌｎｅｏｉｓｔｅｉａｔｆｈａｓｏｈｏｈｍｐｃｏＧｏｇｅｕｏｒｄｔｎｌｉｒｒｓｔｅｉｆｅｃｆｏｌｂａｒｄｔｎｌｉｒｒｓａｄｔｅｒｆｅｂｃ；ｐ — ｏｌｐｎｔａｉｏａｂａｅ；ｈｎｕｎｅｏｉｌｉｌＧｏｇｅＬｉｒｒｔｔｉｏａｂａｅｎｉｅｄａｋＣｏｙｙｏａｉｌｉｈｉｔＧｏｇｅＬｂａｒｈｆｏｌｉｒｒ．Ａｔａｔｔｅａｔｏｏｎｅｕｅｗｅｋｅｓｆｈｕｒｎｓａｃ．ｇｏｙｓｈｕｈｒｉｔｄｏｔａｎｓｔｅｃｒｅｔｅｅｒｈｌ，ｐｈｔｏｒ

Google数字图书馆计划与公共图书馆的应对

护期的图书，根据与出版商或作者协商的程则度，网上提供部分章节或图书的相关信息以及在有关该书的评论。Ｇｏｌ则通过广告盈利来为ｏｇｅ图书数字化付费。Ｇｏｌ司认为，种模式ｏｇｅ公这
在为其赢得更多商业增值的同时，形成了数字也图书馆发展的商业生态链，并能维持数字图书馆的长远发展。毫无疑问，ｏｇｅ数字图书馆计Ｇｏｌ
者可以更容易地查找相关图书—— 特别是那些通过其他任何方式都无法找到的图书（如已例绝版的图书）。其最终目标是与出版商以及图
文图书的书名、者、作主题词、出版商等基本情况，而不能进行全文阅读。微软公司于２０年１月推出了ＬｖＳａｃ — ０６２ｉｅｒｅｈＢｏｓｏｋ服务，支持对整本书的内容进行检索。为避
书馆全部职能的情况，出了公共图书馆应加快资源数字化建设、新定位图书馆员的职业筝应提重
对挑战，图书馆获得新发展的思路和具体做法。使
关键词
Ｇｏｇｅ数字图书馆ｏｌＧ２０７５．６
原因是微软认为对图书内容的搜索应当由书籍出版商和图书馆创建内容库来实现。２００９年４月，界数字图书馆网站在巴黎世成立，由美国国会图书馆主导开发，提供７种共
语言查询。其资料数量不是很多，质量非常但高。其中包括了中国古籍《四库全书》《乐大、永典》《织图》、耕和少数民族文字图书等。此外，内数字计划项目主要有：国由中美高校发起的“ 中美百万 ” 目；星数字图书馆，项超其服务模式和经营模式在国内已属比较成熟；读秀图书搜索是近年来异军突起的一个大型搜索引擎；ａｕ司也开始涉足数字图书领域，Ｂｉ公ｄ但

从Google数字图书馆看当前图书馆的局限和革新

规划提醒数字化（图书馆在读者在线预订图书后则自动为该读
３５
变得更为宽泛，获取知识的方式更加便捷。科学技术带来的变革逐渐改变着人类的阅读习惯。尤其是读者的年轻化以及数字阅读方式的轻便性，更使得传统图书馆的地位在不断下降。据我国国家图书馆的统计分析，９７２０１９－０２
互联网应用的发展趋势，分析了图书馆在发展过程中面临的问题，并对图书资源数字化过程中如何更好地保护作者版权的问题进行了深入的探讨。
关键词：ｏｇｅ网络化；字化；息化；权保护；书馆Ｇｏｌ；数信版图
中图分类号：２０７Ｇ５．６
字图书馆 ”将诸多电子图书提供给读者使用。所以就在Ｇｏｌ，ｏｇｅ将计划推向全球的时候，面临着各国的指责，既同时也引来了大量的版权作者的诉讼。在已知会遭受大量版权所有者指责的时候，这些公司依然要花大量财力、物力建设自己的数字图书馆，究其原因是因为传统图书馆面临危机。
３万元的损失。如此大规模以保护知识产权为目的的法律诉讼，在中国数字版权行业内也是第一起。随后，世界顶级互联网搜索
人群，超过６％的人每日进行０５ｈ以上的网络浏览，０．在浏览时
间上已经超过传统的阅读方式。
随着网络的普及，越来越多的人倾向于使用互联网等数字媒体进行阅读和学习。因为这些资源不但免费，而且获取便捷。
收稿日期：０１０ — ８２１－７２
从Ｇｏｌ数字图书馆看当前图书馆的局限和革新ｏｇｅ

Google数字图书馆项目的多方博弈分析

索网站，实上，ｏｌ仅是世界上最大的搜索事Ｇｏｇｅ不引擎，而且正在提供最全面的互联网服务。Ｇｏｌｏｇｅ以搜索技术为核心，经开通了２已Ｏ多种网络服务
（图１。见）
该公司就从一个名不见经传的小公司迅速成长为全球最大的搜索引擎商。根据互联网分析权威机构
廖ＷｅＳｄＳｏｙ发布的报告，止到２０ｂｉｅｔｒ截０５年６月，
固Ｇｏｌ美国搜索市场中所占的份额达到５．ｏｇｅ在２
２，过了其最大的竞争对手雅虎（５２）３超２．１１
发展方向、数字图书馆的运作模式、识产权保护的知
方式以及图书馆业的生存问题展开了热烈讨论。由
于Ｇｏｌ在互联网信息服务中的优势地位，ｏｇｅ以及它拥有的技术实力和经济实力，ｏｌ介人数字图书Ｇｏｇｅ馆项目已经不单纯是一个图书的数字化问题，重更要的是在网络环境下对知识流通的重新定义，能可
倍，ＭＳ１．７ｏ的四倍还多。在欧盟国家，是Ｎ（０３７）
对Ｇｏｌ述服务进行分析，以分为三种ｏｇｅ上可
类型：
①搜索服务：ｏｌ索内容不仅仅是单纯的Ｇｏｇｅ搜网页（ｅＳａｃ）现在已经扩展到新闻搜索Ｗｂｅｒｈ，

Google 数字图书馆计划的发展及影响

第３４卷第９期
河南图书馆学－？ｌＪ
２０１４年９月
Ｇｏｏｇｌｅ数字图书馆计划的发展及影响
周青建
（郑州升达经贸管理学院图书馆，河南郑州４５１１９１）关键词：Ｇｏｏｇｌｅ；数字图书馆；数字化；版权；前景
片段不利于学术的研究Ｊ。Ｇｏｏｇｌｅ数字图书馆计划对各国传统图书馆形成极大的冲击和影响，各方博弈情况下又引发了版权纷争与利益冲突。那么，Ｇｏｏｇｌｅ数字图书馆又是如何应对的。
划发展速度之迅速，内容覆盖之广泛，充分展示了其建立全球最大数字图书馆的决心。１．２Ｇｏｏｇｌｅ数字图书馆计划的内容及目标
正式决定推出Ｇｏｏｇｌｅ数字图书馆计划，从而开辟了图书馆数字化的新时代。但其发展历程却一直饱受争议。在诞生之初，就有人质疑通过关键词获取图书
１Ｇｏｏｇｌｅ数字图书馆计划的内容简介１．１Ｇｏｏｇｌｅ数字图书馆计划发展历程
１．２．１Ｇｏｏｇｌｅ数字图书馆计划内容。Ｇｏｏｇｌｅ数字
图书馆计划基于一种快速无损的扫描技术。这种技术设备会被安置在大多数合作图书馆中，然后由Ｇｏｏｇｌｅ的工作人员负责扫描，并将扫描的文本传送

第四讲：数字图书馆

《现代文献检索与利用》第2版 /饶宗政
数字图书馆概念的内涵
• 美国国会于1993年通过的“电子图书馆法案”（Electronic Library Act of 1993），该法案认为电子图书馆系统应具有四个方面的特征: • ❶利用一系列技术能够将包括教育和研究在内的大量信息发送到家庭、学校和社区，并能提供检索 • ❷交互的多媒体程序为正规的和非正规的教育与学习，尤其是科学、
Google数字图书馆计划的目标：在切实尊重作者及出版商版权的同时，让读者可以更容易地查找相关图书，特别是那些通过其他任何方式都无法找到的绝版图书。
23
（2）世界数字图书馆
●世界数字图书馆（World Digital Library，WDL)是联合国教科文组织和世界32个公共团体合作建立，由美国国会图书馆主导开发的知识共享计划，中国国家图书馆参加其中。 ●目前收录七种语言：英文、阿拉伯文、中文、西班牙文、法文、葡萄牙文及俄文。平台之检索方式可以利用地点、时间、专题、条目类型、机构等来查寻。 ●世界数字图书馆网址：/zh/
●互联网是成人最方征
1. 数字化资源：文献资源数字化：图书、期刊、特种文献、视频、声频资料等； 2. 网络化存取：网络是ＤＬ的传输工具；ＤＬ依附于网络而存在，ＤＬ的各种服务是在网络环境下进行的，得益于网络，也受制于网络。 3. 分布式管理：全球ＤＬ遵循统一的访问协议，实现“联合检索” 。
早在1999年，Google公司刚刚起步致力于做搜索引擎时， Google联合创始人拉里· 佩奇（Larry Page）就提出了将世界所有书籍数字化的大胆想法。
到2009年Google已扫描了1000多万册图书，其中有约600 万本是受著作权保护的绝版书。约占全球书目数据库里列出并被收藏3200万册图书的三分之一。 “Google books是搜索全球图书的最新索引，有数百万本好书可供您预览或免费阅读。 /

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Google数字图书馆计划及其影响分析题型：填空题（20个20分）选择题（8个8分）名词解释（5个20分）简答题（5题40分）论述题（12分）数字图书馆考试重点1.2. MARC和DCMARC机读编目格式标准（英语：MAchine-Readable Cataloging，缩写：MARC），是一种图书管理的通讯格式标准，用以让图书馆或出版商之间作目录信息交换用途。

MARC标准源于美国国会图书馆于1970年代开发的目录格式。

虽然说是标准，但其实MARC是各国的机读编目格式标准的一个大集合，每个国家依然有自己的格式标准。

DC(Dublin Core) 是数字图书馆中使用的一组简单的包括15个“核心元素”的元数据元素集合，主要用于描述数字对象、馆藏管理和元数据交换。

这15项元数据不仅适用于电子文献目录，也适用于各类电子化的公务文档目录，产品、商品、藏品目录，具有很好的实用性。

3. 数据压缩的含义和类型数据压缩是指在不丢失信息的前提下，缩减数据量以减少存储空间，提高其传输、存储和处理效率的一种技术方法。

或按照一定的算法对数据进行重新组织，减少数据的冗余和存储的空间。

数据压缩包括有损压缩和无损压缩。

4. 主要的存储设备；（磁盘阵列、光盘塔、光盘库、磁带机、磁带库、光盘网络镜像服务器）（1）硬盘阵列由于它的访问速度非常快，所以它主要用于数据的实时共享，还可以用于小型的VOD点播系统。

（2）CD-ROM光盘塔的光驱访问速度相比于硬盘来说，速度慢了一些，而且光驱数量有限，数据源很少，所以供同时使用的用户数量也很少，但是由于光驱的价格很低，作为低端产品，它还是能够适用于一些用户的要求。

（3）CD-ROM光盘库的数据访问速度与CD-ROM光盘塔速度差不多，但是它所能提供的数据量更大些。

（4）磁带机是我们最常用的数据备份设备，按它的按带方式可分为人工加载磁带机和自动加载磁带机两大类。

人工加载磁带机在换磁带时需要人工干预，只能备份一盘磁带，所以只适用于备份数据量较小的中小型企业选用（通常为8GB、24GB和40GB）；自动加载磁带机则可在一盘磁带备份满后，自动卸载原有磁带，并加载新的空磁带，适用于备份数据量较大的大、中型企业选用。

（5）磁带库是像自动加载磁带机一样的基于磁带的备份系统，它能够提供同样的基本自动备份和数据恢复功能，但同时具有更先进的技术特点。

它的存储容量可达到数百PB（1PB=100万GB），可以实现连续备份、自动搜索磁带，也可以在驱动管理软件控制下实现智能恢复、实时监控和统计，整个数据存储备份过程完全摆脱了人工干涉。

（6）光盘网络镜像服务器是继第一代的光盘库和第二代的光盘塔之后，新开发出的一种可在网络上实现光盘信息共享的网络存储设备。

光盘镜像服务器有一台或几台CD-ROM驱动器。

网络管理员可通过光盘镜像服务器上的CD-ROM驱动器将光盘镜像到服务器硬盘中，也可利用网络服务器或客户机上的CD-ROM驱动器将光盘从远程镜像到光盘镜像服务器硬盘中。

光盘网络镜像服务器不仅具有大型光盘库的超大存储容量，而且还具有与硬盘相同的访问速度，其单位存储成本（分摊到每张光盘上的设备成本）大大低于光盘库和光盘塔，因此光盘网络镜像服务器已开始取代光盘库和光盘塔，逐渐成为光盘网络共享设备中的主流产品。

5. 基于内容的信息检索含义，图像内容检索的特征p112；基于内容的信息检索是通过对信息的模式识别和分析理解，从中抽取信息的有关内容特征并加以标示和组织，用户以此作为检索的依据，完成信息数据库中存储信息的匹配，从而实现信息的直接定位和查找。

多媒体数据类型、特征描述不同，其检索技术方法也会有区别。

基于内容的图像检索是把图像的可视特征如颜色、形状、纹理、区域等作为图像的内容进行匹配、查找。

6. 跨语言信息检索主要技术（有翻译技术和优化技术，将检索技术和翻译技术结合）p117跨语言信息检索有三种公认的主要翻译技术：机器翻译技术、基于词典的方法、基于平行或比较语料库的方法。

一般而言，上述三种方法并不是孤立存在的，在构建实际系统时常常会综合利用。

第一、机器翻译技术。

对于CLIR，机器翻译技术是一种显然的选择。

实现跨语言检索系统最直接的方法是将机器翻译系统应用于检索过程中。

具体来说有两种方法：一种方法是将用户的查询翻译为与文档相同的语种；另一种方法是将文档翻译为与查询相同的语种，然后再用单语种的信息检索系统进行检索。

第二、基于词典的方法。

基于词典的方法主要是利用双语词典，将用户提交的提问式翻译成目标语种，然后进行检索。

双语词典是跨语言信息检索系统中的基本资源，Lisa Ballesteros采用双语字典的方法达到了90%的单语检索的效果。

在提问式翻译中，机器翻译方法不一定比基于词典翻译方法好。

Ballesteros和Croft在报告中指出，基于词典翻译方法胜过流行的商业性机器翻译系统。

第三、基于语料库的方法。

语料库是将同一信息或同一主题的信息用两种或多种语言进行描述，并由人工或计算机建立不同语种间信息联系的集合，对单词用法的统计。

基于语料库的方法从大规模的语料入手，从中抽取所需的信息，自动构建与应用有关的翻译技术。

根据所使用的语料库的类型，基于语料库的方法可分为基于平行语料库的方法和基于比较语料库的方法。

跨语言信息检索优化技术主要有三类：查询扩展、检索反馈技术、消除检索词义性。

第一、查询扩展。

查询扩展指的是利用计算机语言学、信息学等多种技术，把与原查询相关的词语或者与原查询语义相关联的概念添加到原查询，得到比原查询更长的新查询，然后检索文档，以改善信息检索的性能，解决信息检索领域长期困扰的词不匹配的问题，以弥补用户查询信息不足的缺陷。

目前关键词查询扩展技术按照其扩展词的不同主要有全局分析、局部分析、基于关联规则的和基于用户查询日志的查询扩展技术等几种。

第二、检索反馈技术。

在跨语言信息检索中，通过一次检索往往得不到想要的结果目的文献，这时就需要通过检索结果中反馈的信息对提问式检索方法或翻译方法进行改进。

特别是当用户和信息系统进行交互式检索文献时，适当的用户反馈相当重要，大量的实验也表明使用检索反馈技术可以极大地改善系统。

第三、消除检索词多义性。

无论什么语种，一词多义现象都是普遍存在的。

对查询来说，确定查询中检索词的确切含义是查询扩展的基础对于被检索信息来说，明确信息中出现的检索词的含义是提高检索准确率、确定信息相关性的关键。

可以利用一种词的共现技术来消除词的多义性，以明确其含义。

词的共现技术，就是若两个有一定关联的词共同出现在某一篇文献或者文献的某一个部分，就可以非常容易确定其含义的技术。

7. 数字图书馆的主要特征；当前数字图书馆在网络环境下呈现出六大特征：信息资源数字化、信息内容动态化、信息组织智能化、信息服务网络化、信息利用共享化、信息服务的知识化。

8. 互操作协议OAI，Z39.50？OAI全称为OAI-PMH（Open Archives Initiative Protocol for Metadata Harvesting）。

由美国数字图书馆联盟（DLF）、网络信息联盟（F）等组织于1999年提出的一个应用框架。

其最初目的是为了解决电子期刊的预印本的互操作和元数据收割（metadata harvesting）问题。

Z39.50是一个美国国家标准，基于ISO的OSI（开放系统互联）参考模型的应用层协议，目的是为了信息系统的开放互联，将个系统的不同数据库软件，不同数据描述格式、访问方式建立一个抽象、通用的用户视图，将各个系统的具体实现映射到抽象模型上，使不同的系统在一个相互理解的、标准的通信平台上进行交互，满足互操作的需要。

9. RDF的含义和作用；资源描述框架(Resource Description Framework,简称RDF)是一个用于表达关于万维网(World Wide Web)上的资源的信息的语言。

它专门用于表达关于Web资源的元数据，比如Web页面的标题、作者和修改时间，Web文档的版权和许可信息，某个被共享资源的可用计划表等。

10. 美国首创计划一期、二期主要内容？美国数字图书馆首创计划一期研究的重点集中在三个方面：第一，发展数字信息收集、储存和组织的技术和手段；第二，研制通过inter进行信息检索的技术；第三，优化数字信息处理过程的用户界面。

美国首创计划（DLI-2）在DLI-1的基础上，从多方面促进数字图书馆的研究与发展，从纵深领域扩大了数字图书馆的应用领域。

11. Web2.0和Library2.0；Web2.0 是相对Web1.0 的新的一类互联网应用的统称。

Web1.0 的主要特点在于用户通过浏览器获取信息。

Web2.0 则更注重用户的交互作用，用户既是网站内容的浏览者，也是网站内容的制造者。

图书馆2.0是一个能够让图书馆快速地反应市场需求的运作模式。

图书馆2.0是web2.0在图书馆的应用，但更多的借鉴了基于web2.0的理念，以读者和用户为中心，使读者可以参与到图书馆的建设中来。

例如：添加OPAC书目、撰写书评等。

12. 知识服务知识服务是以互联网信息进行搜索查询为基础，为用户提供有用的信息和知识。

一般知识服务可以提供：新闻摘要、问答式检索、论坛服务、 __搜索、网站排名、情感计算、倾向性分析、热点发现、聚类搜索、信息分类等服务。

①识服务是用户目标驱动的服务；②知识服务是面向知识内容的服务；③知识服务是面向解决方案的服务；④知识服务是贯穿为用户解决问题工程的服务。

13. 数据挖掘和关联规则；数据挖掘(Data Mining)，就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。

关联规则：同时满足最小支持度和最小可信度的规则称为关联规则，即S（A→B）>min_sup且C（A→B）>min_conf成立，规则A→B 称为关联规则。

14. 个性化服务和移动服务概念；图书馆的个性化信息服务，就是指以用户为本，根据用户的层次和需求的差异，针对不同的用户，采取不同的服务方式，提供不同的信息服务。

15. 什么是数字鸿沟，并且联系实际说明怎么解决数字图书馆的数字鸿沟问题？“数字鸿沟”又称为信息鸿沟(Digital Divide,Digital Gap,Digital Division)，本意是数字差距或者数字分裂。

解决：（1）政府重视；（2）实现全球信息资源共享；（3）用户培训，技术平民化；（4）研制适合贫困地区的信息技术；（5) 积极参与国际活动。

16. 信息资源的存储模式有哪些？(1)DAS（直接连接存储）(2)NAS（网络连接存储）(3)FC-SAN(存储区域网络(4)IP SAN-NAS(5)IP SAN-iSCSI(6)云存储17. 什么是内容信息检索？基于内容的信息检索是通过对信息的模式识别和分析理解，从中抽取信息的有关内容特征并加以标示和组织，用户以此作为检索的依据，完成信息数据库中存储信息的匹配，从而实现信息的直接定位和查找。