学科领域信息可视化研究--以管理信息系统领域为例[文献综述]

  • 格式:doc
  • 大小:40.50 KB
  • 文档页数:7

下载文档原格式

  / 7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2011届)

毕业论文(设计)文献综述

题目:学科领域信息可视化研究--以管理信息系统领域为例

学院:商学院

专业:信息系统与信息管理

班级:

学号:

姓名:

指导教师:

一、前言部分

随着信息的日益丰富和互联网技术的发展,如何在海量数据中获取有效信息这一问题促使信息可视化领域成为当前的研究热点之一。信息可视化(information visualization),有时也被称作数据可视化(data visualization),近几年在国际上得到了广泛的重视。所谓信息可视化,就是将抽象数据用可视的形式表示出来,以利于分析数据、发现规律和支持决策。信息可视化的一个重要分支是引文分析可视化。自从加菲尔德创立引文索引数据库以来,引文分析法越来越多地被用来进行科学结构的分析、科学技术史及其发展规律的研究、科研绩效的评价等方面。它借鉴了很多科学可视化的技术,但又不同于科学可视化。科学可视化中的数据主要是物理世界、自然科学中的数据,例如卫星传回的数据等;而信息可视化中的数据来自社会现实和社会科学的各个方面,一般是比较抽象的数据,如金融数据、商业信息、文献等。信息可视化有以下几个比较突出的优点[1]:

1 提供了一条直观理解大量数据的途径。通过可视化,能够立刻辨别出最重要的信息

2 能够查询到没有预想到的现象。

3 能够发现数据本身的问题。合适的可视化方式可以揭示出数据本身以及人为造成的数据错误。

引文分析主要运用数学和逻辑学等方法对期刊、论文、专著等研究对象的引用和被引用现象和规律进行分析,以便揭示其数量特征和内在规律[2]。因为引文分析要处理大量的抽象的引文数据,信息可视化所具备的诸多优势无疑能促进引文分析应用这项技术。因此引文分析可视化最近几年在国外得到了蓬勃的发展,已经被应用于科学史研究、科学结构分析、知识领域显现等。但我国在这方面的研究层次较低,更多的是理论上的探讨,因此分析探讨国外在这方面研究中所采取的技术与方法对我国的研究无疑具有很强的借鉴意义。

近年来,随着社会信息化的推进和网络应用的日益广泛,信息源越来越庞大。目前已进入前所未有的信息时代。我们每天都处在各种信息的包围之中,需要一种快捷有效的方式帮助我们发现隐藏在庞杂信息当中的模式和知识,帮助我们决策。可视化的目标就是帮助人们增强认知能力,此即信息可视化的意义所在。信息的日益丰富决定着未来用户界面主要是一种信息界面,就某种意义而言,信息可视化代表着下一代用户界面的方向[2]。因为引文分析

要处理大量的抽象的引文数据,信息可视化所具备的诸多优势无疑能促进引文分析应用这项技术。因此引文分析可视化最近几年在国外得到了蓬勃的发展,已经被应用于科学史研究、科学结构分析、知识领域显现等。

二、主题部分

1 引文分析的研究

中国医科大学的崔雷等利用引文时序和同被引聚类分析表示医科某一方面专题的研究历史和状况,通过对某学科和专题的高被引论文的同被引聚类分析动态地反映该学科和专题的变化情况;刘林青以战略管理研究领域为例,应用著者同被引分析对该领域的学派进行了分析;马费成等应用多元统计技术对我国情报学领域的核心著者进行了同被引分析[4]。

引文分析所涉及到的知识很多,影响因子与共被引分析就是其中典型性重点。影响因子是一个常用的管理图书馆科学收藏的工具。图书馆管理员当为他们的部门和机构选择期刊时,必须在有限的预算前作出合理的选择。影响因子通过测定哪些期刊被最频繁引用来帮助管理员选择[5]。影响因子是一个国际上通行的期刊评价指标, 由加菲尔德在 1972 年提出。近年来, 影响因子逐步引入科技成果的评定, 它正日益受到广大科技工作者及医院管理者的关注[6]。在国际上, 已将影响因子作为一个通用的期刊评价指标。由于它是一个相对统计量,所以可公平地评价和处理大期刊和小期刊由于发文量不同所带来的偏差。具体方法为: 该期刊前两年发表的论文在第三年被引用次数除以该期刊在此两年发表的论文总数。一般说来, 期刊的影响因子越大, 则它的影响力和学术作用也越大, 说明该刊被科研工作者广泛使用和高度重视。

共被引用分析可分为三类:文献同被引分析、作者同被引分析、其他类型的同被引分析。所谓文献同被引是指,如果两篇论文A和B同时被后来的一篇或多篇论文所引用,则认为文献A和B具有同被引关系,同时引用A和B的论文数量为同被引度。同被引度越大,文献A 和B之间的关系越密切,或者说文献A和B越相关[7]。与文献同被引一个道理,作者同被引分析就是通过分析不同作者发表的文献同时被其他论文作者引用的频次,从而确定作者之间研究兴趣的距离。除了利用作者同被引分析可视化技术来研究科学结构和科学的发展动向以及历史外,目前还有学者利用期刊同被引可视化分析对期刊进行归类,利用专利同被引追踪科学到技术的转化,利用分类法中类目间的同被引分析对大科学的类目结构进行图示,从而拓宽了同被引分析可视化的研究应用范围。专家们利用聚类分析、多维尺度分析等多元统计方法,借助信息可视化技术,将期刊、文献、作者等分析对象之间的复杂关系通过共引网

络简化为较少的若干聚类群之间的关系,并通过科学知识图谱形象的表达出来,进而研究学科演进的结构和特点。其中不乏有很多代表人物[8]:

(1)荷兰的Loet Leydesdorff利用社会网分析方法,通过分析2001年的JCR中的5 748种期刊的引用关系,计算期刊间的皮尔逊系数,对期刊进行聚类。

(2)西班牙的Felix Moya-Anegon搜集西班牙在2000年被SCI和SSCI以及A&HCI 收录的文献,并根据发表这些文献的期刊在ISI-JCR中所属的类别,对应到根据西班牙的分类法的25个大类中去,这样大类的同被引分析就可以转化为期刊类别的同被引分析,从而得到西班牙大科学结构分析的可视化图像。

(3) C.Chen把引文分析可视化应用于专利引文分析中,以组织工程学方面的专利为分析范围,通过分析这些专利对科技文献(不是专利)的引用情况,利用PFNET形成可视化图,形象地表示出了在专利中多次被引用的论文及它们之间的关系,从而为追踪科学到技术的转化提供了一条途径[9]。

2 信息可视化的领域及相关软件

信息可视化提供了一种新的信息展示方法,丰富了科学发现的过程,开拓了新的视野。它涉及到计算机图形学、图像处理、计算机辅助设计、计算机视觉及人机交互技术等多个领域。通过信息可视化技术,不仅在生物学、工业、农业、军事等领域被广泛应用,特别在医学方面的可视化,已成为信息可视化领域中最为活跃的研究领域之一。近年来利用可视化技术还发现大量金融、通信和商业信息中隐含的规律,从而为决策提供依据,并已成为信息可视化技术中新的热点[10]。

而在信息可视化的软件中,最普遍的就是CiteSpace。CiteSpace是基于JAVA程序语言编写的专门用于引文分析的信息可视化应用软件。由美国德雷克塞尔大学信息科学与技术学院的陈超美开发于2004年9月,软件通过对文献数据信息的相关分析处理,探测和分析学科研究前沿随着时间相关的变化趋势以及研究前沿与其知识基础之间的关系,发现不同研究前沿之间的内部联系。它的主要目标是促进在知识领域的新趋势的分析。它允许用户采取了域的快照时间序列,随后合并这些快照。最初版本的CiteSpace是用来揭示在物理学中超弦理论的变化百分比;然而,当我们实施了CiteSpace I一些问题仍然没有解决。CiteSpace II在CiteSpace I的基础上发生了重大改进。最鲜明的新特点是,计算指标和关键点的视觉属性的组合。其动机是为了当他或她在知识结构的关键点搜索时大幅降低用户的认知负担[11]。

(1)吴鸣以科学引文索引SCIE数据库为数据源,下载以“nanobiotechnolog”为主题词