XML解析技术研究

格式：doc
大小：299.50 KB
文档页数：12

下载文档原格式

XML文档快速解析技术研究

由于ＸＭＬ文档能应用在不同平台上，实现数据的协同工作，它现在已成为不可缺少的企业技术的一部分。比如，ＭＬ增加了在商场中的电子商务和交流Ｘ
１ＸＭＬ解析的必要性
ＸＭＬ解析器是ＸＭＬ应用的基础。ＸＭＬ本身只是以纯文本对数据进行编码的一种格式，想利用要ＸＭＬ，或者说利用ＸＭＬ文件中所编码的数据，须先必
ＳＭＬＳａｄｒｅｅｌｅｒｕａｇａｅ标准通Ｇ（ｔａｄＧｎｒｉｄＭａｐＬｎｕｇ，ｎａｚｋ
存储结构都带来了很大的负载压力，这就导致了ＸＭＬ
的两个关键问题：长和性能。
１冗长：Ｘ）以ＭＬ格式储存的数据要比以其他数据库格式储存占有的空间要大得多。
２性能：）由于ＸＭＬ固有的冗余特性，Ｘ对ＭＬ数据的管理将增大应用服务器的负担。
用标记语言）的子集，它保留了ＳＭＬ主要使用功能Ｇ的同时大大缩减了ＳＧＭＬ的复杂性。它独立于任何语言和体系结构，是公认的下一代网络标记语言。
ＡｂｔａｔＩｔｏｕｅｈｈｏｙｏａｔｐｒｉｇｏＸＭＬｄｃｍｅｔｎｓｒｃ：ｎｒｄｃｄｔｅｔｅｒｆｆｓａｓｎｆｏｕｎ，ａｄｙｅｈｄａｔｇｓａｄｄｓｄａｔｇｏｗｏｐｒｉｇｍｅｈｄｚｄｔｅａｖｎａｅｎｉａｖａｅｆｔａｓｎｎｓｔｏｓ
陈娟，李晖，鱼雷

基于事件模型的MusicXML解析器

1
武汉科技学院计算机科学学院 2009 年毕业设计论文
1．2 发展状况
现在，有许多的音频文件格式，但是并不是所有的数据格式对音乐数据交换有意义，因为这里我们谈到的音乐数据指的是电子乐音和电子乐谱。我们接触到的大多数都是音频格式，记录声音是直接的或间接的记录声音的波形，直接的记录波形的方式对音乐数据的表示作用不大，几乎不大可能从波形中得到乐谱信息，一段 8.8kHz 的高音质 CD 虽然完全重现了声音，但是那些 0 和 1 用来表示波形的数据只是记录的混合后的波形数据，无法得到乐器，拍号，节奏等音乐特征信息。间接的记录波形，从间接的数据中利用软件模拟出波形的方式，恰当的中间数据更容易帮助分析乐谱， MIDI 是间接记录声音的方式，它在电子音乐交换中具有重要地位，在电子乐器交换中具有重要的地位。MIDI(musical instrument digital interface)[4-7] 是一种工业的电子乐器通讯协议， MIDI 不直接记录声音波形，只传输音调和音乐强度数字信息，MIDI 文件的数据特点便于分析乐谱，但乐谱分析往往不能正确还原乐谱，毕竟 MIDI 只记录了声音信息，乐谱的小节，音乐符号具体的表现没有记录，一般的基于 MIDI 的解释都是基于音轨的分析方法，同时各种软件开发商定制的文件格式辅助存储音乐符号信息，开发者的思想直接影响乐谱信息。从音乐家在电子乐器视谱演奏，再从录制的 MIDI 中用各种软件分析乐谱和原谱对照谱子很可能大相径庭，各不相同。早期的乐谱软件都是基于 MIDI，同时为了弥补对乐谱呈现的短处，这些软件都会对 MIDI 进行在包装，设计数据结构辅助存贮乐谱信息，各种软件厂商缺乏统一，使得这些乐谱只能部分的工作在桌面程序中，无法实现阵阵意义的网络音乐服务。笔者大量接触过著名的 cakewalk 和 guitar pro 乐谱软件，它们就是分别自定义了文件格式 .wrk 和.gtp 用于辅助存贮乐谱信息，guitar pro 是功能强大的吉他谱软件，为了满足吉他的特点，被包装的 MIDI 文件上有很多的细节处理，如：为了表现扫弦的过程和方向，和弦各级音都按时间进行了散列，而在 cakewalk 中和弦被认为是在同一时间点上产生的声音事件，当把 MIDI 文件从一种软件导出，再在另外一种软件中导入时，乐谱完全不堪入目。基于 MIDI 在乐谱交换上的不足，人们又开发了新的数据交换格式，这个时期最具有代表性的是 NIFF[8](notation interchange file format), 它将音乐

XML文档解析技术研究

文献5提到基于事件的拉pul1模式的解析方式xppxmlpullparser指出并行解析技术将会成为xml解析技术的一个新的关注点但是实现xml文档的并行解析目前还存在一定的困难1畅1domjaxpcrimson解析器解析dom是以层次结构组织的节点或信息片断的集合是xml数据的一种树型表示文档中所有的元素属性文本都会被解析成节点
用。 …无论是异构数据库信息的交换还是高效检索网页中的ＸＭＬ数据，都需要将ＸＭＬ数据包含的内容解析出来，从而得到有效信息节点。对于较小的ＸＭＬ数据流，可以解析后直接在内存中进行处理，然后在缓冲区中接收下一ＸＭＬ数据
具有很好的自我描述能力。ＸＭＬ以结构化的方
流。然而，当需要处理以ＧＢ为单位的大量ＸＭＬ
信息时，流处理和内存缓冲区显得力不从心。研
式描述各种类型的数据，几乎可以描述所有领域的数据。ＸＭＬ用严格的嵌套标记表示数据信息，特别适合在国际互联网的多点数据交换环境下使
（１．ＤｅｐａｒｔｍｅｎｔｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，ＢｅｎｇｂｕＣｏｌｌｅｇｅ，Ｂｅｎｇｂｕ２３３０００；
中图分类号：ＴＰ３１１
ＲｅｓｅａｒｃｈｏｎｔｈｅＸＭＬＤｏｃｕｍｅｎｔＰａｒｓｉｎｇＴｅｃｈｎｏｌｏｇｙ

基于StAX中指针API的XML数据解析技术研究

推。是一种低层ＡＩ尽管效率高，是没有提供这Ｐ，但
ＳＡｔＸ作为用Ｊｖａａ语言处理ＸＭＬ的最新标
底层ＸＭＬ结构的抽象，其主要ＡＩＸＭＬｔａＰ为Ｓｒｍｅ
Ｒａｅ．另一种是较为高级的基于迭代器的ＡＩ它ｅｄｒＰ，
单易读．
关键词：ＳＡＸ；ＭＬ解析ｔＸ；ＭＬＸ
中图分类号：Ｐ１Ｔ３２文献标志码：Ａ
ＪｖＥ５新推出的ＳＡＳｒａｉｇＡＩｆｒａａＥｔＸｆｔｍｎＰｏｅ
系列的事件流，由应用程序来控制解析过程，即应用
Ｊｖ、ａａ的事件驱动的、用拉式解析方法的流式ＡＩ采Ｐ．ＳＡ允许创建双向的ＸＭｔＸＬ解析器，速度快，易它容编程，占用内存少ｌｌ１．
ＳＡ是由ＢＡ公司领头开发的，同时得到ｔＸＥＳｎＭｉｏｙｔ公司的支持．初以ＪＲ１３即ｕｃｓｓｍｓｒｅ最Ｓ７（
塑ห้องสมุดไป่ตู้
针
一
Ｉ代Ａ）卜器ＰＩ
图１ＳＡ的解析机理ｔｘ
Ｆｉ．ｐｒｉｇｍｅｈｎｃｆＳＡＸｇ１ａｓｎｃａｉｓｏｔ
ＳＸ包括２种处理ＸｔＡＭＬ的ＡＩＰ，它们分别提
１３号Ｊｖ范请求）布，于２０７ａａ规公并０４年３月通过了Ｊｖａａ社区过程（ａａＣｍｍｎｔＰｏｅｓ的最终Ｊｖｏｕｉｒｃｓ）ｙ投票批准（ｔ：ｃ．ｇｎｒｅａｌｉ＝７）目前，ｈｔ／ｐｏ／／ｔｉｄｌ３．ｐ／ｒｅｊｄ？ＳＡ已经是ＪｖＥ５的组成部分（ｔ：ｊｖ．ｎｔＸａａＥｈｔ／ａａｕ．ｐ／ｓ

XML模式匹配技术研究

（）成阶段３合合成不同匹配器的输出结果，进行要
１Ｘ前景与特点ＭＬ
交换很难得到实现，为各种组织的应用因
可扩展标记语言（ｘｅｓｌＭａｋｐ程序对相同的标记名称也有不一样的理ＥｔｎｉｅｂｒｕＬａｇａｅ简称ＸＭＬ）ｎｕｇ，的产生改变了Ｗｅｂ的解。ｘＭＬ的模式出现就是为了保证正确的根本面貌。９８２，３全球互联网联ＸＭＬ档的元素和属性，立一个在数据１９年月ＷＣ（文建盟）出了正式的版本ＸＭＬ１０并且正式交换过程中的标准。守ＸＭＬ式，范给．，遵模规规定ＸＭＬ下一代互联网标准。为与ＨＴＭＬＸＭＬ文档定义为有效文档，的当前应用最相比ＸＭＬ有许多优点：ＭＬ具 ①Ｘ很简单，进广泛的两种ＸＭＬ数据模式语言是ｘＭＬ行自我描述而且易于解析。 ②ＨＴＭＬ中的Ｓｈｍ进行扩展，是Ｘ可ＭＬ的标记则由用户定义，任意的扩展。能 ③ ３Ｘ锯析ＭＬＨＴＭＬ的标记表示方法是数据的显示格中对ｘＭＬ文档进行操作的不是应用程式，无任何语义，可是ＸＭＬ的标记就明确规序，是首先由ＸＭＬ而分析器分析ＸＭＬ文档，定数据的含义，细粒度的ＸＭＬ为数据然后，过ｘＭＬ让成通分析器所提供的ＤＯＭ接Ｅｌ处理。 ④ＸＭＬ实现了结构、表现和内容三者或ＳＡｘ接口应用程序对分析结果进行操

XML的相关技术及数据交换研究

１Ｘ的相关技术ＭＬ
Ｘ为ｅｔｎｉｅｒｕａｇａｅＭＬＸｅｓｌＭａｋＰＬｎｕｇ的简称，ｂ即可扩展标记语言。ＸＭＬ是以一种简单、标准、可扩充的厅式，将各种信息如文本、表格以及罔形等以原始数据的方式储存。ＸＭＩ具有扩展性强、简单易懂、在不同平台问信息传递的优点。同时Ｘ可ＭＩ支持多语种文件Ｕｉｄ，开始设计ｎｃｅ在ｏＸＭＬ时，设 ‘ 者便考虑到信息的流通不应该只受限于一个国家或是一个区域，随着Ｉｔｎｔｎｅｅ在伞世的普及．一份文件能ｒ将
ＸＭＩ文水本身可以看成是数据库中的数据区，ＴＤＤ或者Ｓｈｍａ可以看成是数据库模式设计，Ｑ几以看成是数据库查询语ｃｅｓＸＬｌ『
［收稿日期］０９１— ９２０ — ００［作者简介］王智军（９３）男，１７一，内蒙古赤峰人，讲师，硕土。
１１口扩展的样式语言．．』２
ＸＬＳ是用于规定ＸＭＬ文档样式的语言。ＸＬ能使Ｗｅ浏览器改变文的表示法。ＸＬ能使ＷｅＳｂＳｂ
浏览器直接根据用户的不同需求改变文档的显示法。例如，不需要与服务器进行交互通信，町以改变数据的显示顺序。就通过变换样式表，可以展开或折叠文档。基于Ｘ的网站除了运行速度更快、ＭＬ更易使用外，而且对用电是透明的。１１可扩展链接语言．３．ＸＬ持目前Ｗｅ上已有的简单链接，Ｌ支ｂ并且将进一步扩展链接，包括结求死链接的间接链接以及

XML技术在信息共享领域的应用研究

关键词：息共享Ｘ技术特点ｘＭＬ术的应用ＸＬ信ＭＬ技Ｍ的信息共享模型中图分类号：７６Ｆｌ文献标识码：Ａ文章编号：０７９１（０１ｏ —１２０１０ —４６２１）８００－３
ＡｐｐｌｃｉｉａｔｏｎｎｄａＲｅｓａｒｈｅｃｏｆＸＭＬ
Ｋｙｅｗｏｒｓｉｆｒｔｎｓａｎ，ｄ：ｏｍａｉｈｒｇＸＭＬｔｃｎｃｌｅｔｒｓＸＭＬａｐｉｔｎＸＭＬｂｓｄｉｆｒｔｎｓａｎｄ１ｎｏｉｅｈｉａｆａｕｅ，ｐｌａｉ，ｃｏ — ａｅｏｍａｉｈｒｇｍｏｅ．ｎｏｉ
ｎｏｉｇｄｉｅｔｙｅｔａｔｄａｈｒｄ．Ｔｈｒｆｒ，ｈｔｂｅｎｒｃｌｘｒｃｅｎｄｓａｅｅｅｏｅｏｗｆｅｔｌｏｅｃａｇｎｄｓａｅｉｏａｉｔｅｎｈｅｅｏｅｅｓｓｓｅａｃｅｃｉｙｔｘｈｎｅａｈｒｎｆｒｔｖｅｍｏｎｂｅｗｅｔｒｇｎｏｕｙｔｍｓｈｓｂｅｏｍｅａｎｉｐｏｔｎｅｅｒｈｔｐｃｎｔｉａｒｐｐｉａｉｎｓａｄａｖｎｔｇｓｏｍｒａｔｒｓａｃｏｉ．Ｉｈｓｐｐｅ，ａｌｔｏｎｄａａｅｆＸＭＬｔｃｏｏｇｎｔｎｏａｉｈｒｎｇｆｌｓｒｓａｃｅＴｈｅｄｖｅｏｐｅｔｏｃｅｈｎｌｙｉｈｅｉｆｒｔｍｏｎｓａｉｅｄｉｅｅｒｈｄ．ｉｅｌｍｎｆｉｏａｉｎｓａｎｇａｄｆａｕｒｓｏＭＬｅｈｌｙｓａｌｚｄ，ｒｎｃｐｅａｍｐｌｍｅｔｔｏｆＸＭＬ～ｂｓｄｉｆｒｔｈａｎｇｉｓｕｄｅ．ｎｆｒｔｏｈｒｎｅｔｅｆＸｍｉｔｃｎｏｏｇｉｎａｙｅｐｉｉｌｎｄｉｅｎａｉｎｏａｅｎｏｍａｉｓｒｓｔｉｄｏｎｉ

XML技术在铁路信息交换中的应用研究

ＸＭＬ文档的内容不受信息显示方式的影响．结构其
形式可以通过ｃｓｃｓａｉｇＳｙｅＳｅｔ，联样式ｓ（ａｃｄｎｔｌｈｅｓ级单）者ＸＬＥｔｓｌＳｙｅＬｎｕｇ．扩展的样或Ｓ（ｘｅｉｅｔａｇａｅ可ｎｂｌ
维普资讯
铁道技术监督
第３４卷
第ｌ０期
志、内容模式、属性和实体等方面的描述来规定和检查ＸＭＬ文档有效性，只有有效的ＸＭＬ文档才能传
输，后再把消息翻译成本地代码，然最后映射成本地数据库的数据操作指令，以便在数据库中存储、改修和删除数据．果Ｘ如ＭＬ文档缺乏有效性，么在接那受和发送ＸＭＬ消息时就要经过代码转化。消息的返回过程与上述过程相反，生成Ｘ先ＭＬ消息，再将本地代码转换为标准代码返回给消息源。实际上，次一
维普资讯
第３４卷第１Ｏ期
Ｖｏ．４１３Ｎｏ１．０
铁道技术监督
ＲＩＷＡＵＬＴＯＴＯＡＬＹＱＡＩＹＣＮＲＬ
标准化工作
ＳＡＮＤＡＴＲＤＺＩＯＲＫＩＡＴＯＮＷ
运营。ＸＭ（ｘｎｉｅＭａｋＬｎｕｇＬＥｔｓｌｅｂｒａｇａｅ可扩展标记语
利用ＸＬＭ技术，铁路企业的信息可以准确、及时、完整地传送到目的地的内部信息系统。是网际服务器与应用程序之间，应用程序与用户之间进行数

XML技术研究

对当今瞬息万变的商业环境，一个公司想要成功，必须把信息技术转化为自己的商业优势，其中包括能够在合适的时问，把合适的信息交到合适的人手中。不幸的是，现实于此截然
一
一
一
６Ｏ一
关键词：ＸＭＬＨＴ；记语言；ＭＬ标
的解释。浏览器中预定义了特定标记的特定显对给定的ＸＬＭ文档进行变换之后生成的。现在示或逻辑方案；ＴＬ的主要功能在于通过浏我们要将网站的内容放在一本书中，只需要重ＨＭ览器完成对信息的显示，即信息的格式化控制。新定义ＸＬ，ＳＴ给出变化规则，可以将内容完就ＸＭＬ是ＳＭＬ是文档的精简版本。ＳＭＬ过于美的再现在另外的一种形式中了。ＧＧ复杂，学习难度和开发难度都很大；ＭＸＬ的主６Ｍ用于通信。Ｍ的应用在于于计．ｘＬ２ＸＬ算机之间的数据交换。当—个系统可能有几台相反，几乎所有的ｎ部门，被巨大、 ’ 都错综复要特点如下：杂、新旧交替的系统所累，而且受到资源的极大４１不同系统平台的信息互通。．服务器，同时使用不同的操作系统和数据库的时候，不同系统之间的数据交换将变成一个十制约。４．２整合多种不同数据源的数据。由于世界上存在着如此多的、完全不同的Ｍ我４３平衡客户端和服务器端的处理负荷。分令人头疼的事情。当采用ＸＬ规范以后，＿客户平台，在不同平台问交换数据，同时还要保４４以灵活多变的方式显示数据。．们只需要接收ＸＬＭ标记的数据，遵循在ＩＤＹｒ４５更精确的数据检索。．中定义的规范，而不需要知道对方的系统是什证数据的完整和服务的高效，这是件令人头痛的事情。在大型Ｗｅｂ应用中，工程师们往往被５有了ＨＭＬ为什么还需要用Ｘ？Ｔ，ＭＬ么。因为ＸＬＭ数据不与任何类型的客户方栓在数据格式的转换弄得疲惫不堪，即便是整理完ＳＭＬ的一个重要的派生，就是超文本标起。以它提供了一种很容易在网络上传输Ｇ所成的数据，如何让各种客户端都能正确获取和记语言ＨＭＬＴ。几乎所有的用户都熟悉ＨＭＬ的非常简单的数据表示方式。Ｔ，理解也是不小的麻烦。最终，这一问题成为制约人们感谢ＨＭＬ正是由于ＩＦＴ，ＴＭＬ标准的出现，６Ｍ用于配置。作为应用程序服务器．ＸＬ３增加了技术的可移植性。实际ｗｅｅｉ发展的瓶颈。近年来，ｂＳｒｃｖｅ随着企业运才使Ｉｔｔｎｅ走出了实验室，ｍｅ成为人人皆可使用的配置说明文档，营国际化的趋势越来越明显，垮平台垮语言的的工具，也成为影响世界最重要的技术，它不但上，从ｓＭ派生出ＸＬＧＬＭ子集的主要原因是，远程调用成为一种迫切需要的能力，人们需要改变了人们的生活，也改变了世界运转的方式，编写处理ＳＭＧＬ文档的应用程序太笨拙了。如种平台无关的、能够同时被人类和机器所理同时，更为软件的开发形式带来了多元化的形果希望ＸＬＭ有实用性，那么它就必须很容易编解和处理的文本数据格式。而这种技术的核心，式。写文档处理程序、文档浏览器和其它程序，只有就是Ｘ。ＭＬ因为现在网络应用越来越广泛，仅仅靠这样，使用ＸＬ的代价才不会太大。Ｍ２ＸＭＬ概述ＨＭＴＬ单一文件类型来处理干变万化的文档和７使用ＸＬＭ的好处ＸＭＬ是ＥｔｓｌＭａｋｐＬｎｕｇｘｅｉｅｎｂｒｕａｇａｅ的缩数据已经力不丛心，而且ＨＭＬ本身语法十分Ｔ７１Ｘ可以广泛地运用于Ｗｂ．ＭＬｅ的任何写，中文含义为“ 可扩展标记语言” Ｍ。ＸＬ首先不严密，严重影响网络信息传送和共享。人们早地方。是一种标记语言而且是用来创造标记语言（已经开始探讨用什么方法来满足网络上各种应比７Ｍ可以满足网络应用的需求。．ＸＬ２如ＨＭ）ＴＬ的元语言；其次，它是一种可扩展的用的需要。７．３使用ＸＬＭ将使编程更加简单。标记语言，因为在Ｘ中允许用户自己来创建ＭＬ７４ＸＭＬ便于学习和创建。．使用ＳＭ是可以的，ＳＭ太庞大，ＧＬ但ＧＬ编标签，所以叫做可扩展性。程复杂，于是最终选择了 “ 减肥”的ＳＭＬ— Ｇ７ＭＬ．Ｘ代码将清晰和便于阅读理解。５标记语言是指在普通文本中加入一些具ＸＭＬ作为下一代Ｗｅｂ运用的数据传输和交互８结论有特定含义的标记，以对文本的内容进行标识的工具。和ＨＭＬ一样，ＭＬ是依据ＳＭＬ标ＴＸＧ新旧技术的集成是当今商业面对的一个巨和说明的一种文件表示方法。标记语言对文档准演化而来的。Ｗ３此建立了ＸＣ为ＭＬ工作组大的挑战，在许多企业环境中，每一种平台都有的意义进行了分析和细化，使得计算机应用软（ｘｗＧ）开始创建ＸＭ来Ｌ的进程。ＸＭＬ将派生它工作的最佳范围，一个平台不可能良好的完件对文本的意义也就有了一定程度的理解。于ＳＬ，但与ＳＭＬ相比，Ｌ将大幅度简成包罗万象的任务，ＧＭＧＸＭ基础结构是在发展中逐渐３ＸＭＬ的标记特性化，原则上它只使用２％ＧＬ０ＳＭ标准，但需要发充实完善的，因此，ＭＸＬ技术的研究还有更大３．１作为一种标记语言，它最基本的功能挥了８％的效力。同时与ＨＭＬ相比，０Ｔ它需要的发展空问。就是在文档中添加标记，而且，标记的添加必须更加严谨，而且更适合于计算机之间的数据交参考文献遵循一定的规则。最为直观的规则就是标记必换。『１１周爱武，李孙长，程博等．Ｍ数据库的研究ＸＬ须成对出现。６ＸＭＬ的应用与应用【１Ｊ．计算机技术与发展，０９１（）２０，９９：２４．８３．２所使用的标记都是非预定义的，即用６１Ｘ．ＭＬ用于表示内容。内容与表现形式２１－２户自己定义的。只要遵守ＸＭＬ的标记命名规的分离，一个ＸＭＬ文档中几乎所有的内容都是『１苗维杰，．基于Ｘ２天辉ＭＬ代码生成技术的应则，可以在文档中添加任何标记。数据和数据结构，它主要用于传递数据，对数据用研究．元器件应用，０９ｌ（ｏ：５８．电子２０，１１）７ — ２３．３用户自定义的标记，户可在文档内，的表现完全被剥离。用ｆ】陈腾．３基于ＸＭＬ数据发布的设计和实现ｍ．也可以在文档之外进行说明。标记的说明称为：现在的大部分网站都是用ＨＭＴＬ编写的。地理空间信息，０９７５：７９．２０，（）８ — １ＤＴＤ。网页设计师们精心设计的网页，能够在Ｗｅｂ浏ｆ１治俊，４邢王凌飞，谢声时等．浅谈ＸＭＬ解析３Ｍ文档的标记只描述文档的内容，览器上很漂亮的显示出来，但是如果想把这些技术明．南金融电脑，０９１ｆｏ：１５．．ＸＬ４华２０，】】）－２５具体说，只描述文档的结构和意义。不描述其任网页所包含的内容重新设计在一本书中的话，作者简介：宁（９５）女，师，士，任１７一，讲硕研何显示、出等格式化信息。输显然，浏览器上的漂亮内容就不能很方便的在究方向为软件工程和网络技术。４ＸＭＬ和ＨＭＬ的比较Ｔ书中体现出来了。但是，ＭＬ的出现为解决这ＸＨＭＬ通过在文档中添加具有特定意义种问题提供了一种良好的解决方案。Ｔ的标记来组织文档；ＴＬ所使用的标记都是ＨＭ因为ＸＭＬ只是定义数据，它并不关心数据预定义（固有的标记）不同的ＨＭ版本具是如何显示的，的，ＴＬ所以用ＸＭＩ设计出的网站其内有不同的标记集合；浏览器完成对ＨＭ文档容和显示是分离的。一般的网页是通过ＸＬＴＬＳＴ

XML技术在IEC 61850标准中的应用研究

维普资讯
２００７年１月
西
安
邮
电
学
院
学
报
Ｊｎ２０ａ．０７
Ｖｏ．２Ｎｏ１１１．
第１２卷第１期
ＪＯＵＲＮＡＬＯＦＸＩＡＮ ’ ＵＮＩＶＥＲＳＴＹＯＦＰＴＡＮＤＴＥＬＥＯＭＭＵＮＩＡＴＩＩＯＳＣＣＯＮＳ
１ＸＭＬ应用于变电站配置的研究
１１变电站配置语言分析．
标记语言）万维网联盟（ｃ）建的一组规范，是ｗ３创用于在ｗｅ上组织、布各种信息… ｂ发１。它不仅可以满足迅速增长的网络应用的需求，能够确保网络还
能电子装置能力描述和变电站系统与网络通信拓扑结构描述Ｊ体包括以下内容：。具描述一次系统结
进行交互操作时具有良好的可靠性与互操作性。
ＸＭＬ的语法类似ＨＴＭＬ，标签来描述数据。用
ＨＭＬ的标签是固定的，Ｔ用户只能使用，不能修改。
收稿日期：０６９５２０ —０ —１
构包括使用哪些一次设备功能、设备如何连接；描述
作者简介：黄文华（９０，，１８一）女江苏江阴人，西安邮电学院信息与控制系讲师。朱渝宁（９７，，１７一）男辽宁辽阳人，重庆市电力公司江津供电局工程师。
ＸＭＬ则不同，没有预先定义好的标签可以使用，它
引言
ＩＣ６８０作为下一代变电的无缝通信标Ｅ１５

VxWorks平台XML文档显示技术研究

摘
要
针对电子文档已经成为日常办公交流中不可或缺的重要信息载体，分析了嵌人式系统对文档处理的需求特
点，出一种在Ｖｘｒｓ台实现微软办公文档解析显示的方法，提Ｗｏｋ平并通过ｃ语言编程在ＭｉｉＵＩｎＧ图形系统上对示例进行
了验证。
关键词
用及容错实时调度算法。
２１００年第２期
计算机与数字工程
７９
文档格式能很好地解决这一问题。目前，开放的文
１引言
Ｖｘｒｓ操作系统是美国风河公司（ｎＷｏｋＷｉ—
终端系统也需要特定的办公能力，如对电子文档例
进行查看、辑和保存等基本功能。同时，入式编嵌
操作系统要求配置简洁、能适用，为提供办公功作
Ｖｘｏｋ；办公软件；文档格式；解析ＷｒｓＴＰ９３３
中图分类号
ＲｅｅｒｈｏｃｎｉｕｓｏｓａｃｎＴｅｈｑｅｆＸＭＬＤｏｕｍｅｔｉｐａｙｆｒＶｘｏｋｓｃｎｓＤｓｌｏＷｒ
性，泛应用于通信设备、广工业控制、事电子等各军
个领域口。随着Ｖｘｏｋ在这些领域的使用，ｑ］Ｗｒｓ
办公软件的多样化带来的直接问题是文档格
显现出其在办公能力方面的薄弱，没有相应合适、配套的办公软件。因此，Ｖｘｒｓ入式平台对Ｗｏｋ嵌

如何利用Java语言进行XML编程的研究报告

如何利用Java语言进行XML编程的研究报告随着计算机技术的不断发展，XML（可扩展标记语言）已经成为Web数据交换的一种标准方式。

它是一种使用标签描述数据的语言，具有自我描述性以及能够方便地扩展的特点。

而Java语言可以很好地与XML技术相结合，用于XML编程。

本文将介绍如何利用Java语言进行XML编程的方法和技巧。

一、读取XML文件Java语言中提供了许多读取XML文件的工具，如DOM、SAX、JDOM、XMLBeans等。

其中DOM（文档对象模型）是最常用的读取XML文件的方式。

DOM是一种树状结构，将XML文档中的标签、属性、内容等信息以节点的形式表示，每个节点都有一个唯一的节点名和一个节点值。

通过使用DOM解析器，Java程序可以将XML文档转换为DOM树，然后通过遍历DOM树的方式实现对XML文档的读取。

二、创建XML文档Java语言中也提供了多种创建XML文档的方式，如DOM、JDOM、XOM、StAX等。

其中DOM仍然是最常用的方式。

通过DOM创建XML文档的过程与读取XML文档的过程类似，只不过是反过来了。

先创建一个空的DOM树，然后按照XML文档的结构，在树中添加标签、属性和文本节点等元素，最后将DOM树转换为XML文档。

三、解析XML文件解析XML文件是将XML文档转换为Java对象，使程序能够方便地使用XML数据。

Java语言中可以使用JAXB、Castor、XMLBeans等工具进行XML文件的解析。

其中，JAXB（Java Architecture for XML Binding）是最常用的XML解析工具之一。

JAXB通过将XML数据映射到Java对象上，实现了XML文档的解析和Java对象的序列化过程。

四、使用XPath查询XML数据XPath是一种用于在XML文档中查询信息的语言，它可以实现XML数据的定位、筛选和排序等操作。

在Java语言中，可以使用JDOM、DOM4J等工具实现XPath查询XML数据的功能。

XML文档解析技术研究

问ＤＯ树的内容和结构．Ｍ
１２解析方法及过程．１２１解析过程．．
基于ＤＯＭ的解析是一个三步过程：面以ｅｌｙｅ．ｍｌ下ｍｐｏｅｓｘ为例，现对其在Ｊｖ实ａａ环境的解析．
收稿日期；０６０ — ４２０－１１
Ｖ１５ｏ．Ｎｏ１．
Ｍａ．２０ｒ０６
２００６年３月
ＸＭＬ文档解析技术研究
常春燕李定主
（．１中北大学，山西太原００５．方自动控制技术研究所，３０１２北Ｉ山西太原０００）３０６
［要］对两种ＸＭＬ文档解析技术作了详细介绍，对这两种技术进行了比较．摘并
的新型Ｗｅｂ语言．具有自描述性、它数据结构高度规范、良好的扩展性、以及其数据与平台无关性等诸多优
点ｎ．］有很多应用程序都使ＸＭＬ表示数据，并保存为ＸＭＬ文档。如何有效识别及提取ＸＭＬ文档中的数据
是对ＸＭＬ文档数据后期处理的前提．这就需要对文档解析，常有两种方法，于ＤＯＭ的解析技术和基通基
５５
ＦｉｏＦｌ — ｎｗｌ（ｅｐｏｅｓｘｌ）ｌｄｃｉｅｅｅＦｉ “ ｍｌｙｅ．ｍ ” ；ｅ
Ｄｏｕｎｏ＝ｎｌ；ｃｍｅｔｄｃｕｌ．
ＤｏｕｎＢｉｅＦａｔｒｂ＝ＤｏｕｎＢｕｌｅＦｃｏｙｎｗｌｓａｃ（；ｃｍｅｔｕｌｒｃｏｙｄｆｄｃｍｅｔｉｒａｔｒ．ｅｎｔｎｅ）ｄＤｏｕｎＢｕｌｅｂ＝ｄｆｎｗＤｏｕｎＢｕｌｅ（；ｃｍｅｔｉｒｄｄｂ．ｅｃｍｅｔｉｒ）ｄｄｃｄ．ａｓ（ｏＦｌ）ｏ＝ｂｐｒｅｄｃｉ；ｅ

XML技术在军事信息系统数据交换和集成中的应用研究

XML技术在军事信息系统数据交换和集成中的应用研究摘要：随着军队信息化的不断推进，网络环境下多军事应用协同工作逐渐常态化，这对多应用间的数据交换和集成提出了较高的要求。

分析了基于XML技术进行数据交换的原理与特点，重点论述了基于XML进行数据交换的模式与实现流程，并结合实例提出了基于XML 进行军事信息系统数据交换和集成，以及有关安全的解决方案。

关键词：XML；数据交换；数据集成；军事信息系统0 引言军事信息系统中，各种数据来源不一、类型多、结构性强、交互流程复杂、保密要求高，既有陆情、海情、空情、二炮等军种专用情报数据，又有情报侦察、预警探测、指挥控制、军事通信、信息对抗等各种业务共用指挥数据，还有气象水文保障、测绘保障，以及军务、政工、后勤和装备等通用保障数据，数据交互和集成需求如图1所示。

上下级系统和各应用系统尽管技术体制统一，但往往一个系统的输出是另一系统的输入，如作战编成和作战任务的下发、装备保障需求和战损统计的上报等，需要采取统一的数据格式，让用户以透明的方式进行数据访问和交互，从而集中精力进行业务处理，极大地提高指挥效率，如图1（a）；军兵种系统间，各种数据由于建设阶段不一、数据特点各异，因而使用的数据管理系统、数据本身存储组织形式、数据字典都不一样，数据共享和交互比较复杂，很难使用统一的形式进行访问，需要进行综合集成，如图1（b）；业务系统间，各种情报信息、态势信息、保障信息以及军事信息需形成完整的战场信息回路，将传感器、指挥控制系统和武器系统连接起来形成一体化的武器装备体系，从而形成信息优势，实现对各个作战部队、武器系统实时、快速和准确的指挥与控制，保障一体化联合作战的顺利实施，如图1（c）。

统一数据交换标准，是实现军事信息系统数据集成、进而实现系统集成，满足上下级间、军兵种间、业务部门间各个业务要素分系统之间信息共享和相互协同的需要，提高系统互联、互通、互操作能力，形成信息优势和决策优势，完成作战指挥使命任务的前提和基础。

XML技术在B2B电子商务中的应用研究

XML技术在B2B电子商务中的应用研究第一章：引言B2B电子商务是近年来快速发展的领域之一，XML技术被广泛应用于该领域中。

本文将着重对XML技术在B2B电子商务中的应用进行研究，探究XML技术的优势和局限性。

第二章：XML技术概述XML（可扩展标记语言），是一种用于描述和传输数据的标准规范。

它利用标签来描述和组织数据，不仅可以将数据传输到不同平台中，还可以进行数据分离、简化和标准化。

XML可以定义自己的标签，从而实现面向对象的数据交互。

第三章：XML技术在B2B电子商务中的应用1. 数据交换标准化XML技术在B2B电子商务中最主要的应用就是进行数据交换标准化，它可以帮助不同企业之间进行数据交换。

XML文件的格式可以在所有计算机系统之间实现共用，从而使得企业之间的数据交换变得更加容易和快捷。

同时，XML技术可以对数据进行严格的验证和规范，从而最大限度地避免数据的错误和重复。

2. 电子商务的业务流程管理XML技术还可以在B2B电子商务中实现业务流程管理。

通过建立一个业务流程模型，企业可以将其业务过程标准化，实现各个部门之间的协同。

XML技术可以实现对不同的企业数据进行分类，并对不同数据流的实现进行不同的操作，从而实现自动化业务流程管理。

3. 网络服务管理XML技术可以帮助企业进行网络服务管理，从而实现多个不同平台之间的协同。

企业可以使用XML技术来描述它的网络服务，并通过网络连接其他企业的XML描述，从而实现整个网络的服务链。

这样，不同的企业就可以通过网络资源共享，实现资源的最大化利用。

第四章：XML技术的优势和局限性1. 优势XML技术具有良好的可读性和可扩展性，使得它能够在不同平台之间进行数据交换。

它还可以通过XSLT对XML文档进行转换和处理，从而实现XML文档的多种显示方式。

XML技术在数据管理和处理中具有灵活性和可靠性，可以实现多层次的数据处理和管理，提高数据的利用价值。

2. 局限性与JSON技术相比，XML技术的处理速度较慢，因为XML技术必须首先将其文档解析为文本格式，然后再转换为数据格式。

XML技术在分布式应用中的研究及其应用的开题报告

XML技术在分布式应用中的研究及其应用的开题报告一、选题背景随着网络技术的不断发展，分布式应用正成为越来越多的应用开发者的首选。

在分布式应用中，不同的应用之间需要进行数据的交换，因此数据交换的规范化和标准化成为了一个非常关键的问题。

XML作为一种通用的数据交换格式，在分布式应用中具有广泛的应用前景。

二、选题意义和目的XML技术是一种非常重要的数据交换技术，其在分布式应用中的应用已经越来越广泛。

本次研究的目的是深入研究XML技术在分布式应用中的应用，探讨XML技术在分布式应用中的优点和不足，并进一步探究如何克服XML技术在分布式应用中的不足，提高XML技术在分布式应用中的应用效果。

本次研究的意义在于提高分布式应用开发的效率和质量，增强XML技术在分布式应用中的应用前景。

三、研究内容1. 分析XML技术在分布式应用中的应用特点和优势。

2. 探讨XML技术在分布式应用中的应用不足和局限性。

3. 研究如何克服XML技术在分布式应用中的不足，提高XML技术在分布式应用中的应用效果。

4. 根据研究成果，开发并实现基于XML技术的分布式应用系统。

四、研究方法本次研究将采用文献研究和实验研究相结合的方法。

通过查阅近年来国内外有关XML技术在分布式应用中应用的文献和资料，深入研究XML技术在分布式应用中的应用特点和优势；通过实验研究，探讨XML技术在分布式应用中的应用不足和局限性，并研究如何克服这些不足和局限性，提高XML技术在分布式应用中的应用效果。

五、预期成果通过开展本次研究，预期可以得到以下成果：1. 深入分析XML技术在分布式应用中的应用特点和优势。

2. 发现XML技术在分布式应用中的应用不足和局限性。

3. 提出解决XML技术在分布式应用中应用不足和局限性的方法。

4. 开发并实现基于XML技术的分布式应用系统。

5. 将研究成果用于提高分布式应用开发的效率和质量，增强XML技术在分布式应用中的应用前景。

六、研究计划本次研究计划分为以下几个阶段：第一阶段：调研阶段，负责人根据选题背景，通过大量文献资料的搜集、阅读和分析，对XML技术在分布式应用中的应用进行调研，撰写调研报告，并确定研究内容和方向。

XML模式匹配技术研究

XML模式匹配技术研究摘要:目前随着Web上数据的倍增,针对庞大的信息海洋,人们面临Web上存在的两大问题:一是Internet速度非常慢,有时像爬行的蜗牛。

二是即使可以在线获得各种信息,但是要找到所需要的信息却极度困难。

这当中有硬件方面的原因,但最主要的原因是由于目前Web 语言—HTML的性质引起的。

关键词:XML模式技术研究1 XML前景与特点可扩展标记语言(Extensible Markup Language,简称XML)的产生改变了Web的根本面貌。

1998年2月,W3C(全球互联网联盟)给出了正式的版本XML 1.0,并且正式规定XML为下一代互联网标准。

与HTML相比XML具有许多优点:①XML很简单,进行自我描述而且易于解析。

②HTML中的标记是不变的,不能进行扩展,可是XML的标记则由用户定义,能任意的扩展。

③HTML中的标记表示方法是数据的显示格式,无任何语义,可是XML的标记就明确规定数据的含义,让细粒度的XML成为数据处理。

④XML实现了结构、表现和内容三者的分离。

1.1 自描述性XML准许个人、各个组织建立适合自己的标志集合,这一特征可以让XML在电子商务、保险机构、政府文档、司法、出版、、厂商以及中介组织信息交换等领域进行广泛应用,面对厂商、不同系统提出独特的解决方案。

1.2 可扩展性XML在两个方面是可扩展的,首先它准许开发者创建自己的数据模式,以便创建多种应用的“可扩展”标记集。

其次,它使用与XML相关的标准,这样对XML的扩展,同时这些扩展给XML添加了查询、转换、链接的能力,同时XML作为核心标准,它可以为创建其他标准提供了一个稳固的基础。

1.3 跨平台性XML不仅在多种平台上使用,还可以用多种工具对其进行解释,并对几种主要的字符编码作为主要标准支持,所以它能在全世界使用在许多不同的计算机环境中。

只要在各系统装有相应的XML解析工具,那么就能理解它是以XML为中介把其他系统传递来的信息加以利用。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

XML解析技术研究摘要：XML作为过去十年中出现的最流行的技术之一，得到了广泛的应用，而其中XML解析技术是XML应用的关键。

本文介绍了XML解析技术的研究动向，分析和比较了4种XML解析技术的优劣，并归纳总结了应用系统设计中选取合适的XML解析技术的原则。

1 引言XML（eXtensible Markup Language，可扩展标记语言）是由World Wide Web 联盟（W3C）定义的元语言，即一种关于语言的语言。

XML的设计源于SGML （Standard Generalized Markup Language，标淮通用标记语言），是SGML的子集，其目的是为了促进Internet上结构化文档的交换。

简单的说，XML是一组规则和准则的集合，用于以无格式文本来描述结构化数据[1].1996年W3C联盟就开始从事XML的标准化工作，并于1998年2月10日发布了XML1.0.XML的出现给分布式计算领域带来了重大影响，其力量源于它的数据独立性[1].XML是纯数据描述，与编程语言、操作系统或传输协议无关，从而将数据从以代码为中心的基础结构所产生的约束中解放出来，让数据能够在Web上更自由的流通。

然而XML本身只是以纯文本对数据进行编码的一种格式，要想利用XML，或者说利用XML文件中所编码的数据，必须先将数据从纯文本中解析出来，因此，必须有一个能够识别XML文档中信息的解析器，用来解释XML文档并提取其中的数据。

然而，根据数据提取的不同需求，又存在着多种解析方式，不同的解析方式有着各自的优缺点和适用环境。

选择合适的XML解析技术能够有效提升应用系统的整体性能，因此，了解和区分各种不同的XML解析技术就显得尤为重要。

2 XML解析技术分析所有的XML处理都从解析开始，无论是使用XSLT或Java语言，第一步都是要读入XML文件，解码结构和检索信息等等，这就是解析，即把代表XML文档的一个无结构的字符序列转换为满足XML语法的结构化组件的过程。

2.1 XML解析技术的分类根据从XML中获取数据的简易性，性能和最终所得到的数据模型的不同，XML 解析技术大致可分为以下四类：1）面向文档的流式解析；2）面向文档的对象式解析；3）面向文档的指针式解析；4）面向应用的对象式解析；这四类解析技术分别处于不同的抽象层次，适用于不同的应用场景，有着各自的优缺点。

针对具体的应用需求，选择合适的解析技术，往往能够减少内存消耗，缩短处理时间，更方便地获取数据，提高应用系统的整体性能。

2.2 面向文档的流式解析技术流式解析是一种基于事件的解析过程，解析器顺序读取XML文档，产生一个对应的事件流，并向事件处理程序发送所捕获的各种事件，如元素开始和元素结束等，而事件处理程序则通过不同的方法处理这些事件。

流式解析是将XML文档作为一个数据流来处理，因此，它具有类似于流媒体的优点，能够立即开始读取数据，而不是等待所有的数据被处理。

而且，由于应用程序只是在读取数据时检查数据，不需要将整个文档一次加载到内存中，使得在处理大型文档时具有较好的时间和空间上的效率。

然而效率的代价是易用性的降低，流式解析编程较为复杂，程序员需要负责更多的操作。

并且由于应用程序没有以任何方式存储数据，所以使得更改数据或在数据流中往后移是不可能的。

再加上它的单遍解析特性，意味着它也不支持随机访问。

流式解析又分为两种解析方式：推式解析（SAX）和拉式解析（StAX）。

这两种方式的主要区别在于是由解析器还是应用程序控制读循环（读入文件的循环）。

2.2.1 推式解析（SAX解析技术）SAX（Simple API for XML）解析技术就是一种推式解析，在这种解析方式中，解析器控制着读循环，在文档结束之前控制权不会返回给应用程序[3].解析器通过回调的方式进行数据处理。

SAX提供了一个用于处理XML的，基于事件驱动的简单API.它的设计开始于XML-DEV邮件列表成员间的讨论，他们开发出的第一个接口草案SAX1.0于1998年1月发布，其后在2000年5月发布了SAX2.0，目前最新版本是2004年4月发布的SAX2.0.2.SAX没有经过官方的标准机构认可，它不由W3C联盟或其它任何官方机构维护（现在，SAX由David Megginson维护） [4]，但它被广泛使用并视为XML社区事实上的标准。

SAX最初是为Java而定义的，但也可以用于Python、Perl、C++等其它语言。

SAX是基于事件驱动的，即SAX解析器在读取XML文档的过程中生成一个事件流，并且对于每个事件通过回调事件处理程序中相应的方法来进行处理。

比如元素开始和结束标记，元素内容，实体，语法分析错误等事件。

针对下面的简单XML文档，所产生的事件如图1所示，注意针对元素内的空格或回车也会生成一个文本事件。

图1 SAX解析器生成的事件SAX中的核心事件处理程序是一个实现了ContentHandler接口的类。

此接口中定义了处理与XML文档本身关联的事件的方法，如 startDocument、endDocument、startElement、endElement、Characters等SAX解析技术具有所有流式解析技术的优点和缺点，但是由于在整个解析过程中，解析器掌握着控制权直到文档结束，应用程序很难在获得所需的部分数据后停止解析过程（可以通过抛出异常的方式终止解析过程，但较为复杂，而且终止后也无法继续解析过程），因此产生了由应用程序掌握控制权的拉式解析方式。

2.2.2 拉式解析（StAX解析技术）StAX（Streaming API for XML）解析技术是一种拉式解析，在这种解析方式中，应用程序控制着读循环。

循环中，应用程序负责反复调用解析器获得下一个事件，直到文档结束。

通过保留解析过程的控制权，可以简化调用代码来准确地处理它预期的内容，并且可随时停止解析。

此外，由于该方式没有基于处理程序回调，应用程序也不需要像SAX中那样模拟解析器的状态。

StAX针对同样的XML文档所获得事件类型和SAX基本相同，但是StAX包含了两套处理XML的API：基于指针的API和基于迭代器的API，分别提供了不同程度的抽象[5].基于指针的API简单的返回事件，此时事件用数值形式来表示。

这是一种低层API，没有提供底层XML结构的抽象，所有的状态信息直接从流读取器获得，不需要创建额外的对象。

从而节约内存，拥有较高的效率。

而较为高级的基于迭代器的API则以对象方式返回事件，每个事件对象都封装了它所表示的特定XML结构固有的信息，因此可直接利用其方法获得属于该结构的信息，但也需要额外的对象创建开销。

相对于基于指针的API，基于迭代器的API具有更多的面向对象特征，因此更便于应用于模块化的体系结构。

StAX也是用Java定义的，其StAX1.0于2004年3月发布，并且成为了JSR-173 规范，最新版本为2006年6月发布的StAX1.2.StAX作为用Java语言处理XML的最新标准，比早期出现的XPP （Xml Pull Parser）拉式解析器功能更为强大，也得到了更为广泛的应用。

2.3 面向文档的对象式解析技术由于流式解析方式固有的无法更改数据和不支持随机访问特性，尤其是没有对XML文档的结构建模，使得应用程序很难对XML文档进行搜索、修改、添加和删除等操作。

为了解决这些问题，产生了面向文档的对象式解析技术——DOM.DOM（Document Object Model）是用与平台和语言无关的方式对XML文档进行建模的官方W3C标准[6]，其目标是提供一个可以通用于各种程序语言、操作系统和应用程序的接口。

DOM最初被当作Web浏览器识别和处理页面元素的方式，即在W3C介入之前的功能，称为“DOM Level 0”。

W3C于1998年10月提出了“DOM Level 1”建议，支持XML1.0和HTML处理。

随后于2000年11月提出了“DOM Level 2”建议，对Level 1进行了扩展，支持XML1.0、命名空间和CSS，也支持用户接口和树形操作事件，并且添加了DOM树形操作功能。

最新的“DOM Lev el 3”建议于2003年6月提出，在level 2的基础上添加了对DTD、XML模式和XPath的支持[1].DOM作为一种对象式解析技术，定义了层次化对象模型来表示XML文档。

即为XML语法中的每个概念（如元素，属性，实体，文档等）定义对应的类，而解析器在读入XML文档的时候，会建立XML语法和类之间的一一映射。

实际上，DOM 的层次化对象模型是一个树形结构，它将一个XML文档看作一棵节点树，每个节点代表一个XML文档中的元素。

DOM的基本节点对象有5个[1]：（1）Document 对象：是树的最高节点，也是对整个文档操作的入口；（2）Element和Attr对象：对文档中元素和元素属性的映射；（3）Text对象：作为Element和Attr 对象的子节点，代表了元素或属性的文本内容；（4）NodeList对象：对节点按指定的方式进行遍历。

例如对于2.2.1中的XML文档，其对应的DOM节点树如下图所示（注意元素内的空格或回车也会被当作文本对象）：图2 DOM节点树（矩形框表示元素节点，椭圆表示文本节点）利用DOM在内存中建立的完整的XML文档的树形结构，开发人员就可以方便的对XML文档进行一系列操作，如遍历、增加、删除、修改文档内容等，且具有良好的导航能力。

同时DOM所具有的对象特性也非常便于面向对象编程。

然而，由于DOM在使用数据前需要完整的遍历XML文档，在内存中构建树形结构表示，因此需要消耗大量的内存，尤其是对于大型文档，性能下降的很快。

而且必须一次解析整个XML文档，不可能只做部分解析，当只关注XML文档的小部分数据时，效率很低。

（Axis2项目中的Axiom对象模型实现了对XML文档的部分解析，可构建不完整的节点树，但实现较为复杂）由于DOM是与语言无关的，当DOM接口进入指定语言的数据结构时，会产生不必要的复杂性，无法利用语言本身的优势。

因此出现了许多与DOM类似的针对特定语言的对象模型。

如JDOM就是针对Java的特定文档对象模型，JDOM使用具体类而不使用接口，简化了API，并在API中大量使用了Java集合类。

DOM4J 则是JDOM的一种智能分支，它提供了对XPath和XML Schema的支持，并且通过DOM4J API和标准DOM接口使其具有并行访问功能[5].它们都属于面向文档的对象式解析技术。

2.4 面向文档的指针式解析技术前面提到的面向文档的流式解析效率较高，但易用性差，而对象式解析易用性强，却效率较低，这两种方式似乎处于两个极端。

XML解析技术研究

合集下载

XML文档快速解析技术研究

基于事件模型的MusicXML解析器

XML文档解析技术研究

基于StAX中指针API的XML数据解析技术研究

XML模式匹配技术研究

XML的相关技术及数据交换研究

XML技术在信息共享领域的应用研究

XML技术在铁路信息交换中的应用研究

XML技术研究

XML技术在IEC 61850标准中的应用研究

VxWorks平台XML文档显示技术研究

如何利用Java语言进行XML编程的研究报告

XML文档解析技术研究

XML技术在军事信息系统数据交换和集成中的应用研究

XML技术在B2B电子商务中的应用研究

XML技术在分布式应用中的研究及其应用的开题报告

XML模式匹配技术研究

文档推荐

最新文档