基于P2P的个性化Web信息检索

格式：pdf
大小：442.07 KB
文档页数：5

下载文档原格式

P2P技术：信息检索发展趋势和一种MRD算法思想

节点负担沉重。且共享的内容很难确定地划分为独立的区域。而往往每个节点属于多个ｔｐｓｏｉ。ｃ此外．有人按照预先指定的分类标准对用户进行分类。还并使用这些分类来启发路由．查询传递到相同类别的节点中去，把从而减少传输代价。但这种分类的标准需要预先定义，不够灵恬同时也无法动态地反映ＰＰ共享网络中的内容更替。２．２法或采用启发策略加入网络．网络拓扑随着节点的变迁和网络２ＰＰ的发展趋势与展望．２通信的进行而发生演变，例如。ｎｔｌＧｕｅａ属于这类网络。ｌ在非结构２１ＰＰ的发展趋势化ＰＰ网络内进行搜索的技术分为两类：２ＰＰ信息检索是近两年的研究热点．这方面的研究具有以２（）利用任何文档分布信息的盲搜索（ｌｄｓａｃ）这类下发展趋势：１不ｂｎｅｒｈ：ｉｆ１１发展兴趣关系网络。按照用户的趣组建网络（世界小研究都可以抽象为如何从一个随机图中的任一个点出发定位目标点。使得整个过程遍历的点的个数最少。中最具典型代表意特性）其。研究表明，良好的聚团性质和短路径性质（意两点间的任义的是Ｇｕｅａ的宽度优先遍历搜索（Ｆ１ｎｔｌｌＢｓ。最小路径都在某个较小的范围之内１可以被刺用来提高共享效（）用网络中文档分布信息的搜索（ｆｒｄ８ａｃ）对率。２利ｉｏｅｒｈ：ｎｍｅＢｓ的改进特点是各个节点记录以前接受过的请求和应答．Ｆ并（１ＰＰ检索中引入更多的信息检索技术。息检索是一２在２信根据这种对应关系作为对后来的路由过程的启发。通过记录邻个相对成熟的领域，以提高ＰＰ检索的效率。可２居的文档信息来尽量查询路由到相关的节点．从而减少不必要ｆ１３采用融合的技术研究问题。非结构化和结构化的一些改的通信量。给出一种定期交换路由表的方法使得每个节点都获进技术可以融合成新的技术．兼二者之长处。两者的界限会越来知网络内部的一个子集的文档分布状况．从而达到迅速定位目越模糊。如ＳＮ公司提出的ＪＴＵＸＡ架构所采用的ＬｏｅＨｏｓＤＴ技标资源的目的术．就是一种结构化和非结构化技术的融合。上述方法都是对原有在非结构化网络上检索的改进．对现（１４研究和人类社会网络结合的ＰＰ网络。２下一代的ＰＰ共２有的Ｇｕｅａ等基于文件名检索的ＰＰ文件共享网络比较适享网络将会结合人类社会的特点进行发展．更加明确的身份认ｎｔｌｌ２用。但无法胜任全文信息检索．为了保证较高的文本的召回率证，更加安全高效的组内协作。更加严格的内容监控都将会是以（ｃｌｒｔ。ｒａ —ａｅ需要覆盖较多的节点。ｅｌ）牺牲较大的通信带宽和主机后的发展方向计算代价，对于稀疏资源的定位更是如此。２２ＰＰ技术的朱来与展望．２１．２结构化ＰＰ网络中的搜索技术２ＰＰ在技术层面上并非高深莫测．但正是这个看似简单的２结构化网络指的是Ｔｐｓｙ和Ｃｏｄ之类的点对点网络。技术却蕴藏着无穷的刨造力目前不少企业都把目光投向了ａｅｔｒｈｒ在这类网络中，个节点都有固定的编址，个网络具有相对稳ＰＰ每整２．而许多ＢＢ公司的技术专家也对ＩＰ技术产生了浓厚的２）２定而规则的拓扑结构兴趣．他们认为．２ＰＰ技术可以重新焕发在线交易技术的生命１．于兴趣局部性优化的ＰＰ搜索３基２力。另外，２ＰＰ技术在移动通信和智能网络领域的应用也非常有这类方法基于这样的原则：每个节点都表现出某些可以捕意义。目前Ｓｎ微系统公司ＪＴｕＸＡ计划中的ＰＰ协议就将允许２捉到的兴趣，相近兴趣的节点保存内容和提交的查询也相近。通在使用ＰＡ产品和移动电话等手持设备之间的用户进行文件Ｄ过挖掘每个节点的兴趣，节点按照兴趣关系组成网络。得兴交换和资料共享。还有就是对于目前人们只益关注的网站可用把使趣相近的节点在网络中比较接近性问题．用ＰＰ技术将在提高网站效率方面值得探究。采２目前主要的研究是按照用户提交的检索的行为来划分用户目前。全球择种与ＰＰ有关的研究项目层出不穷，２应用热潮的兴趣。种按兴趣组成的网络表现出和社会网络相近的ｌＪ这ｌ、／世也是一浪高过一浪。而人们对ＰＰ寄予厚望的原因正是ＰＰ身２２界（￣－ｏｌ）特性。ｓｍｗｒ ” ｄ该特性用于提高检索效率证明是有效的。后所蕴藏着的无比的创造力。在可以预见的未来。随着对ＰＰ研２但这类研究没有充分地挖掘节点共享的内容所体现的节点的兴究的进一步深入和关注ＰＰ企业的逐渐增多．２２ＰＰ必将进入一趣。用户提交的查询只是反映用户共享兴趣的一个部分尤其对个飞速发展的新时期于提供大量信息的节点．所产生的查询只是反映其存储内容的３基于ＰＰ信息检索的ＭＲ算法思想．２Ｄ个很小的子集目前已有的搜索技术都是在折中最快搜索速度、最低网络有人提出通过节点共享的内容来挖掘节点的兴趣。它使用效率的ｆｏｉｌｄｎｏｇ方法。与较少带宽消耗、很长响应时间、少搜索较类似于分布式检索的方法。由代理节点定期采集各个共享节点结果的Ｒｎｏｌｅ方法把局部性原理用于ＰＰ网络搜索．ａｄｍＷａｒｋ２共享的内容索引。然后通过聚类的方法把这些索引分成若干话希望解决ＰＰ搜索的查询追求更快的搜索质量与网络管理追求２题区域（ｐｃｅｍｎａｏ）每个节点属于一个或两个区域。对每最小的搜索代价之问的矛盾ｔｉｇｅｔｉｎ．ｏｓｔ次查询．也通过计算查询和各个话胚区域中心的距离来判断该虽然ＰＰ网络中的成员Ｐｅｓ间都是对等关系．但同实２ｅｒ之查询所属的区域路由查询时先路由到该查询所属的目标区域．际社会一样，网络社会中也总是存在所谓的幂律（ｏｅｄ）Ｐｗ卜【ｗ：

基于P2P网络的信息检索系统设计与实现

随着Ｉｎｔｅｒｎｅｔ的快速发展，网络所蕴含的信息量急剧膨胀，
现有基于Ｃｌｉｅｎｔ／Ｓｅｒｖｅｒ模式的搜索技术存在着服务器单点失效、
本文采用ＪＡＶＡ语言和ＪＸＴＡ技术构建了一种基于Ｐ２Ｐ
的网络分布式信息检索系统，功能包括：建立本地对等点信息并
第２３卷
第ｌ８期
收稿日期：２０１３－０７ — ０８
基于Ｐ２Ｐ网络的信息检索系统设计与实现
梁铖华
（湖南理工学院图书馆，湖南岳阳，４１４０００）
摘要：设计了一种基于Ｐ２Ｐ网络的信息检索系统，其主要功能包括：显示网络中所有
相关信息，所有可用的对等点维护一张逻辑索引表，索引表的内容为系统中资源的描述和其物理存储位置，管理本地文件共享状态，基于标题搜索整个存储空间中的资源并下载所需的资源。
源的请求者，全分布式缓存空间极大地促进了信息检索的效
率¨ ］。Ｐ２Ｐ网络是一种全分布式网络，对等体拥有各自的资源，而这些资源可以供网络中其他对等体共享，这些共享资源需要为网络提供服务和内容，也就是说Ｐ２Ｐ网络中的对等点无需经过中央服务器就可以相互通信、共享资源。对等Ｐ２Ｐ模式可以让用
ＡｎａｌｙｓｉｓｏｎｔｈｅＮｅｔｗｏｒｋＩｎｌｆｕｅｎｃｅｏｆｔｈｅＦｏｒｅｉｇｎＬａｎｇｕａｇｅＰｏｒｔａｌｓｏｆＣｈｉｎａ’ ＳＣｏｌｌｅｇｅｓａｎｄＵｎｉｖｅｒｓｉｔｉｅｓ

P2P 技术在互联网中的应用和分析

P2P 技术在互联网中的应用和分析随着信息技术的飞速发展，基于P2P 的分布式网络资源共享系统逐渐成为用户获取数据信息的重要手段，本文对P2P 技术的结构模式和特点进行描述，对P2P网络应用加以说明，并对未来P2P的发展进行了展望。

标签：P2P 技术网络应用探讨一、引言P2P（Peer-to-Peer）又称为对等网，是近几年非常流行的一种网络技术，和传统的客户机/ 服务器模式不同，P2P 技术依赖网络中所有参与者的处理能力和信息共享，它改变了人们部署网络硬件资源的方式，为网络的发展提供了一种新的思路。

P2P 技术具有良好的扩展性和健壮性，性价比较高，P2P 网络是建立的基础是IP 网络，网络中所有安装特定软件的客户端构成一个逻辑P2P 网络，网络中的资源和应用分布在所有客户端上，各用户之间的数据传输无需服务器的介入就能够直接通信，通过这样的方式，大量的客户资源能够充分得到利用，降低硬件成本和，简化了复杂性。

二、P2P的结构类型P2P 网络的结构主要有三种模式：中央式P2P 网络、无中心结构P2P 网络和混合式P2P网络。

1.中央式P2P中央式P2P 网络在硬件部署上有一个中心服务器，主要负责维护共享资源信息以及对客户端查询信息作出回应。

根据中心服务器提供的功能，又可分为以下三类：1.1服务器提供资源的发现，查询和存储。

这种模式与传统的C/S 模型中一样，所有资源都存放在服务器上，客户端从服务器上获取信息，但客户端之间并不具有信息交换能力。

1.2服务器提供发现和查询。

在这种结构中，客户端存储共享资源信息，服务器则提供索引信息，服务器与客户端、客户端与客户端都可以进行数据信息交互。

1.3服务器仅提供发现功能。

在这种方式下，服务器仅提供在客户端的列表信息，客户端彼此之间建立连接和通信。

如果某个用户需要获取某个资料文件，会根据服务器提供的列表清单，依次查询所有的客户端，直到找到所需的资源，如果没有找到，则返回错误信息。

WebPeer：一个基于P2P的Web服务平台

智李瑞轩杨，
俊
（．１武汉科技大学计算机学院，湖北武汉４０７；２华中科技大学计算机学院，湖北武汉４０７３００．３０４；３大冶特．
关键词：对等计算；Ｗｅ服务；Ｗｅ服务描述语言ｂｂ
中图法分类号：Ｔ３３Ｐ９文献标识码：Ａ文章编号：１０ — ６５２０）５０１．３０１３９（０６０．２００
ｃｍｅｔｅｅｌｔｔｎ。ｔｅＷｅＰｅ — ２ａｅｅｅｉｅｌｔｒｉｄｓｇｅ．ＴｉｐａｆｒｏｎｙｃｎａｃｒｔｅｏｈｓｉａｉｓｈｂｅｒａＰＰｂｓｄＷｂＳｒｃｓｐａｏｍｓｅｉｎｄｈｓｌｔｍｎｔｌａｃｄｃａｅｔｍｉｏｖｆｏｏｈ
＆ＴｃｎｌｙｕａｎｖｒｔＳｉｃ＆Ｔｃｎｌｙｕａｕｅ４０７，ｈｎ；２ＣｌｇＣｍｕｅｈｏｏ，ＷｈｎＵｉｓｙｏｃｎｅｅｈｏ，ＷｈｎＨｂｉ３００Ｃｉａ．ｏｌｅｇｅｉｆｅｏｇｅｏｏｐ— ｆ
ｔｃｎｅ＆ＴｃｎｌｙＨｕｚｏｇＵｂｒｔ￣ｉｅ＆ＴｃｎｌｙｅＳｉｒｅｃｅｈｏ，ａｈｎｎＪｓｙｏｅｏｇｅｉｆｃｎｅｈｏ，Ｗｕａｕｅ４０７Ｃｉ；３ＤａｅＳｅＧｏｐＣ．Ｌｄ．ＣｍｏｇｈｎＨｂｉ３０４，ｈｎａ，ｙｔｌｒｕｏｔ．ｏ — ｅ
Ｋｅｏｄ：ＰＰ（ｅｒｔＰｅ）ｙｗｒｓ２Ｐｅ— －ｅｒ；ＷｅｅｉｓｏｂＳｒｃ；ＷＳＬｖｅＤ

一种基于P2P的关键词搜索新方法

一种基于P2P的关键词搜索新方法
俞剑;关佶红
【期刊名称】《微电子学与计算机》
【年(卷),期】2009()8
【摘要】结构化对等(P2P)网络是基于文件标识符的分布式系统.它能够很好地支持对文件标识符的等值查询,但对于其他的复杂查询,则需要进行进一步扩展.现有的一些技术虽然在结构化对等网络实现了关键词搜索,但是仍然存在诸如负载不均衡,结构复杂,不易于部署和效率低等问题.对此提出了一种基于结构化对等网络的关键词搜索新方法,将构建在一般分布式哈希表上的倒排索引与top-k查询算法结合起来,以较少的代价实现关键词搜索,同时有效地克服了数据分布不均匀带来的负载不均衡问题.
【总页数】5页(P68-71)
【关键词】P2P;关键词;搜索;top-k;算法
【作者】俞剑;关佶红
【作者单位】同济大学电子与信息工程学院
【正文语种】中文
【中图分类】TP393
【相关文献】
1.一种基于社会行为的非结构化P2P搜索算法 [J], 朱国晖;张武强;鲁春兰
2.Clair:一种基于P2P的BitTorrent关键词检索系统 [J], 肖建勇;张武生
3.一种基于Chord的P2P搜索算法的研究 [J], 马建宏;钟绍辉
4.一种基于信任模型的P2P快速搜索算法一SAT [J], 范会波;张新有
5.一种基于社会行为的非结构化P2P搜索算法 [J], 朱国晖;张武强;鲁春兰;
因版权原因，仅展示原文概要，查看原文内容请购买。

基于P2P技术的网络资源搜索机制研究

引擎能够以与传统搜索引擎完全不同的方式来提供
检索服务，有效克服了这些问题。
１ＰＰ简介２
ＰＰ是英文ｐｅ —ｔ —ｐｅ的缩写，为对等网２ｅｒｏｅｒ称
资源，搜索引擎提供了解决之道。传统搜索引擎通过网页抓取，建立索引库的方式来为人们找到自己可能想要去的页面。它的工作流程是：从互联网上抓取网页一建立索引数据库一在索引数据库中搜索
ＡｂｔａｔＴｈｅｗｏｋｆｌｄｗｉｈｖｓｍｏｎｓｏｎｏｍａｉｎ，ｗｈｉｈｒｏｔｎｉｇｔｒｗａｉｌ．ｓｒｃ：ｅｎｔｒｌｅｔａｔａｕｔｆｉｆｒｔｏｉｃａｅｃｎｉｕｎｏｇｏｒｐｄｙＰｏｌｅｙｏｔｄｔｎｌｅｒｈｎｉｅｔｆｎｔｅｎｏｍａｉｎｎｒｓｕｃｓｔｅｆｅｔａｅｅｐｅｒｌｎｒｉｉａｓａｃｅｇｎｓｏｉｄｈｉｆｒｔａｄｅｏｒｅ，ｈｅｆｃｈｓｂｅｎａｏｏｓｍｅａｎａｉｆｃｏｙＰＰｅｈｏｏｙａｂｏｇｔＵＳｅｃｎｅｔａｄｍｅｈｄｏｅｒｅｅ．ｗｉｏｗｈｔｕｓｔｓａｔｒ．２ｔｃｎｌｇｈｓｒｕｈａｎｗｏｃｐｎｔｏｔｒｔｖｉｌｌｂｃｍｅｔｅｕｕｒｅｅｏｍｅｔｉｅｔｎｆｔｅｅｒｈｎｉｅ．Ｉｈｓｐａｅ，Ｐ２ｔｃｏｏ，Ｐ２ｅｏｆｔｅｄｖｌｐｎｄｒｃｉｏｈｓａｃｅｇｎｓｎｔｉｐｒｈｏＰｅｈｎｌｇｙＰｓａｃｎｌｓｉｃｔｎａｅｂｉｆｙｓｍｍａｚｄａｄｃｍｐｒｄ．Ｉｌｏｐｉｔｕｈｕｕｅｄｖｌｐｎｅｒｈａｄｃａｓｆａｉｒｒｅｕｉｏｌｉｒｅｎｏａｅｔａｓｏｎｓｏｔｔｅｆｔｒｅｅｏｍｅｔ

基于P2P技术的网络信息检索的探讨

交流、件交换、布计算、同、度检索等方面应用十分广文分协深泛。一般来说．２ＰＰ有两个层面的基本含义：ＰＰ通信模式。这种模式区别于传统的客户机，务器或２服者主，（ｓＳａｅ模式，个通信方都具有相同的能力。从Ｍａｔｌ）ｍ／ｖ每并且每个通信方都可以发起一个通信过程．ＰＰ网络。ＰＰ网络是运行在互联网上的动态变化的逻２２辑网络。这个网络是由一些运行同一个网络程序的客户端彼此互连而构成的．客户端彼此间可以直接访问存储在对方驱动器上的文件。 ’ＰＰ使得网络上的沟通变得更容易、用户可以直接共享和２交互而不必借助中间商．不用像过去那样必须连接到服务器才能浏览与下载。ＰＰ另一个重要特点是改变了互联网以太网站２
－
要建立在分布式Ｈａｈ表之上。ｓ在给定资源的索引情况下．能够
在０１跳之内定位到索引对应的节点。（即）２ＰＰ的概念和结构模式．２
２１ＰＰ的概念．２
ＰＰ是ｐ－ｏｐｅ２￣ｒｔ— ｅｒ的缩写。目前ＰＰ技术在加强网络上２
挖掘网络边缘资源，可提供个性化的信息服务。本文从ＰＰ技术的基本原理入手，并２围绕ＰＰ技术的基本概念、用范围和２应

P2P网络搜索技术

P2P网络搜索技术王婕;王亚美;廖婧;赵婧文【摘要】With the rapid development of P2P technology, the P2P Search that is the key technology of P2P applica-tions has become the focus of researches. The P2P search technology its structure and it differs from each other under different network architectures. The research development ofP2P was introduced in this paper, and further different search algorithms explored the development and direction of the P2P Search technology.%随着P2P技术的蓬勃发展，作为P2P应用中核心的搜索技术成为研究人员关注的焦点。

P2P网络的搜索技术与其结构有着密切联系，不同网络体系结构下的搜索技术各不相同。

介绍了 P2P 技术近几年的研究进展，阐述了目前P2P系统中不同结构下核心搜索算法，探讨了P2P搜索技术的发展方向。

【期刊名称】《计算机系统应用》【年(卷),期】2013(000)001【总页数】4页(P13-15,47)【关键词】P2P;搜索;体系结构;原理【作者】王婕;王亚美;廖婧;赵婧文【作者单位】中国地质大学软件工程系，武汉430074;中国地质大学软件工程系，武汉 430074;中国地质大学软件工程系，武汉 430074;中国地质大学软件工程系，武汉 430074【正文语种】中文1 引言P2P又称对等网络, 由一系列地位对等的结点组成, 结点数目可以动态的增加和减少[1]. P2P网络中结点相互之间直接交换信息和服务, 没有等级、格式、平台的限制. P2P技术改变了传统的C/S(客户/服务器)模式, 每一个P2P结点既是服务器端, 又是客户端, 被财富杂志列为影响Internet未来的四项科技[2]. 在传统的Web搜索中, 当用户发出搜索命令后, Web搜索引擎搜索预先整理好的网页索引数据库, 而在 P2P网络中, 资源存放在各个结点的PC机上, 结点的动态变化给P2P网络搜索增加了复杂性.2 P2P网络体系结构下搜索技术的发展1998年, 美国一名大一的新生Shawn Fanning为了实现MP3音乐共享功能, 编写了一个程序, 这个程序就是后来风靡全球的Napster, Napster运用了第一代P2P网络—集中式P2P网络. Napster系统采用一个中央的目录服务器, 该服务器不对外提供任何应用服务,仅存储连接该服务器的各个结点的相关信息, 随着系统的使用, 人们发现集中式 P2P网络体系的不足, 如果目录服务器瘫痪, 整个系统都会崩溃, 而且当用户数量增加到一定数量后, 系统性能会大大降低, 所以第二代P2P网络—全分布式拓扑结构应运而生, 分布式 P2P网络结构, 它包括两种类型, 一种是全分布式结构化的 P2P网络, 另一种是全分布式非结构化的P2P网络. 分布式结构化的 P2P网络主要采用分布式哈希表(DHT)技术来组织网络中的结点, 采用完全随机图的组织方式, 分布式非结构化的 P2P网络最典型的案例是Gnutella. 随着P2P技术的继续发展, 研究者们将集中式P2P的快速查找和分布式P2P的去中心化优势结合起来, 便形成了一种混合式的P2P网络结构,即第三代P2P网络—半分布式网络.3 集中式P2P网络搜索技术3.1 集中式P2P网络搜索原理集中式P2P网络搜索方法中, P2P 结点都与已知地址的P2P 目录服务器相连, 服务器负责对P2P 网络中的共享文件进行索引和查询, 服务器集中存放对等节点的地址信息和所保存数据的信息. 当结点资源发生变化时, 比如增加、删除、修改等, P2P 节点服务器会随之更新系统索引表[3], 如图1.图1 集中式搜索3.2 集中式P2P网络搜索过程当查询事件触发时, Peer结点根据P2P目录服务器中的信息进行查询, 通过目录服务器来间接定位其他对等点, 如图2中Peer3和Peer4的通信就是通过目录服务器的媒介作用来完成的. 用于Mp3文件共享的Napster是集中式P2P搜索最具有典型的代表, Napster系统的目录服务器存储所有该网络的结点的数据信息, 比如结点的IP地址, 文件的标题等. 当需要查询某个文件时, 结点向目录服务器发出查询请求, 服务器进行相应的检索和查询, 会返回符合查询条件的结点地址信息列表, 查询发起的结点接收到应答后, 选择最佳的结点与之建立连接, 这样两个结点之间实现文件传输, 完成搜索过程.集中式网络搜索结构简单, 查询效率高, 速度快, 不足之处在于中央目录服务器负担重, 安全性低.4 全分布式P2P搜索技术4.1 全分布式结构化P2P网络搜索技术(1) 全分布式结构化的搜索原理全分布式结构化基于分布式哈希表(DHT)进行搜索, DHT中存储形如<关键值, 数值>(< key, value >)的分布式结构, key代表数据标识, value代表数据的信息,比如结点的IP地址等[4], 每个结点负责管理一段范围内 keys. 搜索功能主要由put(key, value)和 get(key)两个函数实现[5], put(key, value)的作用是发布结点信息,get(key)的作用是查询信息, 当需要对P2P系统进行文件搜索时, 执行一次get(key)功能, 便可进行一次搜索.任何一个关键值 key, 系统中的结点要么拥有key, 要么能够连接到距离key较近的结点.(2) 全分布式结构化搜索过程首先定义在分布式哈希表中的一个文件, 名称为file, 内容为value, 计算出该文件的SHA-1的哈希值,得到其关键值key, 执行put(key, value)操作; 然后在哈希表中找到负责存储关键值 k的结点, 将(key, value)存储在该结点上; 当其他结点请求value时, 系统第二次计算file的key值, 然后执行get(key), 发送信息给结构中的任意参与结点, 找到与 key相关的信息; 最后, 此信息在网络中被传送到负责存储key的结点,此结点收到信息后, 将value值传送给请求结点, 完成搜索查询过程. 全分布式结构化搜索优点是结点的自组织能力强, 有良好的可扩展性、鲁棒性, 结点ID分配的均匀性, 缺点是服务质量不高, 易拥塞, 安全性低, 不能支持多关键查询, 维护机制复杂.4.2 全分布式非结构化P2P网络搜索技术(1) 全分布式非结构化搜索原理在全分布式非结构化网络中, 搜索方法采用泛洪(Flooding)搜索. Flooding算法首先遍历自己的相邻结点, 然后再层次性的一层层向下遍历, 在遍历过程中,一个结点向所有邻居结点广播查询消息, 邻居结点再向自己的邻居结点广播, 这个过程不断进行下去. 为了限制搜索的范围, 消息被设置了一个初始的TTL(Time To Live)值, 消息每经过一个结点, TTL值减1, 当TTL值为0时, 搜索过程结束[6].(2) 分布式非结构化搜索改进泛洪算法的算法机制导致了大量冗余消息的存在,使网络流量增加快速, 从而导致网络中部分低带宽结点失效, 查询结果正确性不高, 所以 P2P研究者在此搜索算法上进行改进, 产生了Random Walk[7], 迭代递增搜索, 启发式洪泛搜索等算法.(3) Random Walk搜索Random Walk搜索也叫随机漫步搜索, 在这个搜索中, 请求者发出N个查询请求给随机挑选的N个相邻结点, 在以后的查询过程中, 每个查询信息都直接和请求者保持联系, 当得到请求者继续下一步的同意后, 又开始进行下一轮的漫步, 直到找到要搜索的信息为止, 若请求者不同意继续, 搜索中止,如图2.图2 Random Walk搜索与前面的Flooding搜索相比, Random Walk搜索对结点信息的搜索范围有更强的控制性, 搜索范围的灵活性也增加了. 全分布式非结构化查询容错性好,支持复杂查询,受结点的动态变化影响小, 但是查询速度慢, 结果可靠性不高, 带宽消耗大, 可扩展性不好.5 半分布式P2P网络搜索技术5.1 半分布式P2P网络搜索原理在半分布式 P2P网络搜索是指在搜索过程中,运用了两种或两种以上的搜索技术进行混合搜索的方法, 这种网络结构中包含两类结点, 一类是搜索结点, 另一类是普通结点, 搜索结点和其临近的普通结点之间形成一个集中目录式的结构体, 如图3.图3 半分布式P2P搜索4.2 Geutella2的搜索算法Geutella2是半分布式P2P网络搜索的代表, 该网络结构的搜索结点中存储中与之临近的普通结点的信息, 同时搜索结点之间相互连通. 当普通结点需要查询文件时, 首先从与它连接的搜索的索引中寻找, 如果找到文件, 则直接和具有该文件的结点建立连接,否则搜索结点把该查询请求发给与它连接的其他搜索结点, 直到搜索成功. 半分布式 P2P网络搜索消除了网络阻塞, 搜索效率低等问题, 提高了网络的负载均衡性, 但是对搜索结点依赖性大, 易于受到集中攻击,容错性不好.6 总结本文针对不同P2P网络结构的搜索技术进行总结分析, 得出以下结论, 如表 1, 从表中可以看出,集中式网络结构的的可维护性, 搜索效率是最好的,全分布式结构化总体的性能较高, 全分布式非结构化的优势在于可扩展性, 支持复杂查询, 半分布式网络结构虽然混合使用了集中式搜索和分布式搜索,但是性能总体是中.表1 P2P网络结构综合性能对比表比较标准/网络结构集中式网络结构全分布式结构化网络结构全分布式非结构化网络结构半分布式网络结构可扩展性差好差中可靠性差好好中可维护性最好好最好中发现算法的效率最高高中中复杂查询支持不支持支持支持7 P2P网络搜索展望如今P2P的搜索技术研究不仅仅处于可行性研究阶段, 而是以提高搜索成功率, 缩短搜索时间为目标,综合带宽节约、负载均衡等性能要求, 研究出更专业化、个性化、智能化的搜索算法. 所以未来的 P2P搜索研究, 可以从以下方面进行考虑:在全分布式网络结构下, 如何实现多条件的复杂查询;在全分布式非结构化网络结构中, 用什么网络模型来改进算法;在半分布式网络结构中提高混合后的算法效率;研究兴趣网络, 探究搜索优化算法[8].参考文献【相关文献】1 幸冬梅,朱洪.P2P结构与搜索机制研究.计算机工程与科学,2007,29(10):108-110.2 熊仕勇.基于 P2P网络的搜索算法研究.科技创新导报,2010,27:35.3 韩运宝,戚建勋.P2P 网络搜索技术的研究现状.计算机与信息技术,2007,16:316.4 刘维光,陈立伟.一种基于DHT的P2P 搜索方法.网络与通信,2006,22(3):131-133.5 管磊,等.P2P技术揭秘.北京:清华大学出版社,2011.6 林鹏程,李文正.基于混合式P2P架构的资源搜索机制研究.科技咨询导报,2007,10:39-43.7 欧阳柏成.非结构化P2P中搜索算法的性能分析.计算机工程与科学,2009,31(6):67-70.8 吴思,欧阳松.基于兴趣相关度的 P2P 网络搜索优化算法.计算机工程,2008(6):102-107.。

基于领域本体P2P网络检索算法论文

基于领域本体的P2P网络检索算法研究摘要：针对p2p网络检索质量差的问题，提出了一种基于领域本体的p2p网络检索算法。

该算法设计了一个共享的节点本体，用rdf工具对节点进行语义抽取和知识表示，同时给出相应的查询表示及语义相似性计算方法。

实验结果表明，该算法能够有效地提高检索质量。

关键词：p2p网络检索质量领域本体相似性计算0 引言随着越来越多的资源出现在p2p网络中，一个渐增的需求是找出一种有效的方法来检索这些资源。

本文提出一种基于领域本体的p2p网络搜索算法，通过采用领域本体来封装节点知识，实现基于领域本体的知识查询，以提高检索质量。

1 基于领域本体的p2p节点模型基于文献应用领域的一个p2p网络，其节点包含节点本体(领域内的概念化模型)、本地数据(描述具体文献属性的元数据)、本地知识库(共享的知识)以及本地知识(对知识库的一个抽象的、语义上的描述)等。

每个节点用一种能被其它节点理解的方式将本地节点数据进行结构化和形式化，即提取节点知识。

例如，某个节点上存储了人工智能（ai）方面的书（book）这种文献。

其知识可抽象为文献集合{book}和主题集合{ai}。

2 基于领域本体的p2p网络检索算法2.1 节点本体设计与知识抽取文献检索应用涉及两个主要概念，即文献和主题。

因此，可将p2p节点本体细分为文献本体和主题分类本体加以设计。

由于已存在有acmcss这样的主题分类本体，因此只需对文献本体加以设计。

根据领域本体的思想，本文采用w3c的rdf知识表示工具设计文献领域中的概念、属性和关系及与主题本体的联系等。

概念也称类，包括文献(document)、书(book)、会议论文(paper)等；属性包括标题(title)、作者(author)和主题(topic)等；关系包括父类关系(superclassof)、子类关系(subclassof)、实例和类的关系(type)等，例如学位论文(paper)和文献(document)的关系为subclassof。

基于P2P的学习资源管理系统设计研究

图３Ｐ２Ｐ知识共享的社会性网络
下面从社会学的角度阐述学习者之间通过Ｐ２Ｐ学习资源管理系统如何进行有效的知识共享与交流。从社会性交互理论可知，学习者进行的社会性交互越多，获得知识共享的可能性就越大。从知识管理的角度可知，知识包括显性知识和隐性知识。显性知识是通过网络能够看到的知识，而隐性知识却隐藏在每一位共同体成员的头脑中，不论是显性知识还是隐性知识都只能通过学习者之间社会性交互才能获得。所以学习者之间可以通过Ｐ２Ｐ学习资源管理系统建立相关联结，当一个学者对某一知识发出帮助请求时，所有具备这一知识的学习者与请求者之间可建立如图３所示的知识共享的社会性网络。其中Ｋ－ｎｅｔｗｏｒｋ是Ｐ２Ｐ的学习资源管理系统中各学习者之间联系情况。这个平面便构成了一个完整虚拟社区，其中的ａ－ｆ分别表示一个知识渊博的学习者或者一个学习者拥有的知识信息。如果某个学习者（如学习者ａ）对某一知识提出搜索请求时，该搜索请求将按照指定格式被封装成相应的消扈，然后发送到网络的所有的资源结点，并在资源数据库内进行检索，将相关检索结果返回给请求学习者；如果资源库中没有相关知识，就需要向管理系统中的其它学习伙伴发送搜索请求，收到搜索请求的学习者将会解析相应的搜索请求消息，然后学习者根据自己的
５２
还结合了ＡＣＭ计算系统分类方法，对资源库中的资源和交流过程中形成的知识进行合理的分类管理；同时，根据学习者对资源的访问量、交互过程中提交某一知识的数量以及学习者搜索的结果与学习内容相匹配程度等来确定学习资源的信誉级别，为学习资源的分类管理及方便检索提供更好的依据。
２．学习资源的搜索 “我们淹没在资源的海洋中却又忍受着知识的饥渴”，是对学习内容进行有效搜索的重要性的真实写照。所以在系统中我们提供了关键词、关键词辞典、概念地图三种不同的搜索方法，正是为解决这一问题而设计的。其中关键词搜索方法是一般网络中所采用的最基本方法；关键词辞典是根据关键词的语义预先建好的，通过它可以拓展搜索范围；概念地图搜索方法是根据已建立的关键词及相关内容的概念地图进行搜索，以提高搜索的精确度。系统提供的以上三种搜索方式，可以使学习者迅速地查询到所需要的学习内容，从而提高了学习效率。在用关键词辞典进行搜索时，当输入 “ＮｅｗＹｏｒｋＶａｃａｔｉｏｎ” 关键词，在搜索结果中将生成诸如 “ＮｅｗＹｏｒｋｃｉｔｙＬｉｆｅ”、“ＮｅｗＹｏｒｋＴｒａｖｅｌ”、甚至于 “ＮｅｗＹｏｒｋＹａｎｋｅｅ”等关键术语的辞典。并且搜索的结果按照文件名称、类型、大小、状态、信誉级别在主窗口上方显示出来。概念地图搜索是基于语义搜索来实现的。根据事先建立好的概念关键词之间的联结关系。在搜索的过程进行语义扩展。如用户输入“ｗｅｂｓｅｒｖｉｃｅ”的关键词，系统将迅速的生成一个有三个节点和两个分支的概念地图。一个分支是语义网络（ｓｅｍａｎｔｉｃｗｅｂ），另外一个分支是ＤＡＭＬ－Ｓ。如图２所示。如果用户点击语义网络（ｓｅｍａｎｔｉｃｗｅｂ）节点，概念地图将出现与之相关的其它分支。如果用户双击“ＸＭＬ”节点，系统将继续进行搜索和生成查找的结果。如图２左边窗口上部分显示的是搜索内容的概念描述，下面部分是学习内容的资源类型和相关概念的

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

（．ｅｏｋＣｎｅｖＩｓｔｔｏｎｏｍｔｎａｉｎＬａｎｎ１０３Ｃｉａ１Ｎｔｒｅｔ，，ｗｒｅｎｔｕｅｆＩｒａｉ，Ｄｌｉｏｉｇ１６２，ｈｎ；ｉｆｏａ２ＤｐｒｅｔｆＣｍｕｅＳｉｃｎｅｎｌｙｓｇｕｎｖｒｔｅｉｇ１０８，Ｃｉ）．ｅａｔｎｏｐｔｃｎｅｄＴｃｏｏ，ＴｉｈａＵｉｓｙｍｏｒｅａｈｇｎｅｉ，Ｂｉｎ００４ｈｎｊａ
第３０卷第１期
２１００年１月
计算机应用
ＪｕｎｌｆＣｍｐｔｒＡｐｌａｉｎｏｒａｏｕｅｐｉｔｓｏｃｏ
Ｖ０．１３０Ｎｏ．１
Ｊｎ２０ａ．０１
文章编号：０１— ０１２１）１０１０１０９８（０００～１４— ４
ｐｒｏａｉｅ２ａｅｅｆｒｔｎｒｔｅａｗａｒｐｓｄｂｓｄｏｉｅｄｓｒｕｉｎｏｌｂｒｔｎａｄｓｌｏｇｉａｉｎｅｓｎｌｄＰＰｂｓｄＷｂｉｏｍａｉｒｖｌｓｐｏｏｅａｅｎｗｄｉｔｂｔ．ｃｌｏａｉｎｅ－ｒａｚｔ．ｚｎｏｅｉｉｏａｏｆｎｏ
索引以及基于查询主题进行语义路由等算法和机制，以提供人性化、作式、｝化的搜索。模拟实验表明，型系统协爪｜生原可以加快查询速度，减轻网络负荷，高搜索的准确率。提关键词：ｂ信息检索；等网络；性化；题；作过滤Ｗｅ对个主协
Ａｂｔａｃ：ＴｏｏｅｃｍｅｔｅｓｒｃｍｉｇｆｔｅＷｅｅｒｈｅｇｎｓｏｃｌｂｌｔ，ｃｌａｒｔｏｓｒｔｖｒｏｈｈｏｔｏｎｓｏｈｂｓａｃｎｉｅｎｓａａｉｉｙｏｌｂｏａｉｎ，ａｄｐｅｓｎｌｚｔｏｎｒｏａｉａｉｎ，ａ
Ｔｔａｅｙｏｅｓｃｌａｏａｉｎａｈａｎｓｄｅｎｄ．Ｔｈｔｉ，ｕｓｒｕｒｏｃｒｓｄｔｌｔｒｔｕｅｅ，ｔｈｅｓｒｔｇｆｕｓｒ’ ｏｌｂｒｔｎｄｓｒｇｗａｆｅｏｉｉａｓｅ ’Ｓｑｅｙｔｐｉｓｗｅｅｕｅｏｃｕｓｅｈｅｑｒｓｏｉｓｏｅｄｔｎｄｔｏｅｑｕｒｅ．Ｔｏｒｓｔｅｇａｆｐｒｖｄｎｇｍｏｅｕｎｚｄａｄｐｒｏｌｚｄｒｔｅａｔｌｚｎｅｓｔｒａａａｏｒｕｔｅｓｉｗａｄｈｏｏｏｉｉｒｈｍａｉｅｎｅｓｎａｉｅｅｒｖｌｂｙｕｉｉｇｕｓｒ ’ ｌｉｉ
基于ＰＰ的个性化Ｗｅ２ｂ信息检索
付崇国汤志忠，
（．１大连东软信息学院网络中心，辽宁大连１６２；２清华大学计算机科学与技术系，１０３．北京１０８）００４
（ｕｈｎｇｏｎｕｏ．ｄ．ｎｆｅｏｇｒｔｎｏｇｒｔｍｓａｄｍｅｈｎｓｅｅｄｓｇｅｅｐｃｏｂｉｉｇｕｅ ’ ａｏｔｉｔｅｔｒｃｌｏａｉｅｙｏｌｏａｉ，ｓｍｅａｏｉａｏｌｈｎｃａｉｍｓｗｒｅｉｎｄｉｒｓｅｔｕｌｎｓｒＳｆｖｒｅｌｃｏｏｌｒｔｌ，ｎｔｄｉｓｖｂａｖｃｕｔｒｇｔｅｑｅｉｓｔｐａｅｔｅｕｅ ’ ｎｅｅｔｏｉｙｔｅｓｍａｔｉｌｒｙｔｕｔｒｇｔｅｉｖｒｄｉｄｘｂｅｎｐｒｌｓｅｎｈｒｕｄｔｈｓｒＳｉｔｒｓｔｐｃｂｅｎｉｓｍｉｉ，ｓｃｕｎｈｎｅｔｎｅａｄｏｅｉｕｅｏｈｃａｔｒｉｅｓｕｉｏｅｗｏｄｇｏｐａｄｆｒａｄｎｈｕｒｍｏｇｐｅｓａｃｒｉｇｔｈｉｌｒｔｏｏｉ．Ｔｅｅｐｒｍｅｔｌｒｓｌｎｔｆｋｙｒｒｕ，ｎｏｗｒｉｇｔｅｑｅｙａｎｅｒｃｏｄｎｏｔｅｓｍｉｉｙｆｔｐｃａｈｘｅｉｎａｅｕｔｓ
中图分类号：Ｐ９Ｔ３３文献标志码：Ａ
Ｐｅｒｔ－ｅｒｂｓｄｐｒｏａｉｅＷｅｎｏｍａｉｎｅｒｅａｅ－０ｐｅａｅｅｓｎｌｄｂｉｆｒｔｏｒｔｉｖｌｚ
ＦＣｈｎ — ｕＵｏｇｇｏ，ＴＡＮＧｉｚｏｇＺｈ —ｈｎ
摘要：了克服Ｗｅ搜索引擎在可扩展性、为ｂ协作性和个性化等方面存在的不足，出了一种基于Ｐｅ— —ｅｒ提ｅｒｏＰｅｔ的全分布、协作式、自组织的个性化Ｗｅ信息检索，义了以查询主题为中心进行主题聚类、据组织和查询路由的ｂ定数用户协作共享策略，设计了协作生成用户兴趣列表向量、对相似语义查询进行主题聚类和更新、于查询集建立倒排基

web信息检索

页数:12
信息检索 Intelligent Information Retrieval and Web Search

页数:15
第6章信息检索与web搜索

页数:50
网络信息检索 Web Search

页数:46
CS276InformationRetrievalandWebSearchChristopherM：cs276信息检索和WebsearchchristopherM

页数:51
基于Web的信息检索系统研究毕业设计.pdf

页数:44
WEB全文信息检索技术

页数:5
信息检索与web挖掘

页数:33
现代信息检索导论王斌计算所课件 lecture19-websearch

页数:63
WEB信息检索综述

页数:2