一种P2P数据库的实现机制_第1页
一种P2P数据库的实现机制_第2页
一种P2P数据库的实现机制_第3页
一种P2P数据库的实现机制_第4页
一种P2P数据库的实现机制_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一种P2P数据库的实现机制摘要基于DHT的布局化P2P网络具有鲁棒性、自顺应性、可用性、负载平衡等特点,但缺乏表现和办理庞大语义数据的本领,在P2P数据库中引入庞大数据的索引和定位机制成为体系的关键。本文以布局化的DHTP2P网络作为漫衍式平台,探究一种P2P数据库的实现机制。重要利用数据复制和分层索引机制来包管高效的实现资源定位,而且制止了Hash对数据语义的粉碎,使体系有用地保持数据语义间的接洽。关键字P2P数据库;资源定位;数据复制Peer-t-Peer(P2P)环境下的数据办理和共享是数据库范畴的研究热门,核心题目会合在怎样使得P2P支持庞大语义数据办理成效,提供数据资源复制、索引和正

2、确的资源定位机制。基于P2P数据办理体系PeerDB3,UBerkeley大学的PIER5,Edutella7,Pizaa2,这些体系差异程度实现了数据共享。PeerDB基于关键字形式映射很难做到正确性,必要过多报酬办理;PIER引入名称空间(NaeSpae)对数据举行索引,但仅仅支持关键字正确匹配查询。Edutella利用超节点形貌其辖域子节点共享资源,超节点轻易成为瓶颈,倒霉于体系的扩展。本文以布局化DHTP2P网络hrd1作为漫衍式平台,探究一种广域网环境下P2P数据库的实现机制。起首,对数据利用规矩举行支解,并复制到网络中去,进步体系的可靠性和处置惩罚的并行性;为制止Hash对数据语义

3、的粉碎,利用元数据对副本举行标识、索引;末了,把这些索引元数据构成一种分层索引机制使得数据哀求节点可以高效地举行资源定位。传统漫衍式数据库在局域网环境下,提供全局视图使得用户可以透明地拜候数据库,局部数据源之间有较高的耦合度。但是P2P数据库是基于动态广域网,而且不存在中央操纵节点,要在如许的环境中提供全局视图是不实际的。P2P数据库体系不存在全局视图,但是,提供一组映射规矩和索引机制实现数据定位和数据拜候。P2P数据库是局部数据库LDB,P2P网络及和谐规矩三者的同一体LDB,P2P,rdinatin,此中LDB办理局部数据,包罗共享数据部门和私有数据部门;P2P网络提供Peers间的通讯、

4、路由及数据通报;和谐规矩由一组映射构成,和谐各LDB互助为用户的哀求提供数据办事。P2P数据库体系体系布局(如图1所示)包罗四层:应用层、数据办理层、P2P网络层和局部数据库层。图1P2P数据库体系布局本文重要利用数据复制和分层索引机制来包管高效的实现资源定位,而且制止了Hash对数据语义的粉碎,使体系有用地保持数据语义间的接洽。起首,对数据利用规矩举行支解,并复制到网络中去,进步体系的可靠性和处置惩罚的并行性;为制止Hash对数据语义的粉碎,利用元数据对副本举行标识、索引;末了,把这些索引元数据构成一种分层索引机制使得数据哀求节点可以高效的举行资源定位。3.1数据复制起首把干系表举行支解,然

5、后把这些干系表子集及其标识信息(作为元数据)复制到节点中去。基于干系子集的复制粒度,同时利用标识其定位信息,既可以保持干系表的团体性,又可以快速实现资源快速定位。体系中数据复制的粒度为干系表,或干系表的子集,详细历程如下:对干系R的支解要利用一些规矩聚集,可以利用某一条规矩把R支解为;对每一个子集Ri利用举行标识;把副本及其定位元数据复制到网络中;干系表是其元组聚集),对R利用规矩聚集举行支解后得到一系列子集R1,R2,RK(kN)。根据hrd路由算法,每一个节点peer可以直接与其指针表指向的节点直接通讯,本文把这些节点称作该节点的Link_PeerLink_Peerpeer,LP1,LP2

6、,.LP,必要留意的是Link_Peer是包罗该节点peer的。对节点peer的数据R,其副本R1,R2,RK只能漫衍到Link_Peer上,对付特定的副天职布到Link_Peer的哪个节点上,没有特定的划定,他们的时机是均等的,可以以为是随机的。图2元数据安排计谋LDB,RID和rl形成了一个条理状的域名空间rl决定的数据挝RID标识的数据LDB。如许实际上形成了一个分层索引机制,为资源定位提供了便利。3.2资源定位按照用户数据哀求,资源定位为该哀求办事定位到存储相干副本的节点,由该节点实行局部操纵。由3.1节可知,数据副本定位元数据安排到Suessr(RID)节点上,同一干系表有雷同的RI

7、D,那么干系表R的全部副本定位元数据均存储在Suessr(RID)节点上。某一特定命据哀求操纵具有空间局部性,这种元数据安排计谋使得只需在某几个节点搜刮定位元数据即可定位到存储有相干资源的节点。数据哀求每每按照某些条件哀求特定的数据资源,数据哀求条件与干系表副本标识副天职割规矩举行比力,以近一步缩小切合条件的副本范畴,求解切合哀求条件的副本。图3资源定位在DHTP2P网络中利用3.1节所述的索引机制,资源定位历程如图3所示。起首,按照干系表名盘算出Hash(LDB.TableNae)=RID,RID是分层索引的干系表标识;随后,按照P2P网络路由算法,定位到Suessr(RID)节点,该节点存

8、储了干系表LDB.TableNae的定位元数据;末了,数据哀求条件和干系表子集标识也就是副天职割条件和副本标识比拟力,返回相干副本的定位元数据LDB,RID,rl,NdEiD,IP,数据哀求节点利用这些元数据可以直接定位到存储了相干副本的节点。下面以查询处置惩罚和DHThrd路由算法为例,说明该资源定位历程。假设查询语句如下:Seleta1,a2,a3frLDB.Rherend1rnd2在此查询语句中,必要确定LDB.R表现的副本地点的节点。步调如下:Hash(LDB.R)=RID这里我们假设即是Suessr(RID)=pi;按照hrd路由算法定位到节点pi,节点pi存放了定位LDB.R副本所

9、需元数据;查询条件nd和支解规矩rule举行比力,假设ndrule,那么把该rule对应的LDB,RID,rl,NdeID,IP通报给查询提倡节点p;ndrule说明干系表副本按nd举行支解,而且支解后形成的副本R=R1,R2,RK可以重构R,即;不然,把全部的副本对应的LDB,RID,rl,NdeID,IP通报给查询提倡节点p。ndrule表现干系表没有预先按nd举行支解,因此全部副本都大概和查询处置惩罚相干。在这种环境下,可以思量利用3.1节数据复制要领举行处置惩罚。数据资源定位本色是对Suessr(RID)后继节点的元数据集举行搜刮、匹配,并把搜刮效果返回哀求节点的历程。本文形貌了一种P

10、2P漫衍式环境下的数据库的实现机制。利用数据支解和数据复制,把节点负载疏散,到达体系负载平衡和进步可用性,创立一种分层索引机制使得数据哀求节点可以高效的资源定位,支持庞大的查询机制。P2P漫衍式环境下的数据库的实现机制补充了DHTP2P网络在办理庞大数据上的缺陷。1I.Stia,R.rris,D.Karger,.F.Kaashek,andH.Balakrishnan;hrd:Asalablepeer-t-peerlkupserviefrinternetappliatins;inPr.SIG,SanDieg,A,Aug.2001,pp.149-1603.Sing;NgBeng;hini;PeerDB:AP2P-basedSystefrDistributedDataSharing,Preedingsfthe19thInternatinalnferenenDataEngineering(IDE03)1063-6382/03

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论