外文翻译--模糊数据表示和XML数据库查询_第1页
外文翻译--模糊数据表示和XML数据库查询_第2页
外文翻译--模糊数据表示和XML数据库查询_第3页
外文翻译--模糊数据表示和XML数据库查询_第4页
外文翻译--模糊数据表示和XML数据库查询_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、(附件1:外文译文一)International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems Vol. 15, Suppl. (February 2007) 43-57 World Scientific Publishing Company模糊数据表示和XML数据库查询EKlN USTUNKAYA and ADNAN YAZICIDepartment of Computer Engineering, Middle East Technical University, 06531, Ankara - Turkey E

2、mail: ell2925, HYPERLINK mailto:yazicij.tr yazicij.trROY GEORGE*Department of Computer Science, Clark-Atlanta University, Atlanta, GA, USAEmail: HYPERLINK mailto:rkavil rkavil真实世界的信息,包括主观的意见和判断,需要不精确数据为蓝本来表示并在数据库中 查询。近年来,可扩展标记语言(XML)事实上已经成为数据建模和交流的标准。在XML中, 对不精确性的建模和代表这些数据做出的努力没有得到充分发展。本文中,提出了基于匚 的模

3、糊数据表示和查询系统。用模糊扩展的XML来表示复杂和不精确的数据。这种表示法形 成了一个基础系统,能够在XML文档使用XML的一种查询语言XQuery进行模糊查询。该系 统还可以通过XML架构重组,合并XML元素文件。通过使用此功能的系统,应用程序特定的 XML架构和XML文件可以从现有的文件中产生。关键字:模糊查询,XML,原生XML数据库。1、简介数据库是数据的一个有组织的集合。传统的数据库管理系统特别适合于代表那些使用标 准结构的清晰、明确界定的数据,。然而,现实世界的信息,包括主观的意见和判断,需要 复杂和不准确的数据建模同时也需要明确界定的数据。在数据库中代表这种不确定性和复杂 的数

4、据仍然是一个正在研究中的问题。扩展非第一范式(ExNF2)1数据模型是一个已为拟 议的代表这种不确定和不精确数据模型。可扩展标记语言(XML)2345,被广泛用于数据代表和交换。XML允许内容和 表现的分离,也就是说,XML文档简单定义了数据表示但是并不处理它的表现形式。XML可 以用来表示复杂和层次性的信息,这是ExNF模型的基本造型结构。选择最合适的数据库管理系统,以处理基于应用程序和数据结构的XML数据。随着越来 越大的数据量作为XML文档表示,有必要有效地存储和查询这些XML文档。在管理XML数据 中,原生的XML数据库比传统的数据库管理系统具有几个优点。当数据是半结构化时,映射 到一

5、个关系数据库结果中将导致大量的空列(浪费空间)或大量的表(低效的)。另一个在 原生XML数据库存储数据的原因是检索速度。原生XML数据库在物理存储数据方面,检索数 据比关系型数据库快得多。这是因为原生XML运用存储策略存储整个文件或在文件的各部分 中使用物理(而不是逻辑)指针;允许要检索的文件没有连接或存在物理连接,这两者速度 都比关系型数据库上的逻辑连接据库快得多11。几个XML查询语言(如XML- QL的6,XPATH7和XQuery8)已经被XML提出。XML 的一个特有优势在于它在代表来自不同来源的信息时具有的灵活性。要利用此灵活性,XML 查询语言必须为这些不同来源的信息提供检索和解

6、释功能。XQuery8已被W3C批准作为用 于XML查询的标准语言9。在数据库领域中,传统的查询语言允许在精确的数据的基础上进行数据选择。查询的价 值在于能在那些完全满足查询条件和那些不满足条件的地方产生Boolean分区数据。现实世 界信息是既复杂又不确切,许多知识密集的应用程序需要使用这些数据10,12,13, 14,15,16,17。使用模糊逻辑查询允许用户自定义软目标和约束,并向用户提供 查询数据的相对重要性。本文中,我们介绍了将复杂和不确定的数据映射到XML代表的方法。这项研究的动机是 为了在XML文档中的结合模糊和不确定的数据代表处理ExNF数据模型性并推广XML数据库 系统的使用

7、。XML的结构非常类似于关系数据库元组,因此,将INF文件的元组映射到XML元素是很 简单的1819。然而,ExNF模型1 介绍的是经扩展的,较复杂的,不确定的和模糊的数 据,不容易用XML表示。在这项研究中,XML文档适用于ExNF2模型的格式,包括代表不精 确、复杂性数据的元素和属性。我们使用这些概念,开发一个系统,允许在XML文档中进行 模糊查询。系统中XML文档的概念通过模糊属性得到扩展。除了模糊查询,系统可通过合并 XML文档的元素重组XML架构。通过使用此功能的系统,特定的XML Schema应用程序和XML 文档可从现有的文件中产生。要查询的XML文档在原生XML数据库管理系统塔

8、米诺20中存 储。本文的组织构架如下:第2节将描述以XML为基础的模糊查询系统的设计。第3节将描 述在实施这项研究中所做的细节性工作。最后,第4节作出结论总结。2、基于XML的模糊查询系统的设计本节中,我们首先提出包括在这项研究中的模糊和其他不确定属性的定义以及它们的XML表示。参考模型是ExNF数据库模型1。2.1系统目标这项研究的主要目标是开发一个系统,它通过使用由非第一扩展范式(ExNF2)1的 扩展介绍,在XML中,为现实世界的数据提供了一个模型。在XML数据中执行模糊查询,并 允许XML模式转型。该系统应以图形用户界面提供用户构建模糊查询和XML重组架构。2.2复杂和不确定的数据建模

9、本节引入在ExNF模型1 中介绍的属性类型的定义以及在属性类型的XML表示。在ExNF 模型中属性类型的介绍包括原子,空值,设定值,关系值,模糊值,范围值属性以及XML 表示形式的基础。2.2.1在ExNF数据模型中不确定性的代表在数据库中不确定性可以通过扩展的嵌套关系2122代表而非INF数据模型23, 24,25。扩展模型,即扩展非第一范式(ExNF)1,在数据库中提供包括不确定性的 扩展是必要的。ExNF关系可以定义如下1:定义:定义SchR是一个与属性R相关的属性(A1,A2,,An)。每个属性Aj可能是简 单的设定值,模糊值,范围值或关系值,如下文定义。假设)1,D2,,Dn是有限域

10、设 置。使e,R的一个实例,组成一套有序的形式,这是(D1xD2x x Dn)的一个子集。Dj (1jk)的域,可以是以下内容中的一个:(一)Dj是一个原子值属性域。每个值Aj是Dj的一个元素;也就是说,它是一个典型的 简单明确界定的属性值。(二)Dj是一个空值的属性域。域名Dj组成了明确定义的值a1,a2,an可以扩展 到域 Dj= DjU unk,dne,ni。(三)Dj是一个不完整(范围)值的属性,其值可以是原子或一个区间。区间表示为aj1- aj2,其中aj1为最小值,aj2是范围的最大值。这两个值都取自域Dj。(四)Dj是一个模糊值属性域。域包含了一组模糊集语言。一个模糊的属性值是一

11、个非空子集的Dj和aj1,aj2,ajm的代表。,ajm。任何这个属性(五)Dj是集值属性域,其值代表明确界定的集aj1,aj2, 的值都是Dj的一个子集。(六)Dj是关系值(复合)属性域。这个属性的任何值,Aj,是一个元组的形式,这是(Dj1 x Dj2xxDjm)的一个元素,其中1 m并且1jk。当Dj是一个关系值(复合)设置属性域时,其中每个Aj值是, 的一个元组,这是(Dj1x Dj2 x xDjm)的一个子集,可以通 过关系值和设定值的组合来形成这种属性。定义:假设R和S是RelA和AttA中的属性,且是dom中存在的常数。在这里使用的类型 比那些关系数据模型更复杂。他们的抽象语法为

12、:x = dom| fdom| ndom| idom| (B1: x1, ,Bm : xm) | xs,其中xs尹fdom| idom|X且B1, Bm是截然不同的属性。直观地看,一个元素dom 是一个常数(传统的明确界定的原子属性),fdom是一个模糊值排序属性(可能形成一个集 或语义)v1, ,vm的形式,其中vj是dom的一种并且是任何本集的子集元素;ndom是unk,dne,ni,x 一个空值的排序属性形式,其中x排序dom; idom是v1 - vj的一个 排序不完整的形式,vj的排序dom和元素是vj,v1 WviWvj; (B 1: x1, Bm: xm)的 排序元素是K元组在B

13、j的排序xi的一个元素,1im;排序元素xi是排序X的一个有限集 合元素。定义:从形式上看,排序x的值(即x的解释),记为t x,定义如下:(一)t dom = dom,(二)tfdom= v1, vj |Vi: 1 Wi Wj: vitdom,(三)t ndom= vi | Vi: 1Wi Wj: vi tunk,dne,ni U dom,(四)tidom= v1 - vj | Vi: 1 Wi W j: v1 WviWvj,vi tdom,(五)txs = v1,vj | Vi,j: 1WiWj:vit xs。如果 txs = ,那么vi = dne,(六)t (B1:x1,Bm:xm)

14、= (B1: x1,Bm: xm) | Vi: 1 WiWm: Vitxi。R由关系名和数据库架构的关系名称的有限集合组成。关系名称R的一种关系是有限排 序值(R)。比如I的架构R是R的函数,在这里I是R关系的实例。当关系R有一个排序, 即(R) = (B1:x1, ,Bm: xm),这种关系由元组组成,其中每个xi可能是上述给出的解 释之一。2.2.2.在XML中表示不确定性XML文档是一个由逻辑结构(由文档对象声明,注释,字符引用,元素,和处理指令构 成),和物理结构(由实体,开始的根,或文档实体组成)构成的。每个元素都有一个类型, 有名称标识,并且可能有一组属性规范。属性规范有相应的名称

15、和值XML架构的元素有两 种主要类型:简单的和复杂的。简单的元素内他们定义为零属性和零元素,而复杂元素的定 义允许有一个或多个属性或一个或多个元素。复杂的因素可能会进一步归类为:空元素,只 包含其他元素的元素,只包含文本的元素,同时包含文本和其他元素的元素。在XML文档中,原子属性代表了明确界定的数据。这些原子属性在XML文档中可以作为 元素的值。例如,一本书的标题是一个原子属性。在XML中的空值可以代表新值或引入的字符数据,如ni (无信息),unk(未知),和dne (不存在)。例如,可以用以上的值来形象的描述一本书的封面。集值属性是指在一个属性中有几个值。其中每个值可以作为一个元素添加到

16、XML,这是 使用XML的一种使用方式,而不是仅仅把一个个值串起来。例如,一本书可能有多个作者, 每个作者在“作者”的标签内添加“作者”的标签。图1显示了一个例子。 Thomas H. Cormcn Charles E. Lciscrson Ronald L. Rivesl Clifford Stein cTroductlni图1 XML集值属性的示例模糊值属性用来表示不精确或模糊的数据。用于表示模糊值属性,如“红色”或“绿 色”,被用于表示一本书的颜色。一个模糊值(集)用来存储元素的值。模糊数据的语义在“色”元素中作为一个模糊术语用来表示“模糊谓词”属性。模糊值属性可能有各种语义,如“或”,

17、“异”,“和”等有关的模糊值。图2是给出的一个例子。 imagoredcolouf FuzzyPredicaie-tOR5rccn图2 XML模糊值属性示例范围值(或不完整的值)属性,是用来指定一个字符串格式的范围值。我们为书的价格信息存储价值不等的属性“最低价”和“最高价”标签。如图3所示是一个例子。ProductInfo $ 12.95$8C)Jf)C)图3 XML范围值属性示例在关系值属性中,字段的内容是其他元组的指针。关系值属性代表设置值属性,即对 于每个值,都作为一个完整关系的元素在元组中出现。举例来说,关系值属性代表“形象”, “颜色”,“说明”的“形象”元素。如图4所示就是一个例

18、子。Ihllp: Z/imag e s. iiinaz on.cDin/iiTiag e s/irruigeGreenciinage-dcscriptionxirtjlcsiumbcrs 图4 XML关系值属性的示例2.3.数据对象和数据库设计在这项研究中,所有的数据都是XML格式,并存储在原生XML数据库管理系统中。除 了数据,就是模糊属性的相似性表,与属性值相关,也以XML形式存储在数据库中。在系统书籍(如图5所示为一个完整的示例)作为数据对象被选择。产品信息是由Web 服务检索从XML文档中获得的,这些文件被转化为本地XML架构使其适合应用程序。这种转 变后,这些文件插入到数据库中XML

19、文档存储在数据库中有一个示例9。用来表示存储 产品信息的XML文档XML构架如图5所示。一本书的封面用模糊的“颜色”属性来表示。一本书的封面可能有多种颜色。由于“颜色” 是一个模糊属性,糊的颜色值的相似矩阵10,11存储在一个XML文档中。为了说明概念模糊的“主体”属性,有关问题的相似性值将存储在一个XML文档中。77皿斓曰知mdgHMi:【菱匚三OLuuk: title三 O authorsOauthnr-i publicationEXate; - book_urlr - ) publisher 三 iis好timogc_ur三 OtokirE;口: = FuzzyPrsdie-ate- f

20、 J imaqn dp-s rriplinni ) minPrice + maKpric&-!-yatt_ r i Hi s-.1 I = i. .VMA.VVXA.VX.= = n.:-:-:-!.1.:-!-:- 2 Mh- JE-猝.;.:,w-.国.:-:J:-b -Mi:AAS-MVH-图6查询处理的体系结构概述图7显示了 XQuery表达式为查询生成“显示所有出版商是“托马斯邓恩图书”书籍” 的一个例子。图8显示了与ProductInfo应用程序相关的一个示例。wheie $b/publisfer Thomas Books rettini $bM图7 XQuery的一个例子如果查询

21、包括模糊值属性的搜索条件,执行查询如下:起初检索的是非模糊属性值。这 个结果第一步是根据模糊值属性的结果设置“和”。对于模糊值属性我们利用模糊值的相似 矩阵1011。例如,如果查询“显示所有的书籍,其发行者是”托马斯邓恩图书并且主题 是阈值为0,7的“科学”,首先检索满足出版商标准的书籍,然后使用主题属性的相似矩阵 检索满足主题标准的书籍。如果在查询中“科学”的其他域值大于或等于指定的阈值,那么 这些元组还将包括在答案集中。图8显示了 XQuery表达式用来查找相似值主题为“科学”和“历史”的一个示例。让 我们假设这个表达式的结果是“0,5”。图11显示了查询结果。图12可以看出,有7条记录

22、满足“出版商为托马斯邓恩图书”书籍”的搜索条件,但在图11中记录的数量是3。有四 本书不符合指定的标准:“阈值为0,7主题为科学的书籍”。由于科学和计算机之间的相似性 为0.9(大于指定阈值0.7),图11中是检索元组中的第二个元组(作者是“C.J. Date”)。 请注意,阈值是在查询处理后在考虑的。for $b in iEiputO/SubjefitSimihirityTable/ceUI where- Science1 andSb/ secon d_bj ect $ to ry!remm妙si第力牡角成曲应图8 XQuery检索相似度值的示例3.2.模糊查询正如以上示例,模糊属性“主题”

23、和“颜色”可以与阈值以及“和”,“或”谓词一起 查询。下面将给出执行模糊的“颜色”属性查询的例子。执行命名为“欺骗点”书籍的查询。 图9给出了此书的XML表示。以上.:技、.httpjViiajncspacDs.s o fewin/比 irino/Ta m :nt)S chumDefiii ition盐洞临旗对Hhggj您华峪 遂仞UXMLSchcma-i尚 Deception Point matiocolors)blackcolour Predicate = xblue图9书籍“欺骗点”的XML表示当执行“黑”,“蓝”颜色以及“或”谓词查询时,该查询返回“欺骗点”的纪录,因为 这些书符合颜色

24、为“黑色”和“蓝色”以及“或”模糊谓词。当执行“黑”“蓝”颜色以及“和”谓词查询时,查询结果没有返回记录,因为没有书符合“黑“蓝”以及“和”谓词 条件。如图13所示是这个查询的结果。当图13中的颜色阈值改为“0.3”,查询返回的记录为“欺骗点”。虽然这本书是这些颜色用“或”谓词连接,但“黑色”和“蓝色”的相似值为0.6” 9。由于在查询中阈值小于相似度值,查询条件是满足的。图14显示了此查询结果。4005恐04 AflCfeMA馅曲丫网3睫 T9W,11厦嬲尊!.睥TZgTZgTfw. r. ir.t rr.irm rmirawaviM ihmtvi打获!茂33提3:版昂新E l CSG一而!

25、更福i TUjO 53F-i*tifiaa1mf .“Ua卜r呵amm.u.um “ fij Jrari nin*-!, ir-1 4tl- g电 i:. :,* y PE,.:1 1 涔.1:PM; rr 输” $1 项.都 H塞豪函虱莉逾函勒亟亟筌网豆远瓦二王逐?S3 ,!,r , 上 f ! i fji I 15 J n,rgn 呻 - - r - -| ;,! nf w ,Jf Ub 1 Ik 1 H ,“ :T 4 4 卜 J - $,$* * AS J -X 1“ “1 111 I:Jin Slebmk Tt敢WsAiPi ChwA. M HlacifYJhaveiI jDsn g

26、rown:AngelsIfJHlsInrYXtessic .方671 位/3;60 卜如叔蜜切:卫血1|DW1 Brpytfnjpecetfion PdrT Htejury.c必迁皿7337 rhOlflSE CWft Borts J;2002、一*Dari Brown疯射对Ftjrirass : A T .if HlffiaFvSiziBnce p312S5164 ThotnB AmneBadks 凯004jHiardcwer. _1剖彳:酩匚MLFaeifkiur:口49 9CJ4.Per tack ”1,il 1.7 T#EniB图10相关的ProductInfo应用程序示例3.3.合并

27、XML构架该系统还允许用户合并存储在塔米诺XML数据库服务器中的XML架构中的元素。重组 一个XML构架,改变的XML架构文件会被选中,然后会显示被选择的XML构架元素。要合 并的元素会被选中,合并名称为新的元素,这是选定的元素合并形成的。除了新的XML构架, 新的XML文件包括合并对象(或元组)的原始文档将根据新的XML构架生成并同时加载到数 据库中。区卵:FublisrFrPLJE3hcatidri OlLtQ:FfrmtACPriiuei;图11满足条件“主题是科学并且阈值为0,7”的查询结果HSSN:Fubliihi*r:Form就是FW日曲 Titfe TFie 5 of rwrrn

28、 i n m:! Tin sit b jmsrisnfttittiwi i冲仪.咿点电鱼是扁讨J la dminT j( gl 443.崖CmfM& Art ufWir 瑚Wn gF!用WL:留一统,&nvrn 珂蟹”1 FErcm. A Irriter J rFzicr (ciEnq t ;IK3t231 卸 Ehebs Dunre khxa NK*4 M金 念口阉&如由 名,成曲拓击。丁 嘉omwAriing由由式LRipi瓦航51沛福矿谎福嘉瓦X呢宥云亍 hhacryj.19;n-: n ge mBMS&Duntt 20C3iTrmirim+iT n ma niHim v|rwrE:-n

29、rMir.TnnmiBTm e-3 ia-iiriimrrrwrwtwrwtnranrwih 源里金理$ g现归眼如悠 好蛔.9.密 JhgmiK Mjttc ftockm图12满足条件“出版商为托马斯邓恩图书书籍”的查询结果m W:就 *EE:g 1T:“ m 朴二二二 is?:;-:;:;:器徘:;:!HH-tLH-H-tHI图13执行“黑”,“蓝”颜色,“和”谓词以及“阈值0.7”的查询结果图14执行“黑”,“蓝”颜色,“和”谓词以及“阈值0.3”的查询结果图15表示ExNF数据模型,这也作为一个XML文档的代表。在ExNF中每列元素XML架 构中的元素对应。例如,在图15和图16所示,

30、如果用户选择这个XML架构的所有元素,除 了 “出版商”元素被名称为“ Publisherinfo ”的属性合并,产生了一个新的以 PublisherlnfoSchema (由用户命名)命名的XML架构。具有相同的出版商的图书被合并从 而形成一个新的合并关系。这种合并的关系,可以达到更有效的查询目的或根据用户的要求 生成耳目一新的数据库构架。包括了合并和取消合并的操作细节1。3.4.开发环境为了实现了平台的独立性,根据系统的开发程度选择Java编程语言。该系统是作为Borland JBuilder第9企业版的一个独立应用程序实施的。Java的塔米诺API用来访问和 操纵塔米诺数据库20中存储的

31、数据。“塔米诺执行XQuery,被称为塔米诺XQuery4是用 于执行查询的,也可在塔米诺API为Java访问。Software AG的塔米诺XML服务器4.1.420 被用来充当XML数据库系统。Software AG的塔米诺架构编辑器被用于设计XML构架。 I芝DiCHTlBEfirta.95Diitr c E&il sHardt膈网 H 讷Abfe Co31制M JO.w 散 irrafii而血邮4胡蠕岳7色Jb 3北!南成 mg : n二 _ 成二二aoiig 帕NT白引Efe沛酸I!IS-4? M rfW*上熟度us号 业三火一Qg 怙骐!1竺器上* ?1些 心 hr 巨 Eiafe

32、ijaiBalggc T?ie二:丈 I:*:片:.akt.-A - A.-.?. A =f痿站神w陆l物1般pomaa- i;. i-1. :i-WQW砒 :tt&M-*无盘Me卧 瞄姐 泌 #:S村酬坞冲:财蜘堕也型业白璀蜘” ” “, . ” HTmrrA ” 4,i. ,. rK ” a*|*mrirrirwri:位一五#W如rU牝帕加击出就云图15合并前的XML构架结构. V- V 、 V. -A , . -图16新的XML构架结构结论“可扩展标记语言(XML)是数据表示以及进行格式转换的的一种方法。XML文档定义 数据表示但并不处理数据的表现形式。XML也可以用来表示复杂和不准确的

33、除了明确界定 的数据格式。XML可以处理复杂,层次化的信息,同时也可用于商业交易。本文中,复杂和不确定的数据是用XML来表示的。用户可以在开发系统上执行XML文档 的模糊查询。该系统中XML文档包含模糊属性。用户可以指定一个模糊的属性和阈值进行模 糊查询。除了模糊查询,系统可通过XML文档中元素的合并进行XML架构重组。通过使用此 功能,系统可以生成一个新的XML架构以及从现有文件中形成新的XML文档。系统中的XML 文档存储在原生XML数据库管理系统中,即塔米诺。参考文献Adnan Yazici, Alper Soysal, Bill P. Buckles, and Fred E. Petr

34、y, Uncertainty in nested relational database model, Data & Knowledge Engineering 30 (1999) 275-301.Jennifer Widom, Data Management for XML: Research Directions. HYPERLINK http:/wwwdb http:/wwwdb. /widom/, (1999).Frank Jung, XML Backgrounder, Software AG, HYPERLINK /Corporate/ /Corporate/, (August 20

35、03).Guide to the W3C XML Specification (XMLspec) DTD,V.2.1, HYPERLINK / / XML/1998/, (1998).Charter of the XML Schema Working Group, HYPERLINK /2003/09/xmlap/xmlschema-wg-charter.html /2003/09/xmlap/xmlschema- wg-charter.html, June 2004.XML-QL: A Query Language for XML, HYPERLINK /TR/1998/NOTE-xml-q

36、l-19980819 /TR/1998/NOTE-xml-ql- 19980819, (August 1998).J. Clark, S. DeRose, XML Path Language (XPath) Version 1.0, W3C Recommendation, HYPERLINK /TR/xpath /TR/xpath, (November 1999).XQuery 1.0: An XML Query Language, HYPERLINK /TR/xquery/ /TR/xquery/, (July 2004).Bourret, R., XML and Databases, HY

37、PERLINK http:/www.rpbourret.coin/xml/XML http:/www.rpbourret.coin/xml/XML Databases, (2004).L.A. Zadeh, Similarity Relations and Fuzzy Orderings,Information Sciences, vol. 3, no. 2, (1971) pp. 177-200.Buckles B. P. and Petry F. E., A fuzzy representation of data for relational databases, FuzzySets a

38、nd Systems, Vol. 7, (1982) pp.213-226.Tahani V., A conceptual framework for fuzzy query processing - A step toward very intelligent database systems, Information processing Management,Vol. 13,(1977) pp.289-303.Zemankova M. and Kandel A., Fuzzy Relational Data Bases - A key to Expert Systems, Verlag

39、TUV Rheinland, Koln, (1984).Anvari, M., Rose G. F., Fuzzy relational databases, Analysis of Fuzzy Information, Bezdek ed., Vol II, CRC Press (1987).Ruspini E. H., Issues in the representation of imprecision and uncertainty in information systems, Analysis of Fuzzy Info - Vol. II: Artificial Intellig

40、ence and Decision Systems, CRC Press, Boca Raton, Fl. (1987) pp.231-239.Fuzzy Data Representation and Querying in XML Database 57Prade H. and Testemale C, Generalizing Database Relational Algebra for the Treatment of Incomplete/Uncertain Information and Vague Queries, Information Sciences, Vol. 34 (

41、1984) pp.115-143.Medina J. M., Pons O. and Vila M. A., GEFRED, A generalized model of fuzzy relational databases, Version 1.1, Information Sciences (1994).Lee D., Mani M., Chiu F. and Chu W., NeT and CoT: Translating relational schemas to XML Schemas using semantic constraints, Proceedings of CIKM,

42、McLean, Virginia (2002) pp.282-291.Fernandez M., Morishima A. and Suciu D., Efficient evaluation of XML middle-ware queries, Proceedings of ACM SIGMOD Int. Conf. on Management of Data, Santa Barbara, CA (May 2001),pp.l03-114. HYPERLINK /de/products/tamino /de/products/tamino.L. S. Colby, A recursive

43、 algebra for nested relations,Information Systems 15 (5) (1990) pp.567-662.S. J. Thomas, P. C. Fischer, Nested relational structures,Advances in Computing Research, vol. 3, JAI Press (1986) pp. 269-307.M. A. Roth, H. F. Korth, D. S. Batory, SQL/NF: a query language for non-INF relational databases,

44、Information Systems 12 (1987) pp. 99-114.H. J. Schek, M. H. SchoU, The relational model with relational-valued attributes, InformationSystemsll (2) (1986) pp.137-147.G. Ozsoyoglu, Z.M. Ozsoyoglu, V. Matos, Extending relational algebra and relational calculus with set-valued attributes and aggregate

45、functions, ACM Transactions on Database Systems 12 (4) (1987) pp.566-592.(附件2:外文原文一)International Journal of Uncertainty,Fuzziness and Knowledge-Based SystemsVol. 15, Suppl, (February 2007) 43-57 World Scientific Publishing CompanyFUZZY DATA REPRESENTATION AND QUERYING IN XML DATABASEEKlN USTUNKAYA

46、and ADNAN YAZICIDepartment of Computer Engineering, Middle East Technical University, 06531, Ankara - Turkey Email: ell2925, HYPERLINK mailto:yazicij.tr yazicij.trROY GEORGE*Department of Computer Science, Clark-Atlanta University, Atlanta, GA, USAEmail: HYPERLINK mailto:rkavil rkavilReal-world info

47、rmation including subjective opinions and judgments need imprecise data to bemodeled for representation and querying in databases. The Extensible Markup Language (XML) hasbecome a de-facto standard for data modeling and exchange in recent years. Efforts on modelingimprecision and representing such d

48、ata in XML have not been fully developed. In this paper, anXML based fuzzy data representation and querying system is presented. Complex and imprecisedata are represented using a fuzzy extension of XML. The representation forms the basis for asystem which enables fuzzy querying on XML documents usin

49、g XQuery, a XML query language. The system also enables restructuring of XML Schemas through merging of elements of the XMLdocuments. By using this feature of the system, application specific XML Schema and XMLdocuments can be generated from the existing documents. Keywords. Fuzzy query; XML; native

50、 XML databases.IntroductionA database is an organized collection of data. Traditional database management systemsare particularly suited to represent crisp, well defined data using standard structures. However, real-world information includes subjective opinions and judgments that requirethe modelin

51、g of complex and imprecise data along with crisp data. The representation ofsuch uncertain and complex data in a database is still a research issue. The Extended NonFirst Normal Form (ExNF2) 1 data model is a model that has been proposed for therepresentation of such uncertain and imprecise data.The

52、 Extensible Mark-up Language (XML) 2, 3, 4, 5 is widely used for datarepresentation and interchange. XML allows the separation of content and presentation, i.e., XML documents simply define the data representation and do not deal with thepresentation. XML can be used to represent complex and hierarc

53、hical information, whichare basic modeling constructs in the ExNF2 model.This work is partially supported by the NSF Grant No. HRD-0401679, AHPCRC Contract No. DAAD19-01-2-0014 and ARL Contract No. DAAL01-98-2-0065. The content of this work does not reflect the position orpolicy of the sponsors and

54、no official endorsement should be inferred. Choosing the most appropriate database management system to handle XML datadepends on the application and data structure. With increasingly large amount of databeing represented as XML documents, it becomes necessary to efficiently store and querythese XML

55、 documents. Native XML databases have several advantages over traditionaldatabase management systems in managing XML data. When the data is semi-structured, mapping it to a relational database results in either a large number of columns with nullvalues (which wastes space) or a large number of table

56、s (which is inefficient). Anotherreason to store data in a native XML database is retrieval speed. Depending on how thenative XML database physically stores data, it is possible to retrieve data much fasterthan a relational database. This is because the storage strategies used by native XMLdatabases

57、 store entire documents together physically or use physical (rather than logical) pointers between the parts of the document; permitting the documents to be retrievedeither without joins or with physical joins, both of which are faster than the logical joinsused by relational databases 11.Several XM

58、L query languages (such as XML-QL 6, XPath 7, and XQuery 8) have been proposed for XML. A particular strength of XML is its flexibility inrepresenting many different kinds of information from diverse sources. To exploit thisflexibility, an XML query language must provide features for retrieving and

59、interpretinginformation from these diverse sources. XQuery 8 has been endorsed by W3C as astandard for XML querying 9.Traditional query languages in database domain allow data selection based onprecise data. The evaluation of the query produces Boolean partitions of the data into those that fully sa

60、tisfy the query condition and those which do not. Real world information is both complex and imprecise and many knowledge-intensive applications require the use of such data 10, 12, 13, 14, 15, 16, 17. Querying using fuzzy logic permits the user to define soft goals and constraints, and provide them

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论