外文翻譯--模糊數(shù)據(jù)表示和xml數(shù)據(jù)庫查詢_第1頁
已閱讀1頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p> ?。ǜ郊?:外文譯文一)</p><p>  International Journal of Uncertainty,</p><p>  Fuzziness and Knowledge-Based Systems</p><p>  Vol. 15, Suppl. (February 2007) 43-57</p><p&

2、gt;  © World Scientific Publishing Company</p><p>  模糊數(shù)據(jù)表示和XML數(shù)據(jù)庫查詢EKlN USTUNKAYA and ADNAN YAZICI</p><p>  Department of Computer Engineering, Middle East Technical University, 06531, Ank

3、ara - Turkey</p><p>  Email: {ell2925, yazicij@ceng.metu.edu.tr</p><p>  ROY GEORGE*</p><p>  Department of Computer Science, Clark-Atlanta University, Atlanta, GA, USA</p>&

4、lt;p>  Email: rkavil@gmail.com</p><p>  真實世界的信息,包括主觀的意見和判斷,需要不精確數(shù)據(jù)為藍本來表示并在數(shù)據(jù)庫中查詢。近年來,可擴展標記語言(XML)事實上已經(jīng)成為數(shù)據(jù)建模和交流的標準。在XML中,對不精確性的建模和代表這些數(shù)據(jù)做出的努力沒有得到充分發(fā)展。本文中,提出了基于XML的模糊數(shù)據(jù)表示和查詢系統(tǒng)。用模糊擴展的XML來表示復雜和不精確的數(shù)據(jù)。這種表示法形成

5、了一個基礎系統(tǒng),能夠在XML文檔使用XML的一種查詢語言XQuery進行模糊查詢。該系統(tǒng)還可以通過XML架構(gòu)重組,合并XML元素文件。通過使用此功能的系統(tǒng),應用程序特定的XML架構(gòu)和XML文件可以從現(xiàn)有的文件中產(chǎn)生。</p><p>  關(guān)鍵字:模糊查詢,XML,原生XML數(shù)據(jù)庫。</p><p><b>  1、簡介</b></p><p>

6、  數(shù)據(jù)庫是數(shù)據(jù)的一個有組織的集合。傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)特別適合于代表那些使用標準結(jié)構(gòu)的清晰、明確界定的數(shù)據(jù),。然而,現(xiàn)實世界的信息,包括主觀的意見和判斷,需要復雜和不準確的數(shù)據(jù)建模同時也需要明確界定的數(shù)據(jù)。在數(shù)據(jù)庫中代表這種不確定性和復雜的數(shù)據(jù)仍然是一個正在研究中的問題。擴展非第一范式(ExNF2)[1]數(shù)據(jù)模型是一個已為擬議的代表這種不確定和不精確數(shù)據(jù)模型。</p><p>  可擴展標記語言(XML)[2]

7、[3][4][5],被廣泛用于數(shù)據(jù)代表和交換。XML允許內(nèi)容和表現(xiàn)的分離,也就是說,XML文檔簡單定義了數(shù)據(jù)表示但是并不處理它的表現(xiàn)形式。XML可以用來表示復雜和層次性的信息,這是ExNF模型的基本造型結(jié)構(gòu)。</p><p>  選擇最合適的數(shù)據(jù)庫管理系統(tǒng),以處理基于應用程序和數(shù)據(jù)結(jié)構(gòu)的XML數(shù)據(jù)。隨著越來越大的數(shù)據(jù)量作為XML文檔表示,有必要有效地存儲和查詢這些XML文檔。在管理XML數(shù)據(jù)中,原生的XML數(shù)據(jù)庫

8、比傳統(tǒng)的數(shù)據(jù)庫管理系統(tǒng)具有幾個優(yōu)點。當數(shù)據(jù)是半結(jié)構(gòu)化時,映射到一個關(guān)系數(shù)據(jù)庫結(jié)果中將導致大量的空列(浪費空間)或大量的表(低效的)。另一個在原生XML數(shù)據(jù)庫存儲數(shù)據(jù)的原因是檢索速度。原生XML數(shù)據(jù)庫在物理存儲數(shù)據(jù)方面,檢索數(shù)據(jù)比關(guān)系型數(shù)據(jù)庫快得多。這是因為原生XML運用存儲策略存儲整個文件或在文件的各部分中使用物理(而不是邏輯)指針;允許要檢索的文件沒有連接或存在物理連接,這兩者速度都比關(guān)系型數(shù)據(jù)庫上的邏輯連接據(jù)庫快得多[11]。<

9、;/p><p>  幾個XML查詢語言(如XML- QL的[6],XPATH[7]和XQuery[8])已經(jīng)被XML提出。XML的一個特有優(yōu)勢在于它在代表來自不同來源的信息時具有的靈活性。要利用此靈活性,XML查詢語言必須為這些不同來源的信息提供檢索和解釋功能。XQuery[8]已被W3C批準作為用于XML查詢的標準語言[9]。</p><p>  在數(shù)據(jù)庫領(lǐng)域中,傳統(tǒng)的查詢語言允許在精確的數(shù)

10、據(jù)的基礎上進行數(shù)據(jù)選擇。查詢的價值在于能在那些完全滿足查詢條件和那些不滿足條件的地方產(chǎn)生Boolean分區(qū)數(shù)據(jù)?,F(xiàn)實世界信息是既復雜又不確切,許多知識密集的應用程序需要使用這些數(shù)據(jù)[10],[12],[13],[14],[15],[16],[17]。使用模糊邏輯查詢允許用戶自定義軟目標和約束,并向用戶提供查詢數(shù)據(jù)的相對重要性。</p><p>  本文中,我們介紹了將復雜和不確定的數(shù)據(jù)映射到XML代表的方法。這項

11、研究的動機是為了在XML文檔中的結(jié)合模糊和不確定的數(shù)據(jù)代表處理ExNF數(shù)據(jù)模型性并推廣XML數(shù)據(jù)庫系統(tǒng)的使用。</p><p>  XML的結(jié)構(gòu)非常類似于關(guān)系數(shù)據(jù)庫元組,因此,將INF文件的元組映射到XML元素是很簡單的[18][19]。然而,ExNF模型[1]介紹的是經(jīng)擴展的,較復雜的,不確定的和模糊的數(shù)據(jù),不容易用XML表示。在這項研究中,XML文檔適用于ExNF2模型的格式,包括代表不精確、復雜性數(shù)據(jù)的元素

12、和屬性。我們使用這些概念,開發(fā)一個系統(tǒng),允許在XML文檔中進行模糊查詢。系統(tǒng)中XML文檔的概念通過模糊屬性得到擴展。除了模糊查詢,系統(tǒng)可通過合并XML文檔的元素重組XML架構(gòu)。通過使用此功能的系統(tǒng),特定的XML Schema應用程序和XML文檔可從現(xiàn)有的文件中產(chǎn)生。要查詢的XML文檔在原生XML數(shù)據(jù)庫管理系統(tǒng)塔米諾[20]中存儲。</p><p>  本文的組織構(gòu)架如下:第2節(jié)將描述以XML為基礎的模糊查詢系統(tǒng)的

13、設計。第3節(jié)將描述在實施這項研究中所做的細節(jié)性工作。最后,第4節(jié)作出結(jié)論總結(jié)。</p><p>  2、基于XML的模糊查詢系統(tǒng)的設計</p><p>  本節(jié)中,我們首先提出包括在這項研究中的模糊和其他不確定屬性的定義以及它們的XML表示。參考模型是ExNF數(shù)據(jù)庫模型[1]。</p><p><b>  2.1系統(tǒng)目標</b></p&g

14、t;<p>  這項研究的主要目標是開發(fā)一個系統(tǒng),它通過使用由非第一擴展范式(ExNF2)[1]的擴展介紹,在XML中,為現(xiàn)實世界的數(shù)據(jù)提供了一個模型。在XML數(shù)據(jù)中執(zhí)行模糊查詢,并允許XML模式轉(zhuǎn)型。該系統(tǒng)應以圖形用戶界面提供用戶構(gòu)建模糊查詢和XML重組架構(gòu)。</p><p>  2.2復雜和不確定的數(shù)據(jù)建模</p><p>  本節(jié)引入在ExNF模型[1]中介紹的屬性類型

15、的定義以及在屬性類型的XML表示。在ExNF模型中屬性類型的介紹包括原子,空值,設定值,關(guān)系值,模糊值,范圍值屬性以及XML表示形式的基礎。</p><p>  2.2.1在ExNF數(shù)據(jù)模型中不確定性的代表</p><p>  在數(shù)據(jù)庫中不確定性可以通過擴展的嵌套關(guān)系[21][22]代表而非INF數(shù)據(jù)模型[23],[24],[25]。擴展模型,即擴展非第一范式(ExNF)[1],在數(shù)據(jù)庫中

16、提供包括不確定性的擴展是必要的。 ExNF關(guān)系可以定義如下[1]:</p><p>  定義:定義Sch R是一個與屬性R相關(guān)的屬性(A1,A2,……,An)。每個屬性Aj可能是簡單的設定值,模糊值,范圍值或關(guān)系值,如下文定義。假設D1, D2,……,Dn是有限域設置。使e,R的一個實例,組成一套有序的形式<a1, a2,……,an> ,這是(D1 x D2x……x Dn)的一個子集。Dj(1<

17、j<k)的域,可以是以下內(nèi)容中的一個:</p><p>  Dj是一個原子值屬性域。每個值Aj是Dj的一個元素;也就是說,它是一個典型的簡單明確界定的屬性值。</p><p>  (二)Dj是一個空值的屬性域。域名Dj組成了明確定義的值{a1,a2,……,an}可以擴展到域Dj= DjU {unk,dne,ni}。</p><p> ?。ㄈ〥j是一個不完整(

18、范圍)值的屬性,其值可以是原子或一個區(qū)間。區(qū)間表示為[aj1 - aj2],其中aj1為最小值,aj2是范圍的最大值。這兩個值都取自域Dj。</p><p> ?。ㄋ模〥j是一個模糊值屬性域。域包含了一組模糊集語言。一個模糊的屬性值是一個非空子集的Dj和[aj1,aj2,……,ajm]的代表。</p><p> ?。ㄎ澹〥j是集值屬性域,其值代表明確界定的集{aj1, aj2,……,ajm

19、}。任何這個屬性的值都是Dj的一個子集。</p><p> ?。〥j是關(guān)系值(復合)屬性域。這個屬性的任何值,Aj,是一個元組<aj1,Aj2,……,Ajm>的形式,這是(Dj1 x Dj2x……xDjm)的一個元素,其中1 <m并且1<j<k。</p><p>  當Dj是一個關(guān)系值(復合)設置屬性域時,其中每個Aj值是{<aj1, aj2,……,

20、ajm>,……,<ak1, ak2, ……,akm>}的一個元組,這是(Dj1x Dj2 x …… xDjm)的一個子集,可以通過關(guān)系值和設定值的組合來形成這種屬性。</p><p>  定義:假設R和S是Rel A和Att A中的屬性,且是dom中存在的常數(shù)。在這里使用的類型比那些關(guān)系數(shù)據(jù)模型更復雜。他們的抽象語法為:</p><p>  x = dom| fdom|

21、ndom| idom|(B1:x1,……,Bm :xm)|{xs},</p><p>  其中xs≠fdom| idom|{X}且B1,……Bm是截然不同的屬性。直觀地看,一個元素dom是一個常數(shù)(傳統(tǒng)的明確界定的原子屬性),fdom是一個模糊值排序?qū)傩裕赡苄纬梢粋€集或語義)[v1,……,vm]的形式,其中vj是dom的一種并且是任何本集的子集元素;ndom是{unk,dne,ni,x}一個空值的排序?qū)傩孕问剑?/p>

22、其中x排序dom; idom是[v1 - vj]的一個排序不完整的形式,vj的排序dom和元素是vj,v1 ≤vi≤vj;(B 1:x1,……Bm:xm)的排序元素是K元組在Bj的排序xi的一個元素,1<i<m;排序元素{xi}是排序X的一個有限集合元素。</p><p>  定義:從形式上看,排序x的值(即x的解釋),記為t [x],定義如下:</p><p> ?。ㄒ唬﹖

23、[dom] = dom,(二)t[fdom]= {[v1,……, vj] |Vi:1 ≤i ≤j:vi∈t[dom]},(三)t [ndom]= {vi | Vi:1≤i ≤j:vi∈t[{unk,dne,ni}∪dom}]},(四)t[idom]= {[v1 - vj] | Vi:1 ≤i ≤j:v1≤vi≤vj,vi∈t[dom]},(五)t[{xs]={{v1,……,vj} | Vi,j:1≤i≤j:vi∈t [xs]。如

24、果t[{xs}] = { },那么vi = dne},</p><p>  (六)t [(B1:x1,……,Bm:xm)] = {(B1:x1,……,Bm:xm) | Vi:1≤i≤m:Vi∈t[ xi]}。</p><p>  R由關(guān)系名和數(shù)據(jù)庫架構(gòu)的關(guān)系名稱的有限集合組成。關(guān)系名稱R的一種關(guān)系是有限排序值(R)。比如I的架構(gòu)R是R的函數(shù),在這里I是R關(guān)系的實例。當關(guān)系R有一個排序,即(

25、R)=(B1:x1,……,Bm:xm),這種關(guān)系由元組組成,其中每個xi可能是上述給出的解釋之一。</p><p>  2.2.2.在XML中表示不確定性</p><p>  XML文檔是一個由邏輯結(jié)構(gòu)(由文檔對象聲明,注釋,字符引用,元素,和處理指令構(gòu)成),和物理結(jié)構(gòu)(由實體,開始的根,或文檔實體組成)構(gòu)成的。每個元素都有一個類型,有名稱標識,并且可能有一組屬性規(guī)范。屬性規(guī)范有相應的名稱

26、和值。XML架構(gòu)的元素有兩種主要類型:簡單的和復雜的。簡單的元素內(nèi)他們定義為零屬性和零元素,而復雜元素的定義允許有一個或多個屬性或一個或多個元素。復雜的因素可能會進一步歸類為:空元素,只包含其他元素的元素,只包含文本的元素,同時包含文本和其他元素的元素。</p><p>  在XML文檔中,原子屬性代表了明確界定的數(shù)據(jù)。這些原子屬性在XML文檔中可以作為元素的值。例如,一本書的標題是一個原子屬性。</p&g

27、t;<p>  在XML中的空值可以代表新值或引入的字符數(shù)據(jù),如ni(無信息),unk(未知),和dne(不存在)。例如,可以用以上的值來形象的描述一本書的封面。</p><p>  集值屬性是指在一個屬性中有幾個值。其中每個值可以作為一個元素添加到XML,這是使用XML的一種使用方式,而不是僅僅把一個個值串起來。例如,一本書可能有多個作者,每個作者在“作者”的標簽內(nèi)添加“作者”的標簽。圖1顯示了一

28、個例子。</p><p>  圖1 XML集值屬性的示例</p><p>  模糊值屬性用來表示不精確或模糊的數(shù)據(jù)。用于表示模糊值屬性,如“紅色”或“綠色”,被用于表示一本書的顏色。一個模糊值(集)用來存儲元素的值。</p><p>  模糊數(shù)據(jù)的語義在“色”元素中作為一個模糊術(shù)語用來表示“模糊謂詞”屬性。模糊值屬性可能有各種語義,如“或”,“異”,“和”等有關(guān)的模

29、糊值。圖2是給出的一個例子。</p><p>  圖2 XML模糊值屬性示例</p><p>  范圍值(或不完整的值)屬性,是用來指定一個字符串格式的范圍值。我們?yōu)闀膬r格信息存儲價值不等的屬性“最低價”和“最高價”標簽。如圖3所示是一個例子。</p><p>  圖3 XML范圍值屬性示例</p><p>  在關(guān)系值屬性中,字段的內(nèi)容

30、是其他元組的指針。關(guān)系值屬性代表設置值屬性,即對于每個值,都作為一個完整關(guān)系的元素在元組中出現(xiàn)。舉例來說,關(guān)系值屬性代表“形象”,“顏色”,“說明”的“形象”元素。如圖4所示就是一個例子。</p><p>  圖4 XML關(guān)系值屬性的示例</p><p>  2.3.數(shù)據(jù)對象和數(shù)據(jù)庫設計</p><p>  在這項研究中,所有的數(shù)據(jù)都是XML格式,并存儲在原生XM

31、L數(shù)據(jù)庫管理系統(tǒng)中。除了數(shù)據(jù),就是模糊屬性的相似性表,與屬性值相關(guān),也以XML形式存儲在數(shù)據(jù)庫中。</p><p>  在系統(tǒng)書籍(如圖5所示為一個完整的示例)作為數(shù)據(jù)對象被選擇。產(chǎn)品信息是由Web服務檢索從XML文檔中獲得的,這些文件被轉(zhuǎn)化為本地XML架構(gòu)使其適合應用程序。這種轉(zhuǎn)變后,這些文件插入到數(shù)據(jù)庫中。XML文檔存儲在數(shù)據(jù)庫中有一個示例[9]。 用來表示存儲產(chǎn)品信息的XML文檔XML構(gòu)架如圖5所示。<

32、;/p><p>  一本書的封面用模糊的“顏色”屬性來表示。一本書的封面可能有多種顏色。由于“顏色”是一個模糊屬性,糊的顏色值的相似矩陣[10],[11]存儲在一個XML文檔中。為了說明概念模糊的“主體”屬性,有關(guān)問題的相似性值將存儲在一個XML文檔中。</p><p>  圖5 一個產(chǎn)品的XML構(gòu)架表示</p><p><b>  3.系統(tǒng)的特點</

33、b></p><p>  本節(jié)中,對系統(tǒng)的功能特性進行了簡要解釋。</p><p><b>  3.1.數(shù)據(jù)庫查詢</b></p><p>  在系統(tǒng)中,用戶可以查詢在塔米諾XML服務器中其屬性數(shù)據(jù)存儲為XML文檔的書籍。圖形用戶界面允許用戶選擇或輸入自己的搜索條件。在這些搜索條件基礎上形成一個XQuery表達式。 XQuery表達式發(fā)送

34、到塔米諾XML服務器并且查詢結(jié)果會在用戶界面上顯示。Java 的塔米諾API用于查詢存儲在數(shù)據(jù)庫中的數(shù)據(jù)。圖6顯示了在這個系統(tǒng)中查詢處理的體系結(jié)構(gòu)概述。</p><p>  圖6 查詢處理的體系結(jié)構(gòu)概述</p><p>  圖7顯示了XQuery表達式為查詢生成“顯示所有出版商是“托馬斯鄧恩圖書”書籍”的一個例子。圖8顯示了與ProductInfo應用程序相關(guān)的一個示例。</p&g

35、t;<p>  圖7 XQuery的一個例子</p><p>  如果查詢包括模糊值屬性的搜索條件,執(zhí)行查詢?nèi)缦拢浩鸪鯔z索的是非模糊屬性值。這個結(jié)果第一步是根據(jù)模糊值屬性的結(jié)果設置“和”。對于模糊值屬性我們利用模糊值的相似矩陣[10][11]。例如,如果查詢“顯示所有的書籍,其發(fā)行者是”托馬斯鄧恩圖書并且主題是閾值為0,7的“科學”,首先檢索滿足出版商標準的書籍,然后使用主題屬性的相似矩陣檢索滿足

36、主題標準的書籍。如果在查詢中“科學”的其他域值大于或等于指定的閾值,那么這些元組還將包括在答案集中。</p><p>  圖8顯示了XQuery表達式用來查找相似值主題為“科學”和“歷史”的一個示例。讓我們假設這個表達式的結(jié)果是“0,5”。圖11顯示了查詢結(jié)果。圖12可以看出,有7條記錄滿足“出版商為托馬斯鄧恩圖書”書籍”的搜索條件,但在圖11中記錄的數(shù)量是3。有四本書不符合指定的標準:“閾值為0,7主題為科學的

37、書籍”。由于科學和計算機之間的相似性為0.9(大于指定閾值0.7),圖11中是檢索元組中的第二個元組(作者是“C.J. Date”)。請注意,閾值是在查詢處理后在考慮的。</p><p>  圖8 XQuery檢索相似度值的示例</p><p>  3.2.模糊查詢 正如以上示例,模糊屬性“主題”和“顏色”,可以與閾值以及“和”,“或”謂詞一起查詢。下面將給出執(zhí)行模糊的“顏色”屬

38、性查詢的例子。執(zhí)行命名為“欺騙點”書籍的查詢。圖9給出了此書的XML表示。</p><p>  圖9 書籍“欺騙點”的XML表示</p><p>  當執(zhí)行“黑”,“藍”顏色以及“或”謂詞查詢時,該查詢返回“欺騙點”的紀錄,因為這些書符合顏色為“黑色”和“藍色”以及“或”模糊謂詞。當執(zhí)行“黑”,“藍”顏色以及“和”謂詞查詢時,查詢結(jié)果沒有返回記錄,因為沒有書符合“黑”,“藍”以及“和”謂

39、詞條件。如圖13所示是這個查詢的結(jié)果。</p><p>  當圖13中的顏色閾值改為“0.3”,查詢返回的記錄為“欺騙點”。雖然這本書是這些顏色用“或”謂詞連接,但“黑色”和“藍色”的相似值為“0.6”[9]。由于在查詢中閾值小于相似度值,查詢條件是滿足的。圖14顯示了此查詢結(jié)果。</p><p>  圖10 相關(guān)的ProductInfo應用程序示例</p><p&g

40、t;  3.3.合并XML構(gòu)架</p><p>  該系統(tǒng)還允許用戶合并存儲在塔米諾XML數(shù)據(jù)庫服務器中的XML架構(gòu)中的元素。重組一個XML構(gòu)架,改變的XML架構(gòu)文件會被選中,然后會顯示被選擇的XML構(gòu)架元素。 要合并的元素會被選中,合并名稱為新的元素,這是選定的元素合并形成的。除了新的XML構(gòu)架,新的XML文件包括合并對象(或元組)的原始文檔將根據(jù)新的XML構(gòu)架生成并同時加載到數(shù)據(jù)庫中。</p>

41、<p>  圖11 滿足條件“主題是科學并且閾值為0,7”的查詢結(jié)果</p><p>  圖12 滿足條件“出版商為托馬斯鄧恩圖書書籍”的查詢結(jié)果</p><p>  圖13 執(zhí)行“黑”,“藍”顏色,“和”謂詞以及“閾值0.7”的查詢結(jié)果</p><p>  圖14 執(zhí)行“黑”,“藍”顏色,“和”謂詞以及“閾值0.3”的查詢結(jié)果</p>

42、<p>  圖15表示ExNF數(shù)據(jù)模型,這也作為一個XML文檔的代表。在ExNF中每列元素XML架構(gòu)中的元素對應。例如,在圖15和圖16所示,如果用戶選擇這個XML架構(gòu)的所有元素,除了“出版商”元素被名稱為“Publisherlnfo”的屬性合并,產(chǎn)生了一個新的以PublisherlnfoSchema(由用戶命名)命名的XML架構(gòu)。具有相同的出版商的圖書被合并從而形成一個新的合并關(guān)系。這種合并的關(guān)系,可以達到更有效的查詢目的或

43、根據(jù)用戶的要求生成耳目一新的數(shù)據(jù)庫構(gòu)架。包括了合并和取消合并的操作細節(jié)[1]。</p><p>  3.4.開發(fā)環(huán)境 為了實現(xiàn)了平臺的獨立性,根據(jù)系統(tǒng)的開發(fā)程度選擇Java編程語言。該系統(tǒng)是作為Borland JBuilder第9企業(yè)版的一個獨立應用程序?qū)嵤┑?。Java 的塔米諾API用來訪問和操縱塔米諾數(shù)據(jù)庫[20]中存儲的數(shù)據(jù)。 “塔米諾執(zhí)行XQuery,被稱為塔米諾XQuery4是用于執(zhí)行查詢的,也

44、可在塔米諾API為Java訪問。 Software AG的塔米諾XML服務器4.1.4[20]被用來充當XML數(shù)據(jù)庫系統(tǒng)。 Software AG的塔米諾架構(gòu)編輯器4.1.4.2被用于設計XML構(gòu)架。</p><p>  圖15 合并前的XML構(gòu)架結(jié)構(gòu)</p><p>  圖16 新的XML構(gòu)架結(jié)構(gòu)</p><p>  4.結(jié)論 “可擴展標記語言(XML)

45、是數(shù)據(jù)表示以及進行格式轉(zhuǎn)換的的一種方法。 XML文檔定義數(shù)據(jù)表示但并不處理數(shù)據(jù)的表現(xiàn)形式。 XML也可以用來表示復雜和不準確的除了明確界定的數(shù)據(jù)格式。 XML可以處理復雜,層次化的信息,同時也可用于商業(yè)交易。</p><p>  本文中,復雜和不確定的數(shù)據(jù)是用XML來表示的。用戶可以在開發(fā)系統(tǒng)上執(zhí)行XML文檔的模糊查詢。該系統(tǒng)中XML文檔包含模糊屬性。用戶可以指定一個模糊的屬性和閾值進行模糊查詢。除了模糊查詢,系

46、統(tǒng)可通過XML文檔中元素的合并進行XML架構(gòu)重組。通過使用此功能,系統(tǒng)可以生成一個新的XML架構(gòu)以及從現(xiàn)有文件中形成新的XML文檔。系統(tǒng)中的XML文檔存儲在原生XML數(shù)據(jù)庫管理系統(tǒng)中,即塔米諾。</p><p><b>  參考文獻</b></p><p>  1. Adnan Yazici, Alper Soysal, Bill P. Buckles, and Fr

47、ed E. Petry, Uncertainty in nested</p><p>  relational database model, Data & Knowledge Engineering 30 (1999) 275-301.</p><p>  2. Jennifer Widom, Data Management for XML: Research Direction

48、s. http://wwwdb.</p><p>  stanford.edu/~widom/, (1999).</p><p>  3. Frank Jung, XML Backgrounder, Software AG, http://wwwl.softwareag.com/Corporate/,</p><p>  (August 2003).</p&g

49、t;<p>  4. Guide to the W3C XML Specification ("XMLspec") DTD,V.2.1, http://www.w3.org/</p><p>  XML/1998/, (1998).</p><p>  5. Charter of the XML Schema Working Group, http://w

50、ww.w3.org/2003/09/xmlap/xmlschema-</p><p>  wg-charter.html, June 2004.</p><p>  6. XML-QL: A Query Language for XML, http://www.w3.org/TR/1998/NOTE-xml-ql-</p><p>  19980819, (Augu

51、st 1998).</p><p>  7. J. Clark, S. DeRose, XML Path Language (XPath) Version 1.0, W3C Recommendation,</p><p>  http://www.w3.org/TR/xpath, (November 1999).</p><p>  8. XQuery 1.0: A

52、n XML Query Language, http://www.w3.org/TR/xquery/, (July 2004).</p><p>  9. Bourret, R., XML and Databases", http://www.rpbourret.coin/xml/XML Databases, (2004).</p><p>  10. L.A. Zadeh, S

53、imilarity Relations and Fuzzy Orderings, Information Sciences, vol. 3, no. 2,</p><p>  (1971) pp. 177-200.</p><p>  11. Buckles B. P. and Petry F. E., A fuzzy representation of data for relation

54、al databases, Fuzzy</p><p>  Sets and Systems, Vol. 7, (1982) pp.213-226.</p><p>  12. Tahani V., A conceptual framework for fuzzy query processing - A step toward very</p><p>  int

55、elligent database systems, Information processing Management,Vol. 13,(1977) pp.289-303.</p><p>  13. Zemankova M. and Kandel A., Fuzzy Relational Data Bases - A key to Expert Systems,</p><p>  V

56、erlag TUV Rheinland, Koln, (1984).</p><p>  14. Anvari, M., Rose G. F., Fuzzy relational databases, Analysis of Fuzzy Information, Bezdek ed.,</p><p>  Vol II, CRC Press (1987).</p><p

57、>  15. Ruspini E. H., Issues in the representation of imprecision and uncertainty in information</p><p>  systems, Analysis of Fuzzy Info - Vol. II: Artificial Intelligence and Decision Systems, CRC</p

58、><p>  Press, Boca Raton, Fl. (1987) pp.231-239.</p><p>  Fuzzy Data Representation and Querying in XML Database 57</p><p>  16. Prade H. and Testemale C, Generalizing Database Relatio

59、nal Algebra for the Treatment of</p><p>  Incomplete/Uncertain Information and Vague Queries, Information Sciences, Vol. 34 (1984)</p><p>  pp.115-143.</p><p>  17. Medina J. M., Po

60、ns O. and Vila M. A., GEFRED, A generalized model of fuzzy relational</p><p>  databases, Version 1.1, Information Sciences (1994).</p><p>  18. Lee D., Mani M., Chiu F. and Chu W., NeT and CoT:

61、 Translating relational schemas to XML</p><p>  Schemas using semantic constraints, Proceedings of CIKM, McLean, Virginia (2002)</p><p>  pp.282-291.</p><p>  19. Fernandez M., Mori

62、shima A. and Suciu D., Efficient evaluation of XML middle-ware queries,</p><p>  Proceedings of ACM SIGMOD Int. Conf. on Management of Data, Santa Barbara, CA (May</p><p>  2001),pp.l03-114.<

63、/p><p>  20. www.softwareag.com/de/products/tamino.</p><p>  21. L. S. Colby, A recursive algebra for nested relations, Information Systems 15 (5) (1990)</p><p>  pp.567-662.</p>

64、<p>  22. S. J. Thomas, P. C. Fischer, Nested relational structures, Advances in Computing Research,</p><p>  vol. 3, JAI Press (1986) pp. 269-307.</p><p>  23. M. A. Roth, H. F. Korth, D

65、. S. Batory, SQL/NF: a query language for non-INF relational</p><p>  databases, Information Systems 12 (1987) pp. 99-114.</p><p>  24. H. J. Schek, M. H. SchoU, The relational model with relati

66、onal-valued attributes, Information</p><p>  Systems 11 (2) (1986) pp.137-147.</p><p>  25. G. Ozsoyoglu, Z.M. Ozsoyoglu, V. Matos, "Extending relational algebra and relational</p>&

67、lt;p>  calculus with set-valued attributes and aggregate functions," ACM Transactions on Database</p><p>  Systems 12 (4) (1987) pp.566-592.</p><p> ?。ǜ郊?:外文原文一)</p><p>  In

68、ternational Journal of Uncertainty,</p><p>  Fuzziness and Knowledge-Based Systems</p><p>  Vol. 15, Suppl. (February 2007) 43-57</p><p>  © World Scientific Publishing Company

69、</p><p>  FUZZY DATA REPRESENTATION AND QUERYING IN XML DATABASE</p><p>  EKlN USTUNKAYA and ADNAN YAZICI</p><p>  Department of Computer Engineering, Middle East Technical Universi

70、ty, 06531, Ankara - Turkey</p><p>  Email: {ell2925, yazicij@ceng.metu.edu.tr</p><p>  ROY GEORGE*</p><p>  Department of Computer Science, Clark-Atlanta University, Atlanta, GA, US

71、A</p><p>  Email: rkavil@gmail.com</p><p>  Real-world information including subjective opinions and judgments need imprecise data to bemodeled for representation and querying in databases. The

72、Extensible Markup Language (XML) hasbecome a de-facto standard for data modeling and exchange in recent years. Efforts on modelingimprecision and representing such data in XML have not been fully developed. In this paper

73、, anXML based fuzzy data representation and querying system is presented. Complex and imprecisedata are represented using a fuzzy </p><p>  1. Introduction</p><p>  A database is an organized co

74、llection of data. Traditional database management systemsare particularly suited to represent crisp, well defined data using standard structures. However, real-world information includes subjective opinions and judgments

75、 that requirethe modeling of complex and imprecise data along with crisp data. The representation ofsuch uncertain and complex data in a database is still a research issue. The Extended NonFirst Normal Form (ExNF2) [1] d

76、ata model is a model that has b</p><p>  The Extensible Mark-up Language (XML) [2], [3], [4], [5] is widely used for datarepresentation and interchange. XML allows the separation of content and presentation,

77、 i.e., XML documents simply define the data representation and do not deal with thepresentation. XML can be used to represent complex and hierarchical information, whichare basic modeling constructs in the ExNF2 model.&l

78、t;/p><p>  This work is partially supported by the NSF Grant No. HRD-0401679, AHPCRC Contract No. DAAD19-01-2-0014 and ARL Contract No. DAAL01-98-2-0065. The content of this work does not reflect the position o

79、rpolicy of the sponsors and no official endorsement should be inferred. Choosing the most appropriate database management system to handle XML datadepends on the application and data structure. With increasingly large am

80、ount of databeing represented as XML documents, it becomes necessary to efficient</p><p>  Several XML query languages (such as XML-QL [6], XPath [7], and XQuery [8]) have been proposed for XML. A particular

81、 strength of XML is its flexibility inrepresenting many different kinds of information from diverse sources. To exploit thisflexibility, an XML query language must provide features for retrieving and interpretinginformat

82、ion from these diverse sources. XQuery [8] has been endorsed by W3C as astandard for XML querying [9].</p><p>  Traditional query languages in database domain allow data selection based onprecise data. The e

83、valuation of the query produces Boolean partitions of the data into those that fully satisfy the query condition and those which do not. Real world information is both complex and imprecise and many knowledge-intensive a

84、pplications require the use of such data [10], [12], [13], [14], [15], [16], [17]. Querying using fuzzy logic permits the user to define soft goals and constraints, and provide them wit</p><p>  In this pape

85、r, we introduce methods to map complex and uncertain data to XML</p><p>  representation. The motivation of this study is to handle the ExNF2 data model by</p><p>  incorporating fuzzy and uncer

86、tain data representation in XML documents and</p><p>  implemented using an XML database system..</p><p>  The structure of XML closely resembles that of relational database tuples, and</p>

87、;<p>  therefore the mapping from INF tuples to XML elements is straightforward [18], [19].</p><p>  However, the ExNF2 model [1] introduces extensions for representing complex, uncertain</p>&

88、lt;p>  and fuzzy data not easily represented in XML. In this study, XML documents are adapted</p><p>  to include elements and attributes for representing the imprecise and complex data</p><p&g

89、t;  formats of the ExNF2 model. We use these concepts to develop a system that permits</p><p>  fuzzy querying in XML documents. The notion of XML documents in the system are</p><p>  extended t

90、hrough fuzzy attributes. In addition to fuzzy querying, the system enables</p><p>  restructuring of XML Schemas by merging of elements of the XML documents. By using</p><p>  this feature of th

91、e system, application specific XML Schema and XML documents may</p><p>  Fuzzy Data Representation and Querying in XML Database 45</p><p>  be generated from the existing documents. The XML docu

92、ments to be queried are</p><p>  stored in a native XML database management system, Tamino [20].</p><p>  The organization of the paper is as follows: Section 2 describes design of XMLbased</

93、p><p>  fuzzy querying system. Section 3 details the implementation of the work done in</p><p>  this study. Finally, Section 4 includes conclusion remarks.</p><p>  2. Design of the X

94、ML-Based Fuzzy Querying System</p><p>  In this section, we first present definitions of fuzzy and other uncertain attributes</p><p>  included in this study and their XML representations. The r

95、eference model is the ExNF2</p><p>  database model [1].</p><p>  2.1. System objectives</p><p>  The primary objective of this research is to develop a system, which provides a mod

96、el for</p><p>  real world data in XML, using the extensions introduced by the Extended Non-First</p><p>  Normal Form (ExNF2) [1]; perform fuzzy queries on XML data and permit restructuring<

97、/p><p>  of the XML Schemas. The system should provide the user with a graphical user interface</p><p>  for constructing fuzzy queries and for restructuring the XML Schemas.</p><p>  

98、2.2. Modeling complex and uncertain data</p><p>  This section presents definition of the attribute types introduced in the ExNF2 model [1]</p><p>  and then the XML representation of the attrib

99、ute types. The attribute types introduced in</p><p>  the ExNF2 model are atomic, null-valued, set-valued, relation-valued, fuzzy-valued, and</p><p>  range-valued attributes, and form the basis

100、 of the XML representation.</p><p>  2.2.1. Representing uncertainty in ExNF data model</p><p>  Uncertainty can be represented in databases by extending the nested relations [21], [22]</p>

101、;<p>  or non-INF data model [23], [24], [25]. The extended model, the Extended Non-First</p><p>  Normal Form (ExNF2) [1], provides the extensions necessary to include uncertainty in</p><p

102、>  the database. An ExNF2 relation can be defined as follows [1]:</p><p>  Definition: Let Sch R be a relation schema of relation R with attributes (A!,A2,...,An).</p><p>  Each attribute Aj

103、may be simple, set-valued, fuzzy-valued, range-valued or relationvalued</p><p>  which are all defined below. Suppose Db D2,..., Dn is a finite set of domains. Let</p><p>  e, an instance of R,

104、be composed of a set of ordered k-tuples of the form <a1; a2, ..., an>,</p><p>  which is a subset of (Di x D2 x ... x Dn). The domains, Dj (1 <j < k), can be one of the</p><p>  fol

105、lowing:</p><p>  (i) Dj is the domain of an atomic-valued attribute. Each value aj is an element of DJ; that</p><p>  is, it is a typical simple crisp attribute value,</p><p>  (ii)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論