公司名稱-智能科學(xué)網(wǎng)站_第1頁
已閱讀1頁,還剩61頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于KDD的知識自動(dòng)獲取及其應(yīng)用,答 辯 人:黃 瑞指導(dǎo)教師:趙遠(yuǎn)東 副教授 史忠植 研究員,,,主要內(nèi)容,一、研究背景及意義二、基于KDD的知識自動(dòng)獲取模型概述三、基于知識庫的KDD四、自動(dòng)演化知識庫五、模型在自動(dòng)化測井?dāng)?shù)據(jù)分析中的應(yīng)用六、總結(jié)與展望,,,,研究背景及意義,知識獲取研究概述知識獲取的基本過程知識獲取研究的主要內(nèi)容知識自動(dòng)獲取研究發(fā)展KDD (Knowledge Discover

2、y in Databases)研究概述KDD的基本過程KDD的主要任務(wù)數(shù)據(jù)挖掘的常用方法KDD的應(yīng)用本文的研究目的,,,,知識獲取的基本過程,人類學(xué)習(xí)知識的基本過程,,,,,基礎(chǔ)知識學(xué)習(xí)(固化記憶),,,生產(chǎn)實(shí)踐(總結(jié)經(jīng)驗(yàn)),知識的發(fā)展與完善(新、舊知識融合),循環(huán),,,知識獲取的基本過程,知識獲取的基本過程,,知識工程師從知識源抽取知識存入知識庫,通過機(jī)器學(xué)習(xí)或數(shù)據(jù)挖掘工具從實(shí)踐數(shù)據(jù)中獲得新知識,由知識工程師和領(lǐng)域?qū)<?/p>

3、配合更新知識庫,,,,循環(huán),人類學(xué)習(xí)知識的基本過程,,,知識獲取的基本過程,人類學(xué)習(xí)知識的基本過程,,知識獲取的基本過程,,,知識獲取研究的主要內(nèi)容,知識抽取,,知識建模,知識轉(zhuǎn)換,知識檢測,知識的組織與管理,,,知識自動(dòng)獲取研究發(fā)展,非自動(dòng)的知識獲取,,自動(dòng)知識獲取,,,知識自動(dòng)獲取研究發(fā)展,運(yùn)用機(jī)器學(xué)習(xí)方法構(gòu)建知識庫Okamura 等人的鋼鐵工藝生產(chǎn)專家系統(tǒng)Yamamoto 等人的高爐配料操作自動(dòng)知識獲取系統(tǒng)中科院合肥智能所的

4、農(nóng)業(yè)病蟲害專家系統(tǒng),,運(yùn)用機(jī)器學(xué)習(xí)方法增強(qiáng)知識庫的自適應(yīng)能力吳榮根教授的基于模型的數(shù)字電路設(shè)計(jì)系統(tǒng)Elliott.和Schneider 的故障分離專家系統(tǒng),擁有自學(xué)習(xí)能力的知識編輯器Wheeler 和Schneider 的知識自動(dòng)獲取工具AUTOKNAQ,,,知識自動(dòng)獲取研究發(fā)展,利用KDD技術(shù)從數(shù)據(jù)中自動(dòng)發(fā)現(xiàn)新知識Mitchell 等人的燃?xì)鉁u輪機(jī)故障檢測TIGON系統(tǒng)Takano 等人的可自動(dòng)生成操作序列的范例學(xué)習(xí)工具,,

5、擴(kuò)大到了知識管理、Web知識獲取等領(lǐng)域,引入了本體學(xué)習(xí)、語義Web等概念與技術(shù)KAON工具套件中的TEXT-TO-ONTO工具Henk-Jan Lebbink等人的基于本體的知識系統(tǒng)Joerg-Uwe Kietz等人的自動(dòng)本體獲取Paulo Gottgtroy等人研究了動(dòng)態(tài)領(lǐng)域中的知識發(fā)現(xiàn)問題清華大學(xué)的基于語義Web的本體數(shù)據(jù)挖掘平臺中科院計(jì)算所的綜合知識管理平臺CKMP,,,知識自動(dòng)獲取研究發(fā)展,存在的問題,,循環(huán),環(huán)境

6、/背景知識不斷變化,自動(dòng)進(jìn)行,?,,,KDD的基本過程,,KDD從大量數(shù)據(jù)中提取出可信的、新穎的、有用的且可以被人理解的模式的高級處理過程五個(gè)步驟為:數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘、模式解釋/評價(jià),,,KDD的主要任務(wù),關(guān)聯(lián)分析分類聚類預(yù)測時(shí)序模式偏差檢測空間數(shù)據(jù)挖掘 Web數(shù)據(jù)挖掘,,,,數(shù)據(jù)挖掘的常用方法,關(guān)聯(lián)規(guī)則挖掘決策樹方法統(tǒng)計(jì)方法粗糙集方法人工神經(jīng)網(wǎng)絡(luò)遺傳算法,,,,KDD的應(yīng)用,數(shù)據(jù)挖

7、掘和知識發(fā)現(xiàn)系統(tǒng)IBM Almaden研究中心的Quest加拿大Simon Fraser大學(xué)的DBMinerAT&T實(shí)驗(yàn)室的IMACS和Spotlight中科院計(jì)算所的MSMiner,,作為知識獲取工具Bohanec等人的決策支持工具DEXIBM Watson研究中心開發(fā)的SEAS專家系統(tǒng)明確提出了“基于知識的數(shù)據(jù)挖掘”這一概念,,,?,KDD的應(yīng)用,存在的問題,,知識庫,KDD工具,,,知識工程師&領(lǐng)域?qū)<?/p>

8、,發(fā)現(xiàn),融合,先驗(yàn)知識,,,?,,,本文的研究目標(biāo),背景:中澳科技合作特別資金項(xiàng)目“數(shù)據(jù)挖掘技術(shù)在石油天然氣勘探開發(fā)工程中的應(yīng)用”問題:動(dòng)態(tài)環(huán)境下基于KDD的知識自動(dòng)獲取方法:從研究基于知識庫的KDD出發(fā),將知識庫中的知識作為先驗(yàn)知識引入KDD過程;進(jìn)而研究知識庫的自動(dòng)演化機(jī)制,將KDD過程發(fā)現(xiàn)的新模式與知識庫中的原有知識進(jìn)行自動(dòng)的知識檢測與融合目標(biāo):自動(dòng)進(jìn)行基于KDD的知識獲取循環(huán),,,,基于KDD的知識自動(dòng)獲取模型,,,,模型

9、結(jié)構(gòu),,,,主要子系統(tǒng),約束生成從知識庫自動(dòng)產(chǎn)生對KDD過程的約束輸入:知識庫和KDD模塊的參數(shù)輸出:對KDD過程的約束基于約束的KDD數(shù)據(jù)選擇:依據(jù)相應(yīng)的約束選出相關(guān)數(shù)據(jù)數(shù)據(jù)預(yù)處理:篩選掉非法的記錄并補(bǔ)齊缺失值數(shù)據(jù)挖掘:基于約束的規(guī)則挖掘解釋/評價(jià):根據(jù)規(guī)則的支持度、置信度、并結(jié)合其滿足約束的程度對目標(biāo)規(guī)則集進(jìn)行處理,,,,主要子系統(tǒng),知識庫管理對所發(fā)現(xiàn)的新知識與知識庫中的原有知識進(jìn)行一致性檢測和完整性檢測,并對不一

10、致和不完整的情況自動(dòng)進(jìn)行處理知識應(yīng)用將知識庫中的知識應(yīng)用于實(shí)際的運(yùn)行過程,并從外界獲得反饋,與運(yùn)行結(jié)果進(jìn)行比較,計(jì)算誤差,激發(fā)下一輪基于KDD的知識獲取過程兩個(gè)誤差閾值:平均誤差閾值和嚴(yán)重錯(cuò)誤閾值在KDD等過程中,知識庫不變且保持可用,知識庫更新后也可以立即應(yīng)用,,,,相關(guān)工作比較,利用KDD過程輔助知識自動(dòng)獲取的方法運(yùn)用KDD過程從實(shí)際案例中發(fā)現(xiàn)知識建立知識庫或驗(yàn)證知識庫中的現(xiàn)有知識將KDD過程發(fā)現(xiàn)的知識自動(dòng)融入知識庫存

11、在的問題需要進(jìn)行繁瑣的手工操作KDD獨(dú)立于現(xiàn)有知識本文模型的優(yōu)點(diǎn)利用KDD過程的發(fā)現(xiàn)結(jié)果建立和完善知識庫利用知識庫中的現(xiàn)有知識指導(dǎo)KDD過程進(jìn)行,,,,基于知識庫的KDD,基本思想根據(jù)一定的約束生成機(jī)制自動(dòng)從知識庫中生成約束,這些約束在一定程度上反映了知識庫中的現(xiàn)有知識利用這些約束指導(dǎo)KDD過程的進(jìn)行,實(shí)現(xiàn)基于約束的數(shù)據(jù)挖掘,即相當(dāng)于利用知識庫中的現(xiàn)有知識指導(dǎo)了KDD過程的進(jìn)行整個(gè)約束生成和基于約束的KDD過程都可以自動(dòng)

12、化地進(jìn)行,減少了手工操作的任務(wù)量,極大地提高了模型的工作效率及其實(shí)時(shí)性。,,,,模型知識庫中的知識表示方法,采用面向?qū)ο蟮母拍詈图夹g(shù),吸收了框架理論和語義網(wǎng)絡(luò)的一些特點(diǎn),并融合了產(chǎn)生式規(guī)則表示方法,,,,,關(guān)聯(lián)規(guī)則挖掘,設(shè)I={i1, i2,…, im}是事務(wù)項(xiàng)的集合。設(shè)任務(wù)相關(guān)的數(shù)據(jù)D是數(shù)據(jù)庫事務(wù)的集合,D中的每個(gè)事務(wù)T是一個(gè)事務(wù)項(xiàng)集且滿足 。每一個(gè)事務(wù)有一個(gè)標(biāo)識TID。設(shè)X是一個(gè)事務(wù)項(xiàng)集,事務(wù)T包含X當(dāng)且僅當(dāng)

13、 。關(guān)聯(lián)規(guī)則是形如 的蘊(yùn)涵式,其中 且規(guī)則的支持度:規(guī)則的置信度:,,,,基于約束的關(guān)聯(lián)規(guī)則挖掘,約束:包括數(shù)據(jù)約束、挖掘的維和層次約束、規(guī)則約束等規(guī)則模板:用來表示用戶希望探察或希望證實(shí)的、并且感興趣的規(guī)則模式例:,,數(shù)據(jù)約束“X屬性值必為負(fù)”:規(guī)則約束“挖掘包含原子表達(dá)式(X ?)的規(guī)則,Z為目標(biāo)屬性”:,,,基于知識庫的約束自動(dòng)生成,例規(guī)則行:if ((

14、DEN <= 2.111) && (CNL <= 28.866)) then FORMATION = “gas”約束:,,,,模式評價(jià)策略,結(jié)合支持度、置信度以及規(guī)則約束計(jì)算評價(jià)系數(shù)滿足約束的程度:,,規(guī)則的評價(jià)系數(shù):,,,相關(guān)工作比較,結(jié)合領(lǐng)域先驗(yàn)知識進(jìn)行KDD的方法由知識工程師從領(lǐng)域?qū)<夷抢镏苯荧@得,并直接硬編碼到應(yīng)用系統(tǒng)之中由用戶對KDD過程指定約束,從而間接將領(lǐng)域知識和應(yīng)用需求結(jié)合到KD

15、D過程中去存在的問題繁瑣的手工操作本文方法的優(yōu)點(diǎn)提高第二類方法的自動(dòng)化程度通過知識庫自動(dòng)生成約束指導(dǎo)KDD過程的進(jìn)行,,,,自動(dòng)演化知識庫,目標(biāo):自動(dòng)實(shí)現(xiàn)知識檢測與知識融合,實(shí)現(xiàn)知識庫的自動(dòng)演化知識檢測需要檢測知識庫中的不一致和不完整等情況知識融合將不同來源的多個(gè)知識集合合并為一個(gè)知識集合,本文模型中指將KDD過程發(fā)現(xiàn)的新知識與模型知識庫中的原有知識合并為新的知識庫“演化”一詞表示隨著反復(fù)、自動(dòng)進(jìn)行的知識獲取過程,知識庫

16、中的知識也不斷更新和完善,知識庫也因而不斷發(fā)展,,,,規(guī)則表示形式,,,,規(guī)則Rule的BNF定義,,,,原子表達(dá)式之間的關(guān)系,定義1: 原子表達(dá)式相等:兩個(gè)原子表達(dá)式運(yùn)算數(shù)相同,且運(yùn)算數(shù)的取值區(qū)間也相同,則稱原子表達(dá)式A與B相等,記做A=B。定義2:原子表達(dá)式覆蓋:兩個(gè)原子表達(dá)式A、B的運(yùn)算數(shù)相同,若A中運(yùn)算數(shù)的取值區(qū)間包括了B中運(yùn)算數(shù)的取值區(qū)間,則稱原子表達(dá)式A覆蓋原子表達(dá)式B,記做 ,或者稱原子表達(dá)式B被原子表

17、達(dá)式A覆蓋,記做 。當(dāng)A、B不相等時(shí),該關(guān)系變成 ,即 。定義3: 原子表達(dá)式交叉:兩個(gè)原子表達(dá)式A、B的運(yùn)算數(shù)相同,若A、B中運(yùn)算數(shù)的取值區(qū)間既有相同的部分,也都有不同的部分,則稱原子表達(dá)式A與B交叉,記做A&B。,,,,原子表達(dá)式之間的關(guān)系,定義4:原子表達(dá)式相異:兩個(gè)原子表達(dá)式A、B的運(yùn)算數(shù)相同,但A、B中運(yùn)算數(shù)的取值區(qū)間沒有相同的部分,則稱原子表達(dá)式A與B相異,記做A∥B。定

18、義5: 原子表達(dá)式互補(bǔ):兩個(gè)原子表達(dá)式A、B的運(yùn)算數(shù)相同,且A、B中運(yùn)算數(shù)的取值區(qū)間互為補(bǔ)集,則稱原子表達(dá)式A與B互補(bǔ),記做A= ,或 B= 。,,,,原子表達(dá)式之間的關(guān)系,運(yùn)算符相同但值不同的原子表達(dá)式之間關(guān)系,,,,原子表達(dá)式之間的關(guān)系,運(yùn)算符不同的原子表達(dá)式之間關(guān)系,,,,表達(dá)式之間的關(guān)系,定義6: 表達(dá)式包括:兩個(gè)表達(dá)式R、S,若R中任意一個(gè)原子表達(dá)式均與S中的某一個(gè)原子表達(dá)式相等,則稱表達(dá)式S包括表達(dá)式

19、R,記做 ,或者稱表達(dá)式R被表達(dá)式S包括,記做 。定義7: 表達(dá)式相等:兩個(gè)表達(dá)式R、S,若S包括R(即 ),且R也包括S(即 ),則稱表達(dá)式R與S相等,記做R=S。定義8: 表達(dá)式覆蓋:兩個(gè)表達(dá)式R、S,若R中任意一個(gè)原子表達(dá)式均被S中的某一個(gè)原子表達(dá)式覆蓋,則稱表達(dá)式S覆蓋R,記做 ,或者稱表達(dá)式R被S覆蓋,記做

20、 。當(dāng)R與S不相等時(shí),該關(guān)系變成 ,即 。,,,,,表達(dá)式之間的關(guān)系,定義9: 表達(dá)式交叉:兩個(gè)表達(dá)式R、S,對R中的任意一個(gè)原子表達(dá)式,當(dāng)S中存在與它運(yùn)算數(shù)相同的原子表達(dá)式時(shí),若它與S中這些與它運(yùn)算數(shù)相同的原子表達(dá)式之間,存在交叉關(guān)系,且不存在相異關(guān)系,則稱表達(dá)式R與S交叉,記做R&S。定義10: 表達(dá)式相異:兩個(gè)表達(dá)式R、S,對R中的任意一個(gè)原子表達(dá)式,當(dāng)S中存在與它運(yùn)算數(shù)相同的原子表達(dá)式時(shí),若它

21、與S中這些與它運(yùn)算數(shù)相同的原子表達(dá)式之間存在相異關(guān)系,則稱表達(dá)式R與S相異,記做R∥S。,,,,,知識自動(dòng)檢測,知識檢測處理冗余矛盾從屬環(huán)路不完整,,,,基于規(guī)則Rule的知識自動(dòng)檢測,冗余檢測與處理知識冗余:知識庫中存在多余的知識或多余的條件三種情況:等價(jià)規(guī)則、冗余規(guī)則鏈、冗余條件檢測與處理:等價(jià)規(guī)則:兩條規(guī)則在相同的條件下有相同的結(jié)論;可以直接刪除一條;冗余規(guī)則鏈:兩條規(guī)則鏈中第一條規(guī)則的條件相同,最后一條規(guī)則的

22、結(jié)論也等價(jià);刪除唯一出現(xiàn)的條件,并按需要補(bǔ)充規(guī)則;冗余條件:兩條規(guī)則有相同的結(jié)論,但一條規(guī)則前件中的某些條件與另一條規(guī)則前件中的條件互補(bǔ),而其它條件保持一致;刪除這些互補(bǔ)的多余條件。,,,,基于規(guī)則Rule的知識自動(dòng)檢測,從屬檢測與處理知識從屬:若規(guī)則r1比r2要求更苛刻的條件,或得到更苛刻的結(jié)論,則r1是r2的從屬規(guī)則設(shè)兩條規(guī)則r1: ,r2: ,其中P、Q、R、S為表達(dá)式,若 或

23、 ,且 或 ,則規(guī)則r1是r2的從屬規(guī)則。規(guī)則從屬通常需要領(lǐng)域?qū)<疫M(jìn)行處理,知識檢測過程僅對其進(jìn)行初步處理,即將其進(jìn)行標(biāo)記,然后由知識融合進(jìn)行進(jìn)一步處理。,,,,基于規(guī)則Rule的知識自動(dòng)檢測,矛盾檢測與處理知識矛盾:知識庫中存在矛盾的知識或矛盾的結(jié)論兩種情況:矛盾規(guī)則、矛盾規(guī)則鏈檢測與處理:矛盾規(guī)則:若兩條規(guī)則中某些相同的條件下有不同的結(jié)論,即兩條規(guī)則的條件部分冗余或者從屬

24、,結(jié)論部分卻存在不同(交叉或相異),則稱為矛盾規(guī)則;對其進(jìn)行初步處理;矛盾規(guī)則鏈:若兩條規(guī)則鏈中,第一條規(guī)則的條件部分冗余或者從屬,最后一條規(guī)則的結(jié)論部分卻存在不同(交叉或相異),則稱兩條規(guī)則鏈矛盾;仿照矛盾規(guī)則和冗余規(guī)則鏈的處理方法進(jìn)行初步處理。,,,,基于規(guī)則Rule的知識自動(dòng)檢測,環(huán)路檢測與處理當(dāng)一組規(guī)則形成一條循環(huán)鏈時(shí),稱它們構(gòu)成了一個(gè)環(huán)路如規(guī)則r1: 、r2: 、r3: 、r4:

25、,對這四條規(guī)則無論先執(zhí)行哪一條,最終都會回到出發(fā)點(diǎn),因此它們之間出現(xiàn)了環(huán)路檢測與處理:從任何一條未經(jīng)過的規(guī)則出發(fā),沿著規(guī)則鏈表進(jìn)行查找,若找到一條規(guī)則的結(jié)論與前面某條規(guī)則的條件等價(jià),則找到了環(huán)路;當(dāng)知識庫中出現(xiàn)環(huán)路時(shí),一般需要領(lǐng)域?qū)<疫M(jìn)行處理,知識檢測僅對其進(jìn)行標(biāo)記,然后由知識融合進(jìn)行進(jìn)一步處理。,,,,基于規(guī)則Rule的知識自動(dòng)檢測,不完整與知識精化知識不完整可能導(dǎo)致錯(cuò)判和漏判兩種錯(cuò)誤錯(cuò)判:對給定的不一定產(chǎn)生某一結(jié)論的

26、條件,經(jīng)系統(tǒng)運(yùn)行卻得出了這一結(jié)論漏判:在給定條件下本來應(yīng)該推出的結(jié)論沒有推出來知識精化的一般方法:用一批已知結(jié)論的實(shí)例考核知識庫,看有多少實(shí)例被錯(cuò)判及漏判,然后對知識進(jìn)行修正本文模型中的方法:通過知識應(yīng)用對知識庫進(jìn)行考核,一方面降低知識庫中導(dǎo)致錯(cuò)判和漏判的規(guī)則的置信度,另一方面通過約束指導(dǎo)KDD過程發(fā)現(xiàn)更多有利于知識精化的新模式,,,,知識庫的自動(dòng)演化過程,,,,相關(guān)工作比較,傳統(tǒng)的知識檢測方法僅在規(guī)則條件這一層次上進(jìn)行檢測,即

27、對于兩條規(guī)則,僅僅檢查他們的原子表達(dá)式是否相等或互補(bǔ)本文提出的方法除檢查原子表達(dá)式是否相等或互補(bǔ)外,還檢查原子表達(dá)式以及表達(dá)式之間的覆蓋、沖突等關(guān)系,即對原子表達(dá)式中屬性項(xiàng)的取值范圍進(jìn)行檢測,,,,相關(guān)工作比較,兩種方法對比例如條件x=0與它互補(bǔ)本文的知識檢測方法:條件x-1與它交叉等結(jié)論:本文的知識檢測方法在一個(gè)更細(xì)的粒度上進(jìn)行,因此更為精確,通過檢測的知識庫一致性更好,,,,模型在自動(dòng)化測井?dāng)?shù)據(jù)分析中的應(yīng)用,測井?dāng)?shù)據(jù)分析簡

28、介應(yīng)用數(shù)據(jù)與應(yīng)用需求基于知識庫的KDDMSMiner(Multi-Strategies Miner)簡介基于知識庫的KDD自動(dòng)演化知識庫OKPS(Object-oriented Knowledge Processing System)簡介自動(dòng)演化知識庫,,,,測井?dāng)?shù)據(jù)分析簡介,石油天然氣勘探開采工程的重要環(huán)節(jié)測井:從地表到井底測量鉆井的各個(gè)地層的各種性質(zhì)(包括電、聲、放射性等物理性質(zhì))測井?dāng)?shù)據(jù):測井中測得的各種性質(zhì)的數(shù)

29、據(jù)值測井?dāng)?shù)據(jù)分析:綜合研究和分析測井?dāng)?shù)據(jù),并結(jié)合領(lǐng)域相關(guān)知識預(yù)測特定鉆井甚至整個(gè)勘探區(qū)域和含烴構(gòu)造帶的油氣層情況和油氣藏類別需要進(jìn)行定性分析和定量計(jì)算不同測井的地層情況不同需要反復(fù)進(jìn)行,,,,應(yīng)用數(shù)據(jù)與應(yīng)用需求,數(shù)據(jù)來源:新疆境內(nèi)的油田測井?dāng)?shù)據(jù)表:每一條記錄包含鉆井中一個(gè)特定深度地層的各屬性的實(shí)測值,共有十維屬性:“DEPTH” 、“CALI” 、“CNL” 、“DEN” 、“GR”、“RI” 、“RT” 、“RXO” 、“S

30、P” 和“AC” 區(qū)塊含油數(shù)據(jù)表:每一條記錄包含鉆井中一個(gè)特定的、已探明油氣層的各屬性的實(shí)測值,系統(tǒng)中用到的有:“thickness” 、“starting depth” 、“ending depth”和 “Result”應(yīng)用需求不斷從測井?dāng)?shù)據(jù)和已知油氣層數(shù)據(jù)中學(xué)習(xí),從而可以從測井?dāng)?shù)據(jù)中預(yù)測可能包含的油氣層,,,,MSMiner簡介 ——系統(tǒng)主界面,,,,,MSMiner簡介——數(shù)據(jù)挖掘子系統(tǒng),,,,,,基于知識庫的KDD,設(shè)定K

31、DD過程各個(gè)步驟的算法及其參數(shù),,,,,基于知識庫的KDD,KDD過程生成的發(fā)現(xiàn)規(guī)則文件例,,,Final hypothesis is:d :- RT>=14.397, CALI=-0.398 (56/0).c :- RT>=7.198, RT>=9.28 (127/0).c :- AC>=94.375, RT>=5.426, SP=8.654 (23/1).c :- RT>=7.198, C

32、NL>=28 (31/6).c :- CALI>=8.966 (6/2).c :- CALI=73.987 (8/1).c :- AC>=101.787 (2/0).default b (494/0).=========================== summary ==========================Train error rate: 1.61% +/- 0.44% (808 da

33、tapoints) <<Test error rate: 66.77% +/- 2.64% (319 datapoints) <<Hypothesis size: 8 rules, 23 conditionsLearning time: 0.98 sec,,,OKPS簡介 ——KAMT,,,,,OKPS簡介 ——OOIE,,,,,自動(dòng)演化知識庫,設(shè)定知識檢測與融合時(shí)所需參數(shù),,,,

34、,自動(dòng)演化知識庫,知識檢測與融合,,,,,本文的工作,設(shè)定KDD過程各個(gè)步驟的算法及其參數(shù)的子系統(tǒng)從知識庫自動(dòng)生成約束根據(jù)約束自動(dòng)設(shè)定MSMiner的挖掘任務(wù)自動(dòng)知識檢測自動(dòng)知識融合測井?dāng)?shù)據(jù)分析主系統(tǒng),,,,,總結(jié)與展望,本文的主要貢獻(xiàn)提出了一種通用的基于KDD的知識自動(dòng)獲取模型。利用KDD發(fā)現(xiàn)的知識自動(dòng)完善知識庫;同時(shí)從知識庫中自動(dòng)生成約束指導(dǎo)KDD過程。該模型在一定程度上減輕了人工操作的負(fù)擔(dān),并可以自適應(yīng)動(dòng)態(tài)變化的環(huán)境。

35、實(shí)現(xiàn)了基于知識庫的KDD過程。提出了在數(shù)值屬性的取值區(qū)間上進(jìn)行知識自動(dòng)檢測的方法。提出了結(jié)合規(guī)則支持度、置信度及其滿足約束程度的知識自動(dòng)融合機(jī)制。,,,,總結(jié)與展望,下一步的工作提高基于約束的KDD系統(tǒng)的創(chuàng)新能力對約束進(jìn)行評價(jià)和優(yōu)化,進(jìn)一步提高基于約束的KDD過程有效性和針對性平衡模型的魯棒性和對知識變化的敏感程度拓展模型的應(yīng)用范圍,進(jìn)一步將模型應(yīng)用于KBS、知識管理、決策支持、Web知識獲取等領(lǐng)域,實(shí)現(xiàn)更多動(dòng)態(tài)環(huán)境下的、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論