基于溫病古籍知識(shí)概念語(yǔ)義網(wǎng)絡(luò)構(gòu)建研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩175頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、溫病文獻(xiàn)是全部中醫(yī)古文獻(xiàn)中的一個(gè)重要門(mén)類(lèi),根據(jù)著錄統(tǒng)計(jì),存世的此類(lèi)文獻(xiàn)多達(dá)400余種。中醫(yī)古代溫病文獻(xiàn)主要記載了包含大量現(xiàn)代醫(yī)學(xué)范疇中的急性和烈性傳染性疾病的病因、病機(jī)、治法和方藥等,長(zhǎng)期以來(lái),一直是中醫(yī)認(rèn)識(shí)和防治傳染性疾病所依賴(lài)的知識(shí)資源。當(dāng)前,由于自然環(huán)境惡化和化學(xué)類(lèi)藥物的使用導(dǎo)致疾病譜的改變,新的重大傳染性疾病不期而至。迄今為止,人們對(duì)新發(fā)的傳染性疾病的發(fā)生發(fā)展規(guī)律以及有效地預(yù)防和治療等尚缺乏認(rèn)識(shí),我國(guó)溫病文獻(xiàn)中所蘊(yùn)藏的寶貴知識(shí)財(cái)

2、富尚有待挖掘。
  歷史上不間斷的文獻(xiàn)整理工作實(shí)則是一種資源開(kāi)發(fā)的方式,現(xiàn)代人對(duì)這種科技文化資源的開(kāi)發(fā)既要延續(xù)古人的經(jīng)驗(yàn)和方法,又要推陳出新,對(duì)傳統(tǒng)文獻(xiàn)資源進(jìn)行創(chuàng)造性的研究開(kāi)發(fā)。古籍?dāng)?shù)字化必須遵循古籍整理的基本原則,懂得學(xué)術(shù)研究的基本思維過(guò)程,掌握學(xué)術(shù)研究處理文獻(xiàn)的方式。該方式往往是突破其原有結(jié)構(gòu),將原文獻(xiàn)劃分為若干基本單位,提取其中指向內(nèi)部含義的關(guān)鍵詞,依照它們的屬性進(jìn)行排序、篩選、統(tǒng)計(jì)和分類(lèi),比較相關(guān)文獻(xiàn)中的關(guān)鍵詞,尋求他們之

3、間的相關(guān)性。這正是電子媒體需要繼承的重要方法,為此我們必須將隱藏于學(xué)者大腦中的經(jīng)驗(yàn)和智慧加以總結(jié),建立模型和序列,然后再以這些模型和序例為準(zhǔn)標(biāo)引古籍文本,使之完成經(jīng)驗(yàn)到知識(shí)的轉(zhuǎn)化,建立人文學(xué)術(shù)研究的科學(xué)內(nèi)核,有效積累和傳播人類(lèi)知識(shí),讓每次學(xué)術(shù)研究行為都從前人的終點(diǎn)開(kāi)始。
  古籍是為學(xué)術(shù)研究服務(wù)的,數(shù)字古籍也不例外。古籍?dāng)?shù)字化必須全面借鑒以往的學(xué)術(shù)成果,學(xué)者對(duì)于應(yīng)用的要求是古籍?dāng)?shù)字化的起點(diǎn)。就其本質(zhì)而言,學(xué)術(shù)研究的應(yīng)用要求乃是“知

4、識(shí)發(fā)現(xiàn)”。所謂知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,簡(jiǎn)稱(chēng)KDD),又稱(chēng)數(shù)據(jù)挖掘技術(shù),是指從大量數(shù)據(jù)中提取出可信的、新穎的、有效的并易于理解的知識(shí)的高級(jí)處理過(guò)程。它已廣泛應(yīng)用于許多領(lǐng)域。我們相信,數(shù)據(jù)挖掘技術(shù)運(yùn)用于中醫(yī)藥研究領(lǐng)域,必將創(chuàng)造出更卓越的業(yè)績(jī)。在工作實(shí)踐中,認(rèn)識(shí)到古籍?dāng)?shù)字化是傳統(tǒng)古籍整理在當(dāng)代的延續(xù)與發(fā)展。古籍?dāng)?shù)字化工作通過(guò)對(duì)古籍知識(shí)的解析加工,把傳統(tǒng)古籍整理的方法與數(shù)字化技術(shù)結(jié)合起來(lái),創(chuàng)造出

5、了不同于一般古籍?dāng)?shù)據(jù)庫(kù)的古籍知識(shí)庫(kù)。近些年研究提出的“基于知識(shí)元的中醫(yī)古籍計(jì)算機(jī)知識(shí)表示方法”,在古籍?dāng)?shù)字化實(shí)踐中已經(jīng)達(dá)到實(shí)用化程度,在對(duì)古籍進(jìn)行解析加工基礎(chǔ)上建立的知識(shí)庫(kù),實(shí)現(xiàn)了基于內(nèi)容的檢索,并在一定程度上實(shí)現(xiàn)了對(duì)知識(shí)的挖掘,為廣大中醫(yī)藥工作者更便捷地從古籍中獲取知識(shí)建立了一個(gè)平臺(tái)。
  本文主要利用信息科學(xué)技術(shù)實(shí)現(xiàn)對(duì)知識(shí)的挖掘、獲取,開(kāi)展溫病古籍的知識(shí)挖掘研究,構(gòu)建溫病的病、證、癥、理、法、方、藥本體,形成以溫病疾病為核心,

6、其他類(lèi)型本體和疾病之間的關(guān)系為主的一種網(wǎng)狀關(guān)系,為中醫(yī)臨床、科研和政府決策提供真實(shí)、快捷的知識(shí)服務(wù)。
  本文的研究?jī)?nèi)容有以下幾個(gè)方面:
  (1)對(duì)知識(shí)表示、國(guó)內(nèi)外概念語(yǔ)義網(wǎng)絡(luò)構(gòu)建的相關(guān)知識(shí)以及研究現(xiàn)狀進(jìn)行調(diào)研分析
  知識(shí)是經(jīng)過(guò)整序、提煉的信息,是人們對(duì)事物產(chǎn)生、存在、發(fā)展變化規(guī)律的認(rèn)識(shí),是人類(lèi)發(fā)現(xiàn)、發(fā)明與創(chuàng)造的成果,反映的是人類(lèi)對(duì)客觀事物的普遍認(rèn)識(shí)和科學(xué)評(píng)價(jià),具有相對(duì)正確性,不確定性,可表示性、可利用性。根據(jù)知識(shí)

7、的范圍來(lái)看醫(yī)學(xué)知識(shí)就是領(lǐng)域知識(shí)即專(zhuān)業(yè)性知識(shí)。知識(shí)表示是用一些約定的符號(hào)將知識(shí)編碼成計(jì)算機(jī)可以接受的數(shù)據(jù)結(jié)構(gòu),以實(shí)現(xiàn)計(jì)算機(jī)自動(dòng)知識(shí)處理和問(wèn)題求解。知識(shí)表示方法主要有:一階謂詞邏輯、產(chǎn)生式知識(shí)表示、語(yǔ)義網(wǎng)絡(luò)、框架理論、面向?qū)ο笾R(shí)表示法、本體、程序知識(shí)表示法,對(duì)上述方法的特點(diǎn)進(jìn)行詳細(xì)分析后可以看出:語(yǔ)義網(wǎng)絡(luò)不僅可以表示實(shí)體的結(jié)構(gòu)、屬性以及實(shí)體間的聯(lián)系,還可以通過(guò)相應(yīng)地有向邊(弧)推導(dǎo)出與某個(gè)實(shí)體相關(guān)的事實(shí)、特征、關(guān)系,能將事物的屬性以及事物

8、間的各種語(yǔ)義聯(lián)系顯式地表示出來(lái),以便于對(duì)層次間繼承性質(zhì)的推理演繹。
  在古籍知識(shí)相關(guān)表示研究中發(fā)現(xiàn)古籍的知識(shí)結(jié)構(gòu)主要有聚類(lèi)現(xiàn)象、模塊現(xiàn)象、樹(shù)狀結(jié)構(gòu)、知識(shí)關(guān)聯(lián)、隱含的知識(shí)命題等。古籍知識(shí)表示關(guān)鍵問(wèn)題在于在中醫(yī)學(xué)中資料的收集、分類(lèi)、加工、檢索、統(tǒng)計(jì)和推理是專(zhuān)家們進(jìn)行學(xué)術(shù)研究的必要手段和重要方法,多少年來(lái),學(xué)者們?cè)诖罅康奈墨I(xiàn)資料堆中收集、查找、考證資料,進(jìn)行著繁重的、艱苦的勞動(dòng),這種傳統(tǒng)的研究方式,勞動(dòng)強(qiáng)度大、速度慢、效率低、質(zhì)量差。

9、長(zhǎng)期以來(lái),計(jì)算機(jī)在中醫(yī)古籍?dāng)?shù)字化領(lǐng)域的應(yīng)用得不到深入發(fā)展,其主要原因是缺少計(jì)算機(jī)對(duì)古籍的知識(shí)表示方法。而古籍知識(shí)表示要求除了需要支撐中醫(yī)古籍知識(shí)等可以引入知識(shí)后的智能處理外,更需要實(shí)現(xiàn)對(duì)古籍知識(shí)獲取、處理、分析、應(yīng)用等方面知識(shí)的描述,以實(shí)現(xiàn)古籍知識(shí)的共享,促進(jìn)溫病古籍知識(shí)的應(yīng)用。
  通過(guò)文獻(xiàn)調(diào)研發(fā)現(xiàn)目前主要應(yīng)用的古籍計(jì)算機(jī)知識(shí)表示方法有:“基于知識(shí)元的中醫(yī)古籍計(jì)算機(jī)知識(shí)表示方法”該方法主要特點(diǎn)有:基于知識(shí)元的知識(shí)解析具有信息的二

10、重性;基于知識(shí)元知識(shí)表示方法的知識(shí)解析,最終形成的是結(jié)構(gòu)化文檔;所有實(shí)義詞的意義都可以分解成一些語(yǔ)義成分(Sense Components),也稱(chēng)為語(yǔ)義特征(SemanticFeatures),屬于同一語(yǔ)義場(chǎng)的一組詞可以用特征矩陣來(lái)表示,每個(gè)矩陣可以表示一個(gè)概念。
  結(jié)合上述研究分析,進(jìn)行古籍知識(shí)的表示建模研究可以選用語(yǔ)義網(wǎng)絡(luò)表示法。之所以選用該方法,主要是看重了它具有以下的優(yōu)點(diǎn):語(yǔ)義網(wǎng)絡(luò)提供了一般化的簡(jiǎn)單方法,語(yǔ)義網(wǎng)絡(luò)著重強(qiáng)調(diào)

11、事物間的語(yǔ)義關(guān)系;語(yǔ)義網(wǎng)絡(luò)具有廣泛的表示范圍和強(qiáng)大的表示能力;語(yǔ)義網(wǎng)絡(luò)是一種結(jié)構(gòu)化的表示方法,澄清了古籍知識(shí)結(jié)構(gòu),避免了重復(fù)知識(shí)分析,使知識(shí)共享成為可能。
  (2)對(duì)溫病古籍知識(shí)體系的特點(diǎn)的分析研究
  知識(shí)按形式分為顯性知識(shí)和緘默知識(shí)。溫病古籍知識(shí)形式上屬于緘默知識(shí)。溫病古籍知識(shí)是一種只可意會(huì)不可言傳的知識(shí),是一種經(jīng)常使用卻又不能通過(guò)語(yǔ)言文字符號(hào)予以清晰表達(dá)或直接傳遞的知識(shí)。如對(duì)病證的辨證分析知識(shí),這種知識(shí)即是所謂的“行

12、動(dòng)中的知識(shí)”,或者“內(nèi)在于行動(dòng)中的知識(shí)”,是存儲(chǔ)于人們頭腦中的屬于個(gè)人經(jīng)驗(yàn)、訣竅、靈感的那部分知識(shí),常隱含于人的行動(dòng)之中,屬難以量化處理的隱性知識(shí)。對(duì)知識(shí)的表達(dá)而言,行動(dòng)是和語(yǔ)言同樣根本的表達(dá)方式。
  溫病古籍部分知識(shí)屬于緘默知識(shí),是難以量化處理的隱性知識(shí),其本體構(gòu)建有其特殊性。從知識(shí)工程的角度來(lái)說(shuō),溫病古籍知識(shí)本體論指的是一個(gè)溫病古籍本體結(jié)構(gòu)以及對(duì)溫病古籍概念的本體知識(shí)描述。在這里本體知識(shí)既可以在概念層次上進(jìn)行描述,也可以在語(yǔ)

13、言層次上進(jìn)行描述。它包含了概念的所有相關(guān)知識(shí),知識(shí)必須與溫病古籍領(lǐng)域相符合,又要完整地和全面地認(rèn)識(shí)概念域,對(duì)隱式的或不確定的內(nèi)容進(jìn)行形式刻畫(huà)。
  對(duì)溫病古籍知識(shí)體系的探討可以追溯到《黃帝內(nèi)經(jīng)》,直到明代末,才真正出現(xiàn)了第一部溫病學(xué)的專(zhuān)著《溫疫論》,此后葉桂《溫?zé)嵴摗返葧?shū)問(wèn)世,形成了以衛(wèi)氣營(yíng)血與三焦辨證為核心的辨治理論,從而使溫病學(xué)脫穎而出,成為一門(mén)獨(dú)立的學(xué)科。明末吳又可《溫疫論》開(kāi)創(chuàng)的疫性溫病學(xué)說(shuō),繼之者有鄭重光、戴天章、楊栗山

14、、劉奎、余霖等;由清初葉天士《溫?zé)嵴摗烽_(kāi)創(chuàng)的四時(shí)溫病學(xué)說(shuō),宗之者有薛雪、吳鞠通、王孟英等,使溫病學(xué)得到了很大的發(fā)展,溫病學(xué)知識(shí)體系更加完善和獨(dú)立。
  (3)對(duì)溫病古籍知識(shí)表示方法的分析研究
  所選溫病古籍力求全面反映該時(shí)期與溫病相關(guān)的主要內(nèi)容。仔細(xì)分析溫病古籍知識(shí)源其基本的知識(shí)對(duì)象主要概括如下:疾病、病證、癥狀、臟腑、百骸、季節(jié)、藥物、處方、治則治法、醫(yī)籍、醫(yī)家。
  在溫病古籍知識(shí)本體中,核心的知識(shí)就是關(guān)于疾病的

15、知識(shí)。疾病是一個(gè)最基本的溫病古籍概念,根據(jù)溫病古籍學(xué)科的范疇,可分為病證屬性類(lèi)、癥狀屬性類(lèi)、臟腑屬性類(lèi)、百骸屬性類(lèi)、季節(jié)屬性類(lèi)、藥物屬性類(lèi)、處方屬性類(lèi)、治則治法屬性類(lèi)、醫(yī)籍屬性類(lèi)、醫(yī)家屬性類(lèi)。溫病疾病類(lèi)所使用到的屬性之間存在固有的關(guān)系,疾病的屬性及關(guān)系本身也可形成一個(gè)本體體系,稱(chēng)為疾病屬性類(lèi)。這個(gè)本體不含有任何實(shí)例,只能由病證類(lèi)來(lái)實(shí)現(xiàn)它,在這個(gè)屬性本體中反映的類(lèi)別知識(shí)也是疾病類(lèi)的一部分。
  溫病古籍本體中定義了一些關(guān)系,這些關(guān)系

16、將溫病古籍中的概念與概念連接在一起,具有很重要作用。溫病古籍本體中若干典型關(guān)系如等同關(guān)系、等級(jí)關(guān)系、相關(guān)關(guān)系等。在對(duì)知識(shí)庫(kù)的知識(shí)添加過(guò)程中,常見(jiàn)的語(yǔ)義關(guān)系有如下幾類(lèi):imply(蘊(yùn)涵)、compare(比較)、similar(相似)、relation(關(guān)系)、belong(屬于)、object(對(duì)象)、logic(邏輯)、action(行為)、be(是)、have(有)、position(位置)、quality(質(zhì)量)、attribut

17、e(屬性)、property(性質(zhì))、degree(程度)、exception(除外)等,為了上述的語(yǔ)義關(guān)系的描述,可對(duì)關(guān)系類(lèi)型進(jìn)行添加:part-whole(部分)、instance-of(實(shí)例)、is-a(種屬)、member-of(成員)。這樣可以減少知識(shí)庫(kù)中知識(shí)的冗余,同時(shí)在推理中產(chǎn)生新的知識(shí)。
  (4)對(duì)溫病古籍知識(shí)概念語(yǔ)義網(wǎng)絡(luò)構(gòu)建方法的設(shè)計(jì)、描述。主要包括構(gòu)建本體、本體實(shí)例以及語(yǔ)義關(guān)系,實(shí)現(xiàn)本體實(shí)例之間的關(guān)聯(lián)

18、  根據(jù)溫病古籍知識(shí)組織體系,對(duì)于構(gòu)建本體,自行構(gòu)建本體和頂層本體中的語(yǔ)義類(lèi)型進(jìn)行映射,在頂層本體中語(yǔ)義類(lèi)型之間存在關(guān)系,自行構(gòu)建本體繼承了頂層本體的關(guān)系,從而實(shí)現(xiàn)概念層本體之間關(guān)系的構(gòu)建,自行構(gòu)建的本體實(shí)例由于繼承了本體的屬性,實(shí)現(xiàn)了不同類(lèi)型本體實(shí)例之間關(guān)系的構(gòu)建?;跍夭」偶R(shí)概念語(yǔ)義網(wǎng)絡(luò)構(gòu)建具體過(guò)程如下:基于中醫(yī)藥一體化語(yǔ)言(TCMLS2001),根據(jù)對(duì)溫病古籍知識(shí)系統(tǒng)分析,通過(guò)知識(shí)元標(biāo)引提取語(yǔ)義成分歸納分類(lèi)定義語(yǔ)義類(lèi)型(使用P

19、rotégé4.0構(gòu)建類(lèi))和語(yǔ)義關(guān)系(使用Protégé4.0構(gòu)建對(duì)象關(guān)系)。利用Protégé構(gòu)建以中醫(yī)特色的“病、證、癥、理、法、方、藥”為核心原則的溫病疾病、病證、癥狀、臟腑、百骸、季節(jié)、藥物、處方、治則治法、醫(yī)籍、醫(yī)家本體。將11種本體(疾病、病證、癥狀、臟腑、百骸、季節(jié)、藥物、處方、治則治法、醫(yī)籍、醫(yī)家)分別與TCMLS中的語(yǔ)義類(lèi)型進(jìn)行映射。語(yǔ)義關(guān)系的細(xì)化實(shí)現(xiàn)疾病、病證、癥狀、臟腑、百骸、季節(jié)、藥物、處方、治則治法、醫(yī)籍、醫(yī)家

20、本體之間的相互關(guān)聯(lián),以及各實(shí)例之間的相互關(guān)聯(lián);對(duì)TCMLS中存在的語(yǔ)義關(guān)系進(jìn)行細(xì)分,使其能合適地關(guān)聯(lián)不同類(lèi)型本體的實(shí)例。按照細(xì)化原則,通過(guò)等價(jià)、擴(kuò)展和阻斷三種繼承關(guān)系,構(gòu)建疾病、病證、癥狀、臟腑、百骸、季節(jié)、藥物、處方、治則治法、醫(yī)籍、醫(yī)家本體之間的關(guān)聯(lián)關(guān)系,形成以疾病為核心,其他類(lèi)型本體和疾病之間的關(guān)系為主的網(wǎng)狀關(guān)系,從而構(gòu)建溫病古籍知識(shí)語(yǔ)義網(wǎng)絡(luò),建立概念術(shù)語(yǔ)、本體、實(shí)例之間相互錯(cuò)綜復(fù)雜的關(guān)系。
  本研究目標(biāo)是構(gòu)建基于溫病古籍

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論