基于知識元的中醫(yī)古籍方劑知識表示研究.pdf_第1頁
已閱讀1頁,還剩211頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、方劑是由藥物配合組成的醫(yī)方。據(jù)統(tǒng)計現(xiàn)存有名和無名方劑20余萬首,記載于2000余種中醫(yī)古籍中,以古代的書面語言形式存在并傳播。
  知識表示是指把知識客體中的知識因子與知識關(guān)聯(lián)起來,以便于識別和理解知識。知識表示是知識組織的前提和基礎(chǔ),任何知識組織方法都要建立在知識表示的基礎(chǔ)上。
  自然文本中所記述的知識是由多個概念集合在一起并且形成一定的關(guān)系而構(gòu)成的,學(xué)者們對文獻的理解也是通過對相互關(guān)聯(lián)的一組詞的分析理解,然后獲得一個完

2、整的概念。文獻中的一個詞通常不能表達某個完整概念,往往是一組詞的相互關(guān)聯(lián),才能形成一個完整的概念,我們把中文文本中這種客觀存在的語言現(xiàn)象稱之為知識元。知識管理發(fā)展的趨勢顯示,人類知識處理經(jīng)過了以篇為單位的文獻處理時期,正在進行以數(shù)據(jù)庫為單位的信息處理時期,將要進入以知識元為單位的知識處理時代。
  歷代古醫(yī)籍中所記載的內(nèi)容眾多的方劑學(xué)知識,既包含有海量的關(guān)于疾病治療的方法和經(jīng)驗,又蘊涵著豐富的中醫(yī)學(xué)理論。面對這樣一座恢弘的知識寶庫

3、,我們一方面為這些珍貴方劑知識得以傳承至今感到欣慰;另一方面,又為爬梳文獻的艱難過程倍感無奈。傳統(tǒng)的古籍整理手段以及知識獲取方式已不能完全滿足當(dāng)前中醫(yī)學(xué)繼承發(fā)展的需求,古籍知識利用難的問題受到學(xué)者們的普遍關(guān)注。二十世紀(jì)末以來信息技術(shù)的發(fā)展,以及知識管理理論在古籍整理工作中的應(yīng)用,催生了中醫(yī)古籍?dāng)?shù)字化研究的發(fā)展,古籍方劑中由于蘊含大量中醫(yī)學(xué)證法方藥間規(guī)律性的知識,并因其知識自身結(jié)構(gòu)性較強,成為中醫(yī)藥數(shù)據(jù)挖掘研究的一個熱點,數(shù)據(jù)挖掘這一方法

4、被介紹到中醫(yī)藥研究中最早所公開發(fā)表的文章就是與方劑相關(guān)的。然而就目前見諸報道的研究成果,尚達不到知識服務(wù)的水平,距離語義檢索、知識發(fā)現(xiàn)等高級目標(biāo)還有相當(dāng)?shù)牟罹?,尤其隨著“e-Science”這一概念的提出,基于數(shù)據(jù)挖掘技術(shù)的知識發(fā)現(xiàn)方法引起越來越多研究者的關(guān)注。在既有數(shù)據(jù)基礎(chǔ)上發(fā)現(xiàn)新知識成為科學(xué)研究新的范式,這樣就對古籍自然文本向科學(xué)數(shù)據(jù)的轉(zhuǎn)換提出了更高的要求。
  計算機在中醫(yī)古籍?dāng)?shù)字化領(lǐng)域的應(yīng)用長期得不到深入發(fā)展,究其原因主要

5、是古籍產(chǎn)生的歷史悠久,數(shù)量眾多,內(nèi)容、結(jié)構(gòu)復(fù)雜,各種關(guān)系的命題不清晰,蘊涵的復(fù)雜邏輯關(guān)系得不到充分表達。若要借助于計算機幫助實現(xiàn)對古籍知識的獲取,就必須建立一種深入文獻內(nèi)部的知識組織方法。將古籍?dāng)?shù)據(jù)由自然記載形式過渡到適合計算機處理的表示形式,建立結(jié)構(gòu)清晰、邏輯嚴(yán)謹(jǐn)?shù)闹R結(jié)構(gòu)和語義關(guān)系網(wǎng)絡(luò),在對知識合理表示的基礎(chǔ)上從而實現(xiàn)對知識的獲取。
  傳統(tǒng)古籍整理做章句的方法,以及編撰類書的工作經(jīng)驗提示我們,古籍文本中同樣存在著可被抽取和單

6、獨管理的知識單元(知識體、知識元)。因此通過對中醫(yī)古籍文本進行科學(xué)合理的解構(gòu),揭示中文文本中蘊含的知識和信息,是知識發(fā)現(xiàn)的重要方法和途徑之一。基于此,柳長華教授結(jié)合多年來從事古籍整理研究的經(jīng)驗,結(jié)合傳統(tǒng)古籍整理的理論與方法,提出了“基于知識元的中醫(yī)古籍計算機知識表示方法”這一指導(dǎo)中醫(yī)古籍資源深入開發(fā)的新理論。該理論的提出,使得對中醫(yī)古籍知識的管理,由間接的文獻層面深入到直接的知識層面。
  本文以中醫(yī)古籍方劑知識元研究為核心,擬通

7、過對古籍文獻中知識元的抽取與標(biāo)引,結(jié)構(gòu)起以知識體為單元的知識組織體系:通過對語義成分間關(guān)系的標(biāo)引,關(guān)聯(lián)起中醫(yī)古籍方劑知識語義網(wǎng)絡(luò)。從而構(gòu)建起以知識元為核心的知識表示體系,并嘗試對該體系采用形式化的手段進行表達。主要內(nèi)容包括:
  一、通過對《五十二病方》、《肘后備急方》、《輔行訣臟腑用藥法要》、《備急千金要方》、《外臺秘要方》、《太平圣惠方》、《太平惠民和劑局方》、《傷寒明理方論》、《普濟方》、《醫(yī)方考》、《祖劑》、《古今名醫(yī)方論

8、》、《湯頭歌訣》、《絳雪園古方選注》,以及《黃帝內(nèi)經(jīng)》、《傷寒雜病論》、《脾胃論》、《丹溪心法》、《本草綱目》、《傅青主女科》、《臨證指南醫(yī)案》等30余種包含方劑知識的各類古籍文獻體例的研究,在分析方劑知識特征的基礎(chǔ)上,對方劑知識體、知識元存在于古籍文本中的各種形式進行系統(tǒng)梳理。
  1、古籍方劑知識特征
  (1)從文獻學(xué)角度分析:中醫(yī)古籍方劑知識表現(xiàn)為內(nèi)容眾多、分布廣泛、重復(fù)性高、相似度大、體裁多樣、版本差異等特點。

9、r>  (2)從科學(xué)數(shù)據(jù)角度分析:中醫(yī)古籍方劑知識存在自然語言的高度歧義性、概念間語義關(guān)系復(fù)雜、數(shù)據(jù)缺失等問題。
  2、方劑知識體與知識元在古籍文本中的存在形式
  (1)方劑知識體聚類出現(xiàn);方劑知識體與其他知識體相關(guān)出現(xiàn)。
  (2)方劑知識元分散分布;方劑知識元聚合分布。
  二、參照中醫(yī)古籍方劑語義元數(shù)據(jù)規(guī)范,對方劑元概念所指的內(nèi)涵外延進行界定。通過對古籍方劑知識體、知識元進行結(jié)構(gòu)化定義,為知識體、知識元

10、的抽取和標(biāo)引提供客觀依據(jù)。
  1、中醫(yī)古籍方劑語義元數(shù)據(jù)體系
  中醫(yī)古籍方劑語義元數(shù)據(jù)體系包括10個核心元數(shù)據(jù):“方名”、“出處”、“功用主治”、“組成”、“制法”、“用法”、“加減”、“方解”、“附方”、“附案”,及在此基礎(chǔ)上的擴展規(guī)則。
  2、知識體、知識元結(jié)構(gòu)化定義
  BK:=
  EK:=

11、KC>
  三、從古籍文獻中分析抽取出典型的方劑知識體、知識元,將自然文本中邏輯統(tǒng)一的數(shù)據(jù)分割成可以獨立管理的知識單元(知識體、知識元二級),結(jié)構(gòu)起以知識體為單元的知識組織體系,并以此作為方劑知識語義網(wǎng)絡(luò)研究的素材。
  四、對知識元構(gòu)成要素--語義成分,進行歸納、分類,厘清各種語義類型,從而規(guī)范中醫(yī)方劑知識領(lǐng)域內(nèi)的各種概念。對語義成分進行合理分類,可以為高效、簡潔、可理解、低歧義的形式化表達奠定下重要基礎(chǔ)。
  1、

12、定義了中醫(yī)古籍方劑知識領(lǐng)域25種語義類型
  方劑、方類、藥物、炮制、劑量、單味藥、病證、證候、病因病機、治法、經(jīng)絡(luò)、臟腑、部位、食物、時長、時點、頻率、器具、火候、規(guī)格、時令、地域、人群、人物、書籍。
  2、對概念內(nèi)涵與外延進行界定,并對容易混淆的概念進行了分析比較。
  五、通過對方劑知識中各種概念間關(guān)系的研究,定義各種語義關(guān)系,將古籍中的方劑知識抽象為命題化的表述形式,并對各種運算和推理規(guī)則進行設(shè)計和定義。

13、r>  1、定義了中醫(yī)古籍方劑知識領(lǐng)域46種語義關(guān)系
  等同關(guān)系、屬分關(guān)系、整部關(guān)系和為數(shù)眾多的相關(guān)關(guān)系。相關(guān)關(guān)系包括:組方關(guān)系、炮制關(guān)系、用量關(guān)系、代用關(guān)系、功效關(guān)系、治療關(guān)系、導(dǎo)致關(guān)系、表現(xiàn)關(guān)系、配伍關(guān)系、祖衍關(guān)系、合和關(guān)系、歸經(jīng)關(guān)系、君藥關(guān)系、臣藥關(guān)系、佐藥關(guān)系、使藥關(guān)系、鑒別關(guān)系、先煎關(guān)系、后下關(guān)系、包煎關(guān)系、單煎關(guān)系、溶化關(guān)系、沖服關(guān)系、溶媒關(guān)系、賦形關(guān)系、藥引關(guān)系、包衣關(guān)系、制時關(guān)系、制程關(guān)系、制火關(guān)系、制器關(guān)系、貯

14、器關(guān)系、規(guī)格關(guān)系、用時關(guān)系、用頻關(guān)系、用程關(guān)系、適用關(guān)系、禁忌關(guān)系、刊載關(guān)系、編著關(guān)系、創(chuàng)制關(guān)系、發(fā)揮關(guān)系、評按關(guān)系。
  2、對容易混淆和產(chǎn)生歧義的語義關(guān)系進行了比較說明。
  3、嘗試給出部分命題的推理運算規(guī)則。
  六、建立面向中醫(yī)方劑知識領(lǐng)域的符號命名規(guī)范,對知識體、知識元、語義類型、語義關(guān)系進行命名;建立面向中醫(yī)方劑知識領(lǐng)域的符號運算規(guī)則體系和符號推理規(guī)則體系,符號體系的建立是實現(xiàn)知識表示體系形式化表達的工具

15、。
  1、知識體、知識元符號命名
  2、語義類型符號命名規(guī)則
  3、語義關(guān)系符號命名規(guī)則
  七、將中醫(yī)古籍方劑知識領(lǐng)域各種語義關(guān)系分別納入關(guān)聯(lián)含義和關(guān)聯(lián)對象兩種分類體系下,進行比較研究,以進一步實現(xiàn)對語義類型和語義關(guān)系的精確化定義。并對其符號命名規(guī)范進行驗證與修正,從而設(shè)計出最為合理適度的符號表達方式。
  八、利用以上構(gòu)建的基于知識元的中醫(yī)古籍方劑知識表示體系,對方劑知識進行解析,通過從具有代表性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論