版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1研究背景:目前,已經(jīng)有許多研究人員應(yīng)用數(shù)據(jù)挖掘中的關(guān)聯(lián)分析技術(shù)對(duì)中醫(yī)藥數(shù)據(jù)進(jìn)行處理。如成都中醫(yī)藥大學(xué)與四川大學(xué)合作對(duì)脾胃病方的數(shù)據(jù)挖掘,中國中醫(yī)研究院中醫(yī)藥信息所與浙江大學(xué)合作對(duì)中國方劑數(shù)據(jù)庫、中醫(yī)藥臨床文獻(xiàn)題錄庫和現(xiàn)代生物醫(yī)學(xué)文獻(xiàn)庫的數(shù)據(jù)挖掘以及西南交通大學(xué)對(duì)乙肝醫(yī)案的數(shù)據(jù)挖掘,加上一些小型的零散研究,研究數(shù)目共計(jì)十一項(xiàng),涉及研究單位十二家。 但中醫(yī)藥領(lǐng)域的數(shù)據(jù)挖掘研究是近四、五年來才逐步開展起來,應(yīng)用尚屬初級(jí)階段,其局限性
2、不可避免,概括如下:首先原始資料基本局限于醫(yī)案或方劑,內(nèi)容大多是藥對(duì)的提取,導(dǎo)致挖掘結(jié)果只限于方劑的配伍方面;其次無論是利用已有數(shù)據(jù)庫還是自行建立的數(shù)據(jù)庫,都缺乏對(duì)數(shù)據(jù)規(guī)范深入系統(tǒng)的研究,從而影響了數(shù)據(jù)挖掘效果;最后關(guān)于結(jié)果的分析,以往研究大都停留在驗(yàn)證已有理論,而對(duì)于傳統(tǒng)知識(shí)中未包含的新鮮知識(shí),未能進(jìn)一步分析,使得數(shù)據(jù)挖掘結(jié)果的含義很難解讀,直接影響挖掘結(jié)果的利用。 2研究內(nèi)容:本課題以四種婦科常見疾病為例,利用數(shù)據(jù)挖掘技術(shù)對(duì)
3、醫(yī)案數(shù)據(jù)進(jìn)行處理分析。本課題的研究過程主要包括確定研究目標(biāo)、數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)處理、結(jié)果分析五部分。 2.1確定研究目標(biāo)采用關(guān)聯(lián)分析技術(shù)對(duì)婦科四種常見病醫(yī)案從中藥、證型、癥狀三個(gè)方面進(jìn)行數(shù)據(jù)挖掘。 2.2數(shù)據(jù)采集為了獲得可靠的結(jié)果,對(duì)所收錄醫(yī)案的病種、數(shù)量、醫(yī)家、時(shí)間、內(nèi)容等進(jìn)行了嚴(yán)格控制。 2.2.1病種通過檢索中醫(yī)藥期刊文獻(xiàn)數(shù)據(jù)庫(中醫(yī)藥信息研究所研制),調(diào)查了1984年以來十四種婦科常見疾病相關(guān)論文
4、發(fā)表情況,本課題選擇了文獻(xiàn)量最多的四種疾病——崩漏、閉經(jīng)、不孕、痛經(jīng)進(jìn)行研究。 2.2.2醫(yī)家為了保證數(shù)據(jù)質(zhì)量,醫(yī)案全部選自經(jīng)驗(yàn)豐富的中醫(yī)專家醫(yī)案,醫(yī)家的出生年代限制在二十世紀(jì)二、三十年代。為了避免醫(yī)家醫(yī)案數(shù)量選擇的不均衡導(dǎo)致挖掘結(jié)果的偏差,數(shù)據(jù)庫中單個(gè)醫(yī)家的醫(yī)案控制在一百例以內(nèi),絕大部分醫(yī)家為10例以內(nèi)。 2.2.3時(shí)間全部為現(xiàn)代醫(yī)案,鑒于此階段醫(yī)案記錄時(shí)間跨度較小,用詞較接近,統(tǒng)一規(guī)范相對(duì)容易,適合本課題研究進(jìn)度要求
5、。所選醫(yī)案均采集自公開發(fā)表的期刊和專著,發(fā)表時(shí)間為1972-2005年,所記錄患者就診時(shí)間為1951-2003年。 2.2.4內(nèi)容由于本課題旨在對(duì)醫(yī)案中的中藥、證型、癥狀三部分做數(shù)據(jù)挖掘,收集的醫(yī)案必須包括中醫(yī)診斷、中藥處方、證型、癥狀這四項(xiàng)內(nèi)容。 2.2.4.1中醫(yī)診斷參考了國家中醫(yī)藥管理局1994年頒布的《中華人民共和國中醫(yī)藥行業(yè)標(biāo)準(zhǔn)-中醫(yī)病證診斷療效標(biāo)準(zhǔn)》(南京大學(xué)出版社出版)。 2.2.4.2中藥處方所選
6、醫(yī)案全部是單純中草藥內(nèi)服治療。凡單純或輔助使用中成藥、針灸、外治、西藥以及手術(shù)治療的醫(yī)案不予收錄。 2.2.4.3證型必須含有病性和病位兩部分,如果只含有病位(如“肝脾為病”),或只含有病性(如“虛”或“實(shí)”)則不予收錄。 2.2.4.4癥狀除主癥之外,必須有兩個(gè)以上的次要癥狀。例如某閉經(jīng)醫(yī)案,如果只包括閉經(jīng)這一個(gè)主癥,而未記載其他癥狀,則不予收錄。 經(jīng)過篩選,本課題所采集醫(yī)案總數(shù)為2138例,其中崩漏664例、
7、閉經(jīng)408例、不孕631例、痛經(jīng)435例。從文獻(xiàn)來源統(tǒng)計(jì),848例來自期刊、1290例來自專著,共涉及醫(yī)家476位。 2.3數(shù)據(jù)預(yù)處理按照醫(yī)案中不同屬性信息的不同特點(diǎn),進(jìn)行有針對(duì)性的數(shù)據(jù)預(yù)處理。 2.3.1中藥預(yù)處理中藥名稱不統(tǒng)一的主要原因是別名、錯(cuò)別字、省略語,本課題從這三個(gè)角度對(duì)中藥名稱進(jìn)行規(guī)范。規(guī)范后的中藥名稱主要參考權(quán)威性強(qiáng)的中藥專著,如《中華人民共和國藥典2005版》、《中藥大辭典》、《中華本草》等。
8、中藥炮制方法主要分為凈制、切制、炮炙,由于凈制、切制對(duì)于藥物的性味、歸經(jīng)影響較小,故凡藥名中含有“片”、“末”、“粉”、“嫩”、“凈”等凈制或切制的標(biāo)志用語,均予以去除;炮炙法對(duì)中藥的性味、歸經(jīng)等有較大影響,在規(guī)范后的中藥名稱后面特別標(biāo)明。 2.3.2證型預(yù)處理首先從結(jié)構(gòu)上進(jìn)行規(guī)范,把證型名稱規(guī)范為主謂詞組,主語部分是病位,謂語部分是病性。如規(guī)范后證型血瘀,其中血是主語—病位,瘀是謂語—病性。 其次遇到復(fù)合證型,涉及兩個(gè)
9、臟器的,盡量予以拆分;幾乎所有的婦科醫(yī)案證型都涉及沖任失調(diào),進(jìn)行數(shù)據(jù)挖掘則會(huì)成為一個(gè)強(qiáng)干擾項(xiàng),故將醫(yī)案中沖任失調(diào)用語予以剔除;另外,界于證型和癥狀之間的描述性用語亦予去除,如迫血妄行、血不循經(jīng)等。 規(guī)范后的證型選詞,一方面參考了《中國中醫(yī)藥主題詞表》、《中醫(yī)診斷學(xué)》、《中華人民共和國中醫(yī)藥行業(yè)標(biāo)準(zhǔn)-中醫(yī)病證診斷療效標(biāo)準(zhǔn)》等書籍;另一方面對(duì)醫(yī)案中使用的證型同義詞進(jìn)行歸類后作頻數(shù)統(tǒng)計(jì),選用使用頻次最高的詞作為規(guī)范證型。例如:“血瘀”
10、,在醫(yī)案辨證中有多種表述方法:血瘀、瘀血、血滯等等,其中血瘀的使用頻次最高,則選血瘀為規(guī)范后證型。 2.3.3癥狀預(yù)處理在本課題的癥狀規(guī)范中,首先同證型一樣,將癥狀規(guī)范為主謂詞組,主語部分是病位,謂語部分是病狀,如規(guī)范后的癥狀腹痛,腹(主語-病位),痛(謂語-病狀)。 其次把一些復(fù)雜癥狀拆分為多個(gè)簡單癥狀,并去除主觀性強(qiáng)的程度副詞,如微、稍等。 規(guī)范后的癥狀選詞,一方面參考了《中國中醫(yī)藥主題詞表》、《中醫(yī)診斷學(xué)》
11、、《簡明中醫(yī)辭典》等書籍;另一方面對(duì)醫(yī)案中使用的癥狀同義詞進(jìn)行歸類后做頻數(shù)統(tǒng)計(jì),選用使用頻次最高的詞作為規(guī)范癥狀。 規(guī)范后數(shù)據(jù)庫概況所建數(shù)據(jù)庫共收集婦科醫(yī)案2138例,每個(gè)醫(yī)案均包含四個(gè)字段:癥狀、證型、中藥組成(處方)、中醫(yī)診斷,其中:癥狀共涉及605個(gè),證型63個(gè),中藥(含炮制)754個(gè)。 2.4數(shù)據(jù)挖掘本課題選用了中國中醫(yī)研究院周雪忠等人開發(fā)的WEKA軟件。該軟件基于新西蘭維克多大學(xué)研發(fā)的智能平臺(tái)WEKA,使用了A
12、priori算法(即Agrawal研究提出的算法),進(jìn)行藥物、癥狀、藥癥和藥證等關(guān)聯(lián)規(guī)則的知識(shí)發(fā)現(xiàn)。 與以往課題不同的是,不僅對(duì)中藥、癥狀、證型分別進(jìn)行數(shù)據(jù)挖掘處理,而且將這三部分合并起來處理。數(shù)據(jù)挖掘結(jié)果不僅僅包含按以往方法處理得出的“藥物+藥物”、“癥狀+癥狀”、“證型+證型”三種高頻集,而且包括了“藥物+癥狀”、“藥物+證型”、“癥狀+證型”的高頻集。此種模式進(jìn)行數(shù)據(jù)挖掘,不僅在癥狀、中藥、證型內(nèi)找到高頻集,而且在三者之間
13、找到高頻集,從而獲得更多的關(guān)聯(lián)關(guān)系結(jié)果。 2.5數(shù)據(jù)挖掘結(jié)果分析經(jīng)過數(shù)據(jù)處理后,共得到15張結(jié)果表,包括高頻中藥組5張、高頻“中藥+癥狀”組5張、高頻“中藥+證型”組5張。本課題對(duì)15張結(jié)果表做了與傳統(tǒng)知識(shí)比對(duì)、新鮮知識(shí)分析以及傳統(tǒng)方法的比對(duì)這三方面研究。 與傳統(tǒng)知識(shí)比對(duì)過程中,主要參照經(jīng)典中醫(yī)藥理論:高頻中藥組參考藥對(duì)和中藥配伍書籍,高頻“中藥+癥狀”組、高頻“中藥+證型”組參考中藥功效書籍。比對(duì)情況的統(tǒng)計(jì)結(jié)果如下:高
14、頻中藥組傳統(tǒng)知識(shí)符合率約為70﹪,高頻“中藥+癥狀,,組傳統(tǒng)知識(shí)直接符合率約為39﹪,間接符合率約為61﹪,高頻“中藥+證型”組傳統(tǒng)知識(shí)符合率則為100﹪,結(jié)果證明大部分?jǐn)?shù)據(jù)挖掘結(jié)果在傳統(tǒng)經(jīng)典理論中都已經(jīng)有所論述。 對(duì)一部分傳統(tǒng)理論中未查到的挖掘結(jié)果,本研究又進(jìn)一步從臨床應(yīng)用角度予以分析,發(fā)現(xiàn)了一些已經(jīng)應(yīng)用于臨床,但尚未被使用者提煉的新鮮知識(shí),同時(shí)探討了影響新鮮知識(shí)分析的因素。 此外本課題把數(shù)據(jù)挖掘與傳統(tǒng)頻次統(tǒng)計(jì)進(jìn)行方法
15、學(xué)比較。具體方法是分別把四個(gè)疾病的高頻藥物組結(jié)果與單味藥頻次統(tǒng)計(jì)結(jié)果進(jìn)行比較,從結(jié)果可以看出,數(shù)據(jù)挖掘表面上看與頻數(shù)統(tǒng)計(jì)相似,但進(jìn)一步分析得知它們的最大區(qū)別在于數(shù)據(jù)挖掘是獲取一種關(guān)系,并且定量地表述這種關(guān)系,其在分析關(guān)系方面的意義遠(yuǎn)遠(yuǎn)超出頻數(shù)統(tǒng)計(jì)。 3結(jié)論3.1有效結(jié)果本課題數(shù)據(jù)挖掘結(jié)果與傳統(tǒng)理論有相當(dāng)大的一部分內(nèi)容是相吻合的。這說明數(shù)據(jù)挖掘這項(xiàng)技術(shù)是具有合理有效性的。作為一種新型數(shù)據(jù)分析方法,關(guān)聯(lián)分析技術(shù)可用于中醫(yī)藥數(shù)據(jù)處理,
16、可以作為傳統(tǒng)知識(shí)總結(jié)的有效補(bǔ)充,值得進(jìn)一步深入研究。 3.2新鮮知識(shí)本課題通過數(shù)據(jù)挖掘,獲得一些傳統(tǒng)經(jīng)典理論未直接表述的知識(shí),并以量化的方式展現(xiàn)。同時(shí)結(jié)合臨床經(jīng)驗(yàn)探討了這部分知識(shí)的合理性和可行性。例如:“白術(shù)-當(dāng)歸”對(duì)藥雖然在傳統(tǒng)藥對(duì)理論中并未論及,但實(shí)際上在臨床上常被用于治療氣血兩虛型閉經(jīng),此外這兩味藥結(jié)合使用的緊密程度又通過置信度67﹪被量化表達(dá)。 3.3規(guī)范數(shù)據(jù)本課題在醫(yī)案數(shù)據(jù)的規(guī)范上做了大量工作,從一次文獻(xiàn)入手,
17、根據(jù)中藥、證型、癥狀三方面用詞的不同特點(diǎn),以“貼近臨床,保留有意義的信息”為總則進(jìn)行規(guī)范。其中中藥的規(guī)范,以“參考中藥權(quán)威標(biāo)準(zhǔn)”為主要原則;證型、癥狀的規(guī)范,以“同義詞統(tǒng)計(jì),選用使用頻次最多者”為主要原則,本課題的這部分工作對(duì)于日后臨床數(shù)據(jù)標(biāo)準(zhǔn)化工作具有一定參考價(jià)值。 3.4臨床參考本課題在數(shù)據(jù)挖掘的過程中,不僅挖掘出高頻藥物組來探討藥物配伍的關(guān)系,而且挖掘出了高頻“癥狀+藥物”組和高頻“證型+藥物”組,此部分結(jié)果對(duì)于缺乏經(jīng)驗(yàn)醫(yī)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 當(dāng)代中醫(yī)耳鼻喉科名家醫(yī)案常見病用藥規(guī)律數(shù)據(jù)挖掘研究.pdf
- 婦科常見病
- 婦科常見病的防治
- 婦科常見病健康教育
- 婦科常見病講訴
- 婦科病普查及婦科常見病的防治
- 婦科常見病注意事項(xiàng)
- 婦科常見病知識(shí)講座
- 中醫(yī)醫(yī)案數(shù)據(jù)挖掘技術(shù)研究.pdf
- 婦科常見病及用藥知識(shí)
- 中醫(yī)常見病證
- 婦科病普查及婦科常見病的防治分析
- 《中醫(yī)婦科常見病診療指南——月經(jīng)過少》評(píng)價(jià)與修訂.pdf
- 青春期與婦科常見病
- 當(dāng)代中醫(yī)婦科名家常見月經(jīng)病用藥規(guī)究律數(shù)據(jù)挖掘研究.pdf
- 婦科常見病的普查普治
- (中醫(yī)資料)常見病自測
- 中醫(yī)常見病護(hù)理常規(guī)
- 中醫(yī)常見病問診程序
- 婦科常見病證診療認(rèn)識(shí)和體會(huì)
評(píng)論
0/150
提交評(píng)論