2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩128頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、探索基于SPSS Clementine的在線醫(yī)院數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn),達(dá)到節(jié)約資源、共享資源的目的。在此基礎(chǔ)上,探討數(shù)據(jù)挖掘技術(shù)在因素預(yù)測、疾病判別診斷、疾病關(guān)聯(lián)分析中的應(yīng)用,結(jié)合實(shí)例研究重慶市結(jié)核病流行過程及發(fā)展趨勢、乳腺癌腋窩高位淋巴結(jié)轉(zhuǎn)移的危險(xiǎn)因素及判別分類模型和糖尿病與并發(fā)癥的關(guān)聯(lián)知識發(fā)掘。為臨床管理人員、醫(yī)務(wù)人員、科研工作者進(jìn)行科學(xué)管理、提高診療水平以及開展醫(yī)學(xué)研究提供輔助決策與綜合分析的工具。當(dāng)前信息領(lǐng)域內(nèi)普遍存在的“知識發(fā)現(xiàn)

2、”問題迫切需要研究和解決,就方法學(xué)而言,科學(xué)地選擇適當(dāng)?shù)臄?shù)據(jù)挖掘算法是獲得準(zhǔn)確知識規(guī)則的關(guān)鍵;而在線醫(yī)院數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)對提高醫(yī)院管理水平和醫(yī)療質(zhì)量具有重要的應(yīng)用價(jià)值。 隨著計(jì)算機(jī)技術(shù)、生物醫(yī)學(xué)工程研究的飛速發(fā)展,計(jì)算機(jī)信息技術(shù)在醫(yī)學(xué)領(lǐng)域廣泛應(yīng)用,使得大量醫(yī)學(xué)信息被精確記錄下來,積累了大量的數(shù)據(jù)資源,激增的數(shù)據(jù)背后隱藏著許多重要的有用信息。從這些大量的數(shù)據(jù)資源中挖掘深層次的、隱含的、有價(jià)值的知識顯得越來越重要。到目前為止,在國

3、內(nèi),數(shù)據(jù)挖掘技術(shù)在醫(yī)療服務(wù)領(lǐng)域的研究有所報(bào)道,但未見其在線分析系統(tǒng)的研究應(yīng)用;針對不同目標(biāo)的實(shí)際應(yīng)用,科學(xué)地選擇適當(dāng)?shù)臄?shù)據(jù)挖掘算法的方法學(xué)研究尚屬先例。 本研究采用Java網(wǎng)絡(luò)編程語言,實(shí)現(xiàn)基于SPSS Clementine的在線醫(yī)院數(shù)據(jù)挖掘的技術(shù)。利用來源于重慶市三所醫(yī)療機(jī)構(gòu)(重慶市結(jié)核病防治所、重慶醫(yī)科大學(xué)附屬第一醫(yī)院、附屬第二醫(yī)院)的醫(yī)院數(shù)據(jù),包括結(jié)核病、乳腺癌和糖尿病的資料。分別采用ARIMA模型、BP神經(jīng)網(wǎng)絡(luò)模型、GM

4、l(1,1)模型對結(jié)核病發(fā)病率進(jìn)行預(yù)測分析比較;采用Logistic模型、CHAID模型、RBFN模型、RBFN-Logistic混合模型、RBFN-CHAID混合模型對乳腺癌腋窩高位淋巴結(jié)轉(zhuǎn)移判別分類比較;采用Apriori關(guān)聯(lián)分析模型對糖尿病與并發(fā)癥的關(guān)聯(lián)強(qiáng)度進(jìn)行描述。主要研究內(nèi)容:①采用Java網(wǎng)絡(luò)編程語言,對在線數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)進(jìn)行探索。②分析重慶市結(jié)核病流行過程,乳腺癌腋窩高位淋巴結(jié)轉(zhuǎn)移的危險(xiǎn)因素以及糖尿病與并發(fā)癥的關(guān)聯(lián)。③

5、采用ARIMA模型、BP神經(jīng)網(wǎng)絡(luò)模型、GM(1,1)模型對結(jié)核病發(fā)病率進(jìn)行預(yù)測分析。④采用Logistic模型、CHAID模型、RBFN模型、RBFN-Logistic混合模型、RBFN-CHAID混合模型對乳腺癌腋窩高位淋巴結(jié)轉(zhuǎn)移判別分類。⑤利用準(zhǔn)確率(Accuracy)和可靠性(Reliability)指標(biāo)評價(jià)模型的準(zhǔn)確性和可靠性。 研究結(jié)果表明:①初步整合了SPSS Clementine,實(shí)現(xiàn)了在線醫(yī)院數(shù)據(jù)采集、執(zhí)行引擎、

6、分析結(jié)果處理和分析結(jié)果查詢的流程處理。②結(jié)核病有明顯的季節(jié)流行高峰,基本是每年一、三季度發(fā)病人數(shù)較少,二、四季度發(fā)病人數(shù)較多。一個(gè)結(jié)核病流行年各季度發(fā)病率與一年前的一個(gè)半結(jié)核病流行年各季度發(fā)病率有關(guān)系。對結(jié)核病發(fā)病率的預(yù)測必須考慮季節(jié)因素、周期性及隨機(jī)因素的影響,才能做出準(zhǔn)確的預(yù)測。③ARIMA模型、BPANN2模型和GM(1,1)模型比較,前兩者對結(jié)核病發(fā)病率的預(yù)測的相對誤差分別為0.05872和0.06999,GM(1,1)模型為0

7、.01210,說明殘差GM(1,1)模型對結(jié)核病具有較好的預(yù)測性能。④乳腺癌腋窩高位淋巴結(jié)轉(zhuǎn)移與腋窩中低淋巴結(jié)狀況、腫瘤大小有明顯關(guān)系。⑤RBFN模型采用權(quán)值矩陣表達(dá)診斷知識,Logistic模型與RBFNl-Logistic混合模型采用Logistic回歸系數(shù)表達(dá)診斷知識,二者均不易被使用者解讀;CHAJD模型和RBFN-CHAID混合模型采用了自然語言以樹型的方式表達(dá),提高了結(jié)果的可理解性。⑥Logistic模型、CHAID模型、R

8、BFN模型、RBFN-Logistic混合模型、RBFN-CHAID混合模型的平均預(yù)測準(zhǔn)確率分別為83.34%、83.79%、85.61%、83.77%、79.74%,|r-1|分別為0.0720、0.0625、0.0549、0.0766、0.0948。RBFN模型所獲知識的可靠程度以及對測試集合測試的準(zhǔn)確率明顯優(yōu)于其它算法。⑦CHAID模型提取的診斷規(guī)則描述簡單易懂,應(yīng)用方便,可判斷各診斷指標(biāo)對乳腺癌腋窩高位淋巴結(jié)轉(zhuǎn)移診斷貢獻(xiàn)的大小,

9、從CHAID決策樹型可見,中低淋巴結(jié)狀況對乳腺癌腋窩高位淋巴結(jié)轉(zhuǎn)移診斷起決定性作用,腫瘤大小則可作為診斷的重要指標(biāo)。因此,CHAID模型是一種簡便可行的計(jì)算機(jī)輔助診斷方法,可從病例自動提取診斷規(guī)則,具有較廣泛的實(shí)用價(jià)值,可應(yīng)用于其它疾病的診斷研究。③泌尿道感染、腎病、眼部病變、神經(jīng)病變、高脂血癥、高血壓、心臟病、冠心病等與糖尿病具有明顯并發(fā)傾向。 結(jié)論:①在線醫(yī)院數(shù)據(jù)挖掘技術(shù)是未來醫(yī)院信息系統(tǒng)的重要組成部分,對提高醫(yī)院管理水平和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論