醫(yī)療數據挖掘在疾病早期預警中的關鍵技術研究.pdf_第1頁
已閱讀1頁,還剩148頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著醫(yī)院信息系統(tǒng)(HospitalInformationSystem,HIS)的發(fā)展,臨床數據庫已經積累了大量的關于患者的醫(yī)療診斷的信息。如何發(fā)掘數據背后的關系模式,以提供新的醫(yī)學知識,為患者提供更為個人的,及時的預警和治療得到了越來越多的關注。因此,需要開發(fā)和應用新的醫(yī)療數據挖掘方法來發(fā)現這些隱藏的知識。
  本文針對醫(yī)學數據挖掘的一些關鍵點進行了研究,尤其是在疾病早期預警方面。早期預警系統(tǒng)的目標是確定臨床惡化的跡象,并提供嚴重

2、臨床事件預警。由于醫(yī)療數據往往在高維空間里,充分描述數據所需的空間規(guī)模是指數級增長的,計算量可以大到不切實際而且數據點很稀疏無法建模。為了解決這些問題,我們提出了核密度邏輯回歸混合模型,監(jiān)督度量學習等算法對醫(yī)療數據進行處理。最后,我們搭建了一個雙層預警系統(tǒng):該系統(tǒng)的第一層從現有的臨床電子病歷數據庫中自動識別有惡化風險的患者。第二層通過無線傳感器采集高危患者的實時生命體征數據并進行危險篩查。我們采用數據挖掘技術這兩個層面上分析數據,給予病

3、人的實時分析結果。論文的主要工作及貢獻如下:
  1.提出了一種基于密度的邏輯回歸(DLR)分類模型以解決臨床數據挖掘算法中的邏輯回歸中非線性分類的問題。其主要思想是根據Nadarays-Watson密度估計將訓練數據映射到特定的特征空間,然后組建優(yōu)化模型優(yōu)化特征權重以及Nadarays-Watson密度估計算法的寬度。其主要優(yōu)點在于:它不僅優(yōu)于標準的邏輯回歸,而且優(yōu)于基于RBF內核的核邏輯回歸(KLR)。特別是與核邏輯回歸分析(

4、KLR)和支持向量機(SVM)相比,該方法不僅達到更好的分類精度,而且有更好的時間效率。該方法的另一個顯著優(yōu)點是,它可以很自然地擴展到數值類型和分類型混合的數據集中。除此之外,該方法在醫(yī)療數據挖掘中有模型可解釋的優(yōu)點,這恰恰是其它算法,如核邏輯回歸分析(KLR)和支持向量機(SVM)所不具備的。
  2.提出了一種監(jiān)督度量學習算法–基于內核密度的度量學習算法(KernelDensityMetricLearning(KDML))以解

5、決臨床數據挖掘中數據特征過多引起的模型過擬合問題。該算法通用性強,可以提供非線性的,基于概率的距離量度。通過基于內核概率密度估計,KDML構建了一個從原始空間至目標特征空間的直接非線性映射。KDML內部嵌入的非線性映射能夠解決線性度量學習在數據集上分類錯誤的問題。同時,該算法解決了當特征分布不均時,歐幾里得距離在原始空間上的量度導致k近鄰分類失效的問題。除此之外,算法可以實現與現有的度量學習算法結合。我們同時提出了一種綜合的優(yōu)化算法,來

6、優(yōu)化馬氏矩陣和非線性映射中的超參數。通過在數據集上的實驗證明KDML能夠顯著提高現有度量算法在k近鄰分類中的分類精度。
  3.提出了一種新的監(jiān)督學習算法-快速通量判別算法(FastFluxDiscriminant,FFD),來解決大尺度非線性分類問題。算法提出了一個新的子模優(yōu)化框架,通過分解整個特征空間的核密度估計函數,將原始高維數據轉化至低維子空間。子空間的特征將被轉換,并在新的特征空間進行線性建模。與其他基于核算法非線性模型

7、不同,由于原始空間的權重系數可知,FFD模型具有可解釋性的優(yōu)點,同時通過降維,使得算法的訓練和測試時間大大縮短。在實際數據集上的實驗結果證明,該模型在保持高精度的分類結果的基礎上,具有稀疏性,可解釋性和多尺度性等優(yōu)點。
  4.提出了一個應用在病房中的早期預警系統(tǒng)(EarlyWarningSystem),為臨床病人提供早期預警,從而在病人病情進一步惡化之前為醫(yī)生提供早期介入的機會。通過引入Bucketing技術來捕捉病人重要體征的

8、變化,并填補病人缺失的數據,使得數據可以應用在實際的模型中。同時,我們結合邏輯回歸,BiasedBucketBagging(解決過擬合為題),探索性下采樣(解決類間不均衡問題)等算法完成系統(tǒng)。此外,在實時預測系統(tǒng)中,我們引入通過指數移動平均平滑初級預測結果,來較少數據波動對模型輸出的影響。
  5.設計了無線醫(yī)療監(jiān)控系統(tǒng)-臨床監(jiān)測無線傳感器網絡,能夠獲得病人的實時醫(yī)療數據時間序列。該系統(tǒng)針對無線傳感器網絡在普通病房布置運用的可能性

9、進行了深入的臨床實驗?;?02.15.4的無線Mesh網絡,TelosB硬件平臺,針對病人流動性大,醫(yī)療無線傳感器網絡拓撲結構多變性的特點,通過引入動態(tài)中繼協(xié)議(DRAP),收集樹協(xié)議(CTP)來解決節(jié)點數據傳輸和能量限制的問題。在醫(yī)院病房中的實驗證明,系統(tǒng)提供了足夠的時間分辨率以支持臨床突發(fā)事件的監(jiān)測,實現了利用無線傳感器網絡持續(xù)對病人監(jiān)護的預期目標。在此基礎上,我們提出了一種針對一般的病情惡化的綜合數據挖掘算法。通過提取一階,二階

10、時間序列特征,去趨勢波動分析(DetrendedFluctuationAnalysis(DFA)),頻譜分析,近似熵(ApproximativeEntropy(ApEn)),時間序列交叉相關性分析,整合得到時間序列的特征集。然后,通過引入一系列數據挖掘方法來進行時間序列分類,其中包括前向特征選擇,線性和非線性分類算法等。最終,我們將算法應用在2001年至2008年不同重癥監(jiān)護病房病人的數據上,結果顯示文中提出的綜合數據挖掘算法能夠顯著提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論