數(shù)據(jù)挖掘技術在醫(yī)院醫(yī)保費用分析中的研究與應用.pdf_第1頁
已閱讀1頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著基于關系結(jié)構的傳統(tǒng)數(shù)據(jù)庫技術廣泛地應用于信息化時代的各個領域,各種復雜的數(shù)據(jù)庫系統(tǒng)紛紛被建立,由計算機代替了手工操作,極大提高了人們的工作效率。隨著關系數(shù)據(jù)庫和各類信息系統(tǒng)應用的年深日久,在數(shù)據(jù)庫系統(tǒng)中積累了大量的業(yè)務數(shù)據(jù),并且由于業(yè)務應用的深入數(shù)據(jù)量還在日益增加。當前社會的市場競爭日趨激烈,使得醫(yī)療行業(yè)對于數(shù)據(jù)庫的要求不僅僅停留于數(shù)據(jù)處理層面,而逐漸向數(shù)據(jù)的深層次分析與利用的方向轉(zhuǎn)變。但如果沒有強大的數(shù)據(jù)分析工具對現(xiàn)有數(shù)據(jù)庫中的數(shù)

2、據(jù)進行挖掘分析,而單憑目前數(shù)據(jù)庫的分析查詢功能以及各業(yè)務系統(tǒng)的的能力,是無法發(fā)現(xiàn)并提取這些海量數(shù)據(jù)中所蘊含的知識與規(guī)律的。因此為了滿足日益增長的對數(shù)據(jù)進行深層次利用的需要,數(shù)據(jù)挖掘與數(shù)據(jù)倉庫技術應運而生,它們能夠?qū)ΜF(xiàn)有的海量數(shù)據(jù)進行深層次的知識提取和經(jīng)驗總結(jié),并獲取對管理決策有用的信息。目前這些技術廣泛的運用于金融業(yè)(如銀行、保險)、零售業(yè)(超級市場)以及電信業(yè)等商業(yè)領域,但是在醫(yī)療衛(wèi)生領域還處于摸索階段,對此我們進行了大膽的嘗試,對這

3、一領域進行研究,在醫(yī)院醫(yī)保費用分析中采用了數(shù)據(jù)挖掘技術來產(chǎn)生對醫(yī)保費用管理工作有意義的規(guī)則集。 現(xiàn)在國內(nèi)許多醫(yī)院都建立了自己的醫(yī)院信息系統(tǒng)(HIS系統(tǒng)),甚至有些大型醫(yī)院都擁有了包括HIS系統(tǒng)、圖像存儲與傳輸系統(tǒng)(PACS)以及實驗室信息系統(tǒng)(LIS)等配套關聯(lián)的信息系統(tǒng)在內(nèi)的醫(yī)院綜合信息系統(tǒng)。HIS系統(tǒng)應用復雜,經(jīng)過多年的運行,現(xiàn)有的業(yè)務數(shù)據(jù)庫中包含的不僅僅是大量的病人基本信息,還包含了病人的費用信息以及臨床生理信息,影像圖片

4、信息等等。特別是醫(yī)保等新興醫(yī)療方式不斷涌現(xiàn)并逐漸占據(jù)重要地位,如何從現(xiàn)有的海量數(shù)據(jù)中提取出對于醫(yī)院臨床醫(yī)療、學科建設、決策管理等多方面具有指導意義的知識與經(jīng)驗,幫助醫(yī)院取得競爭優(yōu)勢,成為了醫(yī)院工作中的一個重要任務。我們采用數(shù)據(jù)挖掘與數(shù)據(jù)倉庫技術對醫(yī)院現(xiàn)有的歷史數(shù)據(jù)進行分析成為了一個必然趨勢,這也正是醫(yī)院信息化建設所面臨的新課題。 隨著醫(yī)療改革的深入,國家大力普及醫(yī)保的保障范圍、努力提高醫(yī)保的保障水平,醫(yī)保病人在醫(yī)院病人中占的比例

5、越來越高,醫(yī)保收入在醫(yī)院的營業(yè)收入中占的比重也越來越大,目前醫(yī)院醫(yī)保管理所面臨的問題有:如何合理的控制醫(yī)保病人醫(yī)療費用的上漲,同時又盡可能的為醫(yī)保病人提供完善的醫(yī)療服務,降低醫(yī)院的墊支壓力;如何制定科學、合理的醫(yī)保定額指標,合理分配醫(yī)保返回資源,調(diào)動科室積極性促使科室主動貫徹醫(yī)保政策。 基于本課題的研究,我們提取了醫(yī)院歷年來與醫(yī)保病人相關的各類信息,建立了基于費用分析為主題的數(shù)據(jù)倉庫,在數(shù)據(jù)倉庫建立過程中,對業(yè)務數(shù)據(jù)的數(shù)據(jù)抽取、

6、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加載等一系列數(shù)據(jù)準備的過程進行了詳細闡述,并建立了包括時間維、科室維、醫(yī)生維、診斷維、地址維、性別維、年齡維、身份維等在內(nèi)的多種分析維度以及與費用相關的事實表,建立了以醫(yī)保費用分析為主題的星型模式的數(shù)據(jù)倉庫。 在本課題中數(shù)據(jù)源分別來自于醫(yī)院信息系統(tǒng)(HIS)與醫(yī)保信息系統(tǒng)(PJ3)這兩個異構數(shù)據(jù)源,面臨著描述同一種事物時存在著不同的表達方式,或者數(shù)據(jù)缺失、數(shù)據(jù)重復等情況,如果采用手工篩選的方式將無法完成這

7、些大量的數(shù)據(jù)清洗工作。數(shù)據(jù)準備的工作是建立挖掘系統(tǒng)的過程中重要的部分,它所花費的時間與精力也最多,而在數(shù)據(jù)準備的工作中數(shù)據(jù)清洗又是其中的重點內(nèi)容。數(shù)據(jù)清洗將從業(yè)務數(shù)據(jù)庫中提取出來的數(shù)據(jù)“干凈地”導入到數(shù)據(jù)倉庫中,數(shù)據(jù)清洗工作的好壞將直接影響到數(shù)據(jù)挖掘的質(zhì)量和效率,直接關系著數(shù)據(jù)挖掘的結(jié)果。 針對這一課題,我們設計了自動數(shù)據(jù)清洗的方式。其主要工作是:將HIS系統(tǒng)與PJ3系統(tǒng)這兩個異構數(shù)據(jù)源對其中數(shù)據(jù)的不規(guī)范性和二義性以及重復和不完

8、整等問題進行了數(shù)據(jù)清洗,經(jīng)過一段時間的跟蹤,我們記錄下通過自動數(shù)據(jù)清洗解決了以下幾個方面的問題: 1、自動篩選出缺少住院號的醫(yī)保記錄。 2、自動篩選出數(shù)據(jù)中住院號與姓名不匹配的記錄。 3、病人ID號與住院號在兩個數(shù)據(jù)源中不匹配的記錄。 4、數(shù)據(jù)中科室錯誤的記錄,包含沒有科室信息以及轉(zhuǎn)科信息等。 通過這種自動篩選的數(shù)據(jù)清洗方式,能夠有效的提取攔截有問題的數(shù)據(jù),加快了數(shù)據(jù)清洗的時間,保證了數(shù)據(jù)挖掘的質(zhì)

9、量。 本課題通過對醫(yī)院歷年醫(yī)保病人數(shù)據(jù)采用數(shù)據(jù)挖掘的方法,使用關聯(lián)規(guī)則中的Apriori算法實現(xiàn)了對醫(yī)保費用與相關因素(如醫(yī)保病人身份、科室、醫(yī)生、診斷、住院天數(shù)、地域等)間的規(guī)則挖掘,得出了醫(yī)保費用分析的規(guī)則集。利用該規(guī)則集進行分析我們可以看出與醫(yī)保病人費用關聯(lián)最大的是住院天數(shù)和特定出院科室這兩個因素的組合,規(guī)則集中前5條規(guī)則的匹配模式是對醫(yī)保費用影響最大的因素,今后對于具有這些屬性的醫(yī)保病人應該給予較高的關注,一方面在滿足病

10、人醫(yī)療需求的前提下盡量避免超出定額情況的發(fā)生,另一方面努力調(diào)動科室積極性、合理分配醫(yī)療資源、保障醫(yī)保補償性收入。 通過本課題的研究表明:數(shù)據(jù)倉庫以及數(shù)據(jù)挖掘技術能夠找出與醫(yī)保費用管理工作關系密切的規(guī)則集,通過規(guī)則來為醫(yī)保費用管理工作提供有益的參考和指導,并協(xié)助制定動態(tài)的定額分配指標,加快醫(yī)保數(shù)據(jù)分析反饋的速度以及做出及時的分析回溯。數(shù)據(jù)挖掘技術與傳統(tǒng)技術相比具有靈活、快速、分析能力強的優(yōu)點,把數(shù)據(jù)挖掘技術引入醫(yī)保管理工作中將適應

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論