基于信息挖掘技術(shù)的人工嗅覺系統(tǒng)研究.pdf_第1頁
已閱讀1頁,還剩124頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、人工嗅覺系統(tǒng),也稱電子鼻,是一種模擬人的嗅覺系統(tǒng)工作原理而設計的新型仿生檢測儀器,具有快速穩(wěn)定、成本低廉和無損檢測等優(yōu)勢。隨著計算科學的快速發(fā)展,利用統(tǒng)計學和機器學習等方法對人工嗅覺系統(tǒng)的信號中相關(guān)信息進行數(shù)據(jù)挖掘,從而實現(xiàn)對復雜樣本定量和定性分析,已成為研究的熱點之一。
  分類是人工嗅覺系統(tǒng)數(shù)據(jù)挖掘技術(shù)主要的類型之一。常規(guī)的分類方法只給出預測結(jié)果,缺乏對預測結(jié)果的可靠性評估,即對預測結(jié)果的可信程度的評估以及對該評估有效性的保障

2、。概率預測算法,如Na(i)ve Bayes,Logistic Regression等,可以提供預測結(jié)果正確的概率。然而,這些算法過度依賴樣本分布模型的假設,一旦假設的模型不正確,則預測的概率不準確,可靠性評估的有效性無法保證。分類正確率是系統(tǒng)整體預測結(jié)果可靠性的評價指標,但由于氣敏傳感器漂移等因素導致,人工嗅覺系統(tǒng)最初建立的模型在一段時間后性能很有可能會下降,因此可靠性評估的有效性無法保障。
  一致性預測(Conformal

3、prediction)和韋恩預測(Venn machine)方法是最近提出的用于預測結(jié)果的可靠性評估的機器學習算法。這兩種方法都是很有彈性的算法框架,任何機器學習算法經(jīng)過改造都可以作為他們的底層算法。他們既可以為單個預測結(jié)果也可以為整體預測結(jié)果提供可靠性評估。只要樣本滿足簡單的獨立同分布假設(I.I.D assumption),則可靠性評估的有效性從理論上得到保障。
  人參在中國傳統(tǒng)醫(yī)學中極具藥用價值,但市場中摻假和以次充好的情

4、況頻發(fā)。人參鑒別通常依據(jù)專家組的判斷,鑒定過程費時費力,且鑒定結(jié)果的可靠性依賴專家的經(jīng)驗。精油是自然界植物中提取揮發(fā)性芳香物質(zhì),在日常生活中應用廣泛且種類繁多?;诜治龌瘜W方法的檢測過程復雜且成本較高。肺癌已成為癌癥死亡的主要原因,死亡數(shù)量逐年增加。肺癌診斷最權(quán)威的方法是活體組織切片。但該方法對人體傷害極大,且短時間內(nèi)無法重復檢測。研究表明,肺癌的早期篩查能夠大大降低肺癌的死亡率.目前已有的檢測技術(shù)復雜且費用高昂,難以大面積推廣。因此,

5、人參類別鑒定、精油類別鑒定和肺癌診斷都亟需一種性能穩(wěn)定、快速簡便、成本低廉且無損的檢測方法。
  本文以人參類別鑒定、精油類別鑒定和肺癌診斷為例,對人工嗅覺系統(tǒng)預測的可靠性進行研究。本文使用自主設計的人工嗅覺系統(tǒng),引入一致性預測和韋恩預測算法,在離線模式和在線模式下,對人參樣本、精油樣本和肺癌診斷樣本進行預測,對預測結(jié)果進行可靠性評估,對可靠性評估的有效性進行分析和討論。本研究對基于人工嗅覺系統(tǒng)的復雜樣本預測的可靠性研究具有重要意

6、義。除此之外,為了提高對人參樣本的預測性能,本文將人工嗅覺系統(tǒng)與近紅外光譜系統(tǒng)聯(lián)用,提出一種特征級和一種決策級的數(shù)據(jù)融合方法進行數(shù)據(jù)挖掘。本文主要的研究內(nèi)容和成果如下:
  設計以金屬氧化物半導體氣敏傳感器陣列為核心的人工嗅覺軟硬件系統(tǒng),實現(xiàn)樣本測試流程的自動控制。對人參、精油、和肺癌診斷樣本進行制備和測試。
  針對人工嗅覺系統(tǒng)預測的可靠性研究,首次引入一致性預測算法框架?;趉-最近鄰(KNN)和支持向量機(SVM)構(gòu)造

7、三種一致性預測器(CP-1NN,CP-3NN和CP-SVM),在離線和在線模式下對人參樣本、精油樣本進行預測,并與1NN,3NN和SVM預測結(jié)果進行比較。離線模式下,一致性預測器進行強制預測(輸出單一預測值)時,對人參和精油樣本分別獲得最優(yōu)分類率為85.71%(CP-1NN)和96.17%(CP-1NN)。同時,一致性預測器為每個預測結(jié)果提供了可靠性評估。在線模式下,一致性預測器的預測結(jié)果中錯誤區(qū)域預測的比例不超過預設的顯著性水平(由用

8、戶定義)。說明整體區(qū)域預測結(jié)果的可靠性評估是有效的。對三種一致性預測器在特定顯著性水平下的預測結(jié)果的精確度以及空預測、單一預測和多預測的特點進行了分析和討論。
  針對人工嗅覺系統(tǒng)的可靠性研究,首次引入韋恩預測算法框架?;诔R?guī)概率預測方法,Na(i)ve Bayes,Softmax Regression和Platt's Method,構(gòu)造三種韋恩預測器(VM-NB,VM-SR,VM-SVM),在離線和在線模式下對人參樣本、肺癌診

9、斷樣本進行概率預測,同時與三種常規(guī)概率預測的預測結(jié)果在分類準確率和概率預測有效性方面進行比較。離線模式下,韋恩預測器對人參和肺癌診斷樣本獲得最優(yōu)分類率分別為86.35%(VM-SVM)和97.22%(VM-SR)。同時,提供每個預測結(jié)果預測正確的概率區(qū)間。韋恩預測器概率預測結(jié)果的有效性指標優(yōu)于相應的常規(guī)概率預測方法,且預測的概率區(qū)間和實際觀測到預測正確的概率是一致的,說明了韋恩預測結(jié)果的有效性。韋恩預測的概率區(qū)間寬度非常窄,接近于單一概

10、率預測值。在線模式下,韋恩預測器仍然輸出可靠的概率區(qū)間,且隨著訓練集樣本數(shù)量的增加,概率區(qū)間的分布不斷上移,概率區(qū)間的寬度不斷減小,即韋恩預測器的精確度不斷提高。
  將人工嗅覺系統(tǒng)與近紅外光譜組成的混合系統(tǒng)用于人參樣本的分類。針對兩個系統(tǒng)特征數(shù)量不平衡的特點,提出加權(quán)的特征級數(shù)據(jù)融合方法,獲得99.58%的分類率。結(jié)合概率預測和Dempster-Shafer證據(jù)理論提出決策級數(shù)據(jù)融合方法,獲得99.24%的分類率。兩種數(shù)據(jù)融合方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論