版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、利用基因表達(dá)譜技術(shù),人們可以在一次實驗中同時獲得組織樣本中成千上萬個基因的表達(dá)數(shù)據(jù),為腫瘤學(xué)提供了一種全新的研究手段。如何從龐大的腫瘤基因表達(dá)譜數(shù)據(jù)中分析和挖掘出有用的信息和知識,更加全面的認(rèn)識腫瘤的基因本質(zhì)、獲得對“腫瘤—基因”間關(guān)系的真實反映,推進(jìn)腫瘤學(xué)的基礎(chǔ)研究和腫瘤的臨床診斷與治療,是當(dāng)前生物信息學(xué)和腫瘤學(xué)研究的重要課題。論文基于腫瘤基因表達(dá)譜數(shù)據(jù),從研究樣本的有效分類入手,利用分類特征選取技術(shù),就腫瘤基因表達(dá)譜數(shù)據(jù)中分類特征規(guī)
2、則的提取、腫瘤分類特征基因的鑒別和腫瘤特異表達(dá)基因的發(fā)現(xiàn)三個關(guān)鍵問題作為主要研究內(nèi)容,以從不同角度揭示出可能的“腫瘤—基因”間的關(guān)系。在分析方法上,力求將計算智能的基本理論和方法同生物學(xué)知識有效結(jié)合,從而發(fā)展出一種分析和處理基因表達(dá)譜數(shù)據(jù)的有效方法。論文取得的主要研究成果如下: (1)以多發(fā)性骨髓瘤基因表達(dá)譜數(shù)據(jù)集作為具體的研究對象,提出了一種基于離散型基因表達(dá)譜數(shù)據(jù)的知識提取方法,得到了多發(fā)性骨髓瘤基因表達(dá)譜中蘊含的5條樣本分
3、類規(guī)則,并從生物學(xué)角度對其進(jìn)行詳細(xì)分析以闡明其生物學(xué)含義。這些分類知識的發(fā)現(xiàn)對多發(fā)性骨髓瘤的基因診斷、研究多發(fā)性骨髓瘤中特異的基因表達(dá)行為具有重要意義。在分析方法上,充分考慮了基因表達(dá)譜數(shù)據(jù)集樣本少、維數(shù)高這一突出特點,針對已有歸納學(xué)習(xí)算法在處理小樣本、高維數(shù)的樣本學(xué)習(xí)問題時所出現(xiàn)的困難,通過首先計算屬性的信息增益進(jìn)行基因排序,然后基于神經(jīng)網(wǎng)絡(luò)進(jìn)行屬性規(guī)約,最后利用重采樣技術(shù)形成決策樹群、以綜合統(tǒng)計指標(biāo)對決策樹進(jìn)行性能評價的方法提取樣本
4、分類特征規(guī)則。上述方法可有效提高樣本分類知識提取的準(zhǔn)確性和魯棒性,為腫瘤基因表達(dá)譜數(shù)據(jù)的分析提供了一種可用工具。 (2)從生物學(xué)分析入手、結(jié)合模式識別與機(jī)器學(xué)習(xí)技術(shù)重點研究了腫瘤分類特征基因選取問題。在濾除分類無關(guān)基因這一環(huán)節(jié),充分結(jié)合生物樣本數(shù)據(jù)統(tǒng)計分布的特點和模式識別的基礎(chǔ)理論,提出了基因分類信息指數(shù)的概念,以全面衡量基因所含樣本分類信息量。在冗余屬性去除的問題上,從基因調(diào)控的基本形式出發(fā),首先采用兩兩冗余分析進(jìn)行強(qiáng)相關(guān)性冗
5、余屬性的去除,然后利用基于“屬性子集評價”的特征搜索算法,從“功能基因組合”的角度出發(fā)進(jìn)行分類特征基因集合的選取。在具體搜索算法的設(shè)計問題上,研究了基于概率可分性判據(jù)的浮動前向搜索算法和基于SVM分類模型靈敏度分析的后向搜索算法兩種不同類型的屬性選取方法,為腫瘤分類特征基因選取問題的實際求解提供了兩種高效可行的算法。將上述方法應(yīng)用于急性白血病的亞型識別與分類特征基因選取問題中,結(jié)果表明:同經(jīng)典的研究成果相比,本文方法不僅將分類正確率提高
6、到100%,同時利用前向、后向搜索算法分別得到了兩組數(shù)量更少、更具樣本分類能力的特征基因,為急性白血病亞型的準(zhǔn)確診斷、功能芯片的設(shè)計提供了兩組可用的基因標(biāo)記。 (3)以Multi-Class腫瘤基因表達(dá)譜數(shù)據(jù)集作為分析基礎(chǔ),通過將不同類別的腫瘤組織視為一個統(tǒng)一的“腫瘤”類別,將對應(yīng)的不同類型的正常組織作為一個統(tǒng)一的“正?!鳖悇e加以研究,以“腫瘤”與“正?!苯M織樣本的有效分類為基礎(chǔ),利用分類特征選取技術(shù)就腫瘤特異表達(dá)基因的發(fā)現(xiàn)及其
7、表達(dá)模式問題進(jìn)行了分析和研究。找出了腫瘤特異表達(dá)的一組基因特征,并從信息學(xué)和統(tǒng)計學(xué)的角度對該組基因在腫瘤組織中特異表達(dá)的確實性和普遍性進(jìn)行了全面論證,最后對其在腫瘤組織中特異的表達(dá)模式進(jìn)行了分析探討,總結(jié)了腫瘤基因表達(dá)上的特點,為人們深入認(rèn)識腫瘤共同的基因表達(dá)特征、探究腫瘤發(fā)生與形成的分子機(jī)制提供了有益的參考和借鑒。在分類特征選取問題上,拋棄了從樣本統(tǒng)計特征出發(fā)、基于屬性可分性判據(jù)進(jìn)行特征選取的分析方法,將基于實例的機(jī)器學(xué)習(xí)算法引入到該
8、問題的研究中來,提出了RFERelief算法以有效獲取樣本的分類特征,并從理論和實驗兩方面證明了該算法的有效性。 論文研究課題得到了國家自然科學(xué)基金(No.60234020)支持。論文就腫瘤基因表達(dá)譜分析中一些關(guān)鍵環(huán)節(jié)和重要問題進(jìn)行了深入研究,所做工作的核心是希望從信息學(xué)的角度分析和理解基因表達(dá)數(shù)據(jù),以發(fā)現(xiàn)其中蘊含的信息和知識,并就腫瘤學(xué)研究中的某些問題進(jìn)行分析和解答。所得科研成果對腫瘤的臨床診斷和生物醫(yī)學(xué)基礎(chǔ)研究具有一定的參考
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 智能信息處理技術(shù)
- 基于數(shù)據(jù)挖掘技術(shù)的智能信息處理.pdf
- 智能信息處理
- 物聯(lián)網(wǎng)智能信息處理技術(shù)
- 基于XML的智能信息處理研究.pdf
- 智能信息處理技術(shù)-王耀南
- 基于柔性計算技術(shù)的智能化學(xué)信息處理.pdf
- 基于信息鏈的智能信息處理關(guān)鍵技術(shù)研究.pdf
- 智能圖像信息處理技術(shù)及應(yīng)用研究.pdf
- 基于智能信息處理的煤礦瓦斯動態(tài)預(yù)測研究.pdf
- 神經(jīng)計算智能信息處理
- 計算機(jī)輔助信息處理技術(shù)在藥物色譜分析中的應(yīng)用.pdf
- 基于智能信息處理MIMO系統(tǒng)盲均衡研究.pdf
- 圖像信息處理技術(shù)
- 基于數(shù)據(jù)挖掘技術(shù)的交通信息處理與分析系統(tǒng).pdf
- 基于智能信息處理的模擬電路故障診斷研究.pdf
- 基于群決策理論的智能信息處理方法及其應(yīng)用.pdf
- 智能信息處理技術(shù)在互聯(lián)網(wǎng)輿情分析中的應(yīng)用.pdf
- 中藥分析信息處理技術(shù)的應(yīng)用研究.pdf
- 基于新型智能信息處理技術(shù)的直流局部放電在線檢測方法研究.pdf
評論
0/150
提交評論