若干統(tǒng)計(jì)計(jì)算模型研究及其在生物醫(yī)學(xué)信息處理中的應(yīng)用.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-07 格式：pdf 頁數(shù)：164 大?。?7.12MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

若干統(tǒng)計(jì)計(jì)算模型研究及其在生物醫(yī)學(xué)信息處理中的應(yīng)用.pdf_第1頁

已閱讀1頁，還剩163頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、本課題來源于醫(yī)學(xué)和生物學(xué)中的實(shí)際問題，主要研究利用時(shí)間序列分析、統(tǒng)計(jì)信號(hào)處理、統(tǒng)計(jì)機(jī)器學(xué)習(xí)和模式識(shí)別、Meta(薈萃)分析等方法構(gòu)建了四個(gè)高效的統(tǒng)計(jì)計(jì)算模型，并利用這些模型進(jìn)行了宮內(nèi)胎兒心電圖信號(hào)提取和去噪，真核生物蛋白質(zhì)編碼區(qū)識(shí)別，二代測(cè)序短序列大數(shù)據(jù)背景下的病毒預(yù)測(cè)以及酒精依賴癥與NPY基因多態(tài)性的關(guān)聯(lián)Meta分析等問題的研究.
　　高精度胎兒心電圖(Fetal electrocardiogram，F(xiàn)ECG)在輔助醫(yī)師監(jiān)測(cè)胎兒

2、在宮中變化情況并作出臨床診斷方面具有非常重要的價(jià)值，然而在現(xiàn)實(shí)情況中，清晰的FECG卻很難得到，這是因?yàn)樵贔ECG中往往混雜著母體心電信號(hào)(Maternal ECG，MECG)和其他的噪聲污染，如基線漂移，工頻干擾及其他高頻噪聲等.在第一章中我們提出了一種新型的自適應(yīng)綜合算法用于母嬰心電信號(hào)分離和FECG去噪，該算法集成了獨(dú)立分量分析(Independent Composition Analysis，ICA)，集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ense

3、mble EmpiricalMode Decomposition，EEMD)和小波收縮(Wavelet Shrinkage，WS)等算法優(yōu)勢(shì).首先，我們利用獨(dú)立分量分析(ICA)將胎兒心電信號(hào)(FECG)從腹部混合信號(hào)(Abdominal ECG，AECG)中分離出來，從而得到含噪聲的FECG.其次，我們?cè)O(shè)計(jì)一個(gè)基于集合經(jīng)驗(yàn)?zāi)B(tài)分解和小波收縮的綜合算法對(duì)上一步得到的含噪FECG進(jìn)行去噪.該算法包括EEMD分解，有用子信號(hào)統(tǒng)計(jì)信息量檢驗(yàn)及

4、其小波收縮處理，部分信號(hào)重構(gòu)去除基線漂移等三個(gè)階段.最后，我們采用模擬信號(hào)和真實(shí)信號(hào)進(jìn)行測(cè)試，通過計(jì)算模擬信號(hào)去噪前后的信噪比(Signal-to-noise-ratio，SNR)，均方誤差(Mean Square Error，MSE)以及相關(guān)系數(shù)(R)對(duì)算法準(zhǔn)確性評(píng)估.結(jié)果顯示，我們提出的ICA-EEMD-WS綜合算法優(yōu)于傳統(tǒng)信號(hào)分離和去噪方法。
　　真核生物DNA序列的蛋白質(zhì)編碼區(qū)（外顯子）能夠在翻譯過程中控制蛋白質(zhì)的生成，對(duì)

5、于生命進(jìn)程具有極為重要的意義.在第二章中，我們將生物信息學(xué)中的蛋白質(zhì)編碼區(qū)識(shí)別（基因結(jié)構(gòu)預(yù)測(cè)）轉(zhuǎn)化為模式識(shí)別或分類問題進(jìn)行處理.在真核生物DNA序列的蛋白質(zhì)編碼區(qū)（外顯子）和非編碼區(qū)（內(nèi)含子）預(yù)測(cè)方面，前人已經(jīng)提出了很多分類技術(shù).其中，基于數(shù)字信號(hào)處理(digital signal processing，DSP)的離散傅里葉變換(discrete Fouriertransform，DFT)因其具有不依賴于先驗(yàn)知識(shí)的優(yōu)勢(shì)在該領(lǐng)域取得了較大

6、的成功.但是這類基于DFT的方法因?yàn)槠渥V分辨率低和譜能量泄露等本質(zhì)性的不足，使其在短DNA序列預(yù)測(cè)方面迅速失去優(yōu)勢(shì).第二章中，我們提出了一種新的基于自回歸(autoregressive，AR)譜分析和小波包變換的(wavelet packets transform，WPT)的綜合算法用于提升編碼區(qū)識(shí)別效率和準(zhǔn)確性.該算法首先利用一種DNA序列數(shù)值化方法(Code13 mappingmethod)將DNA序列轉(zhuǎn)為數(shù)值序列，然后將此數(shù)值序列

7、視為自回歸模型的觀測(cè)信號(hào)，利用高效的Marple算法通過計(jì)算Yule-Walker方程組的方法來估計(jì)自回歸模型的能量譜密度(power spectral density, PSD).最后，利用能量譜密度在頻率θ=2π/3處的值(也稱為周期三特性，three-base periodicity(TBP) property)得到信噪比(SNR)曲線.對(duì)該信噪比曲線利用小波包變換算法去噪后，選取適當(dāng)?shù)拈撝颠_(dá)到識(shí)別外顯子區(qū)域的目的.最后，利用三個(gè)

8、著名的標(biāo)準(zhǔn)測(cè)試集(GENSCAN65，HMR195和BG570)進(jìn)行算法測(cè)試，結(jié)果顯示，新算法較傳統(tǒng)的基于DFT的方法能更加準(zhǔn)確地識(shí)別出蛋白質(zhì)編碼區(qū).
　　病毒（尤其是致病病毒）已經(jīng)威脅人類健康數(shù)千年而且近些年來新病毒及其變種不斷出現(xiàn)，因此如何利用計(jì)算生物學(xué)技術(shù)協(xié)助醫(yī)學(xué)專家在二代測(cè)序海量短序列數(shù)據(jù)庫中快速縮小疑似病毒篩選范圍，為其后續(xù)實(shí)驗(yàn)確診病毒提供高質(zhì)量候選對(duì)象、大幅度節(jié)省實(shí)驗(yàn)成本、提高新病毒應(yīng)急反應(yīng)能力和時(shí)效性，以及加快大規(guī)模

9、疫苗研制和生成，挽救生命和減少感染人群等具有重要意義.第三章中，我們將序列比對(duì)與非序列比對(duì)方法相結(jié)合提出了一套綜合分類算法用于病毒和人類的識(shí)別（分類）以及進(jìn)一步的不同病毒類別預(yù)測(cè).該算法首先采用BLAST技術(shù)將待分類序列分別與大型的病毒數(shù)據(jù)庫和人類數(shù)據(jù)庫進(jìn)行比對(duì)，如果能夠從中找到高度同源的目標(biāo)序列，則該目標(biāo)序列的類別即可視為待分類序列的類別，算法停止.對(duì)于那些比對(duì)不上的序列，我們提出的非序列比對(duì)方法就可以發(fā)揮補(bǔ)充作用，首先將待分類DNA

10、序列轉(zhuǎn)換為數(shù)值向量，將其作為支持向量機(jī)(Supportvector machine，SVM)分類器的輸入對(duì)其進(jìn)行類別預(yù)測(cè)，得到其預(yù)測(cè)類別.如果被預(yù)測(cè)為”病毒”，將繼續(xù)利用多分類隨機(jī)森林(Random Forest，RF)進(jìn)行病毒類別預(yù)測(cè)，即繼續(xù)預(yù)測(cè)該”病毒”屬于六種病毒類別中的哪一種.利用獨(dú)立的8個(gè)測(cè)試集對(duì)我們提出的綜合算法進(jìn)行測(cè)試，并與其它預(yù)測(cè)方法進(jìn)行比較.結(jié)果顯示在病毒-人類分類效果方面具有較好的預(yù)測(cè)結(jié)果，尤其在較短的序列預(yù)測(cè)方面結(jié)

11、果基本令人滿意.在病毒水平的多分類預(yù)測(cè)中，盡管總體準(zhǔn)確率不是很高，但是預(yù)測(cè)結(jié)果可以作為生物學(xué)家進(jìn)一步的參考.總之，本研究能夠幫助生物學(xué)家和醫(yī)學(xué)專家進(jìn)行NGS短序列海量數(shù)據(jù)的大幅度篩選，從而大大縮小候選病毒序列的范圍，有助于提升病毒尤其是病原性病毒的識(shí)別確認(rèn)效率，為治療和預(yù)防重大流行性傳染病提供有力的技術(shù)支撐.
　　酒精依賴癥(Alcohol dependence，AD)是一種典型的慢性酒精中毒，是由于長期反復(fù)飲酒所致的對(duì)酒的一種特

12、殊的心理狀態(tài).1990-2010的20年間，在全球所有疾病風(fēng)險(xiǎn)因素中，飲酒已經(jīng)從原來的第6位快速上升為第3位，僅次于高血壓和二手煙.過度飲酒不僅導(dǎo)致與健康相關(guān)的損害，而且會(huì)帶來社會(huì)傷害，如交通事故、犯罪、虐待兒童、家庭暴力及各種形式的傷害等.因此，飲酒相關(guān)問題已經(jīng)將會(huì)成為包括我國在內(nèi)的全球重要的公共衛(wèi)生問題之一.盡管酒精依賴癥的發(fā)病率持續(xù)增加，但是其確切的病因和發(fā)病機(jī)理目前仍不完全清楚.目前研究認(rèn)為AD是與遺傳和環(huán)境等多因素有關(guān)的復(fù)雜精

13、神疾病，而且大量研究已經(jīng)證實(shí)酒依賴癥與遺傳因素密切相關(guān).在神經(jīng)肽Y(NPY)基因多態(tài)性與酒精依賴癥之間關(guān)聯(lián)性的研究方面，各國研究人員已經(jīng)在全球不同人群中進(jìn)行了十多年的研究，但是在兩個(gè)主要單核苷酸多態(tài)性(SNP)，即rs16139和rs16147位點(diǎn)，研究結(jié)果卻呈現(xiàn)出不吻合，甚至完全相反的結(jié)論，以至于與AD相關(guān)的易感基因尚未最終定論.這是因?yàn)椴煌巳?，不同種族間遺傳背景和環(huán)境影響因素的不同，導(dǎo)致同一基因在不同人群，不同種族之間等位基因及基

14、因型頻率可能存在差異，故而對(duì)同一疾病發(fā)生的影響也可能存在差異.如何利用現(xiàn)有隨機(jī)病例對(duì)照研究資料尋找酒精依賴癥的易感基因，從基因水平篩選高危人群并為其有針對(duì)性地提供早期干預(yù)，診斷，實(shí)現(xiàn)個(gè)性化治療具有重要的臨床應(yīng)用價(jià)值和社會(huì)效益.鑒于現(xiàn)有關(guān)于NPY基因多態(tài)性與酒精依賴癥關(guān)聯(lián)性研究中出現(xiàn)了研究結(jié)果不一致的情況，第四章中，我們主要圍繞NPY基因多態(tài)性與酒精依賴癥之間是否存在顯著的相關(guān)性問題，利用SNP的Meta分析方法對(duì)目前已經(jīng)發(fā)表的關(guān)于神經(jīng)肽

15、Y(NPY)基因多態(tài)性，尤其是兩個(gè)重要SNP(rs16139和rs16147)與AD發(fā)病風(fēng)險(xiǎn)的流行病學(xué)文獻(xiàn)進(jìn)行定量分析和綜合評(píng)估.本章我們嚴(yán)格按照SNP的Meta分析方法的基本要求，通過廣泛收集現(xiàn)有國內(nèi)外高質(zhì)量研究文獻(xiàn)，將現(xiàn)有的關(guān)于NPY基因多態(tài)性與酒精依賴癥關(guān)聯(lián)性的文獻(xiàn)進(jìn)行定量綜合分析.首先對(duì)對(duì)照組進(jìn)行哈迪-溫伯格遺傳平衡定律(Hardy-Weinberg equilibrium，HWE)平衡檢驗(yàn)，隨后進(jìn)行各研究的異質(zhì)性檢驗(yàn).上述檢驗(yàn)

16、通過后，利用基于Logistic回歸模型的最佳遺傳模型選擇策略確定采用顯性遺傳模型來合并各研究的p值，并進(jìn)行了亞組分析，最后利用漏斗圖，Egger線性回歸法和Begg秩相關(guān)法進(jìn)行檢驗(yàn)排除了發(fā)表偏倚.結(jié)果顯示，大部分人群目前尚無充分證據(jù)表明NPY基因多態(tài)性與酒精依賴癥之間存在顯著的關(guān)聯(lián)性.但是在亞組分析中發(fā)現(xiàn)個(gè)別人群（如芬蘭人)的SNP rs16139與酒精依賴癥具有相關(guān)性.本章對(duì)多個(gè)現(xiàn)有結(jié)果的Meta分析，從統(tǒng)計(jì)角度上增加了樣本量，提高

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

若干統(tǒng)計(jì)計(jì)算模型研究及其在生物醫(yī)學(xué)信息處理中的應(yīng)用.pdf

文檔簡介

溫馨提示

最新文檔

評(píng)論

若干統(tǒng)計(jì)計(jì)算模型研究及其在生物醫(yī)學(xué)信息處理中的應(yīng)用.pdf

文檔簡介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載