版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、本課題來源于醫(yī)學(xué)和生物學(xué)中的實際問題,主要研究利用時間序列分析、統(tǒng)計信號處理、統(tǒng)計機器學(xué)習(xí)和模式識別、Meta(薈萃)分析等方法構(gòu)建了四個高效的統(tǒng)計計算模型,并利用這些模型進行了宮內(nèi)胎兒心電圖信號提取和去噪,真核生物蛋白質(zhì)編碼區(qū)識別,二代測序短序列大數(shù)據(jù)背景下的病毒預(yù)測以及酒精依賴癥與NPY基因多態(tài)性的關(guān)聯(lián)Meta分析等問題的研究.
高精度胎兒心電圖(Fetal electrocardiogram,F(xiàn)ECG)在輔助醫(yī)師監(jiān)測胎兒
2、在宮中變化情況并作出臨床診斷方面具有非常重要的價值,然而在現(xiàn)實情況中,清晰的FECG卻很難得到,這是因為在FECG中往往混雜著母體心電信號(Maternal ECG,MECG)和其他的噪聲污染,如基線漂移,工頻干擾及其他高頻噪聲等.在第一章中我們提出了一種新型的自適應(yīng)綜合算法用于母嬰心電信號分離和FECG去噪,該算法集成了獨立分量分析(Independent Composition Analysis,ICA),集合經(jīng)驗?zāi)B(tài)分解(Ense
3、mble EmpiricalMode Decomposition,EEMD)和小波收縮(Wavelet Shrinkage,WS)等算法優(yōu)勢.首先,我們利用獨立分量分析(ICA)將胎兒心電信號(FECG)從腹部混合信號(Abdominal ECG,AECG)中分離出來,從而得到含噪聲的FECG.其次,我們設(shè)計一個基于集合經(jīng)驗?zāi)B(tài)分解和小波收縮的綜合算法對上一步得到的含噪FECG進行去噪.該算法包括EEMD分解,有用子信號統(tǒng)計信息量檢驗及
4、其小波收縮處理,部分信號重構(gòu)去除基線漂移等三個階段.最后,我們采用模擬信號和真實信號進行測試,通過計算模擬信號去噪前后的信噪比(Signal-to-noise-ratio,SNR),均方誤差(Mean Square Error,MSE)以及相關(guān)系數(shù)(R)對算法準(zhǔn)確性評估.結(jié)果顯示,我們提出的ICA-EEMD-WS綜合算法優(yōu)于傳統(tǒng)信號分離和去噪方法。
真核生物DNA序列的蛋白質(zhì)編碼區(qū)(外顯子)能夠在翻譯過程中控制蛋白質(zhì)的生成,對
5、于生命進程具有極為重要的意義.在第二章中,我們將生物信息學(xué)中的蛋白質(zhì)編碼區(qū)識別(基因結(jié)構(gòu)預(yù)測)轉(zhuǎn)化為模式識別或分類問題進行處理.在真核生物DNA序列的蛋白質(zhì)編碼區(qū)(外顯子)和非編碼區(qū)(內(nèi)含子)預(yù)測方面,前人已經(jīng)提出了很多分類技術(shù).其中,基于數(shù)字信號處理(digital signal processing,DSP)的離散傅里葉變換(discrete Fouriertransform,DFT)因其具有不依賴于先驗知識的優(yōu)勢在該領(lǐng)域取得了較大
6、的成功.但是這類基于DFT的方法因為其譜分辨率低和譜能量泄露等本質(zhì)性的不足,使其在短DNA序列預(yù)測方面迅速失去優(yōu)勢.第二章中,我們提出了一種新的基于自回歸(autoregressive,AR)譜分析和小波包變換的(wavelet packets transform,WPT)的綜合算法用于提升編碼區(qū)識別效率和準(zhǔn)確性.該算法首先利用一種DNA序列數(shù)值化方法(Code13 mappingmethod)將DNA序列轉(zhuǎn)為數(shù)值序列,然后將此數(shù)值序列
7、視為自回歸模型的觀測信號,利用高效的Marple算法通過計算Yule-Walker方程組的方法來估計自回歸模型的能量譜密度(power spectral density, PSD).最后,利用能量譜密度在頻率θ=2π/3處的值(也稱為周期三特性,three-base periodicity(TBP) property)得到信噪比(SNR)曲線.對該信噪比曲線利用小波包變換算法去噪后,選取適當(dāng)?shù)拈撝颠_到識別外顯子區(qū)域的目的.最后,利用三個
8、著名的標(biāo)準(zhǔn)測試集(GENSCAN65,HMR195和BG570)進行算法測試,結(jié)果顯示,新算法較傳統(tǒng)的基于DFT的方法能更加準(zhǔn)確地識別出蛋白質(zhì)編碼區(qū).
病毒(尤其是致病病毒)已經(jīng)威脅人類健康數(shù)千年而且近些年來新病毒及其變種不斷出現(xiàn),因此如何利用計算生物學(xué)技術(shù)協(xié)助醫(yī)學(xué)專家在二代測序海量短序列數(shù)據(jù)庫中快速縮小疑似病毒篩選范圍,為其后續(xù)實驗確診病毒提供高質(zhì)量候選對象、大幅度節(jié)省實驗成本、提高新病毒應(yīng)急反應(yīng)能力和時效性,以及加快大規(guī)模
9、疫苗研制和生成,挽救生命和減少感染人群等具有重要意義.第三章中,我們將序列比對與非序列比對方法相結(jié)合提出了一套綜合分類算法用于病毒和人類的識別(分類)以及進一步的不同病毒類別預(yù)測.該算法首先采用BLAST技術(shù)將待分類序列分別與大型的病毒數(shù)據(jù)庫和人類數(shù)據(jù)庫進行比對,如果能夠從中找到高度同源的目標(biāo)序列,則該目標(biāo)序列的類別即可視為待分類序列的類別,算法停止.對于那些比對不上的序列,我們提出的非序列比對方法就可以發(fā)揮補充作用,首先將待分類DNA
10、序列轉(zhuǎn)換為數(shù)值向量,將其作為支持向量機(Supportvector machine,SVM)分類器的輸入對其進行類別預(yù)測,得到其預(yù)測類別.如果被預(yù)測為”病毒”,將繼續(xù)利用多分類隨機森林(Random Forest,RF)進行病毒類別預(yù)測,即繼續(xù)預(yù)測該”病毒”屬于六種病毒類別中的哪一種.利用獨立的8個測試集對我們提出的綜合算法進行測試,并與其它預(yù)測方法進行比較.結(jié)果顯示在病毒-人類分類效果方面具有較好的預(yù)測結(jié)果,尤其在較短的序列預(yù)測方面結(jié)
11、果基本令人滿意.在病毒水平的多分類預(yù)測中,盡管總體準(zhǔn)確率不是很高,但是預(yù)測結(jié)果可以作為生物學(xué)家進一步的參考.總之,本研究能夠幫助生物學(xué)家和醫(yī)學(xué)專家進行NGS短序列海量數(shù)據(jù)的大幅度篩選,從而大大縮小候選病毒序列的范圍,有助于提升病毒尤其是病原性病毒的識別確認(rèn)效率,為治療和預(yù)防重大流行性傳染病提供有力的技術(shù)支撐.
酒精依賴癥(Alcohol dependence,AD)是一種典型的慢性酒精中毒,是由于長期反復(fù)飲酒所致的對酒的一種特
12、殊的心理狀態(tài).1990-2010的20年間,在全球所有疾病風(fēng)險因素中,飲酒已經(jīng)從原來的第6位快速上升為第3位,僅次于高血壓和二手煙.過度飲酒不僅導(dǎo)致與健康相關(guān)的損害,而且會帶來社會傷害,如交通事故、犯罪、虐待兒童、家庭暴力及各種形式的傷害等.因此,飲酒相關(guān)問題已經(jīng)將會成為包括我國在內(nèi)的全球重要的公共衛(wèi)生問題之一.盡管酒精依賴癥的發(fā)病率持續(xù)增加,但是其確切的病因和發(fā)病機理目前仍不完全清楚.目前研究認(rèn)為AD是與遺傳和環(huán)境等多因素有關(guān)的復(fù)雜精
13、神疾病,而且大量研究已經(jīng)證實酒依賴癥與遺傳因素密切相關(guān).在神經(jīng)肽Y(NPY)基因多態(tài)性與酒精依賴癥之間關(guān)聯(lián)性的研究方面,各國研究人員已經(jīng)在全球不同人群中進行了十多年的研究,但是在兩個主要單核苷酸多態(tài)性(SNP),即rs16139和rs16147位點,研究結(jié)果卻呈現(xiàn)出不吻合,甚至完全相反的結(jié)論,以至于與AD相關(guān)的易感基因尚未最終定論.這是因為不同人群,不同種族間遺傳背景和環(huán)境影響因素的不同,導(dǎo)致同一基因在不同人群,不同種族之間等位基因及基
14、因型頻率可能存在差異,故而對同一疾病發(fā)生的影響也可能存在差異.如何利用現(xiàn)有隨機病例對照研究資料尋找酒精依賴癥的易感基因,從基因水平篩選高危人群并為其有針對性地提供早期干預(yù),診斷,實現(xiàn)個性化治療具有重要的臨床應(yīng)用價值和社會效益.鑒于現(xiàn)有關(guān)于NPY基因多態(tài)性與酒精依賴癥關(guān)聯(lián)性研究中出現(xiàn)了研究結(jié)果不一致的情況,第四章中,我們主要圍繞NPY基因多態(tài)性與酒精依賴癥之間是否存在顯著的相關(guān)性問題,利用SNP的Meta分析方法對目前已經(jīng)發(fā)表的關(guān)于神經(jīng)肽
15、Y(NPY)基因多態(tài)性,尤其是兩個重要SNP(rs16139和rs16147)與AD發(fā)病風(fēng)險的流行病學(xué)文獻進行定量分析和綜合評估.本章我們嚴(yán)格按照SNP的Meta分析方法的基本要求,通過廣泛收集現(xiàn)有國內(nèi)外高質(zhì)量研究文獻,將現(xiàn)有的關(guān)于NPY基因多態(tài)性與酒精依賴癥關(guān)聯(lián)性的文獻進行定量綜合分析.首先對對照組進行哈迪-溫伯格遺傳平衡定律(Hardy-Weinberg equilibrium,HWE)平衡檢驗,隨后進行各研究的異質(zhì)性檢驗.上述檢驗
16、通過后,利用基于Logistic回歸模型的最佳遺傳模型選擇策略確定采用顯性遺傳模型來合并各研究的p值,并進行了亞組分析,最后利用漏斗圖,Egger線性回歸法和Begg秩相關(guān)法進行檢驗排除了發(fā)表偏倚.結(jié)果顯示,大部分人群目前尚無充分證據(jù)表明NPY基因多態(tài)性與酒精依賴癥之間存在顯著的關(guān)聯(lián)性.但是在亞組分析中發(fā)現(xiàn)個別人群(如芬蘭人)的SNP rs16139與酒精依賴癥具有相關(guān)性.本章對多個現(xiàn)有結(jié)果的Meta分析,從統(tǒng)計角度上增加了樣本量,提高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 特征選擇及其在生物信息處理中的應(yīng)用研究.pdf
- 并行計算在生物醫(yī)學(xué)中的應(yīng)用.pdf
- PCNN在生物醫(yī)學(xué)圖像處理中的應(yīng)用研究.pdf
- 動態(tài)盲源分離及其在生物醫(yī)學(xué)信號處理中的應(yīng)用研究.pdf
- sbo材料在生物醫(yī)學(xué)中的應(yīng)用
- 熵分析方法在生物信息處理中的應(yīng)用.pdf
- 分組檢測方法在生物醫(yī)學(xué)中的應(yīng)用.pdf
- 鉑納米簇的合成及其在生物醫(yī)學(xué)研究中的應(yīng)用.pdf
- 過采樣技術(shù)及其在生物醫(yī)學(xué)信號檢測中的應(yīng)用.pdf
- 非平穩(wěn)度量方法及其在生物醫(yī)學(xué)圖像與信號處理中的應(yīng)用.pdf
- 金納米棒的精確調(diào)控及其在生物醫(yī)學(xué)研究中的應(yīng)用.pdf
- 功能化碳材料的制備、表征及其在生物醫(yī)學(xué)中的應(yīng)用.pdf
- 納米磷酸鈣的制備及其在生物醫(yī)學(xué)中的應(yīng)用.pdf
- 基于偏微分方程的圖像處理方法及其在生物醫(yī)學(xué)中的應(yīng)用.pdf
- 混沌、分形及在生物醫(yī)學(xué)中的應(yīng)用.pdf
- 金納米顆粒生物探針的制備及其在生物醫(yī)學(xué)中的應(yīng)用.pdf
- 石墨烯衍生物的合成及其在生物醫(yī)學(xué)中的應(yīng)用研究.pdf
- 無機生物材料的制備及其在生物醫(yī)學(xué)領(lǐng)域中的應(yīng)用.pdf
- 若干生物醫(yī)學(xué)數(shù)據(jù)處理中的分類問題研究.pdf
- 拉曼光譜技術(shù)在生物醫(yī)學(xué)中的應(yīng)用研究.pdf
評論
0/150
提交評論