版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著人類基因組(測序)計(jì)劃(Humangenomeproject)的實(shí)現(xiàn)以及分子生物學(xué)相關(guān)學(xué)科的迅猛發(fā)展,越來越多的動植物、微生物基因組序列得以測定,基因序列數(shù)據(jù)正在以前所未有的速度迅速增長.與此同時(shí)綜合了分子生物學(xué),半導(dǎo)體微電子,激光,化學(xué)染料等領(lǐng)域的最新科學(xué)技術(shù)的基因芯片,也在以其無可比擬的信息量、高通量、快速、準(zhǔn)確地分析基因的能力,也在基因功能研究、臨床診斷及新藥開發(fā)等方面顯示了巨大的潛能.而生物信息學(xué)分析是大規(guī)?;蛐畔?序列信
2、息,表達(dá)信息)分析的主要方法.本文主要結(jié)果由兩部分組成: 第一部分是針對基因序列的快速多重比對算法及應(yīng)用. 論文的第一和第二章針對基因序列的多重序列的比對問題,根據(jù)序列突變與比對的”模代數(shù)”結(jié)構(gòu)理論[1],并在序列兩兩比對的基礎(chǔ)上,應(yīng)用系統(tǒng)聚類等方法,給出了同源多重序列的超級快速比對算法(簡稱SMA).該算法可適用于大規(guī)模(如m>500,n>10Kbp)的同源多重序列的比對計(jì)算,SMA的程序和測試數(shù)據(jù)我們已在網(wǎng)上公布
3、,并提供比對計(jì)算服務(wù).我們分別對83×30Kbp的SARS序列與706×10Kbp的HIV-1序列進(jìn)行比對,主頻3.0GPC機(jī)上完成多重比對的計(jì)算時(shí)間分別為21分鐘與34小時(shí),SMA算法在速度上對HMMER有明顯優(yōu)勢,而且根據(jù)相似比等各項(xiàng)優(yōu)化指標(biāo)測試,結(jié)果不差于HMMER. 多重序列在完成比對后,對序列的結(jié)構(gòu)分析是多重序列比對后的主要與關(guān)鍵問題.論文的第三章給出了利用突變網(wǎng)絡(luò)理論來研究多重比對后基因的突變分析.利用該理論和正交
4、化方法來研究基因突變,我們可以得到基因組多重序列比對的突變過程更清楚的描述.我們以SARS病毒基因組為例,說明它們的突變網(wǎng)絡(luò)系統(tǒng)模型與正交化運(yùn)算,繪制了SARS基因突變圖,并由此得到SARS病毒從早期傳播到爆發(fā)的基因突變過程. 第二部分是針對基因芯片表達(dá)數(shù)據(jù)的聚類算法和網(wǎng)絡(luò)調(diào)控分析. 第四章針對乳腺癌在轉(zhuǎn)移過程中的基因表達(dá)特征的聚類分析法分析,我們改進(jìn)了k-means聚類算法,給出了kr-means算法,使之具有自動
5、搜索聚類數(shù)的功能,并且有助于改善k-means算法的聚類結(jié)果陷入最小值的狀況.通過對平均聚類誤差指標(biāo)的比較,kr-means要明顯優(yōu)于k-means算法.本文所得到的結(jié)果可供乳腺癌診斷與病變分析參考,同時(shí)可以應(yīng)用于小型基因檢測芯片的制備,也可以用于構(gòu)建基因網(wǎng)絡(luò)調(diào)控圖. 第五章針對表達(dá)數(shù)據(jù)提取基因調(diào)控矩陣從而構(gòu)建基因網(wǎng)絡(luò)的問題,我們通過線性微分方程模型可以初步構(gòu)建基因網(wǎng)絡(luò),了解網(wǎng)絡(luò)結(jié)構(gòu),提取最顯著的信息.然而由于分子生物學(xué)的條件
6、限制或者數(shù)據(jù)來源的限制,導(dǎo)致實(shí)驗(yàn)數(shù)據(jù)不充分,使方程組無解.我們使用三次樣條方法,對26例臨床、病理資料完備的具有淋巴結(jié)轉(zhuǎn)移的乳腺癌基因表達(dá)數(shù)據(jù)進(jìn)行插值處理,使表達(dá)數(shù)據(jù)滿秩,從而使用最小二乘法解出加權(quán)矩陣,構(gòu)建初步的表達(dá)基因調(diào)控網(wǎng)絡(luò).通過對構(gòu)建的基因網(wǎng)絡(luò)的初步生物學(xué)和醫(yī)學(xué)分析表明:乳腺癌轉(zhuǎn)移的形成是由多基因異常引起多條傳導(dǎo)通路異常,致使細(xì)胞惡性轉(zhuǎn)化的結(jié)果,這與生物學(xué)上公認(rèn)的看法是相一致的.利用此線性模型方法對基因表達(dá)譜進(jìn)行分析具有一定可行
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基因芯片數(shù)據(jù)分析方法比較.pdf
- 基于注釋信息的基因芯片數(shù)據(jù)分析.pdf
- 基因芯片數(shù)據(jù)分析方法的比較研究.pdf
- 時(shí)間序列形式的基因芯片數(shù)據(jù)的聚類分析.pdf
- 用于基因芯片和質(zhì)譜數(shù)據(jù)分析的混合模型研究.pdf
- 41951.基因芯片數(shù)據(jù)和基因表達(dá)分析
- 食管基底細(xì)胞樣鱗癌的基因芯片數(shù)據(jù)分析.pdf
- 41822.基因芯片數(shù)據(jù)的三維數(shù)據(jù)分析模型探討
- 49063.基于數(shù)據(jù)挖掘聚類算法的基因芯片數(shù)據(jù)分析
- 乳腺癌基因芯片數(shù)據(jù)分析及方法學(xué)研究.pdf
- 基因芯片分析
- 基因芯片數(shù)據(jù)的統(tǒng)計(jì)分析.pdf
- 腫瘤基因芯片數(shù)據(jù)聚類分析算法研究.pdf
- 基因芯片數(shù)據(jù)統(tǒng)合分析方法的若干拓展.pdf
- 時(shí)空序列數(shù)據(jù)分析和建模.pdf
- 食源性致病菌多重PCR和基因芯片檢測方法的建立.pdf
- 宮頸癌基因芯片數(shù)據(jù)的差異表達(dá)和聚類分析實(shí)驗(yàn)
- 基因芯片數(shù)據(jù)薈萃—膠質(zhì)瘤預(yù)后分析
- 小鼠燒傷后免疫相關(guān)基因芯片數(shù)據(jù)分析及生物標(biāo)志物的初步篩選.pdf
- 利用子空間聚類算法分析基因芯片數(shù)據(jù).pdf
評論
0/150
提交評論