2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩65頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著環(huán)境微生物研究的發(fā)展和高通量測序技術(shù)的出現(xiàn),微生物的研究迎來了宏基因組學(xué)的技術(shù)研究時(shí)代。突破傳統(tǒng)微生物學(xué)研究方法的瓶頸,宏基因組學(xué)直接研究環(huán)境微生物的基因組。近年來大量研究表明,人體的多種疾病與人體類各個(gè)器官的微生物群落是息息相關(guān)的,而宏基因組樣本分類方法成為研究微生物群落與宿主或環(huán)境關(guān)系的重要研究手段:通過提取宏基因組樣本的特征,結(jié)合分類算法鑒定樣本類別。目前宏基因組樣本分類方法大多使用微生物的全基因組序列,本文深入研究了基于16

2、S rRNA基因序列微生物群落分析方法,建立了一套基于16S rRNA基因序列的樣本分類流程,并將分析與分類方法應(yīng)用到小鼠及人類腸道微生物群落的研究中。
  樣本分類的重要前提是對(duì)不同狀態(tài)的樣本提取一種具有顯著差異性的特征。本文深入研究不同樣本的16S rRNA基因序列,通過模擬數(shù)據(jù)分析驗(yàn)證群落結(jié)構(gòu)作為樣本特征的可行性。分析結(jié)果表明,物種豐度包含了樣本中微生物的物種數(shù)目、比例,是最基本的樣本特征;α多樣性提煉了樣本的物種豐度信息,

3、降低了樣本特征維數(shù),是一種較為重要的樣本特征;β多樣性特征同時(shí)結(jié)合了群落獨(dú)立進(jìn)化信息(UniFrac)和物種豐度,是較為理想的樣本特征。
  結(jié)合隨機(jī)森林算法和三種有效的樣本特征,我們建立了一套基于16S rRNA基因序列的樣本分類流程。通過對(duì)不同參數(shù)的模擬數(shù)據(jù)集的分類實(shí)驗(yàn),我們比較了樣本類別數(shù)、特征的類間方差、類內(nèi)方差以及系統(tǒng)發(fā)育樹高度對(duì)分類流程準(zhǔn)確率的影響。最終的分類結(jié)果表明,在樣本特征類間差異不明顯,即類內(nèi)特征方差大、類間特

4、征方差小的情況下本文所建立的分類流程分類準(zhǔn)確率比其他分類方法高;在樣本類別數(shù)增加、群落進(jìn)化關(guān)系復(fù)雜等情況下,本文所建立的流程較其他分類方法表現(xiàn)更好。實(shí)驗(yàn)結(jié)果表明我們?cè)O(shè)計(jì)的宏基因組樣本分類流程具有良好的分類性能,能夠準(zhǔn)確鑒別基于16S rRNA序列的宏基因組樣本。
  將所建立的基于16S rRNA基因序列的宏基因組樣本分類分析流程分別應(yīng)用于小鼠和人類腸道微生物樣本。實(shí)驗(yàn)結(jié)果表明我們發(fā)展的分類流程對(duì)與環(huán)境相關(guān)的小鼠腸道微生物樣本分類

5、準(zhǔn)確率高于88%,能夠準(zhǔn)確地對(duì)小鼠腸道宏基因組樣本中微生物群落所生存的環(huán)境類別進(jìn)行區(qū)分。同時(shí)分類結(jié)果表明:特征向量的類間方差小的兩組樣本錯(cuò)分而導(dǎo)致的樣本分類錯(cuò)誤較多;不同環(huán)境下小鼠腸道微生物樣本的群落獨(dú)立進(jìn)化信息(UniFrac)對(duì)樣本差異性的體現(xiàn)不如物種進(jìn)化關(guān)系。對(duì)于與肥胖相關(guān)的人類腸道微生物樣本,我們發(fā)展的流程的分類準(zhǔn)確率達(dá)到75%以上,基本能夠鑒定人類腸道宏基因組樣本中微生物群落的宿主的體型類別。同時(shí)分類結(jié)果還表明:過重組和肥胖組

6、兩類樣本組的特征向量的類間方差低而經(jīng)常導(dǎo)致樣本錯(cuò)分;肥胖相關(guān)人類腸道微生物樣本的群落獨(dú)立進(jìn)化信息作為樣本特征的分類性能要優(yōu)于微生物物種進(jìn)化信息,我們認(rèn)為群落獨(dú)立進(jìn)化信息更能體現(xiàn)有著不同身體質(zhì)量指數(shù)人群的腸道微生物差異。綜合兩組數(shù)據(jù)實(shí)驗(yàn)結(jié)論如下:首先,樣本特征的類間方差對(duì)分類準(zhǔn)確率影響較大,類間方差較小的兩組樣本容易錯(cuò)分而導(dǎo)致分類準(zhǔn)確率降低;其次,我們?cè)O(shè)計(jì)的流程不論基于哪一種樣本特征,分類性能都要比基于支持向量機(jī)的分類流程出色;最后,對(duì)于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論