版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Shotgun技術(shù)是大規(guī)模蛋白質(zhì)鑒定的重要方法,能在一次實(shí)驗(yàn)中獲得大量的數(shù)據(jù),而這些數(shù)據(jù)的可靠性是蛋白鑒定的一個(gè)重要問(wèn)題。當(dāng)前關(guān)于鑒定結(jié)果質(zhì)量控制的研究主要集中在肽段水平上,而對(duì)于蛋白質(zhì)水平上的鑒定結(jié)果可靠性研究比較少,且這些研究中的評(píng)估方法所用的數(shù)據(jù)量都比較小,不足以說(shuō)明方法的有效性。 在對(duì)現(xiàn)有shotgun蛋白質(zhì)鑒定過(guò)程充分理解的基礎(chǔ)上,建立了一個(gè)半隨機(jī)抽樣模型模擬大量數(shù)據(jù)搜索后鑒定結(jié)果,以期用該模型評(píng)估蛋白質(zhì)概率計(jì)算過(guò)程中
2、可能涉及到的影響因素,同時(shí)評(píng)估現(xiàn)有的蛋白質(zhì)概率計(jì)算方法。 為了驗(yàn)證所建立的半隨機(jī)抽樣模型的可靠性,對(duì)一批標(biāo)準(zhǔn)蛋白質(zhì)數(shù)據(jù)進(jìn)行模擬,比較不同肽段數(shù)上的模擬的和真實(shí)的蛋白質(zhì)或肽段數(shù),發(fā)現(xiàn)兩種結(jié)果基本相似,證明了該模型能基本代表真實(shí)的蛋白質(zhì)鑒定過(guò)程。 基于一批人肝臟的數(shù)據(jù),利用半隨機(jī)抽樣模型模擬的34批數(shù)據(jù),對(duì)鑒定結(jié)果的數(shù)據(jù)量大小、搜索數(shù)據(jù)庫(kù)大小和去高豐度蛋白質(zhì)等影響蛋白質(zhì)概率計(jì)算的因素進(jìn)行了評(píng)估,發(fā)現(xiàn)隨著數(shù)據(jù)庫(kù)和數(shù)據(jù)量的增大蛋
3、白質(zhì)的總體陽(yáng)性率都會(huì)下降,而去除高豐度的蛋白質(zhì)在一定程度上能夠提高蛋白質(zhì)的真陽(yáng)性率。同時(shí),利用這些模擬數(shù)據(jù),對(duì)目前常用的4種蛋白質(zhì)概率計(jì)算方法進(jìn)行了評(píng)估,發(fā)現(xiàn)PROT_PROBE能較好地區(qū)分鑒定結(jié)果中假陽(yáng)性和真陽(yáng)性蛋白質(zhì);ProteinProphet計(jì)算的蛋白質(zhì)概率高于真實(shí)結(jié)果且區(qū)分度不佳;取雙肽段以上(≥2個(gè)非冗余肽段)蛋白質(zhì)的方法效果較好,但會(huì)受到數(shù)據(jù)庫(kù)和數(shù)據(jù)量大小的影響:HPPP所采用的泊松模型在一定程度上能較準(zhǔn)確地計(jì)算假陽(yáng)性蛋白
4、質(zhì)鑒定數(shù),但這種方法強(qiáng)烈依賴于單肽段的假陽(yáng)性率。因此,總體而言,現(xiàn)有的各種方法在部分解決蛋白質(zhì)水平質(zhì)量控制的同時(shí),都存在著各自的缺陷,至今尚無(wú)較成熟可靠的方法。 另外,隨著蛋白質(zhì)組學(xué)的發(fā)展,以及系統(tǒng)生物學(xué)研究的逐漸開(kāi)展,需要高通量地進(jìn)行蛋白質(zhì)的相對(duì)定量。我們?cè)谀壳八玫臒o(wú)標(biāo)記定量方法的基礎(chǔ)上,用EM算法進(jìn)行了方法的改進(jìn),并利用已有研究發(fā)表的數(shù)據(jù)進(jìn)行驗(yàn)證。結(jié)果表明,改進(jìn)后的質(zhì)譜數(shù)和蛋白質(zhì)豐度的相關(guān)性比改進(jìn)前有一定的提高。同時(shí),利用
5、這些數(shù)據(jù)對(duì)主要的幾種基于鑒定蛋白質(zhì)的質(zhì)譜數(shù)定量模型進(jìn)行比較,發(fā)現(xiàn)PAI模型最好,SpS模型次之,emPAI模型效果最差。 最后,本論文還進(jìn)行了一個(gè)實(shí)用軟件AutoMascot的開(kāi)發(fā)研究,該軟件能自動(dòng)批量提交圖譜數(shù)據(jù)進(jìn)行Mascot搜索。AutoMascot不僅包括了Mascot的web服務(wù)方式和MascotDaemon的常用功能,也增加了遠(yuǎn)程訪問(wèn)Mascot搜索引擎、批量提交數(shù)據(jù)文件或文件夾、多種搜索結(jié)果文件格式和輸出結(jié)果的展示
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 概率復(fù)習(xí)課件隨機(jī)抽樣
- 蛋白質(zhì)組表達(dá)譜基本生物信息學(xué)研究及全蛋白質(zhì)組等電點(diǎn)分布研究.pdf
- 基于質(zhì)譜技術(shù)的蛋白質(zhì)組學(xué)方法對(duì)食品蛋白質(zhì)糖基化的研究.pdf
- 蛋白質(zhì)結(jié)構(gòu)分析的計(jì)算方法研究.pdf
- 生物信息學(xué) 第十一章利用蛋白質(zhì)序列的預(yù)測(cè)方法
- 生物信息學(xué)方法研究蛋白質(zhì)相互作用.pdf
- 2447.蛋白質(zhì)羥基化的生物信息學(xué)方法研究
- 蛋白質(zhì)組學(xué)質(zhì)譜數(shù)據(jù)分析的新方法研究開(kāi)發(fā).pdf
- 基于半隨機(jī)抽樣非完備信息多人機(jī)器博弈.pdf
- 11.1隨機(jī)抽樣
- 簡(jiǎn)單隨機(jī)抽樣
- 基于串聯(lián)質(zhì)譜數(shù)據(jù)的蛋白質(zhì)-基因組學(xué)方法研究.pdf
- 30186.蛋白質(zhì)質(zhì)譜數(shù)據(jù)處理方法的研究
- 基于結(jié)構(gòu)生物信息學(xué)的蛋白質(zhì)設(shè)計(jì).pdf
- 43220.信息度量的蛋白質(zhì)序列、結(jié)構(gòu)、質(zhì)譜數(shù)據(jù)研究
- 蛋白質(zhì)可溶性預(yù)測(cè)的生物信息學(xué)模型及應(yīng)用.pdf
- 簡(jiǎn)單隨機(jī)抽樣的實(shí)驗(yàn)
- 隨機(jī)抽樣,教學(xué)設(shè)計(jì)
- 基于串聯(lián)質(zhì)譜的蛋白質(zhì)鑒定算法研究.pdf
- 原位蛋白質(zhì)質(zhì)譜的開(kāi)發(fā)和應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論