

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、目的: 1、為了更好地對(duì)瘧原蟲蛋白家族進(jìn)行比較基因組學(xué)和功能基因組學(xué)方面的研究,構(gòu)建瘧原蟲蛋白家族數(shù)據(jù)庫; 2、開發(fā)一個(gè)功能齊全、高度整合的生物信息學(xué)分析平臺(tái),為瘧疾研究及相關(guān)科研工作者提供良好的數(shù)據(jù)分析工具和平臺(tái)。 方法: 1、對(duì)六個(gè)現(xiàn)有的瘧原蟲基因組蛋白序列數(shù)據(jù)進(jìn)行All-against-All BLAST搜索,再用TribeMCL軟件包中Mclblastline程序進(jìn)行蛋白家族聚類,再用PERL程序
2、提取蛋白家族信息以用于蛋白家族數(shù)據(jù)庫構(gòu)建; 2、用瘧原蟲蛋白序列對(duì)PDB、Swiss-Prot和RefSeq三個(gè)數(shù)據(jù)庫進(jìn)行BLAST同源搜索,所得結(jié)果分別用PERL程序進(jìn)行提取,以用于構(gòu)建數(shù)據(jù)庫; 3、用HMMER軟件包中的Hmmpfam程序?qū)fam數(shù)據(jù)庫進(jìn)行蛋白結(jié)構(gòu)域搜索,輸出結(jié)果用PERL程序提取,以用于數(shù)據(jù)庫構(gòu)建; 4、用BLAST序列相似性程序?qū)EGG Ortholog(KO)數(shù)據(jù)庫進(jìn)行搜索,用PER
3、L程序提取輸出結(jié)果,然后用統(tǒng)計(jì)學(xué)方法推測(cè)各家族的功能,并對(duì)其進(jìn)行注釋; 5、以Linux為服務(wù)器,MySQL為數(shù)據(jù)庫管理軟件,根據(jù)以上各步所得數(shù)據(jù)設(shè)計(jì)數(shù)據(jù)表,采用BigDump和phpMyAdmin等軟件把數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,構(gòu)建成蛋白家族數(shù)據(jù)庫; 6、以Apache為網(wǎng)絡(luò)服務(wù)器,使用Dreamweaver、UltraEdit、Photoshop、Activeperl等軟件,以PHP、HTML、JavaScript、Ajax
4、、PERL等語言進(jìn)行編程構(gòu)建生物信息學(xué)數(shù)據(jù)分析平臺(tái)。 結(jié)果: 1、六個(gè)瘧原蟲基因組總共含有40,273條蛋白基因序列,同源聚類分析得到了8,089個(gè)蛋白家族,總共有50種大小的家族,其中最大家族有1,107個(gè)成員,最小的家族只有1個(gè)成員; 2、按家族大小來分,家族個(gè)數(shù)最多是1個(gè)成員的家族,有3,203個(gè),其次是6個(gè)成員的,有1,094個(gè),家族大多集中有12個(gè)成員以下家族大小段,17個(gè)成員以上的家族比較稀少;
5、 3、按物種基因分布看,P. berghei、P. chabaudi、P. falciparum三個(gè)物種在各種大小家族中分布比較均勻;P. knowlesi和P. vivax兩個(gè)物種在小于12個(gè)成員的家族中占優(yōu)勢(shì);而P.yoelii在多于12個(gè)成員的家族中相對(duì)占優(yōu)勢(shì); 4、家族大小分別為98和178的兩個(gè)家族中的所有成員都來自P. falciparum,其中可能存在物種特意性的基因擴(kuò)增; 5、構(gòu)建了蛋白家族數(shù)據(jù)庫Pla
6、smoGF,并以其為基礎(chǔ)構(gòu)建了功能齊全的生物信息學(xué)分析平臺(tái)(http://www.bioinformatics.zj.cn/pgf/)。該平臺(tái)包含了文本和BLAST數(shù)據(jù)庫搜索、多序列比對(duì)、進(jìn)化樹構(gòu)建等數(shù)據(jù)操作板塊,并開發(fā)了數(shù)據(jù)工作集Work-Set作為用戶數(shù)據(jù)存儲(chǔ)的容器,并作為各步數(shù)據(jù)操作的紐帶。 結(jié)論: 1、成功構(gòu)建了國(guó)際上第一個(gè)瘧原蟲蛋白家族數(shù)據(jù)庫PlasmoGF,經(jīng)人工評(píng)估,其數(shù)據(jù)比較可靠,可作為瘧疾研究工作者研究
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- microRNA生物標(biāo)志物的數(shù)據(jù)庫構(gòu)建及生物信息學(xué)分析.pdf
- 生物信息學(xué)數(shù)據(jù)庫及其利用方法
- 水稻AGO基因家族的生物信息學(xué)分析.pdf
- 肺癌相關(guān)MAGE家族的生物信息學(xué)分析.pdf
- 地黃RAPD-SCAR標(biāo)記及其生物信息學(xué)分析.pdf
- 神經(jīng)退化疾病相關(guān)氨基酸變異數(shù)據(jù)庫構(gòu)建及生物信息學(xué)分析.pdf
- 多能干細(xì)胞誘導(dǎo)因子及其家族蛋白的生物信息學(xué)分析.pdf
- 水稻Rho家族OsRacD及其5種潛在互作蛋白的生物信息學(xué)分析.pdf
- 楊樹富含亮氨酸受體蛋白激酶家族生物信息學(xué)分析.pdf
- 煙草碳酸酐酶基因的克隆及其生物信息學(xué)分析.pdf
- LncRNA-基因調(diào)控關(guān)系的生物信息學(xué)數(shù)據(jù)庫構(gòu)建及分析預(yù)測(cè).pdf
- 番茄DWD家族的生物信息學(xué)分析及生化特征.pdf
- 細(xì)胞周期蛋白生物信息學(xué)分析.pdf
- 耐熱木聚糖酶的體外分子進(jìn)化及其生物信息學(xué)分析.pdf
- 蛋白質(zhì)泛素化的生物信息學(xué)分析.pdf
- myc基因的生物信息學(xué)分析
- 2生物信息學(xué)-生物信息數(shù)據(jù)庫完美版
- 桑樹DREB基因家族生物信息學(xué)分析及功能研究.pdf
- 基于Web頁面的生物信息學(xué)分析平臺(tái)的建立及其應(yīng)用.pdf
- 棉花纖維發(fā)育相關(guān)基因時(shí)空表達(dá)及其生物信息學(xué)分析.pdf
評(píng)論
0/150
提交評(píng)論