版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、生物信息學中的不確定性和分類問題,鄒 權 (博士、副教授)廈門大學數(shù)據(jù)挖掘?qū)嶒炇襤ttp://datamining.xmu.edu.cn/~zq,提綱,生物信息學和機器學習的關系一些生物信息學中的分類問題microRNA識別蛋白質(zhì)功能預測基因表達數(shù)據(jù)分析全基因組關聯(lián)分析總結,生物信息學,人類基因組計劃數(shù)據(jù)存儲---數(shù)據(jù)庫數(shù)據(jù)分析---數(shù)據(jù)挖掘Olson M V. Human genetics: Dr Watso
2、n's base pairs[J]. Nature, 2008, 452(7189): 819-820.HapMap計劃 /1000 Genome計劃大數(shù)據(jù),生物信息學中的我國計算機學者,算法階段(1990-2000)朱大銘、姜濤、卜東波標注階段(2000-2008)王曉龍、朱小燕等系統(tǒng)分析階段(2008-2013)李衍達、張學工等大規(guī)模數(shù)據(jù)處理階段(2010-now)華大基因,一些生物信息學中的分類問題,m
3、icroRNA識別蛋白質(zhì)功能預測基因表達數(shù)據(jù)分析全基因組關聯(lián)分析,microRNA識別,2006年諾貝爾獎---RNA干擾機制CCCCUCUAUUCACAAUUGUUUGGAACUCAGUUUUGUGAUUAUUCUAUCAUUGCCAGGGAGUUUGUGUGGUUGCAUCAGGGG,microRNA分類相關論文,Chenghai Xue, Fei Li, Tao He, Guo-Ping Liu, Yanda Li,
4、Xuegong Zhang. Classification of real and pseudo microRNA precursors using local structure-sequence features and support vector machine. BMC Bioinformatics. 2005.6:310 (google scholar引用271次,截至2014.8.2)Peng Jiang, Haona
5、n Wu, Wenkai Wang, Wei Ma, Xiao Sun, Zuhong Lu. MiPred: classification of real and pseudo microRNA precursors using random forest prediction model with combined features. Nucleic Acids Research. 2007,35:W339-W344 (google
6、 scholar引用239次,截至2014.8.2)Leyi Wei, Minghong Liao, Yue Gao, Rongrong Ji, Zengyou He, Quan Zou. Improved and promising identification of human microRNAs by incorporating a high-quality negative Set. IEEE/ACM Transaction
7、s on Computational Biology and Bioinformatics. 2014, 11(1):192-201,microRNA與疾病的關系,圖挖掘相似度度量、不確定性參考文獻Jiang Q, Hao Y, Wang G, et al. Prioritization of disease microRNAs through a human phenome-microRNAome network[J].
8、BMC Systems Biology, 2010, 4(Suppl 1): S2.Xuan P, Han K, Guo M, et al. Prediction of microRNAs associated with human diseases based on weighted k most similar neighbors[J]. PloS one, 2013, 8(8): e70204.,一些生物信息學中的分類問題,mi
9、croRNA識別蛋白質(zhì)功能預測基因表達數(shù)據(jù)分析全基因組關聯(lián)分析,蛋白質(zhì)功能預測,問題輸入:蛋白質(zhì)序列,進行聚類、分類特殊蛋白識別---不平衡分類亞細胞定位-----多類分類酶和多功能酶---多類,少量多標記功能預測------多示例、多標記二級結構、結構域-----標注、HMM難點特征提取分類器,一些生物信息學中的分類問題,microRNA識別蛋白質(zhì)功能預測基因表達數(shù)據(jù)分析全基因組關聯(lián)分析,基因表達數(shù)據(jù)分析
10、,,14/57,,聚類,,分類,雙聚類,一些生物信息學中的分類問題,microRNA識別蛋白質(zhì)功能預測基因表達數(shù)據(jù)分析全基因組關聯(lián)分析,全基因組關聯(lián)分析(GWAS),GWAS,難點高維小樣本SNP-SNP相互作用結果的可解釋性前景疾病的遺傳機理遺傳育種(作物、養(yǎng)殖),總結,機器學習在尋找生物信息學應用---分類、聚類、降維、不確定性結果的解釋和驗證生物實驗驗證文獻驗證生物信息學在尋找機器學習數(shù)據(jù)量在增大統(tǒng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 疫霉菌基因組與轉(zhuǎn)錄組的生物信息學研究.pdf
- 溶血不動桿菌的全基因組測序及生物信息學分析.pdf
- 水稻基因組結構變異的生物信息學分析.pdf
- 副粘病毒Tianjin株全基因組測序及生物信息學分析.pdf
- 2株溶血不動桿菌全基因組測序及生物信息學分析.pdf
- 56941.生物信息學在基因組學研究中的應用
- 43495.耐輻射球菌基因組的生物信息學研究
- 115株SARS冠狀病毒全基因組序列的生物信息學分析.pdf
- 生物信息學序列分析
- 生物信息學
- Pannonibacter phragmitetus 31801的基因組測序和生物信息學分析.pdf
- 生物信息學課程信息
- 藍藻基因組結構、功能與調(diào)控模式的生物信息學研究.pdf
- 高原肺水腫全基因組甲基化差異功能的生物信息學分析.pdf
- 阿特拉津降解菌arthrobactersp.dns10全基因組生物信息學分析
- 生物信息學課件
- 生物信息學導論
- 生物信息學教案
- 水稻和擬南芥基因組bHLH轉(zhuǎn)錄因子超家族生物信息學研究.pdf
- 生物信息學概論
評論
0/150
提交評論