版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、生物信息學復習題生物信息學復習題一、名詞解釋生物信息學二級數(shù)據(jù)庫FASTA序列格式genbank序列格式Entrez,BLAST,查詢序列(query),打分矩陣(scingmatrix),空位(gap),空位罰分,E值低復雜度區(qū)域,點矩陣(dotmatrix),多序列比對,分子鐘,系統(tǒng)發(fā)育(phylogeny),進化樹的二歧分叉結構,直系同源,旁系同源,外類群,有根樹,除權配對算法(UPGMA),鄰接法構樹,最大簡約法構樹,最大似然法
2、構樹,一致樹(consensustree),bootstrap,開放閱讀框(F),密碼子偏性(codonbias),基因預測的從頭分析法,結構域(domain),超家族,模體(motif),序列表譜(profile),PAM矩陣,BLOSUM,PSIBLAST,RefSeq,PDB數(shù)據(jù)庫,GenPept,折疊子,TrEMBL,MMDB,SCOP,PROSITE,GeneOntologyConstium,表譜(profile)。二、問答題
3、1)生物信息學與計算生物學有什么區(qū)別與聯(lián)系?2)試述生物信息學研究的基本方法。3)試述生物學與生物信息學的相互關系。4)美國國家生物技術信息中心(NCBI)的主要工作是什么?請列舉3個以上NCBI維護的數(shù)據(jù)庫。5)序列的相似性與同源性有什么區(qū)別與聯(lián)系?6)BLAST套件的blastn、blastp、blastx、tblastn和tblastx子工具的用途什么?7)簡述BLAST搜索的算法。8)什么是物種的標記序列?9)什么是多序列比對過
4、程的三個步驟?10)簡述構建進化樹的步驟。11)簡述除權配對法(UPGMA)的算法思想。12)簡述鄰接法(NJ)的算法思想。13)簡述最大簡約法(MP)的算法思想。14)簡述最大似然法(ML)的算法思想。15)UPGMA構樹法不精確的原因是什么?16)在MEGA2軟件中,提供了多種堿基替換距離模型,試列舉其中2種,解釋其含義。17)試述DNA序列分析的流程及代表性分析工具。18)如何用BLAST發(fā)現(xiàn)新基因?19)試述SCOP蛋白質分類方
5、案。20)試述SWISSPROT中的數(shù)據(jù)來源。21)TrEMBL哪兩個部分?22)試述PSIBLAST搜索的5個步驟。三、操作與計算題1)如何獲取訪問號為U49845的genbank文件?解釋如下genbank文件的LOCUS行提供的信息:LOCUSSCU498455028bpDNAlinearPLN21JUN1999列與數(shù)據(jù)庫中的每個序列做相似性比較。P94查詢序列(查詢序列(queryquerysequencesequence):也
6、稱被檢索序列,用來在數(shù)據(jù)庫中檢索并進行相似性比較的序列。P98,第1段。打分矩陣(打分矩陣(scingscingmatrixmatrix):):在相似性檢索中對序列兩兩比對的質量評估方法。包括基于理論(如考慮核酸和氨基酸之間的類似性)和實際進化距離(如PAM)兩類方法。P29,第2段??瘴唬瘴唬╣apgap):):在序列比對時,由于序列長度不同,需要插入一個或幾個位點以取得最佳比對結果,這樣在其中一序列上產(chǎn)生中斷現(xiàn)象,這些中斷的位點稱
7、為空位。P29,第2段。空位罰分空位罰分:空位罰分是為了補償插入和缺失對序列相似性的影響,序列中的空位的引入不代表真正的進化事件,所以要對其進行罰分,空位罰分的多少直接影響對比的結果。P37,倒數(shù)第2段。E值:值:衡量序列之間相似性是否顯著的期望值。E值大小說明了可以找到與查詢序列(query)相匹配的隨機或無關序列的概率,E值越接近零,越不可能找到其他匹配序列,E值越小意味著序列的相似性偶然發(fā)生的機會越小,也即相似性越能反映真實的生物
8、學意義。P95低復雜度區(qū)域:低復雜度區(qū)域:BLAST搜索的過濾選項。指序列中包含的重復度高的區(qū)域,如poly(A)。P100,第一段。點矩陣(點矩陣(dotdotmatrixmatrix):構建一個二維矩陣,其X軸是一條序列,Y軸是另一個序列,然后在2個序列相同堿基的對應位置(x,y)加點,如果兩條序列完全相同則會形成一條主對角線,如果兩條序列相似則會出現(xiàn)一條或者幾條直線;如果完全沒有相似性則不能連成直線。P3941。多序列比對:多序列
9、比對:通過序列的相似性檢索得到許多相似性序列,將這些序列做一個總體的比對,以觀察它們在結構上的異同,來回答大量的生物學問題。P48,需要概括。分子鐘:分子鐘:認為分子進化速率是恒定的或者幾乎恒定的假說,從而可以通過分子進化推斷出物種起源的時間。P112113系統(tǒng)發(fā)育分析:系統(tǒng)發(fā)育分析:通過一組相關的基因或者蛋白質的多序列比對或其他性狀,可以研究推斷不同物種或基因之間的進化關系。P112,第一段。進化樹的二歧分叉結構:進化樹的二歧分叉結構
10、:指在進化樹上任何一個分支節(jié)點,一個父分支都只能被分成兩個子分支。P113,最后一段。系統(tǒng)發(fā)育圖:系統(tǒng)發(fā)育圖:P114直系同源:直系同源:指由于物種形成事件來自一個共同祖先的不同物種中的同源序列,具有相似或不同的功能。P28,P146旁系(并系)同源:旁系(并系)同源:指同一個物種中具有共同祖先,通過基因重復產(chǎn)生的一組基因,這些基因在功能上的可能發(fā)生了改變。P28,P147外類群:外類群:是進化樹中處于一組被分析物種之外的,具有相近親緣
11、關系的物種。P120有根樹:有根樹:能夠確定所有分析物種的共同祖先的進化樹。P113除權配對算法(除權配對算法(UPGMAUPGMA):):最初,每個序列歸為一類,然后找到距離最近的兩類將其歸為一類,定義為一個節(jié)點,重復這個過程,直到所有的聚類被加入,最終產(chǎn)生樹根。P119鄰接法(鄰接法(neighbjoiningneighbjoiningmethodmethod):是一種不僅僅計算兩兩比對距離,還對整個樹的長度進行最小化,從而對樹的拓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論