第四章--信息論與生物醫(yī)學(xué)1_第1頁(yè)
已閱讀1頁(yè),還剩29頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章 信息論與生物醫(yī)學(xué),生命體本身是一個(gè)人復(fù)雜的信息傳遞、加工、處理和控制的系統(tǒng)。理論上,信息論與生物學(xué)和醫(yī)學(xué)有著密切的關(guān)系。1950年就有人把信息學(xué)引入生命研究中,但當(dāng)時(shí)由于技術(shù)的限制,沒有引起人們的重視。近10-20年,人們對(duì)生命科學(xué)的研究達(dá)到細(xì)胞、亞細(xì)胞、分子和量子水平,尤其是在遺傳信息方面的研究取得重大成果,確立了信息理論在生物和醫(yī)學(xué)研究方面的作用和地位。本章簡(jiǎn)單地討論信息論與生物和醫(yī)學(xué)的關(guān)系。,脫氧核糖核酸(DNA

2、 )分子是遺傳的物質(zhì)基礎(chǔ),遺傳信息存儲(chǔ)在DNA結(jié)構(gòu)中。DNA是雙螺旋結(jié)構(gòu),是由一系列核苷酸繞某一長(zhǎng)中心軸形成的螺旋梯狀結(jié)構(gòu)。每個(gè)核苷酸所含的堿基不同。每個(gè)生命系統(tǒng)的DNA都是由四個(gè)堿基排列而成的堿基序列。不同堿基序列形成不同的DNA分子,形成不同放入生命機(jī)體。,4.1 DNA到蛋白質(zhì)的通訊系統(tǒng),從信息論的觀點(diǎn)看,DNA中的四種不同堿基相當(dāng)于將遺傳信息編譯成密碼的四個(gè)字母,即遺傳信息源中的四個(gè)字母。,,不同字母排列成核苷酸系列。D

3、NA中的堿基序列長(zhǎng)度非常長(zhǎng),故遺傳信息總共可能有的不同堿基序列總數(shù)是很大的。(幾萬(wàn)個(gè))再?gòu)纳飳W(xué)角度看,蛋白質(zhì)是生命的基本物質(zhì),它由20種不同的氨基酸以各種方式排列而成,而蛋白質(zhì)是安照DNA 傳遞出去的遺傳信息合成的。,問題:DNA分子中的堿基序列怎樣排列才能得到20種氨基酸合成的蛋白質(zhì)呢?要求:堿基集合的信息熵必須不小于氨基酸集合的信息熵。堿基:X表示,則H(X)=log4=2 bit氨基酸:Y表示,則H(Y)=log20=4

4、.32 bit顯然, H(X) H(Y),就滿足要求了。,人們提出了核苷酸三聯(lián)體的概念,即三個(gè)堿基編碼組成一個(gè)遺傳密碼?,F(xiàn)代科學(xué)實(shí)驗(yàn)證明:現(xiàn)確認(rèn)的三聯(lián)體共有64個(gè)(43=64),其中61個(gè)代表20種氨基酸的密碼,而其余三個(gè)代表終止密碼。下表顯示了該三聯(lián)體組合情況,其中用尿嘧啶(U)代替胸腺嘧啶(T)。,,過程 :DNA遺傳密碼由信使核糖核酸(mRNA)轉(zhuǎn)錄下來(lái),然后由轉(zhuǎn)運(yùn)核糖核酸(tRNA)把遺傳密碼轉(zhuǎn)譯成蛋白質(zhì)的氨基酸順序,合成

5、蛋白質(zhì)。中心法則: DNA→ mRNA → tRNA →蛋白質(zhì)將其看作是一個(gè)通訊系統(tǒng):輸入是DNA堿基序列,輸出是蛋白質(zhì)的氨基酸序列。稱之為DNA →蛋白質(zhì)的通訊系統(tǒng)。所有生命體都是由蛋白質(zhì)和核苷酸組成的,蛋白質(zhì)由20種氨基酸組成,核苷酸都包含堿基。由中心法則,整個(gè)通訊系統(tǒng)是嚴(yán)格不可逆的。通訊模型見下圖:,,首先研究輸入信源X3,是堿基信源X的三次擴(kuò)展信源。X的符號(hào)集合A={A,G,C,U}。有研究表明,

6、堿基序列中的堿基并非統(tǒng)計(jì)獨(dú)立,它們之間是有依賴關(guān)系的,可以證實(shí)它們滿足一階馬爾科夫鏈。所以,信源X是一個(gè)一階馬爾科夫信源。(時(shí)齊和遍歷的),而 是一階馬爾科夫鏈的轉(zhuǎn)移概率,其轉(zhuǎn)移矩陣如下:,時(shí)齊遍歷的一階馬爾科夫鏈滿足:,信源X3是一階馬爾科夫信源X的三次擴(kuò)展信源,所以X3也是一階馬爾科夫信源。X3的符號(hào)集其個(gè)數(shù)總共有64個(gè)。所以遺傳信道的輸入信源為,其次,觀察DNA→

7、蛋白質(zhì)的通訊信道,當(dāng)遺傳信道為[X3,P(y|x1x2x3),Y],Y的符號(hào)集B={B1,B2,……,B21}共21個(gè)符合,20個(gè)代表20種不同的氨基酸, B21代表終止密碼。此信道是平穩(wěn)無(wú)記憶信道,信道的傳遞概率為P(y|x1x2x3)。如B1代表丙氨酸,則 P (B1|GUC)= P (B1|GCC)= P (B1|GCA)= P (B1|GCG)=1,其余的取值P(y|x1x2x3)=0。根據(jù)信道傳遞特性可求得輸出符號(hào)Y的

8、概率分布為:,所以信道容量:,信道的傳遞概率已知,就可以求出信道容量C。信道的最大信息傳輸率C=log21=4.392比特,但這要求氨基酸是統(tǒng)計(jì)獨(dú)立分布的,然而這種要求是不存在的。所以,上式C是對(duì)所有可能存在的情況求上界。,在生命的世代相傳中,絕大多數(shù)保持其遺傳特性,說明遺傳信息的傳遞是可靠準(zhǔn)確的。但也存在變異(遺傳信息傳遞過程出錯(cuò)引起的)。所以,DNA →蛋白質(zhì)的通訊系統(tǒng)不是完全理想的無(wú)噪信道(應(yīng)該是有噪信道),將其看作兩個(gè)信道

9、串接而成:,由于變異引起的密碼到密碼的傳輸概率,仍表示密碼到氨基酸的對(duì)應(yīng)關(guān)系,所以密碼到蛋白質(zhì)的信道為[X3,P*(y|x1x2x3),Y],其傳遞概率為:,此時(shí)蛋白質(zhì)Bj的概率為:,生命機(jī)體在遺傳信息傳遞的過程中有一定的抗干擾能力。從信息學(xué)角度看,增加信源的剩余度可以提高信道的抗干擾能力。所以,我們可以斷定DNA堿基序列不但存儲(chǔ)遺傳密碼,指導(dǎo)蛋白質(zhì)合成;而且還存儲(chǔ)較為復(fù)雜的“遺傳語(yǔ)言”,控制遺傳正確進(jìn)行。即DNA的堿基序列是一種有

10、依賴的序列。,為了分析堿基序列的剩余度,Gatlin引進(jìn)了兩個(gè)偏離指標(biāo):一階偏離指標(biāo)D1,表示與等概率分布信源的偏離;二階偏離指標(biāo)D2,表示與統(tǒng)計(jì)獨(dú)立分布信源的偏離;,實(shí)際堿基信源的熵,當(dāng)堿基序列是一階馬爾科夫信源時(shí),有,可得信源剩余度,D1+D2稱為信息密度,是信源最大熵與信源信息熵之間的差值;可以用它來(lái)衡量堿基序列的約束程度和“遺傳語(yǔ)言”的復(fù)雜程度。,實(shí)驗(yàn)表明:脊椎動(dòng)物的偏離指標(biāo)D2一般高于低級(jí)生物的D2。而脊椎動(dòng)物的“遺傳語(yǔ)言

11、”結(jié)構(gòu)有較高的剩余度時(shí),主要是保持D1增加D2;相反低級(jí)動(dòng)物主要是增加D1。所以,可以用D2作為區(qū)分脊椎動(dòng)物和其他低級(jí)動(dòng)物的生物體指標(biāo)。故此,二階偏離指標(biāo)也稱“進(jìn)化指標(biāo)”。,信息熵是系統(tǒng)紊亂程度的測(cè)度。如果一個(gè)系統(tǒng)很隨機(jī)、很混亂、無(wú)秩序,則此系統(tǒng)的信息熵就很大;反之,信息熵就很小。把信息熵引伸為描述事物集合中相互對(duì)立性質(zhì)的度量(無(wú)序與有序、隨機(jī)性與確定性、雜亂與規(guī)則等),可以把信息熵的概念用于醫(yī)學(xué)研究中。一個(gè)生命體,可以看做是由

12、相互聯(lián)系、相互作用的各個(gè)部分組成的復(fù)雜系統(tǒng);其任何一個(gè)部分都是以一定的組織性(有序性)和多樣性(復(fù)雜性)處于一定的穩(wěn)定狀態(tài),并且個(gè)部分之間相互作用、相互調(diào)節(jié),以保持系統(tǒng)穩(wěn)定。,4.2 醫(yī)學(xué)中的信息分析,任何系統(tǒng)都相應(yīng)有一個(gè)描述它穩(wěn)定的多樣性與組織性的信息熵值。當(dāng)系統(tǒng)或組織發(fā)生病變或異常時(shí),系統(tǒng)的狀態(tài)將發(fā)生變化,信息熵將增加或減少,我們可以判斷系統(tǒng)的變化是趨于惡化,還是好轉(zhuǎn)??梢?,信息熵能對(duì)機(jī)體中系統(tǒng)狀態(tài)作出定量描述,所以信息熵的概念在

13、醫(yī)學(xué)研究中具有重要的作用。,根據(jù)以往的實(shí)驗(yàn)數(shù)據(jù),可以對(duì)有機(jī)體中各組織、結(jié)構(gòu)或系統(tǒng)進(jìn)行抽象,建立一個(gè)近似的信息概率模型。將有機(jī)體中各組織、結(jié)構(gòu)或系統(tǒng)抽象成一個(gè)完備的集合空間X,將有機(jī)體中各組織、結(jié)構(gòu)或系統(tǒng)中各組成部分看成為集合X的元素xi,而所占的百分比作為元素xi出現(xiàn)的概率p (xi)。抽象一個(gè)完備的概率空間:,可以用信息熵公式來(lái)表征這些組織、結(jié)構(gòu)和系統(tǒng)的有序性和組織性。,例如:臨床醫(yī)學(xué)研究水份在健康男子體內(nèi)的分布和在心臟病男子體內(nèi)

14、的分布情況。實(shí)驗(yàn)數(shù)據(jù)見下表:,為了形成可供比較的概率空間的統(tǒng)計(jì)分布,我們將三種人體內(nèi)水的各自總含量設(shè)為1,求出不同組織內(nèi)水相對(duì)于總含量的百分比,結(jié)果見下表:,根據(jù)上表得三個(gè)概率空間模型,可以求出它們各自的信息熵值,形成下表:從上表看出,與健康人的水分布的熵相比,有心臟病的病人熵值增加,在浮腫的情況下熵值更高。,從醫(yī)學(xué)的觀點(diǎn)看,任何系統(tǒng)的生理狀態(tài)最惡化的情況,是系統(tǒng)最混亂、最無(wú)序、最不確定的情況,即系統(tǒng)的熵達(dá)到了極大值的狀態(tài)。因此,分

15、析一個(gè)信息體系的熵值變化所反映的疾病嚴(yán)重程度時(shí),必須考慮熵值H與極大熵值Hmax之間的相對(duì)關(guān)系。引入相對(duì)熵和剩余度的概念,相對(duì)熵描述系統(tǒng)內(nèi)部的無(wú)序性、無(wú)組織性和不確定性的程度;剩余度反映系統(tǒng)現(xiàn)存的有序性或有組織性的程度。,利用機(jī)體中某些“信息系統(tǒng)”的信息指標(biāo)(熵、相對(duì)熵、剩余度等),不僅可以對(duì)系統(tǒng)狀態(tài)變化方向作出定性的判斷,而且還能對(duì)系統(tǒng)狀態(tài)惡化的程度作出定量描述,這在臨床診斷與治療方面具有很重要的意義。注意!在處理實(shí)驗(yàn)數(shù)據(jù)時(shí),不能

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論