時(shí)滯隨機(jī)系統(tǒng)的最優(yōu)控制問(wèn)題及應(yīng)用.pdf_第1頁(yè)
已閱讀1頁(yè),還剩119頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、近些年來(lái),人們逐漸認(rèn)識(shí)到現(xiàn)實(shí)世界中的一些問(wèn)題的發(fā)展不僅依賴于當(dāng)前的狀態(tài),而且還依賴于其過(guò)去的歷史.這類問(wèn)題應(yīng)該用狀態(tài)對(duì)過(guò)去有依賴的系統(tǒng)方程來(lái)刻畫,我們稱之為隨機(jī)微分延遲方程(簡(jiǎn)記為SDDE).由于其在工程、生命科學(xué)及金融等領(lǐng)域的廣泛應(yīng)用,SDDE成為現(xiàn)代研究的熱點(diǎn)問(wèn)題.本文將致力于在金融及其他領(lǐng)域中常見(jiàn)的受控的延遲系統(tǒng)的研究.
   對(duì)于一個(gè)系統(tǒng)而言,當(dāng)觀測(cè)與調(diào)控之間有時(shí)間差或者控制有滯后性時(shí)就會(huì)出現(xiàn)系統(tǒng)延遲,我們稱之為時(shí)滯系統(tǒng)

2、.2000年,()ksendal和Sulem[47]研究了一類財(cái)富方程為SDDE的最優(yōu)控制問(wèn)題.在他們的模型中,不僅當(dāng)前值X(t)而且X(t-δ)及過(guò)去值在某種意義下的平均值都會(huì)影響t時(shí)刻財(cái)富的增長(zhǎng).由于所選模型的特殊性,他們能夠?qū)o(wú)窮維問(wèn)題化為有限維問(wèn)題來(lái)處理,得到了問(wèn)題的最大值原理,并將結(jié)果應(yīng)用于金融中的相關(guān)問(wèn)題.但是他們的條件,相對(duì)來(lái)說(shuō),是比較強(qiáng)的.
   在實(shí)際當(dāng)中,觀測(cè)過(guò)去的數(shù)據(jù)可能是離散的有限個(gè)點(diǎn),因此我們首先考慮當(dāng)

3、前發(fā)展依賴于以往有限個(gè)點(diǎn)的系統(tǒng),而且控制也具有延遲性,這些延遲還可以是時(shí)變的.
   我們研究一類時(shí)滯系統(tǒng)的最優(yōu)控制問(wèn)題,其中狀態(tài)及控制變量都有延遲.在相對(duì)比較一般的條件下,我們得到了這類受控的時(shí)滯系統(tǒng)的最大值原理.作為應(yīng)用,我們用得到的結(jié)果處理了經(jīng)濟(jì)當(dāng)中一類帶有時(shí)滯的生產(chǎn)消費(fèi)選擇問(wèn)題,并得到了問(wèn)題的顯示解.借助于數(shù)值計(jì)算,我們給出了不同的延遲時(shí)間對(duì)結(jié)果的影響情況.我們的主要?jiǎng)?chuàng)新在于引入新型的倒向隨機(jī)微分方程(簡(jiǎn)稱BSDE)一超

4、前BSDE(參見(jiàn)Peng,Yang[55])作為伴隨方程來(lái)處理時(shí)滯最優(yōu)控制問(wèn)題。據(jù)我們所知,這是首次采用這種方法來(lái)研究時(shí)滯控制系統(tǒng)的最優(yōu)控制問(wèn)題.
   我們也考慮了具有時(shí)變延遲的正倒向系統(tǒng),即用遞歸效用函數(shù)代替一般的效用函數(shù)且延遲δ不在是常數(shù),而是時(shí)間t的函數(shù).這部分結(jié)果推廣了1995年Xu[65]中的結(jié)論.
   Hu,Peng[29],Peng,Wu[54]和Yong[69]等相繼研究了完全耦合的正倒向隨機(jī)微分方程

5、(簡(jiǎn)稱FBSDE).在處理線性二次(LQ)問(wèn)題(參見(jiàn)[62;67])和金融中的大戶投資問(wèn)題(參見(jiàn)Cvitanic和Ma[15])時(shí)都會(huì)遇到這類方程.而我們?cè)谔剿鲿r(shí)滯系統(tǒng)的最大值原理問(wèn)題時(shí)遇到了一類新型的FBSDE,其正向方程為時(shí)滯隨機(jī)微分方程,倒向方程為超前倒向隨機(jī)微分方程.我們稱其為推廣的FBSDE,并給出了這類新型FBSDE解的存在唯一性條件.
   早在1973年Kolmanovskii and Maizenberg就討論

6、了時(shí)滯隨機(jī)系統(tǒng)的LQ問(wèn)題.我們?cè)诖嘶A(chǔ)上考慮狀態(tài)與控制都有延遲的LQ問(wèn)題,并且用FBSDE和值函數(shù)兩種方法來(lái)尋找最優(yōu)反饋控制.另外,我們也將關(guān)于推廣的FBSDE的結(jié)果應(yīng)用于時(shí)滯線性二次非零和隨機(jī)微分對(duì)策問(wèn)題.
   考慮一般情況,我們處理一類由隨機(jī)泛函微分方程(簡(jiǎn)稱SFDE)刻畫的時(shí)滯系統(tǒng)的遞歸最優(yōu)控制問(wèn)題,其中系統(tǒng)及遞歸效用函數(shù)的變動(dòng)都依賴于過(guò)去的一段狀態(tài)而不僅僅是有限個(gè)點(diǎn).對(duì)此類問(wèn)題,我們證明了其值函數(shù)仍滿足Bellman型

7、的動(dòng)態(tài)規(guī)劃原理.由于對(duì)過(guò)去狀態(tài)依賴形式的復(fù)雜性,完整形式的Ito公式和Dynkin公式都很難得到,故想進(jìn)一步得到值函數(shù)滿足的Hamilton-Jacobi-Bellman方程并不是件容易的事情.為此我們引入Mohammed[44]中提到的弱無(wú)窮小生成元及Fuhrman等[24]中用到的聯(lián)合二次變差作為工具,得到了上述問(wèn)題值函數(shù)對(duì)應(yīng)的一個(gè)無(wú)窮維的HJB方程.而且我們也證明了值函數(shù)就是這個(gè)無(wú)窮維偏微分方程的粘性解.
   最后,作為

8、理論的應(yīng)用,我們考慮一類具有延遲效用的廣告問(wèn)題即廣告費(fèi)用支出與產(chǎn)生效果之間會(huì)有一定的時(shí)間差.Gozzi和Marinelli在[26]中用動(dòng)態(tài)規(guī)劃原理的方法討論過(guò)這類問(wèn)題.我們采用與他們不同的方法一無(wú)窮維最大值原理來(lái)處理這類問(wèn)題,這種方法是由Hu和Peng[28]首次提出的.這部分結(jié)果也是我們論文2.3部分在無(wú)窮維空間中的一個(gè)推廣.
   本論文由5章內(nèi)容組成,下面我們將列出主要結(jié)果.
   第1章:介紹第2章.第5章所要

9、研究的問(wèn)題.
   第2章:我們研究狀態(tài)方程為如下形式的時(shí)滯系統(tǒng)的最優(yōu)控制問(wèn)題:
   首先我們給出此類SDDE解的存在唯-性.接著我們考慮控制域?yàn)橥辜瘯r(shí)的情形,得到了如下的最大值原理.
   定理2.2.6.令u(·)為時(shí)滯隨機(jī)最優(yōu)控制問(wèn)題(2.3)-(2.5)的最優(yōu)控制,X(·)為其相應(yīng)的最優(yōu)軌線.則我們有如下論斷:定義為:
   更進(jìn)一步,我們可以得到如下的控制最優(yōu)的充分條件.
   定理2

10、.2.8.假設(shè)u(·)∈A,令X(·)為其相應(yīng)的軌線,p(t)和z(i)為伴隨方程(2.12)的解.如果(H2.5)-(H2.6)及(2.13)(或(2.16))成立,則u(·)為時(shí)滯控制問(wèn)題(2.3)-(2.5)的最優(yōu)解.
   利用得到的最大值原理,我們研究了一類時(shí)滯的生產(chǎn)消費(fèi)選擇最優(yōu)化問(wèn)題.生產(chǎn)資本x(t)滿足如下方程:問(wèn)題是如何選取消費(fèi)率c(t)最大化代價(jià)泛函
   下面的命題給出了最有控制問(wèn)題的顯示解,而且從F

11、igure1和Figure2中我們可以看出不同的時(shí)間延遲對(duì)結(jié)果的影響情況.
   命題2.2.9.對(duì)生產(chǎn)消費(fèi)選擇問(wèn)題(2.17)-(2.18),
   接著,我們考慮了控制域非凸時(shí)的遞歸最優(yōu)控制問(wèn)題.假設(shè)延遲是時(shí)變的,且擴(kuò)散項(xiàng)σ不含控制,即系統(tǒng)由如下的時(shí)滯正倒向方程來(lái)描述:定理2.3.6.假設(shè)u(·)為最優(yōu)控制,(x(·),y(·),z(·))為其相應(yīng)的最優(yōu)軌線.則對(duì)所有0≤t   第3章:我們考慮

12、時(shí)滯最優(yōu)化問(wèn)題中遇到的一類推廣的FBSDE:
   定理3·1·3.若(H3.1)及(H3.2)成立,則推廣的FBSDE(3.1)有唯一適應(yīng)解(X,Y,Z).
   我們研究了兩類時(shí)滯LQ問(wèn)題,尋找它們的最優(yōu)控制的顯示形式.
   在問(wèn)題3.1中,我們假設(shè)只有狀態(tài)有延遲.借助于FBSDE的結(jié)果,我們有
   定理3.2.1.控制
   為問(wèn)題3.1的唯一最優(yōu)控制,其中(xt,yt,zt)為如下的推

13、廣的FBSDE的解
   第二種情況,即問(wèn)題3.2,我們假設(shè)系統(tǒng)的狀態(tài)及控制都有延遲.通過(guò)一類更為復(fù)雜的FBSDE我們給出其最優(yōu)控制的形式.
   定理3.2.2.控制為問(wèn)題3.2的唯一最優(yōu)控制,其中(x(t),y(t),z(t))為推廣的FBSDE(3.14)的解.
   我們引入兩種方法來(lái)尋找最優(yōu)反饋控制.這兩種方法是從解決最優(yōu)控制問(wèn)題的經(jīng)典方法一最大值原理和動(dòng)態(tài)規(guī)劃原理這兩個(gè)不同的角度出發(fā)的.
  

14、 從最大值原理的角度出發(fā),我們有:
   定理3.3.1.假設(shè)存在矩陣值過(guò)程(Kt,Ht),t∈[0,T],滿足廣義的矩陣Riccati方程(3.19).則時(shí)滯線性二次最優(yōu)控制問(wèn)題問(wèn)題3.3的最優(yōu)反饋控制為
   從動(dòng)態(tài)規(guī)劃原理的角度出發(fā),我們有:
   在第3章的最后,我們討論時(shí)滯線性二次非零和隨機(jī)微分對(duì)策問(wèn)題.
   定理3.4.1.當(dāng)且僅當(dāng)(u1(·),u2(·))具有如下形式
   第4章

15、:我們給出了由如下SFDE刻畫的時(shí)滯系統(tǒng)的遞歸最優(yōu)控制問(wèn)題的動(dòng)態(tài)規(guī)劃原理:
   定理4.2.10.若A4.4-A4.8成立,則(4.9)式定義的時(shí)滯最優(yōu)控制問(wèn)題的值函數(shù)u(s,ψ)具有如下的優(yōu)良性質(zhì):對(duì)任意0≤T≤T-s,
   我們得到了值函數(shù)滿足的HJB方程-一類無(wú)窮維的偏微分方程.
   定理4.3.9.如果假設(shè)我們問(wèn)題中的值函數(shù)u(s,ψ)∈C1,2lip([0,T]×C)∩D(S),則u(s,ψ)為如

16、下的Hamilton-Jacobi-Bellman偏微分方程的解:
   這里我們以▽0u(t,x)記▽xu(t,x)({0}).
   我們有:
   定理4.3.11.如(4.9)式定義的u(s,ψ)為HJB方程(4.33)的一個(gè)粘性解.
   第5章:在最后一章,我們研究一類廣告模型中的時(shí)滯隨機(jī)控制問(wèn)題作為我們理論的應(yīng)用.這類時(shí)滯的廣告模型可以重新定義于Hilbert空間.我們利用無(wú)窮維的最大值原理

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論