版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、運(yùn)籌學(xué),動(dòng)態(tài)規(guī)劃,動(dòng)態(tài)規(guī)劃的概念與模型,靜態(tài)決策 一次性決策,動(dòng)態(tài)決策 多階段決策,多段決策過(guò)程,…,…,n個(gè)決策子問(wèn)題K稱(chēng)為階段變量xk描述k階段初的狀態(tài),稱(chēng)為狀態(tài)變量一般把輸入狀態(tài)稱(chēng)為該階段的階段狀態(tài)。uk的取值代表k階段對(duì)第k子問(wèn)題所進(jìn)行的決策,稱(chēng)為k階段的決策變量rk為k階段從狀況xk出發(fā),做決策uk之后的后果,稱(chēng)為k階段的階段效應(yīng)。,具有無(wú)后效性的多段決策過(guò)程,Xk+1=Tk (xk, uk)系
2、統(tǒng)從k階段往后的決策只與k階段系統(tǒng)的狀態(tài)xk有關(guān),而與系統(tǒng)以前的決策無(wú)關(guān),則稱(chēng)為具有無(wú)后效性的多段決策過(guò)程。,K后部子過(guò)程,多段決策過(guò)程中從第k階段到最終階段的過(guò)程稱(chēng)為k-后部子過(guò)程,簡(jiǎn)稱(chēng)k-子過(guò)程。,動(dòng)態(tài)規(guī)劃模型,Opt表示求優(yōu)Xk是一個(gè)集合,表示k階段狀態(tài)可能取值的范圍,稱(chēng)為狀態(tài)可能集合。Uk是一個(gè)集合,表示k階段決策可能取值的范圍,稱(chēng)為決策允許集合,一般來(lái)說(shuō)對(duì)于不同狀態(tài),可以作的決策的范圍是不同的。因此決策允許集合一般寫(xiě)為Uk
3、(xk)。,動(dòng)態(tài)規(guī)劃的建模,動(dòng)態(tài)規(guī)劃建模①確定階段與階段變量②明確狀態(tài)變量和狀態(tài)可能集合。③確定決策變量和決策允許集合。④確定狀態(tài)轉(zhuǎn)移方程。⑤明確階段效應(yīng)和目標(biāo)。,動(dòng)態(tài)規(guī)劃的建模,①確定階段與階段變量階段的劃分一般是按照決策進(jìn)行的時(shí)間或空間上的先后順序劃分的,階段數(shù)等于多段決策過(guò)程中從開(kāi)始到結(jié)束所需要作出決策的數(shù)目,階段變量用k表示。②明確狀態(tài)變量和狀態(tài)可能集合。狀態(tài)變量必須包含在給定的階段上確定全部允許決策所需要的信息
4、。狀態(tài)變量的確定決定了整個(gè)決策過(guò)程是不是具有無(wú)后效性,因而也決定著能不能用動(dòng)態(tài)規(guī)劃方法來(lái)求解。狀態(tài)可能集是關(guān)于狀態(tài)的約束條件,因此為了求解必須正確地確定狀態(tài)可能集。,動(dòng)態(tài)規(guī)劃的建模,③確定決策變量和決策允許集合。與靜態(tài)問(wèn)題相同,決策變量應(yīng)能夠反映對(duì)問(wèn)題所作的決策,決策變量也應(yīng)有其相應(yīng)的約束條件,在建模時(shí)應(yīng)明確決策允許集合Uk(xk)。④確定狀態(tài)轉(zhuǎn)移方程。系統(tǒng)k階段從狀態(tài)xk出發(fā)作了決策uk(xk)之后的結(jié)果之一是系統(tǒng)狀態(tài)的轉(zhuǎn)移,這
5、一結(jié)果直接影響系統(tǒng)往后的決策過(guò)程,因此必須明確狀態(tài)的轉(zhuǎn)移過(guò)程,即根據(jù)問(wèn)題的內(nèi)在關(guān)系,明確xk+1=Tk(xk,uk)中的函數(shù)Tk( )。,動(dòng)態(tài)規(guī)劃的建模,⑤明確階段效應(yīng)和目標(biāo)。階段效應(yīng)rk(xk,uk)是在階段k以xk出發(fā)作了決策uk之后所產(chǎn)生的后果,必須明確rk與xk,uk的關(guān)系,才能構(gòu)成目標(biāo)函數(shù)。目標(biāo)函數(shù)是由階段效應(yīng)經(jīng)過(guò)某種集結(jié)而得到的,如何集結(jié)視具體問(wèn)題而定,同時(shí)還應(yīng)根據(jù)問(wèn)題確定目標(biāo)是求最大還是最小。由于在經(jīng)濟(jì)系統(tǒng)中的大多數(shù)
6、情況下,目標(biāo)的集結(jié)方法都是求和,因此,在不作說(shuō)明的情況下,往后的討論都針對(duì)目標(biāo)為和的形式進(jìn)行。,動(dòng)態(tài)規(guī)劃解的概念,多段決策過(guò)程中所要求解的是,從起始狀態(tài)x1開(kāi)始,進(jìn)行一系列的決策,使目標(biāo)R達(dá)到最優(yōu)最優(yōu)目標(biāo)值 R*,最優(yōu)策略 使得目標(biāo)達(dá)到最優(yōu)的決策序列。,最優(yōu)路線 在采取最優(yōu)策略時(shí),系統(tǒng)從x1開(kāi)始所經(jīng)過(guò)的狀態(tài)序列,求解動(dòng)態(tài)規(guī)劃模型 找到最優(yōu)策略、最優(yōu)路線和最優(yōu)目標(biāo)值。,動(dòng)態(tài)規(guī)劃最優(yōu)性原理,多段決策過(guò)程的
7、特點(diǎn) 每個(gè)階段都要進(jìn)行決策 相繼進(jìn)行的階段決策構(gòu)成的決策序列 前一階段的終止?fàn)顟B(tài)又是后一階段的初始狀態(tài)階段最優(yōu)決策不能只從本階段的效應(yīng)出發(fā),必須通盤(pán)考慮,整體規(guī)劃。階段k的最優(yōu)決策不應(yīng)該只是本階段效應(yīng)的最優(yōu),而必須是本階段及其所有后續(xù)階段的總體最優(yōu),即關(guān)于整個(gè)k后部子過(guò)程的最優(yōu)決策。,動(dòng)態(tài)規(guī)劃最優(yōu)性原理,最優(yōu)性原理 “最優(yōu)策略具有的基本性質(zhì)是:無(wú)論初始狀態(tài)和初始決策如何,對(duì)于前面決策所造成的某一狀態(tài)而
8、言,下余的決策序列必構(gòu)成最優(yōu)策略”。,,動(dòng)態(tài)規(guī)劃最優(yōu)性原理,最優(yōu)性原理的含意 最優(yōu)策略的任何一部分子策略,也是相應(yīng)初始狀態(tài)的最優(yōu)策略。 每個(gè)最優(yōu)策略只能由最優(yōu)子策略構(gòu)成。顯然,對(duì)于具有無(wú)后效性的多段決策過(guò)程而言,如果按照k后部子過(guò)程最優(yōu)的原則來(lái)求各階段狀態(tài)的最優(yōu)決策,那么這樣構(gòu)成的最優(yōu)決策序列或策略一定具有最優(yōu)性原理所提示的性質(zhì)。,貝爾曼函數(shù),貝爾曼函數(shù)fk(xk): 在階段k從初始狀態(tài)
9、xk出發(fā),執(zhí)行最優(yōu)決策序列或策略,到達(dá)過(guò)程終點(diǎn)時(shí),整個(gè)k-子過(guò)程中的目標(biāo)函數(shù)取值,稱(chēng)為條件最優(yōu)目標(biāo)函數(shù),亦稱(chēng)貝爾曼函數(shù)。,條件最優(yōu)策略 多段決策過(guò)程的任一階段狀態(tài)xk的最優(yōu)策略 處于條件xk時(shí)的最優(yōu)策略。條件最優(yōu)決策 構(gòu)成條件最優(yōu)策略的決策,貝爾曼函數(shù),條件最優(yōu)目標(biāo)函數(shù)值fk(xk) 執(zhí)行條件最優(yōu)策略時(shí)的目標(biāo)函數(shù)值,條件最優(yōu)路線 執(zhí)行條件最優(yōu)策略時(shí)的階段狀態(tài)序列
10、,貝爾曼函數(shù),條件最優(yōu)k-子策略 系統(tǒng)從xk出發(fā),在k-后部子過(guò)程中的最優(yōu)策略k-子過(guò)程條件最優(yōu)目標(biāo)函數(shù) fk(xk)是從xk出發(fā)系統(tǒng)在k-后部子過(guò)程中的最優(yōu)目標(biāo)值,多段決策問(wèn)題所求解的最優(yōu)目標(biāo)函數(shù)值 R*=opt f1(x1*)動(dòng)態(tài)規(guī)劃基本方程 fk(xk)與fk+1(xk+1)之間的遞推關(guān)系動(dòng)態(tài)規(guī)劃方法的依據(jù)是最優(yōu)性原理,動(dòng)態(tài)規(guī)劃基本方程,設(shè)在階段k的狀
11、態(tài)xk執(zhí)行了任意選定決策uk后的狀態(tài)是xk+1=Tk(xk,uk)。這時(shí)k-后部子過(guò)程就縮小為k+1后部子過(guò)程。根據(jù)最優(yōu)性原理,對(duì)k+1后部子過(guò)程應(yīng)采取最優(yōu)策略,由于無(wú)后效性,k后部子過(guò)程的目標(biāo)函數(shù)值為,動(dòng)態(tài)規(guī)劃基本方程,動(dòng)態(tài)規(guī)劃基本方程,動(dòng)態(tài)規(guī)劃方法基本原理,動(dòng)態(tài)規(guī)劃方法基本原理,rk(xk, uk)和xk+1=Tk(xk, uk)都是已知的函數(shù)求fk(xk)需要首先求關(guān)于xk的所有k+1段狀態(tài)xk+1的fk+1(xk+1)逆序地
12、求出條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合狀態(tài)xk+1是由前面階段的狀態(tài)決定的用問(wèn)題給定的初始條件,即可順序地求出整個(gè)多段決策問(wèn)題的最優(yōu)目標(biāo)函數(shù)值、最優(yōu)策略和最優(yōu)路線。,動(dòng)態(tài)規(guī)劃問(wèn)題求解的一般步驟,逆序地求出條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合k=n時(shí),動(dòng)態(tài)規(guī)劃基本方程是,邊界條件,k=n時(shí)的動(dòng)態(tài)規(guī)劃基本方程成為,動(dòng)態(tài)規(guī)劃問(wèn)題求解的一般步驟,逆序地求出條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合k=n-1時(shí),動(dòng)態(tài)規(guī)劃的基本方程
13、是,所有的fn(xn)都已經(jīng)求出,因此可以根據(jù)xn=Tn-1(xn-1,un-1)就階段n-1每個(gè)可能狀態(tài)xn-1∈Xn-1求條件最優(yōu)決策及相應(yīng)的條件最優(yōu)目標(biāo)函數(shù)值fn-1(xn-1),動(dòng)態(tài)規(guī)劃問(wèn)題求解的一般步驟,逆序地求出條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合k=1時(shí),動(dòng)態(tài)規(guī)劃的基本方程是,所有的f2(x2)都已經(jīng)求出,因此可以根據(jù)x2=T1(x1,u1)就階段1每個(gè)可能狀態(tài)x1∈X1求條件最優(yōu)決策及相應(yīng)的條件最優(yōu)目標(biāo)函數(shù)值f
14、1(x1),動(dòng)態(tài)規(guī)劃問(wèn)題求解的一般步驟,逆序地求出條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合,,動(dòng)態(tài)規(guī)劃問(wèn)題求解的一般步驟,順序地求出最優(yōu)目標(biāo)值、最優(yōu)策略和最優(yōu)路線若x1已知,則,階段1的條件最優(yōu)決策就是階段1的關(guān)于整個(gè)過(guò)程的最優(yōu)決策若x1未知,,,動(dòng)態(tài)規(guī)劃問(wèn)題求解的一般步驟,順序地求出最優(yōu)目標(biāo)值、最優(yōu)策略和最優(yōu)路線,,,,,,,,動(dòng)態(tài)規(guī)劃四大要素、一個(gè)方程,五個(gè)關(guān)鍵因素 四大要素、一個(gè)方程:①狀態(tài)變量及其可能集合②決策變量
15、及其允許集合③狀態(tài)轉(zhuǎn)移方程④階段效應(yīng)⑤動(dòng)態(tài)規(guī)劃基本方程:,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,例4-1 某旅行者希望從s地起到t地,其間的道路系統(tǒng)如圖4-7所示,圖上圓圈表示途徑的地方,稱(chēng)為節(jié)點(diǎn),連結(jié)兩地的箭線表示道路,其上的數(shù)字表示該段道路長(zhǎng)度,箭頭表示通行的方向。試求s到t的最短路。,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,第一階段 第二階段 第三階段劃分階段 k=1,2,3 代表
16、三個(gè)階段,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,狀態(tài)變量xk取為k階段所在地,則有:,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,k階段決策是決定下一步走到哪里,uk(xk)取為下一步的所在點(diǎn)。,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,逆序求條件最優(yōu)目標(biāo)函數(shù)集和條件最優(yōu)決策集由于第3階段末已到達(dá)t,往后的距離自然是零,因此f4(t)=0對(duì)3階段所有可能的狀態(tài)X3={d, e, f}計(jì)算f3( )如下,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,逆序求條
17、件最優(yōu)目標(biāo)函數(shù)集和條件最優(yōu)決策集也可以用表格方法計(jì)算如下,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,逆序求條件最優(yōu)目標(biāo)函數(shù)集和條件最優(yōu)決策集,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,逆序求條件最優(yōu)目標(biāo)函數(shù)集和條件最優(yōu)決策集對(duì)2階段所有可能的狀態(tài)X2={a, b, c}計(jì)算f2( )如下,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,逆序求條件最優(yōu)目標(biāo)函數(shù)集和條件最優(yōu)決策集對(duì)2階段所有可能的狀態(tài)X2={a, b, c}計(jì)算f2( )如下,動(dòng)態(tài)規(guī)劃應(yīng)
18、用舉例----定步數(shù)問(wèn)題,逆序求條件最優(yōu)目標(biāo)函數(shù)集和條件最優(yōu)決策集也可以用表格方法計(jì)算如下,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,逆序求條件最優(yōu)目標(biāo)函數(shù)集和條件最優(yōu)決策集,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,逆序求條件最優(yōu)目標(biāo)函數(shù)集和條件最優(yōu)決策集對(duì)1階段所有可能的狀態(tài)X1={s}計(jì)算f1( )如下,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,順序求最優(yōu)策略、最優(yōu)路線和最優(yōu)目標(biāo)函數(shù)值,,,,,,,,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----定步數(shù)問(wèn)題,逆序求
19、條件最優(yōu)目標(biāo)函數(shù)集和條件最優(yōu)決策集,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----不定步數(shù)問(wèn)題,例4-2,用f(i)表示I節(jié)點(diǎn)到t節(jié)點(diǎn)的最短距離,則根據(jù)動(dòng)態(tài)規(guī)劃原理,應(yīng)該有:,動(dòng)態(tài)規(guī)劃應(yīng)用舉例----不定步數(shù)問(wèn)題,例4-2,可用迭代的方法來(lái)實(shí)現(xiàn)求解。迭代可以針對(duì)f( )來(lái)進(jìn)行,稱(chēng)為函數(shù)迭代法也可以針對(duì)策略{u(i)}(i=s, a, b, c, d)進(jìn)行,稱(chēng)為策略迭代法,不定步數(shù)問(wèn)題----函數(shù)迭代法,函數(shù)迭代法步驟選定一初始函數(shù)f1(i),,然后用
20、遞推關(guān)系求{fk(i)},,fk(i)為從i點(diǎn)出發(fā)走k步到t的最短距離 ,若對(duì)于某個(gè)k,有fk+1(i)=fk(i),對(duì)所有節(jié)點(diǎn)i成立,則fk( )即為條件最優(yōu)目標(biāo)函數(shù),求解結(jié)束。 否則重復(fù)上述過(guò)程,直至最優(yōu)。,不定步數(shù)問(wèn)題----函數(shù)迭代法,例4-2,取,不定步數(shù)問(wèn)題----函數(shù)迭代法,例4-2,不定步數(shù)問(wèn)題----函數(shù)迭代法,例4-2,不定步數(shù)問(wèn)題----策略迭代法,策略迭代法步驟: 1 給每個(gè)點(diǎn)i選擇一個(gè)下一步到達(dá)的點(diǎn)u0(
21、i),i=s, a, b, c, d 取k=0,2 由,算出fk(i),3 由,解出,則已經(jīng)最優(yōu),否則繼續(xù)計(jì)算,若,不定步數(shù)問(wèn)題----策略迭代法,例4-2,取,,,,,,不定步數(shù)問(wèn)題----策略迭代法,例4-2,不定步數(shù)問(wèn)題----策略迭代法,例4-2,,,,,,不定步數(shù)問(wèn)題----策略迭代法,不定步數(shù)問(wèn)題----策略迭代法,資源分配問(wèn)題,資源的多元分配 設(shè)有某種資源,總量為M,可以投入n種生產(chǎn)活動(dòng)。已知用于活動(dòng)k的資源為uk
22、時(shí)的收益是gk(uk),問(wèn)應(yīng)如何分配資源,使n種生產(chǎn)活動(dòng)的總收益最大。這種問(wèn)題就是資源的多元分配問(wèn)題。,資源分配問(wèn)題,資源的多元分配 如果將n種活動(dòng)作為一個(gè)互相銜接的整體,對(duì)一種活動(dòng)的資源分配作為一個(gè)階段,每個(gè)階段確定對(duì)一種活動(dòng)的資源投放量。則該問(wèn)題成為一個(gè)多段決策問(wèn)題。狀態(tài)變量xk的選取原則是要能夠據(jù)此確定決策uk,以及滿足狀態(tài)轉(zhuǎn)移方程所要求的無(wú)后效性。在資源分配問(wèn)題中,決策變量選為對(duì)活動(dòng)k的資源投放量,因此狀態(tài)變量可以選擇為階
23、段k初所擁有的資源量,即將要在第k種到第n種活動(dòng)間分配的資源量。,資源的多元分配,關(guān)于狀態(tài)變量xk的約束條件是 0≤xk≤M關(guān)于決策變量uk的約束條件是 0≤uk≤xk 狀態(tài)轉(zhuǎn)移方程為 xk+1=xk-uk 顯然它滿足無(wú)后效性要求。階段效應(yīng)為對(duì)活動(dòng)k投放資源uk時(shí)的收益, rk(xk, uk)=gk(uk)目標(biāo)函數(shù)是為n種活動(dòng)投放資源后的總收益動(dòng)態(tài)規(guī)劃基本方程,資源的多元分配,例4-
24、3 某公司擬將50萬(wàn)元資金投放下屬A、B、C三個(gè)部門(mén),各部門(mén)在獲得資金后的收益如表所示,用動(dòng)態(tài)規(guī)劃方法求總收益最大的投資分配方案(投資數(shù)以10萬(wàn)元為單位)。,資源的多元分配,解 該問(wèn)題可以作為三段決策過(guò)程。對(duì)A、B、C三個(gè)部門(mén)分配資金分別形成1,2,3三個(gè)階段。xk表示給部門(mén)k分配資金時(shí)擁有的資金數(shù)。uk表示給部門(mén)k分配的資金數(shù)(以10萬(wàn)元為單位)。狀態(tài)轉(zhuǎn)移方程是xk+1=xk-uk。階段效應(yīng)如表所示。目標(biāo)函數(shù)是階段效應(yīng)求和。,資源
25、的多元分配,首先逆序求條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合。,從表可知g3( )是單調(diào)遞增的函數(shù),因此,當(dāng)u3=x3時(shí)達(dá)到最大。即:,資源的多元分配,逆序求條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合。,資源的多元分配,逆序求條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合。,資源的多元分配,逆序求條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合。k=2時(shí),0≤x2≤5 0≤u2≤x2,資源的多元分配,逆序求條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決
26、策集合。k=2時(shí),0≤x2≤5 0≤u2≤x2,資源的多元分配,逆序求條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合。當(dāng)k=1時(shí),有x1=5,0≤u1≤x1=5,資源的多元分配,逆序求條件最優(yōu)目標(biāo)函數(shù)值集合和條件最優(yōu)決策集合。當(dāng)k=1時(shí),有x1=5,0≤u1≤x1=5,資源的多元分配,順序求最優(yōu)目標(biāo)函數(shù)值和最優(yōu)策略、最優(yōu)路線,,,,,,,,,資源的多段分配,將一種有消耗性的資源,多階段地在多種不同的生產(chǎn)活動(dòng)中投放的問(wèn)題稱(chēng)為資源的多
27、段分配問(wèn)題,下面討論其中包含有兩個(gè)生產(chǎn)活動(dòng)的簡(jiǎn)單情況。設(shè)有某種資源,初始的擁有量是M。計(jì)劃在A,B兩個(gè)生產(chǎn)部門(mén)連續(xù)使用n個(gè)階段。已知在部門(mén)A投入資源uA時(shí)的階段收益是g(uA),在部門(mén)B投入資源uB時(shí)的階段收益是h(uB)。又資源在生產(chǎn)中將有部分消耗,已知每生產(chǎn)一個(gè)階段后部門(mén)A,B中的資源完好率分別為a和b,0<(a, b)<1。求n階段間總收益最大的資源分配計(jì)劃。,資源的多段分配,n段決策過(guò)程狀態(tài)變量xk為階段k初擁有
28、的資源量,0≤xk≤M,x1=M決策變量選為階段k在部門(mén)A的資源投放量,即uA=uk,這里顯然有uB=xk- uk,決策變量的約束條件是 0≤uk≤xk即最多將所擁有的資源都投入部門(mén)A,其時(shí)uB=0階段k末部站A的剩余資源auk,部門(mén)B中則為b(xk-uk),因此狀態(tài)轉(zhuǎn)移方程xk+1=T(xk, uk)是 xk+1=auk+b(xk-uk) 滿足無(wú)后效性階段效應(yīng)rk(xk, uk)即階段收益rk(xk, uk)=g(uk
29、)+h(xk-uk)目標(biāo)函數(shù)是n個(gè)階段的總收益,即階段效應(yīng)求和。,資源的多段分配,例4-4 今有1000臺(tái)機(jī)床,要投放到A、B兩個(gè)生產(chǎn)部門(mén),計(jì)劃連續(xù)使用3年。已知對(duì)A部門(mén)投入uA臺(tái)機(jī)器時(shí)的年收益是g(uA)=4(uA)2(元),機(jī)器完好率a=0.5,相應(yīng)的B部門(mén)的年收益是h(uB)=2(uB)2 (元),完好率b= 0.9。試求使3年間總收益最大的年度機(jī)器分配方案。 解 以每年作為一個(gè)階段,設(shè)狀態(tài)變量和決策變量都是連續(xù)取值的。
30、K階段狀態(tài)變量xk取為該年度初完好的設(shè)備數(shù),決策變量取為該年度投入A活動(dòng)的設(shè)備數(shù),則有 0≤xk≤1000, 0≤uk≤xk狀態(tài)轉(zhuǎn)移方程為:xk+1=0.5uk+0.9(xk-uk),資源的多段分配,例4-4解 以每年作為一個(gè)階段,設(shè)狀態(tài)變量和決策變量都是連續(xù)取值的。K階段狀態(tài)變量xk取為該年度初完好的設(shè)備數(shù),決策變量取為該年度投入A活動(dòng)的設(shè)備數(shù),則有 0≤xk≤1000,
31、 0≤uk≤xk狀態(tài)轉(zhuǎn)移方程為:xk+1=0.5uk+0.9(xk-uk)動(dòng)態(tài)規(guī)劃基本方程,資源的多段分配,逆序求條件最優(yōu)目標(biāo)函數(shù)值fk(xk)和條件最優(yōu)決策k=3時(shí),0≤u3≤x3,注意到f4(x4)=0,有,k=2時(shí),0≤u2≤x2,有,資源的多段分配,逆序求條件最優(yōu)目標(biāo)函數(shù)值fk(xk)和條件最優(yōu)決策k=1時(shí),0≤u1≤x1,x2=0.5u1+0.9(x1-u1),f2(x2),,,,,,,,串聯(lián)系統(tǒng)可靠性問(wèn)題,系統(tǒng)
32、可靠性是指系統(tǒng)在規(guī)定的條件下能正常工作的概率,它是管理和工程技術(shù)設(shè)計(jì)中經(jīng)常要研究的問(wèn)題。這兒要研究的是串聯(lián)系統(tǒng)可靠性問(wèn)題。例如某種儀器設(shè)備由N個(gè)部件串聯(lián)構(gòu)成,凡其中有一個(gè)部件出現(xiàn)故障,則整個(gè)系統(tǒng)便不能正常工作。為了提高系統(tǒng)工作的可靠性,一種方法是可以在每個(gè)部件上裝有主要元件的相同性能的備用件,并且?guī)в袀溆迷詣?dòng)投入裝置。自然備用元件越多,系統(tǒng)的可靠性越高,但也會(huì)相應(yīng)增加系統(tǒng)重量、體積和費(fèi)用,有時(shí)也會(huì)降低工作精度。因此,在成本、
33、重量、體積等一定的條件限制下,應(yīng)如何選擇各部件的備用元件數(shù),使得整個(gè)系統(tǒng)的可靠性最大,就可以歸結(jié)為一個(gè)動(dòng)態(tài)規(guī)劃問(wèn)題。,串聯(lián)系統(tǒng)可靠性問(wèn)題,例4-5 某電氣設(shè)備由三個(gè)部件串聯(lián)而成,為提高該種設(shè)備在指定工作條件下正常工作的可靠性,需在每個(gè)部件上安裝一個(gè)、兩個(gè)或三個(gè)主要元件的相同備件。假設(shè)對(duì)部件i(i=1,2,3)配備j個(gè)備件后的可靠性Rij和所需費(fèi)用cij均已知,如表所示,若可用的總資金數(shù)量為1萬(wàn)元,問(wèn)如何配備各部件的備用元件數(shù),才能使該
34、設(shè)備在給定工作條件下的可靠性最大?,串聯(lián)系統(tǒng)可靠性問(wèn)題,例4-5 解 以給不同的部件決定備件作為不同的階段,則該問(wèn)題是3階段決策問(wèn)題設(shè)狀態(tài)變量xk表示從第k個(gè)部件到第3個(gè)部件允許使用的總費(fèi)用(k=1,2,3)決策變量uk為第k部件配備的備用元件數(shù)(k=1,2,3)。則據(jù)題意有:x1=10千元,且每個(gè)部件都最少有一個(gè)備件,即uk≥1,若令sk表示為保障以后各部件均能獲得一個(gè)備件所需的資金數(shù),則應(yīng)有:,串聯(lián)系統(tǒng)可靠性問(wèn)題,例4-5
35、,且據(jù)此可得:s1=6,s2=5,s3=2。從而可知:對(duì)uk有,即當(dāng)期所耗資金加上k+1期往后所用資金sk+1不超過(guò)當(dāng)前擁有資金數(shù)。,串聯(lián)系統(tǒng)可靠性問(wèn)題,例4-5,根據(jù)上述分析可以寫(xiě)出各階段的狀態(tài)可能集合和決策允許集合如下: x1=10 X2={9,7,5} X3={2,3,4,5,6} U1={1,2,3}U2(9)={1,2,3} U2(7)={1,2
36、} U2(5)={1} U3(2)={1} U3(3)={1,2} U3(4)={1,2,3} U3(5)={1,2,3} U3(6)={1,2,3},串聯(lián)系統(tǒng)可靠性問(wèn)題,例4-5,狀態(tài)轉(zhuǎn)移方程為:,階段效應(yīng)為,目標(biāo)函數(shù)為是階段效應(yīng)乘積的形式,若以fk(xk)表示在階段k擁有資金xk時(shí)采用最優(yōu)決策序列所得的k階段往后的系統(tǒng)的可靠性,則動(dòng)態(tài)規(guī)劃基
37、本方程為:,串聯(lián)系統(tǒng)可靠性問(wèn)題,例4-5,串聯(lián)系統(tǒng)可靠性問(wèn)題,例4-5,串聯(lián)系統(tǒng)可靠性問(wèn)題,例4-5,,生產(chǎn)-庫(kù)存問(wèn)題,生產(chǎn)計(jì)劃周期分為n個(gè)階段,即k=1~n;已知最初庫(kù)存量為x1;階段需求量為dk;單位產(chǎn)品的消耗費(fèi)用為L(zhǎng)k;單位產(chǎn)品的階段庫(kù)存費(fèi)用為hk;倉(cāng)庫(kù)容量為Mk;階段生產(chǎn)能力為Bk;生產(chǎn)的準(zhǔn)備費(fèi)用為:,生產(chǎn)-庫(kù)存問(wèn)題,問(wèn)應(yīng)如何安排各階段產(chǎn)量,使計(jì)劃期總費(fèi)用最小。這里狀態(tài)變量xk應(yīng)選為階段k的初始庫(kù)存量,計(jì)劃初期的庫(kù)
38、存量x1是已知的,末期的庫(kù)存量通常也是給定的,為簡(jiǎn)單起見(jiàn)這里假定xn+1=0,于是問(wèn)題是始端末端固定的問(wèn)題。關(guān)于狀態(tài)xk的約束條件是,即階段k的庫(kù)存既不能超過(guò)庫(kù)存容量,也不應(yīng)超過(guò)階段k至階段n的需求總量(dk+dk+1+…+dn),否則將與xn+1=0的假設(shè)相違背。,生產(chǎn)-庫(kù)存問(wèn)題,決策變量uk選為階段k的生產(chǎn)量。階段產(chǎn)量要在不超過(guò)生產(chǎn)能力Bk的條件下,充分滿足該階段的需求dk,同時(shí)還要滿足計(jì)劃末期的庫(kù)存量為0的要求。因此關(guān)于決策變量的
39、約束條件就是,期末庫(kù)存=期初庫(kù)存+生產(chǎn)量-本期需求,生產(chǎn)-庫(kù)存問(wèn)題,階段k的生產(chǎn)費(fèi)用是,庫(kù)存費(fèi)用按階段k末期的庫(kù)存量xk+1計(jì)算,生產(chǎn)-庫(kù)存問(wèn)題舉例,例4-5 求解生產(chǎn)-庫(kù)存問(wèn)題。已知其n=3,ck=8,Lk=2,hk=1.5,x1=1,Mk=4,x4=0(計(jì)劃周期末期的庫(kù)存量為0),Bk=6,d1=3,d2=4,d3=3。,生產(chǎn)-庫(kù)存問(wèn)題舉例,例4-5 求解生產(chǎn)-庫(kù)存問(wèn)題。已知其n=3,ck=8,Lk=2,hk=1.5,x1=1,
40、Mk=4,x4=0(計(jì)劃周期末期的庫(kù)存量為0),Bk=6,d1=3,d2=4,d3=3。,生產(chǎn)-庫(kù)存問(wèn)題舉例,例4-5 求解生產(chǎn)-庫(kù)存問(wèn)題。已知其n=3,ck=8,Lk=2,hk=1.5,x1=1,Mk=4,x4=0(計(jì)劃周期末期的庫(kù)存量為0),Bk=6,d1=3,d2=4,d3=3。,生產(chǎn)-庫(kù)存問(wèn)題舉例,生產(chǎn)-庫(kù)存問(wèn)題舉例,生產(chǎn)-庫(kù)存問(wèn)題舉例,,,,,,,,生產(chǎn)-庫(kù)存問(wèn)題舉例,,,,,,,,,,,,,,二維背包問(wèn)題,背包問(wèn)題的特征類(lèi)
41、似于往旅行背包里面裝用品的問(wèn)題,要求在旅行袋容積和/或載重量的限制下,所裝物品的總價(jià)值最大。這一類(lèi)問(wèn)題在海運(yùn)、航運(yùn)以及航天等領(lǐng)域都有應(yīng)用。若只考慮重量或體積限制,則稱(chēng)為一維背包問(wèn)題,若同時(shí)考慮重量和體積限制,則稱(chēng)為二維背包問(wèn)題??紤]有N種物品需要裝船。第i種物品單位的重量為ωi,單件體積為υi,而價(jià)值為pi。最大的裝載重量為W,最大體積為V?,F(xiàn)在要確定在不超過(guò)船的最大載重量和最大體積(不考慮貨物形狀)的條件下,使所載物品價(jià)值最大的裝
42、載方案。,二維背包問(wèn)題,例4-6 已知貨物的單位重量ωi,單位體積υi及價(jià)值pi如表所示,船的最大載重能力為W=5,最大裝載體積為V=8,求最優(yōu)裝載方案。,二維背包問(wèn)題,例4-6 W=5,V=8,解 該問(wèn)題中有三種物品需要裝載,因此可以作為三段決策問(wèn)題,每階段為一個(gè)物品決定裝船的數(shù)量。k階段系統(tǒng)的狀態(tài)為在給第k物品決定裝載數(shù)量時(shí),船上還剩余的載重能力xk和剩余體積yk,因此狀態(tài)變量是二維的,記為(xk, yk)。
43、 有0≤xk≤5, 0≤yk≤8決策變量uk表示裝載第k種物品的數(shù)量。,二維背包問(wèn)題,例4-6 W=5,V=8,解 狀態(tài)轉(zhuǎn)移方程為: xk+1=xk-uk·ωk yk+1=yk-uk·υk階段效應(yīng)為 rk(xk, yk, uk)=pk·uk各階段的狀態(tài)可能集與決策允許集為:,二維背包問(wèn)題,解 狀態(tài)轉(zhuǎn)移方程為: xk+1=xk-uk·
44、ωk yk+1=yk-uk·υk,二維背包問(wèn)題,解 當(dāng)k=3時(shí),由f4(x4, y4)=0,二維背包問(wèn)題,解 當(dāng)k=2時(shí),由f3(x3, y3)已知,二維背包問(wèn)題,解 當(dāng)k=1時(shí),W=5,V=8,,,,,,,,設(shè)備更新問(wèn)題,設(shè)備更新問(wèn)題的一般提法隨著使用年限的增加,設(shè)備性能會(huì)變差,故障會(huì)增加,需要維修或更新。設(shè)備使用時(shí)間愈長(zhǎng),積累效益愈高,但隨著設(shè)備陳舊,維修使用費(fèi)用也會(huì)提高,而且,設(shè)備使用年限
45、愈久,處理價(jià)格愈低,更新費(fèi)用也要增加。因此,處于某個(gè)階段的各種設(shè)備,總是面臨著保留還是更新的問(wèn)題,這個(gè)問(wèn)題應(yīng)該從整個(gè)計(jì)劃期間的總回收額,而不應(yīng)從局部的某個(gè)階段的回收額來(lái)考慮。由于每個(gè)階段都面臨著保留還是更新的兩種選擇,因此,它是一個(gè)多階段的決策過(guò)程,可以用動(dòng)態(tài)規(guī)劃方法求解。,設(shè)備更新問(wèn)題,今有一設(shè)備更新問(wèn)題如下:已知 n為計(jì)算設(shè)備回收額的總期數(shù); t為某個(gè)階段的設(shè)備役齡; γ(t)為從役齡為t的設(shè)備得到的
46、階段收益; μ(t)為役齡為t的設(shè)備的階段使用費(fèi)用; s(t)是役齡為t的設(shè)備的處理價(jià)格; p為新設(shè)備的購(gòu)置價(jià)格;求n期內(nèi)使回收額最大的設(shè)備更新政策。,設(shè)備更新問(wèn)題,狀態(tài)變量選為設(shè)備的役齡t,即xk=t,決策只有兩種可能,即保留或更新,記為K(保留)或P(更新)。狀態(tài)轉(zhuǎn)移方程,相應(yīng)的階段效應(yīng)即階段的回收額也有兩種可能,設(shè)備更新問(wèn)題,例4-7 假定n=6年,新設(shè)備購(gòu)買(mǎi)價(jià)格為10萬(wàn)元。役齡為t時(shí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 運(yùn)籌學(xué)》習(xí)題答案運(yùn)籌學(xué)答案
- 運(yùn)籌學(xué)
- 運(yùn)籌學(xué)》習(xí)題答案運(yùn)籌學(xué)答案匯總
- 運(yùn)籌學(xué)習(xí)題答案運(yùn)籌學(xué)答案
- 858 運(yùn)籌學(xué)
- 《運(yùn)籌學(xué)1》
- 運(yùn)籌學(xué)課件
- 運(yùn)籌學(xué) 1
- 運(yùn)籌學(xué)基礎(chǔ)
- 運(yùn)籌學(xué)復(fù)習(xí)
- 運(yùn)籌學(xué)習(xí)題運(yùn)籌學(xué)練習(xí)題
- 運(yùn)籌學(xué)大作業(yè)
- 《運(yùn)籌學(xué)基礎(chǔ)》2005
- 《管理運(yùn)籌學(xué)》論文
- 管理運(yùn)籌學(xué)01
- 運(yùn)籌學(xué)作業(yè)習(xí)題
- 運(yùn)籌學(xué)作業(yè)2
- 運(yùn)籌學(xué)動(dòng)態(tài)規(guī)劃
- 運(yùn)籌學(xué)課后答案
- 運(yùn)籌學(xué)-目標(biāo)規(guī)劃
評(píng)論
0/150
提交評(píng)論