版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、智能規(guī)劃是人工智能近年來的熱點(diǎn)研究領(lǐng)域,而關(guān)于不確實(shí)規(guī)劃的研究是其中一個重要分支。不確定規(guī)劃問題由于動作的不確定性,已存在的用來求不確定狀態(tài)轉(zhuǎn)移系統(tǒng)的強(qiáng)規(guī)劃解、弱規(guī)劃解及強(qiáng)循環(huán)規(guī)劃解的方法都是采取從目標(biāo)狀態(tài)開始進(jìn)行反向搜索的方法來求規(guī)劃解,但由于沒有任何引導(dǎo)信息,求規(guī)劃解時常常會重復(fù)搜索大量無用的狀態(tài)和動作,所以如何獲得系統(tǒng)的引導(dǎo)信息,并用于求規(guī)劃解以提高求解的效率一直是研究的難點(diǎn)。
本文針對以上問題,基于不確定狀態(tài)轉(zhuǎn)移系統(tǒng)的
2、狀態(tài)可達(dá)關(guān)系,對于不確定狀態(tài)轉(zhuǎn)移系統(tǒng)中規(guī)劃解的求解問題,主要做了以下兩方面的研究:
1.在不確定規(guī)劃領(lǐng)域中,不確定狀態(tài)轉(zhuǎn)移系統(tǒng)求規(guī)劃解時常常存在大量冗余操作,造成不必要的搜索和計(jì)算。本文將不確定狀態(tài)轉(zhuǎn)移系統(tǒng)轉(zhuǎn)換為鄰接矩陣,使用鄰接矩陣的加和乘運(yùn)算獲得系統(tǒng)中的可達(dá)矩陣,即獲得了系統(tǒng)狀態(tài)間的可達(dá)關(guān)系。因此,我們基于這兩個矩陣設(shè)計(jì)了基于可達(dá)關(guān)系正向搜索強(qiáng)規(guī)劃解、弱規(guī)劃解的算法,在求規(guī)劃解的過程中,根據(jù)鄰接矩陣為系統(tǒng)確定下一步該選擇執(zhí)
3、行的動作,在可達(dá)矩陣中判斷執(zhí)行該動作到達(dá)的狀態(tài)是否可達(dá)目標(biāo)狀態(tài),以此確定該狀態(tài)動作序偶是否能夠加入到規(guī)劃解中。若執(zhí)行動作到達(dá)的狀態(tài)不可達(dá)目標(biāo)狀態(tài),則可以避免搜索這些對構(gòu)成規(guī)劃解沒有用的狀態(tài)和動作。在搜索的過程中根據(jù)兩個矩陣的值判斷狀態(tài)和動作是否有用,若無用,則直接避免了搜索,減少了大量冗余計(jì)算,提高了求規(guī)劃解的效率。
2.多agent規(guī)劃問題首次的正式討論出現(xiàn)在2010年的ICAPS上,現(xiàn)在關(guān)于多agent規(guī)劃領(lǐng)域的研究多為具
4、有確定動作的多agent規(guī)劃問題,而具有不確定動作的多agent規(guī)劃問題的研究還是一個很新的領(lǐng)域。本文針對不確定多agent規(guī)劃系統(tǒng)協(xié)同規(guī)劃解的問題,設(shè)計(jì)了基于可達(dá)關(guān)系求多agent規(guī)劃解的算法。在假設(shè)agent執(zhí)行每個動作的時間相等的前提下,該算法利用鄰接矩陣和可達(dá)矩陣中關(guān)于狀態(tài)之間的轉(zhuǎn)移信息及可達(dá)信息,為多個agent確定下一步轉(zhuǎn)移的動作,執(zhí)行動作后,存在agent與上一個agent到達(dá)的狀態(tài)相同且總執(zhí)行時間相等的情況下,對該age
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于模型檢測的不確定規(guī)劃中的狀態(tài)可達(dá)性研究
- 信息傳遞法求解與維護(hù)不確定狀態(tài)系統(tǒng)的可達(dá)關(guān)系.pdf
- 基于模型檢測的不確定規(guī)劃中的狀態(tài)可達(dá)性研究.pdf
- 不確定規(guī)劃中的狀態(tài)分層算法研究.pdf
- 基于可達(dá)性的不確定圖查詢研究.pdf
- 不確定圖上基于標(biāo)簽限制的可達(dá)性查詢技術(shù)的研究.pdf
- 狀態(tài)飽和不確定連續(xù)系統(tǒng)的魯棒控制.pdf
- 基于ISM有向圖的求可達(dá)矩陣的簡潔算法.pdf
- 基于增量的不確定社團(tuán)發(fā)現(xiàn)算法研究.pdf
- 基于自旋體系的不確定關(guān)系的實(shí)驗(yàn)研究.pdf
- 基于不確定測度的電力系統(tǒng)抗差狀態(tài)估計(jì).pdf
- 不確定觀測系統(tǒng)的分布式狀態(tài)估計(jì).pdf
- 基于有損測量信息的網(wǎng)絡(luò)化不確定系統(tǒng)的狀態(tài)估計(jì).pdf
- 多不確定信息的電網(wǎng)靈活規(guī)劃模型及算法研究.pdf
- 不確定系統(tǒng)極點(diǎn)配置算法研究.pdf
- 基于噪聲不確定性和用戶狀態(tài)改變的能量檢測算法研究.pdf
- 狀態(tài)依賴不確定動態(tài)連續(xù)系統(tǒng)的魯棒控制.pdf
- 基于不確定理論的變壓器狀態(tài)評估的研究
- 基于不確定采樣系統(tǒng)魯棒控制的狀態(tài)觀測器設(shè)計(jì).pdf
- 線性不確定系統(tǒng)的狀態(tài)反饋控制器設(shè)計(jì).pdf
評論
0/150
提交評論