中文--機器人杯是一個推動機器人基礎(chǔ)科技研究的平臺_第1頁
已閱讀1頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、<p><b>  中文10900字</b></p><p>  出處:Cutting Edge Robotics, ISBN 3-86611-038-3, pp. 784</p><p>  機器人杯是一個推動機器人基礎(chǔ)科技研究的平臺</p><p>  陳賢義(音) 夏德勝(音)</p><p><b

2、>  1引言:</b></p><p>  機器人是一項促進人工智能、機器人學(xué)和相關(guān)領(lǐng)域發(fā)展的綜合工程,機器人杯通過提供一個標(biāo)準(zhǔn)的問題,來努力發(fā)展關(guān)于人工智能和智能機器人方面的研究,為解答這個標(biāo)準(zhǔn)的問題,我們集成和檢驗很多領(lǐng)域的技術(shù)。機器人杯選取了足球作為研究的中心課題,目的在于促進創(chuàng)新,以便應(yīng)用于社會重大問題和工業(yè)生產(chǎn)。機器人杯的終極目標(biāo)是在2050年,開發(fā)出一支能夠在與人類足球冠軍隊的比賽中

3、贏得勝利的具有全自動特性的類人機器人隊伍。</p><p>  為了使機器人能夠真正踢一場比賽,必須整合許多相關(guān)的技術(shù),其中包括:自治終端的設(shè)計原理,多終端協(xié)作,策略學(xué)習(xí),實時分析,機器人學(xué)和傳感器整合。機器人杯是一個在動態(tài)環(huán)境下多個快速運動機器人團隊的任務(wù),機器人杯同樣提供了一個基于機器人杯的軟件方面的軟件研究平臺。</p><p>  機器人杯技術(shù)的一個主要應(yīng)用是在大規(guī)模災(zāi)難中執(zhí)行尋找

4、和營救的任務(wù)。機器人杯發(fā)起機器人的營救項目,是專門為促進機器人在社會重大問題及事件方面的應(yīng)用的研究。</p><p>  圖1 未來的足球?qū)?zhàn)</p><p>  在下一部分我們將介紹機器人杯的起源,組織及比賽情況。在第三部分我們將討論機器人杯的相關(guān)技術(shù)。</p><p>  2機器人杯的起源,組織和比賽形式:</p><p>  機器人杯

5、的概念是Alan Mackworth在1993年首先提出來的。機器人杯的主要目標(biāo)是提出一個具有挑戰(zhàn)性的研究課題,以便促進機器人學(xué)的發(fā)展。經(jīng)過兩年的可行性研究,在1995年秋,人們發(fā)表了關(guān)于引入機器人杯國際研討會及國際足球賽的通告,現(xiàn)在機器人杯足球賽被分為這幾部分比賽:模擬對抗賽(2D模式,3D模式),小型機器人賽(F180),中型機器人賽(F2000),四足機器人賽,類人機器人賽。在1997年7月首次官方會議和比賽在日本舉行。一年一次的

6、盛事吸引了許多參賽者和觀眾。</p><p>  2.1機器人杯的2D模擬賽</p><p>  機器人杯2D模擬賽用一個叫做足球服務(wù)器的模擬器去做足球賽的仿真。足球服務(wù)器提供了一個研究多終端系統(tǒng)的標(biāo)準(zhǔn)平臺,22個終端(每隊11個)與服務(wù)器交換信息,服務(wù)器以2D足球賽的模式模擬球員、足球及場地。每100ms足球服務(wù)器通過接口通訊方式從每個終端接收指令,終端向它所控制的模擬球員發(fā)送將要被執(zhí)行

7、的(不完全)的低級信息(如沖,轉(zhuǎn),踢),終端只能以一種不可靠的窄帶通訊信道相互交流信息。這個信道在服務(wù)器中是內(nèi)置的。足球服務(wù)器模擬(不完全的)球員的感知,并每隔150ms向各個終端發(fā)送簡要的分析(如目標(biāo),球隊員和球,方向距離及相對速度),終端的場地視野僅限于整個場地的一部分。足球服務(wù)器實行大多數(shù)基本人類足球規(guī)則,其中包括越位,角球和射門,并模擬一些基本的球員限制,比如最大跑速及踢球力度,和耐力限制等(nom99)。</p>

8、<p>  每隊一個外加的終端可以以“教練”的身份與其他終端聯(lián)系,“教授”的特點是可以看到整個場地并在比賽中止時(如發(fā)任意球時)向其他終端發(fā)送策略信息。</p><p>  足球顯示器(圖2)作為又一個終端與足球服務(wù)器交換信息。并為人類提供一個二維的比賽視圖,其他類型終端可以以相同的方式與服務(wù)器聯(lián)系,完成一些功能,如三維視圖,自動實況報道及統(tǒng)計分析。</p><p>  圖2

9、機器人杯2D模擬賽</p><p>  在比賽中并沒有實際的機器人,但觀眾可以通過大屏幕來觀看比賽。這看起來有點像一個巨大的電腦游戲。每個模擬機器人可以擁有自己的踢球策略和特點,并且每個模擬足球隊實際上由一組程序設(shè)計員組成。為使比賽能夠順利完成,許多電腦以網(wǎng)絡(luò)聯(lián)接了起來,比賽共持續(xù)10分鐘,每個半場5分鐘。</p><p>  圖3 機器人杯的3D模擬賽</p><p&

10、gt;  2.2機器人杯3D虛擬比賽</p><p>  3D比賽利用了一種虛擬器,這種虛擬器以在2003年機器人杯研討會上提出的虛擬系統(tǒng)和在2002年機器人杯研討會上提出的spades模擬中間設(shè)備系統(tǒng)為基礎(chǔ),這種模擬器可以在source forge(圖3)上下載。未來的3D足球賽的一個目標(biāo)是虛擬具有關(guān)節(jié)的機器人,比如類人機器人。</p><p>  編譯和安裝rcsserver 3D,你

11、需要安裝軟件包,你可以以兩種方法安裝rcsserver 3D,一種是簡捷安裝,一種是完整安裝。在完整安裝方式下,你得到一個附加的庫(叫做kerosin)這個庫對顯示對象具有良好的效果,特別是關(guān)節(jié)型對象(這是由一個以上的幾何體組成的對象,幾何體之間都是以關(guān)節(jié)連接的),這些特性并不是虛擬足球中必須的,在系統(tǒng)默認(rèn)的簡捷方式安裝中,你得到的一個不是那么吸引人的openGL,圖像要改為完全安裝,需要充許“enable-kerosin”標(biāo)簽,直到確

12、認(rèn)殼體腳本。如果想知道通用安裝所需要的庫,請看下面介紹的詳細(xì)文本:</p><p><b>  spades</b></p><p> ?。蛇\行的版本:1.0及其以前版本;</p><p>  -可從http://sourceforge.net/projects/spades-sim下載;</p><p>  -描述:

13、智能體中間件,處理時機選擇問題及網(wǎng)絡(luò)工作;</p><p> ?。郊有畔ⅲ耗阈枰粋€近期的expat for sapdes版本。</p><p><b>  ruby</b></p><p> ?。蛇\行服本:1.8.0或者更新的版本;</p><p> ?。瓘膆ttp://www.ruby-lang.org/下載;&

14、lt;/p><p><b>  描述:腳本語言;</b></p><p>  附加信息:如果你自己編譯ruby,你需要打開共享功能。</p><p><b>  boost</b></p><p> ?。梢赃\行的版本:1.30.2,1.31.0;</p><p>  -可從ht

15、tp://www.boost.org/下載;</p><p>  描述:C++編程擴展。</p><p><b>  ode</b></p><p>  -可運行版本:0.039;</p><p>  -可從http://sourceforge.net/projects/open-de下載;</p><

16、;p> ?。枋觯河脕砟M關(guān)節(jié)連接的剛體的動態(tài)特性。</p><p>  openGL,GLUT</p><p>  你需要openGL和GLUT頭文件來為可視化提供支持。這可能需要依靠你的顯卡支持(GLUT是openGL的效用工具);</p><p> ?。荴Free86-Mesa-devel的一部分;</p><p> ?。惚仨?/p>

17、用linux distro來得到它。</p><p>  圖4 小型機器人比賽</p><p>  2.3小型機器人杯比賽</p><p>  球場必須為矩形,大小包括邊界線,標(biāo)準(zhǔn)長度:4900mm,寬度:3400mm。一個小型的機器人杯比賽在兩組機器人中進行,每組5個人,每個機器人必須限制在一定的尺寸內(nèi),該尺寸規(guī)定在F180條規(guī)定中進行了詳細(xì)的說明:機器人必須

18、能放在直徑為180mm的圓圈內(nèi),并且不高于15cm,除非利用機載可視化系統(tǒng)。機器人在一個鋪有綠地毯的2.8米長2.3m寬的場地中踢球,球是一個桔黃色的高爾夫球。機器人分為兩種類型,一種是有局部機載視覺傳感器的機器人,一種是具有全局視覺的機器人。全局視覺機器人是現(xiàn)在最普及的類型。利用一個置頂?shù)恼障鄼C和場外的PC機去判定和追蹤在場內(nèi)移動的機器人。置頂相機被固定在一個高出球場平面3米的一個相機桿上。局部視覺機器人擁有自己的傳感器。視覺信息可以

19、直接通過機器人本身處理,也可以傳到場外的PC機上處理。場外PC是用來傳達(dá)裁判指令,并在置頂視覺系統(tǒng)中傳遞位置信息給機器人,典型的場外PC同樣做好許多協(xié)作和控制的處理工作即使它沒有做全部的工作。最常用的通訊利用無線通訊方式,并且通常用專用的商業(yè)化的FM傳送/接收裝置,盡管至少有一支隊成功地利用了IRDA技術(shù)。</p><p>  圖5 中型機器人比賽</p><p>  2.4中型機器人比

20、賽</p><p>  兩隊帶有全部機載傳感器的球隊在場地踢足球,每支隊伍四個人,物體是通過顏色來辨別的。機器人之間的交流(如果有的話)是通過無線方式來交流的,比賽過程中沒有人類的干預(yù),除非從場地放入或移走機器人。</p><p><b>  2.5四足機器人賽</b></p><p>  四足機器人賽中參賽隊伍必須用競賽委員指定的沒有任何硬件

21、改動的機器人。</p><p>  在2004年機器人賽中人們可以選用以下三種方式其中一種組隊:</p><p> ?。璖ONY娛樂機器人AIBO ERS-210/210A</p><p>  -SONY娛樂機器人AIBO ERS-7</p><p><b> ?。瓋煞N機器人混用。</b></p><

22、p>  四個與SSL相關(guān)的主要技術(shù)問題如下所列:</p><p>  堅實的機械結(jié)構(gòu)。一個能在SSL中踢出好水平的機器人必須速度快,并且能夠抵抗強烈的撞擊,一般來說SSL機器人能在從桌面上掉落下來的情況下仍能夠繼續(xù)踢球。近兩年機器人結(jié)構(gòu)設(shè)計方面有了一些新的重點,那就是方向選擇性驅(qū)動和帶有允許機器人控球的帶球棍。</p><p>  可靠的無線通訊。這個可能是SSL中單個未解決的最困難

23、的問題。大多數(shù)隊伍利用同樣的RF條來進行通訊。并且在過去這導(dǎo)致了嚴(yán)重的干擾問題。因為同時安排兩場比賽相當(dāng)困難。聯(lián)賽的時間變得很長。像WAVElan card和藍(lán)牙技術(shù)模塊將會在未來被開發(fā)出來。</p><p>  對機器人行為的良好編程??梢哉f大多數(shù)SSL球隊采用了具有簡單策略目標(biāo)的純反應(yīng)式設(shè)計。足球場地相對于機器人來說太小意味著為機器人計算復(fù)雜的策略并不值得。由于機器人相對于足球場地的運動速度過快,大多數(shù)系統(tǒng)的

24、范圍僅僅是對未來系統(tǒng)的一個簡單框架。因此,如果想通過編程來實現(xiàn)更復(fù)雜的策略,就必須將擴大場地的研究作為主要的問題。</p><p>  圖6 四足機器人比賽</p><p>  2.6類人機器人比賽</p><p>  類人機器人顯現(xiàn)出了足球運動員的基本技巧,比如射門或防止對方進球。相關(guān)的對象以顏色來進行區(qū)分。由于一些類人機器人具有遠(yuǎn)程操控的特點,人類干預(yù)在類人

25、機器人的比賽中是充許的。</p><p>  3把足球看作是一個多智能體的環(huán)境:</p><p>  從分布式人工智能和多智能體研究方面來看,機器人杯足球賽是一個特殊的但卻非常吸引人的實時多智能體環(huán)境。如果我們把一個足球隊看作多智能體的系統(tǒng),許多有趣味的研究就會浮現(xiàn)出來。</p><p>  圖7 類人機器人比賽</p><p>  在一場

26、比賽中,我們有兩個競爭隊伍,每個隊伍有一個全隊的共有目標(biāo),那就是贏得比賽。兩隊的目標(biāo)是不相容的,對方的球隊可以看作是動態(tài)的阻礙環(huán)境。這個環(huán)境可以妨礙全隊的目標(biāo)實現(xiàn)。為了實現(xiàn)這個目標(biāo),每個隊成員必須動作迅速,靈活并且能夠互相協(xié)作,并把局部和全局環(huán)境考慮在內(nèi)。</p><p>  球隊可能有一些全局(整個球隊范圍內(nèi))策略去實現(xiàn)共同目標(biāo),并且需要局部和全局的技巧來實現(xiàn)子目標(biāo)。然而,考慮到如下所列的挑戰(zhàn):</p&g

27、t;<p>  -比賽環(huán)境,也就是說隊友和對手的動態(tài)程度非常高;</p><p> ?。總€球員的感知可以被局部限制;</p><p> ?。總€球員的角色可能不一樣;</p><p> ?。騿T之間的交流是有限的,因此每個智能體必須在資源有限的環(huán)境下表現(xiàn)得非常靈活并且具有自主特性。</p><p>  通過對這些問題的總結(jié),我

28、們可以認(rèn)為機器人足球是一種基于高動態(tài)特性環(huán)境的協(xié)作的分布式的實時計劃方案。在為實現(xiàn)共同目標(biāo)而實行的分布式協(xié)作計劃中,重要任務(wù)包括在每個智能體上生成有潛力的局部計劃,并協(xié)調(diào)這些局部變化,問題空間的動態(tài)變化,比如目標(biāo)變化頻率相對于每個計劃者的性能來說是相當(dāng)大的。輪流產(chǎn)生計劃和執(zhí)行語句的反應(yīng)式計劃被認(rèn)作是一個有效的方法,至少對一個要處理這些動態(tài)問題的智能體來說。</p><p>  對協(xié)作計劃安排來說,現(xiàn)實中有許多經(jīng)常

29、性變化的問題空間或每個智能體存在能力被局部限制的問題。在通訊耗費和全局計劃的準(zhǔn)確性上有一個折中(這被叫做預(yù)期/執(zhí)行折中)。通訊耗費是在協(xié)調(diào)智能體局部計劃與全局計劃所必須的。通信耗費與處理耗費之間的關(guān)系的研究向我們展現(xiàn)了這個問題。這個研究關(guān)心的是FA/C假設(shè)的可靠性和優(yōu)化局部計劃與全局計劃準(zhǔn)確性兩者之間的關(guān)系。在動態(tài)問題空間中的反應(yīng)式協(xié)作計劃安排已經(jīng)多次在基于追逐模式比賽(捕獵者-獵物模式)中提出并評估。然而追逐賽是一個相對簡單的比賽,這

30、種比賽環(huán)境一般是為了便于單智能體結(jié)構(gòu)的研究。</p><p>  我們可以看出,機器人杯足球賽將會為分布式人工智能和多智能體研究提供一個更強勁,集成度更高的令人激動的先驅(qū)評價環(huán)境。</p><p>  4為機器人杯所做的關(guān)于現(xiàn)實機器人的研究:</p><p>  在這部分,我們討論關(guān)于實現(xiàn)現(xiàn)實機器人參加機器人杯的幾個研究性問題。</p><p&g

31、t;  設(shè)計機器人杯球員和控制指令:現(xiàn)存機器人球員己經(jīng)被設(shè)計得能執(zhí)行大部分單一的行為動作。比如前進、帶球、旋轉(zhuǎn)。一個機器人杯球員應(yīng)該被設(shè)計得能夠執(zhí)行多重子任務(wù),比如射門(包括踢球)、帶球(前進)、傳球、頂球和扔球。這些指令常常包括一些避開對手的普通行為。大體上說有兩種方法去建造機器人杯機器人:</p><p>  -分別設(shè)計每個部分,每個部分專門為一個動作而設(shè)計,然后將它們組裝成一體。</p>&l

32、t;p> ?。O(shè)計一到兩個能夠完成多重子任務(wù)的元件。</p><p>  方法1看起來設(shè)計較為簡單,但建造較為復(fù)雜。反之亦然。由于機器人杯球員應(yīng)當(dāng)能夠快速移動因此它必須緊湊些。因此法2應(yīng)是機器人杯機械設(shè)計的一個新目標(biāo)。我們需要緊湊的強有力的具有寬動態(tài)范圍的驅(qū)動。同時,我們應(yīng)開發(fā)成熟的控制技術(shù)。這種控制技術(shù)應(yīng)能使多重活動部件盡可能少。并使能量消耗達(dá)到最少。機器人杯參賽者的終極目標(biāo)是建造一種類人機器人,它可用自

33、己的腿腳來跑和踢,并傳球。它可以用自己的胳膊來扔球。并且它可以用頭來頂球。建造一支類人型機器人隊伍在現(xiàn)在看起來是不可能的。</p><p>  視覺和傳感器整合:視覺信息是一種豐富的信息資源,它不光能感知外部世界,同時也能感知機器人的行動效果。計算機視覺研究人員一直在探索一種準(zhǔn)確的能從2D視覺信息轉(zhuǎn)化的3D模型并相信3D模型是最有力的表現(xiàn)。它可以用在很多應(yīng)用中。比如視覺生成并形成數(shù)據(jù)庫、機器人操作和導(dǎo)航。然而,費

34、時的3D再現(xiàn)對機器人杯球員的任務(wù)來說可能不是必須的,也不是最優(yōu)的。為了能對周圍情況做出反應(yīng),機器人杯需要快速從周圍環(huán)境中獲取信息,來選取自己的行為方式。我們不建議采取專用的視覺系統(tǒng),因為視覺系統(tǒng)是一種用特殊方式與周圍世界交互作用的復(fù)雜系統(tǒng)。機器人杯是這個世界的一部分,它將會弄清視覺的角色和評價在電腦視覺領(lǐng)域前途未卜的圖像處理的表現(xiàn)。除視覺系統(tǒng)外,機器人杯球員需要其他的感應(yīng)裝置比如聲納及觸覺感應(yīng)和力與轉(zhuǎn)矩的感受來區(qū)分視覺信息。同樣,機器人

35、杯球員需要實時處理多傳感器整合和集成信息。因此,粗略利用多傳感器整合系統(tǒng)的直接辦法看起來并不適合。我們就為機器人杯開發(fā)一種傳感器整合集成的方法。</p><p>  學(xué)習(xí)型機器人行為:單個球員必須能夠執(zhí)行幾種動作,其中的每一個動作都都是根據(jù)當(dāng)前周圍環(huán)境來選定的,考慮到傳感器信息處理和行動執(zhí)行的不確定性,為所有的情況編定機器人行為是不可行的。機器人學(xué)習(xí)法看起來很有前途。作為一種機器人學(xué)習(xí)方法,強化學(xué)習(xí)最近引起了人們

36、的廣泛注意。這種學(xué)習(xí)方法用極少的推理卻得到了高性能反應(yīng)和適應(yīng)行為。然而大多數(shù)現(xiàn)在的應(yīng)用只有在電腦在虛擬環(huán)境下仿真才能夠?qū)崿F(xiàn)?,F(xiàn)實機器人應(yīng)用極為少見(silva99)。對強化學(xué)習(xí)來說機器人杯是一個很好的平臺,因為強化學(xué)習(xí)的優(yōu)勢大部分取決于機器人所能達(dá)到的大型和復(fù)雜任務(wù)的程度。</p><p>  在機器人聯(lián)賽的基礎(chǔ)階段單對單的競賽看起來是可行的。由于球員要考慮對方的運動,問題的復(fù)雜程度要比沒有對手的情況下射門要高出

37、很多。為減少這種復(fù)雜程度,任務(wù)分解是一種常用的辦法。Fredrik提出一種學(xué)習(xí)避開守門員并射門的行為的方法(Fredrik00)射門和躲避是分別獨立學(xué)習(xí)得到的,并且這兩種行為在學(xué)習(xí)過程中相互協(xié)作,由于有限的視覺區(qū)域,他們的方法仍然需要承受巨大的狀態(tài)空間,并且存在觀察及聯(lián)絡(luò)方面的問題。</p><p>  Kum提出一種反應(yīng)式直接法來構(gòu)架在動態(tài)環(huán)境中的實時智能控制。在一個單對單的類似足球比賽的游戲中應(yīng)用了他的方法,

38、由于它的方法需要全局感知場地內(nèi)機器人的位置,所以這種方法并不能應(yīng)用于只允許智能體感知(請查看規(guī)則部分)的機器人杯比賽。在最終比賽中,考慮使用多對多的比賽,在這種情況下,機器人必須具有集體行為,作為一個團隊定義所有團隊行為看起來是不可能的,特別是在當(dāng)某個復(fù)合動作需要被執(zhí)行的時候。很難找到一個學(xué)習(xí)這些行為(也就是集體性行為)的簡單方法。我們將不會定義某種情況為所有球員及球的準(zhǔn)確位置,僅僅是可能將他們分類為某種模式,或者我們可以考慮模仿式協(xié)作

39、。</p><p>  另外,與機器人杯相關(guān)的問題比如任務(wù)描述和環(huán)境建模也是一些具有挑戰(zhàn)性的課題。當(dāng)然,把解決以上問題的方法集成到一個物理實體上是最困難的一個問題。</p><p>  5 機器人的相關(guān)問題:</p><p>  機器人足球比賽的實現(xiàn)是基于硬件或是模仿式機器人。規(guī)則與真人足球比賽相類似。由硬件實現(xiàn)的機器人足球賽的研究涉及電腦、自動化、控制、傳感器技術(shù)

40、、無線通訊、精密機械、模仿材料和無數(shù)前沿的研究和綜合、集成。模仿式機器人足球賽在標(biāo)準(zhǔn)軟件平臺上運行,它包含控制技術(shù)、通信、傳感器和其他一些方面,研究的關(guān)鍵問題是一些先進的功能,如系統(tǒng)內(nèi)的協(xié)作動態(tài)判斷和及時的計劃、機器人的學(xué)習(xí)和一些當(dāng)前人工智能的一些熱點。因此,在國際人工智能領(lǐng)域,機器人足球賽被認(rèn)作是一個在未來50年內(nèi)的一個標(biāo)準(zhǔn)的課題,就像在人和電腦間進行的國際象棋賽一樣。機器人足球賽為人工智能理論應(yīng)用到實際做出了許多貢獻。同樣它為檢驗新

41、想法新技術(shù)和促進相關(guān)技術(shù)的發(fā)展做出了幫助。一系列應(yīng)用到機器人足球賽的新技術(shù)將會促進社會經(jīng)濟文化的發(fā)展。機器人足球賽不僅是一種具有高科技水平的前沿競賽,同樣也提供了真正比賽提供的休閑娛樂及樂趣。</p><p>  我們可以預(yù)料這個活動將會產(chǎn)生巨大的市場需求和新的工業(yè)機遇。而且還會帶來不可估量的經(jīng)濟效益和社會應(yīng)用。</p><p>  機器人杯研究目標(biāo)是為分布式系統(tǒng)提供一個測試平臺,它以一種

42、特殊的方式包含了以下幾個研究目標(biāo):</p><p> ?。瓩C器人形態(tài)。現(xiàn)在機器人利用輪子和軌道來組成形體,而人類球員不會用這些東西來在球場上踢球。所以我們必須把機器人建造得跟人類相似。比如具有相同的姿態(tài),結(jié)構(gòu)和體重。</p><p> ?。瓩C器人的軀體。如果機器人充滿了鐵和塑料,人們將會害怕接觸它。所以,機器人必須擁有自己的肌肉并且可以與人類相接觸。</p><p>

43、;  -機器人能源?,F(xiàn)在足球機器人的能源是電池。但是只能用幾分鐘。在將來,足球機器人必須跑和移動40~45分鐘。那意味著電池必須體具有重量輕和能量大的特性。</p><p>  -機器人技巧?,F(xiàn)在兩腿機器人能夠爬樓梯。最好的足球機器人是SONY公司的四足狗。50年后機器人一定可以像人一樣跑跳射門和帶球。人們可以做到的機器人也可以做到。</p><p>  -機器人智能。高級球員用他們的大腦

44、來踢球,所以明星球員的智力必定很高。在 1977年IBM的深藍(lán)電腦擊敗了卡斯帕羅夫,但是IBM只用了16RISK6000,所以在將來內(nèi)置足球機器人球員的內(nèi)置微型計算機一定會非常優(yōu)秀。</p><p> ?。瓩C器人的感覺。傳感器部分將會被隨意放置,比如,它可以擁有六個眼睛,并利用聲納和無線通訊網(wǎng)絡(luò)?,F(xiàn)在的傳感器技術(shù)不能解決圖像理解觸摸力度和內(nèi)置傳感器的功能與效率的問題。所以我們必須解決這些問題。</p>

45、<p>  6 機器人杯和MAS(多智能體)的關(guān)系:</p><p>  6.1智能體MAS和機器人杯</p><p>  機器人杯是一個典型的MAS(Multi-agent system多智能體系統(tǒng))模型,我們可以把7個機器人當(dāng)做7個終端,這將會涉及MAS一些相關(guān)技術(shù),比如通訊和協(xié)作。這些技術(shù)正是MAS的核心技術(shù)。</p><p>  智能體是一個近

46、幾年在電腦科學(xué)領(lǐng)域的一個重要的概念,這個概念已經(jīng)被廣泛應(yīng)用到了人工智能領(lǐng)域、分布式計算機系統(tǒng)學(xué)等等。同時這個概念提供了一個嶄新的分布式開放系統(tǒng)的設(shè)計路線。它被認(rèn)作是“一個軟件發(fā)展的重大突破”,在AI領(lǐng)域人們把智能體當(dāng)做計算機化的實體,它能獨立完成某種任務(wù),并且具有在某種環(huán)境下的生命周期估計。人們同樣把由多個智能體組成的可相互交流和互動的系統(tǒng)叫做MAS。</p><p>  大體上認(rèn)為智能體研究可以分為智能代理、M

47、AS和智能導(dǎo)向編程(AOP)。他們之間并不是相互孤立的。智能代理可以看做是智能體研究的一個微縮級別。但AOP和發(fā)展工具或者AOP平臺目的是為了MAS研究服務(wù)。因此,從某種程度上說,我們可以說這三個項目對MAS研究來說是一體的,這種說法與我們現(xiàn)實環(huán)境相一致,因為大多數(shù)現(xiàn)實系統(tǒng)屬于MAS。</p><p>  MAS是機器人杯的基礎(chǔ)技術(shù),機器人杯是MAS系統(tǒng)的一個典型。很明顯,機器人杯技術(shù)包括一些智能體相關(guān)技術(shù)比如協(xié)

48、調(diào)規(guī)則、可靠的通信、死鎖和一些其他的技術(shù)。這些技術(shù)是MAS的核心技術(shù)。對于一個想?yún)⒓訖C器人杯的研究人員來說最基本的問題是設(shè)計一個多智能體系統(tǒng)。這個系統(tǒng)可以實時做出響應(yīng),他同樣可以執(zhí)行一個合理的面向目標(biāo)的行動。由于足球比賽空間巨大為所有可能情況和條件還有智能體行為編碼是不可能的,因此,讓智能體學(xué)會策略十分關(guān)鍵。而且這些與智能體研究的一些技術(shù)密切相關(guān)。這些包括:</p><p>  -在協(xié)作環(huán)境下的機器學(xué)習(xí)</

49、p><p> ?。璏AS的構(gòu)建:及時的MAS團隊協(xié)作控制和命令執(zhí)行。</p><p><b> ?。M對手。</b></p><p>  6.2 MAS系統(tǒng)的協(xié)調(diào)</p><p>  由于機器人杯是多智能體系統(tǒng),智能體間協(xié)調(diào)和控制問題便成了要解決的重要問題。如果可以被恰當(dāng)?shù)亟鉀Q,那將會給MAS帶來很多好處比如:降低協(xié)調(diào)的花

50、費;加快整個系統(tǒng)的反應(yīng)速度;確立集體和個體行動的效用關(guān)系;保護缺乏推理能力的機器人并給帶有強烈冒險精神的智能體帶來好處。</p><p>  解決等待其他智能體執(zhí)行完任務(wù)、隊內(nèi)協(xié)作等問題。在MAS中協(xié)作和控制問題實際上是有智能體的群體行為(群體行為概念是意味著在群體活動中,發(fā)起行為的個體將會從與其他個體交換資源的過程中受益,盡管這些資源對它來說并不是重要的)引發(fā)的。因此,研究MAS的群體行為變成了最基本的問題?,F(xiàn)

51、在MAS群體性研究者已經(jīng)取得了一部分成就。但是由于缺少進一步的MAS群體性研究,當(dāng)前的協(xié)作和控制研究仍然存在許多未解決的問題,比如:</p><p>  -很難判定各個方法的優(yōu)缺點;</p><p> ?。^分注重個體研究等。</p><p>  協(xié)作法可以被分為如圖8所示的幾種方法。這里我們僅討論團隊目標(biāo)的隱性協(xié)作。作為一種隱性方法,集體目標(biāo)不僅可以用來降低成本,

52、同時也可以用來嵌入MAS集體行為并平衡個體和集體的獲益。集體目標(biāo)對MAS來說是一個好的突破。如果P是一個集體目標(biāo),那么(C是集體):</p><p> ?。總€智能體I把P當(dāng)做自己的目標(biāo);</p><p> ?。總€在C中的成員有意識的與其他成員共同完成這個目標(biāo);</p><p>  —每一個球員把P當(dāng)做目標(biāo),因為它們相互信任;</p><p&g

53、t;  -他們信任對方,所以如果智能體I達(dá)到了目標(biāo)P,則其他成員認(rèn)為自己也達(dá)到了目標(biāo)。</p><p>  圖8 協(xié)作方式分類</p><p>  現(xiàn)在集體目標(biāo)的研究包括兩個傾向,一個是研究傾向于智能體集體形成之前;一個是在智能體集體形成之后。</p><p>  6.3 MAS的通訊技術(shù)</p><p>  MAS研究中的通訊技術(shù)同樣是

54、一個非常重要的問題,它可以決定智能體通訊的優(yōu)勢和缺陷。如果它們流暢的交換信息,那將會提高智能體通訊的速度,因此,在己解決通訊問題的條件下,我們接著討論怎樣使的通訊更高效。</p><p>  計算機不能夠理解人類語言的一個重要原因是它需要很多知識資源,如果信息發(fā)送方能夠了解信息接收方的情況,它將會發(fā)出更多的長度短內(nèi)容少的信息。因此,有效的交流需要解決的如下兩個問題。</p><p>  首

55、先是利用背景信息。如果信息接收方能夠與信息發(fā)送方享有共同的背景信息,那么共同的背景可以作為一種信息資源來決定信息的意義,共同環(huán)境包括名詞、索引、當(dāng)前環(huán)境等,比如:Tom離開了家,并且他很快就會回來。如果信息接收方理解了第一句話“Tom離開了家”,那么它就會認(rèn)為第二句中的“他”指的是Tom。因此“他”可以替代Tom。盡管這只是做了很少的節(jié)約,但是大量的節(jié)約加起來就提高了效率。在這里背景環(huán)境同樣也可以叫做語言的預(yù)定義。并且預(yù)定義將會對正確發(fā)

56、送信息起到幫助作用,并且使得信息接收方能夠正確的理解接收的通話。</p><p>  接下來是消除歧義。用人類語言的人能通過知識資源來區(qū)分具有不同含義的字和詞組所要表達(dá)的真正含義。但是對智能體來說即使發(fā)送沒有歧義的信息也需要用到大量的字和非常復(fù)雜的表達(dá)。這包括許多方面:</p><p><b>  字的歧義</b></p><p>  同樣的字

57、可能有許多不同的意思,比如“Tom is hot”這句話不僅可以表示“Tom工作做得很好”,同樣也可以表示“Tom很熱”。由字的多義性引起的歧義叫做字的歧義。要解決這個問題,需要很多附加的知識和一個句子的上下文。</p><p><b>  句子結(jié)構(gòu)引起的歧義</b></p><p>  有時候一個句子可以用不同的方式來表達(dá)。也就是說詞語可以用不同的方式組合起來,這種

58、歧義叫做句子結(jié)構(gòu)的歧義。比如“He saw her at home”,這里不光可以說明“他在看”,同樣也可以表示“他在家里”。解決這個問題的辦法是讓接收方知道他或她的位置。</p><p><b>  引用的歧義</b></p><p>  重復(fù)使用代名詞和其他詞可能會引起不同的意思。解決這個問題的過程涉及到復(fù)雜的發(fā)送方與接收方對內(nèi)容的推理。</p>&

59、lt;p><b>  語言應(yīng)用的歧義</b></p><p>  如果共同的知識資源和對接收方背景的學(xué)習(xí)是不確定的,這種歧義叫做語言應(yīng)用的歧義。解決的辦法是確定背景的信息的接收使得雙方具有共同的信息。</p><p><b>  7 機器人的學(xué)習(xí):</b></p><p>  圖9 強化學(xué)習(xí)的略圖</p>

60、;<p>  機器人杯研究的關(guān)鍵問題是如何通過學(xué)習(xí)來提高智能體的智能,也就是提高球員的競爭能力。在許多學(xué)習(xí)方法中,強化學(xué)習(xí)法有望解決能感知環(huán)境的自律機器人智能體怎樣選擇進球最佳方案的問題。這種方法得到了廣泛的關(guān)注。強化學(xué)習(xí)的機制如圖9所示。讓智能體所在環(huán)境為S,把任意智能體可能執(zhí)行的動作叫做A。如果的St狀態(tài)下執(zhí)行任務(wù)At,那么智能體得到一個Rt的反饋,這個Rt是狀態(tài)-行動轉(zhuǎn)化后的一個直接結(jié)果。所以從總體(St,At,Rt

61、),智能體的任務(wù)是學(xué)習(xí)控制規(guī)則∏:S→A。這個規(guī)則可以使獎勵的期望和最大。</p><p>  對于機器人杯的電腦仿真賽,競賽的模式是客戶端/服務(wù)器的模式,在這種模式里,人們采用足球服務(wù)器的標(biāo)準(zhǔn)軟件平臺,參賽隊伍寫出他們自己的客戶端程序去仿真一個真正的足球賽,并且每個終端球員程序可以看做是與環(huán)境交互的智能體。在這個游戲里,每個智能體的行為如踢,沖,轉(zhuǎn)等不僅是一些底層的策略,這些同樣也是比賽中的關(guān)鍵問題。在踢球時對

62、環(huán)境也就是足球服務(wù)器的交互作用,和反饋端口返饋回當(dāng)前的環(huán)境信息。然后球員的任務(wù)就是去設(shè)計一個策略,使踢球效果達(dá)到最好,也就是說同時控制球并踢好球。如何協(xié)調(diào)整個隊伍進行協(xié)作學(xué)習(xí)也是一個比賽獲勝的關(guān)鍵問題。</p><p>  如圖9所示,除智能體和環(huán)境外,仍有四個重要的部分,包括策略功能、獎勵功能、還有評價功能和選擇性的環(huán)境模擬功能,策略學(xué)習(xí)是根據(jù)己觀察到的狀態(tài)定制出下一個狀態(tài)要執(zhí)行的動作。獎勵機制定義了強化學(xué)習(xí)的

63、目標(biāo)。它定義了一個可感知的環(huán)境狀態(tài)(或是狀態(tài)-動作對)作為一個值,這個值是機器人對狀態(tài)的本質(zhì)需求,也就是獎勵。在強化學(xué)習(xí)中單個智能體的目標(biāo)是在漫長的學(xué)習(xí)過程中將整個獎勵最大化,而評價功能顯示了在學(xué)習(xí)過程中什么是有用的。獎勵決定最直接的對環(huán)境的本質(zhì)需求。所以狀態(tài)值反映了將來可能狀態(tài)下的對狀態(tài)的需求和在將來狀態(tài)中獲得獎勵。由于環(huán)境模型模擬了模型行為,所以應(yīng)用這樣一個模型智能體可以預(yù)見環(huán)境將會對智能體的行為做出什么樣的反應(yīng)。強化學(xué)習(xí)可以解決大

64、量沒有優(yōu)先級的動態(tài)程序。一個強化學(xué)習(xí)的總體結(jié)構(gòu)如下所示:</p><p>  初始化學(xué)習(xí)固有狀態(tài)作為Io</p><p><b>  循環(huán)</b></p><p><b>  觀察當(dāng)前狀態(tài)S</b></p><p>  應(yīng)用評價功能V去選擇一個動作A=V(I,S)</p><p&

65、gt;<b>  執(zhí)行動作A</b></p><p>  讓R作為在狀態(tài)S下執(zhí)行A的直接獎勵</p><p>  應(yīng)用更新功能更新固有狀態(tài)I=U(I,S,A,R)</p><p>  通常固有狀態(tài)將會通過存儲好的學(xué)習(xí)算法計算并用狀態(tài)表和行為數(shù)據(jù)的方式編碼。通過遵循調(diào)整當(dāng)前狀態(tài)的強化命令,升級功能計算當(dāng)前固有狀態(tài)、輸入、要執(zhí)行的行為和新狀態(tài)的強化

66、,并且根據(jù)存儲起來的固有狀態(tài)信息,評價功能V計算固有狀態(tài)并輸入一個動作。在不同的強化學(xué)習(xí)中,U和V有一些不同點。</p><p>  Q學(xué)習(xí)僅僅是一個典型的強化學(xué)習(xí),在這種模式中,訓(xùn)練樣本并不跟<S,A>相似,相似的是給機器人行為的獎勵。所以很難通過學(xué)習(xí)得到最好的∏:S→A策略。這個問題可以通過學(xué)習(xí)定義在狀態(tài)和行為之上的評價功能來解決。通過學(xué)習(xí)評價功能,一個智能體獲得最基本的策略。一個很明顯的好的評價

67、功能是V*,當(dāng)V*(S1)>V*(S2)時,智能體將會希望進入S1,因為那樣會得到一個大一些的獎賞。當(dāng)然智能體會選擇行為,而不會選擇狀態(tài)。</p><p>  8研究機器人杯的意義:</p><p>  通過仔細(xì)考慮,我們可以提出更多的內(nèi)容和難題,我們看起來有理由拒絕“人類和機器之間的比賽”的想象,因為在當(dāng)前要達(dá)到這樣的目標(biāo)是不可能的。</p><p>  但

68、是回望歷史,過去有太多的我們先人無法想象的科學(xué)成就不是嗎?50年內(nèi)人們將會對科學(xué)發(fā)展產(chǎn)生新的認(rèn)識。從第一架萊特兄弟的飛機試飛成功到阿波羅號飛船登陸月球,大約僅有半個世紀(jì),同樣從第一臺電腦的誕生到“深藍(lán)”電腦打敗人類天才也是半個世紀(jì)。現(xiàn)在我們應(yīng)該明白,在50年后,我們在“人類和機器之間的比賽”面前將不會說不。</p><p>  我們現(xiàn)在需要的是創(chuàng)新與積極參與,我們應(yīng)該做的是盡最大努力去促進這個過程。</p&

69、gt;<p>  很明顯我們應(yīng)更加注重創(chuàng)新,機器人杯包含人工生命、能源、動力、材料等學(xué)科的發(fā)展,同樣它也孕育著機械、電子、控制、信息和電腦等與機器人相關(guān)的學(xué)科的重大突破。</p><p>  機器人杯雖然只是幾個球員的高科技球賽,但它卻向我們展示了令人費解的場景,比如機器人撞墻,兩個機器人相互糾纏,并且有些機器人顯得很迷亂,并不關(guān)心球在哪里。人們不理解為什么機器人的智力還趕不上個孩子。</p&

70、gt;<p>  這就是說讓機器人擁有人類的智慧及思考能力哪怕是三歲小孩的能力并不是一件容易的事情,到2050年,科學(xué)家們想組建一支全自動的能夠在與人類冠軍隊的比賽中獲勝的機器人隊伍。這是一個偉大的目標(biāo)。</p><p><b>  結(jié)語:</b></p><p>  這個論文討論了一些MAS系統(tǒng)和機器人杯的主要技術(shù)。這個主要目標(biāo)是讓讀者知道更多的關(guān)于智

71、能體系統(tǒng)的知識和引發(fā)智能體導(dǎo)向技術(shù)的快速成熟的原因。</p><p>  程序設(shè)計的發(fā)展總共有四個階段:面向過程的編程,模塊化編程,面向?qū)ο蟮木幊?,和智能編程。每個過程都是越來越抽象越來越模糊的建模工程,直到最終實現(xiàn)自動編程。因此智能化的編程是編程史上不可避免的一個過程,機器人杯是一個促進機器人基礎(chǔ)技術(shù)研究的動力。</p><p><b>  致謝:</b></

72、p><p>  本作品獲得了中國博士基金組織的支持。</p><p><b>  參考文獻:</b></p><p>  [1]Balch T, Mhybinette (2000), Social Potentials for Scalable Multi-Robot Formation. IEEE International Conf.on Ro

73、botics and Automation (ICRA 2000):73-80. </p><p>  [2]Magnus Boman(1999), Agent Programming in RoboCup'99. AgentLink NewsLetter, (4), November 1999. </p><p>  [3]Burkhard H D,et al (2002),Th

74、e Road to RoboCup 2050. IEEE Robotics & Automation </p><p>  Magazine. Jun. 2002: 31-38. </p><p>  [4]Cai Qing-sheng, Zhang Bo (2003), An agent team reinforcement learning model and its app

75、lication. (J). Journal of Computer Research and Development. 2003,37(9): 1087-</p><p>  1093. In China. </p><p>  [5]Cheng Xian-yi (2003), Agent Computing. Haerbin(China): Hei Longjiang science

76、and </p><p>  technology press. 2003. </p><p>  [6]Cheng Xian-yi et al(2004),.Reinforcement Learning in Simulation RoboCup Soccer. </p><p>  Proceeding of 2004 International Confer

77、ence on Machine Learning and Cybernetics </p><p>  (ICML2004),in China, IEEE Catalog Number:04EX826. pp244-248. </p><p>  [7]Fredrik Heintz (2000), RoboSoc a System for Developing RoboCup Agents

78、 for Educational Use. Master's thesis, Department of Computer and Information Science, Link.oping university, March 2000. </p><p>  [8]Hiroaki Y et al (2001), A Distributed Control Scheme for Multiple R

79、obotic Vehicles to Make Group Forma- tions.Robotics and Autonomous systems,2001, 125 –147. </p><p>  Silvia Coradeschi and Jacek Malec(1999), How to make achallenging AI course enjoyable using the RoboCup so

80、ccer simulation system. In RoboCup-98:The Second Robot World Cup Soccer Games and Conference, pages 120{124. Springer verlag, 1999. </p><p>  [9]Johan Kummeneje, David Lyb.ack, and H_akan L. Younes (1999), U

81、BU – an object-</p><p>  oriented RoboCup Team. In Johan Kummeneje and Magnus Boman, editors, Int7 </p><p>  1999 Papers. 1999. </p><p>  [10]Johan Kummeneje (1999), Simulated Robot

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論