您的位置: 首頁 >科技 >

一種機(jī)器人群體合作的進(jìn)化機(jī)器人方法

2022-09-04 15:28:01 編輯:卓華露 來源:
導(dǎo)讀 重組,由于交配或結(jié)合來自不同生物體的DNA片段而重新排列遺傳物質(zhì),具有許多進(jìn)化上的優(yōu)勢(shì)。例如,它允許生物體從其基因組中去除有害的突變...

重組,由于交配或結(jié)合來自不同生物體的DNA片段而重新排列遺傳物質(zhì),具有許多進(jìn)化上的優(yōu)勢(shì)。例如,它允許生物體從其基因組中去除有害的突變,并承擔(dān)更有用的突變。

洛林大學(xué)(Universite de Lorraine)的研究員阿姆·布馬扎(Amine Boumaza)最近試圖將這一過程應(yīng)用于在線體現(xiàn)的進(jìn)化機(jī)器人,這是一個(gè)機(jī)器人領(lǐng)域,專注于在機(jī)器人中復(fù)制進(jìn)化理論。在他的論文中,發(fā)表在GECCO‘19遺傳和進(jìn)化計(jì)算會(huì)議期刊上,他開發(fā)了一個(gè)受進(jìn)化啟發(fā)的重組操作員,并對(duì)其進(jìn)行了三項(xiàng)任務(wù)的培訓(xùn),這些任務(wù)需要多個(gè)機(jī)器人之間的協(xié)作。

布馬扎說:“我的研究落在AI這個(gè)更廣泛的課題上,更具體地說,就是理解我們?nèi)绾文軌蛟O(shè)計(jì)出能學(xué)會(huì)完成有趣任務(wù)的代理人。“這個(gè)研究課題不是新的,而是比較老的,最近因?yàn)樯疃葘W(xué)習(xí)的成果給人留下了深刻的印象,引起了很多人的關(guān)注。在我的例子中,我對(duì)群體機(jī)器人更感興趣,目標(biāo)是讓大量小型機(jī)器人合作解決一項(xiàng)任務(wù),并適應(yīng)其環(huán)境的變化。”

布馬扎被進(jìn)化策略,特別是重組策略所吸引,這些策略使生物體能夠更好地面對(duì)生命的挑戰(zhàn),他開始研究是否可以將類似的機(jī)制應(yīng)用于機(jī)器人方法。他的假設(shè)是,如果在機(jī)器人中成功復(fù)制,重組將提高它們的性能和效率。

布馬扎說:“當(dāng)我們談到機(jī)器人代理時(shí),我們通常假設(shè)一個(gè)物理實(shí)體體現(xiàn)在一個(gè)環(huán)境中(例如一個(gè)房間里的真空清潔機(jī)器人)。“這名特工使用一組傳感器(障礙傳感器、攝像機(jī)等)感知周圍環(huán)境。),這可以給它某種環(huán)境的表征。該劑還可以在環(huán)境中使用效應(yīng)劑(馬達(dá)、手臂、清潔刷等)。這些操作是一個(gè)計(jì)算的結(jié)果,它是我們通常所稱的控制器(即控制器)的輸出。某種決策程序)。

控制器本質(zhì)上是一個(gè)程序,它處理機(jī)器人通過其傳感器獲得的感知,并向其執(zhí)行器輸出命令。例如,在機(jī)器人吸塵器的情況下,控制器將處理有關(guān)其周圍環(huán)境的信息,檢測(cè)其前面是否有灰塵,然后產(chǎn)生輸出,使機(jī)器人激活真空,并前進(jìn)到吸塵器。

布馬扎說:“采取進(jìn)一步措施,我們還可以考慮在同一環(huán)境中可以進(jìn)化的多個(gè)代理。“在這樣的環(huán)境下為每個(gè)代理設(shè)計(jì)控制器是一個(gè)非常困難的問題,對(duì)于這個(gè)問題還沒有有效的技術(shù)。在這種情況下,我們可以有很少的(例如,10到100個(gè))復(fù)雜機(jī)器人,或者許多非常簡(jiǎn)單的機(jī)器人(例如,數(shù)百個(gè))以通常來自昆蟲行為的方式進(jìn)行交互;這就是我們所說的群體機(jī)器人。”

當(dāng)開發(fā)一個(gè)能夠有效完成特定任務(wù)的機(jī)器人時(shí),研究人員需要設(shè)計(jì)一個(gè)圍繞該特定任務(wù)量身定做的控制器。如果機(jī)器人所要操作的環(huán)境是簡(jiǎn)單的,那么設(shè)計(jì)這個(gè)控制器可能相當(dāng)容易,但大多數(shù)情況下,情況并非如此。

當(dāng)考慮到多個(gè)機(jī)器人在給定的環(huán)境中交互時(shí),這變得更加困難,如果不是不可能的話。其主要原因是,人類開發(fā)者不可能預(yù)測(cè)每個(gè)機(jī)器人將遇到的所有情況,以及處理每種情況的最有效的行動(dòng)。幸運(yùn)的是,近年來,機(jī)器學(xué)習(xí)的進(jìn)步為機(jī)器人研究開辟了有趣的新可能性,允許開發(fā)人員集成能夠持續(xù)學(xué)習(xí)的工具,本質(zhì)上是訓(xùn)練控制器處理隨時(shí)間推移的許多情況。

布馬扎說:“以這種方式設(shè)計(jì)控制器的一種方法是使用進(jìn)化算法,從松散的角度講,它試圖模仿物種的自然進(jìn)化來進(jìn)化機(jī)器人代理控制器。這是一個(gè)迭代過程,當(dāng)動(dòng)物更好地適應(yīng)他們的環(huán)境時(shí),控制器就會(huì)更好地解決任務(wù)。目標(biāo)不是模擬自然進(jìn)化,而是從中獲得一些啟發(fā)。”

進(jìn)化機(jī)器人只是研究人員可以用來設(shè)計(jì)機(jī)器人控制器的許多技術(shù)之一。然而,近年來,進(jìn)化方法越來越受歡迎,越來越多的研究旨在復(fù)制在動(dòng)物和人類中觀察到的進(jìn)化策略。

布馬扎說:“進(jìn)化機(jī)器人技術(shù)有一些優(yōu)勢(shì),比如我們不需要指定如何解決任務(wù)(它是由算法發(fā)現(xiàn)/學(xué)習(xí)的),只需要指定一種方法來衡量任務(wù)執(zhí)行得有多好。”它也有一些缺點(diǎn),因?yàn)樗且粋€(gè)非常緩慢和計(jì)算密集的過程,可能很難在真正的機(jī)器人上執(zhí)行。此外,這些方法通常對(duì)性能度量非常敏感,因?yàn)樗鼈儗?duì)代理人所學(xué)到的行為具有條件作用。

布馬扎和該領(lǐng)域的其他研究人員一樣,一直在試圖開發(fā)新的方法來克服現(xiàn)有進(jìn)化機(jī)器人技術(shù)的缺點(diǎn)。在他最近的研究中,他特別提出了一種新的“交配算子”的使用靈感來自重組,它可以提高機(jī)器人模擬中的收斂速度。這是一個(gè)了不起的成就,因?yàn)樗罱K可以減少將一種方法從模擬轉(zhuǎn)移到真正的機(jī)器人所需的時(shí)間。

他將他的重組操作員應(yīng)用于三個(gè)集體機(jī)器人任務(wù):運(yùn)動(dòng)、物品收集和物品覓食。然后,他比較了使用純突變版本的他的算法和不同的重組算子的性能。在他的實(shí)驗(yàn)中收集到的結(jié)果表明,如果設(shè)計(jì)正確,重組策略實(shí)際上可以改善一群機(jī)器人在他所考慮的所有任務(wù)中的適應(yīng)性。

在未來,他提出的新的進(jìn)化機(jī)器人方法可以用來提高機(jī)器人在需要多個(gè)代理之間協(xié)作的任務(wù)中的性能和適應(yīng)性。然而,在此期間,布馬扎計(jì)劃在新任務(wù)上測(cè)試他的算法,以確定他在他關(guān)注的三個(gè)任務(wù)中觀察到的改進(jìn)是否仍然有效。

布馬扎說:“如果我的方法能在真正的機(jī)器人上實(shí)現(xiàn),也會(huì)很有趣。“從理論上講,沒有什么能阻止這一點(diǎn),除了擁有大量的物理機(jī)器人,并接受處理‘現(xiàn)實(shí)差距’(即)。我們?cè)谀M中看到的通常不是在現(xiàn)實(shí)中會(huì)發(fā)生的事情,因?yàn)槟M的簡(jiǎn)化。群機(jī)器人是關(guān)于數(shù)字的,一個(gè)機(jī)器人的失敗不應(yīng)該阻礙群。因此,為了最終確定這種方法的有效性,必須在實(shí)際上對(duì)物理機(jī)器人進(jìn)行測(cè)試。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。