一種機(jī)器人群體合作的進(jìn)化機(jī)器人方法

2022-09-04 15:28:01 編輯：卓華露來源：

導(dǎo)讀重組，由于交配或結(jié)合來自不同生物體的DNA片段而重新排列遺傳物質(zhì)，具有許多進(jìn)化上的優(yōu)勢(shì)。例如，它允許生物體從其基因組中去除有害的突變...

重組，由于交配或結(jié)合來自不同生物體的DNA片段而重新排列遺傳物質(zhì)，具有許多進(jìn)化上的優(yōu)勢(shì)。例如，它允許生物體從其基因組中去除有害的突變，并承擔(dān)更有用的突變。

洛林大學(xué)(Universite de Lorraine)的研究員阿姆·布馬扎(Amine Boumaza)最近試圖將這一過程應(yīng)用于在線體現(xiàn)的進(jìn)化機(jī)器人，這是一個(gè)機(jī)器人領(lǐng)域，專注于在機(jī)器人中復(fù)制進(jìn)化理論。在他的論文中，發(fā)表在GECCO‘19遺傳和進(jìn)化計(jì)算會(huì)議期刊上，他開發(fā)了一個(gè)受進(jìn)化啟發(fā)的重組操作員，并對(duì)其進(jìn)行了三項(xiàng)任務(wù)的培訓(xùn)，這些任務(wù)需要多個(gè)機(jī)器人之間的協(xié)作。

布馬扎說：“我的研究落在AI這個(gè)更廣泛的課題上，更具體地說，就是理解我們?nèi)绾文軌蛟O(shè)計(jì)出能學(xué)會(huì)完成有趣任務(wù)的代理人。“這個(gè)研究課題不是新的，而是比較老的，最近因?yàn)樯疃葘W(xué)習(xí)的成果給人留下了深刻的印象，引起了很多人的關(guān)注。在我的例子中，我對(duì)群體機(jī)器人更感興趣，目標(biāo)是讓大量小型機(jī)器人合作解決一項(xiàng)任務(wù)，并適應(yīng)其環(huán)境的變化。”

布馬扎被進(jìn)化策略，特別是重組策略所吸引，這些策略使生物體能夠更好地面對(duì)生命的挑戰(zhàn)，他開始研究是否可以將類似的機(jī)制應(yīng)用于機(jī)器人方法。他的假設(shè)是，如果在機(jī)器人中成功復(fù)制，重組將提高它們的性能和效率。

布馬扎說：“當(dāng)我們談到機(jī)器人代理時(shí)，我們通常假設(shè)一個(gè)物理實(shí)體體現(xiàn)在一個(gè)環(huán)境中(例如一個(gè)房間里的真空清潔機(jī)器人)。“這名特工使用一組傳感器(障礙傳感器、攝像機(jī)等)感知周圍環(huán)境。)，這可以給它某種環(huán)境的表征。該劑還可以在環(huán)境中使用效應(yīng)劑(馬達(dá)、手臂、清潔刷等)。這些操作是一個(gè)計(jì)算的結(jié)果，它是我們通常所稱的控制器(即控制器)的輸出。某種決策程序)。

控制器本質(zhì)上是一個(gè)程序，它處理機(jī)器人通過其傳感器獲得的感知，并向其執(zhí)行器輸出命令。例如，在機(jī)器人吸塵器的情況下，控制器將處理有關(guān)其周圍環(huán)境的信息，檢測(cè)其前面是否有灰塵，然后產(chǎn)生輸出，使機(jī)器人激活真空，并前進(jìn)到吸塵器。

布馬扎說：“采取進(jìn)一步措施，我們還可以考慮在同一環(huán)境中可以進(jìn)化的多個(gè)代理。“在這樣的環(huán)境下為每個(gè)代理設(shè)計(jì)控制器是一個(gè)非常困難的問題，對(duì)于這個(gè)問題還沒有有效的技術(shù)。在這種情況下，我們可以有很少的(例如，10到100個(gè))復(fù)雜機(jī)器人，或者許多非常簡(jiǎn)單的機(jī)器人(例如，數(shù)百個(gè))以通常來自昆蟲行為的方式進(jìn)行交互;這就是我們所說的群體機(jī)器人。”

當(dāng)開發(fā)一個(gè)能夠有效完成特定任務(wù)的機(jī)器人時(shí)，研究人員需要設(shè)計(jì)一個(gè)圍繞該特定任務(wù)量身定做的控制器。如果機(jī)器人所要操作的環(huán)境是簡(jiǎn)單的，那么設(shè)計(jì)這個(gè)控制器可能相當(dāng)容易，但大多數(shù)情況下，情況并非如此。

當(dāng)考慮到多個(gè)機(jī)器人在給定的環(huán)境中交互時(shí)，這變得更加困難，如果不是不可能的話。其主要原因是，人類開發(fā)者不可能預(yù)測(cè)每個(gè)機(jī)器人將遇到的所有情況，以及處理每種情況的最有效的行動(dòng)。幸運(yùn)的是，近年來，機(jī)器學(xué)習(xí)的進(jìn)步為機(jī)器人研究開辟了有趣的新可能性，允許開發(fā)人員集成能夠持續(xù)學(xué)習(xí)的工具，本質(zhì)上是訓(xùn)練控制器處理隨時(shí)間推移的許多情況。

布馬扎說：“以這種方式設(shè)計(jì)控制器的一種方法是使用進(jìn)化算法，從松散的角度講，它試圖模仿物種的自然進(jìn)化來進(jìn)化機(jī)器人代理控制器。這是一個(gè)迭代過程，當(dāng)動(dòng)物更好地適應(yīng)他們的環(huán)境時(shí)，控制器就會(huì)更好地解決任務(wù)。目標(biāo)不是模擬自然進(jìn)化，而是從中獲得一些啟發(fā)。”

進(jìn)化機(jī)器人只是研究人員可以用來設(shè)計(jì)機(jī)器人控制器的許多技術(shù)之一。然而，近年來，進(jìn)化方法越來越受歡迎，越來越多的研究旨在復(fù)制在動(dòng)物和人類中觀察到的進(jìn)化策略。

布馬扎說：“進(jìn)化機(jī)器人技術(shù)有一些優(yōu)勢(shì)，比如我們不需要指定如何解決任務(wù)(它是由算法發(fā)現(xiàn)/學(xué)習(xí)的)，只需要指定一種方法來衡量任務(wù)執(zhí)行得有多好。”它也有一些缺點(diǎn)，因?yàn)樗且粋€(gè)非常緩慢和計(jì)算密集的過程，可能很難在真正的機(jī)器人上執(zhí)行。此外，這些方法通常對(duì)性能度量非常敏感，因?yàn)樗鼈儗?duì)代理人所學(xué)到的行為具有條件作用。

布馬扎和該領(lǐng)域的其他研究人員一樣，一直在試圖開發(fā)新的方法來克服現(xiàn)有進(jìn)化機(jī)器人技術(shù)的缺點(diǎn)。在他最近的研究中，他特別提出了一種新的“交配算子”的使用靈感來自重組，它可以提高機(jī)器人模擬中的收斂速度。這是一個(gè)了不起的成就，因?yàn)樗罱K可以減少將一種方法從模擬轉(zhuǎn)移到真正的機(jī)器人所需的時(shí)間。

他將他的重組操作員應(yīng)用于三個(gè)集體機(jī)器人任務(wù)：運(yùn)動(dòng)、物品收集和物品覓食。然后，他比較了使用純突變版本的他的算法和不同的重組算子的性能。在他的實(shí)驗(yàn)中收集到的結(jié)果表明，如果設(shè)計(jì)正確，重組策略實(shí)際上可以改善一群機(jī)器人在他所考慮的所有任務(wù)中的適應(yīng)性。

在未來，他提出的新的進(jìn)化機(jī)器人方法可以用來提高機(jī)器人在需要多個(gè)代理之間協(xié)作的任務(wù)中的性能和適應(yīng)性。然而，在此期間，布馬扎計(jì)劃在新任務(wù)上測(cè)試他的算法，以確定他在他關(guān)注的三個(gè)任務(wù)中觀察到的改進(jìn)是否仍然有效。

布馬扎說：“如果我的方法能在真正的機(jī)器人上實(shí)現(xiàn)，也會(huì)很有趣。“從理論上講，沒有什么能阻止這一點(diǎn)，除了擁有大量的物理機(jī)器人，并接受處理‘現(xiàn)實(shí)差距’(即)。我們?cè)谀M中看到的通常不是在現(xiàn)實(shí)中會(huì)發(fā)生的事情，因?yàn)槟M的簡(jiǎn)化。群機(jī)器人是關(guān)于數(shù)字的，一個(gè)機(jī)器人的失敗不應(yīng)該阻礙群。因此，為了最終確定這種方法的有效性，必須在實(shí)際上對(duì)物理機(jī)器人進(jìn)行測(cè)試。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請(qǐng)聯(lián)系刪除！