您的位置: 首頁 >科技 >

一種機器人群體合作的進化機器人方法

2022-09-04 15:28:01 編輯:卓華露 來源:
導(dǎo)讀 重組,由于交配或結(jié)合來自不同生物體的DNA片段而重新排列遺傳物質(zhì),具有許多進化上的優(yōu)勢。例如,它允許生物體從其基因組中去除有害的突變...

重組,由于交配或結(jié)合來自不同生物體的DNA片段而重新排列遺傳物質(zhì),具有許多進化上的優(yōu)勢。例如,它允許生物體從其基因組中去除有害的突變,并承擔(dān)更有用的突變。

洛林大學(xué)(Universite de Lorraine)的研究員阿姆·布馬扎(Amine Boumaza)最近試圖將這一過程應(yīng)用于在線體現(xiàn)的進化機器人,這是一個機器人領(lǐng)域,專注于在機器人中復(fù)制進化理論。在他的論文中,發(fā)表在GECCO‘19遺傳和進化計算會議期刊上,他開發(fā)了一個受進化啟發(fā)的重組操作員,并對其進行了三項任務(wù)的培訓(xùn),這些任務(wù)需要多個機器人之間的協(xié)作。

布馬扎說:“我的研究落在AI這個更廣泛的課題上,更具體地說,就是理解我們?nèi)绾文軌蛟O(shè)計出能學(xué)會完成有趣任務(wù)的代理人。“這個研究課題不是新的,而是比較老的,最近因為深度學(xué)習(xí)的成果給人留下了深刻的印象,引起了很多人的關(guān)注。在我的例子中,我對群體機器人更感興趣,目標是讓大量小型機器人合作解決一項任務(wù),并適應(yīng)其環(huán)境的變化。”

布馬扎被進化策略,特別是重組策略所吸引,這些策略使生物體能夠更好地面對生命的挑戰(zhàn),他開始研究是否可以將類似的機制應(yīng)用于機器人方法。他的假設(shè)是,如果在機器人中成功復(fù)制,重組將提高它們的性能和效率。

布馬扎說:“當我們談到機器人代理時,我們通常假設(shè)一個物理實體體現(xiàn)在一個環(huán)境中(例如一個房間里的真空清潔機器人)。“這名特工使用一組傳感器(障礙傳感器、攝像機等)感知周圍環(huán)境。),這可以給它某種環(huán)境的表征。該劑還可以在環(huán)境中使用效應(yīng)劑(馬達、手臂、清潔刷等)。這些操作是一個計算的結(jié)果,它是我們通常所稱的控制器(即控制器)的輸出。某種決策程序)。

控制器本質(zhì)上是一個程序,它處理機器人通過其傳感器獲得的感知,并向其執(zhí)行器輸出命令。例如,在機器人吸塵器的情況下,控制器將處理有關(guān)其周圍環(huán)境的信息,檢測其前面是否有灰塵,然后產(chǎn)生輸出,使機器人激活真空,并前進到吸塵器。

布馬扎說:“采取進一步措施,我們還可以考慮在同一環(huán)境中可以進化的多個代理。“在這樣的環(huán)境下為每個代理設(shè)計控制器是一個非常困難的問題,對于這個問題還沒有有效的技術(shù)。在這種情況下,我們可以有很少的(例如,10到100個)復(fù)雜機器人,或者許多非常簡單的機器人(例如,數(shù)百個)以通常來自昆蟲行為的方式進行交互;這就是我們所說的群體機器人。”

當開發(fā)一個能夠有效完成特定任務(wù)的機器人時,研究人員需要設(shè)計一個圍繞該特定任務(wù)量身定做的控制器。如果機器人所要操作的環(huán)境是簡單的,那么設(shè)計這個控制器可能相當容易,但大多數(shù)情況下,情況并非如此。

當考慮到多個機器人在給定的環(huán)境中交互時,這變得更加困難,如果不是不可能的話。其主要原因是,人類開發(fā)者不可能預(yù)測每個機器人將遇到的所有情況,以及處理每種情況的最有效的行動。幸運的是,近年來,機器學(xué)習(xí)的進步為機器人研究開辟了有趣的新可能性,允許開發(fā)人員集成能夠持續(xù)學(xué)習(xí)的工具,本質(zhì)上是訓(xùn)練控制器處理隨時間推移的許多情況。

布馬扎說:“以這種方式設(shè)計控制器的一種方法是使用進化算法,從松散的角度講,它試圖模仿物種的自然進化來進化機器人代理控制器。這是一個迭代過程,當動物更好地適應(yīng)他們的環(huán)境時,控制器就會更好地解決任務(wù)。目標不是模擬自然進化,而是從中獲得一些啟發(fā)。”

進化機器人只是研究人員可以用來設(shè)計機器人控制器的許多技術(shù)之一。然而,近年來,進化方法越來越受歡迎,越來越多的研究旨在復(fù)制在動物和人類中觀察到的進化策略。

布馬扎說:“進化機器人技術(shù)有一些優(yōu)勢,比如我們不需要指定如何解決任務(wù)(它是由算法發(fā)現(xiàn)/學(xué)習(xí)的),只需要指定一種方法來衡量任務(wù)執(zhí)行得有多好。”它也有一些缺點,因為它是一個非常緩慢和計算密集的過程,可能很難在真正的機器人上執(zhí)行。此外,這些方法通常對性能度量非常敏感,因為它們對代理人所學(xué)到的行為具有條件作用。

布馬扎和該領(lǐng)域的其他研究人員一樣,一直在試圖開發(fā)新的方法來克服現(xiàn)有進化機器人技術(shù)的缺點。在他最近的研究中,他特別提出了一種新的“交配算子”的使用靈感來自重組,它可以提高機器人模擬中的收斂速度。這是一個了不起的成就,因為它最終可以減少將一種方法從模擬轉(zhuǎn)移到真正的機器人所需的時間。

他將他的重組操作員應(yīng)用于三個集體機器人任務(wù):運動、物品收集和物品覓食。然后,他比較了使用純突變版本的他的算法和不同的重組算子的性能。在他的實驗中收集到的結(jié)果表明,如果設(shè)計正確,重組策略實際上可以改善一群機器人在他所考慮的所有任務(wù)中的適應(yīng)性。

在未來,他提出的新的進化機器人方法可以用來提高機器人在需要多個代理之間協(xié)作的任務(wù)中的性能和適應(yīng)性。然而,在此期間,布馬扎計劃在新任務(wù)上測試他的算法,以確定他在他關(guān)注的三個任務(wù)中觀察到的改進是否仍然有效。

布馬扎說:“如果我的方法能在真正的機器人上實現(xiàn),也會很有趣。“從理論上講,沒有什么能阻止這一點,除了擁有大量的物理機器人,并接受處理‘現(xiàn)實差距’(即)。我們在模擬中看到的通常不是在現(xiàn)實中會發(fā)生的事情,因為模擬的簡化。群機器人是關(guān)于數(shù)字的,一個機器人的失敗不應(yīng)該阻礙群。因此,為了最終確定這種方法的有效性,必須在實際上對物理機器人進行測試。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。