2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
美國(guó)宇航局噴氣推進(jìn)實(shí)驗(yàn)室(JPL),德克薩斯A&M大學(xué)和卡內(nèi)基梅隆大學(xué)的研究人員最近開(kāi)展了一項(xiàng)研究項(xiàng)目,旨在實(shí)現(xiàn)自動(dòng)機(jī)器人的同步定位和規(guī)劃(SLAP)功能。他們?cè)贗EEE機(jī)器人交易中發(fā)表的論文提出了信念空間中的動(dòng)態(tài)重新規(guī)劃方案,這對(duì)于在不確定條件下運(yùn)行的機(jī)器人尤其有用,例如在不斷變化的環(huán)境中。
“在現(xiàn)實(shí)世界中運(yùn)行的機(jī)器人需要應(yīng)對(duì)不確定性,”進(jìn)行這項(xiàng)研究的研究人員之一Sung Kyun Kim告訴TechXplore。“例如,火星探測(cè)器將導(dǎo)航到科學(xué)目標(biāo)位置,但它也需要避免與障礙物碰撞。因此,準(zhǔn)確的本地化和經(jīng)濟(jì)有效的路徑規(guī)劃都是必不可少的能力。”
SLAP是在不確定性下運(yùn)行的自主機(jī)器人的關(guān)鍵能力,允許他們有效地導(dǎo)航空間,避開(kāi)障礙物并規(guī)劃他們到目標(biāo)位置的路徑。甲機(jī)器人在不確定性下的順序決策過(guò)程可以配制為POMDP(部分可觀察馬爾可夫決策過(guò)程),其需要在線連續(xù)地解決。然而,確保機(jī)器人有效和準(zhǔn)確地解決POMDP可能是相當(dāng)具有挑戰(zhàn)性的。
“我們提出了解決SLAP問(wèn)題的兩個(gè)主要想法,”Kim解釋道。“一個(gè)是利用反饋控制器使信念狀態(tài)可達(dá)。這可以有效地打破歷史的詛咒,這有助于我們解決更大的問(wèn)題。另一個(gè)是在運(yùn)行時(shí)動(dòng)態(tài)重新定義和改進(jìn)決策,增強(qiáng)解決方案質(zhì)量和穩(wěn)健性。當(dāng)存在系統(tǒng)建模錯(cuò)誤,動(dòng)態(tài)環(huán)境變化或間歇性傳感器/執(zhí)行器故障時(shí),動(dòng)態(tài)重新計(jì)劃尤其有用。“
Kim和他的同事在信念空間中設(shè)計(jì)了一種動(dòng)態(tài)重新規(guī)劃方案,允許機(jī)器人在不確定的情況下有效地導(dǎo)航它們周圍的空間,例如在變化的環(huán)境中或出現(xiàn)意外障礙時(shí)。他們的算法有兩個(gè)階段,離線和在線。
“在離線階段,我們的算法在信念空間中構(gòu)建一個(gè)稀疏圖,每個(gè)節(jié)點(diǎn)都有一個(gè)反饋控制器,然后在圖上解決粗略的全局策略(決定在當(dāng)前信念狀態(tài)下采取什么行動(dòng)),”Kim說(shuō)。“在線階段,每次更新信念狀態(tài)時(shí)都會(huì)進(jìn)行動(dòng)態(tài)重新計(jì)算。算法會(huì)在圖形上本地評(píng)估移動(dòng)到附近節(jié)點(diǎn)的每個(gè)動(dòng)作,并選擇成本最低的節(jié)點(diǎn)。執(zhí)行所選動(dòng)作并更新后目前的信念,它重復(fù)了重新計(jì)劃的過(guò)程。“
Kim和他的同事設(shè)計(jì)的方案利用了信念空間中反饋控制器的行為。換句話說(shuō),反饋控制器充當(dāng)信念空間中的漏斗,附近的信念狀態(tài)可能與控制目標(biāo)信念狀態(tài)收斂。這有效地解決了在規(guī)劃期內(nèi)解決POMPD-指數(shù)復(fù)雜性的關(guān)鍵問(wèn)題。
實(shí)際上,一旦算法的當(dāng)前信念與已知信念收斂,就沒(méi)有必要考慮導(dǎo)致當(dāng)前信念的行為和觀察。這最終會(huì)帶來(lái)更好的可擴(kuò)展性,允許機(jī)器人解決更復(fù)雜的導(dǎo)航問(wèn)題。
“在動(dòng)態(tài)重新計(jì)劃期間,提議的方法使用(粗略)全局策略引導(dǎo)局部?jī)?yōu)化,”Kim說(shuō)。“這意味著它可以做出非近視決策,不像其他具有有限后退視界的在線規(guī)劃者。簡(jiǎn)而言之,這種方法可以適應(yīng)環(huán)境中的動(dòng)態(tài)變化,并且盡管存在未經(jīng)模型化的擾動(dòng)或錯(cuò)誤,但仍可以穩(wěn)健運(yùn)行,同時(shí)使成本 - 全球意義上的有效計(jì)劃。“
通過(guò)消除不必要的穩(wěn)定步驟,Kim和他的同事設(shè)計(jì)的方法優(yōu)于基于反饋的信息路線圖(FIRM),這是一種用于解決POMDP的最先進(jìn)技術(shù)。將來(lái),信念空間中的這種動(dòng)態(tài)重新規(guī)劃方案可以在不同程度的不確定性下運(yùn)行的機(jī)器人中實(shí)現(xiàn)更好的SLAP能力。
“我們現(xiàn)在計(jì)劃將我們的方法應(yīng)用于現(xiàn)實(shí)世界的問(wèn)題,”金說(shuō)。“一個(gè)可能的應(yīng)用是火星直升機(jī) - 火星車導(dǎo)航和協(xié)調(diào)行星探測(cè)的原型,由JPL的Ali-akbar Agha-mohammadi博士領(lǐng)導(dǎo)的一個(gè)項(xiàng)目。飛越地形的直升機(jī)可以提供粗略的地圖,以便制定一個(gè)粗略的全球政策可以在離線階段獲得。隨后,流動(dòng)站將在在線階段動(dòng)態(tài)重新計(jì)劃,以完成安全且具有成本效益的導(dǎo)航任務(wù)。“
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。