震驚!雙足機器人界“跑步冠軍”轉行了,改組團搬磚了!
還記得那個曾創下百米賽跑世界記錄的雙足機器人界“博爾特”嗎?
它就是Cassie。單個Cassie是跑步冠軍,那麼當三個Cassie湊到一起,會發生什麼?
你以爲是超跑陣容?不不不,其實是組團搬磚!
還是得老老實實地搬磚打工(bushi)。
言歸正傳,多機器人協作可以更好地在複雜環境實現高效、穩定的運輸任務。最近,俄勒岡州立大學團隊提出了一種分散多雙足控制器(decMBC)的架構和訓練方法,首次實現了多個雙足機器人的有效載荷協作運輸!
三個 Cassie 雙足機器人一起搬運貨物:
轉彎 180度:
用力推其中一個,依然穩穩當當:
▍首個可擴展可重構的多雙足運輸系統
多機器人協作能夠克服單個機器人系統的侷限性,特別是在處理大型、重型有效載荷等任務中,輪式機器人是一種比較常見的方案,它們易於控制、有效性高、且車輪配置可擴展,但在非結構化的複雜、崎嶇地形中就無計可施了。
爲了突破該限制,同時保留多輪系統的控制和可重構性,俄勒岡州立大學研究團隊提出了“多雙足運輸”系統,他們的想法是:將車輪或輪式機器人替換爲可以任意附着在載體上的雙足機器人。這種設置可以實現多機器人系統在各種複雜地形上運輸,擴展到更具挑戰性的環境。
不過“多雙足運輸”也是一個巨大的挑戰,有腿機器人通常是不穩定且高度動態的,這使它們比輪式機器人更難控制。在運輸有效載荷和協調多個有腿機器人的同時保持穩定性,進一步增加了控制問題的複雜性。
爲了克服這一挑戰,研究團隊提出一種叫做分散多雙足控制器(decMBC)的架構和訓練方法,不限類型、不限配置、不限數量,該方案可以有效地應用於任何雙足機器人的高級運動控制上,而且可以任意增加雙足機器人數量或配置,無需重新訓練,具有高度可適應性、可擴展性、可訪問性!
▍分散控制器架構:避免機器人互相通信
先前關於“多雙足運輸”系統的工作主要集中在基於模型或學習的方法上,這些方法依賴於機器人交互的精確建模和明確的機器人間通信,對系統有很強的假設性,只能實現固定的機器人配置和數量,且受到重量的限制,無法靈活處理更重的負載,限制了“多雙足運輸”的可擴展性和實用性。
研究團隊設計了一種分散的控制器架構,它避免了機器人之間的通信,利用聯合電機動作來控制每個機器人控制點的高度、線速度、角速度等。具體架構包括:
神經網絡架構:使用循壞神經網絡架構來表示 decMBC,該架構允許通過循壞內部記憶進行依賴歷史的動作選擇。具體來說,網絡由兩個長短期記憶(LSTM)層組成,每個層包含64維隱藏狀態。這些層在每個時間步處理 decMBC輸入以形成內部隱藏狀態,然後由一個線性層處理,產生一個10維的動作向量,爲 Cassie 的每條腿指定5個電機設定值。
訓練集生成與學習:使用獨立近端策略優化方法 (Independent Proximal Policy Optimization, IPPO)對訓練數據集進行4階段的訓練:
第一階段:只對單個機器人進行訓練,目標是學習在其附着點爲載體命令操作的魯棒運動步態。
第二階段:在載體上添加擾動力和扭力的訓練,使機器人能夠抵抗擾動力。
第三階段:在沒有任何扭轉力的情況下,增加兩到三個機器人構型的訓練。這一階段確保每個機器人學會在遠離其附着點的隨機放置的載體控制點上操作。
第四階段:除了隨機化連接機器人的剛性杆的質量外,還要對機器人的基座和載體施加扭轉力。這確保了每個機器人在相對於載體控制點操作時經歷擾動力和變化的質量。
獎勵設計:旨在讓系統產生穩定的運動行爲,同時確保機器人協同遵循載體控制點的命令運動。由兩部分組成:局部獎勵和全局獎勵。
局部獎勵用於每個機器人穩定的運動行爲,獎勵保持一致的基座高度,懲罰機器人的突然運動,規範適當的足部對齊和步進頻率。同時,最大限度地減少電機的扭矩,以懲罰過度的能量消耗,並最大限度地減少站立時在載體上的附着點施加的力,確保機器人不會相互拉或推,而是保持載體穩定。
全局獎勵關注的是所有機器人在執行載體指令時的聯合行動表現,目的是最小化命令與實際的x速度、y速度、角偏航速度和控制點高度等之間的偏差。
▍實證評估:2-10個雙足機器人協作任務
研究團隊使用 Cassie 雙足機器人平臺對decMBC控制器進行了實證評估,在仿真中分別測試了數量從2個到10個的雙足機器人協作任務,讓它們協作搬運一個矩形載荷。機器人的放置方式確保它們均勻分佈,以保持靜態穩定性。
在矩形貨物搬運測試中,兩個機器人在原地測試中表現明顯較差,可能是因爲兩個機器人爲矩形載體提供的有限橫向支撐導致穩定性降低。隨着機器人數量的增加,故障率急劇下降,幾乎爲零,而功耗隨之增加。值得注意的是,功耗與機器人數量近似成線性關係,這表明機器人可以有效地合作,而不會對彼此施加過多反作用力。
除了矩形外,研究團隊還在仿真中測試了不同重量的載體(搬運貨物),比如麻袋(圓形)、長條木板及原木(圓柱體),展示出了系統保持穩定性、有效協調和適應不同有效載荷運輸任務的能力。
在現實環境中,研究團隊測試了2-3個Cassie 機器人多足系統,它們被剛性連接在一個重量支架上,還在重量架上增加了有效載荷,用作載體控制點。
▍結語與未來
這項研究由俄勒岡州立大學的協同機器人與智能系統(CoRIS)研究所提出,文章預發表在arxiv上,標題爲“Learning Decentralized Multi-Biped Control for Payload Transport(負載運輸的分散多雙足控制學習)”
“多雙足運輸”系統突破了目前多輪式機器人系統在複雜地形運動的限制,實現了多雙足機器人系統的穩定運行、有效協調,可適應不同有效載荷等功能。重要的是,該方法可以靈活配置不同類型和數量的雙足機器人,大大增加了系統的靈活性和可擴展力。研究人員表示:這是第一個在模擬和現實世界中展示這種可重構性水平的多足運輸系統。
不過,該系統目前僅在平坦表面上進行了仿真和測試,雖然理論上雙足機器人穿越複雜地形的能力很強,但還需要進一步驗證。另外,decMBC的仿真結果顯示了多達10個機器人的可擴展性,但真正從仿真走到現實世界的只有2-3個Cassie 機器人,更多數量的機器人協作運輸任務也需要進一步驗證。
除此之外,decMBC控制器目前完全依賴本體感覺傳感和相對機器人位置,而沒有納入額外的傳感模式或解決自主導航和高層決策挑戰。研究團隊計劃未來將decMBC與感知、規劃和控制模塊集成,進一步增強其在複雜環境中的能力。