選單

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術

機器之心編輯部

波士頓動力 Atlas 展示了接近於人類的跑酷能力,能夠快速越過具有一定傾斜度的障礙物、執行快速轉身、跳躍等動作。這背後進行了哪些技術改進和創新呢?波士頓動力高階機器人工程師、Atlas 感知軟體開發負責人 Pat Marion 為大家詳盡地解讀了 Atlas 跑酷背後的技術。

幾天前,波士頓動力公司放出了雙足人形機器人 Atlas 的最新酷炫影片。這次,Atlas 展示了它的最新技能「跑酷」。

在一系列傾斜膠合板還有木箱壘成的階梯以及平衡木的場景挑戰中,Atlas 如履平地,表現堪稱完美。

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術

其實三年前,波士頓動力就曾釋出過 Atlas 跑酷的影片。不過當時,Atlas 跑起來顯得更僵硬,步伐也稍顯沉重。

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術

早期 Atlas 跨越障礙的影片。

短短几年時間,從硬體和外觀層面與先前沒有太大區別的 Atlas 在運動方式上有了顯著提升,平衡感也顯然更好。

波士頓動力在背後進行了哪些技術改進和創新呢?機器人需要具備哪些條件才能像人一樣奔跑、跳躍和跨越障礙呢?

波士頓動力高階機器人工程師、Atlas 感知軟體開發負責人 Pat Marion 為大家詳盡地解讀了 Atlas 跑酷背後的技術。

跑酷認知能力

機器人感知演算法的目的是將相機和雷達等感測器中的資料轉換為對決策制定和規劃形體動作有益的東西。雖然 Atlas 使用整合 IMU、聯合位置和力感測器來控制自身的肢體動作,並透過感知地面來保持平衡,但它

需要利用感知來識別和導航以下動圖 1 中的間隙和窄梁等障礙

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術

深度相機拍攝的 Atlas 機器人的點雲旋轉檢視。

Atlas 使用 TOF 深度相機以每秒 15 幀的速度生成環境的點雲,點雲是測距的大規模集合。

Atlas 的感知軟體使用一種名為多平面分割的演算法從點雲中提取平面

。多平面分割演算法的輸入饋入到一個對映系統中,該系統為 Atlas 透過相機看到的各種不同物件構建模型。

下圖 2 顯示了 Atlas 的視覺「所見」以及如何使用這種視覺感知來規劃行為。左上角是深度相機拍攝的紅外影象。主影象中的白點形成點雲。橙色輪廓標記了檢測到的跑酷障礙物的矩形面,隨著時間的推移從感測器觀察結果中對其進行跟蹤。然後將這些檢測到的物件用於規劃特定行為。例如,綠色的腳步代表下一步要跳到哪裡。

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術

具有感知輸出的 Atlas 渲染。

為了執行擴充套件的跑酷行為,波士頓動力的研發團隊為機器人提供了

一張高階地圖,其中包括研發人員希望它去的地方以及沿途它應該做的動作

。該地圖與真實路線的幾何形狀不完全匹配,而是一個包含障礙模板和註釋動作的近似描述。Atlas 使用這些稀疏資訊來導航,並使用實時感知資料來填充細節。

例如,Atlas 知道要尋找要跳的盒子,如果盒子向側面移動 0。5 米,Atlas 會找到它的新位置並跳到那裡。但如果盒子被移得太遠,那麼系統將找不到它並停下來。

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術

波士頓動力機器人跑酷視覺「看到」和規劃的資訊。

這是一個 3D 視覺化動畫,主動跟蹤的物體以綠色繪製,並在脫離機器人感知感測器的視野時從綠色淡化為紫色。跟蹤系統持續估計物體姿態,導航系統利用地圖上的資訊來規劃與這些物體相關的綠色足跡。

Atlas 行為庫

Atlas 在跑酷中所做的

每個動作都源自使用軌跡最佳化提前建立的模板

。透過建立這些模板庫允許研究者向庫中新增新的軌跡,從而可以不斷為機器人新增新的功能。給定感知計劃目標,機器人從庫中選擇與給定目標儘可能匹配的行為。

透過離線設計進行軌跡最佳化,工程師能夠提前以互動方式探索機器人能力的極限,並減少機器人的相關計算量。例如,由於驅動等物理限制,機器人如何精確協調其四肢以啟動和進行後空翻,這些細節可能對機器人的成功產生重大影響。

利用離線最佳化,研究者可以在設計時捕獲這種類似的重要約束,並使用單個通用控制器線上調節機器人。

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術

上圖機器人行為是使用離線軌跡最佳化設計的複雜行為,同時線上控制器將模板動作變成現實。

模型預測控制

在確定了機器人前面的箱子、坡道或障礙物,並計劃了一系列操作以越過它們後,剩下的挑戰就是

機器人如何可靠地執行計劃所需的所有細節

Atlas 控制器被稱為模型預測控制器(model-predictive controller, MPC),該控制器使用機器人動力學模型來預測機器人未來的動作。控制器的工作原理是透過最佳化來計算機器人當前要做的最優事情,從而隨著時間的推移產生最佳動作。正如前文所述,行為庫中的每個模板會向控制器提供什麼解決方案是最佳的選擇。

控制器會調整機器人的力、姿勢和行為時間等細節,以應對環境、腳滑或其他實時因素帶來的影響。擁有一個能夠顯著偏離模板動作的控制器可以簡化行為建立過程,這意味著不用逐個匹配機器人遇到的每一個細節。例如,機器人從 52 釐米高的平臺上跳下和從 40 釐米高的平臺上跳下並沒有什麼不同,MPC 會解決細節問題。

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術

以第一視角顯示了 Atlas 感知和規劃的路徑。藍色箭頭為 MPC 預測的機器人在整個移動過程中的質心和動量。

MPC 的預測特性還允許 Atlas 跨越行為邊界來檢視後續動作。例如,知道跳躍之後是後空翻,控制器可以自動建立從一個動作到另一個動作的平滑過渡。這再次簡化了機器人行為建立問題,因為我們不需要提前考慮所有可能的行為序列。當然,MPC 預測也存在侷限性,例如,機器人嘗試從快進慢跑動作過渡到後空翻是行不通的。一般來說,必須在控制器複雜性和行為庫大小之間取得平衡。

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術

Atlas 展示了接近於人類的跑酷能力,對於波士頓動力來說如何在 Atlas 上建立和控制廣泛的動力學行為有了深刻的瞭解。更重要的是,它為設計一個可擴充套件的軟體系統創造了機會,該軟體系統將與團隊一起成長。

感知演算法、規劃地圖……波士頓動力揭秘Atlas機器人跑酷背後的技術