選單

DeepMind為推進機器人研究收購 MuJoCo ,並將其對所有人免費開放

“接觸”這個看似簡單的動作其實是一個複雜現象,它可以是柔軟的、僵硬的,光滑的、粘稠的。這種微妙的複雜性對機器人研究中的模擬身體接觸提出了挑戰。

機器人研究人員很多都會選擇物理模擬引擎 MuJoCo(Multi-Joint Dynamics with Contact)上的接觸模型來進行模擬。

而近日 MuJoCo 已被人工智慧公司 DeepMind 所收購。DeepMind 表示將會使 MuJoCo 成為對所有人免費的開源軟體。

能夠免費使用 MuJoCo,眾多機器人開發者對此表示歡喜之極。畢竟之前 MuJoCo 的使用費用並不便宜。

我們先通過幾個示例,初步瞭解利用 MuJoCo 能夠做什麼,並體驗下它對現實中物理運動的模擬到底有多真實。

首先是倒立陀螺在平面之上的翻轉運動。

DeepMind為推進機器人研究收購 MuJoCo ,並將其對所有人免費開放

圖 | 現實倒立陀螺的翻轉(來源:DeepMind)

DeepMind為推進機器人研究收購 MuJoCo ,並將其對所有人免費開放

圖 | 模擬倒立陀螺的翻轉(來源:DeepMind)

再比如牛頓擺(Newton’s Cradle)運動。

DeepMind為推進機器人研究收購 MuJoCo ,並將其對所有人免費開放

圖 | 現實牛頓擺(來源:DeepMind)

DeepMind為推進機器人研究收購 MuJoCo ,並將其對所有人免費開放

圖 | 模擬牛頓擺(來源:DeepMind)

可以看到,MuJoCo 能夠精確地捕捉到牛頓擺中的脈衝傳播。

MuJoCo 對在失重下的運動模擬也極其真實。

DeepMind為推進機器人研究收購 MuJoCo ,並將其對所有人免費開放

圖 | 現實失重狀態下物體運動(來源:DeepMind)

DeepMind為推進機器人研究收購 MuJoCo ,並將其對所有人免費開放

圖 | 模擬失重狀態下物體運動(來源:DeepMind)

此外,MuJoCo 還能對人或者動物的複雜生物肌肉進行模擬。

DeepMind為推進機器人研究收購 MuJoCo ,並將其對所有人免費開放

圖 | 模擬的人腿擺動(來源:DeepMind)

很多模擬器起初是為遊戲、電影等設計,準確性並不是它們的優先考慮事項。對比其他模擬器易失真的情況,MuJoCo 能夠有效捕捉接觸物體的特徵,從而準確模擬現實世界中真實的物理運動。同時 MuJoCo 也很靈活,可透過調整引數模擬更廣範圍的接觸現象。

而且,MuJoCo 是一個全功能模擬器,不僅能夠擴充套件計算密集型技術,還能在物理機器人部署之前測試和驗證控制方案、互動式科學視覺化、虛擬環境等。

據瞭解,一開始 MuJoCo 是被用在華盛頓大學運動控制實驗室,在 2015 年才作為付費商品推出。其在機器人和生物力學,還有動畫等領域都有著廣泛應用。

然而,儘管 MuJoCo 足夠優秀,但並不能說沒有缺點,或者說沒有模擬器是完美無缺的。

現有模擬器,包括 MuJoCo,都存在一些共性問題,比如,模擬環境並不能完全等同物理現實,與真正的真實仍有差距。模擬計算需要專用的硬體,成本較高。而且,不管多優秀的模擬器,都會包含“非決定性”元素,這使得測試無法進行復制。

這些問題是模擬研究需要面臨的挑戰。有些專家認為,在要解決的問題和需要的資源方面,開發具有百分之百準確性的模擬器也許和開發機器人本身同樣多。

回到本次收購的問題上。對於 DeepMind 選擇收購 MuJoCo 的原因,也許我們可以從發表在PNAS上的一篇論文中窺見一二。

相關論文以《關於在機器人中使用模擬:機遇、挑戰和前進的建議》(On the use of simulation in robotics: Opportunities, challenges, and suggestions for moving forward)為題發表在PNAS上,第一作者為賓夕法尼亞大學博士後研究員崔熙順(HeeSun Choi)[1]。

圖 | 相關論文(來源:PNAS)

該論文中提到,“經過良好驗證的計算機模擬可以提供一個虛擬的試驗場,在許多情況下,它有助於安全、快速、低成本地理解未來的機器人如何設計和控制,以便安全操作和提高效能。”

論文進一步討論了模擬如何幫助機器人研發:

一、迅速和低成本地生成大量機器學習培訓資料。

機器學習在定義控制策略中的激增,以及相關對大量培訓資料的需求,為機器人模擬的使用提供了主要動力。經過驗證的模擬平臺成為開發系統的理想試驗場,既能從錯誤中吸取教訓,又能進行驗證。

二、加快工程設計週期,降低成本。

機器人的設計有兩個較為耗時的階段,即機械設計和控制策略設計。而在模擬中執行迭代迴圈,可以縮短與設計過程相關的時間。

三、提供加速、安全、完全控制的虛擬測試和驗證環境。

自主系統驗證的方法還處於起步階段。驗證和“除錯”線上學習的自主機器人系統的方法基本上不存在。在此背景下,模擬在對協作式多機器人系統提供見解方面可以發揮重要作用。

四、促進更智慧機器人的發展和人與機器人相互作用的理解。

模擬可以成為智慧機器人進化下一階段的催化劑,正如道德概念(設定規則)、經驗和預測行為後果的能力塑造了人類的決策過程一樣。而模擬機器人與人之間的相互作用的能力可以減少危險工作環境中的個人風險。

對於 MuJoCo 模擬的作用,DeepMind 非常認可,其表示,“我們的機器人團隊一直使用 MuJoCo 作為各種專案的模擬平臺。MuJoCo 緊密地遵循了支配我們世界的方程式。”

目前,DeepMind 正在為 MuJoCo 完全開源做準備,並向“對突破現實物理模擬的界限感到興奮”的研究人員們發出邀請,希望與他們一同將 MuJoCo 打造成一個社群驅動的、具有頂尖功能的專案。

-End-

參考:

[1] HeeSun Choiet al。PNAS5, (2021)