央視網(wǎng)消息:運動(dòng)控制能力是人形機器人適應環(huán)境和執行任務(wù)的核心技術(shù)。如同人類(lèi)一樣,機器人在與物理世界進(jìn)行交互時(shí),需要對各關(guān)節進(jìn)行控制,來(lái)保證運動(dòng)的穩定性和準確性。人類(lèi)的運動(dòng)控制需要小腦的調節,機器人的運動(dòng)控制則依靠一套算法。
近日,北京人形機器人創(chuàng )新中心發(fā)布了機器人半程馬拉松冠軍“天工”的運控算法框架,填補了高性能人形機器人運動(dòng)控制框架在開(kāi)源領(lǐng)域的空白。
總臺記者 袁嘉憶:在北京人形機器人創(chuàng )新中心,我們看到“天工Ultra”在遇到臺階、斜坡、草地、碎石地、沙地等各種復雜地形的時(shí)候,都能實(shí)時(shí)調整步態(tài),保持穩定和優(yōu)雅,這是因為研發(fā)人員在訓練天工的運動(dòng)控制算法中引入了強化學(xué)習和模仿學(xué)習機制,讓機器人具有更發(fā)達的“運動(dòng)智能中樞”。

這套引入的運動(dòng)控制算法框架就是“天工-Lab”,它由北京人形機器人創(chuàng )新中心自主研發(fā),能在短時(shí)間內訓練出人形機器人面對復雜地形的自主適應能力和快速移動(dòng)能力,為更多人形機器人走出實(shí)驗室,在高復雜環(huán)境中執行任務(wù),提供核心基礎技術(shù)支撐。
北京人形機器人創(chuàng )新中心運控部門(mén)負責人 郭宜劼:強化學(xué)習就相當于把它放在一個(gè)仿真環(huán)境當中,它自己不斷去探索,不斷迭代學(xué)習,產(chǎn)生了一套運動(dòng)控制網(wǎng)絡(luò )。我們也把采集的人體運動(dòng)數據放在強化學(xué)習的過(guò)程當中,這兩個(gè)方面結合在一起,就能產(chǎn)生又擬人又穩定的步態(tài)。
多個(gè)全場(chǎng)景交互虛擬機器人訓練場(chǎng)開(kāi)放
在具備強大運動(dòng)控制能力的基礎上,人形機器人還需要在生產(chǎn)生活的應用場(chǎng)景中,執行各類(lèi)復雜物體的靈巧操作,這對具身智能模型訓練的數據量與數據采集場(chǎng)景提出了更高需求。近日,北京人形機器人創(chuàng )新中心還同步開(kāi)放了多個(gè)支持全場(chǎng)景交互的虛擬機器人訓練場(chǎng)。
總臺記者 袁嘉憶:這里是北京人形機器人創(chuàng )新中心的數據采集基地,機器人“天工”的不少操作技能就是在這“熟能生巧”練就的。我們看到這里有起居室、客廳、廚房、商超、工廠(chǎng)等各類(lèi)場(chǎng)景,平時(shí)研發(fā)人員就是在這些真實(shí)場(chǎng)景里去采集機器人執行各項操作任務(wù)的真機數據。不過(guò)真實(shí)場(chǎng)景里能同時(shí)運行的機器人數量是有限的,為了實(shí)現大規模的具身智能數據采集和訓練,研發(fā)人員搭建了數字孿生仿真場(chǎng)景,機器人可以自由操作場(chǎng)景內的各類(lèi)物品。

北京人形機器人創(chuàng )新中心具身智能部門(mén)負責人 車(chē)正平:一個(gè)高質(zhì)量的仿真環(huán)境的搭建,要求視覺(jué)具有非常高的保真度,盡可能和實(shí)際生活、實(shí)際物理世界是一致的。我們希望物體的模型在仿真中的交互行為和真實(shí)世界中也完全一樣,就包括微波爐門(mén)的打開(kāi)方式、它彈開(kāi)之后的滑動(dòng)距離等等。
由北京人形機器人創(chuàng )新中心與北京市建筑設計研究院聯(lián)合打造的高保真鉸接物體數字資產(chǎn)數據集,面向全球開(kāi)發(fā)者開(kāi)放了6大數字孿生機器人訓練場(chǎng),并實(shí)現對抽屜、櫥柜、冰箱等200多種高精度可動(dòng)物件的仿真。開(kāi)發(fā)者可直接基于已有環(huán)境訓練,也能快速生成新鉸接物體資產(chǎn),擴展仿真場(chǎng)景。