這條「絕影」機器狗在倒地後會學著自己站起來
新的 AI 加強式學習方案讓它能應對各種不同的場景。
對於人類而言,在面對陌生情況時切換不同技能來進行嘗試、應對似乎是一種本能,但對機器人來說這卻是一項不小的挑戰。此前大家雖然也看到過它們能跑能跳,但這基本上都是基於預先設定好的程式,一旦到了軟體預設的範圍以外其就很難隨機應變了。為了改善這種情況,浙江大學和愛丁堡大學的研究者開發出了一套新的 AI 加強式學習方案。它能利用所謂的「多專家」系統,讓浙大的「絕影」機器狗掌握自行應對陌生情況的能力。
根據團隊發表在 Science Robotics 期刊上的論文,目前這套系統是由八個 AI「專家」組成。每個「專家」都會訓練一項基本技能,比如說行走、轉向、保持平衡等等。在「專家」掌握基礎技能後研究者會以不同的搭配來進行進一步的組合訓練,這個時候就需要引入額外的門控神經網路,它的角色就類似於所有「專家」的總指揮。
在遇到陌生情況時,門控網路會融合八個「專家」輸入的數據,然後進行協調調度,最終決定以什麼樣的技能組合來做出適應性的行為。在測試過程中,研究者先是以虛擬機器人在電腦上進行了模擬,後續他們也將軟體裝到了一台「絕影」的工程機上。從動圖中你可以看到,在以不同方式倒地之後,機器人最終都會學著自己站立起來。
在接受 Wired 採訪時,論文作者之一的愛丁堡大學資訊學院助教李智彬表示這項研究的目的是創造出「在面對不同陌生情況時懂得將技能融會貫通、隨機應變的進階智慧機器」。按照他的說法,現階段最大的挑戰之一是需要降低模擬機器人訓練所需要的運算力,在達成這一點後該方案才能具備真正的實用前景。