Az UC Berkeley kutatói kifejlesztettek egy robottanulási technológiát, amely lehetővé teszi a robotok számára, hogy elképzeljék cselekedeteik jövőjét, hogy kitalálják, hogyan lehet manipulálni azokat a tárgyakat, amelyekkel még soha nem találkoztak. A jövőben ez a technológia elősegítheti az önálló vezetésű autók számára a jövőbeni események előrejelzését és intelligens robotsegédeket hozhat létre otthonokban, ám az eredeti prototípus az egyszerű kézi készségek teljes megtanulására összpontosít önálló játékból.
Ezzel a technológiával, az úgynevezett vizuális előrelátás, a robotok megjósolhatják, mit látnak a kameráik, ha egy adott mozgási sorrendet hajtanak végre. Ezek a robotképzelések jelenleg is viszonylag egyszerűek - az előrejelzések csak néhány másodpercre készülnek a jövőben -, de elegendőek ahhoz, hogy a robot kitalálja, hogyan mozgathat tárgyakat az asztalon akadályok megzavarása nélkül. Lényeges, hogy a robot megtanulhatja végrehajtani ezeket a feladatokat anélkül, hogy bármiféle emberi segítség vagy a fizika, a környezet vagy az objektumok előzetes ismerete lenne. Ennek oka az, hogy a vizuális képzelőerőt teljesen a semmiből tanulják meg felügyelet nélküli és felügyelet nélküli kutatások során, amikor a robot az asztalon lévő tárgyakkal játszik. A játék fázisa után a robot felépít egy prediktív világmodellt, és felhasználhatja ezt a modellt olyan új tárgyak manipulálására, amelyeket még nem látott.
"Ugyanúgy, ahogy el tudjuk képzelni, ahogyan a tevékenységeink mozgatják a környezetünkben lévő tárgyakat, ez a módszer lehetővé teszi egy robot számára, hogy elképzelje, hogy a különböző viselkedések hogyan befolyásolják a környező világot" - mondta. Sergey Levine, egyetemi docens a Berkeley Villamosmérnöki és Számítástudományi Tanszékén, amelynek laboratóriuma kifejlesztette a technológiát. "Ez lehetővé teszi a rendkívül rugalmas készségek intelligens tervezését a komplex valós helyzetekben."
[the_ad id = ”11018 ″]
A kutatócsoport a vizuális előretekintési technológiát demonstrálja a Neurális információfeldolgozó rendszerek konferencia a kaliforniai Long Beach-ben, december 5.
Ennek a rendszernek a lényege egy mély tanulási technológia, amely konvolúciós visszatérő videó előrejelzésen alapul, vagy dinamikus idegi advekció (DNS). A DNS-alapú modellek előrejelzik, hogy a képen a pixelek hogyan mozognak az egyik képkockáról a másikra, a robot műveletei alapján. A modellosztály közelmúltbeli fejlesztései, valamint a jelentősen javított tervezési képességek lehetővé tették a videó előrejelzésen alapuló robotvezérlést, hogy egyre összetettebb feladatokat hajtsanak végre, például elmozdítsák a játékot az akadályok körül és több objektumot helyezzenek el.