Google AI áttörés: A mély gondolkodás megtanulhat emberi hozzájárulás nélkül

Kérjük, ossza meg ezt a történetet!

A Google a globális technológiát kereső vállalatok felső szintjén helyezkedik el, és az autonóm integrált intelligencia iránti törekvése veszélyezteti a világ társadalma magját. A veszély valódi, ám kevés polgár érti meg ennek a technológiának a bonyolultságát.  TN szerkesztő

Nem olyan régen az ősi kínai Go játék elsajátítása már nem volt elérhető mesterséges intelligencia. De aztán AlphaGo, a Google DeepMind AI-lejátszója, elkezdett távozni még a legjobb emberi ellenfelek is a porban. Mégis ennek a világhírű AI-nek az embereknek kellett tanulniuk. Aztán, szerdán, a DeepMind új verziója összeszerelte az embereket.

Az AlphaGo Zero meghaladta elődje képességeit, megkerülve az AI hagyományos játékmódját, amely több ezer órás emberi játék megfigyelését foglalja magában. Ehelyett egyszerűen véletlenszerűen kezd el játszani, és készségeit úgy csiszolja, hogy többször is maga ellen játszik. Három nappal később és 4.9 millió ilyen játékkal később az eredmény a világ legjobb Go-playing AI.

"Ez erősebb, mint a korábbi megközelítések, mert eltávolítottuk az emberi tudás korlátait" - mondja David Silver, az AlphaGo vezető kutatója.

„Az emberiség több ezer éven keresztül játszott játékok millióit felhalmozta a Go ismereteire - írják a szerzők papírjukban. „Néhány nap múlva… az AlphaGo Zero képes volt felfedezni ezen Go tudás nagy részét, valamint olyan új stratégiákat, amelyek új betekintést nyújtanak a játékok legrégebbi szakaszaiba.”

Az AlphaGo Zero alternatív megközelítése lehetővé tette olyan stratégiák felfedezését, amelyeket az emberek még soha nem találtak. Például sok különböző josekiust megtanult - olyan mozdulatok sorozatát, amelyek egyik oldalán sem nettó veszteséget eredményeznek. Sok éven át írt josekist írtak a Go lejátszása során, és az AlphaGo Zero kezdetben sok ismerősét megtanulta. Az önképzés folytatódásával azonban a korábban ismeretlen szekvenciákat részesítette előnyben.

Az új lépések kipróbálására a DeepMind az AlphaGo Zero verzióját verzióba dobta annak ellenére, hogy legyőzte az 18 időbeli világbajnokot Lee Sedolt. Egy 100-játékban harag mérkőzés, megnyerte az 100-0-t. Ez annak ellenére, hogy csak három napos edzést folytat, szemben az előd több hónapjának. Az 40 napos edzés után az 89-11-ot is megnyerte az AlphaGo jobb verziója ellen, amely legyőzte az első világszerte Ke Jie-t (TermészetDOI: 10.1038 / nature24270).

Olvassa el a teljes történetet itt ...

Feliratkozás
Értesítés
vendég

0 Hozzászólások
Inline visszajelzések
Az összes hozzászólás megtekintése