Attól függően, hogy milyen paranoid vagy, ez a Stanford és Google félelmetes vagy lenyűgöző lesz. Megállapítást nyert, hogy egy gépi tanulási ügynök, amely a légi képeket utcai térképpé és hátulmá alakítja, csalja az adatok elrejtésével, amelyekre később szükség lenne egy „majdnem észrevehetetlen, nagy frekvenciájú jelben”. Okos lány!
Ez az eset felfedi a számítógépekkel kapcsolatos problémát, amely a feltalálásuk óta létezik: pontosan azt teszik, amit Ön mondott nekik.
A kutatók szándéka az volt, hogy feltehetőleg felgyorsítsák és továbbfejlesszék a műholdas képeket a Google híresen pontos térképévé alakításának folyamatával, és amint azt már kitalálhatja. Ennek érdekében a csapat dolgozott a CycleGAN-nek - egy neurális hálózatnak, amely megtanulja, hogy az X és Y típusú képeket a lehető leghatékonyabban, de pontosan átalakítsák egymásba, sok kísérlet révén.
Néhány korai eredményben az ügynök jól ment - gyanakodva jól. Ami a csoportot vonta le, az volt, hogy amikor az ügynök rekonstruált légi fényképeket az utcai térképeiről, sok olyan részlet volt, amelyeknek utóbbi egyáltalán nem volt. Például a tetőn lévő tetőablakok, amelyeket az utcai térkép létrehozása során elkerültek, varázslatosan megjelennek, amikor felkérték az ügynököt, hogy hajtsa végre a fordított folyamatot:

Az eredeti térkép, balra; az utcai térkép az eredetiből, a középpontból; és a légi térkép csak az utcai térképből készül. Vegye figyelembe a pontok jelenlétét mindkét légi térképen, amelyek nem jelennek meg az utcai térképen.
Bár nagyon nehéz belefigyelni egy idegi hálózat folyamatainak belső működésére, a csapat könnyen megvizsgálhatja az általa generált adatokat. És egy kis kísérlettel úgy találták, hogy a CycleGAN valóban gyors lendületet kapott.
A szándék az volt, hogy az ügynök képes legyen értelmezni bármely típusú térkép tulajdonságait, és összehangolni őket a másik térkép megfelelő tulajdonságaival. De mi volt az ügynök tulajdonképpenaz osztályozás (többek között) azt jelentette, hogy a légi térkép milyen közel volt az eredetihez, és az utcai térkép tisztaságához.
Így nem megtanulják, hogyan lehet az egyiket a másikból elkészíteni. Megtanulta, hogyan lehet az egyik tulajdonságait finoman kódolni a másik zajmintáiban. A légi térkép részleteit titokban beírják az utcai térkép tényleges vizuális adataiba: apró sok ezer színváltozás, amelyet az emberi szem nem észrevesz, de amelyet a számítógép könnyen észlelhet.
Valójában a számítógép annyira képes ezeket a részleteket az utcai térképekbe csúsztatni, hogy megtanult kódolni bármilyen légi térkép bármilyenUtcatérkép! Nem is kell figyelnie a „valódi” utcatérképre - a légifotó rekonstrukciójához szükséges összes adat ártalmatlanul felvihető egy teljesen más utcatérképre, ahogyan a kutatók megerősítették:

A jobb oldali térképet a bal oldali térképekbe kódolták, jelentős vizuális változások nélkül. (Képek: agsandrew / Shutterstock)
A c) pontban szereplő színes térképek a számítógép által szisztematikusan bevezetett apró különbségek megjelenítését szemléltetik. Láthatjuk, hogy ezek képezik a légi térkép általános alakját, ám soha nem veszi észre, hacsak nem gondosan kiemelték és eltúlzták ezt.
Az adatok képekké történő kódolásának ez a gyakorlata nem új; ez egy megalapozott tudomány, szteganográfia néven, és ezt mindig használják, mondjuk, vízjelek képeinek vagy metaadatok, például kamerabeállítások hozzáadásához. De egy számítógép, amely létrehozza a saját szteganográfiai módszerét, hogy elkerülje azt, hogy valóban meg kell tanulnia végrehajtani a feladatot is meglehetősen új. (Nos, a kutatás tavaly jelent meg, tehát nem az új új, de ez nagyon újszerű.)