Czy sztuczna inteligencja może uczyć się krócej? Może, jeśli pozna podstawy matematyki. A dokładniej topologii
Jednym z podstawowych problemów sztucznej inteligencji jest to, że nie jest inteligentna. Przynajmniej w codziennym, ludzkim znaczeniu tego słowa. Za inteligentnego uznaje się kogoś, kto szybko się uczy – tymczasem większość algorytmów uczy się powoli. Na przykład sieci uczące się rozpoznawania obrazów nie są zbyt pojętne. By móc rozpoznać twarz lub tekst, naukowcy muszą najpierw „nakarmić” algorytm jak największą liczbą przykładów, czasem idącą w miliony. Wszystko jedno, czy chodzi o ludzi, czy napisany odręcznie tekst.
Z uczeniem maszynowym jest też inny problem. Nie mamy kontroli nad tym, jak działa algorytm i czego tak naprawdę się nauczył. Wiemy, że rozpoznaje twarze (albo pismo), ale jak to się dokładnie dzieje pozostaje tajemnicą. Badacze sztucznej inteligencji czasem sięgają po analogię czarnej skrzynki – nie wiemy, co dzieje się w jej środku i na jakiej podstawie podejmuje decyzje.
Grupa matematyków i neurofizjolog z Champalimaud Centre for the Unknown w Lizbonie zadała sobie pytanie, czy źródło obydwu problemów nie leży w tym, że komputerowe algorytmy nie mają żadnej wiedzy o świecie zewnętrznym. A gdyby tak móc taką podstawową wiedzę im jakoś przekazać?
Narzucić algorytmowi reguły
Różnica mogła by być taka, jak między dzieckiem, a dorosłym. Dziecko nie wie, czym jest znak drogowy, póki nie zdobędzie wiedzy, że są to trójkątne, prostokątne lub koliste kształty o kilku wybranych kolorach na których umieszczono symbol i są umieszczane na słupkach stawianych przy drogach. Ale gdy nabędzie już tę wiedzę, będzie bez problemu potrafiło odróżnić znak drogowy od szyldu.
Z matematycznego punktu widzenia problem można postawić następująco: czy można ograniczyć przestrzeń wyników, narzucając algorytmowi pewne reguły. Badacze postanowili wykorzystać gałąź matematyki zwaną topologią, czyli naukę o kształtach i przekształceniach (a dokładniej topologiczną analizę danych).
Różne przedmioty, ten sam kształt
Na przykład z topologicznego punktu widzenia obwarzanek (torus) jest tym samym kształtem, co naczynie z uchem. Przekonać się można o tym bawiąc się ciastem lub plasteliną – wystarczy wgnieść palcem obwarzanek i otwór pogłębić, żeby zaczął przypominać filiżankę z wielkim uchem. My nabywamy wiedzę z zakresu topologii w sposób praktyczny: bawiąc się, tworząc, czy majsterkując.
Komputer nie nauczy się lepić z plasteliny, ale maszyny można nauczyć matematycznych reguł, które to opisują. Algorytmy widzenia maszynowego bardzo tego potrzebują, bo są w dziedzinie topologii laikami. Nie rozpoznają obiektów po ich obrocie lub zniekształceniu, o ile wcześniej nie nauczymy ich tego na setkach tysięcy przykładów. Ale wpojenie im matematycznych reguł (takich, jak to, że obwarzanek i kubek są tożsame) jest dużo prostsze.
Jak donoszą badacze w pracy opublikowanej w „Nature Machine Intelligence”, jest to bardzo dobry sposób na to, by algorytm stał się bardziej inteligentny. Naukowcy wzięli pod lupę sieci rozpoznające ręcznie napisane cyfry. Jak wszyscy wiemy, każdy pisze je inaczej. Choć z grubsza kształt cyfry 8 różni się od 9, maszyna potrzebuje dziesiątków tysięcy przykładów napisanych różnymi charakterami pisma, by je odróżnić. Człowiek wręcz przeciwnie, rozpoznaje je dobrze.
Sztuczna inteligencja bardziej inteligentna
To dlatego, że wiemy, że ósemka jest kształtem z dwoma otworami, a dziewiątka z jednym i nie da się przekształcić jednego w drugi bez rozrywania. Badacze wyposażyli głęboką sieć neuronową w zestaw reguł dotyczących kształtów, czyli topologicznych. Okazało się to zaskakująco skuteczne. Żeby nauczyć się odróżniać cyfry taki wyposażony w podstawowe topologiczne reguły algorytm zamiast setek tysięcy, potrzebował tylko 50 przykładów.
Badacze zamierzają iść w tym kierunku dalej. Chcą zobaczyć, czy maszyny naśladujące człowieka mogą się stać bardziej inteligentne, a ich działania przejrzyste. „Zrozumiałość sztucznej inteligencji jest niezbędna dla interakcji i integracji z inteligencją biologiczną” – mówi Mattia Bergomi. Wraz z Pietro Vertechim pracują teraz nad nowym rodzajem architektury sieci neuronowych, która umożliwi ludziom łatwe wprowadzanie reguł, które pozwolą takimi sieciami sterować i przyspieszą ich uczenie.
A sztuczna inteligencja stanie się dzięki temu bardziej inteligentna. Czy są szanse na to, by dogoniła człowieka? Nieprędko.
Ludzki mózg zawiera około stu miliardów neuronów połączonych stu bilionami synaps, odpowiada petabajtom (milionom gigabajtów) pojemności pamięci. Przechowujemy w niej między innymi ważne reguły odróżniające ósemki od dziewiątek, ale też i takie jak „upuszczone przedmioty spadają w dół”. Wyposażenie komputerów w zestaw reguł wiedzy ogólnej na razie przekracza nasze możliwości. Ale kto wie, może kiedyś okaże się to możliwe.
Na razie wyposażenie algorytmu w znajomość topologii i danych może pomóc rozpoznawać kształty – nie tylko cyfr, ale innych obiektów i twarzy – bez konieczności pokazywania ich maszynie w każdej możliwej konfiguracji i pod każdym kątem miliony razy. Ale algorytm może potraktować jako kształt dowolny zbiór danych, co pozwoli znajdować komputerom powiązania, które do tej pory nie były oczywiste.