Sztuczna inteligencja od Google’a potrafi teraz przegapić nieistotne szczegóły, by lepiej skupić się na tym, co ważne

Zacznijmy od małego testu. Prosiłbym, Czytelniku, żebyś przed dalszą lekturą tego artykułu uważnie obejrzał poniższy krótki film i zastosował się do instrukcji w nim zawartych. To minieksperyment psychologiczny badający Twoją percepcję.

Adres filmu na Youtube: https://www.youtube.com/watch?time_continue=63&v=vJG698U2Mvo&feature=emb_logo

Źródło: Daniel Simons / YouTube

Ślepota pozauwagowa to fenomen, który dotyczy każdego z nas. W największym skrócie polega na tym, że jeśli nie spodziewamy się czegoś zobaczyć, to z dużym prawdopodobieństwem tego nie zobaczymy – nasz mózg to odfiltruje.

Powyższy film pochodzi z najsłynniejszego bodaj badania ślepoty pozauwagowej, przeprowadzonego przez Daniela Simonsa i Christophera Chabrisa. Okazało się, że ponad 50 procent badanych skupionych na liczeniu podań nie zauważyło goryla przechadzającego się wśród graczy. (Jeśli dopiero teraz zechcesz spełnić moją prośbę i obejrzeć film, to najprawdopodobniej nie zadziała – wiesz już, czego się spodziewać).

Jak pisze Piotr Piotrowski w artykule poświęconym temu fenomenowi, ślepota pozauwagowa jest powodem, dla którego jazda samochodem i rozmowa przez telefon to bardzo niebezpieczne połączenie. W innych przytaczanych przez niego eksperymentach badanym kazano podczas spaceru rozmawiać przez telefon, słuchać muzyki, iść w parze z kimś, iść samemu. Okazało się, że osoby rozmawiające przez telefon rzadziej zauważały dość rzucającego się w oczy klauna na monocyklu. Robi się mniej śmiesznie, gdy wyobrazimy sobie w podobnej sytuacji kierowcę, który rozmawiając przez telefon, nie zauważa osoby wchodzącej na jezdnię

Ślepota pozauwagowa ma jednak swoje dobre strony. „Skupiając uwagę na informacjach priorytetowych, a jednocześnie odrzucając te nieistotne, dajemy odpocząć naszemu umysłowi. Nawiązuje to do schematów poznawczych, które są uogólnioną wiedzą o świecie” – czytamy w artykule Piotrowskiego.

Krótko mówiąc – to umiejętność, która pozwala nam utrzymać skupienie na zadaniu i nie rozpraszać się nieistotnymi z jego punktu widzenia szczegółami.

Właśnie ta ostatnia właściwość zainteresowała ekspertów od sztucznej inteligencji w Google AI. Postanowili zastosować mechanizm naśladujący ślepotę pozauwagową w procesie szkolenia modelu uczenia maszynowego.

opublikowanej niedawno pracy badają zachowania agentów (sterowanych przez SI wirtualnych obiektów, które postrzegają i działają) wyposażonych w mechanizm samodzielnego ograniczania percepcji.

Przed agentami postawiono zadania oparte o sygnały wizualne – sterowanie samochodem wyścigowym widzianym z góry na krętej drodze oraz omijanie pocisków w środowisku trójwymiarowym widzianym z perspektywy pierwszej osoby.

Mechanizm imitujący ślepotę pozauwagową pozwala agentom wybrać, jaki wycinek otrzymanego obrazu jest kluczowy do wykonania zadania, i podejmować decyzje tylko w oparciu o sygnał z tego wycinka.

Na powyższej animacji widać, jak agent korzysta z systemu. Po prawej mamy dane, na podstawie których podejmuje decyzje. W przypadku zadania z samochodem skupia uwagę na poboczu, odpowiednio ją rozszerzając zaraz przed wejściem w zakręt. W drugim zadaniu skupia się wyłącznie na przeciwnikach i lecących w jego stronę pociskach.

Okazuje się, że dzięki zastosowaniu mechanizmu selektywnej uwagi do wykonania zadania potrzeba modelu o tysiąckrotnie mniejszej liczbie parametrów (tysiąc razy mniej połączeń między sztucznymi neuronami) niż z wykorzystaniem konwencjonalnych metod. Taki model jest też dużo mniej podatny na zmiany wirtualnego środowiska (np. zmiany tekstur, dodatkowych elementów w polu widzenia) – po prostu ich nie zauważa.

Wyniki badania są bardzo obiecujące. Dają nadzieję na bardziej oszczędne i wydajne systemy przetwarzania obrazu. Jak przyznają badacze – to dopiero początek zmagań z tematem. Algorytm ma swoje ograniczenia, na przykład nie radzi sobie z drastycznymi zmianami tła.

To jeden z wielu przykładów prób przekładania mechanizmów działania ludzkiego mózgu na język sztucznej inteligencji. Pisaliśmy już choćby o algorytmach, które uczą się jak dzieci, czy urządzeniach naśladujących anatomiczną budowę mózgu.