Dlaczego internetowy gigant tworzy perfumy? Bo chce rozwiązać zagadkę zapachów. A ta jest bardzo trudna
Światło uchyliło swoje tajemnice już Izaakowi Newtonowi w XVII wieku. Rozszczepił je na poszczególne kolory za pomocą pryzmatu, co udowodniło, że jest mieszaniną wielu barw. W XIX wieku odkryto, że są to fale elektromagnetyczne i ustalono w jaki sposób nasze oko je rejestruje. Mamy w siatkówce oka trzy rodzaje receptorów, światła niebieskiego, żółtozielonego i czerwonego. Pobudzenie dwóch z nich oznacza, że rejestrujemy barwę pośrednią. Pobudzenie wszystkich – białą. W ten sposób odbieramy całe spektrum barw, a gdy uwzględnić także natężenie barwy – miliony odcieni.
Z zapachami sprawa jest bardziej skomplikowana. Mamy w nosach wyspecjalizowany nabłonek, na którego powierzchni znajduje się kilka milionów receptorów węchowych. Szkopuł w tym, że różnych receptorów na nim zidentyfikowano już ponad cztery setki. Liczba kombinacji jest tu astronomiczna: pobudzenie dwóch rodzajów receptorów daje 160 tysięcy różnych możliwych zapachów, trzech już aż 64 miliony (przy czym niektóre zapachy mogą powstawać na przykład w wyniku pobudzenia czterech czy pięciu rodzajów receptorów).
Zapach trudny do sklasyfikowania
Dlatego też tajemnicą pozostaje to, co konkretnie sprawia, że cząsteczka związku chemicznego będzie dla nas pachnieć tak, a nie inaczej. O ile można zmierzyć długość fali elektromagnetycznej i stwierdzić, jaki będzie miała ona dla nas kolor, o tyle zapachu nie da się łatwo przewidzieć na podstawie budowy cząsteczki chemicznej. Aromatycznych związków są setki tysięcy, jeśli nie miliony. Trudno jest je wszystkie opisać czy sklasyfikować. Jeśli jakieś reguły istnieją, są bardzo ogólne. Wiemy, że grupa estrowa nadaje związkom zapach owocowy, ale jaki – to już zależy od długości łańcuchów (estry posiadają dwa).
Czasem dodanie atomu lub ich grupy do cząsteczki zmienia zapach, a czasem nie. Jeszcze kiedy indziej sprawia, że związek staje się bezwonny. Czasami wystarczy przestawić tylko jedną grupę metylową z jednej strony cząsteczki na przeciwną, żeby nasze nosy zamiast zapachu grejpfruta zaczęły odczuwać zapach konwalii (lub odwrotnie). Jeszcze całkiem niedawno, bo w 2006 r. renomowany periodyk naukowy z dziedziny chemii „Angewandte Chemie” publikował pracę pod znamiennym tytułem „O nieprzewidywalności zapachu”.
Przemysł perfumeryjny pracuje nad tymi zagadkami od dziesiątków lat. Chciałoby się powiedzieć „ręcznie”, ale oczywiście specjaliści wykorzystują nosy, żeby katalogować zapachy różnych związków. Dość niedawno problemem zainteresowali się również specjaliści od uczenia maszynowego. Z obliczeniowego punktu widzenia jest to tzw. problem klasyfikacji wieloetykietowej (multi labeling classification). Wieloetykietowej, bowiem większości zapachów można przypisać wiele określeń (etykiet). Na przykład wanilina, składnik nadający zapach wanilii, opisywana jest jako “słodka”, “waniliowa”, “kremowa”, czy “czekoladowa”.
Sieci neuronowe dają obiecujące rezultaty
Badacze w 2015 r. stworzyli projekt DREAM, który miał nauczyć maszyny rozpoznawania zapachów na podstawie budowy cząsteczki i opisu zapachu (dokonanego przez wcześniej badanych ochotników). Algorytmom częściej udawało się przewidzieć zapach niż nie udawało. Ale był to tylko umowny sukces, bowiem projekt rozważał tylko dwie wonie: czosnku lub jaśminu.
Później zadania rozpoznawania zapachu na podstawie budowy cząsteczki podejmowało się kilka innych zespołów, z mniejszymi lub większymi sukcesami. Szczególnie udane okazało się zaprzęgnięcie do tego zadania sieci neuronowych zwanych „graph neural network” (GNN). Sieci takie powstały do przetwarzania wykresów i grafik, ale okazało się, że dobrze radzą sobie z zapachami.
Czasami wystarczy przestawić tylko jedną grupę metylową z jednej strony cząsteczki na przeciwną, żeby nasze nosy zamiast zapachu grejpfruta zaczęły odczuwać zapach konwalii
Zespół badaczy z Google Brain doniósł właśnie, że uzyskał bardzo obiecujące rezultaty (praca została opublikowana w serwisie Arxiv) w identyfikacji zapachów przy wykorzystaniu takich sieci GNN. Wykorzystał 5000 opisów zapachów związków chemicznych dokonanych przez ekspertów. Większa część (dwie trzecie) z tych danych została wykorzystana do treningu sieci neuronowej. Pozostała jedna trzecia – do jej testowania. Okazało się, że sieć nauczona na przykładach opisanych przez ekspertów dobrze radzi sobie z przewidywaniem zapachu na podstawie budowy cząsteczki chemicznej.
Sieć neuronowa identyfikuje pewne kluczowe elementy cząsteczki (liczba atomów węgla, wodoru, innych pierwiastków, ich odległości oraz rodzajów wiązań chemicznych) i tworzy z tego rodzaj grafu. Gdy zna strukturę opisanych już kilku tysięcy odpowiadających cząsteczkom grafów może porównywać z nimi nowe cząsteczki. Tworzy też rodzaj „mapy”, na której pewne obszary odpowiadają konkretnym zapachom.
SI nie odróżnia lustrzanych odbić cząsteczek
Wytrenowana przez Google sieć neuronowa nie radzi sobie tylko z jednym. Nie odróżnia cząsteczek, które różną się od siebie niczym lustrzane odbicia (enancjomerów). Algorytm klasyfikuje tak samo zapach (S)-karwonu i (R)-karwonu. Dla ludzkiego zmysłu powonienia pierwszy ma zapach kminku, drugi zaś mięty.
Czy opisywanie zapachów przez maszyny może mieć jakiś praktyczny walor? Na pewno w przemyśle perfumeryjnym i kosmetycznym. Może z czasem powstaną jednak sztuczne nosy, które będą mogły rozpoznawać ślady węchowe tak, jak czynią to psy.
I chociaż uważamy nasze powonienie za znacznie gorsze od psiego, w rzeczywistości jest ono całkiem czułe. Do niedawna uważano, że człowiek jest w stanie odróżnić kilka do dziesięciu tysięcy zapachów. Dopiero praca opublikowana dwa lata temu w „Science” rozwiała to jako „dziewiętnastowieczny mit”. Umiemy rozróżnić ich aż bilion.
Większość z nas jest w stanie rozpoznać ręcznik członka rodziny po zapachu. Gdy ślad zostawia człowiek boso lub skarpetkach, jesteśmy w stanie odnaleźć ślad na drewnianej podłodze. Być może węchem wyczuwamy też emocje innych ludzi, a nawet ich zespół zgodności tkankowej (co prawdopodobnie pomaga wybierać partnerów).
Póki trudno było klasyfikować zapachy, nauka o nich nie była traktowana zbyt poważnie. Teraz może się to zmienić. A maszyny mają w tym względzie jeszcze trochę do nadrobienia.