Sieć neuronowa tworzy muzyczne wariacje, by pomóc badaczom poznać istotę białek

Białka to podstawowy budulec żywych organizmów. Są niezwykle zróżnicowane – jedne pełnią funkcje strukturalne w kościach czy mięśniach, inne działają jako enzymy, jeszcze inne zajmują się transportem, regulacją transkrypcji genów, jako hormony przekazują informacje, jako przeciwciała bronią organizmu.

Naukowcy od lat badają ich strukturę i właściwości. Syntetyzują też nowe białka, które można wykorzystać na przykład do tworzenia superwytrzymałych materiałów. Ostatnio postanowili wykorzystać do pracy z białkami sieci neuronowe i… muzykę.

Posłuchać pajęczyny

Głównym składnikiem białek są aminokwasy. Naukowcy z zespołu kierowanego przez dr. Markusa Buehlera z MIT przyporządkowali każdemu z 20 standardowych aminokwasów białkowych jeden dźwięk. Najcięższy z aminokwasów – tryptofan – otrzymał najniższy dźwięk, najlżejszy – glicyna – dźwięk najwyższy. Rytm i głośność poszczególnych dźwięków oddaje tak zwaną strukturę drugorzędową, czyli sposób przestrzennego ułożenia molekuły. Tak powstała muzyka protein – język, w którym można wyrazić skomplikowaną strukturę białka za pomocą zapisu nutowego.

Wizualizacja efektu tłumaczenia aminokwasów na dźwięki

Następnie zespół przetłumaczył na ten muzyczny język molekuły różnych białek, na przykład mioglobiny, która pozwala kaszalotowi spermacetowemu nurkować nawet na głębokość 2 kilometrów, czy spidroiny, głównego składnika sieci pajęczej.

Tak „brzmi” spidroina, główny składnik sieci pajęczej.
Źródło: Markus J. Buehler/Soundcloud

Białkowe zapisy nutowe stały się następnie materiałem treningowym dla rekurencyjnej sieci neuronowej.

Czemu to ma służyć?

„Wykorzystujemy sztuczną inteligencję do generowania nowych kompozycji muzycznych przez wychwytywanie naturalnych relacji pomiędzy sekwencją aminokwasową a strukturą białka. Następnie tłumaczymy dane muzyczne wygenerowane przez SI na sekwencje białkowe i uzyskujemy projekty nowych białek o specyficznych cechach konstrukcyjnych” – czytamy w pracy podsumowującej badania na łamach periodyku „ACS Nano”.

Jak mówi dr Buehler w wypowiedzi dla MIT News, wyuczenie sieci neuronowej danymi na temat pewnej klasy białek może trwać kilka dni, ale potem wygenerowanie nowego wariantu trwa mikrosekundy. „Żadna inna metoda się nie umywa” – mówi Buehler.

Według badaczy ten specyficzny mariaż nauki ze sztuką może pomóc zrozumieć wzorce, wariacje i mutacje struktur białkowych, a równocześnie stanowi atrakcyjny sposób zilustrowania sekwencji białkowych.

Naukowcy zaprojektowali nawet aplikację na Androida o nazwie Amino Acid Synthesizer, która pozwala bawić się dźwiękami aminokwasów i nagrać sekwencje białkowe jako kompozycje muzyczne. Można ją pobrać TUTAJ.