Superkomputer z Krakowa rozgrzany prawie do czerwoności. Pomaga naukowcom znaleźć antidotum na COVID-19 i pokonać koronawirusa
Polski superkomputer Prometheus, który haruje dzień i noc w Akademickim Centrum Komputerowym „Cyfronet” Akademii Górniczo-Hutniczej w Krakowie, służy medycynie nie od dziś. Zainstalowane na jego zasobach specjalistyczne pakiety oprogramowania są na co dzień wykorzystywane m.in. w badaniach związanych z modelowaniem cząsteczek leków, do analiz danych z mikromacierzy DNA, identyfikacji białek i poznawania ich roli w procesach biologicznych.
Jednak od początku pandemii koronawirusa pierwszeństwo w dostępie do zasobów obliczeniowych najszybszego aktualnie superkomputera w Polsce mają granty obliczeniowe poświęcone badaniom nad SARS-CoV-2. Zespoły naukowców (nie, nie zapomnieliśmy o wysiłku ludzi) z pomocą Prometheusa badają przeciwciała obecne w organizmie w czasie zakażenia, cząsteczki działające hamująco na infekcję czy możliwości rozwoju szczepionek.
Szafa gra
Prometheus ma moc obliczeniową 2,65 petaflopsów. Polski sprinter w obliczeniach to m.in. ponad 53 tysiące rdzeni obliczeniowych zespolonych w jednej maszynie oraz infrastruktura towarzysząca. Razem pozwalają na szybkie przetwarzanie dużych danych medycznych, biologicznych i chemicznych.
– Moc obliczeniową Prometheusa można porównać do ponad 50 tysięcy najwyższej klasy komputerów osobistych PC w najmocniejszej konfiguracji, dodatkowo połączonych superszybką siecią i zarządzanych specjalnym oprogramowaniem – obrazowo wyjaśnia Marek Magryś, zastępca dyrektora Cyfronetu ds. komputerów dużej mocy.
Na czerwcowej liście TOP500 najszybszych supermaszyn świata krakowski „mózg obliczeniowy” zajął 288. miejsce. Uruchomiono go w 2015 roku. Jest jednym z najbardziej energooszczędnych komputerów swojej klasy. Innowacyjne chłodzenie cieczą umożliwiło osiągnięcie bardzo wysokiej gęstości instalacji – aż 144 serwery obliczeniowe mieszczą się w pojedynczej szafie. Tych jest łącznie 20. Dzięki temu ważąca tyle, co duży czołg (ponad 40 ton) część obliczeniowa zajmuje powierzchnię tylko 18 metrów kwadratowych.
Naukowcy mogą czerpać zarówno z zasobów obliczeniowych, jak i narzędzi pozwalających z nich efektywnie korzystać. Są dostępne za pośrednictwem infrastruktury PLGrid (rejestracja możliwa jest poprzez portal PlGrid). Badacze nie muszą się przy tym obawiać, że sobie sami z prometejską mocą nie poradzą. Fachowcy z Cyfronetu pomagają przy uruchomieniu programów na zasobach Prometheusa.
Przechytrzyć chorobę
Z mocy obliczeniowej supermaszyny korzysta m.in. nowo powstające Centrum Zindywidualizowanej Medycyny Obliczeniowej – Międzynarodowa Fundacja Badawcza „Sano” z siedzibą w Krakowie. Jego celem jest wprowadzenie innowacyjnych rozwiązań diagnostycznych i terapeutycznych dzięki tworzeniu nowych, obliczeniowych biomarkerów chorób, zindywidualizowanych dla poszczególnych pacjentów.
Sano współpracuje z licznymi ośrodkami krajowymi i międzynarodowymi. Oprócz Cyfronetu to także Uniwersytet w Sheffield, niemiecki Instytut Obliczeniowy Jülich, Fraunhofer ISI (Instytut Badań Systemów i Innowacji Fraunhofera z Karlsruhe) oraz klaster LifeScience Kraków, czyli sieć instytucji i firm z makroregionu południowej Polski.
Zespół naukowy Sano włączył się w walkę z pandemią COVID-19.
– Nasze działania mają wspomóc klinicystów w walce z wirusem poprzez zastosowanie metod sztucznej inteligencji do przewidywania progresji choroby u osób, u których stwierdzono zakażenie SARS-CoV-2. Algorytmy sztucznej inteligencji trenowane są na danych pochodzących aktualnie z dwóch kohort osób cierpiących na COVID-19 – pierwsza z nich obejmuje polskich, a druga brazylijskich pacjentów – wyjaśnia Tomasz Gubała, informatyk i programista naukowy Cyfronetu, zaangażowany w prace zespołu badawczego nad koronawirusem w Sano.
Trenując algorytm na takim zróżnicowanym zestawie danych, naukowcy chcą wypracować model, który będzie w stanie w sposób zautomatyzowany przewidywać rozwój choroby na podstawie wstępnych pomiarów u pacjentów dopiero co przyjętych do szpitala. Ma on również wspomagać lekarzy przy podejmowaniu decyzji o potencjalnym schemacie leczenia. Chodzi między innymi o to, by maksymalnie opóźnić lub – w sytuacji idealnej – zminimalizować prawdopodobieństwo osiągnięcia stanu, w którym pacjent będzie wymagał podłączenia do respiratora.
– System ten może też pomóc wytypować pacjentów, u których ryzyko gwałtownego pogorszenia stanu zdrowia jest największe, co być może przełoży się na zmianę strategii leczenia i w konsekwencji zmniejszy ryzyko dopuszczenia do znacznego pogorszenia stanu zdrowia – dodaje Gubała.
Prace nad rozwojem systemu trwają, a Sano poszukuje kolejnych chętnych do współpracy ośrodków klinicznych, które dysponują danymi pacjentów cierpiących na COVID-19.
Zaplanować desant na wirusa
Jednym z grantów realizowanych z użyciem mocy obliczeniowej Prometheusa w kontekście COVID-19 jest projekt zatytułowany „Potencjalna strategia przeciw wirusowi SARS-CoV-2 oparta na zahamowaniu programowanej zmiany ramki odczytu podczas translacji genomu wirusa” (spokojnie! już tłumaczymy), którego kierownikiem jest prof. dr hab. Joanna Kufel z Instytutu Genetyki i Biotechnologii Uniwersytetu Warszawskiego.
– Infrastruktura obliczeniowa Prometheusa pozwoliła nam wymodelować duży fragment materiału genetycznego SARS-CoV-2, niezbędny do jego rozwoju i namnażania się w komórkach gospodarza (w przebiegu COVID-19 – człowieka) – mówi dr Dorota Niedziałek z Zakładu Bioinformatyki Instytutu Biochemii i Biofizyki Polskiej Akademii Nauk, członkini zespołu badawczego realizującego projekt. – Materiałem genetycznym koronawirusów jest bardzo długa i tworząca różnorodne trójwymiarowe struktury cząsteczka kwasu nukleinowego RNA, której elementami budulcowymi są tzw. nukleotydy. Nas szczególnie interesuje związek pomiędzy składem i wzajemnym ułożeniem nukleotydów a dynamiką struktury cząsteczki wirusowego RNA, która wydaje się kluczowa na etapie tzw. translacji w cyklu namnażania się SARS-CoV-2 – tłumaczy.
Symulacje komputerowe przy użyciu metod tzw. dynamiki molekularnej pozwalają prześledzić zmiany dynamicznej struktury cząsteczki kwasu nukleinowego SARS-CoV-2. Ruch poszczególnych fragmentów cząsteczki względem siebie wydaje się niezbędny do rozpoczęcia produkcji składników budulcowych wirusa w trakcie infekcji.
– Poszukujemy takich miejsc w badanym fragmencie wirusowego RNA, do których przyłączać się mogą cząsteczki potencjalnych leków, zdolnych zaburzyć jego trójwymiarową strukturę, blokując tym samym proces rozwoju i namnażania się wirusa – dodaje dr Niedziałek.
Ten projekt zdobył dofinansowanie w wysokości 878 tysięcy złotych z Narodowego Centrum Nauki w ramach programu „Szybka ścieżka dostępu do funduszy na badania nad Covid-19”.
Chmury nad Europą (to dobrze)
Część mocy obliczeniowej Prometheusa jest udostępniona w ramach partnerstwa europejskiego PRACE do przeprowadzenia paneuropejskiego „pandemicznego” hackathonu. Dzięki niemu mają powstać nowe rozwiązania w walce z koronawirusem. Wspierany przez państwa europejskie hackathon dostępny jest pod adresem https://euvsvirus.org/. Do tych zasobów dostęp mają również badacze z Polski.
Cyfronet udostępnia również zasoby w ramach federacji EGI z siedzibą w Holandii– rozproszonej infrastruktury obliczeniowej, która skupia zasoby ponad 250 jednostek z całego świata. Federacja EGI zrzesza setki badawczych centrów danych w instytutach oraz laboratoriach krajowych i międzynarodowych w Europie, Afryce, regionie Azji i Pacyfiku, Kanadzie i Ameryce Łacińskiej, które wspierają się w zaawansowanych projektach badawczych opartych na danych. Obejmuje największą w Europie federację chmury badawczej – to ponad 20 dostawców chmur badawczych z całego kontynentu. Pod koniec maja EGI wspólnie z amerykańską organizacją Open Science Grid (OSG) połączyły siły, by wspierać projekty badawcze dotyczące COVID-19.
Dodatkowo za pośrednictwem rozwijanego przez Cyfronet portalu EOSC (European Open Science Cloud – swoistego punktu kontaktowego dla europejskich naukowców i innowatorów w celu odkrywania, uzyskiwania dostępu i wykorzystywania szerokiego spektrum zasobów na potrzeby zaawansowanych badań opartych na danych) dostępne jest stworzone na Uniwersytecie w Utrechcie narzędzie Haddock do modelowania biomolekularnego. Z Haddock korzysta przeszło 17 tysięcy badaczy na całym świecie. Narzędzie umożliwia badanie złożonych oddziaływań między wirusem a ludzkimi białkami oraz przewidywanie, w jaki sposób małe cząsteczki celują w główne białka wirusa. Wysokowydajne zasoby obliczeniowe dostępne w europejskiej chmurze dla otwartej nauki umożliwiły zespołowi Haddock zbadanie w ciągu zaledwie trzech dni skuteczności ponad 2 tysięcy już istniejących, zaakceptowanych w leczeniu innych chorób, leków przeciwko proteazie SARS-CoV-2 (zahamowanie działania tego enzymu powoduje, że wirus ginie).
Cyfronet uczestniczy również w europejskim projekcie EOSC Synergy, w ramach którego udostępnione zostały zasoby chmury obliczeniowej na rzecz walki z wirusem.
Jak widać, prometejskie moce najszybszej polskiej maszyny płyną w wielu kierunkach, aby jak najskuteczniej rozprawić się z siejącymi spustoszenie wśród ludzi mikroskopijnymi koronawirusami.