Naukowcy muszą mieć dostęp do wszystkich danych o koronawirusie. Inaczej walka z nim może być mało skuteczna – czyli długotrwała. Aktywiści posuwają się nawet do wykradania i udostępniania płatnych publikacji

Pandemia koronawirusa daje nam po raz kolejny do zrozumienia, że bez współpracy i dzielenia się informacjami świat nie będzie w stanie jej wygasić, nie ponosząc ogromnych strat. Przykład? Amerykańscy naukowcy zaangażowali swój superkomputer Summit do wykonania 8 tysięcy symulacji w ciągu kilkudziesięciu godzin, by wykazać, że wśród takiej liczby różnych związków 77 może mieć potencjał ograniczający możliwość zarażenia COVID-19. Wykorzystali do tego model białek koronawirusa przedstawiony w naukowej publikacji przez Chińczyków. Teraz z użyciem supermaszyny modelują kolejne rozwiązania, bo w połowie marca Chińczycy dostarczyli jeszcze dokładniejszy model białek koronawirusa.

Gdzie szukać?

Ale czy to, co jest powszechnie dostępne, wystarczy naukowcom do szybkiego opracowania skutecznych metod walki z koronawirusem? Praktyki związane z publikacjami naukowymi utrudniają szybkie rozpowszechnianie wyników istotnych z epidemiologicznego punktu widzenia. Pojawiły się już nawet oddolne akcje udostępniania treści, które są prawnie chronione i do których dostęp jest płatny.

Naprzeciw problemowi wychodzi m.in. Światowa Organizacja Zdrowia (WHO), która gromadzi linki do wszystkich opublikowanych badań. Udostępnia je w jednej, skonsolidowanej bazie danych. Bazę danych publikacji na temat choroby koronawirusowej można przeszukać według autora, słowa kluczowego (tytuł, autor, czasopismo), czasopisma lub ogólnego tematu. Jest aktualizowana codziennie, od poniedziałku do piątku. Niektóre z treści są płatne.

Gates pochwalił

Nextstrain powstał kilka lat temu. To projekt typu open source ułatwiający naukowcom i instytucjom zdrowia publicznego dostęp do potężnych zasobów danych i narzędzi analitycznych możliwych do wykorzystania w walce z epidemiami. Analiza naukowa jest tu możliwa dzięki otwartemu udostępnianiu danych genetycznych przez grupy badawcze z całego świata. Dane dotyczą m.in. ptasiej grypy, dengi czy grypy sezonowej. Inicjatywę Nextstrain w 2017 roku chwalił na Twitterze Bill Gates, który już wcześniej ostrzegał świat przed epidemią, czyli kataklizmem gorszym niż wojny nuklearne: „Fascynujące… Nextstrain wykorzystuje dane genetyczne z wirusów, aby pomóc naukowcom śledzić rozprzestrzenianie się chorób”.

Dziś strona Nextstrain upublicznia dane z tych laboratoriów na całym świecie, które sekwencjonują genom koronawirusa. Sprawia, że są dostępne w jednym miejscu – to otwarte repozytorium, utworzone, by pomóc naukowcom badającym ewolucję wirusa. Daje ono też możliwość śledzenia tego, jak wirus przenosi się w czasie i przestrzeni.

Liczy się czas

Badacze dzielą się nowymi odkryciami na temat profilu genomowego wirusa za pośrednictwem publikacji o otwartym dostępie na stronach takich jak bioRxiv. To darmowa usługa archiwizacji i dystrybucji online dla niepublikowanych wstępnych odkryć w naukach przyrodniczych.

Ostatnio pojawiła się na niej będąca w trakcie recenzowania praca zespołu prof. Marcina Drąga z Politechniki Wrocławskiej dotycząca enzymu, którego działanie może być kluczowe dla walki z koronawirusem SARS-CoV-2 (pisaliśmy o tym w tekście „Król komputerów i koronawirus”).

Serwis jest prowadzony przez Cold Spring Harbor Laboratory, niekomercyjną instytucję badawczą i edukacyjną, we współpracy z naukowcami z całego świata. Publikując prace na stronie bioRxiv, autorzy są w stanie natychmiast udostępnić swoje odkrycia społeczności naukowej, bez czekania na opinie recenzentów.

Aktywiści z Reddita: Nasz projekt jest nielegalny, ale to słuszne w przypadku kryzysu. Nie chcemy stawiać praw autorskich przed ludzkim życiem

Podobnie działa Chinaxiv (wersja w językach chińskim i angielskim). Z ostatniego opublikowanego tam artykułu naukowego na temat koronawirusa można m.in. się dowiedzieć, jakie postępy w leczeniu zaobserwowano u krytycznie chorych pacjentów z koronawirusem po zastosowaniu leku o nazwie Tocilizumab. To lek immunosupresyjny, stosowany głównie do leczenia reumatoidalnego zapalenia stawów. Dla naukowców pracujących nad lekiem na koronawirusa takie publikacje są bardzo przydatne.

Choćby poza prawem

Aktywiści z Reddita, niejako hakując płatne platformy z artykułami naukowymi, stworzyli niedawno bazę ponad 5 tysięcy publikacji związanych z koronawirusem, uzasadniając to tak: „Nasz projekt jest nielegalny, ale to słuszne w przypadku kryzysu. Nie chcemy stawiać praw autorskich przed ludzkim życiem. Najważniejsze jest dzielenie się wszystkim, co wiemy o wirusie, dlatego międzynarodowi naukowcy otwarcie dzielą się swoimi odkryciami dotyczącymi koronawirusa w bezprecedensowy sposób. Naukowcy z krajów rozwijających się często pracują bez dostępu do artykułów, ze względu na złożone i kosztowne umowy między wydawcami, uniwersytetami i szpitalami, polegając na współpracownikach z zagranicy, którzy pomagają im w wyszukiwaniu plików PDF. Wirus nie będzie na to czekał, więc teraz musimy działać z przekonaniem”.

Nie tylko oddolnie

Są też odgórne inicjatywy związane z udostępnianiem prac naukowych o koronawirusie. Tydzień temu naukowcy współpracujący z kilkoma organizacjami wydali COVID-19 Open Research Dataset (CORD-19), który zawiera ponad 29 tysięcy prac badawczych z recenzowanych czasopism, a także takich źródeł, jak wspomniany bioRxiv i medRxiv (strony internetowe, na których naukowcy mogą zamieszczać nierecenzowane prace przedrukowe). Baza danych została opracowana na wniosek Biura Polityki Naukowo-Technicznej Białego Domu w ramach współpracy trzech organizacji. Biblioteka Narodowa Medycyny (NLM) przy Narodowych Instytutach Zdrowia zapewniła dostęp do istniejących publikacji naukowych, Microsoft wykorzystał swoje algorytmy do wyszukiwania odpowiednich artykułów, a organizacja non-profit Allen Institute for Artificial Intelligence (AI2) przekształciła je ze stron internetowych i plików PDF w ustrukturyzowany format, który może być przetwarzany przez algorytmy. Baza danych jest dostępna na stronie internetowej AI2 Semantic Scholar.