Algorytmy pozwalają skutecznie przetestować na obecność koronawirusa, nawet jeśli testów jest znacznie mniej niż badanych. Wykazali to także polscy badacze z Instytutu Biologii Doświadczalnej PAN
Na całym świecie jest już ponad 33 miliony zakażonych osób i w większości krajów codziennie przybywają ich dziesiątki tysięcy, a przynajmniej tysiące.
Testowanie na obecność wirusa SARS-CoV-2 to jeden z lepszych sposobów walki z pandemią. Pozwala odnaleźć i poddać kwarantannie zakażonych, ale w tym celu powinno się testować dziesiątki tysięcy osób dziennie. Niestety, wiele krajów boryka się z brakiem testów. Badania przeprowadzone w Japonii wykazują, że przeciwciała na koronawirusa ma od 300 do 800 razy więcej osób, niż wykrywanych jest przypadków.
Co można zrobić? Intuicja podpowiada, że niewiele – potrzeba tylu testów, ile jest osób. To nieprawda. Skutecznie testować można nawet wtedy, gdy liczba testów jest znacznie mniejsza niż osób do przebadania. Wystarczy odpowiedni algorytm – i nie musi być on złożony. Wystarczy taki, który można spisać na kartce.
Jeśli do przebadania na obecność koronawirusa mamy 100 osób, a testów tylko 25, można podzielić badanych na pięć grup po dwadzieścia osób. Zebrane od nich próbki testujemy zbiorczo. Jeśli w grupie nie stwierdza się obecności wirusa, rzecz jasna nie marnujemy dalszych testów. Potrzebne będą nam, jeśli wyniki badania całej grupy wypadną pozytywnie – wtedy musimy przetestować dalsze dwadzieścia osób.
Taka metoda jest skuteczna, jeśli częstotliwość występowania wirusa w populacji jest z grubsza znana. Jeśli jest to na przykład 1 proc., czyli zakażona jest jedna na sto osób, istnieje spora szansa, że taka osoba znajdzie się tylko w jednej dwudziestoosobowej grupie – co pozwoli nam oszczędzić znakomitą większość testów. W powyższym przypadku zużyte zostanie 5 testów dla każdej z grup i 20 dla poszczególnych osób z tej grupy, której zbiorczy wynik był dodatni. Wykorzystanych zostanie 25 testów zamiast 100.
Specjaliści od statystyki, ale też inżynierowie zajmujący się kompresją danych czy dekodowaniem wideo, mają w tym wprawę, bo na co dzień zajmują się podobnymi problemami – pracują z algorytmami, które na podstawie niepełnych danych pozwalają odtworzyć pełen obraz.
O tym, jak to działa w praktyce, opowiada magazynowi IEEE Spectrum Dror Baron z North Carolina University.
Zdecydowanie powinniśmy włączyć testowanie grupowe do podstawowej diagnostyki COVID-19, na pewno w takich populacjach, gdzie spodziewamy się niskich odsetków zakażonych, w poszczególnych firmach, fabrykach, uczelniach, szkołach i wszędzie tam, gdzie jest duża populacja ludzi, która musi przebywać w jednym pomieszczeniu
Prof. Agnieszka Dobrzyń, dyrektor Instytutu Biologii Doświadczalnej im. M. Nenckiego PAN
Jak tłumaczy, sama idea nie jest nowa, bo w podobny sposób testuje się oddawaną w testach krwiodawstwa krew – ponieważ większość ludzi nie jest nosicielami wirusów HIV czy HCV, łatwiej jest przetestować pod tym kątem całe partie oddanej krwi. Dopiero gdy wynik testów jest dodatni, bada się każdą oddaną porcję krwi osobno. Podobną metodą testuje się na obecność koronawirusa w szpitalach w Izraelu.
Na czym polega więc rola specjalistów od algorytmów? Na opracowaniu takiego podziału na grupy, który pozwalałby zużyć jak najmniej testów bez szwanku dla wiarygodności. Testy nigdy nie są stuprocentowo pewne, zawsze istnieje pewien margines błędu. Dzielenie na zbyt duże grupy zwiększałoby ryzyko przegapienia osoby zakażonej. Dzielenie na zbyt małe nie daje wielkich oszczędności. A podział na grupy wcale nie musi być tak prosty jak w przedstawionym powyżej przykładzie.
Znów przyjmijmy, że mamy sto osób i wiemy, że zakażona jest (statystycznie) jedna na sto. Możemy podzielić badanych tak, by każdy z z nich występował w losowych grupach po trzydzieści osób. Wykonujemy dwadzieścia testów takich losowo dobieranych grup (czyli zużywany 60 testów). Na podstawie tego, ile razy ktoś wystąpił w grupie z dodatnim wynikiem, można z wysokim prawdopodobieństwem określić, czy jest zakażony. Podobne metody wykorzystywane są w dekompresji danych oraz analizie obrazów w medycynie i astronomii. Zamiast przechowywać dane o każdym bicie czy pikselu, robi się to właśnie na podstawie analizy prawdopodobieństwa.
Jest to oczywiście dobra metoda, jeśli w przykładowej stuosobowej grupie spodziewamy się jednego zakażonego. Im więcej statystycznie ich jest w danej populacji, tym więcej testów musielibyśmy wykonać. Badacze z Izraela wykazali (w opublikowanej niedawno w „Science Advances” pracy), że do zbadania 384 pacjentów wystarczy 48 testów przy założeniu, że w próbie spodziewamy się mniej niż pięciu zakażeń.
Zbadali to też dokładnie polscy naukowcy. Badania prowadził zespół Instytutu Biologii Doświadczalnej im. M. Nenckiego PAN we współpracy z Wydziałem Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego, Uniwersytetu Medycznego w Łodzi oraz Sanepidu.
Badacze ustalili, że jeśli odsetek zakażonych w populacji wynosi poniżej 2 proc., pojedynczy test wystarczy na 12 próbek. Jeśli jest to więcej niż 2 proc., ale mniej niż 8 proc. – wykorzystuje się test kratkowy 8 x 12 próbek. Jeśli jest to od 8 do mniej niż 15 proc. – jeden test wystarczy na 4 osoby. Jeśli jednak istnieje ryzyko, że w danej populacji zakażonych może być powyżej 15 proc. – wówczas testy grupowe stają się nieopłacalne, a badania indywidualne są lepsze – relacjonuje serwisowi PAP Nauka w Polsce prof. Agnieszka Dobrzyń, dyrektor Instytutu Biologii Doświadczalnej im. M. Nenckiego PAN i kierownik projektu.
„Zdecydowanie powinniśmy włączyć testowanie grupowe do podstawowej diagnostyki COVID-19, na pewno w takich populacjach, gdzie spodziewamy się niskich odsetków zakażonych, w poszczególnych firmach, fabrykach, uczelniach, szkołach i wszędzie tam, gdzie jest duża populacja ludzi, która musi przebywać w jednym pomieszczeniu” – mówi prof. Dobrzyń.
Zespół badaczy z Instytutu Nenckiego PAN rozpoczął badania pilotażowe takiej strategii testów grupowych niedawno, bo decyzja o wdrożeniu strategii SONAR została ogłoszona 18 września 2020 przez ministra Nauki i Szkolnictwa Wyższego. Testy na wybranych populacjach pracowników i studentów mają potwierdzić skuteczność opracowanych przez badaczy protokołów. Naukowcy liczą, że w kolejnym etapie testowanie grupowe będzie mogło być wdrażane w całej Polsce.
„Przebadanie 38 milionów Polaków wymagałoby przemyślanej logistyki i zaangażowania wielu laboratoriów. Ich pracownicy otrzymaliby od nas szczegółowe instrukcje, jak wykonywać testy grupowe. Próbki mogłyby być pobierane m.in. w miejscach pracy. Aby proces mógł być przeprowadzony sprawnie, konieczna byłaby także digitalizacja wyników testów, czyli przechowywanie ogromnej liczby wrażliwych danych. To kolejny powód, dla którego musimy dostać oficjalną zgodę na działanie z Ministerstwa Zdrowia” – mówi prof. Dobrzyń cytowana na stronie Polskiej Akademii Nauk.