- Olbrzymia liczba badań naukowych tworzy szum informacyjny
- Sztuczna inteligencja pomaga odnaleźć kluczowe zagadnienia
- Narzędzia do szukania informacji wymagają samodzielnej selekcji artykułów
Współczesna nauka obfituje w duże liczby. Tylko w ubiegłym roku opublikowano na świecie ponad 1,6 mln artykułów naukowych. To o 1,5 procenta więcej niż rok wcześniej. Artykuły to jednak nie wszystko. Surowcem dla nauki są dane eksperymentalne, których liczba jest dziś astronomiczna. Wielki Zderzacz Hadronów w Europejskiej Organizacji Badań Jądrowych (CERN) w ciągu jednej sekundy wytwarza kilka petabajtów danych. Jest ich tak dużo, że trzeba je filtrować automatycznie. W przeciwnym razie szybko zapełniłyby nie tylko serwery CERN-u, ale i innych ośrodków akademickich, które z nim współpracują.
Kłopot z nadmiarem
Oczywiście, nie każde centrum badawcze produkuje tyle danych, co CERN. Mimo to zalew informacji jest tak duży, że naukowcom coraz trudniej trzymać rękę na pulsie nawet w ich macierzystych dziedzinach. A dochodzą do tego jeszcze badania interdyscyplinarne. Mają one wielki potencjał naukowy, ale wymagają śledzenia sytuacji także poza własnym poletkiem badawczym. To dodatkowe wyzwanie.
Trudność nie wynika tylko z ilości. W przypadku danych kłopotliwa jest także różnorodność. Zdarza się, że pochodzą one z różnych dyscyplin czy projektów. Są także zapisywane w nietypowych formatach lub z wykorzystaniem odmiennych konwencji. W efekcie osoby zainteresowane wynikami cudzych badań mają często do czynienia z naukową Wieżą Babel.
Udrożnić naukę
Ratunku można szukać w przepastnych międzynarodowych bazach naukowych. Gromadzą one abstrakty artykułów oraz tworzą indeksy cytowań. Niestety i one nie rozwiązują problemu. Zbadanie pełnej zawartości artykułów wymaga zasobów właściwych erze analogowej: czasu, cierpliwości, a nierzadko opłaty za dostęp.
Niektórym z tych bolączek usiłują zaradzić coraz popularniejsze inicjatywy spod znaku otwartej nauki. Ruch ten promuje swobodny dostęp do badań, tak by każdy naukowiec mógł z nich korzystać bez przeszkód. Artykuły i dane mają trafiać do repozytoriów, które udostępnią je za darmo wszystkim zainteresowanym. Nadal jednak potrzebny jest ktoś, kto je przeczyta.
Maszynowi asystenci
Naukowcom strudzonym kwerendami mogą wkrótce przyjść w sukurs narzędzia wytrenowane z pomocą sztucznej inteligencji. Już dziś istnieją systemy analizujące teksty kontekstowo, a nie tylko na podstawie sztywno określonych słów kluczowych. Nie jest to jeszcze pełne czytanie ze zrozumieniem, jednak ma zalety nie do przecenienia. Dzięki możliwości szybkiego przetwarzania informacji, systemy te potrafią wychwytywać zależności między tekstami, które zapewne umknęłyby badaczowi nieuzbrojonemu w sztuczną inteligencję.
Przykładem takiego narzędzia jest Semantic Scholar – wyszukiwarka mająca obecnie dostęp do ponad 40 mln artykułów naukowych z renomowanych źródeł. Wykorzystując data mining, przetwarzanie języka naturalnego czy automatyczne rozpoznawanie obrazów, Semantic Scholar analizuje zawartość artykułów m.in. pod względem zachodzących między nimi relacji.
Narzędzie to sugeruje również wartość naukową artykułu, oceniając przyrost liczby cytowań oraz wskazując na najbardziej prestiżowe odniesienia do danego materiału w literaturze fachowej. Dzięki takiej pomocy naukowcy mogą szybciej zorientować się w wartości wyszukanego materiału i skoncentrować swoją uwagę na tym, co najistotniejsze.
Inne podejście do wykorzystania SI w automatycznym przetwarzaniu prac naukowych oferuje Source Data. Narzędzie analizuje ryciny ilustrujące wyniki badań i wydobywa leżące u ich podstaw dane. Następnie gromadzi je w bazie, która pozwala naukowcom odnaleźć ewentualne związki między różnymi badaniami. Na razie narzędzie pracuje na dość ograniczonym zbiorze danych, ale w przyszłości ten zakres ma być znacznie szerszy.
Czego jeszcze możemy spodziewać się po takich mechanicznych asystentach? Oren Etzioni z Allen Institute for Artificial Intelligence – instytucji, która zbudowała Semantic Scholar – uważa, że z czasem ich inteligentna wyszukiwarka pozwoli na stawianie hipotez badawczych.
Będzie to wynikało z możliwości przyjrzenia się danemu problemowi z szerszej perspektywy lub pod innym kątem. Twórcy tego narzędzia liczą, że efekty jego działania będą wymierne. Na stronie Semantic Scholar czytamy, że kiedyś może ono pomóc znaleźć lekarstwo na nieuleczalny dotychczas nowotwór. Brzmi jak oklepany slogan marketingowy? Być może. Miejmy jednak nadzieję, że jest w tym coś więcej.