Prof. Jerzy Stefanowski: Nasi naukowcy są niewidoczni, badania kuleją, na świecie cytują nas rzadko
By oceniać stan badań w Polsce w zakresie uczenia maszynowego, a szczególnie eksploracji masywnych i złożonych danych (Big Data), trzeba sprawdzić, czy te badania są widoczne na świecie.
W przypadku środowisk badawczych wskaźnikiem jest tu obecność/przyjęcie artykułów na najlepszych światowych konferencjach oraz w prestiżowych czasopismach.
W przypadku szeroko pojętej sztucznej inteligencji elitarne konferencje to ECAI [European Conference on AI – red.], IJCAI [International Joint Conference on Artificial Intelligence] oraz AAAI Conference on Artificial Intelligence.
Poniżej potencjału
Dla uczenia maszynowego najbardziej prestiżowe są: Neural Information Processing Systems – NIPS, International Conference on Machine Learning ICML oraz europejski ECML PKDD; ponadto w szerszym zakresie eksploracji danych ACM SIGKDD oraz niektóre konferencje IEEE, np. IEEE Data Mining lub mniej prestiżowa Big Data. Liczy się także bardzo dobra SIAM Data Mining.
Jeśli chodzi o obecność artykułów z polską afiliacją na tych konferencjach, w ostatnich pięciu-siedmiu latach wśród autorów pojawiają się raczej pojedyncze nazwiska, i to z maksymalnie trzech polskich ośrodków: Instytut Podstaw Informatyki PAN w Warszawie, Uniwersytet Warszawski; Politechnika Poznańska oraz Wrocławska.
Prac polskich autorów w renomowanych światowych czasopismach jest bardzo niewiele, nawet jeśli porównamy się do krajów europejskich o podobnym potencjale. Stosunkowo najlepiej jest z akceptacją prac na europejskiej konferencji ECML PKDD [European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases], lecz jako jej wieloletni uczestnik muszę zauważyć, że jest to zasługa tylko kilku osób.
Można też sprawdzić, ilu doświadczonych badaczy pełniło wyższe funkcje w ramach organizacji konferencji i nadzoru nad recenzowaniem oraz decyzjami o losie artykułów. Na przykład na konferencji ECML PKDD jednym z głównych program chair był 2007 prof. Jacek Koronacki; a po dziesięciu latach track chairem był piszący niniejszą opinię. Nieco mniejszą rolę area chaira przydzielono tylko dwa razy w czasie ponad dziesięciu lat (prof. Szymon Jaroszewicz i ja), a w przypadku konferencji IJCAI w podobnym okresie tylko trzy osoby z Polski pełniły rolę senior PC (profesorowie: Krzysztof Dembczyński, Jerzy Stefanowski oraz Piotr Faliszewski). W podstawowych zestawach recenzentów (tzw. PC members) dla np. ICML, NIPS lub SIAM Data Mining były to także pojedyncze osoby.
Polskich nazwisk jak na lekarstwo
Jeśli wziąć pod uwagę artykuły w najważniejszych i najbardziej wpływowych czasopismach naukowych ze wspomnianej wyżej dziedziny – np. „Journal of Machine Learning Research”, „IEEE Transactions on Neural Networks and Learning Systems”, „Machine Learning”, „Journal of Data Mining and Knowledge Discovery”, „IEEE Transactions on Pattern Analysis and Machine Intelligence” – to wniosek jest podobny: polskie nazwiska, które się tam pojawiają, są nieliczne: Wojciech Kotłowski i Krzysztof Krawiec Politechniki Poznańskiej, Michał Woźniak i współpracownicy oraz Przemysław Kazienko z Politechniki Wrocławskiej; Leszek Rutkowski i współpracownicy z Politechniki Częstochowskiej, Jan Mielniczuk z IPI PAN.
Sprawa liczby publikacji może wyglądać nieco lepiej w przypadku mniej prestiżowych czasopism z dziedziny computational intelligence oraz tzw. soft/fuzzy computing – tyle że te dziedziny są odległe od zakresu problematyki machine learning, a w szczególności Big Data.
Odnosząc się z dużą ostrożnością do tak zwanych wskaźników cytowalności, można dostrzec ledwie kilku naukowców z Polski choć częściowo powiązanych ze sztuczną inteligencją, którzy mają w miarę wysokie wskaźniki Hirscha oraz wysoką liczbę cytowań (można np. spojrzeć na tzw. ranking „100 top best cited Polish scientists” według Google Scholar, upowszechniony dwa lata temu). Sprawa wygląda nieco lepiej, jeśli uwzględnić też polskich naukowców pracujących za granicą, np. prof. Jacka Żuradę albo prof. Witolda Pedrycza – zaliczając ich publikacje w dziedzinie computational intelligence.
Mniej niż dziesięciu
Nie widać też polskich naukowców we władzach międzynarodowych stowarzyszeń zajmujących się AI i ML. Tylko trzej Polacy mają tytuł ECAI (EuroAi), w tym jeden, prof. Stanisław Matwin, to naukowiec z afiliacją zagraniczną (w mojej ocenie to najbardziej obecnie rozpoznawalny w środowisku międzynarodowym naukowiec polskiego pochodzenia).
Reasumując: widzialność międzynarodowa badań prowadzonych w Polsce w zakresie uczenia maszynowego oraz eksploracji złożonych i masywnych danych (takich jak Big Data) jest zbyt niska i sprowadza się do mniej niż 10 osób. Poza nimi można zauważyć innych badaczy polskiego pochodzenia, którzy na różnych etapach swych karier wyjechali za granicę i uzyskali znaczące wyniki.
Prac polskich autorów w renomowanych światowych czasopismach jest bardzo niewiele, nawet jeśli porównamy się do krajów europejskich o podobnym potencjale
Jeśli wziąć pod uwagę nagrody i wyróżnienia we wszystkich konkursach na najlepsze doktoraty Polskiego Stowarzyszenia Sztucznej Inteligencji (wszystkie edycje – patrz strona http://www.pssi.agh.edu.pl/pl:konkurs), widoczna jest dominacja trzech ośrodków:
- Politechnika Poznańska (trzy nagrody główne, cztery wyróżnienia);
- Uniwersytet Warszawski (dwie nagrody, trzy wyróżnienia);
- Politechnika Wrocławska (dwie nagrody).
Wyróżnienia otrzymywali też doktorzy z Politechniki Warszawskiej (cztery razy), AGH (dwa razy) i pojedynczo: z Politechniki Śląskiej, politechniki Gdańskiej oraz IPI PAN i IBS PAN.
W nagrodzonych pracach tematyka uczenia maszynowego oraz zaawansowanej eksploracji danych pojawia się głównie w pracach z Politechniki Poznańskiej, Politechniki Wrocławskiej i Politechniki Warszawskiej. Inne ośrodki prowadziły badania w bardziej standardowych obszarach sztucznej inteligencji (przetwarzanie języka naturalnego, tekstów oraz niestandardowe logiki dla systemów wieloagentowych lub robotyka).
To idzie młodość
W wielu innych ośrodkach to raczej młode pokolenie osiąga w ostatnich latach ciekawe rezultaty. Oto przykłady:
- Analiza sieci społecznych lub zaawansowanych struktur grafowych – np. Politechnika Wrocławska (zespół prof. Kazienko), Uniwersytet Warszawski (Tomasz Michalak), AGH (Piotr Faliszewski), PJATK (Adam Wierzbicki) oraz Politechnika Poznańska (Mikołaj Morzy);
- Eksploracja wielkich modeli grafów dla sieci internetowych oraz wyszukiwania informacji z wielkich repozytoriów tekstowych, głównie IPI PAN (zespół prof. Kłopotka, lecz także Marcin Sydow), choć analiza dużych repozytoriów tekstowych i wykorzystania inspiracji metod reguł asocjacyjnych w zadaniach przetwarzania języka naturalnego była także prowadzona na Politechnice Warszawskiej (zespół prof. Rybińskiego);
- Dobór atrybutów, metody selekcji cech, rozkład sygnałów na istotne składowe, zwłaszcza dla wysokowielowymiarowych danych, w szczególności dla danych biomedycznych, zastosowania w bioinformatyce i biologii molekularnej – np. Uniwersytet Warszawski, IPI PAN, Politechnika Śląska, Uniwersytet Jagielloński, UMK.
- Uczenie zespołów klasyfikatorów, złożone struktury wyjść (np. uczenie wieloetykietowe), uwzględnianie semantycznych współzależności między elementami danych (klasyfikacja porządkowa) – np. Politechnika Wrocławska i Poznańska, IPI PAN, UMK.
- Uczenie się z niestacjonarnych strumieni danych (predykcja, grupowanie, poszukiwanie właściwych cech) – głównie Politechniki: Wrocławska, Poznańska, Częstochowska.
- Modelowanie danych przy integracji różnorodnych źródeł danych w kontekście Big Data (głównie Politechnika Śląska i Politechnika Poznańska).
- Dostosowanie metod uczących do różnego rodzaju niedoskonałości danych (nieprecyzyjności, niekompletności lub częściowo sprzecznych danych, granulacja informacji) – np. Uniwersytet Warszawski, IPI PAN, IBS PAN, Politechniki: Śląska, Poznańska, Częstochowska i i Warszawska – jak też złożonościami rozkładu danych (na przykład niezbalansowania, dekompozycji klas) – Politechnika Wrocławska i Poznańska, IPI PAN.
- Rozwój i zastosowania głębokich sieci neuronowych w robotyce, sterowaniu, wizji maszynowej i rozpoznawania obrazów (obecnie wiele różnych grup roboczych, np. Politechniki: Warszawska, Śląska, Gdańska i Poznańska, AGH, UJ).
- Przetwarzanie wielkich rozmiarów danych multimedialnych w kontekście zastosowań biomedycznych – głównie Politechnika Gdańska.
- Przetwarzanie dużych ilości danych z wykorzystaniem uczenia maszynowego w zakresie neurokognitywistyki oraz badań nad obrazowaniem ludzkiego mózgu – np. Laboratorium Neurokognitywne na UMK w Toruniu lub projekt UW oraz Instytut Biologii Doświadczalnej PAN.
Wielkie podzielenie
Niestety, środowisko badawcze w Polsce jest mocno zatomizowane. Współpraca między zespołami kuleje, nieliczne są wspólne projekty badawcze, nie ma wymiany doktorantów, słabe jest umiędzynarodowienie (np. poprzez choćby okresowe zatrudnienie znanych naukowców zagranicznych w ramach tzw. profesur wizytujących lub wspólnego prowadzenia doktorantów – wyjątkiem jest zespół z Politechniki Wrocławskiej dzięki środkom projektu ENGINE, które pozwoliły także na organizację tzw. międzynarodowych szkół doktorskich).
Nikła jest także obecność polskich badaczy z zakresu uczenia maszynowego w dużych projektach międzynarodowych. W Polsce organizuje się wiele konferencji naukowych, w tym międzynarodowych, nie są to jednak najważniejsze wydarzenia w omawianej tu dziedzinie. W zasadzie od 2007 roku – kiedy to dzięki staraniom prof. Matwina i prof. Koronackiego pozyskano ECML PKDD – nie udało się przyciągnąć do Polski żadnej znaczącej konferencji z szeroko pojętej tematyki machine learning lub knowledge discovery/data mining.
Środowisko badawcze w Polsce jest mocno zatomizowane. Współpraca między zespołami kuleje, nieliczne są wspólne projekty badawcze, nie ma wymiany doktorantów, słabe jest umiędzynarodowienie
Czasami pojawiają się ciekawe wydarzenia w ramach innych znaczących konferencji. Przykładowo, w ramach kongresu światowego organizacji IFIP we wrześniu 2018 zorganizowano specjalną debatę oksfordzką na temat aspektów etyczno-regulacyjnych AI i doprowadzono do rozmów przedstawicieli Polskiego Stowarzyszenia Sztucznej Inteligencji z szefami grupy IFIP TC12 [International Federation for Information Processing Technical Committee on Artificial Intelligence], odpowiedzialnej za sztuczną inteligencję.
Mocno niesatysfakcjonująca jest również współpraca z przemysłem i administracją państwową. Środowisko naukowe nie uczestniczy w dużych projektach o kluczowym znaczeniu dla gospodarki i społeczeństwa. Zamiast tego są małe zlecenia od wybranych przedsiębiorstw lub projekty NCBR.
Bilans i tak na minus
Z drugiej strony można zauważyć, że w ostatnich dwóch-trzech latach pojawiła się bardzo liczna grupa młodych ludzi (pracowników firm i studentów), którzy są zafascynowani nowo pojawiającymi się bibliotekami uczenia maszynowego oraz oprogramowaniem do tzw. data mining i możliwościami komercyjnymi ich zastosowań. Widać to po mnożących się różnorodnych (choć o bardzo nierównym poziomie) spotkaniach typu ML Meetup albo konferencjach jak Polish People in Machine Learning oraz różnego rodzaju nieformalnych grupach seminaryjnych młodych doktorantów.
Bardziej naukową inicjatywą jest tak zwana Polska Grupa Systemów Uczących się (w organizację której jest zaangażowany autor tego raportu).
Takie nieformalne i na swój sposób przypadkowe inicjatywy pokazują, że grono młodych entuzjastów prężnie się rozwija. Mogą one stanowić podstawę do zastosowań w strefie przedsiębiorstw lub start-upów opartych raczej na wyborze i adaptacji często gotowego oprogramowania rozwijanego w innych krajach.
Niestety drobne pozytywy nie zmieniają mojej końcowej opinii: w Polsce badania nad uczeniem maszynowym oraz data mining – eksploracji złożonych i masywnych danych (takich jak Big Data) są dziś zbyt ograniczone, a liczba pracujących w kraju uznanych badaczy zdecydowanie za mała.
Materiał jest opracowaniem części pracy prof. Jerzego Stefanowskiego pt. „Rozwój sztucznej inteligencji i uczenia maszynowego w kontekście Big Data” (Poznań 2018), przygotowanej dla OPI PIB.