Gdzie publikują polscy naukowcy pracujący nad sztuczną inteligencją?

Raport „Badacze SI i ich publikacje” przedstawia liczby dotyczące publikacji prac z obszaru sztucznej inteligencji w podziale na dyscypliny, ośrodki, czy prestiż periodyku, w którym opublikowano pracę naukową.

  • Pierwsza część raportu zawiera wyniki przeszukiwań zawartości bazy Polska Bibliografia Naukowa z wykorzystaniem listy słów kluczowych pod kątem publikacji autorstwa badaczy reprezentujących wszystkie dyscypliny nauki. Szczegóły można znaleźć tutaj.
  • Druga część zawęża analizy do grona naukowców reprezentujących informatykę w obrębie nauk ścisłych lub informatykę techniczną i telekomunikację. Szczegóły można znaleźć tutaj.
  • Niniejsza, trzecia część dotyczy statystyk opartych na przeszukiwaniach bazy PBN pod kątem artykułów, które ukazały się w prestiżowych czasopismach informatycznych o tematyce SI.
  • Czwarta część przedstawia mapy, ranking ośrodków naukowych i przedstawia ich strategie publikacyjne. Szczegóły można znaleźć tutaj.

CAŁY RAPORT w formacie pdf dostępny TUTAJ (uwaga, ze względu na sposób prezentacji ta wersja różni się nieznacznie od internetowej, gdzie połączono w jedną część dwa ostatnie rozdziały).

Badacze sztucznej inteligencji i ich publikacje w prestiżowych czasopismach

Statystyki dotyczące badaczy tematyki SI i ich dorobku publikacyjnego opracowane na podstawie listy prestiżowych czasopism informatycznych zamieszczonej w serwisie internetowym Guide2Research.

Wszelkie dane o badaczach i ich publikacjach pochodzą z bazy Polska Bibliografia Naukowa.

W latach 2013-2018 w bazie Polska Bibliografia Naukowa zarejestrowanych zostało łącznie 1679 artykułów naukowych w czasopismach, których tematyka dotyczy zagadnień takich jak: uczenie maszynowe, przetwarzanie danych (data mining) i sztuczna inteligencja, przetwarzanie obrazów oraz interakcje człowiek-maszyna.

Łącznie autorów tych artykułów było 1229.

Aż 68% publikacji tego typu powstało w ramach dwóch dyscyplin naukowych: informatyki oraz informatyki technicznej i telekomunikacji.

Uwaga: wzięto pod uwagę publikacje w czasopismach posiadających impact factor, z obszaru machine learning, data mining and artificial intelligence; image processing and computer vision oraz human computer interaction, zgodnie z ich listą zamieszczoną w serwisie internetowym Guide2Research.
* Dotyczy naukowców, którzy jako jedną ze swoich dyscyplin naukowych wymienili informatykę w ramach nauk ścisłych lub informatykę techniczną i telekomunikację, zgodnie z obowiązującą klasyfikacją dyscyplin.
Źródło: opracowanie OPI PIB na podstawie systemu PBN, stan na 07.05.2019.

Liczba badaczy i liczba artykułów naukowych opublikowanych przez nich w latach 2013-2018 w prestiżowych czasopismach informatycznych związanych z tematyką SI

Skala współautorstwa i interdyscyplinarności artykułów naukowych opublikowanych w latach 2013-2018 w prestiżowych czasopismach informatycznych związanych z tematyką SI

Uwaga do obu powyższych rysunków: wzięto pod uwagę publikacje w czasopismach posiadających impact factor, z obszaru machine learning, data mining and artificial intelligence; image processing and computer vision oraz human computer interaction, zgodnie z ich listą zamieszczoną w serwisie internetowym Guide2Research.
Źródło obu rysunków: opracowanie OPI PIB na podstawie systemu PBN, stan na 07.05.2019.

Liczba badaczy i artykułów naukowych opublikowanych przez nich w prestiżowych czasopismach informatycznych w latach 2013-2016 systematycznie rosła, po czym zmniejszyła się w roku 2017. Dane dla roku 2018 mają charakter jedynie poglądowy, ponieważ dane o opublikowanych wtedy pracach nadal wprowadzane są do systemu PBN.

Większość takich artykułów (63%) tworzonych jest przez jednego autora. Jeden na dziesięć stanowi natomiast efekt współpracy naukowców reprezentujących różne dziedziny nauki.

Liczba badaczy, którzy w latach 2013-2018 opublikowali co najmniej jeden artykuł naukowy w prestiżowym czasopiśmie informatycznym związanym z tematyką SI, według dziedzin nauki

Uwaga: wzięto pod uwagę publikacje w czasopismach posiadających impact factor, z obszaru machine learning, data mining and artificial intelligence; image processing and computer vision oraz human computer interaction, zgodnie z ich listą zamieszczoną w serwisie internetowym Guide2Research. Dziedziny naukowe badaczy określono na podstawie pierwszej wskazanej przez nich dziedziny.
Źródło obu rysunków: opracowanie OPI PIB na podstawie systemu PBN, stan na 07.05.2019.

Najwięcej naukowców, którzy opublikowali przynajmniej jedną pracę naukową w prestiżowym czasopiśmie informatycznym związanym z tematyką SI, jako swoją główną dziedzinę badań podało nauki inżynieryjno-techniczne, w tym przede wszystkim informatykę techniczną i telekomunikację (472 osoby) oraz automatykę, elektronikę i elektrotechnikę (100 osób). Następni w kolejności są przedstawiciele nauk ścisłych i przyrodniczych: matematycy (72 osoby) i informatycy (58 osób).

Specjaliści, którzy jako swoją główną dziedzinę wskazali nauki społeczne, nauki medyczne i o zdrowiu, nauki rolnicze, nauki humanistyczne lub dziedzinę sztuki stanowili 11% wszystkich autorów.

Liczba badaczy, którzy w latach 2013-2018 opublikowali jeden, dwa lub co najmniej trzy artykuły naukowe w prestiżowych czasopismach informatycznych związanych z tematyką SI

Uwaga: wzięto pod uwagę publikacje w czasopismach posiadających impact factor, z obszaru machine learning, data mining and artificial intelligence; image processing and computer vision oraz human computer interaction, zgodnie z ich listą zamieszczoną w serwisie internetowym Guide2Research. Dziedziny naukowe badaczy określono na podstawie pierwszej wskazanej przez nich dziedziny.
Źródło obu rysunków: opracowanie OPI PIB na podstawie systemu PBN, stan na 07.05.2019.

W grupie specjalistów SI publikujących wyniki swoich badań w prestiżowych czasopismach informatycznych znajdują się przede wszystkim doktorzy (49% ogółu autorów), a w następnej kolejności doktorzy habilitowani (30%) oraz profesorowie (19%).

Warto zauważyć, że 21% wszystkich autorów opublikowało w analizowanych latach co najmniej trzy artykuły naukowe tego typu.

Liczba badaczy, którzy w latach 2013-2018 opublikowali co najmniej jeden artykuł naukowy w prestiżowym czasopiśmie informatycznym związanym z tematyką SI, według roku urodzenia

Uwaga: wzięto pod uwagę publikacje w czasopismach posiadających impact factor, z obszaru machine learning, data mining and artificial intelligence; image processing and computer vision oraz human computer interaction, zgodnie z ich listą zamieszczoną w serwisie internetowym Guide2Research.
Źródło obu rysunków: opracowanie OPI PIB na podstawie systemu PBN, stan na 07.05.2019.

Największa grupa specjalistów, którzy publikują swoje prace w prestiżowych czasopismach związanych z tematyką SI, to osoby w czwartej lub trzeciej dekadzie życia (odpowiednio 411 i 396 osób).

Podobnie liczną grupę (406 osób) stanowią także badacze od pięćdziesiątego roku życia wzwyż.

Ranking instytucji naukowych z największą liczbą badaczy, którzy w latach 2013-2018 opublikowali co najmniej jeden artykuł naukowy w prestiżowym czasopiśmie informatycznym związanym z tematyką SI 

Uwaga: wzięto pod uwagę publikacje w czasopismach posiadających impact factor, z obszaru machine learning, data mining and artificial intelligence; image processing and computer vision oraz human computer interaction, zgodnie z ich listą zamieszczoną w serwisie internetowym Guide2Research.
Źródło obu rysunków: opracowanie OPI PIB na podstawie systemu PBN, stan na 07.05.2019.

Wyniki swoich prac naukowych w prestiżowych czasopismach informatycznych publikowali przede wszystkim naukowcy zatrudnieni na pięciu uczelniach publicznych: Akademii Górniczo-Hutniczej, Politechnice Warszawskiej, Politechnice Wrocławskiej, Uniwersytecie Warszawskim i Politechnice Poznańskiej. Większość autorów afiliowała publikacje do wydziałów informatycznych, a tylko niewielka grupa – do wydziałów społecznych i humanistycznych.

Poniżej zaprezentowano ranking 20 instytucji naukowych z największą liczbą publikacji w tego typu czasopismach. Warto zwrócić uwagę, że spośród nich wyróżniającą liczbę autorstw lub współautorstw artykułów przypadających na jednego badacza miał Instytut Badań Systemowych PAN (6,93) oraz Politechnika Częstochowska (3,33).

Ranking instytucji naukowych, w których w latach 2013-2018 opublikowano największą liczbę artykułów naukowych w prestiżowych czasopismach informatycznych związanych z tematyką SI

Uwaga: wzięto pod uwagę publikacje w czasopismach posiadających impact fatctor, z obszaru machine learning, data mining and artificial intelligence; image processing and computer vision oraz human computer interaction, zgodnie z ich listą zamieszczoną w serwisie internetowym Guide2Research.
* Dotyczy autorstwa lub współautorstwa artykułów w prestiżowych czasopismach informatycznych o tematyce SI przypadającego na jednego badacza z danej instytucji.
Źródło: opracowanie OPI PIB na podstawie systemu PBN, stan na 07.05.2019.

Załączniki metodologiczne

Załącznik 1

Metoda doboru słów kluczowych do analizy danych z systemu Polska Bibliografia Naukowa

Wyboru publikacji oraz naukowców z obszaru sztucznej inteligencji dokonano z wykorzystaniem metod maszynowych (automatyczne przeszukiwanie baz danych), na podstawie listy słów kluczowych. Założono, że wyodrębnione w ten sposób prace naukowe powinny dotyczyć badań nad metodami sztucznej inteligencji, jej zastosowaniami lub też społecznych aspektów rozwoju nowych technologii, a zatem mogą przedstawiać wąskie (techniczne) lub szerokie ujęcie problematyki sztucznej inteligencji.

Lista słów kluczowych powstała w czterech krokach. Na początek wyodrębniono szeroki zbiór słów kluczowych na podstawie literatury przedmiotu. W kolejnym kroku został on zweryfikowany przez ekspertów: praktyków i naukowców z obszaru sztucznej inteligencji (łącznie sześć osób). Na tym etapie wyeliminowano słowa, które niewłaściwie identyfikują publikacje z obszaru sztucznej inteligencji lub też nie są dla nich unikatowe. Eksperci mieli także możliwość przedstawienia własnych propozycji słów kluczowych. Ustalona w ten sposób lista liczyła 294 terminy w języku angielskim.

Na kolejnym etapie lista słów w języku angielskim została przetłumaczona na język polski. Uwzględniono przy tym wszystkie możliwe wersje tłumaczeń, co oznacza, że słów kluczowych w języku polskim jest więcej niż tych w języku angielskim. Zastosowana technologia przeszukiwań pozwoliła wyodrębnić pracę na podstawie liczby pojedynczej, mnogiej i deklinacji zaproponowanych słów kluczowych.

Na ostatnim etapie, już po wyszukaniu publikacji w bazie PBN wybrano próbkę tytułów i abstraktów prac, aby ostatecznie zweryfikować efektywność wytypowanych słów kluczowych w identyfikacji właściwych prac. Na tym etapie wyeliminowano ze zbioru łącznie 29 fraz, które okazały się zbyt wieloznaczne, by precyzyjnie wskazywać na prace z zakresu SI. Ponadto w przypadku czterech fraz (emotion recognition, expression recognition, object recognition, pattern recognition) zdecydowano się na usunięcie ich z listy słów kluczowych jedynie w przypadku niektórych dyscyplin naukowych (np. psychologia, językoznawstwo, nauki medyczne), w ramach których frazy te wykorzystywane są w innym kontekście.

Weryfikacja listy słów kluczowych pozwoliła zatem na usunięcie zbyt szerokich pojęć, które nie są wyróżnikiem jedynie sztucznej inteligencji (np. clustering, casualty, Python, smart devices). Wybrane pojęcia natomiast są jednocześnie na tyle szerokie, że identyfikują także węższe frazy (np. convolutional neural network identyfikuje neural network).

Statystyki opracowane z wykorzystaniem tak opracowanej listy słów kluczowych są dobrym przybliżeniem realnych wartości. Opracowaną listę można w przyszłości poszerzać o nowe słowa kluczowe oraz inne języki obce oraz konsultować z kolejnymi ekspertami.

Najważniejsze źródła, które posłużyły do wyodrębnienia bazy słów kluczowych:

Załącznik 2

Metoda doboru prestiżowych czasopism informatycznych o tematyce SI do analizy danych z systemu Polska Bibliografia Naukowa

Zakres przeglądu publikacji w czasopismach informatycznych o tematyce SI ustalony został na podstawie listy takich czasopism, zamieszczonej w serwisie internetowym Guide2Research.com. Serwis ten gromadzi wiedzę o badaniach i międzynarodowych konferencjach naukowych. W zakładce „Top 600 Journals” serwisu znajduje się lista czasopism międzynarodowych, posiadających tak zwany impact factor, z podziałem na obszary tematyczne w ramach nauk informatycznych.

Na potrzeby przeglądu wykorzystano następujące listy:

  • 111 czasopism z obszaru machine learning, data mining and artificial intelligence,
  • 57 czasopism z obszaru image processing and computer vision,
  • 28 czasopism z obszaru human computer interaction.

W analizie uwzględniono wszystkie czasopisma z wymienionych wyżej list, w których naukowcy sprawozdający swój dorobek badawczy w systemie Polska Bibliografia Naukowa opublikowali swoje artykuły. Należy zauważyć, że czasopisma te znajdują się w wykazie czasopism punktowanych Ministerstwa Nauki i Szkolnictwa Wyższego na tak zwanej liście A.

Źródło listy prestiżowych czasopism informatycznych o tematyce SI:

Pytania dotyczące badania prosimy przesyłać na adres: labstat@opi.org.pl