W programach nauczania data science za mało mówi się o realiach biznesowych oraz etycznej sztucznej inteligencji. A bez tych kompetencji trudno o profesjonalną i odpowiedzialną kadrę – przekonują autorzy raportu „2020 State of Data Science”
Raport, opracowany przez firmę Anaconda (prowadzącą najpopularniejszą platformę data science dla języka Python), oparto na wynikach ankiety przeprowadzonej wśród 2360 uczestników z ponad 100 państw na całym świecie. Ankietowani reprezentowali różne środowiska data science: studentów, naukowców oraz ekspertów zatrudnionych w przedsiębiorstwach.
Tegoroczna edycja skupia się na wykorzystaniu data science w różnych środowiskach komercyjnych oraz na sposobach edukacji przyszłych specjalistów w tej dziedzinie.
Etyka wciąż na marginesie
Największy niepokój twórców raportu wzbudza zbyt opieszałe podejście do problemów związanych ze sprawiedliwym i wyjaśnialnym działaniem systemów SI. Tylko 15 procent respondentów wskazało, że w ich organizacjach wdrożono rozwiązania przeciwdziałające dyskryminacji przez systemy SI. W przypadku wyjaśnialnej SI wynik jest niewiele lepszy i dotyczy 19 procent ankietowanych. Pocieszające jest to, że spora liczba organizacji planuje wdrożenie takich narzędzi, jednak częściej skupiają się one na wyjaśnianiu działania SI (35 procent) niż na zapewnieniu jej sprawiedliwego funkcjonowania (23 procent). Autorzy podkreślają przy tym, że choć oba obszary są ze sobą powiązane, to jednak nie należy ich traktować łącznie.
Niestety, bardzo wiele przedsiębiorstw nie ma w ogóle zamiaru wprowadzać tego typu rozwiązań: w przypadku 39 procent dotyczy to przeciwdziałania skrzywieniu algorytmicznemu (czyli niesprawiedliwego działania SI), zaś 27 – narzędzi do wyjaśniania SI. Zdaniem twórców raportu taka postawa jest niebezpieczna dla firm i grozi utratą konkurencyjności oraz konsekwencjami finansowymi i prawnymi.
Postawa przedsiębiorców jest tym bardziej niepokojąca, że dla 27 procent ankietowanych specjalistów największym zagrożeniem związanym z uczeniem maszynowym jest właśnie skrzywienie algorytmiczne. Wśród innych wymienionych problemów znalazły się też m.in.: wpływ technologii SI na prywatność (21 procent), jej negatywne oddziaływanie na środowisko oraz generowanie nierówności społecznych (w sumie 10 procent ankietowanych).
Ograniczone zainteresowanie biznesu wyjaśnialną SI oraz przeciwdziałaniem dyskryminacji znajduje odzwierciedlenie w programach nauczania na kierunkach data science. Jedynie 15 procent ankietowanych wykładowców zadeklarowało, że uczy etyki SI, zaś do zajęć tego rodzaju miało dostęp tylko 18 procent studentów.
Edukacja oderwana od realiów
Co ciekawe, niedostatki w nauczaniu etyki SI idą w parze ze słabym przygotowaniem studentów do pracy w środowisku biznesowym. Kształcenie kompetencji w obu tych obszarach występowało jedynie w przypadku 15 procent uczelni. Tymczasem, jak podkreślają twórcy raportu, umiejętności te będą tylko zyskiwać na znaczeniu wraz z upowszechnianiem się data science i wzrostem jej znaczenia przy podejmowaniu decyzji w organizacjach.
Jedynie 15 procent ankietowanych wykładowców zadeklarowało, że uczy etyki SI, zaś do zajęć tego rodzaju miało dostęp tylko 18 procent studentów.
W takiej sytuacji priorytetem staje się współpraca biznesu i uczelni przy tworzeniu rozbudowanych programów praktyk i staży. Dzięki nim studenci będą mogli lepiej zrozumieć wyzwania w realnym świecie, a także nauczą się lepiej tłumaczyć wyniki swoich analiz oraz przedstawiać znaczenie swojej pracy dla działania firmy.
Frustracja i potrzeba zmiany
Ta ostatnia kwestia jest ważna w kontekście odczuć wielu specjalistów data science, którzy deklarują, że ich praca nie przekłada się na rzeczywiste działania w ich organizacjach. Dotyczy to w największym stopniu osób, które pracują wspólnie z działami IT, a w najmniejszym tych funkcjonujących w osobnych centrach doskonalenia data science.
Na możliwość zastosowania data science w praktyce ma również wpływ sektor, w jakim zatrudniona jest dana osoba: taką możliwość deklarowały najczęściej osoby pracujące w energetyce, nowych technologiach i bankowości (odpowiednio 71, 60 i 57 procent), zaś najrzadziej w służbie zdrowia (34 procent). W sumie tylko połowa ankietowanych mówi o częstym zastosowaniu rezultatów swoich działań w praktyce.
Taka sytuacja skutkuje frustracją i częstymi zmianami miejsca zatrudnienia wśród wielu specjalistów data science. Stopień przywiązania do miejsca pracy różni się w zależności od ich umiejscowienia w strukturze firmy (działy IT, działy badawczo-rozwojowe, działy biznesowe, centra doskonałości data science), jednak w żadnym wypadku liczba pracowników deklarujących chęć pozostania w firmie dłużej niż przez 3 lata nie przekracza 50 procent ankietowanych.
Niezbędna integracja
Aby przeciwdziałać tak dużej rotacji specjalistów od data science, firmy muszą więc stworzyć dla nich programy rozwoju i integracji, tak by bliżej związać ich z głównym obszarem działalności danej organizacji i dać im poczucie sprawczości. Same wysokie zarobki już dziś nie wystarczą.
Raport „2020 State of Data Science” to ważny głos w dyskusji na temat przyszłości jednego z najważniejszych trendów we współczesnych nauce i biznesie. Zawarte w nim opinie dają do myślenia nie tylko z tego powodu, że pochodzą od praktyków, ale również dlatego, że wiążą ze sobą nieoczywiste obszary, jak biznes i etyka. Nie powinno nas to jednak dziwić – w końcu specjalnością data science jest wykrywanie nieoczywistych zależności.