Największe wydarzenie o tematyce data science w Polsce mimo pandemii miało duży rozmach – 15 równoległych ścieżek tematycznych i ponad sto prezentacji ekspertów z Polski i zagranicy. Zobacz, co się działo

Data Science Summit to konferencja dla osób związanych z przetwarzaniem, analizą i wizualizacją danych oraz uczeniem maszynowym, a także zainteresowanych tą tematyką. Ze względu na pandemię wirusa COVID-19 tegoroczna, czwarta edycja wydarzenia odbyła się w hybrydowej formule – w konferencji i targach można było uczestniczyć 16 października online, stacjonarne były imprezy preparty i afterparty.

Na Data Science Summit zaplanowano aż 15 równoległych ścieżek tematycznych i ponad sto prezentacji ekspertów z Polski i zagranicy. Dyskutowano o sztucznej inteligencji i uczeniu maszynowym, data mining, narzędziach w data science i ich programowaniu, hurtowniach danych, przetwarzaniu danych w chmurze, wizualizacji i raportowaniu danych. Nie zabrakło też wystąpień przedstawiających trendy i innowacje w dziedzinie przetwarzania danych.

Jak na naszą przyszłość wpłynie sztuczna inteligencja, co dzieje się już, a co nastąpi wkrótce? Czy mamy się czego obawiać – co się stanie z prywatnością naszych danych? Rozmawiano też o rynku pracy – czy zastąpią nas roboty?. Dyskutowano o zawodzie, który wkrótce ma szansę stać się jednym z najbardziej poszukiwanych i najlepiej opłacanych – czyli data scientist. Przede wszystkim padały konkretne przykłady istniejącego już wykorzystania technologii i konkretne rozwiązania techniczne.

Wystąpienia dostępne w formacie VoD (video on demand) podzielono na kilkanaście kategorii: computer vision (maszynowego rozpoznawania obrazów), przetwarzania języka naturalnego, uczenia ze wzmocnieniem, analizy predykcyjnej i preskrypcyjnej, customer analytics (analizy danych zachowań konsumentów), przetwarzania danych i wdrożeń oraz big data, przetwarzania danych w chmurze i „hurtowni danych” (data warehouses). Osobne działy poświęcono wizualizacji i raportowaniu danych, danym w usługach medycznych, komputerom kwantowym oraz prawu i etyce. W sumie dostępnych było ponad 120 prezentacji w tej formie.

Organizatorzy zapowiedzieli dostęp do nagrań wszystkich prelekcji jeszcze przez trzy miesiące po wydarzeniu.

Dr Jarosław Protasiewicz, dyrektor Ośrodka Przetwarzania Informacji – Państwowego Instytutu Badawczego, w wystąpieniu VoD przedstawił złożony ekosystem informacji dla szkolnictwa wyższego i nauki. OPI PIB stworzyło wykorzystywane w tych obszarach systemy POLon (zintegrowany system o nauce polskiej), zawierający także Polską Bibliografię Naukową (PBN), Ogólnopolskie Repozytorium Pisemnych Prac Dyplomowych (ORPPD), Jednolity System Antyplagiatowy (JSA) oraz Zintegrowany System Usług dla Nauki / Obsługa Strumieni Finansowania (ZSUN/OSF), a także ogólnopolski system monitorowania Ekonomicznych Losów Absolwentów szkół wyższych (ELA – który pokazuje zarobki absolwentów po poszczególnych kierunkach i uczelniach). Prezentacja dotyczyła także wyzwań związanych z tworzeniem zintegrowanych systemów operujących wielką ilością danych do celów świadczenia usług rozproszonych w ekosystemie usług publicznych, by wspomóc podejmowanie decyzji.

Nie zabrakło też wystąpień na żywo. Monitorowanie satelitarne w rolnictwie, choć brzmi jak science fiction, już jest wykorzystywane do sprawdzania stanu upraw oraz do kontroli, czy unijne dotacje wykorzystywane są zgodnie z przepisami. Jak należy analizować takie dane i co jest do tego potrzebne, opowiadali dr Jan Musiał, adiunkt Centrum Teledetekcji Instytutu Geodezji i Kartografii w Warszawie, oraz dr Jędrzej Bojanowski, zastępca kierownika Centrum Teledetekcji Instytutu Geodezji i Kartografii w Warszawie).

Dr hab. inż. Przemysław Biecek z Politechniki Warszawskiej przestawił zaś ideę „odpowiedzialnego uczenia maszynowego” (responsible learning) – nową ideę przedstawioną przez Gartnera w tym roku jako odpowiedź na usterki związane z niską skutecznością modeli uczenia maszynowego, brakiem przejrzystości modeli czy częstą dyskryminację użytkowników. Obok metod i narzędzi przestawił także ich zastosowanie do przewidywania powikłań w przebiegu zachorowania na COVID-19 (opracowane z grupą MOdeling COronavirus Spread – MOCOS).

Równolegle do konferencji odbyły się również Data Science Expo – targi usług, rozwiązań i technologii, połączone z targami pracy. Można było na nich wirtualnie spotkać największych pracodawców branży data science oraz zapoznać się z najnowszymi technologiami i usługami, jakie oferują.

Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy był patronem honorowym wydarzenia, a portal sztucznainteligencja.org.pl (którego OPI PIB jest wydawcą) – patronem medialnym.