Aplikację do rozpoznawania śpiewu ptaków stworzyły kobiety z trójmiejskiego oddziału Women in Machine Learning & Data Science. Nie dla pieniędzy ani sławy, więc po co? Po prostu chciały zrobić coś razem
Spotykały się co dwa tygodnie po pracy. Przez pięć miesięcy od sierpnia do grudnia zeszłego roku, osiem dziewczyn z Trójmiasta realizowało projekt, który nie miał przysporzyć im ani pieniędzy, ani sławy, ani jakiegoś konkretnego dorobku naukowego w postaci artykułu, który można by wydrukować w renomowanym czasopiśmie.
– Myśmy po prostu chciały zrobić coś razem. Czegoś się od siebie nawzajem nauczyć – mówią, jakby to było takie oczywiste.
Były wśród nich m.in.: specjalistka od data science, doktorantka zajmująca się sztucznymi sieciami neuronowymi, programistka, ekspertka od akustyki i ornitolożka. W tym interdyscyplinarnym kobiecym zespole wspólnie stworzyły machine learningowy model do detekcji śpiewu ptaków.
– Tak, wiem, są już na rynku aplikacje do rozpoznawania śpiewu ptaków – mówi nam Magdalena Kortas, uczestniczka projektu, specjalistka od data science. – Ale to był nasz pierwszy wspólny machine learningowy projekt, który miałyśmy zrobić same od początku do końca, od pozyskania danych aż po produkt końcowy. Nie chciałyśmy robić czegoś zupełnie nowego; chciałyśmy móc porównać nasze rozwiązanie z innymi, przekonać się, co zrobiłyśmy lepiej, a co gorzej.
Poza tym, jak się dowiedziałyśmy, ptaki tego samego gatunku na różnych szerokościach geograficznych śpiewają inaczej. Model wytrenowany na nagraniach z Wielkiej Brytanii, niekoniecznie będzie dobrze działał w Polsce. Postanowiłyśmy więc zająć się detekcją śpiewu ptaków z naszych okolic.
Skąd taki pomysł?
Zaczęło się od bootcampu
– W 2018 roku wzięłam udział w bootcampie dla data scientistów – opowiada Magda Kortas. – Skończyłam analitykę gospodarczą na Politechnice Gdańskiej, ale nie chciałam się tym zajmować zawodowo. Od dziecka interesowałam się informatyką. Kiedy tylko dowiedziałam się, że jest taki zawód, jak data scientist, który polega zbieraniu, analizowaniu i interpretowaniu bardzo dużych ilości danych i że właśnie ma się odbyć w Trójmieście bootcamp, czyli 6-miesięczny, intensywny kurs data science, natychmiast się na niego zapisałam. Okazało się, że to był strzał w dziesiątkę.
W kursie brało udział dwanaście osób, z czego połowa to były – ku mojemu zdziwieniu – kobiety. Wszystkie byłyśmy zaskoczone swoją obecnością, choć później zdałyśmy sobie sprawę, że nie powinnyśmy być – to powinno być całkowicie naturalne, że kobiety również pracują w zawodach technicznych, inżynierskich i programistycznych.
– Pod koniec kursu stwierdziłyśmy z dziewczynami, że fajnie by było zintegrować środowisko kobiet, które działa w data science i machine learningu w Trójmieście i stworzyć organizację, gdzie byśmy się wspólnie uczyły, wspierały i promowały.
Kiedy zaczęłam szperać w temacie, odkryłam, że od 2013 roku istnieje już międzynarodowa organizacja, która to robi. Ma 30 tysięcy członków na całym świecie. Nazywa się Women in Machine Learning & Data Science – wspomina Kortas.
Kobieca współpraca daje pewność siebie
Jak wygląda rynek pracy w data science? Według danych z Linkedina w zawodzie tym pracuje w Polsce 1400 osób; 16 proc. z nich, a więc 224 osoby to kobiety. W Trójmieście w data science pracuje 63 osoby; w tym 27 proc., 17 kobiet. Na świecie, zależnie od źródła statystyk, kobiety stanowią od 15 proc. do 25 proc. pracowników data science. To ponad 40 tysięcy osób.
Są, co najmniej dwa rodzaje śpiewu: jeden godowy, dłuższy i drugi ostrzegawczy – krótszy i ostrzejszy. Poza tym ptaki mają różne dialekty. Nieco inaczej śpiewa sikorka żyjąca nad morzem niż ta z gór
– Mogłoby by być nas znacznie więcej – mówi Magda Kortas. – Zwłaszcza, że data scientist nie jest typowo programistycznym zawodem; liczą się tu nie tylko twarde kwalifikacje, ale także kreatywność i umiejętności miękkie. Dlatego zdecydowałyśmy się stworzyć oddział gdański WiML&DS. Drugi polski oddział działa w Poznaniu. Naszym celem jest właśnie promowanie udziału kobiet w tej dziedzinie, organizowanie szkoleń, tworzenie wspólnych projektów, networking. Myślę, że dzięki takiej kobiecej współpracy dziewczyny nabierają więcej pewności siebie, a tego często im brakuje. To dlatego byłyśmy zdziwione swoją obecnością na kursie; kobiety często nie wierzą, że mogą tworzyć rozwiązania przyszłości. A przecież nie powinno nas to ani dziwić ani zaskakiwać.
Zawód programisty nie dla kobiet?
Ale takie postawy kształtowane są bardzo wcześnie. Uważam, że programy typu „kobiety na politechniki” są tworzone dużo za późno. Już we wczesnej podstawówce trzeba dziewczynkom pokazywać, że jeśli tylko chcą, mogą zostać inżynierkami i informatyczkami, że mogą pracować w zawodach związanych z nowymi technologiami. Ja zawsze byłam mocna z informatyki i matematyki, a mimo to od swojego nauczyciela w liceum usłyszałam, że zawód programisty nie jest dla kobiet, że jako kobieta nie powinnam iść w tę stronę. To realnie wpłynęło na moją decyzję o wyborze studiów.
Ptasi śpiew w dialekcie
Pewnie każdy z nas zastanawiał się nie raz, co to za ptak tak śpiewa za oknem. Jednak rozróżnienie śpiewu ptaków nie jest łatwym zadaniem. Melodie różnią się zależnie od sytuacji. Są, co najmniej dwa rodzaje śpiewu: jeden godowy, dłuższy i drugi ostrzegawczy – krótszy i ostrzejszy. Poza tym ptaki mają różne dialekty. Nieco inaczej śpiewa sikorka żyjąca nad morzem niż ta z gór. Co gorsza są gatunki, które naśladują głosy innych – niektóre nawet urządzeń, na przykład telefonów komórkowych – i wplatają je we własne melodie. Amatorzy ptasich treli swoje nagrania wrzucają na platformę Xeno Canto, na której jest w tej chwili ponad 500 tysięcy nagrań ponad 10 tysięcy gatunków ptaków z całego świata. To stąd uczestniczki projektu z Trójmiasta wzięły potrzebne im dane.
– Pobrałyśmy kilkadziesiąt tysięcy nagrań 27 najbardziej popularnych w Polsce gatunków ptaków – mówi Magda Kortas. – Dla każdego gatunku miałyśmy od 50 do 2000 nagrań. Nagrania miały jednak bardzo różną jakość – na wielu z nich w tle słychać śpiew innych ptaków, odgłosy miasta, szum samochodów. Problemem była też różna długość – jedne nagrania trwały 5 sekund, podczas gdy inne 15 minut. Musiałyśmy najpierw wszystkie te dane odpowiednio przygotować. Jak w każdym projekcie machine learningowym – ściągnięcie i przygotowanie danych zajęło nam 80-90 proc. czasu. Tworzenie modelu SI to była wisienka na torcie.
Doktorat z Preludium
Tym w projekcie zajęła się Agnieszka Mikołajczyk z Politechniki Gdańskiej, która w ramach grantu Preludium pisze doktorat z wyjaśnialnej sztucznej inteligencji.
– Głębokie sieci neuronowe często mają dziesiątki milionów parametrów i ciężko przeanalizować na podstawie czego sieć wykonała taką, a nie inną predykcję – tłumaczy. – Na przykład dlaczego sklasyfikowała dany śpiew jako śpiew gołębia. Jeśli w bazie danych mamy w większości nagrania gołębi z głosem dzwonu kościoła w tle, sztuczna inteligencja może pomylić śpiew gołębia z dźwiękiem bijących dzwonów. Wyjaśnialna sztuczna inteligencja ma zapobiegać tego typu pomyłkom. Ja pracuję głównie na obrazach medycznych – zajmuję się znamionami skórnymi, do tej pory głównie czerniakiem złośliwym. W ptasim projekcie też pracowałam na obrazach – melspektrogramach. Robiłam wizualizacje nagrań dźwiękowych i otrzymywałam wykresy – obrazy, które wędrowały do głębokich sieci konwolucyjnych. Początkowo zdecydowałyśmy, że nasz model będzie rozróżniał tylko pięć gatunków – zdecydowałyśmy się na te, które były najlepiej reprezentowane w nagraniach. Ostatecznie skończyło się na 27 najczęściej spotykanych ptakach w Polsce.
Właśnie powstaje aplikacja webowa. Wkrótce każdy będzie mógł wrzucić tu swoje własne nagranie, a algorytm sklasyfikuje je, pokaże fotografię ptasiego śpiewaka i o nim opowie. W planach jest także aplikacja mobilna.
– Niestety przeszkodziła nam epidemia – dodaje Magdalena Kortas. – Na wiele z nas spadło z tej okazji tyle obowiązków domowych i rodzinnych, że po prostu nie miałyśmy możliwości zajmować się jeszcze takim dodatkowym projektem. Ale jest plan, żeby od sierpnia znowu działać. Chcemy wziąć udział w niedawno ogłoszonym konkursie na znanej platformie Kaggle, który także dotyczy rozpoznawania śpiewu ptaków. Tam będzie już konkurencja z całego świata, więc myślę, że to będzie dla nas super doświadczenie.