Finlandia zbiera nagrania mowy swoich obywateli oraz obcokrajowców mówiących po fińsku i osób z wadami wymowy. Każdy może przesłać swoje nagranie uczestnicząc w projekcie non-profit. Po co?

Czy rodowity Ślązak, który „godo”, zrozumie mowę Kaszuba? Można wątpić. A co mają zrobić asystenci głosowi, którzy takiego mówienia gwarą czy narzeczem w ogóle nie rozumieją, bo nikt ich na takich danych nie wyszkolił? Finlandia wpadła na pewien nowatorski pomysł. Chce nauczyć SI rozumienia wszystkich możliwych narzeczy i dialektów fińskiego, a nawet rozpoznawania fińskiego w wykonaniu obcokrajowców czy osób z wadami wymowy. Finlandia rozpoczyna projekt zbierania próbek mowy od wszystkich fińskich użytkowników, aby opracować technologię rozpoznawania głosu.

Kampania „Donate Your Speech” („Przekaż swoją mowę”) zbiera naturalną mowę i powiązane informacje z całej Finlandii. Przekazując swoje wypowiedzi chętni mają pomóc naukowcom i firmom rozwijającym sztuczną inteligencję w zrozumieniu i modelowaniu cech mowy fińskiej, jej dialektów i różnych stylów mówienia. Celem jest m.in. rozwój aplikacji i usług sterowanych głosem, które będą działać płynnie w języku fińskim, niezależnie od dialektu oraz tego, czy to mowa potoczna, czy też oficjalna.

Za pomysłem stoi m.in. Yle – fiński publiczny wydawca radiowo-telewizyjny, który nadaje 5 kanałów telewizyjnych oraz 38 radiowych (w tym 25 regionalnych) w pięciu językach: fińskim, szwedzkim, lapońskim, angielskim i łacińskim. Wspiera naukowców z Uniwersytetu Helsińskiego wraz z państwową firmą rozwojową VAKE, działającą od 2016 roku, która ma pobudzać inwestycje cyfrowe i prośrodowiskowe. Całe przedsięwzięcie „Donate Your Speech” (po fińsku Lahjoita puhetta) jest finansowane z pieniędzy publicznych.

W mniejszości

Używanie poleceń aktywowanych głosem do wykonywania połączeń telefonicznych, dyktowania list zakupów lub przyciemniania świateł staje się coraz bardziej powszechne w wielu krajach. Finlandia ze swoim Finnish, który jest używany przez ok. 4,9 miliona obywateli na 5,5 miliona mieszkających w Finlandii, pozostaje w tyle w technologii aktywowanej głosem. To częsty problem w przypadku języków z mniejszą liczbą użytkowników. Nawet Komisja Europejska zwróciła na to uwagę. Wyraziła zaniepokojenie, że technologia przetwarzania języka naturalnego stworzona głównie dla użytkowników języka angielskiego powoduje, że inne języki są niedostatecznie reprezentowane albo pomijane – to za małe rynki, aby duże firmy technologiczne inwestowały w świadczenie takich usług.

Fiński język, trudna język

Fiński wbrew powszechnemu przekonaniu nie jest spokrewniony ze szwedzkim czy norweskim. Największym językiem europejskim, który ma tego samego przodka, co fiński, jest język węgierski. W Finlandii „Finnish” za język ojczysty uważa ok. 92 procent populacji. W Szwecji, gdzie posługuje się nim około 300 tys. mieszkańców pochodzenia fińskiego, jest uznawany jako język mniejszości, jest też oficjalnie językiem mniejszości w Republice Karelii w Rosji. Niewielkie fińskojęzyczne mniejszości znajdują się również w prowincji Finnmark na północy Norwegii oraz w Estonii. Języka standardowego używa się w tekstach oficjalnych i jest odmianą języka nauczaną w szkołach. Jego forma mówiona obowiązuje w polityce, mediach, w sądach i innych formalnych sytuacjach. W języku fińskim różnica między językiem pisanym a mówionym jest większa niż w większości innych języków używanych w Europie – różnią się zarówno gramatycznie, jak i fonetycznie. Języka literackiego używa się w prawie wszystkich tekstach pisanych, z wyjątkiem nieformalnych wiadomości przesyłanych drogą mailową, SMS-em czy komunikatorami internetowymi.

Luknij man

Z kolei w języku mówionym używa się prawie wyłącznie form potocznych, które różnią się w zależności od dialektu, wieku i statusu społecznego, poza tym ten sam użytkownik może używać różnych rodzajów języka mówionego. Fiński język potoczny opiera się na dialekcie helsińskim. Można je podzielić na dwie grupy główne: zachodnią i wschodnią, (czasem wyróżnia się jeszcze dialekty północne), z której każda ma kilka podgrup. Różnice między fińskimi dialektami są na ogół niewielkie – różnią się prawie wyłącznie wymową. Jedną z odmian dialektu jest tzw. Finglish – odmiana języka używana przez fińskojęzycznych emigrantów w Stanach Zjednoczonych i Kanadzie. Również i neologizmy w odróżnieniu od języków Europy są na ogół tworzone na bazie fińskiego. Z zapożyczeń język fiński korzysta rzadko. Ciekawostki? Najdłuższy wyraz fiński to „epäjärjestelmällistyttämä¬ttömyydelläänsäkäänköhän”, co oznacza: „nawet nie przez jej brak zorganizowania, czyż nie”.

Fiński od obcokrajowców

Celem uruchomionego właśnie projektu jest pobranie próbek mowy od dużej i zróżnicowanej puli fińskich użytkowników, w tym tych, którzy uczą się go jako języka obcego. „Ponieważ coraz więcej osób mówi po fińsku jako języku obcym, ważne jest, aby sztuczna inteligencja rozpoznawania mowy nauczyła się rozpoznawać obcy akcent” – wyjaśnia Katja Solla, dziennikarka pracująca nad projektem w Yle. Przewiduje się, że w samych Helsinkach liczba osób obcojęzycznych wzrośnie do 2035 roku z obecnego poziomu 14 procent do około 25 procent. Dlatego dzielenie się przez nich swoją mową po fińsku może mieć bardzo duże znaczenie. Wolontariusze powinni mówić naturalnie i nie czytać.

Badacze chcą pozyskać 10 tysięcy godzin fińskiej mowy, projekt ma trwać do końca bieżącego roku. Zgromadzonym materiałem ma zarządzać Language Bank of Finland, podmiot działający w ramach Uniwersytetu Helsińskiego. Co pięć lat naukowcy będą oceniać, czy należy usunąć, czy zachować w części lub całości zebrane dane. Za symboliczną opłatą materiały będą dostępne dla każdego, pod warunkiem, że wykaże zgodność z zasadami ochrony prywatności w Unii Europejskiej.

A co z prywatnością?

Podobno fińskie firmy technologiczne z zadowoleniem przyjęły tę inicjatywę. Ale co z prywatnością? To stało się powodem do dyskusji nad całym przedsięwzięciem. Bo przecież amerykańscy i chińscy giganci technologiczni Apple i Google spotkały się z krytyką za podsłuchiwanie klientów w celu opracowania własnych technologii rozpoznawania mowy. Jak przekonują wykonawcy specjalnej aplikacji na potrzeby projektu z firmy Solita, „Przekaż swoją mowę” to dobrowolna i przejrzysta inicjatywa zbierania danych dla SI. „Mówimy ludziom, co robimy, a oni przekazują nam te informacje dobrowolnie” – powiedział jej przedstawiciel Sami Köykkä. Są i głosy krytyki.

W dającej się przewidzieć przyszłości sztuczna inteligencja może tworzyć nagrania używane do wyłudzania pieniędzy z banku lub przez podających się za krewnych np. osób starszych.

„Komputerom nie jest trudno dopasować anonimowe próbki audio do prawdziwych ludzi, jeśli ich głosy są dostępne w internecie” – twierdzi Dave Sayers, wykładowca z Uniwersytetu Jyväskylä, który bada, w jaki sposób nowe technologie kształtują język.

Firmy zajmujące się wykorzystaniem SI w rozwiązaniach opartych na języku naturalnym pokazały również, jak małe fragmenty dźwięku mogą naśladować mowę prawdziwej osoby. Przykład? Australijska Replica AI – potrafi skonstruować głos osoby, która wypowie do aplikacji zaledwie kilka zdań. Każdy może spróbować.

Aleksi Rossi, która przewodzi projektowi „Przekaż swoją mowę” zapewnia, że dane będą traktowane z najwyższą ostrożnością, a zainteresowane strony, które chcą uzyskać dostęp do materiałów, będą poddawane wielostopniowej kontroli. Wolontariusze mogą również zażądać usunięcia swoich głosów z systemu.


*Różnice w języku na terenie Polski: Fraza „Gdzie można najbliżej zjeść?”

Góral: Kany jes nojblizy cosik zjeś?
Ślązak: Kaj je nojbliżej pojejś?
Kaszub: Chdze je zjecs?