Czy to przyszłość dla inteligentnych asystentów głosowych? Mogą do ciebie mówić twoim głosem. Nie tylko. Lektorów filmów, głosy aktorów gier można tworzyć samemu. I skopiować swój też

Przypadkiem znalazłam w sieci firmę o nazwie Replica Studios. Chwali się, że buduje największą bazę ludzkich głosów na świecie.

„Opracowaliśmy sztuczną inteligencję, która może odtworzyć ludzki głos za pomocą kilku minut nagrania” – brzmiało zaproszenie do wejścia głębiej. Zaryzykowałam, mając w pamięci incydent z podrabianym głosem prezesa dużego koncernu, który miał zadzwonić do pracownika zagranicznej filii firmy i skutecznie zlecił wykonanie przelewu na sporą sumę, oczywiście na konto złodzieja. Replica, jak twierdzą jej autorzy – fani filmów, gier i programiści jednocześnie, ma mieć jednak wysoki poziom zabezpieczeń. Firma to niewielki australijski start-up z Brisbane. Zatrudnia dziesięć osób.

„W Replica możesz wybrać nagrany wcześniej głos i stworzyć na jego bazie swój projekt. Tekst, który wpiszesz po angielsku, zostanie odczytany przy jego użyciu. Możesz też spróbować przeszkolić algorytmy sztucznej inteligencji własnym głosem” – zachęcają autorzy na witrynie firmy. Spróbowałam.

Zadanie do wykonania? Odczytanie kilkudziesięciu zdań w języku angielskim do mikrofonu wbudowanego w komputer czy telefon. To przypadkowy tekst: o tęczy, dziadku, staniu w kolejce, rollercoasterze. Zdania są zarówno krótkie, jak i złożone. Zajmuje to od kilku do kilkunastu minut. Mnie kilkanaście, bo dwukrotnie przeszkoliłam algorytm. Na przygotowanie SI, która gada moim głosem musiałam trochę poczekać. Algorytm po nauczeniu się mojego tembru i stylu czytania teraz potrafi przekształcić tekst na mowę. Moją. Efekt? Zdumiewający, choć nie do końca perfekcyjny. Tekst po angielsku, wpisany w odpowiednie miejsce na stronie firmy replicastudios.com jest faktycznie czytany moim głosem, choć nieco źle modulowany. Drobnostka.

Opracowaliśmy sztuczną inteligencję, która może odtworzyć ludzki głos za pomocą kilku minut nagrania

– Wciąż nie jesteśmy zadowoleni z jakości angielskiej wersji – wyjaśnia w rozmowie ze mną odpowiadając na pytania, jakie zadaję mu w imieniu portalu sztucznainteligencja.org.pl Cameron Smith, główny menedżer produktu w Replica Studios. Fajnie byłoby, – mówię, gdyby dało się robić nagrania również w innych językach. – Najpierw doprowadzimy wersję anglojęzyczną do perfekcji, a potem zajmiemy się pracą nad innymi językami – odpowiada Cameron Smith. Wyobrażam sobie, jak smsy ode mnie przesłane podróżującemu mężowi komputer pokładowy naszego samochodu czyta moim głosem.

– Tak, to będzie możliwe – przyznaje Cameron. Ale Replica główne zastosowanie ma znaleźć m.in. w grach, będzie lektorem w filmach, zastępując dubbingujących aktorów, przyda się na rynku reklamowym i w różnego typu aplikacjach, wykorzystujących głosowych asystentów. Podobnie jak Siri Apple’a czy asystent Google’a – będą mogli do ciebie mówić głosem, jaki wybierzesz lub nagrasz. Facebook też pracuje nad takim rozwiązaniem.

Replica pokazuje możliwości systemu na krótkim filmie, gdzie produkt zachwala Sundar Pichai, szef Google oraz kasowy aktor Arnold Schwarzenegger. To oczywiście przeróbki ich głosów wykonane przez SI.

Adres filmu na Youtube: https://www.youtube.com/watch?time_continue=28&v=f4DgHI9J3U8&feature=emb_logo

https://www.youtube.com/watch?time_continue=28&v=f4DgHI9J3U8&feature=emb_logo
O Replice opowiadają celebryci – prezes Google Sundai Pichar czy Arnold Schwarzenegger. Oczywiście robi to za nich przeszkolony ich głosami algorytm Replica Studios
Źródło: Replica Studios/YouTube

Animatorzy, scenarzyści, reżyserzy, twórcy gier i aplikacji, konsultanci marketingowi i reklamodawcy, którzy mają do opowiedzenia jakąś historię, za pośrednictwem rozwiązania Replica AI mogą ją ożywić szybciej i łatwiej, bez konieczności nagrywania w studiu.

Ale wciąż powraca pytanie – co z etycznym użyciem „sztucznych” głosów, odwzorowanych od konkretnych ludzi?

– Od momentu powstania Replica byliśmy świadomi etycznego wykorzystania syntetycznych głosów sztucznej inteligencji i tego, w jaki sposób taka technologia może zostać wykorzystana w złych zamiarach – pisze Shreyas Nivas na blogu firmy. – Po pierwsze, nigdy nie umożliwiamy publicznego dostępu do czyjegokolwiek głosu Replica bez zgody właściciela. Po drugie, nigdy nie pozwalamy naszym użytkownikom na replikowanie czyjegoś głosu – stosujemy zabezpieczenia, aby temu zapobiec. Wreszcie, kiedy współpracujemy z aktorem głosowym i udostępniamy jego głos Replica każdemu użytkownikowi naszego produktu, obowiązuje umowa licencyjna, która zapewnia im odpowiednią rekompensatę za ciągłe używanie ich replikowanego głosu.

Adres filmu na Youtube: https://www.youtube.com/watch?v=qaKQKDN4Z7c&list=PLYmLRnTpj4nzpDCHaI9bMx0OvBg1J3L7y

To, co odróżnia Replicę od innych firm oferujących usługi tekstowe wspomagane przez SI, to ścisła współpraca z aktorami głosowymi w celu stworzenia rynku dla głosów SI
Źródło: Replica Studios/YouTube

A Smith spieszy z dalszymi wyjaśnieniami: – To, co odróżnia Replicę od innych firm oferujących usługi tekstowe wspomagane przez SI (np. Google lub Amazon), to ścisła współpraca z aktorami głosowymi w celu stworzenia rynku dla głosów SI. Aktorzy głosowi będą mogli skonfigurować profile dla swoich Replica Voice i zarabiać tantiemy za każdym razem, gdy ich głos jest używany – zdradza mi główny menedżer produktu australijskiej firmy. A ja oczami wyobraźni widzę, jak telefon zamiast mamy czyta dziecku jej głosem bajki na dobranoc, a noworoczne orędzie w telewizji wygłasza awatar prezydenta, który w tym czasie szusuje w Wiśle… Nie wiem, czy to pójdzie w dobrym kierunku.