Niektóre mają zakręconą melodię, inne są dziwne pod kątem rytmu. Czy sztuczna inteligencja może pomóc skomponować taki hit jak przeboje Eurowizji? Sprawdza to platforma medialna VPRO. Ogłosiła konkurs

Rywalizacja piosenek skomponowanych przy użyciu algorytmów ma wypełnić lukę po odwołanej tegorocznej edycji Eurowizji.

W tym roku słynny konkurs miał się odbyć w połowie maja w Rotterdamie (organizacją zajmowała się Europejska Unia Nadawców oraz kilku holenderskich nadawców publicznych). Jednak z powodu pandemii COVID-19 został odwołany.

Pałeczkę czym prędzej przejęła VPRO. To organizacja medialna z siedzibą w Holandii, z długą historią sięgającą 1926 roku. Powstała jako radiowa rozgłośnia protestancka. W latach 50. i 60. XX w. religijny charakter rozgłośni zmienił się na świecki, społeczno-liberalny, a stacja rozpoczęła nadawać programy telewizyjne. Przez lata ewoluowała i rozrastała się, zyskując światową reputację dzięki pozostawaniu w awangardzie zmian zachodzących na rynku medialnym. VPRO to obecnie radio, telewizja, magazyn medialny, szereg stron internetowych i aplikacji itp. Obecnie specjalizuje się w tematyce kulturalnej.

Hit czy kit?

W konkursie o nazwie „AI Song Contest”, który wystartował 10 kwietnia, bierze udział 13 drużyn z 8 krajów: Australii, Belgii, Francji, Holandii, Niemiec, Szwajcarii, Szwecji i Wielkiej Brytanii. Grupy muzyków, artystów, naukowców i programistów wraz z VPRO zbadają tym samym twórczą moc sztucznej inteligencji i jej wpływ na przyszłość przemysłu muzycznego.

Ich zadaniem było stworzenie za pomocą sztucznej inteligencji hitu na miarę zwycięskich piosenek Eurowizji. Wśród nich w ciągu 64 lat istnienia konkursu były np. utwór „Nel blu dipinto di blu” Domenico Modugno, znany pod tytułem „Volare”, czy „Heroes” Månsa Zelmerlöwa.

Prawie zawsze zwycięstwo w Eurowizji zapewniało międzynarodową karierę – zrobili ją m.in. Celine Dion, Julio Iglesias czy ABBA.

Do trenowania swoich algorytmów zespoły uczestniczące w konkursie użyły zarówno danych, których dostarczyły najlepsze szlagiery z Eurowizji, jak i specjalnych zestawów danych z hitów o konkretnym profilu (np. wyłącznie szybkich, wyłącznie wesołych czy z tekstami o miłości) oraz innych.

Na straży sztuczności

Głosowanie trwa do 10 maja i każdy może wziąć w nim udział. Wystarczy kliknąć i postępować zgodnie ze wskazówkami. Wyniki uzupełnione o ocenę fachowców zostaną podane 12 maja.

Konkurs nadzoruje Europejska Unia Nadawców (EBU) – ta sama, która co roku monitoruje przebieg głosowania Eurowizji. Zgodności z zasadami konkursu oraz tego, aby SI rzeczywiście była zaangażowana w proces twórczy, pilnuje panel ekspertów SI. Sprawdza piosenki na poziomie algorytmicznym. W jego skład wchodzą: Vincent Koops z Holandii, inżynier zajmujący się danymi w RTL i kompozytor, Anna Huang, Amerykanka wcześniej związana z projektem Magenta Google, która bada zastosowania SI w generowaniu muzyki, oraz Ed Newton-Rex (Wielka Brytania), kompozytor i dyrektor w laboratorium SI ByteDance.

Newton-Rex po przesłuchaniu zgłoszonych piosenek był zaskoczony różnorodnością ich stylów i rozmaitymi kreatywnymi sposobami wykorzystania technik sztucznej inteligencji.

Każdy zespół dostarczył również dokument procesowy opisujący, w jaki sposób powstała ich piosenka.

„Wielu autorów niekoniecznie ma akademickie wykształcenie muzyczne, ale zespoły składają się z naukowców zajmujących się danymi. Wzięli udział, ponieważ uważali, że dobrze jest eksperymentować” – stwierdził Koops w opisie konkursu.

Kim są śmiałkowie?

Pakt z diabłami

Zespół z Australii o nazwie Uncanny Valley postawił na przekaz pozytywny i radosną tonację (trochę wbrew nazwie oznaczającej dobrze znane naszym czytelnikom pojęcie Doliny Niesamowitości – niepokojącego uczucia w zetknięciu z ludzkopodobnymi robotami). Po części dlatego, że jest to nieodłączny aspekt Eurowizji, ale także dlatego, że – jak stwierdzili artyści – jest to DNA zespołu. Musiała to być również piosenka, którą można było grać na gitarze przy ognisku.

Kapelę tworzą: matematyk, informatyk, antropolog społeczny, muzyk oraz projektant systemów interaktywnych. W skład zespołu wchodzi również Sally-Ann Williams, dyrektor generalna Cicada, australijskiego Narodowego Centrum Innowacji, oraz Alexandra Uitdenbogerd, ekspertka w dziedzinie algorytmicznych kompozycji chóralnych.

Adres filmu na Youtube: https://youtu.be/sAzULywAHUM

Propozycja konkursowa zespołu z antypodów.
Źródło: Uncanny Valley / YouTube

Z użyciem algorytmów skomponowali piosenkę „Beautiful the World”. Grupa wpadła na niezwykły pomysł szkolenia sieci neuronowej na próbkach audio australijskich zwierząt, w tym koali czy diabłów tasmańskich. Ich praca jest odpowiedzią na ogromne pożary lasów, które nawiedziły Australię i pochłonęły życie wielu zwierząt różnych gatunków (szacuje się, że nawet miliarda). Przesłaniem ich utworu jest nadzieja, że natura wyzdrowieje i zatriumfuje.

Ludzki wokal maszyny

Z kolei Francuzi z zespołu Team Algomus postawili na współpracę między ludźmi a SI. Wszyscy członkowie to badacze, eksperci w dziedzinie analizy muzyki za pomocą komputerów. Wykorzystali przede wszystkim bazę danych dotyczących dotychczasowych zgłoszeń do Konkursu Piosenki, a także niektóre teksty piosenek z Eurowizji do stworzenia własnego. Dorzucili modele z własnych badań i społeczności akademickiej. Zaproponowali utwór „I Keep Counting” i głos Niam, artystki i studentki, który jest połączony z syntetycznym. Stwierdzili też, że „zwykli słuchacze nie zauważą, że ta piosenka została stworzona przy pomocy SI”.

Brytyjski duet Nancy Carlisle i Toma Collinsa przygotował utwór „Hope Rose High”. Ona w życiu codziennym jest adiunktem psychologii na Uniwersytecie Lehigh i na urlopie naukowym na Uniwersytecie w Yorku. Jej mąż to wykładowca technologii muzycznej na uniwersytecie w Yorku. Najpierw zatrudnił do pracy nad utworem SI. Potem poprosił małżonkę, aby poprawiła w balladzie melodię, akordy i partie perkusji. Sam udoskonalił linię basu. Tekst został również stworzony przez SI. Nazwa ich zespołu, Brentry, jest ironiczną aluzją do brexitu. Collins ma nadzieję, że Wielka Brytania i UE pewnego dnia ponownie połączą siły.

Bariery sztucznego kompozytora

Niemiecki duet Ligatur składa się z doktorantki Ulliki Scholz i naukowca danych André Röhriga. Oboje są zafascynowani systemami matematycznymi. Komponując utwór, ograniczyli interwencję ludzi do minimum, by pokazać, co ta technologia może, a czego nie może osiągnąć. Wykorzystali SI do stworzenia segmentów typowej popowej piosenki, takich jak wersety, refren i przejścia, i ręcznie powtórzyli je za pomocą oprogramowania audio, aby przygotować spójną piosenkę pt. „Offshore in Deep Water”. Wygenerowanie tekstu było, jak twierdzą, bułką z masłem. Jego fragment brzmi tak: „Na morzu w głębokiej wodzie, z dala od światła, na morzu w głębokiej wodzie, z dala od ludzi. Wracam”.

Holendrzy z drużyny Can AI Kick It nadesłali na konkurs nieco wywrotową piosenkę pt. „Abbus”. Tekst wygenerowany przez SI śpiewa z początku człowiek, na końcu maszyna, która przejmuje wokal płynnie w trakcie utworu. Wyśpiewuje końcowe frazy: „Chcemy rewolucji / Ciągła zmiana / Dajcie wszystkim / Żywność i ubrania / Chcemy rewolucji / Zabij rząd / Zabij system…”. Intencja zespołu? Wykazać, że SI może mieć dość anarchistyczne i rewolucyjne zapatrywania.

Eksperyment z samouczka

OVGneUrovision to jednoosobowy projekt Hindusa Richhieya Thomasa, studiującego inżynierię danych w Magdeburgu w Niemczech. Nie miał doświadczenia w komponowaniu piosenek, więc przygotowując utwór, korzystał m.in. z samouczków na kanale YouTube. Powstał w ten sposób utwór instrumentalny „Podróżnik w czasie”, który ma być eksperymentalną zabawą z kompozycją. Bębny pochodzą z neuronowej maszyny perkusyjnej Google Creative Lab, a Magenta MusicVAE wymyśliła linię basu „SI może pomóc w kreatywnym aspekcie, ale nie może stworzyć kompletnej piosenki” – twierdzi Thomas.

Adres filmu na Youtube: https://youtu.be/BNRd4eo-ePk

Utwór Richhieya Thomasa powstał dzięki samouczkom z YouTube’a.
Źródło: Richhiey Thomas / YouTube

New Piano ze Szwajcarii tworzą naukowcy zajmujący się danymi Basil Philipp i Polak Krzysztof Ciesielski. Przedstawili swój utwór z wyraźnym zastrzeżeniem: „W obliczu wyboru między stworzeniem przystępnej piosenki z kilkoma ludzkimi interwencjami lub eksperymentowaniem z możliwie największą ilością sztucznej inteligencji, a następnie dostarczeniem piosenki o gorszym brzmieniu, wybraliśmy tę drugą opcję ”. Duet wyprodukował słowa, szkoląc system GPT-2 od OpenAI na zestawie danych 1562 tekstów piosenek Eurowizji i zastosował technologię generowania melodii neuronowej uwarunkowanej tekstem, aby dopasować słowa do muzyki, w tym wypadku o założonym zabarwieniu melancholijnym.

Miłość w czasach zarazy

Zespół Beatroots z Belgii dzięki konkursowi znalazł idealny sposób na połączenie pracy z hobby. Jest ciekawy, jak będzie brzmieć muzyka przyszłości. Grupa wykorzystała bazę danych z ultimate-guitar.com do stworzenia melodii i akordów. W zestawie danych Eurowizji brakowało części perkusyjnych, więc wygenerowano je na podstawie melodii. Teksty są w całości napisane przez SI i zamienione na wokale dzięki syntezie mowy Sinsy. Każdy z członków zespołu skomponował jeden utwór (łącznie sześć). Do konkursu przedstawili „Violent Delights Have Violent Ends” wyłoniony w wewnętrznym głosowaniu.

Niemieckie trio Dadabots x Portret XO zastosowało unikalną metodę pisania tekstów: przeszkolili SampleRNN na utworach a capella z lat 50. Z generowanego nonsensownego bełkotu spróbowali wyłowić sensowne słowa. I tak powstało „Poślubię Cię, Punk Come”. Słychać tu historię dziewczyny, która zakochuje się w chłopaku z SI podczas epidemii.

Muzyczni dadaiści

Zespół KTH / KMH + Doremir ze Szwecji to z m.in. utytułowani naukowcy związani z Królewskim Instytutem Muzyki (KMH), Królewskim Instytutem Technologii (KTH) i firmą Doremir Music Research. Reprezentuje ją Sven Ahlbäck, uznawany za jednego z najlepszych szwedzkich skrzypków, a Doremir była nagradzana za oprogramowanie ScoreCloud, automatyzujące zapis nutowy. Propozycja Szwedów, jak można się było spodziewać, jest melodyjna i rytmiczna, bardzo zbliżona do „ludzkiej” twórczości pop. Twierdzą, że powstała jak układanka, a nie jak współpraca ludzi z maszyną. Synteza mowy jest zapewniana przez Google WaveNet, podczas gdy generowana przez SI melodia i tekst utworu „Come To Ge Ther” są śpiewane przez młodą wokalistkę Olgę Rosenberg.

DataDada, istniejący od 2014 r., to drugi francuski zespół w konkursie. Postrzega siebie jako uczestnika ruchu artystycznego XXI wieku, w którym dane nie są już po prostu faktem cyfrowym, ale czymś namacalnym, z odrobiną dadaizmu i jego interdyscyplinarnego podejścia do sztuki i twórczości. By stworzyć piosenkę, zespół zebrał dane nie ze wszystkich zgłoszeń, ale tylko z trzech najlepszych piosenek rocznie. Piosenkę pt. „Je secoue le monde” wykonuje nie człowiek, ale robot o nazwie Robert de Barretin (spróbuj z nim porozmawiać TUTAJ). Robert jest bardzo współczesny i neutralny pod względem płci, ponieważ chociaż jest mężczyzną, jego głos jest kobiecy.

SI to pieśń przyszłości?

Druga propozycja kraju-gospodarza? Grupa COMPUTD / Shuman & Angel-Eye i piosenka „I write a song”. Zespół tworzą studenci Uniwersytetu w Maastricht oraz producenci muzyczni. Celem ich projektu było zmuszenie SI do napisania chwytliwej piosenki przy minimalnej interwencji człowieka. Poszczególne fragmenty tekstu zostały stworzone przez SI, a zespół ręcznie zmienił tekst, akordy i melodie w spójną całość.

Piosenka belgijskiego zespołu Polaris nie ma tytułu. Wykorzystał dane dostarczone przez organizatorów „AI Song Contest”, aby wygenerować nowe teksty z 200 istniejących. W tym celu wykorzystali sieć neuronową GPT-2. Dopasowywanie tekstu do melodii okazało się trudne do zautomatyzowania, więc zespół zrobił to sam. Tekst, melodia, partie basu i rytm są generowane komputerowo, ale utwór jest złożony i częściowo wykonywany przez ludzi.

„Mieliśmy nadzieję całkowicie polegać na sztucznej inteligencji” – pisze zespół. „Byłoby wspaniale wyczarować kompletny rockowy utwór za naciśnięciem jednego przycisku, ale niestety nie jest to jeszcze możliwe.

Wszystkie propozycje i piosenki do odsłuchania znajdziecie TUTAJ.

Czy w wyniku takich konkursów jak ten spełni się prognoza (czy przekleństwo) Vinoda Khosli, inwestującego w nowe technologie bogacza z Doliny Krzemowej, że za dziesięć lat muzykę będzie komponować wyłącznie SI?