Badacze z Madrytu wyszkolili algorytmy do przewidywania, która z piosenek ma szansę na zdobycie popularności
Piosenka łatwo wpada w ucho? Tekst przemawia do twoich przeżyć, emocji lub wspomnień, no a do tego wykonawca – taki popularny na Instagramie? To może być przebój tej jesieni. I może to przewidzieć sztuczna inteligencja, opracowana przez naukowców z Politechniki w Madrycie.
Badacze opracowali system umożliwiający dokładne przewidywanie popularności aktualnych piosenek w oparciu o techniki i algorytmy SI. Nazwali go HitMusicNet. System wykorzystuje trzy różne źródła informacji do przewidywania popularności: sygnał audio, teksty, jeśli są dostępne, oraz zestaw danych dotyczących autora, takich jak popularność na wybranej platformie lub liczbę obserwujących.
Ciągły rozwój treści multimedialnych na platformach takich jak Netflix, Amazon, Spotify czy Deezer sprzyja badaniom i rozwojowi inteligentnych systemów, które są w stanie automatycznie analizować treści. Po co? Do efektywnego wykonywania zadań wyszukiwania i pobierania informacji, niezbędnych w systemach rekomendujących, monitorowania treści multimedialnych czy nawet wykrywania podobieństw w celu ochrony praw autorskich. Gałąź badań ukierunkowana na przetwarzanie muzyki, znana jako MIR (ang. Music Information Retrieval) bada, coraz śmielej analizuje i wdraża techniki sztucznej inteligencji stosowane bezpośrednio do treści muzycznych. W ostatnich latach branża muzyczna włącza te systemy do swoich produktów na wielu etapach: od fazy nagrywania i masteringu utworów muzycznych po końcową fazę doświadczeń użytkownika – rekomendacje oparte zarówno na treści, jak i preferencjach.
Badacze opracowali system umożliwiający dokładne przewidywanie popularności aktualnych piosenek w oparciu o techniki i algorytmy SI
Wnioskowanie o przyszłej popularności piosenek w wykonaniu SI opracowanej przez madryckich badaczy polega na sprawdzaniu, jakie parametry sprawiają, że temat muzyczny zajmuje pierwsze miejsca na głównych listach światowych hitów. Wśród wielu analizowanych czynników są: barwa, struktura harmoniczna utworu oraz rytm i tekst, jeśli taki występuje. Równolegle algorytmy analizują odbiór społeczny, a nawet popularność artysty w mediach i sieciach społecznościowych. Może to pomóc artystom, producentom i innym podmiotom z branży muzycznej w podejmowaniu decyzji dotyczących przesyłania utworu muzycznego na określoną platformę.
W przypadku sygnału dźwiękowego utworu muzycznego ekstrahowany jest zestaw parametrów związanych z barwą, rytmem i progresją harmoniczną za pomocą różnych technik przetwarzania dźwięku. Z drugiej strony, w odniesieniu do analizy tekstu, badanie przeprowadza się przy użyciu technik przetwarzania języka naturalnego.
Te parametry wprowadza się w algorytmy uczenia głębokiego. System uczy się relacji między danymi wejściowymi i zwraca wartość od 0 do 100 jako dane wyjściowe, wskazujące na stopień popularności utworu.
„Przeprowadzone eksperymenty pokazują, że proponowana architektura przewyższa poprzednie badania, włączając trzy główne modalności do analizy, takie jak dźwięk, teksty i metadane, a także wstępną kompresję za pomocą autoenkodera w celu poprawy możliwości modelu przy prognozowaniu popularności” – napisali badacze, podsumowując wyniki uzyskane za pomocą HitMusicNet.
„Wyniki uzyskane przez proponowany system są obiecujące i należy się spodziewać, że w najbliższych latach tego typu algorytmy mogą zostać uwzględnione w głównych platformach z treściami muzycznymi, w celu poprawy ich wydajności, bez wpływu na doświadczenia użytkownika i artysty lub producenta” – zapowiada David Martín Gutiérrez w komunikacie prasowym uczelni.