Sztuczna inteligencja rozpozna nastrój piosenki

Bartek SzcześniakSkomentuj
Sztuczna inteligencja rozpozna nastrój piosenki
Badacze z zespołu Deezer opracowali system AI zdolny do przypisywania różnym piosenek konkretnych nastrojów. Wzięli oni pod uwagę zarówno tekst, jak i ścieżkę dźwiękową. Na początku wprowadzili ścieżki audio wraz z zakodowanymi kontekstami do sieci neuronowej. Następnie użyli Million Song Dataset – zbioru danych dla ponad miliona współczesnych piosenek. Najprzydatniejszy okazał się zbiór danych Last.fm oferujący identyfikatory piosenek z ponad 500 000 unikalnych tagów, z których wiele powiązanych jest właśnie z nastrojem.

The Million Song Database zawiera metadane muzyki, a nie samych piosenek, więc zespół sparował wszystkie te informacje z katalogiem Deezera za pomocą identyfikatorów, takich jak tytuły utworów, nazwiska wykonawców i tytuły albumów. Około 60% wynikowego zbioru danych zostało użyte do szkolenia AI, a reszta posłuży do sprawdzania poprawności i dalszego testowania systemu.

Ostatecznie ustalono, że sztuczna inteligencja lepiej radzi sobie z odczytywaniem nastroju utworu niż dotychczasowe „tradycyjne” metody.

„Wygląda na to, że ten wzrost wydajności jest wynikiem zdolności naszego modelu do odkrywania i stosowania średnich korelacji pomiędzy dźwiękiem a tekstem, szczególnie jeśli chodzi o przewidywanie wartościowości” – napisali naukowcy w artykule opublikowanym na arxiv.org.

Zaznaczają oni także, że bardzo istotną rolę dla dalszego rozwoju odegrałaby baza danych oferująca ścieżki audio zsynchronizowane z tekstem. Badacze uważają, że prace nad tym systemem AI mogą poszerzyć naszą wiedzę na temat tego w jaki sposób muzyka, słowa i nastrój korelują ze sobą, a także na to, że modele głębokiego uczenia się mogą się porządkować i znajdować nieoznakowane dane w dużych ilościach.

Źródło: The Verge

Udostępnij

viriacci