Frechet Music Distance: A Metric For Generative Symbolic Music Evaluation
W niniejszej pracy wprowadzamy Frechet Music Distance (FMD) – nową metrykę oceny dla generatywnych modeli muzyki symbolicznej, inspirowaną metryką Frechet Inception Distance (FID) stosowaną w wizji komputerowej oraz Frechet Audio Distance (FAD) wykorzystywaną w generatywnym audio. FMD oblicza odległość między rozkładami osadzeń (ang. embeddings) referencyjnej i wygenerowanej muzyki symbolicznej, uchwytując abstrakcyjne cechy muzyczne. Metrykę FMD zweryfikowano na różnych zbiorach danych i modelach. Wyniki wskazują, że FMD skutecznie odróżnia jakość modeli, dostarczając metryki specyficznej dla dziedziny generowania muzyki symbolicznej oraz ustanawiając powtarzalny standard dla przyszłych badań w zakresie modelowania tego typu muzyki.
Materiał konferencyjny:
Proceedings of the 39th Annual AAAI Conference on Artificial Intelligence
Autorzy z PW:
Mateusz Modrzejewski
Dyscyplina:
Rok wydania: