Ентропія MIDI-файлів розділила музичні епохи

Вчені з Венесуели розділили музичні твори за стилями, проаналізувавши вміст відповідних MIDI-файлів так, як якщо б вони були осмисленим текстом. Використовуючи поняття інформаційної ентропії і методи лінгвістичного аналізу, в роботі вдалося розділити кілька сотень композицій по автору і часу написання. Препринт дослідження викладено на .Автори розглядали цифровий запис кожного з 453 досліджуваних творів у форматі MIDI, який являє собою лінійну послідовність чисел. Вона кодує загальні характеристики твору (темп, тональність), а також які ноти повинні звучати в кожен момент часу, і яким тембром і гучністю вони повинні володіти. Розглядаючи кожен MIDI-файл як текст, автори підбирали до нього свою «мову». Як «слова» виступали різні комбінації з декількох чисел. «Словник» складали так, щоб у «мови» була мінімально можлива інформаційна ентропія - міра невизначеності мови. Її можна розрахувати наступним чином: для кожного з D «слів» розрахувати частоту p, з якою воно зустрічається в «тексті», а потім просумувати твори p log (p).


Щоб підвищити точність класифікації, вчені також розраховували ентропію більш високого порядку. Для цього в разі кожного MIDI-файлу будували розподіл частоти для даного «слова» від його рангу (порядкового номера у відсортованому списку), а потім віднімали з отриманої залежності функцію Ципфа, яка описує подібні розподілу в реальних мовах. Для різниць знову розраховували ентропію і також використовували її в класифікації. Виявилося, що якщо побудувати тривимірну діаграму в координатах (ентропія 1-го порядку, 2-го порядку, відносний розмір «словника»), то на ній всі музичні твори групуються в кластери, що відповідають якомусь жанру або автору. Крім того, вчені описали деякі часові тренди. Наприклад, розкид ентропії другого порядку для творів XIX-XX століть у кілька разів перевищує таку для музики XIII-XV століть, що, ймовірно, говорить про зростання різноманітності в музиці. Автори зауважують, що в роботі не було використано жодної інформації про структуру формату MIDI або значення окремих текстових блоків. З файлів навіть не видаляли коментарів тексту. Частіше завдання про класифікацію музичних творів вирішують за допомогою штучних нейронних мереж. У цьому випадку програма автоматично збирає набір «ознак» даної композиції і групує треки зі схожими розподілами цих ознак. Використовуючи такий підхід, наприклад, вдалося описати найбільш значущі «революції» в музиці XX століття.


COM_SPPAGEBUILDER_NO_ITEMS_FOUND