Роботу мехіканського метробуса кластеризували без учителя

Мексиканські фізики запропонували метод статистичного аналізу автобусної транспортної мережі, який дозволяє кластеризувати без учителя і наочно порівнювати різні ділянки маршруту залежно від швидкісного режиму на них. Вони застосували свої напрацювання до даних про роботу метробуса в Мехіко, зібраних за рік. Дослідження опубліковано в.


Метробус або швидкісний автобус - це система організації міського автобусного сполучення, для якої характерне часткове або повне відділення автобусних ліній від доріг загального користування. Вона найбільш поширена в країнах Північної і Південної Америки як дешева і простіша альтернатива метро.


У багатьох містах на автобуси встановлюються системи GPS-навігації, що дозволяє відстежувати положення і швидкість кожного транспортного засобу. Ця інформація дає загальну картину системи в режимі реального часу і може використовуватися для поліпшення загальної продуктивності та контролю розкладу. Такі масиви даних вже були використані вченими для аналізу часу, які витрачають автомобілі на подолання певних ділянок дороги, класифікації траєкторій машин і навіть для оцінки завантаженості транспортної мережі за допомогою нейронних мереж. Проте вкрай мало досліджень було зосереджено на систематичному аналізі всієї інформації про транспортну систему, її зонування і виділення окремих моделей активності.

Хаспе Мартінес-Гонсалес (Jaspe Martánez-González) і Алехандро Ріаскос (Alejandro Riascos) з Національного автономного університету Мексики використовували дані про становище і швидкість автобусів системи швидкісного транспорту Мехіко, щоб провести їх зональний статистичний аналіз. В результаті їм вдалося побудувати мережі подоби, які допомогли провести кластеризацію без вчителя зон за швидкостями.

Фізики зібрали дані з відритої бази, організованої адміністрацією міста Мехіко, за 383 дні з лютого 2020 по квітень 2021 року. Для кожного місяця вони будували розподіл швидкостей. На обраний період припала одна з хвиль пандемії COVID-19, що відбилося на істотному зниженні трафіку з квітня по серпень 2020 року. Примітно, що це не вплинуло на швидкісний профіль в ці місяці.

Система метробуса в Мехіко складається з 7 маршрутів загальною протяжністю 225 кілометрів і 195 станцій. Автори розділили її на 214 сегментів (зон), більшість з яких являють собою прямокутники, що покривають конкретну ділянку міста, що включає в себе відрізок лінії між двома станціями. 9 сегментів були обрані у вигляді багатокутників і покривали області перетину ліній.

Кожен сегмент фізики характеризували своїм розподілом швидкостей. Щоб оцінити те, наскільки сегменти в цьому різні, вони вираховували симетризовану відстань Кульбака - Лейблера для кожної їх пари. Прагнучи краще зрозуміти схожість усіх розподілів, автори будували неорієнтовані мережі подоби (графи). Як вершини вони використовували сегменти, а як зв'язки - вирахувані відстані. Щоб мережа була інформативна, вчені вводили фільтрацію відстаней, залишаючи тільки ті зв'язки, які перевищують деякий поріг H.

Таким способом виникала неконтрольована (без учителя) кластеризація мережі на незв'язані частини, детальністю якої можна було керувати, змінюючи H. Виявилося, що різні кластери володіють різними швидкісними розподілами. Так, для найбільшого значення порогу H, рівного 0,357, при якому мережа залишається незв'язаною, утворювалося два кластери. Вони суттєво відрізнялися за розподілом швидкостей вище 10 метрів в секунду. У той же час, для H, рівного 0,05, кластерів ставало вже 6, а відмінності між ними виникали в окремих швидкісних діапазонах. Автори наносили результати кластеризації на карту за допомогою різних кольорів, що дозволяло зорово оцінити схожість швидкісних режимів на різних ділянках доріг.


Фізики підкреслюють універсальність і гнучкість запропонованого підходу, що дозволить використовувати його для будь-яких транспортних систем, причому не тільки для аналізу швидкостей, але й інших параметрів, таких, наприклад, як слідування розкладу, пасажиропотоку і викидів вуглекислого газу. Вони сподіваються, що аналіз подоби допоможе в майбутньому розробити стратегії, спрямовані на поліпшення роботи цих систем.

Статистичний аналіз і кластеризація - це універсальні і максимально міждисциплінарні інструменти. Вони допомагають розбиратися з явищами в широкому діапазоні завдань, починаючи від футболу і закінчуючи мемами.

COM_SPPAGEBUILDER_NO_ITEMS_FOUND