Трек #3
Предсказание вероятности возникновения ДТП

Общее описание задачи


Участникам предстоит разработать алгоритм прогнозирующий наиболее вероятную категорию события дорожно-транспортного происшествия (далее по тексту «ДТП»):

  • ДТП не произойдет;
  • ДТП произойдет без пострадавших;
  • ДТП произойдет с пострадавшими;
  • Режим ЧС (объявляется от 5 погибших и/или 10 пострадавших)*.

*Прогнозирование режима ЧС будет рассматриваться как задание повышенной сложности, за которое в процессе оценивания итоговых решений жюри вправе добавить дополнительные баллы.

Данные для обучения — это информация о ДТП от ГИБДД и ВНИИ ГОЧС, а также дополнительные данные по интенсивности движения и метеоусловиях на участках дороги. В качестве федеральных автомобильных дорог рассматриваются М-8 «Холмогоры» и Р-21 «Кола».


Предпосылки

Национальный проект «Безопасные и качественные автомобильные дороги» к 2024 году предполагает постепенное снижение количества погибших в ДТП и мест концентрации ДТП.

Федеральные автомобильные дороги являются важнейшими с точки зрения экономики и национальной безопасности транспортными узлами Российской Федерации, но в то же время возрастают и риски возникновения ДТП на всей протяженности трасс с такого рода высокой эксплуатационной нагрузкой и интенсивностью дорожного трафика.

Способ реагирования МЧС России на ДТП в том числе зависит от того является ли ДТП чрезвычайной ситуацией. Режим чрезвычайной ситуации объявляется от 5 погибших и/или 10 пострадавших, поэтому важно предсказывать не только факт возникновения ДТП, но и его соответствующую категорию.

Решение такого рода задачи позволит реализовать МЧС России следующие мероприятия:

  • расчет оптимально необходимого количества сил и средств пожарно-спасательных подразделений в определенные временные отрезки мониторинга за ситуацией с безопасностью на дороге;
  • оценка необходимого наращивания сил и средств в зависимости от потенциального уровня тяжести ДТП

Метрика


У предиктивной модели предполагается 1 таргет-переменная: у нее может быть значение 0,1,2,3 (0 — нет аварии / 1 — есть авария, без пострадавших / 2 — есть авария, с пострадавшими / 3 — ЧС). Для оценки алгоритма будет использоваться будет использоваться macro-F1 score.

Формат решения:

  1. Аннотация проекта (краткое описание - 2-4 предложения)
  2. Ссылка на я.диск/dropbox с ML-моделью, обученной на тренировочной выборке
  3. Ссылка на код, использованный при подготовке модели (ссылка на любой открытый репозиторий с кодом, с помощью которого строилась модель, а также кодом, запускающим модель).
  4. Ссылка на презентацию для очной защиты

Данные:

Обучающая выборка, включающая:

  • погодные условия;
  • интенсивность дорожного трафика;
  • данные из карточки ДТП;
  • данные о пассажиропотоке на трассах.

Критерии оценки:

60 баллов распределяется в соответствии с результатом, который ML-модель показала на соревновании. Будет учитываться не место в турнирной таблице напрямую, а логарифмированное значение ошибки на тестовой выборке относительно величины ошибок других участников. По результатам соревнования на очную защиту перед жюри допускается не более 10 команд.

40 баллов распределяется по результатам оценки кода, выложенного в открытый репозиторий, а также выступления на очной защите в соответствии со следующими критериями:

  • обоснованность выбранных методов для построения модели. Предлагаемая в качестве решения задачи модель машинного обучения является легко интерпретируемой. Участник может объяснить характер зависимости между входными данными (признаками) и принимаемым моделью решением. К примеру: определенные погодные условия приводят к повышению вероятности возникновения ДТП и эта зависимость прослеживается в процессе принятия решения моделью (20 баллов);
  • оригинальность подхода, в частности, использование дополнительных данных из открытых источников для повышения качества модели (10 баллов);
  • качество кода: его чистота и понятность (5 баллов);
  • качество очной защиты: последовательность и понятность изложения (5 баллов)

Бенефициары разработанных решений: МЧС России; ГИБДД России; Минздрав России; граждане, перемещающиеся по федеральным автомобильным дорогам на транспортных средствах.