Трек #2 Предсказание роста максимального уровня воды на реке Лена в весенний период
Общее описание задачи

Построить предиктивную модель, которая позволит в весенний период на реке Лена оценивать суточное приращение максимального уровня воды на горизонте прогноза семь дней на гидропостах около населенных пунктов Киренск, Витим, Пеледуй, Крестовский Лесоучасток, Ленск, Олёкминск, Покровск, Якутск, Батамай, Сангар.


Предпосылки

Весеннее половодье на реках характеризуется резким увеличением уровня и расхода воды. Рост уровней может приводить к наводнениям – затоплению освоенных территорий, что сопровождаются значительным экономическим и экологическим ущербом. В бассейне реки Лена наводнения случаются нередко и могут приводить к чрезвычайным ситуациям. Наибольший удар принимают населенные пункты в среднем течении реки, где часты мощные ледовые заторы. Предсказание уровня воды в реке позволит службам МЧС сформировать тактическое видение ситуации во время весеннего половодья, своевременно проводить предупредительные мероприятия информирование населения и и тем самым минимизировать возможный ущерб. При этом большую ценность при прогнозировании имеют как абсолютные значения уровней воды, так и их высокий прирост по сравнению с предыдущим днём – один из признаков возможного ледового затора.


Формулировка задачи

Участникам хакатона предлагается разработать модель, предсказывающую суточное приращение максимального уровня воды на 7 дней вперед на следующих гидропостах: город Киренск, посёлок городского типа Витим, посёлок городского типа Пеледуй, село Крестовский Лесоучасток, город Ленск, город Олёкминск, город Покровск, город Якутск, село Батамай, посёлок городского типа Сангар. Особенно важно, чтобы модель в меньшей степени ошибалась при предсказании уровня воды, близкого к уровню опасного явления.


Метрика

Микровзвешенное значение среднеквадратичной ошибки MSE, нормированное на среднеквадратичное отклонение по целевым населенным пунктам.


Формат решения

  1. Аннотация проекта (краткое описание - 2-4 предложения)
  2. Ссылка на я.диск/dropbox с ML-моделью, обученной на тренировочной выборке
  3. Ссылка на код, использованный при подготовке модели (ссылка на любой открытый репозиторий с кодом, с помощью которого строилась модель, а также кодом, запускающим модель).
  4. Ссылка на презентацию для очной защиты


Данные

Обучающая выборка, включающая:

● архивные наблюдения на гидрологических постах на интересующем отрезке реки Лена,
● метеорологические и актинометрические данные, собираемые метеостанциями в округе гидропостов,
● географические координаты гидропостов и метеостанций; для гидропостов — информация о положении относительно устья и истока реки, площадь водосбора,
● сведения о населенных пунктах, подвергшихся затоплениям
● дополнительные данные из открытых источников, собранные участниками хакатона.


Критерии оценки

60 баллов распределяется в соответствии с результатом, который ML-модель показала на соревновании. Учитывается не место в турнирной таблице напрямую, а логарифмированное значение ошибки на тестовой выборке относительно величины ошибок других участников. По результатам соревнования на очную защиту перед жюри допускается не более 10 команд.

40 баллов распределяется по результатам оценки кода, выложенного в открытый репозиторий, а также выступления на очной защите в соответствии со следующими критериями:

● обоснованность выбранных методов решения задачи с точки зрения гидрологии и применимости итоговой модели в работе МЧС (20 баллов);
● оригинальность подхода, в частности, использование дополнительных данных из открытых источников для повышения качества модели (10 баллов);
● качество кода: его чистота и понятность (5 баллов);
● качество очной защиты: последовательность и понятность изложения (5 баллов).

Бенефициары разработанных решений: МЧС России, Республика Саха (Якутия), жители указанных в описании населенных пунктов.