Математическое бюро
Прогнозирование на ОРЭМ
Kaggle vs closed competition

Чем точнее прогноз энергопотребления конкретного потребителя на завтра, тем, с одной стороны, ниже стоимость электроэнергии для этого потребителя, а с другой — выше надежность энергоснабжения. Оптовый рынок электроэнергии организован таким образом, чтобы стимулировать потребителей точнее прогнозировать собственное потребление.

Закрытые соревнования по прогнозу энергопотребления

В связи с этим гонка за точностью прогноза энергопотребления идет многие годы и будет продолжена. Каждый потребитель имеет свою собственную систему прогнозирования, причем в России в 90% случаях это будет xls-файл. Сменить одну систему прогнозирования на другую потребитель может решиться только в случае, если увидит надежный выигрыш в точности. Для этого потребители постоянно проводят соревнования a la Kaggle. Правила просты: на основании исторических данных за несколько лет претендент готовит модель прогнозирования, а далее в течение оговоренного периода делает ежедневный прогноз. Потребитель делает свой прогноз той же величины на тот же период. По итогам прогнозирования за период производят сравнение ошибки обоих прогнозов: внутреннего прогноза потребителя и прогноза претендента. По итогам сравнения двух прогнозов принимают решение о том, стоит или не стоит внедрять алгоритмы претендента в ежедневную практику потребителя.

Компании, покупающие электроэнергию на оптовом рынке, регулярно проводят такие соревнования своими силами, обмениваясь данными, как правило, по почте в виде файлов. На Kaggle соревнования в области прогнозов в электроэнергетике не проводятся. Более того, данная тема не очень широко освещена: несколько дискуссий, пара попыток соревнований InClass и все.

Как вы думаете, почему соревнования по прогнозированию потребления электроэнергии не проводят на Kaggle?

У меня небольшой опыт работы в Kaggle и довольно широкий опыт участия в закрытых соревнованиях по прогнозу цены на электроэнергию и энергопотребления. Позволю себе сделать предположение.

Математические модели краткосрочного прогнозирования энергопотребления во многом строятся на значениях за предыдущие несколько дней, так называемые лаговые переменные (lags). Следовательно, нельзя выложить однажды архив и проверить качество прогнозов за период, потому что для каждого нового дня нужны фактические значения за несколько ближайших предыдущих. Если мы прогнозируем на завтра, то нам нужны фактические значения за сегодня, вчера, позавчера и т.д. Когда это завтра наступает, то нам нужны обновления фактических значений за предыдущий день. То есть соревнования по прогнозу энергопотребления можно проводить только итеративно — день за днем.

Почему не Kaggle? Я предполагаю, что, во-первых, Kaggle не предоставляет платформы для подобного соревнования, как следствие все соревнования по краткосрочному прогнозированию энергопотребления проходят в закрытом порядке. Во-вторых, сказывается относительная закрытость области: компании не хотят выкладывать в открытый доступ значение собственного энергопотребления.

На мой взгляд, проведение подобных соревнований в закрытом режиме, безусловно, снижает общее качество прогнозов в данной области.

Столько стоит точность прогноза энергопотребления?

В рамках моего текущего проекта я делала оценку, сколько стоит «точность прогнозирования» для оптового рынка электроэнергии и мощности России за 2017–2019 годы. Повышение точности прогнозирования энергопотребления на 1 МВт·ч в среднем в году позволяет снизить затраты на покупку электроэнергии на рынке как минимум на 500 000 — 800 000 рублей в год, что эквивалентно 8000…11000 евро в год.

Комментарии