Точность прогнозирования временного ряда – величина, зависящая от качественных характеристик временного ряда, выбранных моделей прогнозирования, квалификации эксперта, доступности программно-аппаратных средств для реализации алгоритмов модели и других факторов.
Качественные характеристики временного ряда
Временные ряды описывают реальные физические и экономические процессы, характеристики временных рядов зависят от свойств описываемого процесса.
Например, процесс энергопотребления является регулярным, постоянным – это видно даже не специалисту (взгляните на наши «Примеры прогнозов»), а потому прогнозируется с высокой точностью. Для прогноза энергопотребления ошибка (MAPE) изменяется обычно в диапазонах от 1 до 5%. Причем замечено, что, чем большие объемы энергопотребления требуется прогнозировать, тем выше будет точность, так как у больших объемов более стабильные свойства процесса.
Временной ряд цен РСВ куда менее регулярный, чем ряд энергопотребления – и это тоже может увидеть не специалист (по той же ссылке «Примеры прогнозов»). Точность прогноза цен РСВ всегда в среднем будет ниже точности прогноза энергопотребления. На ОРЭМ цены достаточно волатильны, однако в целом не так волатильны, как на западных рынках. Я исследовала временные ряды цен рынка на сутки вперед (day ahead market) энергорынков Канады (Ontario market), Скандинавии (NordPool), Испании (Spain market), Америки (PJM). Некоторые временные ряды цен этих рынков вы можете найти у нас на форуме в примерах временных рядов.В процессе работы с западными ценами обратила внимание, что их структура отличается от структуры цен РСВ на ОРЭМ: она менее регулярна, всплески цен значительно выше, их больше, ошибка прогнозирования таких цен находится в диапазоне от 5 до 15%, что по оценкам тамошних экспертов является достаточным для финансового планирования. Для ОРЭМ реален прогноз цен РСВ со средней ошибкой 5 – 8%.
Важно понимать, что точность прогнозирования, главным образом, есть характеристика временного ряда и для каждого временного ряда, будь то цены РСВ или энергопотребление, существует некоторый предел, точнее которого в среднем за период спрогнозировать нельзя. Не стоит пенять на математические модели и специалистов там, где задача не имеет решения: нельзя прогнозировать с нулевой ошибкой.
Модели прогнозирования
Ранее я сделала первый обзор существующих моделей прогнозирования временных рядов. Нужно понимать, что каждая модель на «свой манер» улавливает закономерности временного ряда. Которая из приведенного списка моделей лучше улавливает и, как следствие, точнее прогнозирует, однозначно сказать нельзя. Нужно ясно понимать, что математическая модель — есть инструмент формирования прогнозов, так же как молоток есть инструмент для забивания гвоздей. И очевидно, что не всегда качество забивания гвоздя зависит от молотка, более того, качество забивания гвоздя лишь в некоторой степени зависит от качества молотка, но в гораздо большей степени зависит от человека, в чьих руках инструмент находится.
Модели прогнозирования как люди – у каждой свои достоинства и недостатки. В настоящее время существует множество моделей прогнозирования временных рядов: регрессионные и авторегрессионные модели, нейросетевые модели, модели экспоненциального сглаживания и др. Перечень моделей и методов прогнозирования я уже приводила. Наиболее популярными и широко используемыми являются классы авторегрессионных и нейросетевых моделей прогнозирования. Главным недостатком авторегрессионных моделей является большое число свободных параметров, определение которых неоднозначно и ресурсоемко. Главным недостатком нейронных сетей является недоступность промежуточных вычислений, выполняющихся в «черном ящике», и, как следствие, сложность интерпретации результатов моделирования. Кроме того, еще одним недостатком нейронных сетей является сложность выбора алгоритма обучения.
Класс модели, сложность и корректность программной реализации ее алгоритмов, доступность аппаратных средств для проведения исследования – лишь часть факторов, оказывающих влияние на точность прогнозирования.
Квалификация эксперта
Это, пожалуй, главный фактор после качественных характеристик временного ряда, влияющий на точность прогноза. Как и в истории с гвоздем и молотком, главным является человек — он оценивает характеристики временного ряда, он выбирает модель прогнозирования, он ее реализовывает на той программной платформе, которой владеет, он производит постоянную донастройку алгоритмов, он следит за качеством прогноза и именно он задается вопросом о том, как повысить точность прогнозирования.
И для всех этих работ нужны опыт и знания в области анализа временных рядов. Тот же самый специалист должен понимать и четко различать модели прогнозирования, зная на практике достоинства и недостатки каждой, а для этого их нужно реализовать. Тот же специалист должен владеть в той или иной мере программными продуктами, такими как STATISTICA, SAS, SPSS, MATLAB, а также иметь навыки программирования. Не математик тот, кто считает в MS Excel и больше ничего не знает! Тот же специалист должен следить за качеством прогноза, обладать соответствующими компетенциями в области оценки моделей, понимать предметную область. Тот же специалист должен располагать временем для проведения научно-исследовательских работ, направленных на автоматизацию процесса прогнозирования или повышение точности прогнозирования. Словом, это должен быть не человек, а просто чудо, которое все знает, понимает и умеет. И от квалификации такого чуда и зависит во многом точность прогнозирования и, как следствие, финансовый результат компании на рынке.
Доступность программно-аппаратных средств
Доступность всякого рода средств, таких как сложные математические пакеты, мощные вычислительные машины, временные ресурсы для проведения исследований также в той или иной степени влияют на точность прогнозирования. Безусловно, этот фактор не является главенствующим, однако располагать необходимыми программными и аппаратными средствами весьма желательно, если стоит задача повышения точности прогнозирования.
Об основных оценках точности прогнозирования я уже говорила.