Математическое бюро
Прогнозирование на ОРЭМ

Я уже рассмотрела AR и I и MA, теперь для завершения краткого описания модели мне осталось рассмотреть ту часть, которая в аббревиатуре зашифрована буквой X - «eXtended».

Целью расширения всякой модели прогнозирования является добавление в нее учета внешних факторов.

Расширение модели ARIMAX имеет дело с моделью авторегрессии AR(p). В заметке об авторегрессии я писала, что формула для определения Z(41) выглядит следующим образом и называется авторегрессией порядка p:

Модель авторегрессии

Если же нам нужно добавить в модель учет, например, двух показателей, представленных в виде временных рядов X(t) и Y(t), то выражение авторегрессии будет иметь вид

Модель авторегрессии

Мы видим, что в линейную комбинацию добавлены два члена (их называют регрессорами), которые позволяют учет значений рассматриваемых внешних факторов.

Коэффициенты данной линейной регрессии находятся аналогичным образом при помощи метода наименьших квадратов для набора уравнений

Модель авторегрессии

Имея все фактические значения Z(t), X(t) и Y(t), мы легко составляем систему для определения коэффициентов. Подробно пример использования метода наименьших квадратов приведен в диссертации в разделах 3.1. Алгоритм экстраполяции временного ряда без учета внешних факторов и 3.2. Алгоритм экстраполяции временного ряда с учетом внешних факторов.

Учет будущих значений внешних факторов в модели прогнозирования

Важно отметить, что в моделях прогнозирования внешние факторы, то есть показатели X(t) и Y(t) должны учитываться в соответствующие моменты времени. Если мы прогнозируем временной ряд Z(t) на завтра, то нам нужно иметь под рукой значения внешних факторов X(t) и Y(t) на то же самое завтра, иначе модель будет работать некорректно.

Самым простым примером внешнего фактора для временного ряда потребления электроэнергии является температура воздуха. Целый ряд исследований был проведен по данному вопросу и в настоящее время множество моделей прогнозирования потребления электроэнергии включают учет влияния температуры окружающей среды. Однако при прогнозировании в модели учитываются не фактические значения, а прогнозные. Их, как правило, предоставляют специализированные сервисы, например, ГисМетео.

Дополнительные разъяснения по этому вопросу приведены в диссертации 2.2.4 Описание модели

Влияние количества внешних факторов в модели на точность прогнозирования

Я не едижожны слышала от дилетантов мнение о том, что модель прогнозирования тем точнее, чем большее число внешних факторов мы в ней учтем. Это принципиально неверное положение!

Мы используем в модели, как правило, будущие значения внешних факторов, которые или спрогнозировали заранее, или получили откуда-то из вне, например, прогноз температуры на завтра у ГисМетео. Таким образом, каждый внешний фактор несет в себе ошибку собственного прогноза и эта ошибка может быть большой, а потому самым негативным образом сказаться на точности прогнозирования искомого временного ряда.

Из личного опыта, из статей, с которыми знакома, заключу, что в авторегрессионных моделях прогнозирования следует учитывать не более 3 внешних факторов. В нейросетевых моделях, которые работают несколько иначе, число внешних факторов иногда увеличивают до 5.

Комментарии

Аватар пользователя Tatyanick
Татьяна Медведь

Доброго времени суток, Ирина!

Подскажите, будьте добры, если в курсе, как и в какой модели можно использовать фактические значения внешних факторов, если они качественные. Например, период экономического кризиса или ухуджение полит. ситуации в стране. Спасибо!

Аватар пользователя chuchueva
Ирина Чучуева

Татьяна, добрый день!

Вам подойдут нейронные сети (ANN) и классификационно-регрессионные деревья (CART).