logo
Первоисточники / Мангейм Д

Анализ временных рядов

Многие важные социальные и политические события иногда повторяются, а не случаются лишь единожды, а социальные и политические процессы порой тянутся на протяжении нескольких лет. В результате исследователям часто приходится изучать взаимодействия объектов, разделенных во времени. Средством для этого является[c.459]анализ временных рядов. Он используется, когда нужно объяснить, что случилось в прошлом или прогнозировать события в будущем. Способы применения временных рядов сложны и требуют основательной подготовки. Они, однако, подходят для решения настолько большого круга исследовательских задач и так часто используются в разработках важных проблем, что даже начинающие должны иметь некоторое представление об их основных принципах.

Временные ряды – это просто комплекс наблюдений, в которых одна и та же переменная измеряется повторно через определенные интервалы. Государственное агентство занятости может обнародовать цифры по уровню безработицы каждый месяц, международная организация может публиковать ежегодные отчеты об общем объеме международной торговли, маклерская контора может фиксировать индекс Доу-Джонса каждый день. Такие данные можно анализировать методами, основаннымина тех принципах регрессии, которые обсуждались ранее. Мы начнем с обсуждения общих подходов к временным рядам и затем рассмотрим два варианта.

Регрессия временных рядов. Исследователям часто бывает необходимо объяснить наблюдаемые тренды (их еще называют секулярными трендами).

Они хотят знать, почему нечто увеличивается или уменьшается, почему оно возрастает или убывает постоянно или циклически и т.д. Например, нам нужно выяснить, насколько послевоенный (имеется в виду вторая мировая война) рост расходов на вооружения в Соединенных Штатах являлся следствием военных расходов в СССР; для этого мы строим простейшую регрессионную модель:

Y = a + bXt + et,

где Y представляет данные по военным расходам США в виде временных рядов; а – средний уровень расходов в Соединенных Штатах; b – влияние расходов в СССР на расходы в США; Xt данные по военным расходам СССР в виде временных рядов; et – погрешность, отражающая случайные влияния на расходы в США.

Можно использовать обычную регрессию наименьших квадратов для подсчета коэффициентов в этой модели и [c.460] попытаться объявить или предположить расходы США следствием расходов СССР. Однако для того, чтобы в результате этих подсчетов получить неотклоненные или точные значения коэффициентов, погрешности, соответствующие различным временным точкам, не должны коррелировать, как уже упоминалось при перечислении условий, лежащих в основе регрессионного анализа. Фактически внешние факторы, влияющие на размер расходов США в одной временной точке, вероятно, будут влиять и в другой. Если, к примеру, перспективы заключения контракта заставили Пентагон вложить средства в дорогое оружие абсолютно помимо каких-либо действий с советской стороны, то такое воздействие скорее всего будет сохраняться из года в год; точно так же, если члены конгресса пытаются сохранить в своих военных округах военные контракты и оборудование, их влияние на уровень расходов будет постоянно проявляться. Эти влияния в модели отражены погрешностью. И в результате эти погрешности с течением времени сильно коррелируют.

Эта автокорреляция (ее еще называют серийной корреляцией) нарушает одно из условий регрессионного анализа и может привести к тому, что отклонения коэффициента а и 6 при компьютерной обработке могут быть значительно недооценены. В результате статистическая значимость этих коэффициентов будет сильно вздута, и это может привести нас к мысли, что существует взаимосвязь там, где ее на самом деле нет. По этой причине очень важно проводить тест на наличие автокорреляции и, если таковая присутствует, принятьмеры к устранению ее воздействия, прежде чем делать какие = либо выводы по моделям, содержащим временные ряды. Существует целый ряд статистических тестов на автокорреляцию и несколько способов ее корректировки10.

Построение временных лагов. Часто обнаруживается, что одно событие влияет на другое только по прошествии некоторого времени. В нашем примере, скажем, маловероятно, что советские военные расходы за один год повлияют на расходы США в тот же год, поскольку уровень расходов планируется заранее и уровень советских военных расходов может быть неизвестен в момент принятия решения о расходах США. Следовательно, иногда необходимо учесть в модели, изображающей влияние одной [c.461] переменной на другую, временной лаг. На простейшем уровне мы можем сделать это, сравнивая расходы США с расходами СССР за предыдущий год. Наша основная модель, таким образом, будет выглядеть вот так:

Yt = a + bXt–1 + et,

где t–1 означает запаздывание в один год.

Прерванные временные ряды. Часто исследователю бывает необходимо определить влияние единичного события на поведение переменной. Например, можно попытаться измерить влияние принятия закона о необходимости пристегивать автомобильные ремни на количество смертельных исходов в автокатастрофах в определенной стране. Для этого нужно собрать данные о количестве смертельных случаев, отмеченных за каждый месяц в течение нескольких лет до принятия закона и нескольких лет после (может быть, следует фиксировать количество смертей в процентах от общего количества людей, вовлеченных в автокатастрофы за месяц, с тем чтобы обеспечить реальную почву для сравнения периодов, в течение которых количество происшествий сильно менялось). Обнаружится, однако, что выяснить влияние закона простым сравнением количества смертей до закона и после его принятия довольно сложно, поскольку мы сравниваем не единичное измерение, а комплекс измерений. Значения могут существенно изменяться как до, так и после принятия закона, так что визуальное изучение данных не даст очевидного результата.

Значения переменных в любых временных рядах могут изменяться по трем основным причинам: (1) секулярные тренды (долговременные тенденции к увеличению или уменьшению); (2) циклические отклонения или сезонность (тенденции к регулярному росту или падению в течение длительного времени) и (3) случайные отклонения (изменения, являющиеся следствием единичных событий, как, например, неожиданная метель для нашего случая, или ошибок в измерении переменной, как, например, случайное отнесение телесных повреждений к числу смертных случаев). Прежде чем мы сможем определить влияние любого конкретного события на временной ряд, необходимо исключить изменения, являющиеся следствием [c.462] трендов, сезонных и случайных факторов. Кроме того, важно осознать, что в любом временном ряду такого типа, вероятно, возникнут серьезные проблемы, связанные с автокорреляцией, поскольку погрешности в разных наблюдениях обычно сильно коррелируют, делая невозможным точный подсчет коэффициентов.

К счастью, в статистике разработан способ, с помощью которого можно приспособить регрессионный анализ к такой ситуации. Этот способ называется авторегрессивные интегрированные движущиеся средние модели (АРИМА – аббревиатура английского названия), они приспособлены к факторным трендам, сезонности и случайным воздействиям извне временных рядов и одновременно к автокорреляции так, что истинное влияние помех ясно видно11. Хотя мы здесь не располагаем достаточным местом, чтобы объяснить, как работают эти методики, исследователям следует знать об их существовании, поскольку они делают возможным использование прерванных временных рядов как форму квазиэксперимента, где вызывающие помехи события (революция, стихийное бедствие, расследование коррупции в государственном учреждении, введение новой технологии и т. д.) рассматриваются как стимул или НП, а значения ЗП выполняют функции контрольной группы12. Такие исследования могут позволить нам сделать некоторые ценные выводы относительно тех причин важных событий, которые не были предусмотрены при постановке задач исследования, и, следовательно, открыть путь к решению целого ряда исследовательских задач, которые иначе могли бы остаться вне сферы нашего внимания. [c.463]