Санкт-Петербургский институт машиностроения
Курсовая работа
по дисциплине Статистика
на тему
Автокорреляционная функция. Примеры расчётов
Выполнил
Студент курса
группы
отделения
Руководитель
Санкт-Петербург
2007
Содержание
Глава 1. Теоретические сведения
Коэффициент автокорреляции и его оценка
Глава 2. Примеры практических расчетов с помощью макроса Excel «Автокорреляционная функция»
Введение
Периодическая зависимость представляет собой общий тип компонент временного ряда. Можно легко видеть, что каждое наблюдение очень похоже на соседнее; дополнительно, имеется повторяющаяся периодическая составляющая, это означает, что каждое наблюдение также похоже на наблюдение, имевшееся в том же самое время период назад. В общем, периодическая зависимость может быть формально определена как корреляционная зависимость порядка k между каждым i-м элементом ряда и (i-k)-м элементом. Ее можно измерить с помощью автокорреляции (т.е. корреляции между самими членами ряда); k обычно называют лагом (иногда используют эквивалентные термины: сдвиг, запаздывание). Если ошибка измерения не слишком большая, то периодичность можно определить визуально, рассматривая поведение членов ряда через каждые k временных единиц [7, 153].
Периодические составляющие временного ряда могут быть найдены с помощью коррелограммы. Коррелограмма (автокоррелограмма) показывает численно и графически автокорреляционную функцию (AКФ), иными словами коэффициенты автокорреляции для последовательности лагов из определенного диапазона. На коррелограмме обычно отмечается диапазон в размере двух стандартных ошибок на каждом лаге, однако обычно величина автокорреляции более интересна, чем ее надежность, потому что интерес в основном представляют очень сильные1 автокорреляции [6, 207].
При изучении коррелограмм следует помнить, что автокорреляции последовательных лагов формально зависимы между собой. Рассмотрим следующий пример. Если первый член ряда тесно связан со вторым, а второй с третьим, то первый элемент должен также каким-то образом зависеть от третьего и т.д. Это приводит к тому, что периодическая зависимость может существенно измениться после удаления автокорреляций первого порядка, (т.е. после взятия разности с лагом 1).
Цель работы:
Дать основные теоретические сведения
Дать примеры расчета АКФ
Глава 1. Теоретические сведения
Коэффициент автокорреляции и его оценка
Для полной характеристики случайного процесса недостаточно его математического ожидания и дисперсии. Еще в 1927 г. Е.Е.Слуцкий ввел для зависимых наблюдений понятие «связанного ряда»: вероятность возникновения на определенном месте тех или иных конкретных значений зависит от того, какие значения случайная величина уже получила раньше или будет получать позже. Иными словами, существует поле рассеяния пар значений x(t), x(t+k) временного ряда, где k - постоянный интервал или задержка, характеризующее взаимозависимость последующих реализаций процесса от предыдущих. Теснота этой взаимосвязи оценивается коэффициентами автоковариации –
g (k) = E[(x(t) - m)(x(t + k) - m)] –
и автокорреляции
r (k) = E[(x(t) - m)(x(t + k) - m)] / D ,
где m и D - математическое ожидание и дисперсия случайного процесса. Для расчета автоковариации и автокорреляции реальных процессов необходима информация о совместном распределении вероятностей уровней ряда p(x(t1),x(t2)). Однако для стационарных процессов, находящихся в определенном статистическом равновесии, это распределение вероятностей одинаково для всех времен t1, t2 , разделенных одним и тем же интервалом. Поскольку дисперсия стационарного процесса в любой момент времени (как в t, так и в t + k) равна D = g (0), то автокорреляция с задержкой k может быть выражена как [5, 312]
r (k) = g (k) /g (0),
откуда вытекает, что r (0) = 1. В тех же условиях стационарности коэффициент корреляции r (k) между двумя значениями временного ряда зависит лишь от величины временного интервала k и не зависит от самих моментов наблюдений t. 2
В статистике имеется несколько выборочных оценок теоретических значений автокорреляции r (k) процесса по конечному временному ряду из n наблюдений. Наиболее популярной оценкой является нециклический коэффициент автокорреляции с задержкой k (Андерсон, 1976; Вайну, 1977):
Наиболее важным из различных коэффициентов автокорреляции является первый - r1, измеряющий тесноту связи между уровнями x(1), x(2) ,..., x(n -1) и x(2), x(3), ..., x(n).
Распределение коэффициентов автокорреляции неизвестно, позтому для оценки их достоверности иногда используют непараметрическую теорию Андерсона (1976), предложившего статистику [4, 112]
t = r1 (n -1)0.5 ,
которая при достаточно большой выборке распределена нормально, имеет нулевую среднюю и дисперсию, равную единице (Тинтнер, 1965).
Автокорреляционные функции
Последовательность коэффициентов корреляции rk, где k = 1, 2, ..., n, как функция интервала k между наблюдениями называется автокорреляционной функцией (АКФ).
Вид выборочной автокорреляционной функции тесно связан со структурой ряда.
Автокорреляционная функция rk для «белого шума», при k >0, также образует стационарный временной ряд со средним значением 0.
Для стационарного ряда АКФ быстро убывает с ростом k. При наличии отчетливого тренда автокорреляционная функция приобретает характерный вид очень медленно спадающей кривой [3, 268].
В случае выраженной сезонности в графике АКФ также присутствуют выбросы для запаздываний, кратных периоду сезонности, но эти выбросы могут быть завуалированы присутствием тренда или большой дисперсией случайной компоненты.
Рассмотрим примеры автокорреляционной функции:
на рис. 1 представлен график АКФ, характеризующегося умеренным трендом и неясно выраженной сезонностью;
рис. 2 демонстрирует АКФ ряда, характеризующегося феноменальной сезонной детерминантой;
практически незатухающий график АКФ ряда (рис. 3) свидетельствует о наличии отчетливого тренда.
Рис 1.
Рис 2.
Рис 3.
В общем случае можно предполагать, что в рядах, состоящих из отклонений от тренда, автокорреляции нет. Например, на рис. 4 представлен график АКФ для остатков, полученных от сглаживания ряда, очень напоминающий процесс «белого шума». Однако нередки случаи, когда остатки (случайная компонента h ) могут оказаться автокоррелированными, например, по следующим причинам [1, 172]:
в детерминированных или стохастических моделях динамики не учтен существенный фактор3
в модели не учтено несколько несущественных факторов, взаимное влияние которых оказывается существенным вследствие совпадения фаз и направлений их изменения;
выбран неправильный тип модели (нарушен принцип контринтуитивности);
случайная компонента имеет специфическую структуру.
Рис 4.
Критерий Дарбина-Уотсона
Критерий Дарбина-Уотсона (Durbin, 1969) представляет собой распространенную статистику, предназначенную для тестирования наличия автокорреляции остатков первого порядка после сглаживания ряда или в регрессионных моделях.
Численное значение коэффициента равно
d = [(e(2)-e(1))2 + ... + (e(n)-e(n -1))2]/[e(1)2 + ... + e(n)2],
где e(t) - остатки.
Возможные значения критерия находятся в интервале от 0 до 4, причем табулированы его табличные пороговые значения для разных уровней значимости (Лизер, 1971).
Значение d близко к величине 2*(1 - r1), где r - выборочный коэффициент автокорреляции для остатков. Соответственно, идеальное значение статистики - 2 (автокорреляция отсутствует). Меньшие значения соответствуют положительной автокорреляции остатков, большие – отрицательной [2, 193].
Например, после сглаживания ряда ряд остатков имеет критерий d = 1.912. Аналогичная статистика после сглаживания ряда - d = 1.638 - свидетельствует о некоторой автокоррелированности остатков.
Глава 2. Примеры практических расчетов с помощью макроса Excel «Автокорреляционная функция»
Все данные взяты с сайта http://e3.prime-tass.ru/macro/
Пример 1. ВВП РФ
Приведем данные о ВВП РФ
Год | квартал | ВВП | первая разность |
2001 | I | 1900,9 | |
II | 2105,0 | 204,1 | |
III | 2487,9 | 382,9 | |
IV | 2449,8 | -38,1 | |
2002 | I | 2259,5 | -190,3 |
II | 2525,7 | 266,2 | |
III | 3009,2 | 483,5 | |
IV | 3023,1 | 13,9 | |
2003 | I | 2850,7 | -172,4 |
II | 3107,8 | 257,1 | |
III | 3629,8 | 522,0 | |
IV | 3655,0 | 25,2 | |
2004 | I | 3516,8 | -138,2 |
II | 3969,8 | 453,0 | |
III | 4615,2 | 645,4 | |
IV | 4946,4 | 331,2 | |
2005 | I | 4479,2 | -467,2 |
II | 5172,9 | 693,7 | |
III | 5871,7 | 698,8 | |
IV | 6096,2 | 224,5 | |
2006 | I | 5661,8 | -434,4 |
II | 6325,8 | 664,0 | |
III | 7248,1 | 922,3 | |
IV | 7545,4 | 297,3 | |
2007 | I | 6566,2 | -979,2 |
II | 7647,5 | 1081,3 |
Исследуем ряд
На диаграммах показаны: исходный ряд (сверху) и автокорреляционная функция до лага 9 (снизу). На нижней диаграмме штриховой линией обозначен уровень «белого шума» - граница статистической значимости коэффициентов корреляции. Видно, что имеется сильная корреляция 1 и 2 порядка, соседних членов ряда, но и удаленных на 1 единицу времени друг от друга. Корреляционные коэффициенты значительно превышают уровень «белого шума». По графику автокорреляции видим наличие четкого тренда.
Ниже даны значения автокорреляционной функции и уровня белого шума
АКФ(...) | Ошибка АКФ | ||
1 | 0,856 | 0,203 | -0,203 |
2 | 0,762 | 0,616 | -0,616 |
3 | 0,658 | 0,747 | -0,747 |
4 | 0,550 | 0,831 | -0,831 |
5 | 0,418 | 0,885 | -0,885 |
6 | 0,315 | 0,915 | -0,915 |
7 | 0,224 | 0,932 | -0,932 |
8 | 0,131 | 0,940 | -0,940 |
Если нас интересует внутренняя динамика ряда необходимо найти первую разность его членов, т.е. для каждого квартала найти изменение значения по сравнению с предыдущим кварталом. Для первой разности построим автокорреляционную функцию.
Статистика Дарбина-Ватсона (DW) =1,813 |
DW Up= 1,450 |
DW Low=1,290 |
Статистика Дарбина-Уотсона показывает, что автокорреляции 1-го порядка нет. По графику можно видеть, что первые разности возрастают, т.к. тренд восходящий. Видна автокорреляция 2 и 4-го порядков, что говорит о полугодовой и годовой сезонности. Значения функции и границы для «белого шума» представлены ниже
АКФ(...) | Ошибка АКФ | ||
1 | -0,203 | 0,392 | -0,392 |
2 | -0,530 | 0,416 | -0,416 |
3 | -0,003 | 0,513 | -0,513 |
4 | 0,637 | 0,513 | -0,513 |
5 | -0,087 | 0,627 | -0,627 |
6 | -0,423 | 0,629 | -0,629 |
7 | -0,028 | 0,673 | -0,673 |
Пример 2. Импорт
Дано
год | квартал | номер | значение | разность |
1999 | I | 1 | 3,10 | |
II | 2 | 3,40 | 0,30 | |
III | 3 | 3,33 | -0,07 | |
IV | 4 | 3,80 | 0,47 | |
2000 | I | 5 | 3,20 | -0,60 |
II | 6 | 3,60 | 0,40 | |
III | 7 | 3,70 | 0,10 | |
IV | 8 | 4,33 | 0,63 | |
2001 | I | 9 | 3,60 | -0,73 |
II | 10 | 4,43 | 0,83 | |
III | 11 | 4,30 | -0,13 | |
IV | 12 | 5,17 | 0,87 | |
2002 | I | 13 | 4,13 | -1,03 |
II | 14 | 4,77 | 0,63 | |
III | 15 | 5,20 | 0,43 | |
IV | 16 | 5,97 | 0,77 | |
2003 | I | 17 | 5,10 | -0,87 |
II | 18 | 5,90 | 0,80 | |
III | 19 | 6,33 | 0,43 | |
IV | 20 | 7,23 | 0,90 | |
2004 | I | 21 | 6,43 | -0,80 |
II | 22 | 7,70 | 1,27 | |
III | 23 | 8,17 | 0,47 | |
IV | 24 | 9,08 | 0,92 | |
2005 | I | 25 | 8,17 | -0,92 |
II | 26 | 9,80 | 1,63 | |
III | 27 | 10,50 | 0,70 | |
IV | 28 | 12,47 | 1,97 | |
2006 | I | 29 | 10,40 | -2,07 |
II | 30 | 12,67 | 2,27 | |
III | 31 | 14,20 | 1,53 | |
IV | 32 | 17,10 | 2,90 |
Построим автокорреляционную функцию
АКФ(...) | Ошибка АКФ | ||
1 | 0,802 | 0,211 | -0,211 |
2 | 0,693 | 0,535 | -0,535 |
3 | 0,585 | 0,637 | -0,637 |
4 | 0,566 | 0,701 | -0,701 |
5 | 0,423 | 0,756 | -0,756 |
6 | 0,343 | 0,785 | -0,785 |
7 | 0,255 | 0,803 | -0,803 |
8 | 0,231 | 0,813 | -0,813 |
9 | 0,131 | 0,822 | -0,822 |
10 | 0,072 | 0,824 | -0,824 |
Видим, что есть автокорреляция 1-го и 2-го порядков. График показывает наличие тренда. Положительная автокорреляция объясняется неправильно выбранной спецификацией, т.к. линейный тренд тут непригоден, он скорее экспоненциальный. Поэтому сделаем ряд стационарным, взяв первую разность.
АКФ(...) | Ошибка АКФ | ||
1 | -0,297 | 0,343 | -0,343 |
2 | 0,309 | 0,390 | -0,390 |
3 | -0,420 | 0,420 | -0,420 |
4 | 0,636 | 0,471 | -0,471 |
5 | -0,226 | 0,571 | -0,571 |
6 | 0,214 | 0,583 | -0,583 |
7 | -0,311 | 0,593 | -0,593 |
8 | 0,444 | 0,613 | -0,613 |
9 | -0,229 | 0,653 | -0,653 |
Видим наличие автокорреляции 4-го порядка, что соответствует корреляции данных, отдаленных на год. Автокорреляцию первого порядка не имеем.
Статистика Дарбина-Ватсона (DW) =2,023 |
DW Up=1,500 |
DW Low=1,360 |
Пример 3. Экспорт
Приведем данные
год | квартал | номер | значение | разность |
2000 | I | 1 | 22,30 | |
II | 2 | 22,80 | 0,50 | |
III | 3 | 24,80 | 2,00 | |
IV | 4 | 24,80 | 0,00 | |
2001 | I | 5 | 25,50 | 0,70 |
II | 6 | 25,50 | 0,00 | |
III | 7 | 25,90 | 0,40 | |
IV | 8 | 26,20 | 0,30 |
2002 | I | 9 | 26,30 | 0,10 |
II | 10 | 28,60 | 2,30 | |
III | 11 | 28,70 | 0,10 | |
IV | 12 | 30,30 | 1,60 | |
2003 | I | 13 | 30,50 | 0,20 |
II | 14 | 31,00 | 0,50 | |
III | 15 | 33,80 | 2,80 | |
IV | 16 | 36,40 | 2,60 | |
2004 | I | 17 | 38,00 | 1,60 |
II | 18 | 41,40 | 3,40 | |
III | 19 | 47,20 | 5,80 | |
IV | 20 | 52,36 | 5,16 | |
2005 | I | 21 | 52,50 | 0,14 |
II | 22 | 60,40 | 7,90 | |
III | 23 | 65,70 | 5,30 | |
IV | 24 | 67,40 | 1,70 | |
2006 | I | 25 | 69,00 | 1,60 |
II | 26 | 76,60 | 7,60 | |
III | 27 | 79,80 | 3,20 | |
IV | 28 | 71,00 | -8,80 | |
2007 | I | 29 | 80,50 | 9,50 |
Для исходного ряда имеем:
АКФ(...) | Ошибка АКФ | ||
1 | 0,896 | 0,165 | -0,165 |
2 | 0,822 | 0,600 | -0,600 |
3 | 0,712 | 0,739 | -0,739 |
4 | 0,592 | 0,828 | -0,828 |
5 | 0,483 | 0,884 | -0,884 |
6 | 0,372 | 0,920 | -0,920 |
7 | 0,261 | 0,941 | -0,941 |
8 | 0,150 | 0,950 | -0,950 |
9 | 0,062 | 0,954 | -0,954 |
Очевидно наличие четкого тренда, значимыми являются коэффициенты автокорреляции 1-го и 2-го порядков. Для первой разности
АКФ(...) | Ошибка АКФ | ||
1 | -0,173 | 0,372 | -0,372 |
2 | -0,090 | 0,389 | -0,389 |
3 | 0,353 | 0,392 | -0,392 |
4 | 0,240 | 0,435 | -0,435 |
5 | -0,106 | 0,454 | -0,454 |
6 | -0,088 | 0,457 | -0,457 |
7 | 0,315 | 0,460 | -0,460 |
8 | -0,136 | 0,490 | -0,490 |
Автокорреляции уже не видим, остатки распределены как «белый шум».
Заключение
Другой полезный метод исследования периодичности состоит в исследовании частной автокорреляционной функции (ЧАКФ), представляющей собой углубление понятия обычной автокорреляционной функции. В ЧАКФ устраняется зависимость между промежуточными наблюдениями (наблюдениями внутри лага). Другими словами, частная автокорреляция на данном лаге аналогична обычной автокорреляции, за исключением того, что при вычислении из нее удаляется влияние автокорреляций с меньшими лагами. На лаге 1 (когда нет промежуточных элементов внутри лага), частная автокорреляция равна, очевидно, обычной автокорреляции. На самом деле, частная автокорреляция дает более "чистую" картину периодических зависимостей.
Как отмечалось выше, периодическая составляющая для данного лага k может быть удалена взятием разности соответствующего порядка. Это означает, что из каждого i-го элемента ряда вычитается (i-k)-й элемент. Имеются два довода в пользу таких преобразований. Во-первых, таким образом можно определить скрытые периодические составляющие ряда. Напомним, что автокорреляции на последовательных лагах зависимы. Поэтому удаление некоторых автокорреляций изменит другие автокорреляции, которые, возможно, подавляли их, и сделает некоторые другие сезонные составляющие более заметными. Во-вторых, удаление периодических составляющих делает ряд стационарным, что необходимо для применения некоторых методов анализа.
Литература
Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1977.
Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. М.: Высшая школа, 1997.
Калинина В.Н., Панкин В.Ф. Математическая статистика. М.: Высшая школа, 1994.
Мацкевич И.П., Свирид Г.П., Булдык Г.М. Сборник задач и упражнений по высшей математике (Теория вероятностей и математическая статистика). Минск: Вышейша школа, 1996.
Тимофеева Л.К., Суханова Е.И., Сафиулин Г.Г. Сборник задач по теории вероятностей и математической статистике / Самарск. экон. ин-т. Самара, 1992.
Тимофеева Л.К., Суханова Е.И., Сафиулин Г.Г. Теория вероятностей и математическая статистика / Самарск. гос. экон. акад. Самара, 1994.
Тимофеева Л.К., Суханова Е.И. Математика для экономистов. Сборник задач по теории вероятностей и математической статистике. –М.: УМиИЦ «Учебная литература», 1998.
1 а, следовательно, высоко значимые
2 Коэффициент автокорреляции может быть оценен и для нестационарного ряда, но в этом случае его вероятностная интерпретация теряется.
3 фактически, нарушен принцип омнипотентности