ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЭКОНОМИКИ И ФИНАНСОВ»
КАФЕДРА СТАТИСТИКИ И ЭКОНОМЕТРИКИ
КОНТРОЛЬНОЕ ЗАДАНИЕ
по дисциплине "ЭКОНОМЕТРИКА"
ВАРИАНТ № 5
Санкт-Петербург
2009
1. По 10 банкам изучается зависимость прибыли (у – млн. руб.) от вложений в уставные капиталы предприятий (х – млн. руб.):
№ |
Прибыль, млн. руб. |
Вложения в уставные капиталы предприятий, млн. руб. |
1 |
55,3 |
20 |
2 |
50,2 |
25 |
3 |
60,9 |
35 |
4 |
62,8 |
42 |
5 |
63,9 |
47 |
6 |
64,5 |
50 |
7 |
65,5 |
55 |
8 |
66,8 |
63 |
9 |
67,9 |
70 |
10 |
69,3 |
80 |
Построить поле корреляции рассматриваемой зависимости.
Определить уравнение регрессии полулогарифметической модели: = а + b*lnх.
Найти индекс корреляции и сравнить его с линейным коэффициентом корреляции. Пояснить причины различий.
Найти среднюю ошибку аппроксимации.
Рассчитать стандартную ошибку регрессии.
С вероятностью 0,95 оценить статистическую значимость уравнения и коэффициента регрессии. Сделать выводы.
С вероятностью 0,95 оценить доверительный интервал ожидаемого размера прибыли, если вложения в уставные капиталы предприятий составят 45 млн. руб.
решение
При изучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на поле корреляции.
Рисунок 1.1. Поле корреляции, характеризующее зависимость прибыли от вложений в ставные капиталы предприятий.
Для определения параметров полулогарифмической функции используется система нормальных уравнений следующего вида:
.
Таблица 1.1
Определение параметров регрессии
№ | у | у2 | х | lnx | (lnx)2 | у*lnx | |
1 | 55,3 | 3058,09 | 20 | 2,996 | 0,655 | 8,974 | 165,664 |
2 | 50,2 | 2520,04 | 25 | 3,219 | 0,344 | 10,361 | 161,588 |
3 | 60,9 | 3708,81 | 35 | 3,555 | 0,062 | 12,640 | 216,521 |
4 | 62,8 | 3943,84 | 42 | 3,738 | 0,005 | 13,970 | 234,726 |
5 | 63,9 | 4083,21 | 47 | 3,850 | 0,002 | 14,824 | 246,024 |
6 | 64,5 | 4160,25 | 50 | 3,912 | 0,011 | 15,304 | 252,325 |
7 | 65,5 | 4290,25 | 55 | 4,007 | 0,041 | 16,059 | 262,480 |
8 | 66,8 | 4462,24 | 63 | 4,143 | 0,114 | 17,166 | 276,761 |
9 | 67,9 | 4610,41 | 70 | 4,248 | 0,197 | 18,050 | 288,473 |
10 | 69,3 | 4802,49 | 80 | 4,382 | 0,333 | 19,202 | 303,674 |
Сумма | 627,1 | 39639,63 | 487 | 38,051 | 1,764 | 146,550 | 2408,237 |
Среднее | 62,710 | 3963,96 | 48,700 | 3,805 | - | 14,655 | 240,824 |
s | 5,605 | - | - | 0,421 | - | - | - |
.
а = = 0,02;
b = = 16,428.
Итак, получили следующее уравнении регрессии: = 0,02 + 16,428*lnх.
Подставляя в уравнении регрессии фактические значения х, получаем теоретические значения результата . По ним рассчитываем показатель тесноты связи – индекс корреляции.
rху =
Таблица 1.2
Расчет коэффициента корреляции
№ | у | |||
1 | 55,3 | 49,23 | 36,80 | 54,91 |
2 | 50,2 | 52,90 | 7,29 | 156,50 |
3 | 60,9 | 58,43 | 6,11 | 3,28 |
4 | 62,8 | 61,42 | 1,90 | 0,01 |
5 | 63,9 | 63,27 | 0,40 | 1,42 |
6 | 64,5 | 64,29 | 0,05 | 3,20 |
7 | 65,5 | 65,85 | 0,12 | 7,78 |
8 | 66,8 | 68,08 | 1,65 | 16,73 |
9 | 67,9 | 69,81 | 3,66 | 26,94 |
10 | 69,3 | 72,01 | 7,33 | 43,43 |
Сумма | 627,1 | 625,30 | 65,31 | 314,19 |
Среднее | 62,710 | - | - | - |
rху = = 0,89 – связь сильная.
Рассчитаем линейный коэффициент корреляции:
rxy = b* = 16,428* = 0,91 – данное значение близко к единице и означает наличие очень тесной зависимости прибыли от вложений в уставные капиталы предприятий.
Мы получили различие между индексом корреляции и линейным коэффициентом корреляции из-за различий в принимаемой базе при расчетах, т.е. в одном случае используется потенцированное значение, а в другом непотенциированное.
Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:
= *100%.
Таблица 1.3
Расчет средней ошибки аппроксимации
№ | у | ||
1 | 55,3 | 49,23 | 0,110 |
2 | 50,2 | 52,90 | -0,054 |
3 | 60,9 | 58,43 | 0,041 |
4 | 62,8 | 61,42 | 0,022 |
5 | 63,9 | 63,27 | 0,010 |
6 | 64,5 | 64,29 | 0,003 |
7 | 65,5 | 65,85 | -0,005 |
8 | 66,8 | 68,08 | -0,019 |
9 | 67,9 | 69,81 | -0,028 |
10 | 69,3 | 72,01 | -0,039 |
Сумма | 627,1 | 625,30 | 0,040 |
= *0,040*100 = 0,4% - в среднем расчетные значения отклоняются от фактических на 0,4%.
Стандартная ошибка регрессии, как и ошибка аппроксимации, служит для оценки качества уравнения регрессии. Ошибка определяется по формуле:
S = = = 2,857.
f-тест – оценивание качества уравнения регрессии – состоит в проверке гипотезы Н0 о статической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнения фактического Fфакт и критического Fтабл значений f-критерия Фишера.
Fфакт определяется из соотношения:
Fфакт = = = 30,48,
где n – число единиц совокупности;
m – число параметров при переменных х.
Поскольку Fфакт > Fтабл. = 5,32, то Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Для параметров парной регрессии средняя ошибка оценки вычисляется:
mb = = = 2,151;
tb = = = 7,637.
Табличное значение критерия Стьюдента при уровне значимости 0,05 и количестве степеней свободы 10 – 2 = 8 составляет 2,306.
Вывод: полученное значение критерия tb по модулю больше табличного, следовательно, можно отклонить гипотезу о несущественности коэффициента регрессии b.
Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если вложения в уставные капиталы предприятий составят 45 млн. руб., то вложения в уставные капиталы предприятий будут:
= 0,02 + 16,428*ln45 = 62,556 млн. руб.
Ошибка прогноза вычисляется по формуле:
m= sост* = 2,857* = 2,857*1,049 = 2,997.
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
D = tтабл* m = 2,306*2,997 = 6,911.
Доверительный интервал прогноза:
g = ± D = 62,556 ± 6,911;
gmin = - D = 62,556 – 6,911 = 55,645;
gmах = + D = 62,556 + 6,911 = 69,467.
Итак, ожидаемый размер прибыли, если вложения в уставные капиталы предприятий составят 45 млн. руб., не выйдет с вероятностью 0,95 за пределы интервала [55,645; 69,467] млн. руб.
2. По 20 предприятиям региона, выпускающим однородную продукцию построена модель объема выпуска (у – тыс. ед.) от численности занятых (х1 - человек), элекровооруженности труда (х2 – кВт*час на 1 работника) и потерь рабочего времени (х3 - %). Результаты оказались следующими:
= а + 1,8*х1 + 3,2*х2 – 2,1*х3 R2 = 0,875
(2,1) (3,4) (4,9) (1,9)
В скобках указаны фактические значения t-критерия для параметров уравнения регрессии.
Кроме того, известна следующая информация:
Среднее значение |
Коэффициент вариации, % |
|
у |
25 |
40 |
х1 |
420 |
20 |
х2 |
30 |
35 |
х3 |
18 |
10 |
Дать интерпретацию коэффициентов регрессии и оценить их значимость. Сделать выводы.
Оценить параметр а.
Оценить значимость уравнения регрессии с помощью F-критерия Фишера с вероятностью 0,95. Сделать выводы.
Построить уравнение множественной регрессии в стандартизованном масштабе и сделать выводы.
Найти частные коэффициенты корреляции и сделать выводы.
Дать интервальную оценку для коэффициентов регрессии.
Определить частные средние коэффициенты эластичности и сделать выводы.
Оценить скорректированный коэффициент множественной детерминации.
решение
Интерпретация уравнения регрессии: параметр b1 свидетельствует о том, что с увеличением численности занятых на 1 чел., объем выпуска увеличивается на 1,8 тыс. ед. при постоянном уровне электровооруженности труда и потерь рабочего времени.
Увеличение электровооруженности труда на 1 кВт.час на 1 работника объем выпуска увеличивается на 3,2 тыс. ед. при постоянном уровне численности занятых и потерь рабочего времени.
Увеличение же потерь рабочего времени на 1% объем выпуска снижается на 2,1 тыс. ед. при постоянном уровне численности занятых и элекровооруженности труда.
Оценку статистической значимости коэффициентов регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Выдвигаем гипотезу Н0 о статистически незначимом отличии коэффициентов регрессии от нуля.
tтабл для числа степеней свободы df = n – 2 = 20 – 2 = 18 и a = 0,05 составит 2,101.
Фактические значения t-статистики:
tb1 = 3,4 > tтабл = 2,101;
tb2 = 4,9 > tтабл = 2,101;
tb3 = -1,9 < tтабл = 2,101.
Гипотеза Н0 отклоняется, т.е. b1 и b2 не случайно отличаются от 0, а статистически значимы. Гипотеза Н0 не отклоняется в случае коэффициента b3, данный коэффициент следует признать статистически незначимым.
Выдвигаем гипотезу Н0 о статистически незначимом отличии показателя а от нуля.
tтабл для числа степеней свободы df = n – 2 = 20 – 2 = 18 и a = 0,05 составит 2,101.
Фактические значения t-статистики: tа = 2,1 > tтабл = 2,10.
Гипотеза Н0 отклоняется, т.е. параметр а не случайно отличаются от 0, а статистически значим.
f-тест – оценивание качества уравнения регрессии – состоит в проверке гипотезы Н0 о статической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнения фактического Fфакт и критического Fтабл значений f-критерия Фишера.
Fфакт определяется из соотношения:
Fфакт = = = 37,33,
где n – число единиц совокупности;
m – число параметров при переменных х.
Поскольку Fфакт > Fтабл. = 3,24, то Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
Для построения уравнения в стандартизованном масштабе рассчитаемbi, используя формулы для перехода от bi к bi:
bi = bi*.
Таблица 2.1
Расчет среднеквадратического отклонения
Среднее значение | Коэффициент вариации, % | s | |
(1) | (2) | (3) | (4) = (2)*(3) |
у | 25 | 40 | 10 |
х1 | 420 | 20 | 84 |
х2 | 30 | 35 | 10,5 |
х3 | 18 | 10 | 1,8 |
b1 = 1,8* = 15,12;
b2 = 3,2* = 3,36;
b3 = -2,1* = -0,38;
Получим уравнение: ty = 15,12*tx1 + 3,36*tx2 – 0,38*tх3.
Анализ β-коэффициентов показывает, что на объем выпуска из трех исследуемых факторов сильнее оказывает фактор X1 – численность занятых, так как ему соответствует наибольшее значение β-коэффициента.
Частные коэффициенты корреляции можно определить по формуле на основе коэффициентов детерминации:
ryx1*x2x3 = ;
ryx2*x1x3 = ;
ryx3*x1x2 = .
Определяем частный коэффициент корреляции у с х1:
Fх1 = ;
tb1 = Ю Fх1 = = 3,42 = 11,56;
= R2 - = 0,875 - = 0,785;
ryx1*x2x3 = = 0,647.
При постоянном уровне электровооруженности труда и потерь рабочего времени объем выпуска тесно зависит от численности занятых (теснота зависимости соответствует 0,647).
Определяем частный коэффициент корреляции у с х2:
Fх2 = ;
tb2 = Ю Fх2 = = 4,92 = 24,01;
= R2 - = 0,875 - = 0,687;
ryx2*x1x3 = = 0,775.
При постоянном уровне численности занятых и потерь рабочего времени объем выпуска тесно зависит от электровооруженности труда (теснота зависимости соответствует 0,775).
Определяем частный коэффициент корреляции у с х3:
Fх3 = ;
tb3 = Ю Fх3 = = 1,92 = 3,61;
= R2 - = 0,875 - = 0,847;
ryx2*x1x3 = = 0,428.
При постоянном уровне численности занятых и электровооруженности труда объем выпуска средне зависит от потерь рабочего времени (теснота зависимости соответствует 0,428).
Для расчета доверительного интервала определяем предельную ошибку для коэффициентов регрессии при факторах:
D = tтабл*mbxi,
где mbx1 = = = 0,529;
mbx2 = = = 0,653;
mbx3 = = = -1,105;
для b1
D = 2,11*0,529 = 1,116.
b1 - D = 1,8 – 1,1 = 0,7;
b1 +D = 1,8 + 1,1 = 2,9.
Итак, интервальное значение для коэффициента регрессии при факторе х1 с вероятностью 0,95 следующее [0,7; 2,9].
для b2
D = 2,11*0,653 = 1,378.
b2 - D = 3,2 – 1,4 = 1,8;
b2 +D = 3,2 + 1,4 = 4,6.
Итак, интервальное значение для коэффициента регрессии при факторе х2 с вероятностью 0,95 следующее [1,8; 4,6].
для b3
D = -2,11*1,105 = -2,332.
b2 - D = -2,1 + 2,3 = 0,2;
b2 +D = -2,1 - 2,3 = -4,4.
Итак, интервальное значение для коэффициента регрессии при факторе х3 с вероятностью 0,95 следующее [-4,4; 0,2].
Частные коэффициенты эластичности для линейной регрессии рассчитывают, как правило, при средних значениях факторов и результата:
= bi*.
= 1,8* = 30,24;
= 3,2* = 3,84;
= -2,1* = -1,51.
Анализ частных коэффициентов эластичности показывает, что по абсолютному приросту наибольшее влияние на значение объема выпуска оказывает фактор X1 – численность занятых, увеличение данного фактора на 1 пункт приводит к увеличению объема выпуска на 30,24 пункта. Увеличение электровооруженности труда на 1 пункт приводит к увеличению объема выпуска на 3,84 пункта. А увеличение потерь рабочего времени на 1 пункт приводит к снижению объема выпуска на 1,51 пункта.
Скорректированный коэффициент множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:
= 1 – (1 – R2)* = 1 – (1 – 0,875)* = 0,852.
3. Показать, что в следующей системе одновременных уравнений точно идентифицируемым является одно из уравнений:
Какое это уравнение? Имеет ли оно статистическое решение с помощью КМНК?
решение
Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос — имеют ли решения каждое из уравнений и система в целом. Воспользуемся счетным правилом, по которому в каждом уравнении системы необходимо сравнить НY - число эндогенных переменных в данном уравнении и Dx - число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня. Для удобства анализа представим результаты в таблице.
Таблица 3.1
Результаты идентификации структурных уравнений и всей системы
Номер уравнения | Число эндогенных переменных в уравнении, НY | Число экзогенных переменных из общего их списка, отсутствующих в уравнении, Dx | Сравнение параметров НY и Dx+1 | Решение об идентификации уравнения |
1 | 2 | 1 | 2 = 1+1 | Точно идентифицируемо |
2 | 2 | 1 | 2 = 1+1 | Точно идентифицируемо |
3 | 2 | 1 | 2 = 1+1 | Точно идентифицируемо |
4 | 3 | 2 | 3 = 2+1 | Точно идентифицируемо |
Проверим необходимое условие идентификации для уравнений модели.
I уравнение
Уравнение | Отсутствующие переменные | ||
у3 | у4 | х3 | |
Второе | b23 | 0 | 0 |
Третье | -1 | 0 | 0 |
Четвертое | 0 | -1 | a33 |
Det A = 0.
Следовательно, не выполняется достаточное условие идентификации, и первое уравнение не идентифицируемо.
II уравнение
Уравнение | Отсутствующие переменные | ||
у1 | у4 | х3 | |
Первое | -1 | 0 | 0 |
Третье | b31 | 0 | 0 |
Четвертое | b41 | -1 | a33 |
Det A = 0.
Следовательно, не выполняется достаточное условие идентификации, и второе уравнение не идентифицируемо.
III уравнение
Уравнение | Отсутствующие переменные | ||
у2 | у4 | х3 | |
Первое | b12 | 0 | 0 |
Второе | -1 | 0 | 0 |
Четвертое | b42 | -1 | a33 |
Det A = 0.
Следовательно, не выполняется достаточное условие идентификации, и третье уравнение не идентифицируемо.
IV уравнение
Уравнение | Отсутствующие переменные | ||
у3 | х1 | х2 | |
Первое | 0 | а11 | а12 |
Второе | b23 | а21 | а22 |
Третье | -1 | а31 | а32 |
Det A = = -a11* + a12* № 0.
Ранг матрицы равен 2, что не менее числа эндогенных переменных системы без единицы.
Следовательно, выполняется достаточное условие идентификации, и четвертое уравнение точно идентифицируемо.
Вся модель является не идентифицируемой. Соответственно идентифицируемое уравнение не может быть решено с помощью КМНК.
4. Динамика ВРП на душу населения по региону характеризуется следующими данными за 1997-2003 гг. (тыс. руб.):
1997 | 1998 | 1999 | 2000 | 2001 | 2002 | 2003 |
10,0 | 12,7 | 14,3 | 17,1 | 29,4 | 42,2 | 52,4 |
Определить коэффициент автокорреляции первого порядка и дать его интерпретацию.
Построить уравнение тренда в виде экспоненты или показательной кривой. Дать интерпретацию параметров.
С помощью критерия Дарбина-Уотсона сделать выводы относительно автокорреляции в остатках в рассматриваемом уравнении.
Дать интервальный прогноз ожидаемого уровня ВРП на душу населения на 2005 год.
решение
Для изменения автокорреляции уровней динамического ряда используется коэффициент автокорреляции:
r1 = ,
где = = 28,02 тыс. руб.;
= = 20,95 тыс. руб.
Таблица 4.1
Расчет коэффициента автокорреляции первого порядка для временного ряда
t | yt | yt-1 |
yt - |
yt-1 - |
(yt - )*(yt-1 - ) |
(yt - )2 |
(yt-1 - )2 |
1 | 10,0 | - | - | - | - | - | - |
2 | 12,7 | 10,0 | -15,32 | -10,95 | 167,72 | 234,60 | 119,90 |
3 | 14,3 | 12,7 | -13,72 | -8,25 | 113,16 | 188,15 | 68,06 |
4 | 17,1 | 14,3 | -10,92 | -6,65 | 72,60 | 119,17 | 44,22 |
5 | 29,4 | 17,1 | 1,38 | -3,85 | -5,33 | 1,91 | 14,82 |
6 | 42,2 | 29,4 | 14,18 | 8,45 | 119,85 | 201,17 | 71,40 |
7 | 52,4 | 42,2 | 24,38 | 21,25 | 518,15 | 594,55 | 451,56 |
Итого | 178,1 | 125,7 | 0 | 0 | 986,15 | 1339,55 | 769,98 |
r1 = = 0,971.
Полученное значение свидетельствует об очень тесной зависимости между ВРП на душу населения по региону текущего и непосредственно предшествующего годов и, следовательно, о наличии во временном ряде ВРП на душу населения по региону сильной линейной тенденции.
Определим параметры уравнения тренда в виде показательной кривой у = а*bt:
lgy = lga + t*lgb
Y = C + B*t,
где Y = lgy;
C = lga;
B = lgb.
Таблица 4.1
Расчет параметров тренда
№ | у | Y | t | Y*t | Y2 | t2 |
1 | 10,0 | 1,000 | 1 | 1,000 | 1,000 | 1 |
2 | 12,7 | 1,104 | 2 | 2,208 | 1,218 | 4 |
3 | 14,3 | 1,155 | 3 | 3,466 | 1,335 | 9 |
4 | 17,1 | 1,233 | 4 | 4,932 | 1,520 | 16 |
5 | 29,4 | 1,468 | 5 | 7,342 | 2,156 | 25 |
6 | 42,2 | 1,625 | 6 | 9,752 | 2,642 | 36 |
7 | 52,4 | 1,719 | 7 | 12,035 | 2,956 | 49 |
Сумма | 178,1 | 9,305 | 28 | 40,735 | 12,827 | 140 |
Среднее | 25,44 | 1,329 | 4 | 5,819 | 1,832 | 20 |
В = = = 0,126;
А = - В* = 1,329 – 0,126*4 = 0,825.
Получено линейное уравнение: = 0,825 + 0,126*t.
Произведем потенцирование полученного уравнения и запишем его в обычной форме: = 100,825*100,126*t = 6,683*1,337t.
Рис. 4.1. Графическое отображение уравнения тренда.
Показатель b = 1,337 представляет собой средний за период цепной коэффициент роста уровней ряда. Параметр а = 0,825 означает начальный уровень ряда в момент времени, равный 0.
Остатки et рассчитываются по формуле:
et = yt - .
Критерий Дарбина-Уотсона рассчитывается по формуле:
d = .
Таблица 4.2
Расчет критерия Дарбина-Уотсона
№ | уt |
|
et | et-1 |
|
|
1 | 10,0 | 8,94 | 1,06 | |||
2 | 12,7 | 11,95 | 0,75 | 1,06 | 0,097 | 0,568 |
3 | 14,3 | 15,97 | -1,67 | 0,75 | 5,885 | 2,796 |
4 | 17,1 | 21,35 | -4,25 | -1,67 | 6,670 | 18,104 |
5 | 29,4 | 28,55 | 0,85 | -4,25 | 26,045 | 0,720 |
6 | 42,2 | 38,17 | 4,03 | 0,85 | 10,101 | 16,214 |
7 | 52,4 | 51,04 | 1,36 | 4,03 | 7,099 | 1,856 |
Сумма | - | - | - | - | 55,896 | 40,258 |
d = = 1,39.
Фактическое значение d сравниваем с табличным значением при 5%-ном уровне значимости. При n = 7 лет и m = 1 (число факторов) нижнее значение d’ равно 0,70, а верхнее - 1,36. Так как фактическое значение d равно 1,39.
На основании схемы видно, что d = 1,39 попадает в промежуток от dU до 4 – dU. Следовательно, нет оснований отклонять гипотезу Н0 об отсутствии автокорреляции в остатках.
При t = 9, что соответствует 2005 году, прогнозное значение составит:
= 6,683*1,3379 = 91,2 тыс. руб.
Таблица 4.3
Расчет стандартной ошибки прогноза
№ | уt |
|
|
t |
|
1 | 10,0 | 8,94 | 1,124 | 1 | 9 |
2 | 12,7 | 11,95 | 0,563 | 2 | 4 |
3 | 14,3 | 15,97 | 2,789 | 3 | 1 |
4 | 17,1 | 21,35 | 18,063 | 4 | 0 |
5 | 29,4 | 28,55 | 0,722 | 5 | 1 |
6 | 42,2 | 38,17 | 16,241 | 6 | 4 |
7 | 52,4 | 51,04 | 1,850 | 7 | 9 |
Сумма | 178,1 | 176,0 | 41,351 | 28 | 28 |
Среднее | - | - | - | 4 | - |
S = = = 2,876.
myt = = = 1,726.
ta* myt = 2,571*1,726 = 4,4.
91,2 – 4,4 = 86,8 Ј Ј 91,2 + 4,4 = 95,6.
Интервальный прогноз ожидаемого уровня ВРП на душу населения на 2005 год составит 86,8 Ј Ј 95,6 тыс. руб.
5. Динамика показателя деятельности организаций с участием иностранного капитала в регионе характеризуется следующими данными:
Год |
Среднесписочная численность работников, тыс. чел. (хt) |
Выпуск товаров, работ и услуг, млрд. руб. (уt) |
1998 |
25,8 |
6 |
1999 |
29,5 |
14 |
2000 |
31,4 |
19 |
2001 |
29,1 |
29 |
2002 |
35,5 |
45 |
2003 |
42,0 |
64 |
2004 |
46,1 |
69 |
В результате аналитического выравнивания получены следующие уравнения трендов и коэффициенты детерминации (t = 1:7):
для выпуска товаров, работ и услуг:
= -9,8571 + 11,25*t, R2 = 0,9654,
для среднесписочной численности работников:
= 27,4 – 0,8238*t + 0,5048*t2, R2 = 0,9397.
Дать интерпретацию параметров уравнений трендов.
Определить коэффициент корреляции между временными рядами, используя:
непосредственно исходные уровни;
отклонения от основной тенденции.
Обосновать различие полученных результатов и сделать вывод о тесноте связи между временными рядами.
Построить уравнение регрессии по отклонениям от трендов.
решение
Наиболее простую экономическую интерпретацию имеют параметры линейного тренда. Параметры линейного тренда можно интерпретировать так:
а – начальный уровень временного ряда в момент времени t = 0;
b – средний за период абсолютный прирост уровней ряда.
Для исходной задачи начальный уровень ряда для выпуска товаров соответствует значению -9,8571 млрд. руб., средний за период абсолютный прирост уровней ряда составляет 11,25 млрд. руб. Параметр b > 0, значит уровни ряда равномерно возрастают на 11,25 млрд. руб. каждый год.
Для среднесписочной численности работников коэффициент а - начальный уровень ряда соответствует значению 27,4 тыс. чел.; абсолютное ускорение увеличения среднесписочной численности работников соответствует 1,0096.
Рассчитаем коэффициент корреляции между временными рядами, используя непосредственно исходные уровни. Коэффициент корреляции характеризует тесноту линейной связи между изучаемыми признаками. Определяем его по формуле:
rxy = ,
Таблица 5.1
Расчет параметров коэффициента корреляции
№ | у | х | х*у | у2 | х2 |
1 | 6 | 25,8 | 154,8 | 36 | 665,64 |
2 | 14 | 29,5 | 413 | 196 | 870,25 |
3 | 19 | 31,4 | 596,6 | 361 | 985,96 |
4 | 29 | 29,1 | 843,9 | 841 | 846,81 |
5 | 45 | 35,5 | 1597,5 | 2025 | 1260,25 |
6 | 64 | 42,0 | 2688 | 4096 | 1764 |
7 | 69 | 46,1 | 3180,9 | 4761 | 2125,21 |
Сумма | 246 | 239,4 | 9474,7 | 12316 | 8518,12 |
Среднее | 35,14 | 34,20 | 1353,53 | 1759,43 | 1216,87 |
sх = = = 6,87;
sу = = = 22,90.
rxy = = 0,965 - связь сильная, прямая.
Рассчитаем коэффициент корреляции между временными рядами, используя отклонения от основной тенденции.
Таблица 5.2
Расчет отклонений от основной тенденции
№ | у | х |
х - |
у - |
||
1 | 6 | 25,8 | 27,08 | 1,39 | -1,28 | 4,61 |
2 | 14 | 29,5 | 27,77 | 12,64 | 1,73 | 1,36 |
3 | 19 | 31,4 | 29,47 | 23,89 | 1,93 | -4,89 |
4 | 29 | 29,1 | 32,18 | 35,14 | -3,08 | -6,14 |
5 | 45 | 35,5 | 35,90 | 46,39 | -0,4 | -1,39 |
6 | 64 | 42,0 | 40,63 | 57,64 | 1,37 | 6,36 |
7 | 69 | 46,1 | 46,37 | 68,89 | -0,27 | 0,11 |
Сумма | 246 | 239,4 | 239,41 | 246,00 | -1,28 | 0,02 |
Среднее | 35,14 | 34,20 | - | - | 0 | 0,00286 |
Таблица 5.3
Расчет параметров коэффициента корреляции
№ | у | х | х*у | у2 | х2 |
1 | 4,61 | -1,28 | -5,90 | 21,25 | 1,64 |
2 | 1,36 | 1,73 | 2,35 | 1,85 | 2,99 |
3 | -4,89 | 1,93 | -9,44 | 23,91 | 3,72 |
4 | -6,14 | -3,08 | 18,91 | 37,70 | 9,49 |
5 | -1,39 | -0,4 | 0,56 | 1,93 | 0,16 |
6 | 6,36 | 1,37 | 8,71 | 40,45 | 1,88 |
7 | 0,11 | -0,27 | -0,03 | 0,01 | 0,07 |
Сумма | 0,02 | -1,28 | -0,03 | 0,00 | 1,64 |
Среднее | 0,00286 | 0 | 15,14 | 127,11 | 21,59 |
sх = = = 4,65;
sу = = = 11,27.
rxy = = 0,289 - связь слабая, прямая.
При измерении корреляции между двумя временными рядами следует учитывать возможное существование ложной корреляции, что связано с наличием во временных рядах тенденции, т.е. зависимости обоих рядов от общего фактора времени. Для того чтобы устранить ложную корреляцию, следует коррелировать не сами уровни временных рядов, а их последовательные (первые или вторые) разности или отклонения от трендов (если последние не содержат тенденции).
Различия полученных результатов объясняется ложной корреляцией из-за наличия во временных рядах тенденции. Таким образом между временными рядами существует прямая слабая взаимосвязь.
Линейная регрессия сводится к нахождению уравнения вида:
= a + b*x.
Классический подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов.
Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b.
,
Можно воспользоваться готовыми формулами, которые вытекают из этой системы:
а = ;
b = = = 0,701;
а = 0,00286 – 0,701*0 = 0,00286.
Уравнение регрессии по отклонениям от трендов: = 0,00286 + 0,701*х.