ІНДУВІДУАЛЬНЕ ЗАВДАННЯ
З ДИСЦИПЛІНИ
"Економетрія"
Задача №1
По приведеним даним побудувати і дослідити емпіричну лінійну економетричну модель залежності обсягу виробництва фірми від витрат на заробітну платню персоналу й вартості основних фондів (вихідні данні в умовних одиницях). Виконати наступні завдання.
Скласти матрицю вихідних даних.
Знайти оцінки:
коефіцієнтів моделі;
математичного чекання обсягу виробництва;
залишків моделі;
дисперсії залишків;
коефіцієнта детермінації.
Скласти прогноз середньорічного обсягу виробництва для фірми з витратами на заробітну платню 1,2 ум.од. і основними фондами 15 ум.од.
Обсяг середньорічного виробництва
№ фірми Варіант |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
2 |
7,68 | 3,16 | 1,52 | 3,15 | 5,77 | 4,33 | 8,35 | 7,02 |
Заробітна платня та вартість основних фондів
(для усіх варіантів)
№ фірми Показники |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Зарплатня | 0,31 | 0,98 | 1,21 | 1,29 | 1,12 | 1,49 | 0,78 | 0,94 |
Осн. фонди | 10,24 | 7,51 | 10,81 | 9,89 | 13,72 | 13,92 | 8,54 | 12,36 |
РІШЕННЯ
По приведеним даним побудувати і дослідити емпіричну лінійну економетричну модель залежності обсягу виробництва фірми від витрат на заробітну платню персоналу й вартості основних фондів (вихідні данні в умовних одиницях). Виконати наступні завдання.
Скласти матрицю вихідних даних.
Знайти оцінки:
коефіцієнтів моделі;
математичного чекання обсягу виробництва;
залишків моделі;
дисперсії залишків;
коефіцієнта детермінації.
Скласти прогноз середньорічного обсягу виробництва для фірми з витратами на заробітну платню 1,2 ум.од. і основними фондами 15 ум.од.
Обсяг середньорічного виробництва
№ фірми Варіант |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
2 | 7,68 | 3,16 | 1,52 | 3,15 | 5,77 | 4,33 | 8,35 | 7,02 |
Заробітна платня та вартість основних фондів
№ фірми Показники |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Зарплатня | 0,31 | 0,98 | 1,21 | 1,29 | 1,12 | 1,49 | 0,78 | 0,94 |
Осн. фонди | 10,24 | 7,51 | 10,81 | 9,89 | 13,72 | 13,92 | 8,54 | 12,36 |
Розв'язання
Усі вихідні данні зводимо в таблицю:
Фірма, № з/п |
Обсяг середньорічного виробництва (y), ум.од. |
Зарплатня (x2), ум.од. |
Основні фонди (х3), ум.од. |
1 | 7,68 | 0,31 | 10,24 |
2 | 3,16 | 0,98 | 7,51 |
3 | 1,52 | 1,21 | 10,81 |
4 | 3,15 | 1,29 | 9,89 |
5 | 5,77 | 1,12 | 13,72 |
6 | 4,33 | 1,49 | 13,92 |
7 | 8,35 | 0,78 | 8,54 |
8 | 7,02 | 0,94 | 12,36 |
Складемо матрицю вихідних даних:
.
2.Економетричну модель запишемо у вигляді
,
Де y, - відповідно фактичні та розрахункові значення обсягу середньорічного виробництва за моделлю (регресант);
регресори (незалежні змінні):
х1 – допоміжний регресор (приймає одиничні значення);
х2 - витрати на заробітну платню персоналу;
х3 - вартість основних фондів;
u – залишки;
- оцінки параметрів моделі.
Для оцінки коефіцієнтів моделі використовуємо 1МНК.
Оператор оцінювання параметрів моделі за 1МНК має вигляд
де
; ; .
Матриця Х крім двох векторів незалежних змінних містить вектор одиниць. Він дописується в цій матриці ліворуч тоді, коли економетрична модель має вільний член.
Знайдемо транспоновану матрицю до матриці Х:
Знайдемо добуток Одержуємо
Знайдемо зворотну матрицю
Знайдемо вектор
.
Отримаємо шуканий вектор 1МНК-оцінок :
=.
Оцінена за допомогою 1МНК емпірична множинна регресія має вид
Отже, коли за всіх одинакових умов регресор х2 (витрати на заробітну платню персоналу) збільшується на одиницю, то регресант (обсяг середньорічного виробницьтва) також зменшується на 5,76 одиницю. Якщо за інших незмінних умов незалежна змінна х3 (обь'єм основних фондів) збільшується на одиницю, то залежна змінна збільшуеться на 0,42 одиниць.
Знайдемо прогнозні значення (математичне чекання) обсягу виробництва при даних у задачі значеннях зарплатні та вартості основних фондів:
Знайдемо оцінки залишків моделі дисперсії залишків , коефіцієнта детермінації
Складемо розрахункову таблицю.
У таблиці залишки обчислюються згідно з рівністю
,
а середнє значення регресанта підраховується слідуючім чином
.
№ п/п |
y | |||||
1 | 7,68 | 8,9131 | -1,2331 | 1,5206 | 3,7906 | 14,3687 |
2 | 3,16 | 3,8920 | -0,7320 | 0,5359 | -1,2305 | 1,5142 |
3 | 1,52 | 3,9723 | -2,4523 | 6,0138 | -1,1502 | 1,3230 |
4 | 3,15 | 3,1198 | 0,0302 | 0,0010 | -2,0027 | 4,0108 |
5 | 5,77 | 5,7295 | 0,0405 | 0,0017 | 0,6070 | 0,3685 |
6 | 4,33 | 3,6837 | 0,6463 | 0,4177 | -1,4388 | 2,0702 |
7 | 8,35 | 5,4824 | 2,8676 | 8,2232 | 0,3599 | 0,1296 |
8 | 7,02 | 6,1872 | 0,8328 | 0,6936 | 1,0647 | 1,1336 |
∑ | 40,98 | 40,9800 | 17,4075 | 24,9186 |
Незміщена оцінка дісперсії залишків подається так:
3,4815, де n – кiлькiсть спостережень, k –
кiлькiсть незалежних змiнних.
З таблиці маємо дисперсію регресії
.
Обчислимо дисперсію регресанта:
Остаточно, коефіцієнт детермінації має значення
Коефіцієнт детермінаціі R2, близький до одиниці, що свідчить про те, що отримана багатомірна регресійна модель досить близька до даних, отриманим емпіричним шляхом і може бути використана для визначення обсягу середньорічного виробництва фірми по заданим витратам на заробітну платню персоналу й вартості основних фондів. Отриманий висновок підтверджує графік відповідності теоретичних і емпіричних даних.
3. Прогноз середньорічного виробництва для фірми з витратами на заробітну платню 1,2 ум.од. і основними фондами 15 ум.од складає
(ум.од.)
Задача №2
Построить линейную регрессионную модель зависимости расходов на единицу продукции от уровня фондоемкости продукции. Проинтерпретировать найденные параметры модели. Рассчитать остатки економетричной модель. Найти коэффициент эластичности расходов относительно фондоемкости продукции. Рассчитать прогноз расходов на единицу продукции, если фондоемкость равняется 95 усл.ед. Найти , дать экономическую интерпретацию.
№ п/п |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Фондоёмкость продукции |
102 | 87 | 132 | 112 | 92 | 900 | 122 | 127 | 127 | 137 |
Расходы на ед. продукции |
50 | 40 | 65 | 55 | 45 | 42 | 56 | 60 | 64 | 65 |
Решение
В качестве регрессора Х принимаем фондоемкость продукции, регрессант Y – затраты на ед. продукции. Решим задачу 1МНК.
Эконометрическую модель (простую регрессионную модель) ищем в виде:
Составим расчетную таблицу
№ п/п | yi | xi | xi2 | xiyi |
1 | 50 | 102 | 10404 | 5100 |
2 | 40 | 87 | 7569 | 3480 |
3 | 65 | 132 | 17424 | 8580 |
4 | 55 | 112 | 12544 | 6160 |
5 | 45 | 92 | 8464 | 4140 |
6 | 42 | 90 | 8100 | 3780 |
7 | 56 | 122 | 14884 | 6832 |
8 | 60 | 127 | 16129 | 7620 |
9 | 64 | 127 | 16129 | 8128 |
10 | 65 | 137 | 18769 | 8905 |
S |
542 |
1128 |
130416 |
62725 |
Параметры находим по формулам
Эконометрическая модель имеет вид:
.
Воспользуемся альтернативным способом вычисления параметров с помощью отклонений средних арифметических.
Составим расчетную таблицу.
№ п/п | yi | xi | ui | ui2 | ||||||
1 | 50 | 102 | -10,8 | -4,2 | 116,64 | 45,36 | 48,8 | 1,2 | 1,44 | 17,64 |
2 | 40 | 87 | -25,8 | -14,2 | 665,64 | 366,36 | 41,3 | -1,3 | 1,69 | 201,64 |
3 | 65 | 132 | 19,2 | 10,8 | 368,64 | 207,36 | 63,8 | 1,2 | 1,44 | 116,64 |
4 | 55 | 112 | -0,8 | 0,8 | 0,64 | -0,64 | 53,8 | 1,2 | 1,44 | 0,64 |
5 | 45 | 92 | -20,8 | -9,2 | 432,64 | 191,36 | 43,8 | 1,2 | 1,44 | 84,64 |
6 | 42 | 90 | -22,8 | -12,2 | 519,84 | 278,16 | 42,8 | -0,8 | 0,64 | 148,84 |
7 | 56 | 122 | 9,2 | 1,8 | 84,64 | 16,56 | 58,8 | -2,8 | 7,84 | 3,24 |
8 | 60 | 127 | 14,2 | 5,8 | 201,64 | 82,36 | 61,3 | -1,3 | 1,69 | 33,64 |
9 | 64 | 127 | 14,2 | 9,8 | 201,64 | 139,16 | 61,3 | 2,7 | 7,29 | 96,04 |
10 | 65 | 137 | 24,2 | 10,8 | 585,64 | 261,36 | 66,3 | -1,3 | 1,69 | 116,64 |
S |
542 |
1128 |
3177,6 |
1587,4 |
26,6 |
819,6 |
Здесь средние значения переменных определяются из соотношений
Используя формулы, получим
a=54,2-0,5·100,8»3,8.
Окончательно, получим:
.
Количественная оценка параметра а=0,5 показывает, что среднее увеличение затрат при возрастании фондоемкости продукции на 1 усл.ед. составляет 0,5 усл.ед.
При построении эконометрической модели очень важным является вопрос о степени зависимости между регрессором и регрессантом, т.е. о тесноте связи между ними. Простейшим критерием, позволяющим получить количественную оценку влияния объясняющей переменной на объясняемую, является выборочный коэффициент корреляции (или просто коэффициент корреляции). Он рассчитывается по следующей формуле:
или, другая форма представления:
Из выражения видно, что коэффициент корреляции по абсолютной величине не превосходит единицу, т.е. -1Ј rxy Ј 1. При этом, чем ближе |rxy| к единице, тем теснее связь. При rxy=± 1 корреляционная связь представляет собой линейную функциональную зависимость, а наблюдаемые значения располагаются на прямой линии. Если rxy=0, то считают, что корреляция отсутствует. Линия регрессии при этом параллельна оси абсцисс.
Принято считать, что связь между переменными высокая, если rxyі0,8, если 0,7Ј rxy <0,8, то связь считают средней, при 0,6Ј rxy<0,7 - связь заметная, а в остальных случаях (rxy<0,6) связь является низкой и следует пересмотреть выбор объясняющей переменной в рассматриваемом эконометрическом исследовании.
Коэффициент корреляции показывает, что связь между переменными в рассматриваемой задаче очень тесная.
3.4. Нелинейные модели
Простая регрессионная модель может быть нелинейна в двух смыслах:
регрессия не является линейной по объясняющей переменной, но линейна по оцениваемым параметрам;
регрессия не является линейной по оцениваемым параметрам.
Нелинейность по переменным всегда можно обойти, используя замену переменных, например,
выражение можно привести к линейному виду, используя подстановку:
Имеем линейное уравнение с тремя переменными :
.
Способ параметризации полученного многофакторного уравнения основывается на 1МНК и будет рассмотрен позднее.
аналогично можно преобразовать квадратичною функцию y=а+bx+cх2. Ее приводим к линейной с помощью замены: z1=x, z2=x2. Получим:
y=a+bz1+cz2. (3.22)
Следует отметить, что найти параметры квадратичной функции y=ах2+bx+c можно и не используя линеаризацию (3.22). Осуществить параметризацию можно с помощью непосредственного применения МНК, при этом получим следующую систему нормальных уравнений (индексы суммирования опущены):
(3.23)
Решить ее можно, например, с помощью метода Крамера (метода определителей).
Пример 3.2. Предполагается, что объем потребления некоторого товара имеет квадратичную зависимость от уровня дохода семьи в месяц (условные данные приведены в таблице). Требуется найти уравнение, выражающее эту зависимость.
Таблица 3.4
Доход семьи, грн. | 800 | 1030 | 752 | 950 | 1004 | 837 | 986 | 1016 | 899 | 1005 |
Объем потребления товара, кг. | 0,20 | 1,00 | 0,15 | 0,66 | 0,80 | 0,35 | 0,74 | 0,95 | 0,52 | 0,83 |
Решение.
Обозначим месячный семейный доход через регрессор х (тыс. грн.), а объем потребления товара – регрессант y (кг). Уравнение зависимости будем искать в виде
y=а+bx+cх2
Параметры модели a,b и c будем искать с помощью МНК. Расчеты приведем в таблице (столбцы 1-8):
Таблица 3.5
№ п/п | х | у | х2 | х3 | х4 | ху | х2у | u | u2 | |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
1 | 0,80 | 0,20 | 0,64 | 0,51 | 0,41 | 0,16 | 0,13 | 0,24 | -0,04 | 0,001 |
2 | 1,03 | 1,00 | 1,06 | 1,09 | 1,13 | 1,03 | 1,06 | 0,96 | 0,04 | 0,002 |
3 | 0,75 | 0,15 | 0,57 | 0,43 | 0,32 | 0,11 | 0,08 | 0,15 | 0,00 | 0,000 |
4 | 0,95 | 0,66 | 0,90 | 0,86 | 0,81 | 0,63 | 0,60 | 0,65 | 0,01 | 0,000 |
5 | 1,00 | 0,80 | 1,01 | 1,01 | 1,02 | 0,80 | 0,81 | 0,85 | -0,05 | 0,003 |
6 | 0,84 | 0,35 | 0,70 | 0,59 | 0,49 | 0,29 | 0,25 | 0,32 | 0,03 | 0,001 |
7 | 0,99 | 0,74 | 0,97 | 0,96 | 0,95 | 0,73 | 0,72 | 0,78 | -0,04 | 0,002 |
8 | 1,02 | 0,95 | 1,03 | 1,05 | 1,07 | 0,97 | 0,98 | 0,90 | 0,05 | 0,002 |
9 | 0,90 | 0,52 | 0,81 | 0,73 | 0,65 | 0,47 | 0,42 | 0,49 | 0,03 | 0,001 |
10 | 1,01 | 0,83 | 1,01 | 1,02 | 1,02 | 0,83 | 0,84 | 0,86 | -0,03 | 0,001 |
S | 9,28 | 6,20 | 8,70 | 8,23 | 7,86 | 6,02 | 5,88 | 6,20 | 0,00 | 0,013 |
Данные полученные в таблице подставим в систему (3.23), получим
.
Решая ее методом Крамера, имеем:
D=0,00036; | D1=0,00052; | D2=-0,00185; | D3=0,00163. |
Тогда,
|
Искомая модель имеет вид:
. (3.24)
Подставив последовательно в полученное уравнение (3.24) значения хi, получим теоретические значения (столбец 9). Как видно из таблицы 3.5 теоретические значения регрессанта близки по своему значению к эмпирическим данным yi, этот же факт подтверждают и малые значения остатков (столбец 10). Можно утверждать, что квадратичное уравнение (3.24) хорошо описывает рассматриваемый экономический процесс.
Проблема преобразования нелинейных по параметрам соотношений представляет особый интерес в эконометрических исследованиях. Этот класс нелинейных моделей можно подразделить на два типа1:
нелинейные модели внутренне линейные (те, которые с помощью элементарных преобразований можно свести к линейным);
нелинейные модели внутренне нелинейные (не могут быть сведены к линейным функциям).
К внутренне линейным можно отнести функции:
степенную
показательную
экспоненциальную y=ea+bx.
Перечисленные функции можно свести к линейным логарифмированием обеих частей выражения (обычно логарифмируют по основанию е).
Для степенной функции получим:
(3.25)
Если переопределить , и , то от соотношения (3.24) перейдем к линейному относительно переменных и параметров соотношению
. (3.25')
Таким образом, оценивая регрессию между логарифмом у и t, получаем оценку темпа прироста b.
Логарифмируя показательную функцию также получим линейное уравнение
. (3.26)
Замена: , и , имеем:
(3.27)
Преобразования экспоненциальной зависимости y=ea+bx аналогичны показательным (учитывая, что ):
(3.28)
Линейная модель
(3.29)
получается заменой .
После оценки параметров линейных моделей, полученных после соответствующих преобразований, можно вернуться к исходным моделям, используя обратную замену и последующее потенцирование.
Пример 3.3. Решить задачу 3.2. в предположении, что объем потребления товара и уровень дохода семьи в месяц имеют экспоненциальную зависимость.
Решение.
Уравнение зависимости между регрессором х и регрессантом у будем искать в виде экспоненциального уравнения y=ea+bx. После логарифмирования переходим к уравнению (3.28) , или, используя замену , к уравнению (3.29) .
Параметры линейной модели (3.29) будем искать по 1МНК. Для этого составим расчетную таблицу (столбцы 1-6):
Таблица 3.6
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
№ п/п | х | у | х2 | ху* | u | u2 | ||
1 | 0,80 | 0,20 | -1,609 | 0,64 | -1,288 | 0,175 | 0,025 | 0,001 |
2 | 1,03 | 1,00 | 0 | 1,06 | 0,000 | 1,256 | -0,256 | 0,065 |
3 | 0,75 | 0,15 | -1,897 | 0,57 | -1,423 | 0,114 | 0,036 | 0,001 |
4 | 0,95 | 0,66 | -0,416 | 0,90 | -0,395 | 0,632 | 0,028 | 0,001 |
5 | 1,00 | 0,80 | -0,223 | 1,01 | -0,223 | 0,971 | -0,171 | 0,029 |
6 | 0,84 | 0,35 | -1,05 | 0,70 | -0,882 | 0,246 | 0,104 | 0,011 |
7 | 0,99 | 0,74 | -0,301 | 0,97 | -0,298 | 0,891 | -0,151 | 0,023 |
8 | 1,02 | 0,95 | -0,051 | 1,03 | -0,052 | 1,152 | -0,202 | 0,041 |
9 | 0,90 | 0,52 | -0,654 | 0,81 | -0,589 | 0,412 | 0,108 | 0,012 |
10 | 1,01 | 0,83 | -0,186 | 1,01 | -0,188 | 1,058 | -0,228 | 0,052 |
S | 9,28 | 6,20 | -6,388 | 8,70 | -5,337 | 6,905 | -0,705 | 0,235 |
Подставив данные, полученные в первых шести столбцах таблицы в формулы (3.16) и (3.17), получим:
Получим
.
Потенцируя полученное выражение для , получим
или, окончательно,
(3.30)
Определим теоретические значения регрессанта, подставив в функцию (3.30) значения х (столбец 7). Для оценки полученной модели рассчитаем ее остатки (столбцы 8,9). Сравнивая остатки квадратичной модели (пример 3.2) и экспоненциальной модели (пример 3.3) видно, квадратичная модель дает более точную аппроксимацию исследуемого процесса.
Внутренне нелинейные функции требуют особого подхода. Как уже отмечалось, их невозможно привести к линейным с помощью обычных преобразований. Примером внутренне нелинейной модели служит соотношение:
(3.31)
Для оценки параметров такой модели используют итеративные процедуры. Процесс продолжают до тех пор, пока полученная модель не будет удовлетворять некоторому критерию. Как правило, критерием служит минимизация суммы квадратов остатков модели или же процесс прерывается, когда полученная сумма меньше некоторого наперед заданного числа.
Опишем процедуру оценки параметров модели как последовательность шагов:
Шаг 1. На основе априорных рассуждений выбираются некоторые начальные параметры модели.
(3.32)
Шаг 2. Вычисляются теоретические значения непосредственной последовательной подстановкой значений регрессора xi в соотношение (3.32).
Шаг 3. Вычисляется сумма квадратов остатков (СКО) модели . Определим параметр k=1.
Шаг 4. Вносятся некоторые изменения в параметры модели:
. (3.33)
Шаг 5. Определяются теоретические значения из соотношения (3.33).
Шаг 6. Вычисляется СКО
Шаг 7. Если полученное значение S(k) меньше предыдущего, то процесс продолжаем и возвращаемся к шагу 4 (k=k+1). Если же последние изменения параметров модели не привели к уменьшению СКО, то переходим к следующему шагу.
Шаг 8. Делается вывод о минимизации суммы квадратов остатков. В качестве искомой нелинейной эконометрической модели принимается предпоследнее соотношение.
При использовании современных компьютерных программ описанный метод не представляет сложностей, например, при работе в Microsoft Excel определение параметров нелинейной модели можно осуществить с помощью надстройки Поиск решения.
3.4. Проверка адекватности и точности простой модели.
Анализировать экономический процесс и строить прогнозы на основе построенной регрессионной зависимости можно только в случае установления адекватности (соответствия по выбранным критериям) модели рассматриваемому экономическому явлению и достаточной точности этой модели.
Для проверки адекватности модели эмпирическим данным служит оценка остатков модели (, ).
Парную регрессионную модель можно считать адекватной при выполнении следующих условий:
в модели объясняющая переменная Х является величиной неслучайной, а объясняемая переменная Y (а, следовательно, и остаток модели) является величиной случайной;
последовательность остатков модели имеет нормальный закон распределения;
математическое ожидание остатков равно нулю;
значение уровней остатков модели являются независимыми величинами (т.е. каждое следующее значение не зависит от предыдущего).
Рассмотрим проверку выполнения перечисленных условий2.
Проверка случайности остатков модели осуществляется с помощью непараметрических критериев, например, критерий серий и критерий пиков (поворотных точек).
Остановимся на критерии серий, который основан на медиане выборки.
Вначале составляют вариационный, располагая остатки ui в возрастающем порядке. Находят медиану um полученного ряда, (срединное значение при нечетном n и среднюю арифметическую из двух срединных значений при четном n). Дальнейшие рассуждения проводят, занося в таблицу "+", если значение остатка больше медианы и "-", если меньше. В случае равенства остатка медиане клетка не заполняется. Далее определяется длина и количество серий (подряд идущих плюсов или минусов). "Обозначим протяженность самой длинной серии через Kmax, а общее число серий - через n. Выборка признается случайной, если выполняются следующие неравенства для 5%-ного уровня значимости:
(3.34)
где квадратные скобки, как обычно, означают целую часть числа."
Если хотя бы одно из этих неравенств нарушается, то гипотеза о случайном характере отклонений ui отвергается и модель считается неадекватной.
Существуют различные методы проверки соответствия распределения последовательности остатков нормальному закону распределения: метод Вестергарда, RS-критерий и т.д. При достаточно большом количестве наблюдений проверку можно осуществить с помощью критерия согласия Пирсона (подробно рассматривается в курсе математической статистики).
На практике ряды, как правило, не очень велики, в этом случае проверка гипотезы о нормально распределенной величине остатков модели может быть произведена лишь приближенно. Рассмотрим один из самых простых методов анализа последовательности ошибок модели, основанный на исследовании выборочных показателей: асимметрии (g1), эксцесса (g2) и их среднеквадратических ошибок (и соответственно), которые рассчитываются по формулам:
(3.35) | ||
Если одновременно выполняются неравенства (3.36), то нет оснований отвергнуть гипотезу о нормальном распределении остатков.
(3.36) |
Если выполняется хотя бы одно из неравенств (3.36)
(3.37) |
то гипотеза о нормальном характере распределения отвергается, трендовая модель признается неадекватной. Другие случаи требуют дополнительной проверки с помощью более сложных критериев.
Проверка равенства математического ожидания последовательности остатков нулю, если она распределена по нормальному закону, осуществляется на основе критерия Стьюдента (t-критерия) в следующем порядке:
рассчитывается стандартное (среднеквадратическое) отклонение для последовательности остатков:
; (3.38)
в качестве критерия определяем величину
(3.39)
где - среднее арифметическое значение остатков;
задается уровень значимости a (обычно принимают a=0,05 или a=0,01);
по таблице определяется значение tкр= t(a,n-1) с n-1 степенью свободы при заданном уровне значимости a;
если tнабл<tкр, то гипотеза о равенстве математического ожидания ряда остатков нулю принимается, в противном случае эта гипотеза отвергается и модель признается неадекватной.
Проверка независимости значений
Для того чтобы доказать, что значение уровней остатков модели являются независимыми величинами (т.е. доказать отсутствие автокорреляции) можно используя широко известную статистику Дарбина-Уотсона (d), которая определяется следующим образом:
(3.40)
Расчетное значение d сравнивается с табличными значениями dН и dВ критерия Дарбина-Уотсона, определенными при фиксированном уровне значимости a (обычно принимается a=0,05) и зависящим от числа наблюдений n. Это предполагает наличие трех возможностей:
d>dB. Принимается гипотеза об отсутствии автокорреляции, значения остатков можно считать независимыми.
d<dН. Подтверждается наличие положительной автокорреляции, модель считается неадекватной.
dН Ј dЈ dB. Нет достаточных оснований для того, чтобы отклонить или принять гипотезу об отсутствии автокорреляции. Требуются дополнительные исследования.
Если проверка перечисленных выше четырех условий дает положительный результат, то простая регрессионная модель считается адекватной. Для адекватной модели ставится следующая задача – проверка точности модели.
Одной из наиболее эффективных оценок точности модели, мерой качества уравнения регрессии и характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации R2.
Коэффициентом детерминации называется величина
, (3.41)
Величина R2 показывает какая часть вариации регрессанта может быть объяснена вариацией выбранного регрессора и характеризует качество подгонки регрессионной модели к наблюдаемым значениям y. В следующей главе будет показано, что Если , то это означает точную подгонку, между переменными существует линейная связь, все . Если то говорят, что функция регрессии не объясняет ничего. Если , то регрессионное уравнение оценено тем лучше, чем больше при прочих равных условиях R2.
В случае однофакторной линейной регрессии коэффициент детерминации равен квадрату коэффициента корреляции:
R2 = r2 (3.42)
3.5. Прогнозирование по моделям простой регрессии.
Предположим, что нами построена регрессионная модель, доказана ее адекватность и определена точность. Теперь на базе этой модели можно строить различные прогнозы.
Существуют две формы прогнозирования:
интерполяционное (применяют для определения среднего значения объясняемой переменной у при значениях х, расположенных "внутри" ряда эмпирических данных, т.е. между значениями объясняющей переменной, полученным в результате сбора информации);
экстраполяционное (позволяющее определить значения признака за пределами исследуемого ряда эмпирических значений).
Интерполяционное прогнозирование как правило, не составляет труда. Прогнозные значения получают непосредственной подстановкой интересующего нас значения регрессора в построенную модель.
При экстраполяционном прогнозировании делается предположение о сохранении выявленных взаимосвязей факторов и на значения переменных, находящиеся за пределами исследуемого интервала аргументов. Особенно это важно при анализе временных данных. Обычно экстраполяция распространяется на период не превышающий одной трети количества наблюдений.
В процессе прогнозирования можно получить два типа прогнозов: точечный и интервальный.
Точечный прогноз дает значения зависимой переменной, например, , для соответствующего значения из построенной регрессионной модели:
(3.43)
При этом действительное значение регрессанта будет несколько отличаться от полученного теоретического значения. Причиной такого отклонения являются различные случайные факторы. Т.е.
(3.44)
Действительное значение мы не можем найти, а можем лишь оценить его с помощью прогноза (3.46).
Література
Наконечний C.I., Терещенко Т.О., Романюк Т.П. Економетрія: Підручник.- Вид. 2-ге, доповн. та перероб. – К.: КДЕУ, 2000. – 296 с.
Наконечний C.I. та інші. Методичні розробки та вказівки для проведення
Економетрія. Методичні рекомендації до виконання контрольних робіт (для студентів економічних спеціальностей).
Укладачі: Ю.Т.Олійник, О.В.Балко – Макіївка, МЕГІ, 2001. – 22с.
1 Эконометрика: Учебник/ Под ред. И.И.Елисеевой. – М.: Финансы и статистика. 2002. – 344 с.
2 Экономико – математические методы и прикладные модели: Уч. пособие для вузов /В.В.Федосеев, А.Н.Гармаш, Д.М.Дайнтбегов и др.; Под ред. В.В.Федосеева. – М.: ЮНИТИ, 2000. – 391 с.