ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ
ИНСТИТУТ
ЛАБОРАТОРНАЯ РАБОТА ПО ЭКОНОМЕТРИКЕ
Вариант1
Смоленск, 2007
Имеются следующие данные:
№ |
prise |
DEN |
polyamid |
lykra |
firm |
|
Y |
X1 |
X2 |
X3 |
X4 |
1 |
49,36 |
20 |
86 |
14 |
0 |
2 |
22,51 |
20 |
97 |
3 |
1 |
3 |
22,62 |
20 |
97 |
3 |
1 |
4 |
59,89 |
20 |
90 |
17 |
0 |
5 |
71,94 |
30 |
79 |
21 |
0 |
6 |
71,94 |
30 |
79 |
21 |
0 |
7 |
89,9 |
30 |
85 |
15 |
1 |
8 |
74,31 |
40 |
85 |
13 |
1 |
9 |
77,69 |
40 |
88 |
10 |
1 |
10 |
60,26 |
40 |
86 |
14 |
1 |
11 |
111,19 |
40 |
82 |
18 |
0 |
12 |
73,56 |
40 |
83 |
14 |
1 |
13 |
84,61 |
40 |
84 |
16 |
0 |
14 |
49,9 |
40 |
82 |
18 |
1 |
15 |
89,9 |
40 |
85 |
15 |
0 |
16 |
96,87 |
50 |
85 |
15 |
0 |
17 |
39,99 |
60 |
98 |
2 |
1 |
18 |
49,99 |
60 |
76 |
24 |
0 |
19 |
49,99 |
70 |
83 |
17 |
1 |
20 |
49,99 |
70 |
88 |
10 |
1 |
21 |
49,99 |
70 |
76 |
24 |
0 |
22 |
49,99 |
80 |
42 |
8 |
1 |
23 |
129,9 |
80 |
50 |
42 |
0 |
24 |
84 |
40 |
82 |
18 |
0 |
25 |
61 |
20 |
86 |
14 |
0 |
26 |
164,9 |
30 |
16 |
30 |
1 |
27 |
49,9 |
40 |
82 |
18 |
1 |
28 |
89,9 |
30 |
85 |
15 |
1 |
29 |
129,9 |
80 |
50 |
42 |
0 |
30 |
89,9 |
40 |
86 |
14 |
1 |
31 |
105,5 |
40 |
85 |
15 |
1 |
32 |
79,9 |
15 |
88 |
12 |
1 |
33 |
99,9 |
20 |
88 |
12 |
1 |
34 |
99,9 |
30 |
73 |
25 |
1 |
35 |
119,9 |
20 |
85 |
12 |
1 |
36 |
109,9 |
20 |
83 |
14 |
1 |
37 |
59,9 |
20 |
86 |
14 |
0 |
38 |
79,9 |
40 |
82 |
18 |
0 |
39 |
82,9 |
20 |
86 |
14 |
0 |
40 |
111,8 |
40 |
82 |
18 |
0 |
41 |
83,6 |
40 |
82 |
18 |
0 |
42 |
60 |
20 |
86 |
14 |
0 |
43 |
80 |
40 |
82 |
18 |
0 |
44 |
90 |
50 |
76 |
24 |
0 |
45 |
120 |
70 |
74 |
26 |
0 |
Задача состоит в построении линейной модели зависимости цены колготок от их плотности, состава и фирмы-производителя в торговых точках города Москвы и Московской области весной 2006 года.
Цена колготок – это зависимая переменная Y. В качестве независимых, объясняющих переменных были выбраны: плотность (DEN) X1, содержание полиамида X2 и лайкры X3, фирма-производитель X4.
Описание переменных содержится в Таблице 1.1:
Таблица 1.1.
Переменная |
Описание |
№ |
номер торговой точки |
price |
цена колготок в рублях |
DEN |
плотность в DEN |
polyamid |
содержание полиамида в % |
lykra |
содержание лайкры в % |
firm |
фирма-производитель: 0 - Sanpellegrino, 1 - Грация |
Задание:
Рассчитайте матрицу парных коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции. Поясните выбор факторов для включения в модель.
Постройте уравнение регрессии. Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения проверьте с помощью F-критерия; оцените качество уравнения регрессии с помощью коэффициента детерминации .
Постройте уравнение множественной регрессии только со статистически значимыми факторами. Рассчитайте доверительный интервал для каждого наблюдения (уровень значимости примите равным 5%). Результаты п.3 отобразить графически (исходные данные,
Решение.
1.Для проведения корреляционного анализа необходимо выполнить следующие действия:
Данные для корреляционного анализа должны располагаться в смежных диапазонах ячеек.
Выбрать команду Сервис – Анализ данных.
В диалоговом окне анализ данных выберите инструмент Корреляция, а затем щелкнуть на кнопке ОК.
В диалогом окне Корреляция в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные данные(значения Х и У).Если выделены и заголовки столбцов, то установить флажок Метки в первой строке.
Выбрать параметры вывода. ОК.
Матрица парных коэффициентов корреляции.
Анализ матрицы коэффициентов парной корреляции показывает, что фактор Х3(содержание лайкры) оказывает наибольшее влияние на У(цена колготок), т.к.
КПК │rx2x3=-0.67│ < 0.8
значит, мультиколлинеарность отсутствует.
Посмотрим как влияют коэффициенты Х2 и Х3 на У.
│ ryx2= -0.56 │ < │ryx3=0.6│,
следовательно фактор Х3 оказывает большее влияние на У, но в ММР включаем и Х2 и Х3, т.к. Явление МК отсутствует.
2.Для проведения регрессионного анализа выполним:
Команду Сервис – Анализ данных. В диалоговом окне выберем инструмент Регрессия, а затем ОК. В поле Входной интервал У введем адрес значений У из заданной таблицы. В поле Входной интервал Х – адрес значений Х.
Данные регрессионного анализа:
Запишем модель регрессии в линейной форме:
У=104,16 – 0,48Х1 – 0,59Х2 + 2,25Х3 + 7,55Х4
Оценим значимость факторов с помощью Т –критерия Стьюдента, для этого, определим его табличное значение при уровне значимости 0,05.
к =n-m-1=45-4-1=40 t-кр.таб=2.0211
Сравним расчетные значения с табличным по модулю:
│t X1= -2.334│ > t –табл. = 2,021,
следовательно фактор Х1(плотность) является статистически значимым, и статистически значимым признается влияние плотности колготок на их цену.
│t X2= -1,763│< t –табл. = 2,021,
следовательно фактор Х2 – содержание полиамида – является статистически незначимым.
│t X3= 3,269 │> t –табл. = 2,021,
следовательно фактор Х3 – содержание лайкры – является статистически значимым, и статистически значимым признается влияние содержания лайкры в колготках на их цену.
│t X4= 0,966 │< t –табл. = 2,021,
следовательно фактор Х4 – фирма-производитель – является статистически незначимым.
Оценка статистической значимости уравнения регрессии в целом осуществляется по F – критерию Фишера: Fтабл.= 2,61
Так как Fрасч. > Fтабл.(9,59 > 2.61), то уравнение регрессии можно признать статистически значимым (адекватным).
Оценка общего качества уравнения регрессии происходит с использованием коэффициента детерминации.
Так как R=0.489, то 48,9% вариации результативного показателя – цены колготок – объясняется вариацией факторных признаков, включенных в модель регрессии – плотность, содержание лайкры и полиамида, фирмы – производителя.
3.Постройте уравнение множественной регрессии только со статистически значимыми факторами. Рассчитайте доверительный интервал для каждого наблюдения, (уровень значимости примите равным 5%). Укажите торговые точки, в которых цены завышены.
№ |
prise |
DEN |
lykra |
|
Y |
X1 |
X3 |
1 |
49,36 |
20 |
14 |
2 |
22,51 |
20 |
3 |
3 |
22,62 |
20 |
3 |
4 |
59,89 |
20 |
17 |
5 |
71,94 |
30 |
21 |
6 |
71,94 |
30 |
21 |
7 |
89,9 |
30 |
15 |
8 |
74,31 |
40 |
13 |
9 |
77,69 |
40 |
10 |
10 |
60,26 |
40 |
14 |
11 |
111,19 |
40 |
18 |
12 |
73,56 |
40 |
14 |
13 |
84,61 |
40 |
16 |
14 |
49,9 |
40 |
18 |
15 |
89,9 |
40 |
15 |
16 |
96,87 |
50 |
15 |
17 |
39,99 |
60 |
2 |
18 |
49,99 |
60 |
24 |
19 |
49,99 |
70 |
17 |
20 |
49,99 |
70 |
10 |
21 |
49,99 |
70 |
24 |
22 |
49,99 |
80 |
8 |
23 |
129,9 |
80 |
42 |
24 |
84 |
40 |
18 |
25 |
61 |
20 |
14 |
26 |
164,9 |
30 |
30 |
27 |
49,9 |
40 |
18 |
28 |
89,9 |
30 |
15 |
29 |
129,9 |
80 |
42 |
30 |
89,9 |
40 |
14 |
31 |
105,5 |
40 |
15 |
32 |
79,9 |
15 |
12 |
33 |
99,9 |
20 |
12 |
34 |
99,9 |
30 |
25 |
35 |
119,9 |
20 |
12 |
36 |
109,9 |
20 |
14 |
37 |
59,9 |
20 |
14 |
38 |
79,9 |
40 |
18 |
39 |
82,9 |
20 |
14 |
40 |
111,8 |
40 |
18 |
41 |
83,6 |
40 |
18 |
42 |
60 |
20 |
14 |
43 |
80 |
40 |
18 |
44 |
90 |
50 |
24 |
45 |
120 |
70 |
26 |
Эта операция проводится с помощью инструмента анализа данных Регрессия. В диалоговом окне при заполнении параметра входной интервал Х следует указать все столбцы.
Уравнение регрессии в линейной форме:
У = 49,89 – 0,37Х1 + 2,65Х3.
Уравнение статистически значимо. Каждый факторный признак характеризует влияние на общую стоимость колготок.
Для нахождения доверительного интервала воспользуемся формулой:
У = а ± ∆а
У = в ± ∆в
а=49,89; в1= -0,37;в3= 2,65
∆в=mв*tтаб.
Коэффициент Стьюдента для k =42 и уровня значимости 0,05 равен 2,0211.
∆а=9,45
∆в=0,208*2,0211=0,420
∆в3=0,489*2,0211=0,988
Цены завышены во всех точках, кроме точек под номерами 1,2,3,14,17.
4. Представим графически исходные данные:
Представим графически предсказанные значения: