Всероссийский заочный финансово-экономический институт

Лабораторная работа

по дисциплине «Эконометрика»

Брянск 2010

Задание

В таблице 1 представлены данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 1996г.).

Таблица 1 – Исходные данные

№ п/п

Х1

Х2

Х3

Х4

Х5

Х6

Х7

Х8

У
1

1

1

39

20

8,2

0

1

0

15,9
2

3

1

68,4

40,5

10,7

0

1

0

27
3

1

1

34,8

16

10,7

0

1

12

13,5
4

1

1

39

20

8,5

0

1

12

15,1
5

2

1

54,7

28

10,7

0

1

12

21,1
6

3

1

74,7

46,3

10,7

0

1

12

28,7
7

3

1

71,7

45,9

10,7

0

0

0

27,2
8

3

1

74,5

47,5

10,4

0

0

0

28,3
9

4

1

137,7

87,2

14,6

0

1

0

52,3
10

1

1

40

17,7

11

1

1

8

22
11

2

1

53

31,1

10

1

1

8

28
12

3

1

86

48,7

14

1

1

8

45
13

4

1

98

65,8

13

1

1

8

51
14

2

1

62,6

21,4

11

1

1

0

34,4
15

1

1

45,3

20,6

10,4

1

1

8

24,7
16

2

1

56,4

29,7

9,4

1

1

8

30,8
17

1

1

37

17,8

8,3

0

1

0

15,9
18

3

1

67,5

43,5

8,3

0

1

0

29
19

1

1

37

17,8

8,3

0

1

3

15,4
20

3

1

69

42,4

8,3

0

1

3

28,6
21

1

1

40

20

8,3

0

0

0

15,6
22

3

1

69,1

41,3

8,3

0

1

0

27,7
23

2

1

38,1

35,4

13

1

1

20

34,1
24

2

1

75,3

41,4

12,1

1

1

20

37,7
25

3

1

83,7

48,5

12,1

1

1

20

41,9
26

1

1

48,7

22,3

12,4

1

1

20

24,4
27

1

1

39,9

18

8,1

1

0

0

21,3
28

2

1

68,6

35,5

17

1

1

12

36,7
29

1

1

39

20

9,2

1

0

0

21,5
30

2

1

48,6

31

8

1

0

0

26,4
31

3

1

98

56

22

1

0

0

53,9
32

2

1

68,5

30,7

8,3

1

1

6

34,2
33

2

1

71,1

36,2

13,3

1

1

6

35,6
34

3

1

68

41

8

1

1

12

34
35

1

1

38

19

7,4

1

1

12

19
36

2

1

93,2

49,5

14

1

1

12

46,6
37

3

1

117

55,2

25

1

1

12

58,5
38

1

2

42

21

10,2

1

0

12

24,2
39

2

2

62

35

11

1

0

12

35,7
40

3

2

89

52,3

11,5

1

1

12

51,2
41

4

2

132

89,6

11

1

1

12

75,9
42

1

2

40,8

19,2

10,1

1

1

6

21,2
43

2

2

59,2

31,9

11,2

1

1

6

30,8
44

3

2

65,4

38,9

9,3

1

1

6

34
45

2

2

60,2

36,3

10,9

1

1

12

31,9
46

3

2

82,2

49,7

13,8

1

1

12

43,6
47

3

2

98,4

52,3

15,3

1

1

12

52,2
48

3

3

76,7

44,7

8

1

1

0

43,1
49

1

3

38,7

20

10,2

1

1

6

25
50

2

3

56,4

32,7

10,1

1

1

6

35,2
51

3

3

76,7

44,7

8

1

1

6

40,8
52

1

3

38,7

20

10,2

1

0

0

18,2
53

1

3

41,5

20

10,2

1

1

0

20,1
54

2

3

48,8

28,5

8

1

0

0

22,7
55

2

3

57,4

33,5

10,1

1

1

0

27,6
56

3

3

76,7

44,7

8

1

1

0

36
57

1

4

37

17,5

8,3

0

1

7

17,8
58

2

4

54

30,5

8,3

0

1

7

25,9
59

3

4

68

42,5

8,3

0

1

7

32,6
60

1

4

40,5

16

11

0

1

3

19,8
61

2

4

61

31

11

0

1

3

29,9
62

3

4

80

45,6

11

0

1

3

39,2
63

1

3

52

21,2

11,2

1

1

18

22,4
64

2

3

78,1

40

11,6

1

1

18

35,2
65

3

3

91,6

53,8

16

1

0

18

41,2
66

1

4

39,9

19,3

8,4

0

1

6

17,8
67

2

4

56,2

31,4

11,1

0

1

6

25
68

3

4

79,1

42,4

15,5

0

1

6

35,2
69

4

4

91,6

55,2

9,4

0

1

6

40,8

Принятые в таблице обозначения:

Y – цена квартиры, тыс.долл.;

Х1 – число комнат в квартире;

Х2 – район города (1 – Приморский, Шувалово-Озерки, 2 – Гражданка, 3 – Юго-запад, 4 — Красносельский);

Х3 – общая площадь квартиры (м2);

Х4 – жилая площадь квартиры (м2);

Х5 – площадь кухни (м2);

Х6 – тип дома (1 – кирпичный, 0 — другой);

Х7 – наличие балкона (1 – есть, 0 — нет);

Х8 – число месяцев до окончания срока строительства.

1) Введите фиктивную переменную z, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы: квартиры на севере города (Приморский район, Шувалово-Озерки, Гражданка) и на юге города (Юго-запад, Красносельский район).

2) Составьте матрицу парных коэффициентов корреляции исходных переменных. Вместо переменной х2 используйте фиктивную переменную z.

3) Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в линейной форме. Установите, какие факторы мультиколлинеарны.

4) Постройте модель у = f(х3, х6, х7, х8, z) в линейной форме. Какие факторы значимо воздействуют на формирование цены квартиры в этой модели?

5) Существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?

6) Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия Стьюдента; нулевую гипотезу о значимости уравнения регрессии проверьте с помощью F-критерия Фишера; оцените качество уравнения регрессии с помощью коэффициента детерминации R2.

Решение

1) Введем фиктивную переменную Z вместо Х2, отражающую местоположение квартиры и позволяющую разделить всю совокупность квартир на две группы. Первые 47 квартир относятся к северной части города (Приморский район, Шувалово-Озерки, Гражданка), а оставшиеся 22 квартиры относятся к южной части города (Юго-запад, Красносельский район). Составим матрицу парных коэффициентов корреляции исходных переменных.

Х1

Z

Х3

Х4

Х5

Х6

Х7

Х8

У
1

1

39

20

8,2

0

1

0

15,9
3

1

68,4

40,5

10,7

0

1

0

27
1

1

34,8

16

10,7

0

1

12

13,5
1

1

39

20

8,5

0

1

12

15,1
2

1

54,7

28

10,7

0

1

12

21,1
3

1

74,7

46,3

10,7

0

1

12

28,7
3

1

71,7

45,9

10,7

0

0

0

27,2
3

1

74,5

47,5

10,4

0

0

0

28,3
4

1

137,7

87,2

14,6

0

1

0

52,3
1

1

40

17,7

11

1

1

8

22
2

1

53

31,1

10

1

1

8

28
3

1

86

48,7

14

1

1

8

45
4

1

98

65,8

13

1

1

8

51
2

1

62,6

21,4

11

1

1

0

34,4
1

1

45,3

20,6

10,4

1

1

8

24,7
2

1

56,4

29,7

9,4

1

1

8

30,8
1

1

37

17,8

8,3

0

1

0

15,9
3

1

67,5

43,5

8,3

0

1

0

29
1

1

37

17,8

8,3

0

1

3

15,4
3

1

69

42,4

8,3

0

1

3

28,6
1

1

40

20

8,3

0

0

0

15,6
3

1

69,1

41,3

8,3

0

1

0

27,7
2

1

38,1

35,4

13

1

1

20

34,1
2

1

75,3

41,4

12,1

1

1

20

37,7
3

1

83,7

48,5

12,1

1

1

20

41,9
1

1

48,7

22,3

12,4

1

1

20

24,4
1

1

39,9

18

8,1

1

0

0

21,3
2

1

68,6

35,5

17

1

1

12

36,7
1

1

39

20

9,2

1

0

0

21,5
2

1

48,6

31

8

1

0

0

26,4
3

1

98

56

22

1

0

0

53,9
2

1

68,5

30,7

8,3

1

1

6

34,2
2

1

71,1

36,2

13,3

1

1

6

35,6
3

1

68

41

8

1

1

12

34
1

1

38

19

7,4

1

1

12

19
2

1

93,2

49,5

14

1

1

12

46,6
3

1

117

55,2

25

1

1

12

58,5
1

1

42

21

10,2

1

0

12

24,2
2

1

62

35

11

1

0

12

35,7
3

1

89

52,3

11,5

1

1

12

51,2
4

1

132

89,6

11

1

1

12

75,9
1

1

40,8

19,2

10,1

1

1

6

21,2
2

1

59,2

31,9

11,2

1

1

6

30,8
3

1

65,4

38,9

9,3

1

1

6

34
2

1

60,2

36,3

10,9

1

1

12

31,9
3

1

82,2

49,7

13,8

1

1

12

43,6
3

1

98,4

52,3

15,3

1

1

12

52,2
3

0

76,7

44,7

8

1

1

0

43,1
1

0

38,7

20

10,2

1

1

6

25
2

0

56,4

32,7

10,1

1

1

6

35,2
3

0

76,7

44,7

8

1

1

6

40,8
1

0

38,7

20

10,2

1

0

0

18,2
1

0

41,5

20

10,2

1

1

0

20,1
2

0

48,8

28,5

8

1

0

0

22,7
2

0

57,4

33,5

10,1

1

1

0

27,6
3

0

76,7

44,7

8

1

1

0

36
1

0

37

17,5

8,3

0

1

7

17,8
2

0

54

30,5

8,3

0

1

7

25,9
3

0

68

42,5

8,3

0

1

7

32,6
1

0

40,5

16

11

0

1

3

19,8
2

0

61

31

11

0

1

3

29,9
3

0

80

45,6

11

0

1

3

39,2
1

0

52

21,2

11,2

1

1

18

22,4
2

0

78,1

40

11,6

1

1

18

35,2
3

0

91,6

53,8

16

1

0

18

41,2
1

0

39,9

19,3

8,4

0

1

6

17,8
2

0

56,2

31,4

11,1

0

1

6

25
3

0

79,1

42,4

15,5

0

1

6

35,2
4

0

91,6

55,2

9,4

0

1

6

40,8

2) Проведем корреляционный анализ на выявление зависимости Y от представленных факторов в среде «СтатЭксперт».

Протокол корреляционного анализа

Линейное уравнение регрессии

Главная цель анализа данных состоит в выявлении корреляционной связи зависимой переменной Y с независимыми переменными Хi, а также выявление независимых переменных, имеющих высокий уровень корреляции между собой.

Критическое значение коэффициента корреляции rкр = 0,2002. Это означает, что все коэффициенты корреляции, значения которых меньше rкр принимаются равными нулю, а связь между этими параметрами считается незначимой.

Влияние независимой переменной Х3, Х4, включенной в исследование, имеет высокий уровень (r > 0,7), причем это влияние положительно (rух3 = 0,872, rух4 = 0,917).

Х5 оказывает умеренное положительное влияние на величину Y (rух5 = 0,303).

Х1, Х2, Х6, Х7, Х8 не оказывают влияния на величину Y (rух2 = 0,010, rух6 = = -0,104, rух7 = 0,119, rух8 = -0,005).

3) Построим уравнение регрессии, характеризующее зависимость цены от всех факторов, в линейной форме.

Линейная регрессия

Линейное уравнение регрессии

Уравнение будет иметь вид:

у(х) = -0,505 – 0,966х1 + 0,824х2 + 0,390х3 + 0,191х4 + 0,091х5 + 5,835х6 + 1,244х7 – 0,011х8

Линейная или близкая к ней связь между факторами называется мультиколлинеарностью. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,7.

Рассмотрим матрицу парных коэффициентов корреляции между факторами Хj, включенными в дальнейшем анализ.

Матрица парных корреляций

Линейное уравнение регрессии

Явление сильной коллинеарности наблюдается между факторами:

Х1 и Х3, т.к. rх1х3 = 0,872 > 0,7

Х1 и Х4, т.к. rх1х4 = 0,917 > 0,7

Х3 и Х4, т.к. rх3х4 = 0,966 > 0,7

4) Построим модель у = f (х3, х6, х7, х8, z) в линейной форме.

Линейное уравнение регрессии

Результаты регрессионного анализа

Линейное уравнение регрессии

Модель в линейной форме будет иметь вид:

у(х) = -5,64 + 0,715х2 + 0,475х3 + 6,786х6 + 1,284х7 – 0,037х8

Х6 (тип дома), значимо воздействует на формирование цены квартиры в модели.

5) Оценим статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения регрессии проверим с помощью F-критерия; оценим качество уравнения регрессии с помощью коэффициента детерминации R2.

Характеристика остатков линейной регрессии

Характеристика

Значение
Среднее значение

0,000
Дисперсия

10,579
Приведенная дисперсия

12,220
Средний модуль остатков

2,237
Относительная ошибка

7,144
Критерий Дарбина-Уотсона

1,154
Коэффициент детерминации

0,991
F — значение ( n1 = 8, n2 = 58)

764,697
Критерий адекватности

36,993
Критерий точности

47,492
Критерий качества

44,867
Уравнение значимо с вероятностью 0.95

Коэффициент детерминации показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 99,1% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Табличное значение F-критерия (Fкрит) при доверительной вероятности 0,95 при n1 = 8 и n2 = 58 составляет 2,10. Проверка гипотезы о значимости уравнения регрессии проводится на основании:

если Fфакт > Fкрит, то модель статистически значима;

если Fфакт < Fкрит, то модель статистически незначима.

Fфакт > Fкрит, значит модель статистически значима, т.е. пригодна к использованию.

Оценим с помощью t-критерия Стьюдента статистическую значимость коэффициентов уравнения регрессии.

Табличное значение t-критерия при 5% уровне значимости и степени свободы k = 69-8-1 = 60 составляет 2,0003.

Если tрасч > tтабл, то коэффициент статистически значим.

Характеристика модели

Коэффициенты

Стандартная ошибка

t-статистика
Y-пересечение

-6,10491

1,867676003

-3,268720937
Переменная Х 1

-0,16426

1,096321271

-0,149825399
Переменная Х 2

0,744173

0,335026167

2,221237839
Переменная Х 3

0,36827

0,092869614

3,965447278
Переменная Х 4

0,147869

0,132602783

1,115126788
Переменная Х 5

0,177213

0,195399452

0,906925347
Переменная Х 6

6,93635

0,869661345

7,975921084
Переменная Х 7

1,777648

1,124095736

1,581402513
Переменная Х 8

-0,04802

0,072432334

-0,662966567

tb0 = 3,2687 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb1 = 0,1498 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb2 = 2,2212 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb3 = 3,9654 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb4 = 1,1151 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb5 = 0,9069 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb6 = 7,9759 > 2,0003 => коэффициент регрессии b0 статистически значим;

tb7 = 1,5814 < 2,0003 => коэффициент регрессии b0 статистически незначим;

tb7 = 0,6630 < 2,0003 => коэффициент регрессии b0 статистически незначим;

6) существует ли разница в ценах на квартиры, расположенных в северной и южной частях Санкт-Петербурга?

tb2 = 2,2212 > 2,0003, tb3 = 3,9654 > 2,0003 и tb6 = 7,9759 > 2,0003,

значит факторы Х2 (район города), Х3 (общая площадь квартиры) и Х6 (тип дома) значимо влияют на формирование цен на квартиры.

Анализ показал, что разница в ценах на квартиры, расположенные в северной и южной частях Санкт-Петербурга существенна, т.к. tb2 = 2,2212 > 2,0003.