1. Администрация страховой компании приняла решение о введении нового вида услуг – страхование на случай пожара. С целью определения тарифов по выборке из 10 случаев пожаров анализируется зависимость стоимости ущерба, нанесенного пожаром от расстояния до ближайшей пожарной станции:
№ п/п1.2.3.4.5.6.7.8.9.10.
Общая сумма ущерба, млн.руб.26,217,831,323,127,536,014,122,319,631,3
Расстояние до ближайшей станции, км3,41,84,62,33,15,50,73,02,64,3
Построить поле корреляции результата и фактора
Поле корреляции результата (общая сумма ущерба) и фактора (расстояние до ближайшей пожарной станции).
На основании поля корреляции можно сделать вывод , что между факторным (Х) и результативным (Y) признаками существует прямая зависимость.
2. Определить параметры а и b уравнения парной линейной регрессии:
где n число наблюдений в совокупности ( в нашем случае 10)
a и b искомые параметры
x и y фактические значения факторного и результативного признаков.
Для определения сумм составим расчетную таблицу из пяти граф, в графе 6 дадим выравненное значение y (?).
В графах 7,8,9 рассчитаем суммы, которые использованы в формулах пунктов 4,5 данной задачи.
Коэффициент регрессии (b) показывает абсолютную силу связи между вариацией x и вариацией y. Применительно к данной задаче можно сказать, что при применении расстояния до ближайшей пожарной станции на 1 км общая сумма ущерба изменяется в среднем на 4,686 млн.руб.
Таким образом, управление регрессии имеет следующий вид:
3. Линейный коэффициент корреляции определяется по формуле:
В соответствии со шкалой Чеддока можно говорить о высокой тесноте связи между y и x,r = 0.957.
Квадрат коэффициента корреляции называется коэффициентом детерминации
Это означает, что доля вариации y объясненная вариацией фактора x включенного в уравнение регрессии равна 91,6%, а остальные 8,4% вариации приходятся на долю других факторов, не учтенных в уравнении регрессии
4. Статистическую значимость коэффициента регрессии «b» проверяем с помощью t-критерия Стьюдента. Для этого сначала определяем остаточную сумму квадратов:
и ее среднее квадратическое отклонение:
Найдем стандартную ошибку коэффициента регрессии по формуле:
Фактическое значение t-критерия Стьюдента для коэффициента регрессии «b» рассчитывается как
Полученное фактическое значение tb сравнивается с критическим tk , который получается по талблице Стьюдента с учетом принятого уровня значимости L=0,05 (для вероятности 0,95) и числа степеней свободы
Полученный коэффициент регрессии признается типичным, т.к.
Оценка статистической значимости построенной модели регрессии в целом производится с помощью F-критерия Фишера
Фактическое значение критерия для уравнения определяется как
Fфакт сравнивается с критическим значением Fк, которое определяется по таблице F-критерия с учетом принятого уровня значимости L=0,05 (для вероятности 0,95) и числа степеней свободы:
Следовательно, при Fфакт>Fк уравнении регрессии в целом признается существенным.
5. По исходным данным полагают, что расстояние до ближайшей пожарной станции
уменьшится на 5% от своего среднего уровня
Следовательно, значения факторного признака для точечного прогноза:
а точечный прогноз :
Строим доверительный интервал прогноза ущерба с вероятностью 0,95 (L=0,05) по формуле
Табличное значение t-критерия Стьюдента для уровня значимости L=0,05 и числа степеней свободы п-2=10-2=8,
Стандартная ошибка точечного прогноза рассчитываемая по формуле
Отсюда доверительный интервал составляет:
Из полученных результатов видно, что интервал от 19,8 до 28,6 млн. руб. ожидаемой величины ущерба довольно широкий. Значительная неопределенность прогноза линии регрессии, это видно из формулы связана прежде всего с малым объемом выборки (n=10), а также тем, что по мере удаления xk от ширина доверительного интервала увеличивается.
Задача 2
Имеются следующие данные о ценах и дивидендах по обыкновенным акциям, также о доходности компании.
№
цена акции лоллар США
доходность капитала %
уровень дивидендов %
1
25
15,2
2,6
2
20
13,9
2,1
3
15
15,8
1,5
4
34
12,8
3,1
5
20
6,9
2,5
6
33
14,6
3,1
7
28
15,4
2,9
8
30
17,3
2,8
9
23
13,7
2,4
10
24
12,7
2,4
11
25
15,3
2,6
12
26
15,2
2,8
13
26
12
2,7
14
20
15,3
1,9
15
20
13,7
1,9
16
13
13,3
1,6
17
21
15,1
2,4
18
31
15
3
19
26
11,2
3,1
20
11
12,1
2
1. построить линейное уравнение множественной регрессии и пояснить экономический смысл его параметров
По Данным таблицы составим систему нормальных уравнений с тремя неизвестными:
Разделим каждое уравнение на коэффициент при a.
Вычтем первое уравнение из второго и третьего
Разделим каждое уравнение на коэффициент при
Сложим оба уравнения и найдем
Таким образом, уравнение множественной регрессии имеет вид
Экономический смысл коэффициентов ив том, что это показатели силы связи, характеризующие изменение цены акции при изменении какого-либо факторного признака на единицу своего измерения при фиксированном влиянии другого фактора. Так, при изменении доходности капитала на один процентный пункт, цена акции измениться в том же направлении на 0,686 долларов; при изменении уровня дивидендов на один процентный пункт цена акции изменится в том же направлении на 11,331 доллара.
2. Рассчитать частные коэффициенты эластичности.
Будем рассчитывать частные коэффициенты эластичности для среднего значения фактора и результата:
Э- эластичность цены акции по доходности капитала
Э- эластичность цены акции по уровню дивидендов
3. Определить стандартизованные коэффициенты регрессии
формулы определения:
4. сделать вывод о силе связи результата с каждым из факторов.
Коэффициенты эластичности факторов говорят о том, что при отклонении величины соответствующего фактора от его средней величины на 1% (% как относительная величина) и при отвлечении от сопутствующего отклонения другого фактора входящего в уравнение множественной регрессии, цена акции отклонится от своего среднего значения на 0,403% при действии фактора (доходность капитала) и на 1,188% при действии фактора (уровень дивидендов).
Таким образом сила влияния фактора на результат (цену акции) больше, чем фактора , а сами факторы действуют в одном и том же положительном направлениии.
Количественно фактор приблизительно в три раза сильнее влияет на результат чем фактор . ()
Анализ уравнения регрессии по стандартизованным коэффициентам показывает, что второй фактор влияет сильнее на результат, чем фактор (), т.е. при учете вариации факторов их влияние более точно.
5. Определить парные и частные коэффициенты корреляции, а также множественный коэффициент корреляции.
Парные коэффициенты корреляции определяются по формулам:
Частные коэффициенты корреляции определяются по ф-ле:
Множественный коэффициент корреляции определяется по формуле:
Матрица парных коэффициентов корреляции
Из таблицы видно, что в соответствии со шкалой Чеддока связь между и можно оценить как слабую, между и - как высокую, между и связь практически отсутствует.
Таким образом, по построенной модели можно сделать вывод об отсутствии в ней мультиколлениарности факторов.
Частные коэффициенты корреляции рассчитывались как оценки вклада во множественной коэффициент корреляции каждого из факторов ( и ). Они характеризуют связи между результативными признаками (ценой акции) и соответствующим фактором x при
Причина различий между значениями частных и парных коэффициентов корреляции состоит в том, что частный коэффициент отражает долю вариации результативного прихнака (цены акции), дополнительно объясняемой при включении фактора (или ) после другого фактора (или ) в уравнение регрессии, не объяснимой ранее включенным фактором (или ).