КОНТРОЛЬНАЯ РАБОТА
ПО ДИСЦИПЛИНЕ
«Математическая статистика»
Задания к контрольной работе
1. Генеральная совокупность. Выборка. Объем выборки. Среднее значение. Дисперсия. Среднеквадратическое отклонение.
2.
Найти коэффициент
эластичности
для указанной
модели в заданной
точке X.
Сделать экономический
вывод. Модель
:
;
X = 4;
3. Для представленных данных выполнить следующее задание:
3.1 Провести эконометрический анализ линейной зависимости показателя от первого фактора. Сделать прогноз для любой точки из области прогноза, построить доверительную область. Найти коэффициент эластичности в точке прогноза.
3.2 Провести эконометрический анализ нелинейной зависимости показателя от второго фактора, воспользовавшись подсказкой. Сделать прогноз для любой точки из области прогноза, построить доверительную область. Найти коэффициент эластичности в точке прогноза.
3.3 Провести эконометрический анализ линейной зависимости показателя от двух факторов. Сделать точечный прогноз для любой точки из области прогноза. Найти частичные коэффициенты эластичности в точке прогноза.
Производительность труда, фондоотдача и уровень рентабельности по хлебозаводам области за год характеризуются следующими данными:
№ завода | Фактор |
Уровень рентабельности, % |
|
Фондоотдача, грн | Производительность труда, грн | ||
1 | 38,9 | 3742 | 10,7 |
2 | 33,3 | 2983 | 11,3 |
3 | 37,7 | 3000 | 12,2 |
4 | 31,1 | 2537 | 12,4 |
5 | 29,4 | 2421 | 10,9 |
6 | 37,2 | 3047 | 11,3 |
7 | 35,6 | 3002 | 11,1 |
8 | 34,1 | 2887 | 14,0 |
9 | 16,1 | 2177 | 6,8 |
10 | 22,8 | 2141 | 7,1 |
11 | 21,7 | 2005 | 8,9 |
12 | 26,8 | 1843 | 4,2 |
13 | 23,3 | 2031 | 7,4 |
14 | 24,5 | 2340 | 11,4 |
15 | 19,9 | 1933 | 4,8 |
Нелинейную
зависимость
принять
1. Генеральная совокупность. Выборка. Объем выборки. Среднее значение. Дисперсия. Среднеквадратическое отклонение
Генеральная совокупность - вся изучаемая выборочным методом статистическая совокупность объектов и/или явлений общественной жизни, имеющих общие качественные признаки или количественные переменные.
Выборочная совокупность (выборка)- часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение о всей генеральной совокупности.
Для того, чтобы заключение, полученное путем изучения выборки , можно было распространить на всю генеральную совокупность выборка должна обладать свойством репрезентативности.
Объем выборки - общее число единиц наблюдения в выборочной совокупности. Определение объема выборки представляет собой один из основных этапов ее формирования. Объем выборки для генеральной совокупности обозначается– N, для выборки – n.
Среднее значение выборки можно вычислить по формуле:
Дисперсия (от лат. dispersio - рассеяние), в математической статистике и теории вероятностей, наиболее употребительная мера рассеивания, т. е. отклонения от среднего. Дисперсия вычисляется по формуле:
- простая
дисперсия,
- взвешенная
дисперсия.
Дисперсия
есть средняя
величина квадратов
отклонений.
Для этого достаточно
извлечь из
дисперсии
корень второй
степени, получится
среднее квадратическое
отклонение
().
или
.
Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности.
2. Найти коэффициент эластичности для указанной модели в заданной точке X. Сделать экономический анализ
Известно, что коэффициент эластичности показывает, на сколько процентов изменится в среднем результат, если фактор изменится на 1 %. Формула расчета коэффициента эластичности:
Э
= f′(x)X/Y,
где f′(x) – первая производная, характеризующая соотношение прироста результата и фактора для соответствующей формы связи.
,
.
Следовательно получим следующее математическое выражение
.
При заданном значении X=4 получим, что коэффициент эластичности равен Э=0,25.
Допустим,
что заданная
функция
определяет
зависимость
спроса от цены.
В этом случае
с ростом цены
на 4% спрос повысится
в среднем на
0,25 %.
3. Производительность труда, фондоотдача и уровень рентабельности по хлебозаводам области за год характеризуются следующими данными:
№ завода | Фактор |
Уровень рентабельности, % |
|
Фондоотдача, грн | Производительность труда, грн | ||
1 | 38,9 | 3742 | 10,7 |
2 | 33,3 | 2983 | 11,3 |
3 | 37,7 | 3000 | 12,2 |
4 | 31,1 | 2537 | 12,4 |
5 | 29,4 | 2421 | 10,9 |
6 | 37,2 | 3047 | 11,3 |
7 | 35,6 | 3002 | 11,1 |
8 | 34,1 | 2887 | 14,0 |
9 | 16,1 | 2177 | 6,8 |
10 | 22,8 | 2141 | 7,1 |
11 | 21,7 | 2005 | 8,9 |
12 | 26,8 | 1843 | 4,2 |
13 | 23,3 | 2031 | 7,4 |
14 | 24,5 | 2340 | 11,4 |
15 | 19,9 | 1933 | 4,8 |
Нелинейную
зависимость
принять
Последовательность выполнения задания 3
1. Вводим данные .Определяем основные числовые характеристики.
2. Строим диаграмму рассеивания (корреляционное поле).
3. Определяем тесноту линейной связи по коэффициенту корреляции.
4. Строим линейную модель вида у = bо + b1*х.
5. Определяем общее качество модели по коэффициенту детерминации R2. Проверяем полученную модель на адекватность по критерию Фишера
6. Проверяем статистическую значимость коэффициентов модели.
7. По полученной модели рассчитываем значение показателя Y для всех точек выборки и в точке прогноза (точку прогноза выбираем произвольно из области прогноза).
8. Рассчитаем полуширину доверительного интервала d. =
9. Рассчитаем доверительный интервал для всех точек выборки и в точке прогноза: (Y-d, Y +d).
10. Рассчитываем коэффициент эластичности:
Для линейной
модели y’х
= b1. Получим
, где у(х) - рассчитанное
по модели значение
показателя.
11. Строим, используя «Мастер диаграмм», корреляционное поле, график эластичности и доверительную область.
12. Делаем лист с формулами.
Решение 1:
1. Вводим данные. Определяем основные статистики. Строим корреляционное поле. По виду корреляционного поля выдвигаем гипотезу о нелинейной зависимости между X и Y.
2. С помощью
формул перехода
линеаризуем
нелинейную
модель:
, V=у. Получаем
линейную модель
относительно
новых переменных
V = b0 + b1u
3. Рассчитываем основные числовые характеристики X, Y, V, U с помощью «Мастера функций» и функции «Описательная статистика».
4. Продолжим регрессионный анализ с помощью вкладки «Анализ данных» и функции «Регрессия».
5. Вычислим значения V(U),V min, V max.
6. Рассчитаем полуширину доверительного интервала d .
7. По формулам обратного перехода пересчитываем значения Y, Ymin (левая граница доверительного интервала»,Ymaх(правая граница доверительного интервала).
8. Рассчитываем коэффициент эластичности
,
9. Строим доверительные области V(U) и Y(х) и график эластичности.
10. Делаем лист с формулами.
Решение 2:
1. Вводим данные.
2. Определяем основные статистики.
3. По корреляционной таблице проверяем факторы на коллинеарность.
4. Строим линейную модель вида y = b0+b1х+b2х.
5. Определяем общее качество модели по коэффициенту детерминации R2. Проверяем полученную модель на адекватность по критерию Фишера.
6. Проверяем статистическую значимость коэффициентов модели.
7. По полученной модели рассчитываем значения показателя Y для всех точек выборки и в точке прогноза(точку прогноза выбрали произвольно из области прогноза).
8. Рассчитываем частичные коэффициенты эластичности:
- по фактору X1
- по фактору Х2
4. Экономический анализ
Обозначим Фондоотдачу (грн.) – Х, Уровень рентабельности (%) – Y. Найдем основные числовые характеристики.
Объем выборки n=15 суммарное количество наблюдений.
Фондоотдача изменяется от 16,1 до 38,9 грн., уровень рентабельности изменяется от 4,2 до 14%.
Среднее значение фондоотдачи составляет 28,83 грн, среднее значение уровня рентабельности составляет 9,63%.
Среднее
значение можно
вычислить по
формуле:
.
Дисперсия
.
Среднеквадратическое
отклонение
7,23,
значит среднее
отклонение
фондоотдачи
от среднего
значения, составляет
7,23 грн.,
2,92, значит среднее
отклонение
уровня рентабельности
от среднего
значения, составляет
2,92%.
Определим, связаны ли X и У между собой, и, если да, то определить формулу связи.
По таблице
строим корреляционное
поле (диаграмму
рассеивания)
- нанесем точки
(X, Y) на
график. Точка
с координатами
()
=(28,83;9.63) называется
центром рассеяния.
По виду корреляционного поля можно предположить, что зависимость между Y и X линейная.
Для определения тесноты линейной связи найдем коэффициент корреляции (из таблицы регрессионная статистика):
.
Так как
,
то линейная
связь между
X и Y
достаточная.
Пытаемся
описать связь
между X и
Y зависимостью
.
Параметры
находим по
методу наименьших
квадратов.
Так как
,
то зависимость
между X и
Y прямая:
с ростом фондоотдачи
уровень рентабельности
повышается.
Проверим значимость
коэффициентов
.
Значимость коэффициента может быть проверена с помощью критерия Стьюдента:
.
Значимость
равна
.
Это меньше 5%.
Коэффициент
статистически
значим.
.
Значимость
равна
,
что практически
равно 0%. Это меньше
5%. Коэффициент
статистически
значим.
Проверим
модель на
адекватность.
Проанализировав
таблицу Дисперсионный
анализ можно
сказать, разброс
данных, объясняемый
регрессией
.
Остатки, необъясненный
разброс
.
Общий разброс
данных
.
Коэффициент
детерминации
.
Разброс данных
объясняется
на 50,49% линейной
моделью и на
49,51% - случайными
ошибками.
Проверим
модель с помощью
критерия Фишера.
Для проверки
найдем величины:
и
.
Вычисляем
и
.
Находим наблюдаемое
значение критерия
Фишера
.
Значимость
этого критерия
,
т.е. процент
ошибки практически
равен 0%, что меньше
чем 5%. Модель
считается
адекватной
с гарантией
более 95%.
Найдем прогноз.
Примем за точку прогноза значение фондоотдачи 33 грн.
Рассчитываем прогнозные значения по модели для всех точек выборки и для точки прогноза:
.
Построим доверительную область для точки прогноза и всех точек.
Найдем полуширину доверительного интервала в каждой точке выборки:
,
где
- среднеквадратическое
отклонение
выборочных
точек от линии
регрессии;
;
критическая
точка распределения
Стьюдента для
надежности
и
;
.
Прогнозируемый
доверительный
интервал для
любого x
такой
,
где
,
т.е. доверительный
интервал для
составит от
6,0157 до 15,6503 с гарантией
95%., т.е. при фондоотдаче
33 грн. Уровень
рентабельности
составит от
6,0157% до 15,6503%.
Найдем эластичность.
Для линейной
модели
Коэффициент эластичности показывает, что при изменении фондоотдачи на 1% уровень рентабельности увеличится с 10,83% на 0,876%. Т.е. при увеличении фондоотдачи рентабельность растет.
Задание № 3.2
Обозначим
производительность
труда в расчете
на одного работника
(грн.) – Х, Уровень
рентабельности
(%) – Y. Построим
нелинейную
зависимость
показателя
от фактора вида
.
Проанализируем
фактор X,
используя
таблицу описательная
статистика.
Производительность труда в расчете на одного работника изменяется от 1843 до 3742 грн. Средняя производительность составляет 2535,27 грн. Отклонение от среднего составляет 546,96.
Определим, связаны ли X и У между собой, и, если да, то определить формулу связи.
По таблице строим корреляционное поле (диаграмму рассеивания) - нанесем точки (X, Y) на график.
По виду корреляционного поля можно предположить, что зависимость между Y и X нелинейная.
Пытаемся
описать связь
между X и
Y зависимостью
.
Перейдем
к линейной
модели. Делаем
линеаризующую
подстановку:
.
Получим новые
данные U
и V. Для этих
данных строим
линейную модель:
.
Проверим тесноту
линейной связи
U и V.
Найдем коэффициент
корреляции
(из таблицы
Регрессионная
статистика):
.Между
U и V
достаточная
связь.
Параметры
находим по
методу наименьших
квадратов.
Значимость коэффициента может быть проверена с помощью критерия Стьюдента:
.
Значимость
равна 0,0021, что
практически
равно 0%. Это меньше
5%. Коэффициент
статистически
значим.
.
Значимость
равна0,00083, что
практически
равно 0%. Это меньше
5%. Коэффициент
статистически
значим.
Получили
линейную модель
.
Проверим
модель на
адекватность.
Проанализировав
таблицу дисперсионный
анализ можно
сказать, разброс
данных, объясняемый
регрессией
.
Остатки, необъясненный
разброс
.
Общий разброс
данных
.
Коэффициент
детерминации
.
Разброс данных
объясняется
на 59,92% линейной
моделью и на
40,08% - случайными
ошибками.
Проверим
модель с помощью
критерия Фишера.
Для проверки
найдем величины:
и
.
Вычисляем
и
.
Находим наблюдаемое
значение критерия
Фишера
.
Значимость
этого критерия
,
т.е. процент
ошибки практически
равен 0%, что меньше
чем 5%. Модель
считается
адекватной
с гарантией
более 95%. Так как
линейная модель
адекватна, то
и соответствующая
ей нелинейная
модель адекватна.
Находим параметры
исходной нелинейной
модели:
;
.
Вид нелинейной
функции:
.
Таким образом,
можно сказать,
что зависимость
уровня рентабельности
от производительности
труда можно
описать следующей
функцией:
.
Найдем прогноз. Примем за точку прогноза значение производительности труда 2500 грн.
Рассчитываем прогнозные значения по модели для всех точек выборки и для точки прогноза: .
.
Построим доверительную область для точки прогноза и всех точек.
Найдем полуширину доверительного интервала в каждой точке выборки:
,
где
- среднеквадратическое
отклонение
выборочных
точек от линии
регрессии;
;
критическая
точка распределения
Стьюдента для
надежности
и
;
.
Прогнозируемый
доверительный
интервал для
любого x
такой
,
где
,
т.е. доверительный
интервал для
составит от
5,35 до 14,03 с гарантией
95%., т.е. при производительности
2500 грн. Уровень
рентабельности
составит от
5,35% до 14,03%.
Для нелинейной
модели найдем
доверительный
интервал,
воспользовавшись
обратной заменой:
.
Совокупность
доверительных
интервалов
для всех X
из области
прогнозов
образует
доверительную
область.
Найдем эластичность.
Для линейной
модели
тогда
.
Коэффициент
эластичности
для точки прогноза:
Коэффициент эластичности показывает, что при увеличении производительности на 1% уровень рентабельности увеличится с 9,69% на 1.1%. Т.е. при увеличении производительности труда рентабельность растет.
Задание № 3.3
Обозначим Фондоотдачу (грн.) – Х1, Производительность труда в расчете на одного работника (грн) – X2, Уровень рентабельности (%) – Y. Построим линейную зависимость показателя от факторов.
Прежде чем
строить модель
проверим факторы
на коллинеарность.
По исходным
данным строим
корреляционную
матрицу. Коэффициент
корреляции
между X1 и
X2 равен
0,87. Так как
,
значит X1
и X2 – неколлинеарные
факторы. Пытаемся
описать связь
между X и
Y зависимостью
.
Параметры
находим по
методу наименьших
квадратов.
.
Проверим
значимость
коэффициентов
.
Значимость коэффициента может быть проверена с помощью критерия Стьюдента:
.
Значимость
равна 0,99, т.е 99% больше
5%. Коэффициент
статистически
незначим.
.
Значимость
равна
,
т.е. 39,6%, что больше
5%. Коэффициент
статистически
незначим.
.
Значимость
равна
,
т.е. 35%, что больше
5%. Коэффициент
статистически
незначим.
Проверим модель на адекватность.
Проанализировав
таблицу дисперсионный
анализ можно
сказать, разброс
данных, объясняемый
регрессией
.
Остатки, необъясненный
разброс
.
Общий разброс
данных
.
Коэффициент
детерминации
.
Разброс данных
объясняется
на 54,11% линейной
моделью и на
45,89% - случайными
ошибками.
Проверим
модель с помощью
критерия Фишера.
Для проверки
найдем величины:
и
.
Вычисляем
и
.
Находим наблюдаемое
значение критерия
Фишера
.
Значимость
этого критерия
,
т.е. процент
ошибки практически
равен 0%, что меньше
чем 5%.
Модель считается адекватной с гарантией более 95%.
Из полученной
модели можно
сделать вывод,
что уровень
рентабельности
от фондоотдачи
и производительности
труда описывается
следующей
зависимостью:
Найдем прогноз.
Примем за точку прогноза значение производительности труда 25000 грн, фондоотдачи 33 грн. Получили при данных условиях уровень рентабельности
Рассчитываем прогнозные значения по модели для всех точек выборки и для точки прогноза:
.
Найдем эластичность по каждому фактору.
Для линейной
модели
,
т.е. при производительности
труда 2500 грн. и
увеличении
фондоотдачи
с 33 грн. на 1% уровень
рентабельности
снижается на
0,4736%.
,
т.е. при фондоотдаче
33 грн и увеличении
производительности
труда с 2500 грн.
на 1% уровень
рентабельности
увеличивается
на 0,5243%.
Значит для увеличения рентабельности целесообразнее увеличивать производительность труда.