МИНИСТЕРСТВО ОБРАЗОВАНИЯ УКРАИНЫ
ДОНЕЦКАЯ ГОСУДАРСТВЕННАЯ МАШИНОСТРОИТЕЛЬНАЯ АКАДЕМИЯ
КАФЕДРА: ЭКОНОМИКА И ФИНАНСЫ
ЛАБОРАТОРНАЯ РАБОТА
ПО КУРСУ «СТАТИСТИКА»
2008 г.
Выполнение задания начинают с группирования совокупности данных для этого определяют количество групп с равными интервалами и рассчитывают величины интервала.
Величина интервала:
d = (xmax – xmin) / n,
Где
Хmax, Xmin – соответственно максимум и минимум значения сгруппированного признака;
n – число групп.
Границы вариант (групп) определяются путем прибавления минимального значения и величин интервала к минимальному признаку, т.е.
[xmin + (xmin + d)],
Где
Xmin – нижняя граница инт6ервала (Xmin+d) – верхняя граница интервала.
Для следующей варианты (Xmin+d) становятся нижней границей интервала, а верхняя граница на d – больше нижней и т.д. Образовав группы с равными интервалами находят частоту (вес) каждой группы (вариант) т.е. подсчитывают число единиц совокупности входящих в каждую группу при этом необходимо задаться условием: если знание признака у единицы больше совокупности верхней границе интервала то это единица войдет в следующий интервал, т.е. чтобы Xi вошло в соответствующую группу ее значение должно быть в пределах
xmin < xi < (xmin + d)
Для расчета средней и показателей вариации определяют середину интервала (Xi), которая равна полу сумме его нижней и верхней границ.
Xi =[Xmin + (Xmin + d)]/2
Расчет средней и показателей вариации по данным задачи требует применения арифметической средней, так как данные представлены в виде вариант и частот. Вес каждой варианты различен, поэтому расчет производят по средней арифметической взвешенной.
xi = Σxi ∙fi / Σfi,
Где Xi – средняя арифметическая.
Xi – значение варианты определяемого признака (средина интервала).
fi – частота (вес) варианты.
Чтобы вычислить среднюю вначале следует взвесить варианты (перемножить варианты на их частоты (Xi*fi), затем найти сумму их произведений (SXi*fi), сумму частот (Sfi) и поделить сумму произведений вариант на частоты на сумму частот (1)). Расчет дисперсии – производят по формуле:
σ2 = Σ (xi - xi)2 ∙ fi / Σ fi
Следовательно, прежде всего, необходимо найти отклонения вариант от средней (xi - xi), затем возвести их в квадрат ([(xi - xi)2]) квадраты отклонения взвесить [(xi - xi)2 ∙ fi] и просуммировать взвешенные квадраты отклонений [Σ (xi - xi)2 ∙ fi.]. Полученную сумму разделить на сумму частот (2).
Среднее квадратическое отклонение устанавливают извлечением корня квадратного из значения дисперсии
σ = √ σ2
Коэффициент детерминации вычисляется по формуле
η2 = σ2 вн / σ2 об,
Где σ2 вн - внутригрупповая дисперсия.
σ2 об - общая дисперсия.
Эмпирическое корреляционное отношение рассчитывается по формуле
η = √ σ2 вн / σ2 об,
Задача 1.
Имеются следующие данные о рабочих одного из участников механического цеха
Рабочий | Возраст, лет |
Месячная З/П, грн. |
Рабочий | Возраст, лет |
Месячная З/П, грн. |
1 | 25 | 18 |
25 180,00 11 |
24 210,00 |
18 100,00 |
2 | 24 | 37 |
24 210,00 12 |
46 390,00 |
37 280,00 |
3 | 46 | 25 |
46 390,00 13 |
45 320,00 |
25 190,00 |
4 | 45 | 30 |
45 320,00 14 |
42 260,00 |
30 220,00 |
5 | 42 | 26 |
42 260,00 15 |
50 310,00 |
26 210,00 |
6 | 50 | 36 |
50 310,00 16 |
29 240,00 |
36 300,00 |
7 | 29 | 40 |
29 240,00 17 |
36 290,00 |
40 330,00 |
8 | 36 | 28 |
36 290,00 18 |
54 390,00 |
28 240,00 |
9 | 54 | 35 |
54 390,00 19 |
29 250,00 |
35 280,00 |
10 | 29 | 25 |
29 250,00 20 |
25 280,00 |
280,00 |
Для выявления зависимости между возрастом рабочих и оплатой их труда произведите их группировку по возрасту образовав пять групп с равными интервалами.
По каждой группе и совокупности рабочих в целом подсчитайте:
Число рабочих;
Средний возраст;
Среднюю заработную плату;
Результаты представьте в таблице. Проанализируйте показатели и сделайте краткие выводы.
Решение
1.1 Найдем минимальное и максимальное значение варианты данной совокупности
Min = 18 лет;
Мах = 54 лет.
Определим размах вариации:
D = 54 – 18 = 36;
Тогда величина интервала составит:
d = (54 – 18) / 5 = 7 (лет).
Определим границы интервалов (групп) и их середины:
Таблица 1.
№ группы |
Границы интервала |
Середина интервала |
1 |
18–25 | 21,5 |
2 |
25–32 | 28,5 |
3 |
32–39 | 35,5 |
4 |
39–46 | 42,5 |
5 |
46–54 | 49,5 |
1.3 Определим принадлежность каждого рабочего к определенному интервалу (произведем группировку)
В группу 1 (границы: 18 – 25) входят рабочие:
№11 возраст составляет 18 лет с заработной платой 100,00 грн
№2 (возраст = 24 года) с (з/п = 210,00 грн)
№1 (возраст = 25 лет) с (з/п = 180,00 грн)
№13 (возраст = 25 лет) с (з/п = 190,00 грн)
№20 (возраст = 25 лет) с (з/п = 280,00 грн)
Количество человек в 1 ой группе – 5
В группу 2 (границы: 25 – 32) входят рабочие:
№15 (возраст = 26 лет) с (з/п = 210,00 грн)
№18 (возраст = 28 лет) с (з/п = 240,00 грн)
№7 (возраст = 29 лет) с (з/п = 240,00 грн)
№10 (возраст = 29 лет) с (з/п = 250,00 грн)
№14 (возраст = 30 лет) с (з/п = 220,00 грн)
Количество человек во 2 ой группе – 5
В группу 3 (границы: 32 – 39) входят рабочие:
№19 (возраст = 35 лет) с (з/п = 280,00 грн)
№8 (возраст = 36 лет) с (з/п = 290,00 грн)
№16 (возраст = 36 лет) с (з/п = 300,00 грн)
№12 (возраст = 37 лет) с (з/п = 280,00 грн)
Количество человек в 3 й группе – 4
В группу 4 (границы: 39 – 46) входят рабочие:
№17 (возраст = 40 лет) с (з/п = 330,00 грн)
№5 (возраст = 42 года) с (з/п = 260,00 грн)
№4 (возраст = 45 лет) с (з/п = 320,00 грн)
№3 (возраст = 46 лет) с (з/п = 390,00 грн)
Количество человек в 4 й группе – 4
В группу 5 (границы: 46 – 54) входят рабочие:
№6 (возраст = 50 лет) с (з/п = 310,00 грн)
№9 (возраст = 54 года) с (з/п = 390,00 грн)
Количество человек в 5 й группе – 2
1.4 Определим средний возраст работы по каждой группе и по совокупности рабочих в целом
Группа 1 х1 = (18+24+25+25+25) / 5 = 23,4 (года);
Группа 2 х2 = (26+28+29+29+30) / 5 = 28,4 (года);
Группа 3 х3 = (35+36+36+37) / 4 = 36 (лет);
Группа 4 х4 = (40+42+45+46) / 4 = 43,25 (года);
Группа 5 х5 = (50 + 54) / 2 = 52 (года);
По совокупности в целом:
Х = (23,4 · 5 + 28,4 · 5 + 36 · 4 + 43,25 · 4 + 52 · 2) / 20 = 34 (года)
1.5 Определим среднюю заработную плату по каждой группе и по совокупности рабочих в целом
Группа 1 х1 = (100+210+180+190+280) / 5 = 192,00 (грн);
Группа 2 х2 = (210+240+240+240+250+220) / 5 = 280,00 (грн);
Группа 3 х3 = (280+300+290+280) / 4 = 287,50 (грн);
Группа 4 х4 = (330+260+320+390) / 4 = 325,00 (грн);
Группа 5 х5 = (310+390) / 2 = 350,00 (грн);
По совокупности в целом: Х = (192,00 · 5 + 280,00 · 5 + 287,50 · 4 + 325,00 · 4 + 350,00 · 2) / 20 = 236,50 (грн).
Таблица 3. Группировка рабочих по возрасту работы.
№ группы | Границы интервалов | Показатели по каждой группе | Показатели по совокупности в целом | |||
Вес варианты | Средний возраст работы | Средняя заработная плата | Средний возраст работы | Средняя заработная плата | ||
1 |
18–25 | 5 | 23,4 | 192,00 | ||
2 |
25–32 | 5 | 28,4 | 280,00 | ||
3 |
32–39 | 4 | 36 | 287,50 | 34 | 236,50 |
4 |
39–46 | 4 | 43,25 | 325,00 | ||
5 |
46–54 | 2 | 52 | 350,00 |
Выводы: На основании полученных результатов по группировке рабочих по возрасту и проведенных расчетов можно сделать следующие выводы:
– наибольшее количество рабочих имеют возраст в пределах 18 – 25 лет (в среднем 23,4 года) и 25 – 32 лет (в среднем 28,4 года), наименьшее количество рабочих имеют возраст в интервале 46 – 54 года (в среднем 52 года). Средний же возраст работников предприятия составляет 34 года.
– наибольшую среднюю заработную плату имеют рабочие входящие в пятую группу возрастных пределов 46 – 54 года (в среднем 350,00 грн), наименьшую среднюю заработную плату имеют рабочие входящие в первую группу возрастных пределов 18 – 25 лет (в среднем 192,00 грн). Средняя заработная плата работников предприятия составляет 236,50 грн.
Задача 7
По данным задачи 1 для выявления тесноты связи между возрастом рабочих и оплатой труда вычислить коэффициент детерминации.
Решение
Определим дисперсию по каждой группе рабочих и по совокупности в целом:
Группа 1 s 21 = ((18 – 23,4)2 + (24 – 23,4)2 + 3 ∙ (25 – 23,4)2) / 5 = 7,44;
Группа 2 s 22 = ((26 – 28,4)2 + (28 – 28,4)2 + 2 ∙ (29 – 28,4)2 + (30 – 28,4)2) / 5 = 1,84;
Группа 3 s 23 = ((35 – 36)2 + 2 ∙ (36 – 36)2 + (37 – 36)2) / 4 = 0,5;
Группа 4 s 24 = ((40 – 43,25)2 + (42 – 43,25)2 + (45 – 43,25)2 + (46 – − 43,25)2) / 4 = 5,69;
Группа 5 s 25 = ((50 – 52)2 + (54 – 52)2) / 2 = 4.
По совокупности в целом:
s2 = ((21,5 – 34)2 · 5 + (28,5 – 34)2 · 5 + (35,5 – 34)2 · 4 + (42,5 – 34)2 · 4 + (49,5 – 34)2 · 2) / 20 = 85,55.
Определим общую дисперсию
= [(21,5 2 · 5 + 28,52 · 5 + 35,52 · 4 + 42,52 · 4 + 49,52 · 2) / 20] – [(21,5 · 5 + 28,5 · 5 + 35,5 · 4 + 42,5 · 4 + 49,5 · 2) / 20)]2 = 1176,95 – 1092,30 = 84,65.
Задача 2
За отчетный период имеются следующие данные об электровооруженности труда выработке продукции рабочими завода
Рачий | Электровооруженность труда одного рабочего, кВт*ч | Рачий | Электровооруженность труда одного рабочего, кВт*ч |
1 | 24,7 | 11 | 27,4 |
2 | 23,0 | 12 | 26,7 |
3 | 24,0 | 13 | 23,3 |
4 | 28,0 | 14 | 22,1 |
5 | 26,3 | 15 | 25,8 |
6 | 24,3 | 16 | 22,6 |
7 | 24,7 | 17 | 23,6 |
8 | 20,0 | 18 | 25,9 |
9 | 21,4 | 19 | 21,9 |
10 | 25,0 | 20 | 23,8 |
Сгруппируйте рабочих по электровооруженности труда, образовав четыре группы с равными интервалами.
По каждой группе и совокупности рабочих в целом подсчитайте:
Их число;
Среднюю электровооруженность труда;
Дисперсию и среднее квадратическое отклонение;
Коэффициент вариации.
Постройте гистограмму и полигон распределения рабочих. Сделайте вывод.
Решение
Группировка рабочих по электровооруженности труда.
1. Найдем минимальное и максимальное значение варианты данной совокупности по признаку возраста:
Min = 20 кВт·ч;
Мах = 28 кВт·ч.
Опредилим размах вариации:
D =28 – 20=8 (кВт·ч);
Тогда величина интервала составит:
d = (28 – 20) / 4 = 2 (кВт·ч).
2. Определим границы интервалов (групп) и их середины:
Таблица 1
№ группы | Границы интервала | Середина интервала |
1 | 20 – 22 | 21 |
2 | 22 – 24 | 23 |
3 | 24 – 26 | 25 |
4 | 26 – 28 | 27 |
Определим принадлежность каждого рабочего к определенному интервалу (произведем группировку)
В группу 1 (границы: 20 – 22) входят рабочие:
№8 (Электровооруженность труда =20,0 кВт·ч)
№9 (Электровооруженность труда =21,4 кВт·ч)
№19 (Электровооруженность труда = 21,9 кВт·ч)
Количество человек в 1 ой группе = 3
В группу 2 (границы: 22 – 24) входят рабочие:
№2 (Электровооруженность труда = 23,0 кВт·ч)
№13 (Электровооруженность труда = 23,3 кВт·ч)
№14 (Электровооруженность труда = 22,1 кВт·ч)
№16 (Электровооруженность труда = 22,6 кВт·ч)
№17 (Электровооруженность труда = 23,6 кВт·ч)
№20 (Электровооруженность труда = 23,8 кВт·ч)
Количество человек во 2 ой группе = 6
В группу 3 (границы: 24 – 26) входят рабочие:
№1 (Электровооруженность труда = 24,7 кВт·ч)
№3 (Электровооруженность труда = 24,0 кВт·ч)
№6 (Электровооруженность труда = 24,3 кВт·ч)
№7 (Электровооруженность труда = 24,7 кВт·ч)
№10 (Электровооруженность труда = 25,0 кВт·ч)
№15 (Электровооруженность труда = 25,8 кВт·ч)
№18 (Электровооруженность труда = 25,9 кВт·ч)
Количество человек в 3 й группе = 7
В группу 4 (границы: 11 – 13) входят рабочие:
№4 (Электровооруженность труда = 28,0 кВт·ч)
№5 (Электровооруженность труда = 26,3 кВт·ч)
№11 (Электровооруженность труда = 27,4 кВт·ч)
№12 (Электровооруженность труда = 26,7 кВт·ч)
Количество человек в 4 й группе = 4
Определим среднюю электровооруженность труда по каждой группе рабочих в отдельности и по всей совокупности в целом:
Группа 1 х1 = (19,0 + 20,4 + 20,9) / 3 = 20,1 (кВт·ч)
Группа 2 х2 = (22,0 + 22,3 + 21,1 + 21,6 + 22,6 + 22,8) / 6 = 22,1 (кВт·ч);
Группа 3 х3 = (23,7 + 23,0 + 23,3 + 23,7 + 24,0 + 24,8 + 24,9) / 7 = 23,9
(кВт·ч);
Группа 4 х4 = (27,0 + 25,3 + 26,4 + 25,7) / 4 = 26,1 (кВт·ч).
По совокупности в целом:
Х = (20 · 3 + 22 · 6 + 24 · 7 + 26 · 4) / 20 = 23,2 (кВт·ч)
Определим дисперсию по каждой группе рабочих в отдельности и по всей совокупности в целом:
Группа 1 s 21 = ((19,0 – 20,1)2 + (20,4 – 20,1)2 + (20,9 – 20,1)2) / 3 = 0,65.
Группа 2 s 22 = ((22,0 – 22,1)2 + (22,3 – 22,1)2 + (21,6 – 22,1)2 + (21,1 –
-22,1)2 + (22,6 – 22,1)2 + (22,8 – 22,1)2) / 6 = 0,34.
Группа 3 s 23 = ((23,7 – 23,9)2 + (23 – 23,9)2 + (23,3 – 23,9)2 + (23,7 – 23,9)2
+ (24,0 – 23,9)2+ (24,8 – 23,9)2 + (24,9 – 23,9)2) / 7 = 0,44.
Группа 4 s 24 = ((27,0 – 26,1)2 + (25,3 – 26,1)2 + (26,4 – 26,1)2 + (25,7 –
26,1)2) / 4 = 0,42.
По совокупности в целом:
s2 = ((20 – 23,2)2 ·3+ (22 – 23,2)2 · 6+ (24 – 23,2)2 · 7+ (26 – 23,2)2 · 4) / 20 =3,76
Определим среднее квадратическое отклонение по каждой группе рабочих в отдельности и по всей совокупности в целом:
Группа 1 s1 = Ц0,65= 0,8. (кВт·ч)
Группа 2 s2 = Ц0,34 = 0,58 (кВт·ч)
Группа 3 s3 = Ц0,44 = 0,66 (кВт·ч)
Группа 4 s4 = Ц0,42 = 0,65 (кВт·ч)
По совокупности в целом:
s = Ц3,76 = 1,94 (кВт·ч).
Определим коэффициент вариации по каждой группе рабочих в отдельности и по всей совокупности в целом:
Группа 1 v1 = 0,8 / 20,1 = 0,040 (4,0%).
Группа 2 v2 = 0,58 / 22,1 = 0,026 (2,6%).
Группа 3 v3 = 0,66 / 23,9 = 0,028 (2,8%).
Группа 4 v4 = 0,65 / 26,1 = 0,025 (2,5%).
По совокупности в целом:
V = 1,94 / 23,2 = 0,084 (8,4%).
Таблица 1. Группировка рабочих по электровооруженности труда
Границы интервалы | Середина интервала | Вес варианты | Показатели по каждой группе | |||
Средняя электровооруженность труда. | Дисперсия | Ср. квад. отклонение | Коеффициент вариации % | |||
19 – 21 | 20 | 3 | 20,1 | 0,65 | 0,8 | 4,0 |
21 – 23 | 22 | 6 | 22,1 | 0,34 | 0,58 | 2,6 |
23 – 25 | 24 | 7 | 23,9 | 0,44 | 0,66 | 2,8 |
25 – 27 | 26 | 4 | 26,1 | 0,42 | 0,65 | 2,5 |
Выводы
На основании полученных результатов по группировке рабочих по электровооруженности труда и проведенных расчетов можно сделать следующие выводы:
– наибольшее количество рабочих имеют электровооруженности труда в пределах 23–25 кВт·ч (в среднем 24 кВт·ч), наименьшее количество рабочих имеют электровооруженности труда в интервале 19 – 21 кВт·ч (в среднем 20 кВт·ч). Средняя электровооруженности труда работников предприятия составляет 23,2 кВт·ч.
– в среднем отклонение от средней электровооруженности труда работников как в сторону увеличения, так и в сторону уменьшения составляет 1,94 кВт·ч, что составляет 8,4%.
Лабораторная работа №2
Расчет средней и показателей по данным сгруппированного массива
Цель – научиться производить расчеты на ЭВМ по данным интервального вариационного ряда. Рассчитать среднюю, среднее квадратическое отклонение. Построить полигон и гистограмму. Проанализировать полученные данные.
Расчет средней, дисперсии и среднего квадратического отклонение производя по формулам (1) и (3). Однако в качестве вариант в задачах приведены так называемые «открытые» варианты. В начале следует закрыть варианты, а затем, найдя полу сумму интервалов, ввести их в программу в виде усредняемых значений признака xi и fi – частоты повторения каждой варианты.
Среднее линейное отклонение L – есть средняя арифметическая из абсолютных значений отклонений вариант от средней и определяется по формуле:
L=(S(Xi-X)*fi)/Sfi
Согласно формуле в начале находят абсолютные отклонения каждой варианты от средней ((Xi-X), а затем каждое абсолютное отклонение взвешивают ((Xi-X)*fi), суммируют взвешенные абсолютные отклонения (S(Xi-X)*fi) и это суммы делят на сумму частот (Sfi).
Задача 1
В целях изучения норм расхода сырья на единицу продукции из партий изделий проведена двухпроцентная механическая выборка, в результате которой получена двухпроцентная механическая выборка, в результате которой получено следующее распределение
Расход сырья, г | Изготовлено изделий, шт. |
До 20 | 25 |
20–22 | 32 |
22–24 | 67 |
24–26 | 37 |
Свыше 26 | 24 |
Итого | 185 |
Определите:
средний расход сырья на одно изделие;
дисперсию и среднее квадратическое отклонение;
среднее линейное отклонение;
коэффициент вариации.
Решение предоставьте в таблице. Поясните значение исчисленных
показателей.
Решение
Для упрощения решения представим его в виде таблицы и для нахождения средней и дисперсии воспользуемся способом моментов:
Расход сырья на 1 цу изделия, г. | Изготовленно изделий, шт. | Середина интервала. | |Х-Х|·f | (X – A) |
(X – A) i |
(Х – А)·f i |
(Х – А) 2 i2 |
(X – A) 2 ·f i2 |
До 20 | 25 | 19 | 100 | -4 | -2 | -50 | 4 | 100 |
20 – 22 | 32 | 21 | 64 | -2 | -1 | -32 | 1 | 32 |
22 – 24 | 67 | 23 | 0 | 0 | 0 | 0 | 0 | 0 |
24 – 26 | 37 | 25 | 72 | 2 | 1 | 37 | 1 | 37 |
Свыше 26 | 24 | 27 | 96 | 4 | 2 | 48 | 4 | 96 |
Итого | 185 |
е |Х-Х| · f= 332 |
е(X-A) ·f/ i = 3 |
е((X – A) / i) 2·f = 265 |
1. Для нахождения средней и дисперсии воспользуемся способом моментов: Х=m1 · i +A; s2 = i 2 (n ·(m2 – m1 2);
m1= е((X – A) ·f / i))/еf; m2= е((X – A) / i) 2·f)/еf;
где
m1, m2 – соответственно моменты первого и второго порядка;
i – величина интервала;
А – варианта, имеющая наибольшую частоту;
F – значение весов или частот каждой варианты.
Наиболее частото встречаются изделия с расходом сырья на единицу продукции =23 г. Значит А=23 (г.).
Определим величину интервала (визуально видно, что интервалы имееют равную величину):
I=22–20=24–22=26–24=2 (г.)
На основании расчетов представленных в таблице найдем Х и s2:
Х= (3/185) · 2 + 23=23,03 (г.)
s2 = 4 · ((265/185) – (3/185) 2)= 4 · (1,43 – 0)=5,72
Найдем среднее квадратическое отклонение:
s=√5,72=2,39 (г.)
2. Определим среднее линейное отклонение:
L= 332/185=1,79 (г.)
3. Определим коэффициент вариации:
V=1,79/23,03=0,078 (7,8%).
Вывод
На основании проведенных расчетов можно сделать следующие выводы:
– средний расход сырья на единицу изделия равен ≈ 23 г.
– среднее квадратическое отклонение показывает, что возможно отклонение от среднего расхода сырья на единицу продукции как в сторону увеличения, так и в сторону уменьшения на 2,39 г., что составляет 7,8% (см. коэффициент вариации).
– среднее линейное отклонение также показывает возможное отклонение от среднего расхода сырья на единицу продукции как в сторону увеличения, так и в сторону уменьшения, но менее точно, чем среднее квадратическое отклонение, и составляет 1,79 г.
Лабораторная работа №3
Расчет внутри групповой и межгрупповой дисперсии. Правило сложения дисперсий
Цель – изучить элементы дисперсионного анализа. Получить практические навыки производства на ЭВМ трудоемких расчетов показателей внутригрупповой, межгрупповой дисперсий для различного количества групп. Произвести расчет корреляционного отношения.
Проверить правило сложений дисперсий. Приобрести навыки анализа и практического применения этих показателей.
Выполнение задания предусматривает расчет показателей, характеризующих случайную и систематическую вариации и их роли в общей вариации. Эти показатели широко используются на производстве при количественной оценке влияния различных факторов на те или иные показатели, осуществляемой с помощью дисперсионного анализа.
Общая дисперсия рассматривалась при выполнение заданий 1 и 2. Она характеризует общую вариацию под влиянием всех причин, ее вызывающих и исчисляется по формуле (3).
Для оценки влияния группировочного признака (постоянного фактора) на величину вариаций рассчитывают межгрупповую дисперсию, исчисляемую на основании групповых средних:
UІ =(S(Xi-X)І *fi)/Sfi (1)
UІ – межгрупповая дисперсия;
Xi – групповые средние исчисляются по формуле (1)
X – общее среднее (также исчисляется по формуле (1)
fi – групповые частоты.
При оценке влияния случайных факторов и их роли в общей вариации определяют внутригрупповую дисперсию. Она исчисляется как средняя арифметическая из групповых дисперсий.
s І =(Ss І i *fi)/Sfi (2)
sІ – внутригрупповая (средняя из групповых) дисперсия;
sІ – групповые дисперсии (исчисляются по формуле (2)).
В математической статистика доказано, что общая дисперсия sІ равна сумме внутригрупповой и межгрупповой дисперсий, т.е.
sІ = sІ +UІ
Исходя из этого правила, можно определить влияние случайной и систематической дисперсий на общую дисперсию, установить тесноту связи между признаками. Для этого применяется в дисперсионном анализе корреляционное отношение ν:
ν=s /х
Задача 2
Имеются следующие данные о распределении рабочих по возрасту работы двух заводов и объединения
Возраст работы, лет | Количество рабочих | ||
Завод 1 | Завод 2 | Объединение | |
До 5 лет | 67 | 32 | 99 |
5–10 | 125 | 77 | 202 |
10–15 | 162 | 119 | 281 |
15–20 | 89 | 70 | 159 |
Свыше 20 | 42 | 37 | 79 |
Определите:
средний возраст работы одного рабочего по каждому заводу и по объединению в целом;
дисперсию для каждого завода (внутригрупповую) и для объединения в целом (общую);
среднюю из внутригрупповых дисперсий;
межгрупповую дисперсию;
корреляционное отклонение.
Проверьте правило сложения дисперсий. Поясните сущность исчисленных показателей.
Решение
1. Определим средний возраст работы одного рабочего по каждому заводу и по объединению в целом.
Так как нам дан интервальный ряд с равными интервалами, то определим сначала середины интервалов и полученные данные занесем в таблицу.
Таблица 1
Возраст работы, лет. | Середина интервала. | Количество рабочих. | ||
Завод 1 | Завод 2 | Объединение. | ||
До 5 | 2,5 | 67 | 32 | 99 |
5 – 10 | 7,5 | 125 | 77 | 202 |
10 – 15 | 12,5 | 162 | 119 | 281 |
15 – 20 | 17,5 | 89 | 70 | 159 |
Свыше 20 | 22,5 | 42 | 37 | 79 |
Итого | 485 | 335 | 820 |
Средний возраст работы одного рабочего на заводе 1:
Х1 = (2,5 · 67 + 7,5 · 125 + 12,5 · 162 + 17,5 · 89 + 22,5 · 42)/485=11,6 (лет).
Средний возраст работы одного рабочего на заводе 2:
Х2 = (2,5 · 32 + 7,5 · 77 + 12,5 · 119 + 17,5 · 70 + 22,5 · 37)/335=12,5 (лет).
Средний возраст работы одного рабочего на объединении в целом:
Х =(2,5 · 99 + 7,5 · 202 + 12,5 · 281 + 17,5 · 159 + 22,5 · 79)/820=12,0 (лет).
2. Определим дисперсию для каждого завода в отдельности (внутригрупповую) и по объединению в целом:
Дисперсия на заводе 1:
s2 1= ((2,5–11,6) 2 · 67 + (7,5–11,6) 2 · 125 +(12,5–11.6) 2 · 163 + (17,5 –11,6)2· 89 + (22,5–11,6) 2 · 42)/485=32,72;
Дисперсия на заводе 1:
s22=((2,5–12,5) 2 · 32 + (7,5–12,5) 2· 77 + (12,5–12,5) 2 ·119 + (17,5–12,5) 2· 70+ (22,5–12,5) 2 · 37)/335=31,57
Дисперсия по объединению в целом (общую дисперсию):
u 2=((2,5–12.0) 2 · 99 + (7,5–12,0) 2 · 202 + (12,5–12,0) 2 · 281 + (17,5–12,0) 2 ·159 + (22,5–12,0) 2 · 79)/820=32,46
3. Определим среднюю из внутригрупповых дисперсий:
s2 =(32,72+31,57) /2=32,15
4. Определим межгрупповую дисперсию:
s2 = ((11,6–12,0) 2 ·485 +(12,5–12,0) 2 ·335)/820=0,20
5. Определим среднее квадратическое отклонение для каждого завода в отдельности и по объединению в целом:
Завод 1:
s1=√32,72=5,72 (лет).
Завод 2:
s2=√31,57=5,62 (лет).
Объединение:
s=√32,46=5.7 (лет).
6. Определим корреляционное отклонение (коэффициент вариации):
Корреляционное отклонение (коэффициент вариации) для завода 1:
ν =√32,72 /11,6=0,493 (49,3%);
Корреляционное отклонение (коэффициент вариации) для завода 2:
ν = √31,57 /12,5=0,449 (44,9%);
Корреляционное отклонение (коэффициент вариации) по объединению в целом (общее):
ν = √32,46 /12,0=0,475 (47,5%).
7. Проверим правило сложения дисперсий:
u 2= 32,17 +0,2=32,37≈32,46
Выводы
На основании проведенных расчетов можно сделать следующие выводы:
– средний возраст работы одного рабочего на заводе 1 равен 11,6 лет, на заводе 2 -12,5 лет и по объединению в целом -12,0 лет.
– в среднем отклонение от среднего возраста работы одного рабочего, как в сторону увеличения, так и в сторону уменьшения по заводу 1 составляет 5,72 лет (или 49,3%), по заводу 2 –5,62 лет (или 44,9%), по объединению в целом –5,7 лет (или 47,5%).