1. База данных
Для проведения статистического наблюдения формируется информационная база. Создание такой базы – начальная стадия экономико-статистического исследования. По результатам статистического наблюдения формируется информационная база данных.
При определении программы выборочного наблюдения необходимо определить минимальный объем выборки, который должен обеспечить требуемую точность. Методика расчета численности выборки n зависит от метода выбора, она рассчитывается по формуле, приведенной в табл. 1.
Таблица 1.
Расчет минимальной численности выборки
Методы отбора | Формула объема выборки | |
для средней | для доли | |
Бесповторный |
Например, в металлообрабатывающем цехе работают 100 рабочих-сварщиков. Для этой совокупности произведем необходимый объем выборки. С помощью бесповторного метода предполагается произвести выборочное обследование для определения средней заработной платы среди сварщиков цеха. Определять необходимый объем выборки будем при условии, что с вероятностью 0,954 ошибка выборки не превысит 190 р. при среднеквадратическом отклонении 490 р.
(1)
Подставляем принятое значение в (1), получаем минимальный объем выборки:
( округлив=22)
Минимальный объем выборки составляет 22 единицы.
Из цеха методом случайного бесповторного отбора выбирают 22 рабочих- сварщиков, которые оформляются в виде информационной базы данных, представленной в табл.2.
Таблица 2.
№ п/п | Фамилия, имя, отчество | Заработная плата |
1 | Аверьянов К.Д. | 1750 |
2 | Лукьянова Т.А. | 1380 |
3 | Севостьянов Л.И. | 2430 |
4 | Иванов Т.А. | 2300 |
5 | Поздняков А.А. | 1940 |
6 | Сушков Б.А. | 2890 |
7 | Ляпин Е.Л. | 3220 |
8 | Федоров А.М. | 3010 |
9 | Федосеев Л.А. | 2620 |
10 | Кудряшов А.В. | 2754 |
11 | Подгорный Р.В. | 2150 |
12 | Смирнов К.А. | 3200 |
13 | Ченцов А.С. | 3000 |
14 | Гудович Г.К. | 2240 |
15 | Лаптев С.В. | 1980 |
16 | Титов О.В. | 1860 |
17 | Матвеев В.М. | 3400 |
18 | Сиденко А.В. | 2170 |
19 | Сорокин П.В. | 1830 |
20 | Елисеев Р.Д. | 2440 |
21 | Колбачев А.А. | 2386 |
22 | Сидоров А.С. | 3492 |
ИТОГО | 54442 |
2.Обработка базы данных
Расчет ошибки выборки средней:
для бесповторного отбора:
, (2)
где - ошибка выборки средней;
- дисперсия;
- число единиц выборочной совокупности;
- число единиц генеральной совокупности.
Производим расчет средней по выборочной совокупности по формуле:
(3)
Подставим суммарную зарплату по выборочной совокупности из табл.2 в формулу (3) и число членов выборочной совокупности получаем:
Производим промежуточные расчеты и заносим результаты в табл.3.
Таблица 3.
Промежуточные результаты расчета
№ п/п | |||
1 | 1750 | -724,4 | 524755,36 |
2 | 1380 | -1094,6 | 1198149,16 |
3 | 2430 | -44,6 | 1989,16 |
4 | 2300 | -174,6 | 30485,16 |
5 | 1940 | -534,6 | 285797,16 |
6 | 2890 | 415,4 | 172557,16 |
7 | 3220 | 745,4 | 555621,16 |
8 | 3010 | 535,4 | 286653,16 |
9 | 2620 | 145,4 | 21141,16 |
10 | 2754 | 279,4 | 78064,36 |
11 | 2150 | -324,6 | 105365,16 |
12 | 3200 | 725,4 | 526205,16 |
13 | 3000 | 525,4 | 276045,16 |
14 | 2240 | -234,6 | 55037,16 |
15 | 1980 | -494,6 | 244629,16 |
16 | 1860 | -614,6 | 377733,16 |
17 | 3400 | 925,4 | 856365,16 |
18 | 2170 | -304,6 | 92781,16 |
19 | 1830 | -644,6 | 415509,16 |
20 | 2440 | -34,6 | 1197,16 |
21 | 2386 | -88,6 | 7849,96 |
22 | 3492 | 1017,4 | 1035102,76 |
Итого | 54442 | 7149033,32 |
Расчет дисперсии производим по формуле:
(4)
Подставляя данные в формулу (4) из табл.2 (гр.4), получим
3.Расчет предельной ошибки выборки
Методика расчета предельной ошибки выборки приведена в табл.4.
Таблица 4.
Расчет предельной ошибки выборки.
Методы отбора | Предельные ошибки индивидуального отбора | |
для средней | для доли | |
Бесповторный |
Для нашего примера предельную ошибку рассчитаем по формуле
(5)
После расчета предельной ошибки выборки находят доверительный интервал для генеральных показателей. Для доверительный интервал определяется по формуле:
(6)
Для доли доверительный интервал определяется по формуле:
(7)
Подставляя результат расчета по формуле (4) в формулы (2) и (5), получаем среднюю и предельную ошибки отклонения:
Подставляя результаты расчета в формулу (7), получаем границы доверительного интервала:
4.Оценка распространения выборочных данных на генеральную
совокупность
Если средняя заработная плата одного рабочего составляет 2474,6 р., а предельная ошибка выборки 214,8, то, зная численность рабочих цеха = 100, можно установить с принятой вероятностью пределы фонда оплаты их труда.
5. Построение вариационного ряда
Вариационные ряды – это ряды, построенные по количественному признаку. В настоящей работе производится построение вариационного возрастающего ряда. (См. табл.5).
Таблица 5
1 | 1380 |
2 | 1750 |
3 | 1830 |
4 | 1860 |
5 | 1940 |
6 | 1980 |
7 | 2150 |
8 | 2170 |
9 | 2240 |
10 | 2300 |
11 | 2386 |
12 | 2430 |
13 | 2440 |
14 | 2620 |
15 | 2754 |
16 | 2890 |
17 | 3000 |
18 | 3010 |
19 | 3200 |
20 | 3220 |
21 | 3400 |
22 | 3492 |
6. Построение эмпирического графика
График строится по данным возрастающего вариационного ряда. По оси абсцисс откладываются номер по порядку из вариационного ряда. По оси ординат располагается результативный признак, в нашем примере заработанная плата рабочих. (См. рис.1)
Рисунок 1
7. Составление группировки и расчет показателей по группам
Первым шагом при построении группировок является расчет числа групп и величины интервала, на которые будет разбита выборочная совокупность.
Для нахождения числа групп служит формула Стерджеса:
(9)
где n – число групп,
N – число единиц выборочной совокупности.
Получаем: n=5
В случае равных интервалов величина интервала может быть определена следующим образом:
, (10)
где - максимальное значение показателя,
- минимальное значение показателя,
- число групп.
Граничные значения каждой группы определяются следующим образом:
(11)
Таким образом, исходные данные разбиваются на следующие 5 групп:
1) 1380 - 1802,4
2) 1802,4 - 2224,8
3) 2224,8 - 2647,2
4) 2647,2 - 3069,6
5) 3069,6 - 3492
Для каждой группы рассчитываем среднюю величину. Этот расчет осуществляется по формуле:
(12)
где - индивидуальное значение величин, входящих в группу, например, в первую;
n – число единиц, входящих в группу, например, первую.
Индекс по группе рассчитывается по формуле:
(13)
Полученные расчетные данные заносим в табл. 6 и распределяем данные вариационного ряда по полученным группам.
Таблица 6.
Группировка данных
№ гр. |
Группа |
Повторяемость | Среднее значение по группе | Индекс i |
|
абсолютная, чел. | относительная, % | ||||
I | 1380-1802,4 | 2 | 10 | 1565 | 0,63 |
II | 1802,4-2224,8 | 6 | 30 | 1988,3 | 0,8 |
III | 2224,8-2647,2 | 6 | 30 | 2402,6 | 0,97 |
IV | 2647,2-3069,6 | 4 | 15 | 2913,5 | 1,17 |
V | 3069,6-3492 | 4 | 15 | 3328 | 1,34 |
Итого | 22 | 100 | 2474,6 | 1,0 |
8. Расчет показателей вариации
Для измерения вариации в статистике используют ряд показателей вариации.
Размах вариации.
(14)
Среднее линейное отклонение.
Среднее линейное отклонение представляет собой простейший показатель колеблемости d.
(15)
Дисперсия и среднеквадратическое отклонение.
Дисперсия признака определяется на основе среднего квадратического отклонения и характеризует степень рассеяния, разброса данных.
(16)
Таблица 7.
Данные и промежуточные результаты для расчета показателей вариации.
№№ групп |
Группа | Абсолютное количество n | |||
1 | 1380-1802,4 | 2 | 370 | 136900 | |
1380 | 1565 | -185 | 34225 | ||
1750 | 185 | 34225 | |||
2 | 1802,4-2224,8 | 6 | 686,6 | 471419,56 | |
1830 | -158,3 | 25058,89 | |||
1860 | -128,3 | 16460,89 | |||
1940 | 1988,3 | -48,3 | 2332,89 | ||
1980 | -8,3 | 68,89 | |||
2150 | 161,7 | 26146,89 | |||
2170 | 181,7 | 33014,89 | |||
3 | 2224,8-2647,2 | 6 | 564 | 318096 | |
2240 | -162,6 | 26438,76 | |||
2300 | -102,6 | 10526,76 | |||
2386 | 2402,6 | -16,6 | 275,56 | ||
2430 | 27,4 | 750,76 | |||
2440 | 37,4 | 1398,76 | |||
2620 | 217,4 | 47241,02 | |||
4 | 2647,2-3069,6 | 4 | 366 | 133956 | |
2754 | -159,5 | 25440,25 | |||
2890 | 2913,5 | -23,5 | 552,25 | ||
3000 | 86,5 | 7482,25 | |||
3010 | 96,5 | 9312,25 | |||
5 | 3069,6-3492 | 4 | 472 | 222784 | |
3200 | -128 | 16384 | |||
3220 | 3328 | -108 | 11664 | ||
3400 | 72 | 5184 | |||
3492 | 164 | 26896 | |||
Итого | 2459,2 | 1644236 |
Внутригрупповые дисперсии определяются по формулам:
(17)
где - индивидуальное значение признака в i- группе
- средняя величина признака по i- группе
k - число единиц признаков в группе
Подставляя данные из табл.7 в формулу (17), рассчитаем внутригрупповые дисперсии:
Рассчитаем среднюю из внутригрупповых дисперсий:
: (18)
Межгрупповая дисперсия вычисляется:
Т.об. (19)
общая дисперсия будет равна:
При помощи элементарных преобразований формулы (16), получим формулу для расчета дисперсии методом моментов:
(20)
Рассчитаем среднее квадратическое отклонение по группам и по совокупности:
Общее среднеквадратическое отклонение определяем по этой же формуле:
Коэффициент корреляции рассчитаем по формуле:
(21)
Коэффициент детерминации рассчитаем по формуле:
(22)
K=17.0569
Коэффициент осцилляции или относительный размах Кн.
(23)
где - средняя по группе или по совокупности.
Коэффициент вариации определяется по формуле:
(24)
Библиографический список.
Методические указания к выполнению индивидуального задания по дисциплине «Статистика». Составитель Матвеев Д.Е., редактор Т.М.Курьянова.