Введение
Выборочным называется такое статистическое исследование, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части, сформированной на основе положений случайного отбора.
В основе выборочного исследования лежит несплошное наблюдение, при котором обследуются не все единицы совокупности, а лишь определенная их часть.
Выборочное исследование широко применяется на практике, поскольку обладает существенными преимуществами по сравнению с другими методами получения статистических данных. К ним относятся:
• Достаточно высокая точность результатов обследования благодаря использованию более квалифицированных кадров, что приводит к сокращению ошибок регистрации;
• Экономия времени и средств в результате сокращения объема работы, большая оперативность в получении данных о результатах обследования;
• Возможность исследования очень больших статистических совокупностей;
• Выборочный метод является единственно возможным, если сбор информации связан с разрушением или потерей единиц наблюдения, например, при органалитическом контроле качества продукции;
• Возможность исследования полностью недоступных совокупностей
Обоснование целесообразности применения выборочного метода
Выборочное статистическое наблюдение является наиболее широко применяемым видом не сплошного наблюдения. При выборочном методе обследованию подвергается сравнительно набольшая часть всей изучаемой совокупности (обычно до 5–10%, реже до 15–20%). При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или выборкой. Значение выборочного метода состоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.
Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части, организованной по принципу случайного отбора.
При случайном отборе каждой единице изучаемого объекта (массового явления, генеральной совокупности) обеспечивается определенная (обычно равная) вероятность попасть в количество обследуемых единиц (в выборку) и тем самым исключается субъективность, тенденциозность и односторонность в подборе этих единиц.
При строгом соблюдении принятых правил отбора выборочное наблюдение репрезентативно в широком смысле слова: при нем обеспечивается близкое соответствие состава охваченной наблюдением выборки и состава генеральной совокупности. Благодаря этому по данных выборочного наблюдения можно определить с желательной степенью приближения интересующие исследователей характеристики изучаемого явления.
Выборочный метод при проведении ряда исследований является единственно возможным, например, при контроле качества продукции (товара).
Выборочный метод иногда применяется для проверки данных даже сплошного учета. Минимальная численность обследуемых единиц позволяет провести исследование более тщательно и квалифицированно. Так, при переписи населения практикуются выборочные контрольные обходы для проверки правильности записей сплошного наблюдения.
Большую актуальность приобретает выборочный метод в условиях перехода к рыночной экономике. Развитие различных форм собственности, изменения в характере экономических отношений, как, обусловливают изменения функций учета и статистики, сокращение и упрощение статистической отчетности.
По сравнению с другими методами, применяющими не сплошное наблюдение, выборочный метод имеет существенное преимущество. При соблюдении правил научной организации выборочного наблюдения появляется возможность количественной оценки ошибки репрезентативности (представительности).
Более того, способы определения ошибок выборки при различных приемах формирования выборочной совокупности и распространение характеристик выборки на генеральную совокупность составляют основное содержание статистической методологии выборочного метода.
Логика выборочного наблюдения:
определение объекта и целей выборочного наблюдения;
выбор схема отбора единиц для наблюдения;
расчет объема выборки;
проведение случайного отбора установленного числа единиц из генеральной совокупности;
наблюдение отобранных единиц по установленной программе;
расчет выборочных характеристик в соответствии с программой выборочного наблюдения;
определение ошибки, ее размера;
распространение выборочных данных на генеральную совокупность;
анализ полученных данных.
Основные преимущества выборочного наблюдения:
Выборочное наблюдение можно осуществить по более широкой программе.
Выборочное наблюдение более дешевое с точки зрения затрат на его проведение.
Выборочное наблюдение можно организовать тогда и в тех случаях, когда отчетностью мы воспользоваться не можем.
Основные недостатки:
Полученные данные всегда содержат в себе ошибку, о результатах наблюдения можно судить лишь с определенной степенью достоверности. Но по сравнению с другими видами наблюдения это достоинство выборочного метода.
Для
его проведения
требуются
квалифицированные
кадры.
Вся
совокупность
единиц, из которых
производится
отбор, называется
генеральной.
Совокупность
единиц отобранных
называется
выборочной.
Проведение выборочного наблюдения складывается из ряда последовательных этапов:
1) обоснование целесообразности проведения выборочного метода в соответствии с задачами исследования;
2) составление программы проведения статистического исследования выборочным методом;
3) решение организационных вопросов сбора исходной информации;
4) установление доли выборки, т.е. части подлежащих обследованию единиц генеральной совокупности;
5) обоснование способов формирования выборочной совокупности;
6) осуществление отбора единиц из генеральной совокупности для их обследования;
7) фиксация в отобранных единицах выборки значений изучаемых признаков;
8) статистическая обработка полученной в выборке информации с определением обобщающих характеристик изучаемых признаков;
9) определение количественной оценки ошибки выборки;
10) распространение обобщающих выборочных характеристик на генеральную совокупность.
11) В зависимости от способа организации выборочного наблюдения и применяемых способов отбора различают также виды выборочного наблюдения:
1) простая случайная выборка (собственно-случайная);
2) механическая случайная выборка;
3) типическая случайная выборка;
4) серийная (гнездовая) выборка;
5) многоступенчатая (многостепенная или комбинационная) выборка.
Выборку можно производить из конечной (ограниченной) и неограниченной генеральной совокупности. Поэтому целесообразно различать выборочный метод и по этому признаку. Иногда различают также большие, охватывающие значительное число обследуемых единиц, выборки и малые выборки.
Каждый из указанных основных способов отбора может реализоваться по схеме повторного (когда зафиксированная в выборке единица возвращается в генеральную совокупность) или бесповоротного отбора (когда зафиксированная единица исключается из дальнейшего просмотра и может попасть в выборку только один раз). Целесообразно различать выборки и по этому признаку.
Задача №1.
Вычислить индексы сезонности и построить сезонную волну за полугодие. Сделать вывод
Индексы сезонности | ||||||
I | II | III | всего за три года | В среднем за три года | ||
Январь | 30,2 | 31,5 | 31,2 | 92,9 | 31 | 16,77 |
Февраль | 29,8 | 31,1 | 30,8 | 91,7 | 30,6 | 16,55 |
Март | 29,6 | 30,9 | 30,5 | 91 | 30,3 | 16,39 |
Апрель | 29,4 | 30,6 | 30,3 | 90,3 | 30,1 | 16,28 |
Май | 30,5 | 31,9 | 31,5 | 93,9 | 31,3 | 16,93 |
Июнь | 30,8 | 32,2 | 31,8 | 94,8 | 31,6 | 17,09 |
Итого | 180,3 | 188,2 | 186,1 | 554,6 | 184,9 | 100,01 |
Решение:
Всего за три года =I+II+III
Январь = 30,2+31,5+31,2=92,9
Февраль = 29,8+31,1+30,8=91,7
Март = 29,6+30,9+30,5=91
Апрель = 29,4+30,6+30,3=90,3
Май = 30,5+31,9+31,5=93,9
Июнь = 30,8+32,2+31,8=94,8
Итого I = январь I+ февраль I+март I+апрель I+май I+июнь I=30,2+29,8+29,6+29,4+30,5+30,8=180,3
Итого II = январь II+февраль II+март II+май II+июнь II = 31,5+31,1+30,9+30,6+31,9+32,2=188,2
Итого III = январь III+февраль III+март III+апрель III+май III+ июнь III = 31,2+30,8+30,5+30,3+31,5+31,8=186,1
Итого всего за три года = 92,9+91,7+91+90,3+93,9+94,8=554,6
В среднем за три года = (I+II+III)/3 = Всего за три года/3. По этой формуле рассчитаем для всех месяцев:
Январь = 92,9/3=31
Февраль = 91,7/3=30,6
Март = 91/3=30,3
Апрель = 90,3/3=30,1
Май = 93,9/3=31,3
Июнь = 94,8/3=31,6
Итого = 554,6/3=184,9
Индекс сезонности (Ис) =Всего за три года для каждого месяца / общую среднюю за три года*100%. По этой формуле рассчитае6 м для каждого месяца:
Ис январь = 31/184,9*100=16,77
Ис февраль = 30,6/184,9*100=16,55
Ис март = 30,3/184,9*100=16,39
Ис апрель = 30,1/184,9*100=16,28
Ис май =31,3/184,9*100=16,93
Ис июнь = 31,6/184,9*100=17,09
Итого Ис = 16,77+16,55+16,39+16,28+16,93+17,09=100,01
Строим сезонную волну:
Вывод: Правильность полученной сезонной волны зависит от числа уровней ряда и от характера их изменения: чем больше уровней ряда, тем более точные будут результаты. Если посмотреть на полученных данных сезонной волны, видно существенный спад в марте и апреле, а в мае и июне видимое увеличение средних показателей.
Задача №2.
Имеются данные о 23 рабочих-сдельщиках, представленные в следующей таблице:
Номер рабочих | Стаж работы, лет | Месячная выработка продукции, у. е. |
1 | 18,0 | 737 |
2 | 23,5 | 827 |
3 | 26,2 | 844 |
4 | 21,5 | 792 |
5 | 23 | 797 |
6 | 19,5 | 770 |
7 | 19,7 | 762 |
8 | 33 | 857 |
9 | 30,2 | 829 |
10 | 31 | 869 |
11 | 28 | 842 |
12 | 29 | 825 |
13 | 27,5 | 823 |
14 | 18 | 769 |
15 | 26 | 807 |
16 | 22 | 782 |
17 | 23 | 775 |
18 | 27,2 | 805 |
19 | 22 | 757 |
20 | 22,4 | 787 |
21 | 24,5 | 795 |
22 | 25 | 805 |
23 | 25,8 | 812 |
Для изучения зависимости между приведенными показателями произвести группировку рабочих по стажу работы, выделив 5 групп с равными интервалами. По каждой из них и совокупности подсчитать количество рабочих (абсолютное и в процентах к итогу), средний стаж работы, среднемесячную выработку продукции. Результаты представить в таблице, сделать краткие выводы.
Решение:
Определяем величину интервала (i):
i = (Xmax-Xmin)/5=(33–18)/5=3.
Разбиваем на группы: (18; 21); (21; 24); (24; 27); (27; 30); [30; 33].
Строим вспомогательную таблицу для рассчитанных
Размер интервала | Номер рабочих | Стаж работы, лет | Месячная выработка продукции, у. е. |
(18; 21) |
1 | 18 | 737 |
6 | 19,5 | 770 | |
7 | 19,7 | 762 | |
14 | 18 | 769 | |
Итого | 4 | 75,2 | 3038 |
(21; 24) |
2 | 23,5 | 827 |
4 | 21,5 | 792 | |
5 | 23 | 797 | |
16 | 22 | 782 | |
17 | 23 | 775 | |
19 | 22 | 757 | |
20 | 22,4 | 787 | |
Итого | 7 | 157,4 | 5517 |
(24; 27) |
3 | 26,2 | 844 |
15 | 26 | 807 | |
21 | 24,5 | 795 | |
22 | 25 | 805 | |
23 | 25,8 | 812 | |
Итого | 5 | 127,5 | 4063 |
(27; 30) |
11 | 28 | 842 |
12 | 29 | 825 | |
13 | 27,5 | 823 | |
18 | 27,2 | 805 | |
Итого | 4 | 111,7 | 3295 |
[30; 33] |
8 | 33 | 857 |
9 | 30,2 | 829 | |
10 | 31 | 869 | |
Итого | 3 | 94,2 | 2555 |
Строим итоговую таблицу
Группы п\п по стажу работы, лет | Количество рабочих, человек | Стаж работы, лет | Месячная выработка продукции, у. е. | |||
абсолютное | в% к итогу | всего | в среднем на 1 рабочего | всего | в среднем на 1 рабочего | |
1 |
2 |
3=2*100/23 |
4 |
5=4/2 |
6 |
7=6/2 |
[18; 21] | 4 | 17,4 | 75,2 | 18,8 | 3038 | 506,3 |
(21; 24) | 7 | 30,4 | 157,4 | 22,5 | 5517 | 788,1 |
(24; 27) | 5 | 21,7 | 127,5 | 25,5 | 4063 | 812,6 |
(27; 30) | 4 | 17,4 | 111,7 | 27,9 | 3295 | 823,8 |
{30; 33] | 3 | 13,1 | 94,2 | 31,4 | 2555 | 851,7 |
Вывод: Для всех 5 групп «Группировки рабочих по стажу работы» характерны следующие характеристики: среднемесячная выработка продукции пропорционально растет, а количество рабочих уже с третьей группы резко уменьшается. Можно предположить, что на данном предприятии происходит внедрение новых процессов производства, в связи с чем ручной труд заменяется машинным.
Задача №3.
Построить прогноз методом среднего абсолютного прироста. Обосновать выбор метода прогнозирования, предварительно проверив предпосылки его реализации.
Построить прогноз методом среднего темпа роста, предварительно проверив предпосылки его реализации.
Построить прогноз, методом экстраполяции трендовых моделей.
Произвести оценку точности прогнозов, полученных методом экстраполяции трендовых моделей на основе:
средней квадратической ошибки;
коэффициента несоответствия.
Сделать выводы.
Исходные данные
Динамика числа семей, состоявших на учете на учёте на получение жилья в одном из регионов Республики Беларусь за январь-октябрь 2009 г.
Месяц | Число семей, состоявших на учете на получение жилья, тыс. ед. |
январь | 179,6 |
февраль | 181,2 |
март | 203,3 |
апрель | 206,1 |
май | 226,9 |
июнь | 248 |
июль | 261,3 |
август | 231,9 |
сентябрь | 255,1 |
октябрь | 299 |
Решение:
1. Прогноз методом среднего абсолютного прироста.
Месяц |
Число семей, состоявших на учете на получение жилья, тыс. ед. yi |
yi2 |
Δr |
Δ2 |
_ _ y Δ |
_ _ yi- y Δ |
_ _ (yi- y Δ) |
январь | 179,6 | 32256,16 | - | - | 179,6 | 0 | 0 |
февраль | 181,2 | 32833,44 | 1,6 | 2,56 | 192,867 | -11,667 | 136,111 |
март | 203,3 | 41330,89 | 22,1 | 488,41 | 206,134 | -2,834 | 8,028 |
апрель | 206,1 | 42477,21 | 2,8 | 7,84 | 219,401 | -13,3 | 176,91 |
май | 226,9 | 51483,61 | 20,8 | 432,64 | 232,668 | -5,768 | 33,27 |
июнь | 248 | 61504 | 21,1 | 445,21 | 245,935 | 2,065 | 4,264 |
июль | 261,3 | 68277,69 | 13,3 | 167,89 | 259,202 | 2,098 | 4,401 |
август | 231,9 | 53777,61 | -29,4 | 864,36 | 272,469 | -40,569 | 1645,844 |
сентябрь | 255,1 | 65076,01 | 23,2 | 538,24 | 285,736 | -30,636 | 938,564 |
октябрь | 299 | 89401 | 43,9 | 1927,21 | 299 | 0 | 0 |
Итого | 2292,4 | 538417,62 | 119,4 | 4883,36 | 2393,012 | -100,612 | 2947,392 |
Δ=(yn-y1)/(n-1)=(октябрь-январь)/9=(299–179,6)/9=13,267
Для того чтобы найти Δr, нужно от каждого месяца отнять предыдущий: Δrфевраля=февраль-январь; Δr марта = март-февраль и так для всех месяцев.
_ _ Δ2 = значение Δr возведённое в квадрат.
y Δ февраля = yi января + е значение Δ, для марта =Δ+ yi февраля.
Для осуществления прогноза должна выполняться предпосылка:δ2ост≤ р2;
Проверим: δ2=∑(yi – y Δ)2/n=2947,392/10=294,739
р2=1/2*∑ Δ2/n=1/2*4883,36/10=244,168; δ2ост≤ р2, условие не выполняется, следовательно прогноз построить нельзя.
2. Прогноз методом среднего темпа роста
Месяц |
Число семей, состоявших на учете на получение жилья, тыс. ед. yi |
Tr |
_ yiTr |
январь | 179,6 | - | 171,218 |
февраль | 181,2 | 1,008 | 192,101 |
март | 203,3 | 1,122 | 194,746 |
апрель | 206,1 | 1,014 | 214,4 |
май | 226,9 | 1,101 | 234,338 |
июнь | 248 | 1,093 | 246,905 |
июль | 261,3 | 1,054 | 219,125 |
август | 231,9 | 0,887 | 241,047 |
сентябрь | 255,1 | 1,1 | 282,529 |
октябрь | 299 | 1,172 | 299 |
Итого | 2292,4 | 9,551 | 2295,409 |
Для расчета Тr нужно месяц для которого считаем разделить на предыдущий. Тr февраля = февраль уi /январь уi так для всех месяцев.
Тr=√(yn/y1)= √(299/179.6)=1.0583
yiTr= уi следующего месяца/ Тr= yiTr сентября = уi октября/ Тr=299/1,0583= =282,529 и так для каждого месяца.
Проверим предпосылки осуществления прогноза:
∑yi ≈∑yTr; 2295,409>2292,4; Так как предпосылка не выполняется, то прогноз методом среднего темпа построить невозможно.
3. Прогноз методом экстраполяции трендовых моделей.
Модель прямой
Месяц |
Число семей, состоявших на учете на получение жилья, тыс. ед. yi |
Номер года t | t2 | yixt | yt | (yi-yt)2 | yi2 |
январь | 179,6 | 1 | 1 | 179,6 | 176,815 | 7,76 | 32256,16 |
февраль | 181,2 | 2 | 4 | 362,4 | 188,465 | 52,78 | 32833,44 |
март | 203,3 | 3 | 9 | 609,9 | 200,115 | 10,14 | 41330,89 |
апрель | 206,1 | 4 | 16 | 824,4 | 211,765 | 32,09 | 42,477,21 |
май | 226,9 | 5 | 25 | 1134,5 | 223,415 | 12,15 | 51483,61 |
июнь | 248 | 6 | 36 | 1488 | 235,065 | 167,31 | 61504 |
июль | 261,3 | 7 | 49 | 1829,1 | 246,715 | 212,72 | 68277,69 |
август | 231,9 | 8 | 64 | 1855,2 | 258,365 | 700,4 | 53777,61 |
сентябрь | 255,1 | 9 | 81 | 2295,9 | 270,015 | 222,46 | 65076,01 |
октябрь | 299 | 10 | 100 | 2990 | 281,665 | 300,5 | 89401 |
Итого | 2292,4 | 55 | 385 | 13569 | 2292,4 | 1718,31 | 538417,62 |
yixt= yiмесяца * t месяца.
na0+∑ta1=∑yt
∑ta0+∑t2a1=∑yixt
10a0+55a1=2292.4
55a0+385a1=13569
10a0=2292.4–55a1
55a0+385a1=13569
a0=229.24–5.5a1
55a0+385a=13569.подставим значения е а0 во второе уравнение и решим его. 55 (229,24–5,5а1)+385а1=13569
82,5а1=960,8
а1=11,65, подставим значение а1 в первое уравнение и решим его.
10а0+640,75=2292,4
а0=165,165
а0=165,165
а1=11,65
yt января = а0+а1; yt февраля = yt января+ а1, так для всех месяцев.
Yt=165.165+11.65t. Построим прогноз:
номер года, t | yt |
11 | 529,915 |
12 | 604,565 |
13 | 616,215 |
11= yt октябрь+а1=281,665+11,65=592,915
12=11 yt+а1=592,915+11,65=604,565
13=12 yt+а1=604,565+11,65=616,215
Оценка точности прогноза:
Среднеквадратическая ошибка: δ=√(∑(yi-yt)2/n)=13.11
Коэффициент несоответствия: КН=√(∑(yi-yt)2/∑ yi2)=0,05649
Модель параболы
Месяц |
Число семей, состояв- ших на учете на получе-ние жилья, тыс. ед. yi |
Но-мер года t |
t2 | t3 | t4 | yixt | yixt2 | yt | (yi-yt)2 | yi2 |
январь | 179,6 | 1 | 1 | 1 | 1 | 179,6 | 179,6 | 177,1 | 7,76 | 32256,16 |
февраль | 181,2 | 2 | 4 | 8 | 16 | 362,4 | 724,8 | 188,51 | 52,78 | 32833,44 |
март | 203,3 | 3 | 9 | 27 | 81 | 609,9 | 1829,7 | 200 | 10,14 | 41330,89 |
апрель | 206,1 | 4 | 16 | 64 | 256 | 824,4 | 3297,6 | 211,4 | 32,09 | 42,477,21 |
май | 226,9 | 5 | 25 | 125 | 625 | 1134,5 | 5672,5 | 222,8 | 12,15 | 51483,61 |
июнь | 248 | 6 | 36 | 216 | 1296 | 1488 | 8929 | 234,21 | 167,31 | 61504 |
июль | 261,3 | 7 | 49 | 343 | 2401 | 1829,1 | 12803,7 | 245,64 | 212,72 | 68277,69 |
август | 231,9 | 8 | 64 | 512 | 4096 | 1855,2 | 14841,6 | 257,1 | 700,4 | 53777,61 |
сентябрь | 255,1 | 9 | 81 | 729 | 6561 | 2295,9 | 20663,1 | 268,5 | 222,46 | 65076,01 |
октябрь | 299 | 10 | 100 | 1000 | 10000 | 2990 | 29900 | 280 | 300,5 | 89401 |
Итого | 2292,4 | 55 | 385 | 3025 | 25333 | 13569 | 98841,6 | 2285,3 | 1718,31 | 538417,62 |
na0+∑ta1+∑t2a2=∑yt
∑ta0+∑t2a1+∑t3a2=∑yixt
∑t2a0+∑t3a1+∑t4a2=∑ yixt2
10a0+55a1+3025a2=2292.4
55a0+385a1+3025a2=13569
385a0+3025a1+25333a2=98841.6
a0=165.6578
a1=11.4036
a20.0224
Yt=165.6578+11.4036t+0.0224t2
Построим прогноз (подставляя в найденное уравнение t)
номер года, t | yt |
11 | 291,1 |
12 | 305,73 |
13 | 317,69 |
Оценка точности прогноза:
Среднеквадратическая ошибка: δ=√(∑(yi-yt)2/n)=13.11
Коэффициент несоответствия: КН=√(∑(yi-yt)2/∑ yi2)=0,05649
Вывод: Первые два метода: метод среднего абсолютного прироста и среднего темпа роста неэффективны, так как построить прогноз невозможно, из-за невыполнения условий. А из метода экстраполяции трендовых моделей наиболее эффективным является модель прямой, так как у неё совпали два показателя yt и yi, а среднеквадратическая ошибка и коэффициент несоответствия одинаковые.
Список использованных источников
Громыко Г.Л. Теория статистики. Учебник. Москва: ИНФРА-М, 2000. – 414 с.
Колесникова, Н.Н. Статистика: учебное пособие./ Н.Н. Колесникова, Г.В. Круглякова. – Москва: Новое знание, 2007.-224 с.
Рудакова Р.П., Букин Л.Л., Гаврилов В.И. Практикум по статистике. Питер, 2007. – 288 с.
Сизова Т.М. Статистика: Учебное пособие. – СПб.: СПб ГУИТМО, 2005. – 190 с.
www.allstats.ru