МІНІСТЕРСТВО ОСВІТИ УКРАЇНИ
КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ ТЕХНОЛОГІЙ ТА ДИЗАЙНУ
Інститут післядипломної освіти
КОНТРОЛЬНА РОБОТА
З курсу «Статистика»
студента _Михайленко С.В.
1 курсу ЗФ 1-09 групи
Інституту післядипломної освіти
Перевірив Тарасенко И.О.
Київ 2010р.
ВАРІАНТ 7
Тема контрольної роботи : «Вибіркове спостереження»
вибірковий спостереження сукупність
Який метод відбору одиниць слід використати, якщо генеральна сукупність складається з типових груп одиниць, співвідношення між якими відомо? Відповідь обґрунтувати.
Які способи поширення даних вибіркового спостереження на генеральну сукупність вам відомі? В чому їх особливості?
1. Поняття про вибірковий метод та основні умови наукової організації вибіркового спостереження
Вибіркове спостереження є найбільш поширеним видом несуцільного спостереження. При цьому обстеженню підлягає не вся статистична сукупність, а лише її певна частина, яка відбирається за відповідними правилами та представляє сукупність в цілому.
Вибіркове спостереження має суттєві переваги порівняно з суцільним: воно є більш оперативним, вимагає менше коштів та часу на підготовку та проведення. Результати вибіркового спостереження часто є точнішими, оскільки зменшуються помилки реєстрації.
До вибіркового спостереження вдаються тоді, коли проведення суцільного спостереження недоцільне або неможливе.
В процесі вибіркового спостереження вирішуються наступні завдання:
- визначається мета спостереження ;
- складається план і програма спостереження ;
- визначається вид та спосіб відбору, чисельність вибірки ;
- проведення відбору , тобто формування вибіркової сукупності ;
- реєстрація ознак ;
- розраховуються вибіркові характеристики ;
- визначаються помилки репрезентативності та поширюються результати на генеральну сукупність.
Вся сукупність одиниць, з яких виконується відбір для подальшого обстеження, називається генеральною сукупністю, а її чисельність позначається N . Частина генеральної сукупності , що попала у вибірку має назву вибіркової сукупності ( її чисельність позначається n ). Відношення n/N називається часткою відбору, а 100 n/N – процентом відбору.
Як вибіркова, так і генеральна сукупності характеризуються рядом показників, що відповідно називаються вибірковими та генеральними характеристиками. Розбіжність між ними, яка об`єктивно виникає внаслідок несуцільності спостереження, має назву помилки репрезентативності. Помилки репрезентативності, на відміну від помилок реєстрації, можна оцінити ( тобто визначити їх розмір ), що дозволяє врахувати їх при поширенні результатів вибіркового спостереження на генеральну сукупність.
Генеральні характеристики
N – чисельність генеральної сукупності ;
– середнє значення ознаки у генеральній сукупності ( генеральна середня ) ;
2 – дисперсія ;
p – генеральна частка ;
2p – дисперсія альтернативної ознаки 2р = р(1- р).
Вибіркові характеристики :
n – чисельність вибіркової сукупності;
х – середнє значення ознаки у вибірковій сукупності ( вибіркова середня );
2 – дисперсія;
W – вибіркова частка ;
2w – дисперсія альтернативної ознаки 2w = W (1-W).
Доведено, що для достатньо великих сукупностей генеральна та вибіркова дисперсії співпадають, тому на практиці для розрахунків помилок репрезентативності використовують вибіркову дисперсію.
В залежності від того, скільки разів відібрані для обстеження одиниці приймають участь у відборі, розрізняють повторний та безповторний відбір. При повторному відборі обстежені одиниці ” повертаються” у генеральну сукупність і знову приймають участь у відборі. При без повторному відборі одиниці, що попали у вибірку, більше не приймають участі у відборі, таким чином кожна одиниця може бути відібраною лише один раз
При формуванні вибіркової сукупності використовують також наступні види відбору:
індивідуальний, при якому у вибіркову сукупність вибирають по одній одиниці з генеральної сукупності;
груповий або серійний , при якому вибирається група (серія) одиниць;
комбінований, тобто сполучення перших двох видів відбору.
Розрізняють чотири основних способи формування вибіркової сукупності:
1). власне випадковий відбір (повторний чи безповторний) , при якому вибіркова сукупність формується виключно випадково (методом жеребкування , за таблицями чисел тощо);
2). механічний ( систематичний) відбір, при якому у вибіркову сукупність попадають одиниці з певними порядковими номерами. При цьому всі одиниці генеральної сукупності спочатку впорядковуються та їм присвоюються порядкові номери. Далі визначається пропорція відбору та крок. Наприклад, пропорція відбору 1/20, отже крок ( різниця між порядковими номерами) становить 20. Далі з першої групи випадковим чином визначається перший порядковий номер, а наступні – шляхом додавання кроку відбору. Наприклад, з перших 20 одиниць обрано 7-му, тоді наступні одиниці – 27, 47, 67 і т.д. Цей спосіб відбору є безповторним.
3).типовий відбір передбачає , що генеральна сукупність поділяється на однорідні групи і з кожної групи випадковим або механічним способом формується вибіркова сукупність . Якщо з кожної групи відбирається однаковий процент одиниць, типовий відбір називається пропорційним, а якщо однакова кількість одиниць – непропорційним. Типовий відбір може бути повторним і безповторним.
4). серійний відбір , при якому у вибіркову сукупність відбираються групи одиниць (серії) , які надалі обстежуються суцільно.
У статистичній практиці застосовується відбір у часі, наприклад , моментне спостереження, що передбачає реєстрацію ознак на певний момент часу, як правило, через рівні інтервали.
Помилки вибіркового спостереження виникають внаслідок обстеження частини сукупності, або при порушенні правил формування вибіркової сукупності. Вони проявляються у розбіжності між генеральними і вибірковими характеристиками. Ці помилки поділяються на випадкові та систематичні. Випадкові помилки (помилки репрезентативності) можна оцінити із заданим рівнем імовірності. Систематичні помилки, що виникають внаслідок невдалого відбору, оцінюванню не підлягають, тому їх не можна враховувати.
Випадкові помилки вибіркового спостереження залежать від двох факторів:
- чисельність вибіркової сукупності ( або частки чи процента відбору);
- варіації ознаки.
Доведено, що чим більшою є чисельність вибіркової сукупності (частка відбору), тим меншою є помилка вибіркового спостереження, і навпаки, чим більшою є варіація ознаки, Тим більша й помилка.
Залежність величини помилки вибіркового спостереження від названих факторів виражається через формули граничної помилки вибірки:
а) при повторному випадковому відборі гранична помилка визначається
- для середньої = t
- для частки = t
В наведених формулах t – коефіцієнт довіри, який залежить від рівня ймовірності наступним чином:
рівень ймовірності ( ) коефіцієнт довіри (t)
0,863 1
0,954 2
0,997 3
0,950 1,96
0,990 2,58
0,999 3,28
Приклад розрахунку помилок середньої та частки при випадковому повторному відборі. Обстежено 200 одиниць продукції, з яких 150 відповідають вимогам, а 50 – не відповідають. Середня вага одиниці продукції у вибірці – 850 г, дисперсія ваги – 184.
Гранична помилка середньої ваги :
при рівні ймовірності 0,954
при рівні ймовірності 0,990
Гранична помилка частки :
- при рівні ймовірності 0,954
W = = 2 = 0,061
- при рівні ймовірності 0,990
= 2,58 = 0,079
б) при без повторному випадковому та механічному відборі гранична помилка визначається за формулами
- для середньої ;
- для частки .
Наприклад, з 2000 одиниць продукції обстежено 200 одиниць, з яких відповідають вимогам 100 одиниць. Середня вага у вибірці – 950 г , дисперсія ваги – 190.
Гранична помилка середньої ваги:
.
при ймовірності 0,950
= 1,8 (г)
при ймовірності 0,997
= 2,8 (г).
Гранична помилка частки одиниць, що задовольняють вимоги:
при ймовірності 0,950
W = = = 0,5 = 0,066
при ймовірності 0,997
= 0,101.
Мала вибірка
У клінічних і експериментальних роботах досить часто приходиться користатися малою вибіркою, коли число спостережень менше 30. При малій вибірці середні величини і показники обчислюються по тим же формулам, що і при великій. При обчисленні середнього квадратичного відхилення і середньої помилки показника число спостережень зменшується на одиницю;
;
Вірогідність результатів (I) оцінюється по таблиці Стьюдента Звертатися з таблицею Стьюдента випливає по графі 1-й, у якій зазначене число ступенів волі (п), рівне п — 1, тобто числу проведених спостережень зменшеному на одиницю. Дані 2, 3 і 4-й граф обчислені для імовірності правильного висновку, рівної, 95% — графа 2, при ризику помилки 5% (Р05); 99% — графа 3, при ризику помилки 1% (P01) і 99.9%-графа 4, при ризику помилки 0,01% (Р001).
Розв’язати наступні задачі та дати пояснення одержаних результатів
ЗАДАЧА 1.1. В табл. 1.1. наведено інформацію про стаж роботи та суми виплачених дивідендів робітникам підприємства «ТРЕМБІТА».
Визначити величину інтервалу групування та згрупувати робітників підприємства за двома ознаками окремо та в комбінації, утворивши 5 груп з однаковими інтервалами.
За згрупованими даними визначити моду за ознакою стажу роботи та середній рівень дивідендів, пояснити економічний зміст цих показників.
Визначити дисперсію та коефіцієнт варіації для ознаки “середній рівень дивідендів”, пояснити їх економічний зміст.
Таблиця 1.1 Дані кадрової служби підприємства “ТРЕМБІТА” про вік та виплачені робітникам підприємства дивіденди
Табельний номер робітника | Стаж роботи, років | Виплачені дивіденди, грн. |
1 | 8 | 420 |
2 | 7 | 456 |
3 | 2 | 480 |
4 | 5 | 473 |
5 | 36 | 495 |
6 | 4 | 500 |
7 | 5 | 550 |
8 | 7 | 560 |
9 | 3 | 400 |
10 | 6 | 450 |
11 | 9 | 490 |
12 | 8 | 670 |
13 | 2 | 350 |
14 | 4 | 370 |
15 | 7 | 470 |
16 | 3 | 395 |
17 | 8 | 630 |
18 | 7 | 520 |
19 | 4 | 460 |
20 | 9 | 600 |
Розв’язання задачі:
Визначити величину інтервалу групування та згрупувати робітників підприємства за двома ознаками окремо та в комбінації, утворивши 5 груп з однаковими інтервалами
Визначимо величину інтервалу групування за формулою
h = ximin – ximax / n
h = 670 - 350 / 5 = 64
Згрупуємо робітників за дивідендами, грн.
Межі інтервалів ознаки хximin – ximax | Кількість елементів ni |
350-414 | 4 |
414-478 | 6 |
478-542 | 5 |
542-606 | 3 |
606-670 | 2 |
∑ | 20 |
Визначимо величину інтервалу групування за формулою
h = ximin – ximax / n
h = 36 - 2 / 5 = 6,8
Згрупуємо робітників за стажем роботи, роки
Межі інтервалів ознаки х ximin – ximax | 350-414 | 414-478 | 478-542 | 542-606 | 606-670 |
2-8,8 | 1,1,1,1 | 1,1,1,1,1,1 | 1,1,1 | 1,1 | 1,1 |
8,8-15,6 | 1 | 1 | |||
15,6-22,4 | |||||
22,4-29,2 | |||||
29,2-36 | |||||
∑ | 4 | 6 | 5 | 3 | 2 |
За згрупованими даними визначити моду за ознакою стажу роботи та середній рівень дивідендів, пояснити економічний зміст цих показників
Визначимо середній рівень дивідендів робітників
х |
f |
х |
х* f |
S |
350-414 | 4 | 382 | 1528 | 4 |
414-478 | 6 | 446 | 2676 | 10 |
478-542 | 5 | 510 | 2550 | 15 |
542-606 | 3 | 574 | 1722 | 18 |
606-670 | 2 | 638 | 1276 | 20 |
∑ | 20 |
=510 |
9752 |
Визначимо середній рівень дивідендів за формулою
= 9752 / 20 = 487, 6 грн грош. од
Визначимо моду за формулою
де ХМо - нижня межа модального інтервалу; fMo, fMo-1, fMo+1 - частоти або частки відповідно модального, передмодального і післямодального інтервалів.
Мо = 414 + 64 * (5 - 6) / (5 - 6)+ (5 - 3) = 350 грн грош. од.
Отже, середній рівень дивідендів робітників складає 487, 6 грн грош. од, а модальне значення за ознакою стажу роботи - 350 грн грош. од.
Визначити дисперсію та коефіцієнт варіації для ознаки “середній рівень дивідендів”, пояснити їх економічний зміст
Визначимо дисперсію за формулою
за згрупованими даними
- зважена
= ∑ (446- 487,6)* 6 + (510 – 487,6)+ (574 – 487,6)* 3 / 20 = 1764, 35 грош. од.
Якщо з дисперсії добути корінь квадратний, дістанемо середнє квадратичне відхилення σ:
= = 42
Знайдемо коефіцієнт фаріації за формулою
= 42 / 487,6 * 100 = 8,6%
Можна зробити висновок, що сукупність однорідна в зв’язку с тим, що менше 33%
Задача 2.2. Спостереження міцності на розрив 140 зразків шерстяної тканини, які зрізано з різних шматків, відібраних у випадковому порядку, дало такі результати (див. табл. 2.2).
Таблиця 2.2 Дані про міцність ниток на розрив, одержані за результатами вибіркового спостереження
Групи | Міцність тканини на розрив, кг | Кількість зразків |
1 | 20-25 (+) | 25 |
2 | 25-30 | 35 |
3 | 30-35 | 40 |
4 | 35-40 | 30 |
5 | 40 і більше | 15 |
Разом | 145 |
Визначити
середню та граничну помилку середньої міцності тканини з ймовірністю 0,954;
дати пояснення одержаних результатів.
Визначимо середню та граничну помилки середньої міцності тканини.
Обчислимо середнє значення і вибіркову дисперсію всієї сукупності:
х |
х |
f |
х* f |
20-25 | 22,5 | 25 | 562,5 |
25-30 | 27,5 | 35 | 962,5 |
30-35 | 32,5 | 40 | 1300 |
35-40 | 37,5 | 30 | 1125 |
40 і більше | 42,5 | 15 | 637,5 |
∑ |
= 32,5 |
145 | 4587,5 |
Визначимо середнє значення за формулою
= 4587,5 / 145 = 31, 6
Визначимо вибіркову дисперсію за формулою
= = 11,38
Обчислюємо стандартну (середню) помилку вибірки
.
Гранична помилка вибірки обчислюється за формулою:
Dу=tЧmу,
де t – довірчий коефіцієнт
При довірчій ймовірності р=0,954, t=2
Тоді Dу= 2Ч1,5086=3,0173.
Визначаємо довірчий інтервал для середнього розміру ознаки всієї сукупності
Отже, з ймовірністю 0,954 можна стверджувати, що середнє значення у генеральній сукупності буде знаходитись в межах від 28,5827 до 34,6173 для безповторної вибірки.
Задача 7.3. Проаналізуйте динаміку середньої ціни однорідної продукції чотирьох підприємств взуттєвої підгалузі з використанням системи взаємопов’язаних індексів (табл. 10.3). Розрахуйте відсутні показники та заповніть всі клітинки таблиці.
Таблиця 10.3 Дані про динаміку випуску та цін чотирьох підприємств взуттєвої підгалузі
Підприємство | Випуск продукції, тис. шт. | Ціна одиниці продукції, гр.од. | Товарооборот, тис. гр. од. | |||
Базисн. період | Звітний період. | Базисн. період | Звітний період | Базисн. період | Звітний період | |
q0 | q1 | р0 | р1 | р0q0 | р1q1 | |
№ 1 | 220 | 245 | 185 | 199 | 40700 | ? |
№. 2 | 192 | 190 | 350 | 330 | ? | 62700 |
№ 3 | 145 | 140 | ? | 295 | 39150 | 41300 |
№ 4 | ? | 135 | 265 | 280 | 31800 | 37800 |
Разом | 677 | 710 | - | - | 178850 | ? |
Підприємство | Випуск продукції, тис. шт. | Ціна одиниці продукції, гр.од. | Товарооборот, тис. гр. од. | |||
Базисн. період | Звітний період. | Базисн. період | Звітний період | Базисн. період | Звітний період | |
q0 | q1 | р0 | р1 | р0q0 | р1q1 | |
№ 1 | 220 | 245 | 185 | 199 | 40700 | 48755 |
№. 2 | 192 | 190 | 350 | 330 | 67200 | 62700 |
№ 3 | 145 | 140 | 270 | 295 | 39150 | 41300 |
№ 4 | 120 | 135 | 265 | 280 | 31800 | 37800 |
Разом | 677 | 710 | 1070 | 1204 | 178850 | 190555 |
Список використаної літератури:
1. Удотова Людмила Федосіївна Соціальна статистика.- К.: КНЕУ, 2002.- 376с.
2. Головач Анатолій Варфоломійович та ін. Статистика банківської
діяльності.- К.: МАУП, 1999.- 176с.
3. Уманець Тетяна Василівна, Пігарєв Юрій Борисович Статистика.- К.: Вікар, 2003.- 624с.
4. Турчин Валерій Миколайович Математична статистика.- К.: Видавничий центр "Академія", 1999.- 240с.
5. www. ukrreferat.com
6. Статистика: Пыдручник С. С. Герасименко та ін. – К.: КНЕУ, 1998. – 468 с.