Федеральное агентство по образованию РФ
Сибирская государственная автомобильно-дорожная академия (СибАДИ)
Кафедра: «Высшая математика»
РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА
Тема: «Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона»
Выполнила: студентка 23ЭУТ
Хасянова А.Ф.
Проверил: Матвеева С.В
Дата_______________
Оценка_____________
Омск-2010
Содержание
1. Введение. Исходные данные
2. Вариационный ряд
3. Интервальный вариационный ряд
4. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х
5. Оценки числовых характеристик и параметров выдвинутого закона
6. Теоретическая функция плотности рассматриваемого закона распределения «Построение ее на гистограмме»
7. Проверка критерия Пирсона
Вывод
1. Исходные данные варианта №20
Дана выборка из генеральной совокупности случайной величины Х. Данные представлены в таблице 1.
Таблица 1
79,02 | 79,70 | 74,68 | 20,47 | 11,70 | 44,64 | 40,75 | 8,59 | 96,42 | 6,17 |
91,75 | 93,29 | 77,57 | 81,25 | 76,59 | 51,84 | 6,17 | 42,79 | 80,87 | 92,81 |
48,04 | 14,70 | 100,64 | 69,83 | 94,56 | 70,42 | 47,93 | 47,48 | 66,79 | 42,12 |
20,27 | 51,36 | 62,51 | 66,86 | 87,99 | 99,29 | 5,96 | 60,38 | 62,53 | 75,50 |
46,55 | 83,53 | 55,65 | 59,26 | 77,05 | 101,10 | 29,93 | 102,21 | 86,11 | 45,92 |
90,93 | 24,30 | 9,76 | 90,25 | 36,72 | 84,96 | 20,50 | 81,99 | 56,29 | 31,75 |
43,61 | 68,70 | 80,47 | 100,66 | 29,98 | 48,88 | 40,37 | 67,46 | 91,46 | 59,11 |
90,75 | 4,64 | 36,53 | 32,39 | 6,99 | 8,41 | 30,85 | 37,30 | 64,44 | 25,60 |
18,00 | 84,27 | 98,88 | 36,39 | 34,64 | 49,49 | 10,53 | 50,97 | 39,40 | 3,59 |
100,39 | 18,57 | 9,27 | 10,89 | 65,91 | 35,62 | 75,45 | 37,86 | 89,74 | 4,57 |
Выборка содержит 100 наблюдаемых значений, поэтому выборка имеет объем n=100.
2. Построение вариационного ряда
Операция расположения значений случайной величины по не убыванию называется ранжированием. Последовательность элементов х(1) ≤ х(2) ≤…≤ х(k) называется вариационным рядом, элементы которого называют вариантами.
Проранжировав статистические данные, получаем вариационный ряд (табл. 2).
Таблица 2
3,59 | 9,76 | 24,30 | 36,53 | 44,64 | 51,84 | 66,68 | 77,05 | 84,96 | 93,29 |
4,57 | 10,53 | 25,60 | 36,72 | 45,92 | 55,65 | 66,79 | 77,75 | 86,11 | 94,56 |
4,64 | 10,89 | 29,93 | 37,30 | 46,55 | 56,29 | 67,46 | 79,02 | 87,99 | 96,42 |
5,96 | 11,70 | 29,98 | 37,86 | 47,48 | 59,11 | 68,78 | 79,70 | 89,74 | 98,88 |
6,17 | 14,70 | 30,85 | 39,40 | 47,93 | 59,26 | 69,83 | 80,47 | 90,25 | 99,29 |
6,17 | 18,00 | 31,75 | 40,37 | 48,04 | 60,38 | 70,42 | 80,87 | 90,75 | 100,39 |
6,99 | 18,57 | 32,39 | 40,75 | 48,88 | 62,51 | 74,68 | 81,25 | 90,93 | 100,46 |
8,41 | 20,27 | 34,64 | 42,12 | 49,49 | 62,53 | 75,45 | 81,99 | 91,46 | 100,66 |
8,59 | 20,47 | 35,62 | 42,79 | 50,97 | 64,44 | 75,50 | 83,53 | 91,75 | 101,10 |
9,27 | 20,50 | 36,39 | 43,61 | 51,36 | 65,71 | 76,59 | 84,27 | 92,81 | 102,21 |
3. Построение интервального вариационного ряда
Опытные данные объединяем в группы так, чтобы в каждой отдельной группе значения вариант будут одинаковы, и тогда можно определить число, показывающее, сколько раз встречается соответствующая варианта в определенной (соответствующей) группе.
Численность отдельной группы сгруппированного ряда опытных данных называется выборочной частотой соответствующей варианты x(i) и обозначается mi; при этом , где n – объем выборки.
Отношение выборочной частоты данной варианты к объему выборки называется относительной выборочной частотой и обозначается Pi*,
т.е. – число (частота) попаданий значений X в i-й разряд, n – объем выборки.
Т.к. согласно теореме Бернулли имеем, что т.е. выборочная относительная частота сходится по вероятности соответствующей вероятности, тогда из условия:
Интервальным вариационным рядом распределения называется упорядоченная совокупность частичных интервалов значений С.В. с соответствующими им частотами или относительными частотами.
Для построения интервального вариационного ряда выполняем следующие действия.
Находим размах выборки R = xmax – xmin. Имеем R = 102,21-3,59=98,62 .
Определяем длину частичного интервала ∆ – шаг разбиения по формуле Стерджеса: где n – объем выборки, К– число частичных интервалов . ,
∆=10
Определяем начало первого частичного интервала
После разбиения на частичные интервалы просматриваем ранжированную выборку и определяем, сколько значений признака попало в каждый частичный интервал, включая в него те значения, которые ≥ нижней границы и меньше верхней границы. Строим интервальный вариационный ряд (табл. 3).
Таблица 3
Разряды
|
mi |
= |
|||
1 | [3.5-13.5) | 14 | 0.14 | 0.014 | 8.5 |
2 | [13.5-23.5) | 6 | 0.06 | 0.006 | 18.5 |
3 | [23.5-33.5) | 7 | 0.07 | 0.007 | 28.5 |
4 | [33.5-43.5) | 12 | 0.12 | 0.012 | 38.5 |
5 | [43.5-53.5) | 12 | 0.12 | 0.012 | 48.5 |
6 | [53.5-63.5) | 7 | 0.07 | 0.007 | 58.5 |
7 | [63.5-73.5) | 8 | 0.08 | 0.008 | 68.5 |
8 | [73.5-83.5) | 12 | 0.12 | 0.012 | 78.5 |
9 | [83.5-93.5) | 13 | 0.13 | 0.013 | 88.5 |
10 | [93.5-103.5) | 9 | 0.09 | 0.009 | 98.5 |
Контроль |
=100 |
=1 |
Где -плотность относительной частоты
-середина частичных интервалов
Построение гистограммы
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению – плотность частоты (или – плотность частности).
По данным таблицы 4 строим гистограмму (рис. 1).
Гистограмма частот является статистическим аналогом дифференциальной функции распределения (плотности) случайной величины Х. Площадь гистограммы равна единице.
Выдвижение гипотезы о законе распределения генеральной совокупности
По данным наблюдений статистическое среднее и выборочное среднее квадратическое отклонение у* по значению почти совпадают. Учитывая данный факт, а также вид гистограммы можно предположить, что случайная величина имеет равномерное распределение.
По виду гистограммы выдвигаем гипотезу о равномерном законе распределения генеральной совокупности Х.
Оценка числовых характеристик и параметров закона распределения
Оценками математической статистики называют приближенные значения числовых характеристик или параметров законов распределения генеральной совокупности Х вычисленные на основе выборки.
Оценка называется точечной, если она определяется числом или точкой на числовой оси.
Оценка (как точечная, так и интервальная) является случайной величиной, так как она вычисляется на основе экспериментальных данных и является функцией выборки.
При вычислении точечных оценок для удобства берут не сами элементы выборки, а середины частичных интервалов из интервального вариационного ряда (табл. 1) и применяют формулы:
где n - объем выборки, – i-й элемент выборки
Составим таблицу для нахождения и
Таблица 4
i | ||
1 | 8.5*14=119 | |
2 | 18.5*6=111 | |
3 | 28.5*7=199.5 | |
4 | 38.5*12=462 | |
5 | 48.5*12=582 | |
6 | 58.5*7=409.5 | |
7 | 68.5*8=548 | |
8 | 78.5*12=942 | |
9 | 88.5*13=1150.5 | |
10 | 98.5*9=886.5 | |
6. Равномерный закон
интервальный вариационный генеральный совокупность
Выдвинута гипотеза о распределении генеральной совокупности Х по равномерному закону
найдем функцию плотности равномерного закона вычислив оценки параметров и
,
Т.к М(x)= , , D(x)=
Таблица 5
i | |
1 | |
2 | |
3 | |
4 | |
5 | |
6 | |
7 | |
8 | |
9 | |
10 | |
186 |
После того, как найдены значения функции плотности для каждого разряда, нанесем их прямо на гистограмму, получая тем самым кривую функции плотности
Проверка гипотезы о законе распределения генеральной совокупности по критерию Пирсона
В качестве меры расхождения между статистическим и гипотетическим (теоретическим) распределениями возьмем критерий Пирсона К = ч2.
Пирсон доказал, что значение статистического критерия не зависит от функции и от числа опытов n, а зависит от числа частичных интервалов интервального вариационного ряда. При увеличении ч2, и находится по формуле:
К = или К =
Дальнейшие вычисления, необходимые для определения расчетного значения выборочной статистики , проведем в таблице 5.
Таблица 6
i |
/ |
|||||
1 | 0.14 | 14 | 0.1029 | 10.29 | 13.76/10.37=1.33 | |
2 | 0.06 | 6 | 0.1 | 10 | 16/10=1.6 | |
3 | 0.07 | 7 | 0.1 | 10 | 16/10=1.6 | |
4 | 0.12 | 12 | 0.1 | 10 | 16/10=1.6 | |
5 | 0.12 | 12 | 0.1 | 10 | 16/10=1.6 | |
6 | 0.07 | 7 | 0.1 | 10 | 16/10=1.6 | |
7 | 0.08 | 8 | 0.1 | 10 | 16/10=1.6 | |
8 | 0.12 | 12 | 0.1 | 10 | 16/10=1.6 | |
9 | 0.13 | 13 | 0.1 | 10 | 16/10=1.6 | |
10 | 0.09 | 9 | 0.1149 | 11.49 | 6.3/11.49=0.548 | |
01.86 |
Чтобы найти значение надо воспользоваться табличными распределениями в которых значение сл. величины находят по заданному уровню значимости и вычисленному числу степеней свободы
R- число частичных интервалов в таблице 1 но если в некоторых из интервалов значения то надо объединить расположенные рядом интервалы так, чтобы тогда число
R-это число из необъединенных интервалов
i- число неизвестных параметров
В рассматриваемом эмпирическом распределении не имеются частоты, меньшие 5. Случайная величина ч2 (мера расхождения) независимо от вида закона распределения генеральной совокупности при (n ≥ 50) имеет распределение ч2 с числом степеней свободы
1) К =
уровень значимости б =1–=0,05
,
найдем по таблице значений критическое значение для б = 0,05 и =9
Имеем =16.9. Так как то предполагаемая гипотеза о показательном законе распределения генеральной совокупности не противоречит опытным данным и принимается на уровне значимости б.
2)=,
=
3) M(x)= ,
M(x)=
4) D(x)=
D(x.1)=
5) Таким образом, критическая область для гипотезы задается неравенством ; P()= Это означает, что нулевую гипотезу можно считать правдоподобной и гипотеза Но принимается
Вывод: В ходе расчетно-графической работы мы установили, что генеральная совокупность X распределена по равномерному закону, проверив это по критерию Пирсона. Определили параметры и числовые характеристики закона и построили для них доверительные интервалы.