Рефетека.ру / Эк.-мат. моделирование

Реферат: Доверительный интервал. Проверка статистических гипотез


Доверительный интервал.

Проверка статистических гипотез

1. Доверительный интервал


Точечные оценки являются приближенными, так как они указывают точку на числовой оси, в которой должно находиться значение неизвестного параметра. Однако оценка является приближенным значением параметра генеральной совокупности, которая при разных выборках одного и того же объема будет принимать разные значения, поэтому в ряде задач требуется найти не только подходящее значение параметра а, но и определить его точность и надежность.

Для этого в математической статистике используется два понятия – доверительный интервал и доверительная вероятность. Пусть для параметра а из опытных данных получена несмещенная оценка Доверительный интервал. Проверка статистических гипотез Требуется определить возможную при этом величину ошибки и вероятность того, что оценка не выскочит за пределы этой ошибки (надежность).

Зададимся некоторой вероятностью b (например, b = 0,99) и найдем такое значение e > 0, для которого

Доверительный интервал. Проверка статистических гипотез

Представим это выражение в виде

Доверительный интервал. Проверка статистических гипотез

Это значит, что с вероятностью b точное значение параметра а находится в интервале le Доверительный интервал. Проверка статистических гипотез


Доверительный интервал. Проверка статистических гипотез le


Доверительный интервал. Проверка статистических гипотез


Здесь параметр а – неслучайная величина, а интервал le является случайным, так как Доверительный интервал. Проверка статистических гипотез - случайная величина. Поэтому вероятность b лучше толковать, как вероятность того, что случайный интервал le накроет точку а. Интервал le называют доверительным интервалом, а вероятность b - доверительной вероятностью (надежностью).

Пример. Если при измерении какой-то величины Х указывается абсолютная погрешность Dх, то это, по существу, означает, что погрешность измерения, являясь случайной величиной, равномерно распределена в интервале (-Dх, Dх) и Доверительный интервал. Проверка статистических гипотез где Х* - измеренная величина, а х – ее точное значение. Здесь b = 1, e = Dх и le = (x*- Dх, x* + Dх).


Доверительный интервал для математического ожидания

В качестве еще одного примера рассмотрим задачу о доверительном интервале для математического ожидания. Пусть проведено n независимых опытов измерения случайной величины Х с неизвестным математическим ожиданием mx и дисперсией s2. На основании опытных данных Х1, Х2, ... , Хn построим выборочные оценки


Доверительный интервал. Проверка статистических гипотез


Требуется построить (найти) доверительный интервал le, соответствующий доверительной вероятности b, для среднего генерального mx.

Так как среднее выборочное Доверительный интервал. Проверка статистических гипотез представляет сумму n независимых одинаково распределенных случайных величин Доверительный интервал. Проверка статистических гипотез то при достаточно большом объеме выборки согласно центральной предельной теоремы ее закон близок к нормальному. Существует эмпирическое правило, по которому при объеме выборки n і 30 выборочное распределение можем считать нормальным.

Ранее было показано, что Доверительный интервал. Проверка статистических гипотез Найдем теперь такую величину e(b) > 0, для которой выполняется равенство


Доверительный интервал. Проверка статистических гипотез


Считая случайную величину Доверительный интервал. Проверка статистических гипотез нормально распределенной, имеем


Доверительный интервал. Проверка статистических гипотез


После замены Доверительный интервал. Проверка статистических гипотез имеем


Доверительный интервал. Проверка статистических гипотез


По табличным значениям функции Лапласа Ф*(z) находим аргумент, при котором она равна b. Если этот аргумент обозначить Zb, то тогда


Доверительный интервал. Проверка статистических гипотез


Среднее квадратичное значение Доверительный интервал. Проверка статистических гипотез приближенно можно заменить


Доверительный интервал. Проверка статистических гипотез Доверительный интервал. Проверка статистических гипотез где Доверительный интервал. Проверка статистических гипотез


Таким образом, доверительный интервал для среднего генерального равен:

le = Доверительный интервал. Проверка статистических гипотез


Если пользоваться табличными значениями интеграла вероятностей


Доверительный интервал. Проверка статистических гипотез


то доверительный интервал принимает вид


le = Доверительный интервал. Проверка статистических гипотез


Распределение Стьюдента

При малом объеме выборки (n < 30) полученный доверительный интервал для среднего генерального, использующий нормальное распределение случайной величины Доверительный интервал. Проверка статистических гипотез, может быть очень грубым.

Для более точного получения доверительного интервала необходимо знать закон распределения случайной величины Доверительный интервал. Проверка статистических гипотез при малом объеме выборки. Для этого воспользуемся следующим результатом. Пусть Х1, Х2, ... , Хn – выборка нормально распределенной случайной величины Х, тогда, как доказано, случайная величина


Доверительный интервал. Проверка статистических гипотез


подчиняется распределению Стьюдента c n – 1 степенью свободы, плотность распределения которого имеет вид

Доверительный интервал. Проверка статистических гипотез


где Доверительный интервал. Проверка статистических гипотез - гамма функция. Эта плотность, как видно из формулы, зависит только от числа опытов n. Ниже представлены графики плотностей нормированной (mx = 0, s = 1) нормально распределенной и с распределением Стьюдента (n = 4) случайных величин.


Доверительный интервал. Проверка статистических гипотез

Доверительный интервал. Проверка статистических гипотез f

Доверительный интервал. Проверка статистических гипотез

Доверительный интервал. Проверка статистических гипотезДоверительный интервал. Проверка статистических гипотез 0,4

0,3

0,2

0,1

-4 -3 -2 -1 1 2 3 4 t


На основании найденных Доверительный интервал. Проверка статистических гипотез можно, пользуясь распределением Стьюдента, найти доверительный интервал для mx , соответствующий доверительной вероятности b. Действительно, так как Доверительный интервал. Проверка статистических гипотез то


Доверительный интервал. Проверка статистических гипотез

Доверительный интервал. Проверка статистических гипотез

Пользуясь таблицей значений интеграла


Доверительный интервал. Проверка статистических гипотез

по значению b найдем величину Доверительный интервал. Проверка статистических гипотез а следовательно, и сам доверительный интервал le = Доверительный интервал. Проверка статистических гипотез

Проверка статистических гипотез

Принятие решения о параметрах генеральной совокупности играет исключительно важную роль на практике. Рассмотрим вопрос о принятии решения на примере. Пусть фирма, выпускающая конденсаторы, утверждает, что среднее пробивное напряжение конденсаторов равно или превышает 300 В. Испытав 100 конденсаторов, мы получили, что среднее выборочное пробивное напряжение равно 290 В, а несмещенное выборочное среднее квадратичное отклонение sn = 40 В. Можно ли с доверительной вероятностью 0,99 утверждать, что среднее пробивное напряжение превышает 300 В.

Здесь нас интересует односторонняя оценка – среднее пробивное напряжение должно превышать 300 В.

Выскажем статистическую гипотезу – генеральное среднее mx = 300 В, а затем проверим, соответствует ли она результатам наблюдения. Поскольку объем выборки больше 30, то выборочное среднее можно считать гауссовской случайной величиной с генеральной дисперсией s2 » sn2. Введем центрированную и нормированную величину


Доверительный интервал. Проверка статистических гипотез


Утверждение о том, что среднее выборочное напряжение Доверительный интервал. Проверка статистических гипотез эквивалентно утверждению, что случайная величина


Доверительный интервал. Проверка статистических гипотез


Найдем вероятность того, что гауссовская случайная величина Z с mz = 0 и sz = 1 принимает значения больше zo:

Доверительный интервал. Проверка статистических гипотез


Эта величина должна равняться доверительной вероятности 0,99. Тогда Доверительный интервал. Проверка статистических гипотез и по таблицам значений функции Доверительный интервал. Проверка статистических гипотез находим аргумент zo = -2,33. Вычислим теперь наблюдаемое значение случайной величины Z:


Доверительный интервал. Проверка статистических гипотез


Мы видим, что наблюдаемое значение z = - 2,5 нe принадлежит интервалу [-2,33;Ґ), поэтому гипотезу нужно отвергнуть.

Приведем пример гипотезы с двухсторонней оценкой. Пусть фирма, выпускающая стабилитроны определенного типа, утверждает, что номинальное напряжение стабилизации стабилитронов равно 10 В. Естественно, что отклонение напряжения стабилизации в меньшую или большую стороны одинаково нежелательно. Выдвинем гипотезу, что генеральное среднее напряжение стабилизации равно 10 В, а затем проверим эту статистическую гипотезу по результатам наблюдения.

Пусть при испытании 100 стабилитронов среднее выборочное равно 10,3 В, а несмещенное выборочное среднее квадратичное отклонение равно 1,2 В. Можно ли с доверительной вероятностью 0,95 считать выдвинутую гипотезу справедливой? Так как объем выборки больше 30, то можно, как и в предыдущем примере, ввести гауссовскую случайную величину Z. Найдем


Доверительный интервал. Проверка статистических гипотез

и приравняем правую часть полученного соотношения 0,95. Тогда Доверительный интервал. Проверка статистических гипотез и zo =1,96. Это значит, что наблюдаемое значение z должно принадлежать интервалу (-1,96; 1,96). Поскольку Доверительный интервал. Проверка статистических гипотезДоверительный интервал. Проверка статистических гипотез не попадает в указанный интервал, то гипотеза отвергается.

Если объем выборки n < 30, то случайная величина Доверительный интервал. Проверка статистических гипотез cчитается стьюденской случайной величиной T. Поэтому повторяя все указанные выше выкладки для проверки статистических гипотез, значения аргумента ищутся для распределения Стьюдента. При этом, так как "хвосты" стьюденского распределения по отношению к гауссовским удлиняются, доверительные интервалы расширяются, а возможности принятия гипотез улучшаются.

Функция риска

доверительный интервал вероятность статистическая гипотеза

Пусть имеются две противоположные гипотезы Но и Н1 и некоторая связанная с ними случайная величина Y. И пусть у - значение случайной величины Y, полученное в результате испытаний, которое принадлежит множеству D - множество всех значений случайной величины Y. Требуется провести проверку гипотезы Но относительно конкурирующей гипотезы Н1 на основании результатов испытания.

Разобьем множество D на две части - Dо и D1 с условием принятия гипотезы Но при попадании полученного значения у в Dо и гипотезы Н1 - при попадании у в D1. Выбор решающего правила, то есть разбиение множества D на две части Dо и D1 в любой задаче проверки гипотез возможен больше, чем одним способом. Возникает вопрос, какое из этих разбиений в каждой конкретной задаче считать наилучшим? Чтобы решить поставленную задачу нужно обладать некоторой дополнительной информацией. Такая информация носит название априорной.

Будем считать известными два условных распределения вероятностей случайной величины Y:

Доверительный интервал. Проверка статистических гипотез - плотность распределения случайной величині Y при условии, что верна гипотеза Но;

Доверительный интервал. Проверка статистических гипотез - плотность распределения случайной величині Y при условии, что верна гипотеза Н1;

Кроме того нам потребуется априорная вероятность р того, что гипотеза Но имеет место.

Введем в рассмотрение события:

А – верна гипотеза Но, тогда р = р(А);

Доверительный интервал. Проверка статистических гипотез – верна конкурирующая гипотеза Н1, тогда р(Доверительный интервал. Проверка статистических гипотез) = 1 - р;

В – в результате эксперимента значение у попало в интервал Dо;

Доверительный интервал. Проверка статистических гипотез – в результате эксперимента значение у попало в интервал D1.

Тогда по результатам эксперимента возможны только четыре события:

АВ – верна гипотеза Но и принято решение о ее истинности;

Доверительный интервал. Проверка статистических гипотезВ – верна гипотеза Н1, а принято решение о истинности гипотезы Но;

АДоверительный интервал. Проверка статистических гипотез – верна гипотеза Но, а принято решение о истинности гипотезы Н1;

Доверительный интервал. Проверка статистических гипотезДоверительный интервал. Проверка статистических гипотез – верна гипотеза Н1 и принято решение о ее истинности.

Ясно, что события Доверительный интервал. Проверка статистических гипотезВ и АДоверительный интервал. Проверка статистических гипотез определяют ошибочные решения. Событию Доверительный интервал. Проверка статистических гипотезВ соответствует так называемая ошибка первого рода, а событию АДоверительный интервал. Проверка статистических гипотез - ошибка второго рода.

Для ответа на вопрос, какое из решающих правил следует считать лучшим, введем понятие функции потерь и функцию риска.

Функция потерь – дискретная случайная величина С, которая каждому из событий АВ, Доверительный интервал. Проверка статистических гипотезВ, АДоверительный интервал. Проверка статистических гипотез, Доверительный интервал. Проверка статистических гипотезДоверительный интервал. Проверка статистических гипотез ставит в соответствие потери Доверительный интервал. Проверка статистических гипотез, выраженные в каких-то единицах. Правильному решению естественно положить нулевые потери, а ошибкам первого и второго ряда положить соответственно положительные потери (числа) С1 и С2, которые нужно задать.

Пусть ро = р(АВ или Доверительный интервал. Проверка статистических гипотезДоверительный интервал. Проверка статистических гипотез), р1 = р(Доверительный интервал. Проверка статистических гипотезВ), р2 = р(АДоверительный интервал. Проверка статистических гипотез). Определение значений этих вероятностей будет проведено ниже. Ряд распределения для случайной величины С имеет вид


С 0 с1 с2
р ро р1 р2

Определение. Математическое ожидание М(С) случайной величины С называется функцией риска и обозначается буквой r.

Таким образом, r = М(С) = 0 ро + с1 р1 + с2 р2 = с1 р1 + с2 р2.

Введение функции риска приводит к естественному выбору решающего правила. Из двух правил лучшим считается то, которое приводит к меньшему риску. Для нахождения минимума функции риска найдем вероятности р1 и р2:

Доверительный интервал. Проверка статистических гипотез

Доверительный интервал. Проверка статистических гипотез

Тогда

Доверительный интервал. Проверка статистических гипотез

Доверительный интервал. Проверка статистических гипотез

Доверительный интервал. Проверка статистических гипотез


Для того, чтобы интеграл был минимальным, а значит и минимальное значение принимала функция риска r, нужно в состав Dо включить только те у, в которых подыинтегральная функция


С1 (1-р) f1(y) – p C2 fo(y) < 0,


а в состав D1- остальные значения у.

Последнее неравенство можно записать в виде


Доверительный интервал. Проверка статистических гипотез


Функция f1(y)/fo(y) называется отношением правдоподобия.

Итак, оптимальное решающее правило заключается в следующем: полученное в результате эксперимента значение у подставляется в отношение правдоподобия f1(y)/fo(y) и сравнивается с числом

l = Доверительный интервал. Проверка статистических гипотез


если полученное в результате вычисления число f1(y)/fo(y) меньше l, принимается гипотеза Но; в противном случае – гипотеза Н1.

Величина l носит название порога, а оптимальное решающее правило носит название порогового критерия оптимальности.

Размещено на

Похожие работы:

  1. • Математическая статистика
  2. • Элементы математической статистики
  3. • Распределение "хи-квадрат" и его применение
  4. • Экономическое планирование методами математической статистики
  5. • Статистическая проверка гипотез
  6. • Статистический анализ выборочных совокупностей
  7. • Статистическое моделирование
  8. • Доверительные интервалы прогноза. Оценка ...
  9. • Определение законов распределения случайных величин и их ...
  10. • Теория вероятностей и математическая статистика
  11. •  ... интервальных и пропорциональных шкал. Доверительные интервалы
  12. • Теоретические аспекты управления доходами и ...
  13. • Информационные технологии в эконометрике
  14. • Математическая статистика
  15. • Комплексная статистическая обработка ...
  16. • Нормальный закон распределения
  17. • Нормальный закон распределения
  18. • Статистический анализ числовых величин (непараметрическая ...
  19. •  ... Basic для проверки гипотезы о нормальности остатков ...
Рефетека ру refoteka@gmail.com