Тема 3. Проверка статистических гипотез

Обсуждение

Пусть дана некоторая оценка   неизвестного параметра распределения , построенная по выборке x1, x2, …, xn  из случайной величины x.

Предположим, что есть основания считать, что истинное значение оцениваемого параметра равно q 0.

Поскольку  — случайная величина, то выборочное значение , вряд ли будет совпадать с q0. В связи с этим возникает вопрос: при каком отклонении  от q0  и с какой степенью уверенности можно утверждать, что истинное значение оцениваемого параметра q отлично от q0

Ответом на этот вопрос может быть значение вероятности того, что больше некоторого фиксированного числа, вычисленной в предположении, что .

Если эта вероятность мала, то мы являемся свидетелями маловероятного события, т.е. отличие эмпирического значения  от гипотетического значения q0 представляется значимым и гипотеза о том, что q=q0 должна быть отвергнута.

Если же эта вероятность велика, то отклонение  от q0, по-видимому, обусловлено естественной случайностью, и гипотеза q =q0 может быть принята.

Рассмотрим простой пример.

Предположим, что нужно проверить игральную кость. Если кость «честная», то вероятность выпадения каждой грани равна 1/6. Отсюда следует, что при 600 бросках каждая грань должна выпасть около 100 раз.

Если в результате получим, что 1 выпала 100 раз, 2 — 99 раз, 3 — 98, 4 — 102, 5 — 100 и 6 — 101 раз, то вряд ли кто-нибудь усомнится в том, что кость правильная.

Если же, скажем, 1 выпала 600 раз, то хотя вероятность такого исхода отлична от нуля,  вряд ли кто-нибудь поверит в правильность кости.

Задача состоит в выработке общего подхода к процедуре, которая называется проверкой статистических гипотез.

Пусть  — выборочное значение оцениваемого параметра q  и пусть   и  соответственно плотность вероятностей и функция распределения случайной величины  при условии, что .

Рис. 1. Области принятия и отклонения гипотез

На рисунке изображен график функции . На графике отмечена точка qleft  для которой выполнено условие , точка и qright, для которой  , где a — некоторое малое число.

На графике заштрихованы области,  для которых   и .

Важно помнить, что все вычисления выполнены в предположении, что q =q0.

Число a  имеет простой смысл: если вероятность события меньше a, то событие маловероятно и мы не можем быть свидетелем такого события.

Иными словами, если вычисленное значение  окажется вне промежутка (qleft, qright), то событие  маловероятно и есть все основания усомниться в том, что истинное значение параметра q  равно  q0   и гипотезу о том, что следует отвергнуть (отклонить).

Если же  попадает в интервал (qleft, qright), то гипотеза о том, что q =q0 может быть принята.

Поскольку на самом деле функция распределения оцениваемого параметра q  не известна, то поступим следующим образом. Подберем, «сконструируем», функцию выборочных значений , которая представляет собой случайную величину с известным стандартным распределением.

Важно, что случайная величина , критерий , имеет стандартное распределение только при  условии, что выдвинутая гипотеза  верна.

Важно также, что это стандартное распределение не зависит от оцениваемого параметра q.

Затем вычисляем границы критической области для критерия

Если вычисленное по выборке значениене попадает в критическую область, то событие  маловероятно и гипотезу о том, что следует отвергнуть(отклонить).

Если же значение критерия не попадает в критическую область, то гипотеза о том, что может быть принята.

Вероятность a, использованная при вычислении границ критической области критерия,  называется уровнем значимости.

Области значений, при которых гипотеза отвергается или принимается, называются соответственно областью отклонения гипотезы (критической областью) и областью принятия гипотезы.

В приведенном на рисунке примере критерий проверки гипотезы был двусторонним, поскольку значимыми были отклонения  от q0 в обе стороны.

Если могут быть значимы отклонения только в одну строну ( или ) то строятся односторонние критерии.

Универсальный алгоритм проверки статистических гипотез о значении параметра состоит в следующем.

Заметим, что если проверяется гипотеза  против альтернативы , то соответствующий критерий двусторонний.

Если гипотеза  проверяется против альтернативы  или против альтернативы , то соответствующий критерий односторонний.

Следует обратить внимание на то, что в рассматриваемых задачах принятие или отклонение гипотезы не носит категорического характера.

Решение об отклонении или принятии гипотезы может быть ошибочным. Ошибка при этом  может быть одного из двух типов:

— гипотеза  отклонена, хотя она на самом деле верна (ошибка первого рода);

— гипотеза принята, хотя она на самом деле неверна (ошибка второго рода).

 

Хостинг от uCoz