Тема 2. Статистическое оценивание параметров распределений

Точечные оценки параметров распределений

Точечная оценка математического ожидания
Пусть выборка из генеральной совокупности, соответствующей случайной величине x с неизвестным математическим ожиданием Mx =q  и известной дисперсией  .
Рассмотрим оценку неизвестного математического ожидания

.

Оценка несмещённая, поскольку её математическое ожидание равно Mx =q  :

,
Оценка состоятельная, поскольку при n®¥, :

.

Итак, для оценки неизвестного математического ожидания случайной величины будем использовать выборочное среднее: .

Точечная оценка дисперсии
Для дисперсии  случайной величины  можно предложить следующую оценку:

, где  — выборочное среднее.

Доказано, что эта оценка состоятельная, но смещенная.
В качестве состоятельной несмещенной оценки дисперсии используют величину

.

Именно несмещенностью оценки  объясняется ее более частое использование в качестве оценки дисперсии.

Пример 1

Пример 1. Задана выборка, содержащая 100 значений случайной величины.

Вычислим точечные оценки математического ожидания и дисперсии случайной величины.

На приведенном ниже рисунке изображён фрагмент листа Excel с вычислениями.

Получили .

 

Точечная оценка вероятности события

Предположим, что в некотором эксперименте событие A происходит (благоприятный исход испытания) с вероятностью p и не происходит с вероятностью q =1– p и пусть случайная величина  m — количество  благоприятных исходов в серии испытаний. Задача состоит в получении по результатам серии n случайных экспериментов оценки  неизвестного параметра  распределения p.

При заданном числе испытаний n  величина m — случайная величина, имеющая биномиальное распределение. Если событие A в серии из n независимых испытаний произошло m раз, то m значение случайной величиныm.

Оценку  величины  будем вычислять по формуле .

Эта оценка несмещённая, состоятельная и эффективная.

Доказано, что эта оценка эффективна — обладает при прочих равных условиях минимальной дисперсией.

На рисунке приведен график зависимости точечной оценки вероятности p числа успехов от числа испытаний n в серии испытаний Бернулли. График построен по выборке 1000 значений случайной величины, имеющей биномиальное распределение с параметром p = 0.4. Видно, что с ростом числа испытаний точечная оценка приближается к известному точному значению параметра, которое равно 0.4.

 

График зависимости точечной оценки вероятности от числа испытаний

Пример 2

Пример 2. Задана выборка, содержащая  20 значений случайной величины (значения m) количество успехов в эксперименте из 1000 независимых испытаний (проведено 20 одинаковых экспериментов по 1000 независимых испытаний в каждом).

Найдём точечную оценку  вероятности успеха  p и исследуем статистические свойства этой оценки.

На приведенных ниже рисунках изображены фрагменты листа Excel с вычислениями.

 

Вычисленные значения оценки вероятности записаны в столбце B. Видно, что все эти значения близки к 0.3.

 

Значения вероятности  лежат в интервале [0.2672, 0.3525], . Можно достаточно уверенно полагать вероятность успеха равной 0.3.

 

Точечная оценка параметров равномерного распределения

Пусть  выборка из генеральной совокупности, соответствующей случайной величине x, имеющей равномерное распределение на [0, q ] с неизвестным параметром q. Наша задача — оценить этот неизвестный параметр.

Для случайной величины  x , имеющей равномерное распределение на [0, q] математическое ожидание и дисперсия известны:  и .

 

А поскольку оценка  величины Mx  известна, , то за оценку  параметра  q можно взять оценку .

 

Несмещенность оценки очевидна: .

Состоятельность:

 

 ,

 

т.е. при n® ¥ дисперсия оценки  стремится к нулю.

Для получения другой оценки  параметра  обратимся к другой статистике:  

Пусть .

Найдем функцию распределения случайной величины :

,  для .

Тогда математическое ожидание и дисперсия случайной величины  равны соответственно  и , т.е. оценка  состоятельная, но смещенная.

Однако если вместо  рассмотреть , то  и , — состоятельная и несмещенная оценка.

А поскольку , то оценка  существенно эффективнее оценки . Например, при  разброс оценки  в 33 раза меньше разброса оценки .

Последний пример еще раз показывает, что выбор статистической оценки неизвестного параметра распределения — важная и нетривиальная задача.

Пример 3

Пример 3. Задана выборка, содержащая 100 значений случайной величины, о которой известно, что она имеет равномерное распределение на промежутке [0, q].

Вычислим и сравним три оценки неизвестного параметра q, котрые вычисляются по формулам:

, , .

На приведенном ниже рисунке изображён фрагмент листа Excel с вычислениями.

Получили, что оценки  и  близки. Это и понятно, сомножитель  в оценке  при больших  мало отличается от единицы.

Хостинг от uCoz