@tim_ka18

Обоснованность бутстрап метода.Почему можно экстраполировать на генеральную совокупность?

Допустим, мы имеем некую выборку,которую мы считаем репрезентативной. Методом бустрепинга делаем несколько тысяч ресемплов и каждый раз находим,например, среднее значение полученной выборки.Строим функцию распределения вероятности и считаем 2.5 и 97.5 перцентили. Почему на основе этого мы можем быть уверены что этот интервал покроет среднее значение в генеральной совокупности с вероятностью в 95%, не зная распределения,а основываясь только лишь на выборках?
  • Вопрос задан
  • 88 просмотров
Решения вопроса 1
@dmshar
Что-то немного не сходится. Проведя ресемплинг мы получаем эмпирическую функцию распределения (например) среднего значения. Для этого распределения (а не для распределения исходной выборки) мы можем строить доверительный интервал, т.е. такие пределы, в которых (условно) в 95 случаях из ста попадет среднее нашей выборки.
Т.е. реальное среднее реальной выборки или матожидание генеральной совокупности вполне может и не попасть в этот доверительный интервал, но вероятность этого меньше 5%. Причем такое заключение мы сделали исключительно на основе имеющихся данных. Если вдруг у нас появятся дополнительные данные из той-же генеральной совокупности, то вполне возможно, что наше заключение придется корректировать.
Главное понять: статистика - это не об уверенности. Никогда! Статистика это на самом деле о вероятности ошибиться в своей уверенности.
P.S. Все таки загляните в книгу, которую я вам порекомендовал в другом месте.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы