Как корректно сравнить две выборки по гистограммам?

Есть две целочисленные выборки (точнее, даже, их гистограммы, но по гистограмме можем получить вариационный ряд). Выборки разного размера.
Как корректно их сравнить на предмет того, они из одного и того же распределения или нет?
Критерий Пирсона, Смирнова или какой-то ещё, и почему?
  • Вопрос задан
  • 2908 просмотров
Решения вопроса 1
@Rodres
Лепский А.Е. "Сравнение вероятностных распределений". Статья доступна для скачивания.
В статье - исчерпывающий ответ: все известные методы, минимальное описание.
Корректны будут все сравнения в той или иной степени, "лучшее" отсутствует в принципе. Где-то одно лучше подходит, где-то другое.
Если надо выбирать, то для гистограмм, в которых могут иметься "помехи", ошибки и т.п. предпочитают сравнение не бин-бин, а все бины со всеми. Соответственно, одно из устойчивых, часто применяемых и вполне "хороших" - Earth mover's distance
Грубо говоря, этот метод можно применять в очень широком диапазоне "качества" исходных данных.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы