@PenguinVasily

Как нормализовать список чисел?

У меня есть список цен, за которые продавался предмет на торговой площадке в течении нескольких месяцев. Мне необходимо получить среднюю стоимость этого товара. Но проблема в том, что в этот список цен попадают неадекватные транзакции. Например, предмет за пару рублей покупали за несколько десятков тысяч. Это портит среднюю стоимость товара.
  • Вопрос задан
  • 143 просмотра
Пригласить эксперта
Ответы на вопрос 1
mayton2019
@mayton2019
Bigdata Engineer
Эта неадекватная транзакция называется "выбросом".

Есть много методик фильтрации выбросов. Но я помню только ящик с усами. Это что-то вроде биржевой свечки. Только вместо цены открытия и закрытия в ящике отмечают 1-3 квартили. И на диаграмме этого ящика строится межквартильный размах, как функция этих квартилей. Обычно с линейным коэфициентом. И далее четко видно что выбросы выходят за границы этого размаха.

Но это не точная методика. Она может случайно убить и нужные транзакции. Поэтому надо внимательно смотреть на данные и проверять.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы