BitNeBolt, Вообще-то есть целый раздел в Мachine Learning и ее применениях для (технической) диагностики/мониторинга объектов, который называется "обнаружение аномалий". Который в свою очередь делиться на "обнаружение выбросов", обнаружение novelty" и на "change point detection". В зависимости от поставленной задачи и особенностей набора данных могут применяться (и будут "лучше работать") разные методы. Однозначного ответа нет. Но даже в ваших данных видно, что метод "обрезаем по среднему значению" подходит только, если есть абсолютный ноль. А в жизни так бывает не всегда. Так что однозначного ответа нет. Всегда надо пробовать и сравнивать несколько. Конечно, если речь идет о профессиональном подходе и о задачах, когда ошибка (кстати - тоже разная - первого, второго рода - для разных задач имеет большую важность) может обойтись дорого.
А для учебного применения или "для себя" - ну можно и "по среднему".