Как отбросить выбивающиеся элементы из потока схожих (фильтрация входных данных)?

Question

Дмитрий @Tomasina

Инженер-разработчик

Как отбросить выбивающиеся элементы из потока схожих (фильтрация входных данных)?

есть такой входной поток:

Как можно выделить из этого два наиболее встречающихся числа из трех, для каждого сенсора?
Т.е. в данном случае получить тройки [*, 53, 27], [*, 46, 37], [2, 17 *], [*, 95, 51].

Сейчас используется среднее арифметическое, но из-за случайных всплесков отклонение от "эталона" получается более 3 единиц, что не устраивает: получается [25, 53, 25], [32, 46, 33], [5, 17, 4], [54, 95, 52].

Грубо говоря, из 200 чисел в каждой колонке надо отбросить явно случайные всплески, которые сильно отличаются от остальных, затем найти для каждой колонки число с максимальной частотой появления (плюс-минус допустимая погрешность) и выбрать из каждой тройки два наиболее часто встречающихся числа.

Как называются такие алгоритмы? В частности, с языке C++.

Вопрос задан более трёх лет назад
199 просмотров

1 комментарий

Подписаться 1 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Разработчик на C++

12 месяцев

Далее
Академия Эдюсон

Разработчик игр на Unreal Engine + ИИ

9 месяцев

Далее
Stepik

Профессия: Разработчик C++ (Junior)

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

Простой
Нарушается ли тут strict aliasing rule?
- 1 подписчик
- 21 час назад
- 25 просмотров
1

ответ
C++

Простой
Безопасно ли преобразование reinterpret_cast из указателя в массив?
- 1 подписчик
- вчера
- 37 просмотров
1

ответ
C++

Простой
Как сделать скриншот второго монитора на С++?
- 1 подписчик
- 14 июл.
- 120 просмотров
4

ответа
C++

Простой
Возможно ли сделать скрин действующего окна через Alt + PrtSc на С++?
- 1 подписчик
- 08 июл.
- 138 просмотров
2

ответа
C++

Простой
Как можно через ООП сериализировать в разные форматы в едином стиле?
- 2 подписчика
- 07 июл.
- 101 просмотр
3

ответа
C++

+1 ещё

Простой
Почему компилятор подчёркивает импортируемый класс как ошибку «индификатор не определён»?
- 1 подписчик
- 04 июл.
- 114 просмотров
2

ответа
C++

Сложный
Концепт проверки совместимости с шаблонным конструктором?
- 1 подписчик
- 25 июн.
- 102 просмотра
1

ответ
C++

Простой
Я единственный у кого cppreference.com через раз падает с ERR_TIMED_OUT?
- 1 подписчик
- 21 июн.
- 192 просмотра
2

ответа
C++

+1 ещё

Простой
Как правильно посчитать UV координаты из локальных нормальных?
- 1 подписчик
- 20 июн.
- 113 просмотров
1

ответ
C++

+3 ещё

Простой
Почему бинарник скомпилированный через CMake весит больше, чем напрямую скомпилированный через clang++?
- 1 подписчик
- 11 июн.
- 342 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2015-08-07 03:47:31

Могу предложить тупое решение.
Накапливайте кол-во встречающихся чисел, например, в std::map<int, std::size_t>

std::map<int, std::size_t> m;
for (int v : vals) { ++m[v]; }
std::vector<std::pair<int, std::size_t> > v(m.begin(), m.end());
std::sort(v.begin(), v.end(), [] (std::pair<int, std::size_t> const & l, std::pair<int, std::size_t> const & r) { return l.second > r.second; });
// в v пары "число - кол-во таких чисел", отсортированы по убыванию
// можно откинуть нижнюю часть (те, которые встречаются реже, чем какой-то процент, например, 10%)
v.erase(
  std::find_if(v.begin(), v.end(), [] (std::pair<int, std::size_t> const & x) { return x.second < (v.size() / 10); }),
  v.end());
// а сверху взять часто встречающиеся
int row_value = v.front().first;

Answer 2 · 2015-08-10 09:04:10

Дмитрий @Tomasina Автор вопроса

Инженер-разработчик

Положение спас медианный фильтр, при глубине 10-20 итераций все лишнее замечательно отсекается.

Ответ написан более трёх лет назад

Комментировать

Как отбросить выбивающиеся элементы из потока схожих (фильтрация входных данных)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт