Задать вопрос
@okkkman

Как убрать дублирующие данные?

Всем привет.

Как в ElasticSearch найти все дублирующие записи, у которых в _id указан хэш, а не цифры?
И удалить их?

Уже часа три сижу, не могу найти подходящий способ
  • Вопрос задан
  • 77 просмотров
Подписаться 1 Средний Комментировать
Решения вопроса 1
@iva3682
использовать aggs по term + top_hits
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
Ranwise
@Ranwise
регулярные выражения попробовать, типа для md5 ^[a-f0-9]{32}$
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы