Задать вопрос
@okkkman

Как убрать дублирующие данные?

Всем привет.

Как в ElasticSearch найти все дублирующие записи, у которых в _id указан хэш, а не цифры?
И удалить их?

Уже часа три сижу, не могу найти подходящий способ
  • Вопрос задан
  • 96 просмотров
Подписаться 1 Средний Комментировать
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Мидл Python-разработчик
    6 месяцев
    Далее
  • OTUS
    PHP Developer. Professional
    5 месяцев
    Далее
  • Merion Academy
    Курс по NoSQL. Нереляционные базы данных
    1 месяц
    Далее
Решения вопроса 1
@iva3682
использовать aggs по term + top_hits
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
Ranwise
@Ranwise
регулярные выражения попробовать, типа для md5 ^[a-f0-9]{32}$
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы