Как в Elasticsearch проверить, что массив содержит определенное количество значений?

Question

Nikolai Khoziashev @The_Last_Dot

Как в Elasticsearch проверить, что массив содержит определенное количество значений?

В бд, в колонке shifts, типа jsonb есть массив объектов

[{"id": 1, "name": " first"}, {"id": 2, "name": " second"}]

В Elasticsearch индексирую следующим образом:

shifts: {
  type: 'object',
  dynamic: false,
  properties: { id: { type: 'keyword' }, { type: 'keyword' } },
}

Допустим, чтобы проверить, что массив не пустой, я делаю следующее:

query: {
  bool: {
    filter: {
      exists: {
        field: 'shifts.id',
      }
    }
  }
}

Вопрос: Как мне проверить, что массив содержит именно 2 значения?
Пытался делать:

query: {
  bool: {
    filter: {
      script: {
        script: {
          source: "doc['shifts'].values.length = 2"
        }
      }
    }
  }
}

Ошибка: 'ResponseError: x_content_parse_exception: [parsing_exception] Reason: [script] query does not support [source]'
PS: Предпринимал разные решения, но так и не понял, как сделать это
Спасибки!

Вопрос задан более трёх лет назад
544 просмотра

Комментировать

Подписаться 2 Простой Комментировать

Решения вопроса 2

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Elasticsearch

Простой
Почему opensearch создает кучу процессов?
- 2 подписчика
- 04 авг.
- 271 просмотр
1

ответ
PHP

+1 ещё

Простой
Как в выборке sql обратиться к предыдущей записи?
- 2 подписчика
- 30 июл.
- 282 просмотра
6

ответов
SQL

Простой
Как реализовать набор таблиц?
- 1 подписчик
- 01 июл.
- 169 просмотров
1

ответ
SQL

Простой
Как отсортировать по полю и id в sql?
- 1 подписчик
- 18 июн.
- 193 просмотра
1

ответ
Elasticsearch

Простой
Как побороть несовместимость версий elasticsearch и его fluent плагина?
- 2 подписчика
- 11 июн.
- 272 просмотра
0

ответов
SQL

+1 ещё

Простой
Как найти нужные столбцы в таблице oracle по содержанию?
- 2 подписчика
- 04 июн.
- 102 просмотра
1

ответ
SQL

Средний
Помощь в решении задачи 96, Sql-ex?
- 1 подписчик
- 03 июн.
- 319 просмотров
2

ответа
Elasticsearch

Простой
К какому методу API ElasticSearch необходимо делать запрос для получения количества документов?
- 1 подписчик
- 27 мая
- 33 просмотра
1

ответ
SQL

Простой
Как выбрать из таблицы нужный раут REST API?
- 1 подписчик
- 07 мая
- 157 просмотров
2

ответа
SQL

+2 ещё

Простой
Как внести большое количество данных из Excel и pdf файла в БД?
- 2 подписчика
- 23 апр.
- 343 просмотра
3

ответа
Показать ещё Загружается…

Backend Python/SQL

ПерилаГлавСнаб • Москва

от 150 000 до 250 000 ₽

Разработчик Idea Platform, Java и SQL

Idea Platform • Москва

от 100 000 до 250 000 ₽

Data Analyst со знанием 1C / SQL / Python

Agro.Сlub • Воронеж

от 150 000 до 200 000 ₽

Answer 1 · 2022-06-08 16:30:18

Did you try this approach, adjusting to field names.
Passed test on ES 8.2.2:

{
  "aggs" : {
    "@timestamp": {
      "terms" : { "field" : "@timestamp"},   

  "aggs": {
    "shift_count": {
      "value_count": { "field": "shifts.id" }
    },
    "shift_count_filter": {
      "bucket_selector": {
        "buckets_path": {
          "shiftCount": "shift_count"
        },
        "script": "params.shiftCount > 1"
      }
    }
  }}}
}

I am still searching how to apply filter over aggregate using "filtered" query approach, something like

select * from ( select count(*) as count_of_items, item_name from item_collection group by item_name ) as inner_query 
where count_of_items > 1

as this approach, using aggregates feels more like a workaround ( thought robust to use in production ).
If you come over something interesting, please post here.
---
I don't know the reason as to why, since I just installed elasticsearch to investigate your question, the approach with measuring array using property values and function size() didn't work.
Based on all I have learned so far, the dynamic property, currently set to false on the shifts field may need to be modified to false, to enable dynamic scripting.
For aggregate approach above to work over nested field with text sub - field, the field may need to be applied with "fielddata" attribute set to true, by default if is false on such fields. It could be this is a new behavior since version 8.2.2. Here is error message I was getting in some experiments

"type" : "illegal_argument_exception",
"reason" : "Text fields are not optimised for operations that require per-document field data like aggregations and sorting, so these operations are disabled by default. Please use a keyword field instead. Alternatively, set fielddata=true on [...] in order to load field data by uninverting the inverted index. Note that this can use significant memory."

here is script to apply fielddata attribute:

shifts: {
  type: 'object',
  dynamic: false,
  fielddata: true,
  properties: { id: { type: 'keyword' }, { type: 'keyword' } },
}

-- cheers

Answer 2 · 2022-08-29 10:10:30

Если количество элементов массива известно во время индексации, то проще всего проиндексировать это значение как отдельное поле с числовым значением. И затем просто фильтровать обычным term запросом по нужному количеству элементов.

Как в Elasticsearch проверить, что массив содержит определенное количество значений?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт