Как проиндексировать документы в elasticsearch быстро?
Суть вопроса:
есть сервер ксеон 16 ядер и 16гб оперативки
поставил еластиксерч и импортирую в него документы при помощи еластикдамп
но процесс идет крайне медленно - примерно 1.5 млн документов в сутки
а мне нужно залить 810 млн документов
можно ли ускорить индексацию?
Эластик нужен для быстрого полнотекстового поиска, может стоит посмотреть в сторону другого движка?
Если ты сам откудато выгрузил этот json. То забей на него. Напиши скрипт который будет отправлять например по 50 тыщ запросов за раз в формате Bulk API. В документации все подробно описано.
un1t: 50 тыщ это сильно, вы так делали? Мы подбирали методом тыка и остановились на отметке в 1к запросов в батче - большие значения сожрут всю память на отправляющей стороне, что ведет к нестабильной работе...