@dizlv

Как экспортировать данные из DynamoDB с их последующим изменением в AWS Data Pipeline?

Храним логи в DynamoDB. Задача состоит в том, чтобы с помощью AWS Data Pipeline выбрать из DynamoDB таблицы логи, которые не содержат в себе набор из списка строк ("bot", "python", "requests", etc.) и записать в другую таблицу DynamoDB (обе таблицы идентичны по дизайну, различие лишь в том - что в первой "грязные" логи, а во второй - "чистые").

Насколько я понимаю на данный момент, надо создать 2 DynamoDBDataNode на вход и выход (какой Data Format задавать?) и с помощью HiveCopyActivity сделать запрос (как?). Я попытался это все дело настроить, но в конечном итоге процессы падают с различными ошибками, которые никакой полезной/узнаваемой информации для меня, к сожалению, не несут.

Есть у кого-то готовый рецепт или хотя-бы примерное описание, как это сделать? Официальная документация очень поверхностна и не дает ответы на вопросы, которые появились в процессе исследования.

Спасибо.
  • Вопрос задан
  • 188 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы