Как экспортировать данные из DynamoDB с их последующим изменением в AWS Data Pipeline?
Храним логи в DynamoDB. Задача состоит в том, чтобы с помощью AWS Data Pipeline выбрать из DynamoDB таблицы логи, которые не содержат в себе набор из списка строк ("bot", "python", "requests", etc.) и записать в другую таблицу DynamoDB (обе таблицы идентичны по дизайну, различие лишь в том - что в первой "грязные" логи, а во второй - "чистые").
Насколько я понимаю на данный момент, надо создать 2 DynamoDBDataNode на вход и выход (какой Data Format задавать?) и с помощью HiveCopyActivity сделать запрос (как?). Я попытался это все дело настроить, но в конечном итоге процессы падают с различными ошибками, которые никакой полезной/узнаваемой информации для меня, к сожалению, не несут.
Есть у кого-то готовый рецепт или хотя-бы примерное описание, как это сделать? Официальная документация очень поверхностна и не дает ответы на вопросы, которые появились в процессе исследования.