Ответы пользователя mayton2019 по тегу «Amazon Web Services»

Задать вопрос

Ответы пользователя по тегу Amazon Web Services

Как проверять файлы в S3 хранилище?

mayton2019 @mayton2019
Bigdata Engineer

Большинство файлов - небольшие. Их можно грузить в фолдер /tmp на сервере и проверять на вирусы сразу. И если ок то публиковать в s3.

Если файл допустим больше 10мб то публиковать сразу на s3. Но здесь как бы слегка уже срезали costs.

Ответ написан 03 июн.

Комментировать

Комментировать
Есть ли готовое решения для инкрементного резервное копирования бакетов s3 и если нет, то почему это никому не нужно?

mayton2019 @mayton2019
Bigdata Engineer

Хм. Да похоже AWS.S3 действительно не поддерживает откат бакета в прошлое.
Но если рассматривать S3 как протокол поверх обычной файловой истемы
(Minio+BTRFS/ZFS) то вы можете задачу отката переформулировать в терминах
конкретной файловой системы. Там - это коробоная фича.

Ответ написан 08 янв.

1 комментарий

1 комментарий
Как ограничить доступ к S3 без проксирования?
mayton2019 @mayton2019
Bigdata Engineer
В S3 можно фолдеры создавть. Как часть ключа-пути.

s3://bucket/Bolage/file1.txt s3://bucket/mayton2019/file1.txt

Ответ написан более года назад

Комментировать
Комментировать
Как эффективно читать сжатый лог файл с S3 бакета в Ruby?

mayton2019 @mayton2019
Bigdata Engineer

Фреймворк Apache Spark судя по документации умеет работать с zstd.

https://spark.apache.org/docs/latest/configuration.html

Я имею в виду что он может извлекать сведентья из архива не распаковывая.
Но если выбирать между форматами то я-бы посоветовал перепаковать в bzip2.
Он судя по документации - splittable, тоесть несколько Workers смогут работать
с архивом одновременно и независимо и таким образом ваш парсер будет быстрее в разы.

Ответ написан более года назад

4 комментария

4 комментария
Почему 300 проксей проверяются так долго?

mayton2019 @mayton2019
Bigdata Engineer

Тебе нужно проанализировать статистику по негативным ответам проверки прокси.
Если большая часть ответов - это socket timeout - то сделай таймаут не 5 секунд а 0.5 секунды.

Ответ написан более двух лет назад

Комментировать

Комментировать
На продакшне, перестала отображаться одна страница, после последнего билда, и выдает эту ошибку, какие варианты решения проблемы?

mayton2019 @mayton2019
Bigdata Engineer

Нужно откатить на предыдущий билд и дать возможность сайту работать.
А после этого - в спокойной обставновке смотреть что менялось и что привело к инцеденту.

Ответ написан более двух лет назад

Комментировать

Комментировать
Можно ли в MinIO настроить удаленный узел?

mayton2019 @mayton2019
Bigdata Engineer

Непонятно какая цель за этим стоит. Надежность такой системы будет слабее. Т.к. зависим уже от двух разных хостов.

Ответ написан более трёх лет назад

3 комментария

3 комментария
Фильтр по части строки?

mayton2019 @mayton2019
Bigdata Engineer

Значит сразу скажу что у меня для вас - плохие новости. DynamoDb как и многие ему подобные облачные key-value решения расчитаны на выборку по сету ключевых полей. Обычно это хеш-ключ и ключ диапазона. В этом случае вы платите немного. Если вдруг вы решили выбирать по не-ключевым полям это уже будет другое тип запроса. Называется scan. Его можно писать на любом языке разработки но суть в том что будет выбрана ВСЯ таблица. Если она большая - то charge за текущий период вас неприятно удивит. Фиксить это почти невозможно. Это неправильный дизайн и неправильное использование AWS Dynamo. Вам следует вообще отказаться от использования Dynamo и думать над тем как НЕ делать сканов в будущем. Можете теоретически создать индекс по хвосту от строки. Но индекс с точки зрения Динамо - это копия таблицы просто по другому расположенная и реплицируемая. Вобщем не советую тоже.

Ответ написан более трёх лет назад

3 комментария

3 комментария
Почему S3 выдает ошибку XML?

mayton2019 @mayton2019
Bigdata Engineer

Непотятно какой это язык? Go что-ли? Тут ошибка не про работу с AWS S3 bucket а просто про то что сериализация структуры params почему-то на выходе выдала НЕ-Xml строку. А ожидалась Xml.

Вот тут пишут как структуры сливать в XML

https://www.golangprograms.com/golang-write-struct...

Ответ написан более трёх лет назад

Комментировать

Комментировать
Архитектура/стек для telegram - бота, где не прав? Aws. +Метрики. Логи?

mayton2019 @mayton2019
Bigdata Engineer

Непонятно зачем автору здесь grafana и prometheus. Выглядит ненужным обвесом. Кроме того требует полноценного и дорогого EC2 на фоне всего остального которое почти serverless.

Ответ написан более трёх лет назад

2 комментария

2 комментария
Можно ли изолированно запустить несколько приложений?

mayton2019 @mayton2019
Bigdata Engineer

Правильно сказано про миллион.

Но смущает 1) Хеш тег Node.JS. Этот фреймворк архитектурно был однопроцессным. Возможно тут автор решает задачу которая решается на самом деле по другому. 2) Непонятна "выделенная среда". Что это? Еще один процесс в текущей ОС? Еще процесс в контейнерах LXC/Docker? Процесс в виртуалке? Процесс в другой EC2 ?

Ответ написан более трёх лет назад

Комментировать

Комментировать
Что изменится при использовании AWS API Gateway c подключением существующего API endpoint?

mayton2019 @mayton2019
Bigdata Engineer

Наиболее дешевый вариант масштабирования - это переписать REST-приложение vasya на AWS Lambda. Это не всегда архитектурно возможно ввиду ограничений на сеанс и объемы ресурсов. Но если получится - то можно запускать до 1000 экземпляров Васи в параллель.

Ответ написан более трёх лет назад

4 комментария

4 комментария
Сколько может стоить альтернатива обычному хостингу на AWS?

mayton2019 @mayton2019
Bigdata Engineer

Ни один архитектор наперед не скажет вам сколько вы заплатите за AWS услуги. Формула биллинга там - сложная и учитываем и транзакции и трафик и каллбеки (AWS-lambda) и ресурсы времени для инстансов. Поэтому единственные правильный путь - собрать работающий макет. Задеплоить его в AWS и понаблюдать под нагрузкой в течение месяца. Посмотреть какой пришел счет. И соотвествтенно экстраполировать на другие объемы.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как в рамках AWS lambda создать zip архив из папки на S3 на python?

mayton2019 @mayton2019
Bigdata Engineer

Упирается в возможности Питона и AWS-Lambda. Насколько я помню там есть ограничения на память для лямбды и лимит на время для 1 сеанса хендлера. Но я думаю что можно решить эту задачу. Библиотеки сжатия должны быть потоковые. Тоесть без накопления результата в памяти. И степень сжатия надо поставить на store чтоб было максимально быстро.

Вобщем в рамках этого форума почти невозможно обсудить т.к. нужны сорцы и хотя-бы штук 10 экспериментов. Пробуйте. Я думаю что это решаемо.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

Михаил Лялин
- 2 ответа
- 0 вопросов
Василий Банников
- 2 ответа
- 0 вопросов
guatemala812
- 1 ответ
- 1 вопрос
Researcher
- 1 ответ
- 0 вопросов
Vitalya Ivanov
- 0 ответов
- 1 вопрос
tut_nick
- 1 ответ
- 0 вопросов

Войдите на сайт