web_dev: датабрикс как я понимаю заточен на чтение с amazon s3 сториджа просто файликов, типа json или parquet, т.е. данные твоего клиента кладешь на s3 и просчитываешь датабриксом
если тебя нужны еще какие-то базы данных то судя по этому https://www.oreilly.com/ideas/spark-comparison-aws...
лучше смотреть что есть у гугла.
за одно нам расскажешь :)
web_dev: а что делать с голым сервером ? самому поднимать всю хадуповскую инфраструктуру ? потом ее мониторить, решать проблемы, нанимать админа ? думаю разница в $50 не стоит таких приключений.
у гугла мне кажется вообще можно платить лишь за потребленные секунды, но я не уверен, что там как-то можно спарк пристроить.
если речь о спарке то логичней тогда уже смотреть на databricks cloud, ну или на гугл, у него как я понял в отличие от aws платить в плоть до секунд счетчик.
при наличии databricks брать одиночный сервер имхо вообще не имеет смысла
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
если тебя нужны еще какие-то базы данных то судя по этому
https://www.oreilly.com/ideas/spark-comparison-aws...
лучше смотреть что есть у гугла.
за одно нам расскажешь :)