Может ли Grafana напрямую слать запросы в табличку на hdfs и рисовать временной ряд?

Question

Иван Мельников @immelnikoff

Изучаю БД

Может ли Grafana напрямую слать запросы в табличку на hdfs и рисовать временной ряд?

На hdfs есть табличка (обычно дергаю из неё данные в hive). Необходимо периодически выполнять sql-запрос к этой табличке и добавлять результат к графику временного ряда в Grafana.
Встают 2 вопроса:
1) Может ли Grafana напрямую работать с hdfs? Интуиция мне подсказывает, что нужен какой-то посредник, который будет хранить данные рассчитанного временного ряда.
2) Что обычно используют в качестве посредника между hdfs и Grafana? Логика подсказывает, что для расчёта и вывода временных рядов нужна какая-нибудь TSDB, например, Prometheus. А можно ли использовать отдельную табличку на hdfs для этих целей?

Вопрос задан более двух лет назад
114 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Merion Academy

Базы данных с нуля

2 месяца

Далее
Stepik

Тестирование ПО (без проверки)

2 недели

Далее
OTUS

Базы данных

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Базы данных

Простой
Как настроить десятки связей и не потеряться в модели (prisma orm)?
- 1 подписчик
- 10 нояб.
- 83 просмотра
0

ответов
PostgreSQL

+1 ещё

Простой
Как вести историю работы с записями во всех таблицах для всех пользователей?
- 2 подписчика
- 08 нояб.
- 256 просмотров
2

ответа
Базы данных

+1 ещё

Средний
Какие методы синхронизации SQL Express и MSSQL Server порекомендуете?
- 3 подписчика
- 03 нояб.
- 191 просмотр
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт.
- 201 просмотр
2

ответа
SQL

+1 ещё

Простой
Как сделать уменьшение склада в СУБД безопасными правильным?
- 2 подписчика
- 14 окт.
- 256 просмотров
4

ответа
Python

+2 ещё

Простой
Как получить данные в виде текста на русском языке из базы данных Paradox 4.5?
- 1 подписчик
- 23 сент.
- 327 просмотров
1

ответ
Базы данных

+2 ещё

Средний
Как автоматически откатить в CI/CD миграции при помощи Goose, если их было несколько?
- 3 подписчика
- 04 сент.
- 449 просмотров
1

ответ
SQL

+1 ещё

Простой
Какие таблицы для продуктов (и их вариантов) в БД использовать?
- 1 подписчик
- 02 сент.
- 223 просмотра
1

ответ
Базы данных

Простой
Как вы работаете с Milvus в контексте RAG-системы?
- 1 подписчик
- 25 июн.
- 97 просмотров
1

ответ
Node.js

+2 ещё

Простой
Как сделать регистрацию без слета через fs?
- 1 подписчик
- 03 июн.
- 168 просмотров
2

ответа
Показать ещё Загружается…

Стажер специалист по сопровождению сделок по проблемным активам

ПСБ цифровая лаборатория • Москва

от 30 000 до 60 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Стажер Специалист по сопровождению внутрибанковских проектов

ПСБ цифровая лаборатория • Москва

До 60 000 ₽

Answer 1 · 2023-07-04 07:04:08

Grafana только отправляет запросы к какой-то третьей системе и рисует. Она не отвечает за хранение временного ряда.
Сейчас погуглил - везде для мониторинга состояния hadoop кластера использую Prometheus.
В вашем случае я бы так и попробовал - пихать данные из этой таблички в prometheus

Answer 2 · 2023-07-04 16:38:32

Поищите плагин для hdfs

Штатно есть плагин для постгреса, можно делать запросы в него напрямую.
Есть плагин для монго, но только в ентерпрайз версии (платный), бесплатный опенсорсный плагин для монги совсем плохой, вплоть до нерабочести.
Вместе с графаной обычно идет influxdb, можно в нее данные накидывать.

про hdfs надо гуглить, вдруг есть плагин.

Answer 3 · 2023-07-04 21:16:10

А можно ли использовать отдельную табличку на hdfs для этих целей?

На самом деле вопрос звучит неправильно. HDFS это просто биг-датавская файловая система
и ей безразлично таблички на ней лижат или вообще какие-то рандомные файлы.

Для стриминга информации действительно подходит связка Graphana + Prometeus + InfluxDb.
Но тут дальше непонятно какой-такой посредник тебе нужен. Такие посредники существуют
для Kafka/Cassandra и они называются коннекторы. Они льют информацию из очереди
в таблички и наоборот (там есть правда условие). Но опять-же твою постановку надо грумить
очень глубоко вплоть до объемов данных и лагов и условий чтобы понять что на самом деле надо.

На hdfs есть табличка (обычно дергаю из неё данные в hive).

По роду постановки - это очень близко к микро-батчингу или стримингу. Но я пока не вижу
какой стек ты используешь. Обычно к стримингу ближе идут Spark/Databricks/Flink/Storm.
У них хотя-бы существует терминология стриминга. Вот а hive - это точно не про стриминг.

Может ли Grafana напрямую слать запросы в табличку на hdfs и рисовать временной ряд?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт