Задать вопрос

Andrey Tatarnikov @atatarn

Скрещиваю ужей с ежами. Viva la robolution!

аналитика

Какие инструменты использовать для обработки истории связей между сущностями?

Посоветуйте, пожалуйста, подход или инструмент, на которой посмотреть.
Есть некотрое множество сущностей, условно описываемых, например, так:

EntityA:
Aid, Cid, Aprop1, Aprop2, Aprop3, ...
EntityB:
Bid, Cid, Bprop1, Bprop2, Bprop3, ...
EntityC:
Cid, Aid, Bid

Есть как логически-самостоятельные сущности, так и сущности, реализующие связь между несколькими другими.
Про эти сущности есть набор текстовых файлов (csv и xml), описывающих состояния разных сущностей "в моменте", то есть на момент генерации текстовых файлов с осписанием. Типов сущностей десятки, самих сущностей десятки миллионов каждого типа, исторических состояний (то есть файлов со слепком тех или иных сущностей) - пара тысяч весом в 200Гб.

Хочется подсунуть все файлы в какое-то одно место, чтобы поизучать общую картину на предмет количества и качества связей между сущностями, как они меняются от слепка к слепку и проч.
Самый простой способ - запихать все в SQL, но покуда про сущность с одним id могут быть десятки состояний непонятно насколько запросы будут долго крутиться без адекватных индексов, которые непонятно как строить.
С инструментами для анализа данных никогда не сталкивался, идей нет. :)

Вопрос задан более трёх лет назад
20 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Аналитик данных

7 месяцев

Далее
Skillbox

Профессия Data Analyst

12 месяцев

Далее
Нетология

Аналитик данных: расширенный курс

11 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

dimonchik2013

Dimonchik @dimonchik2013

non progredi est regredi

ArangoDB графы

Ответ написан более трёх лет назад

Комментировать

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Хранение данных

+1 ещё

Сложный
Как сделать Service Structure рабочими в Tempo?
- 1 подписчик
- 06 нояб.
- 43 просмотра
0

ответов
Аналитика

Простой
Где посмотреть примеры оформления кода для экономического анализа данных?
- 1 подписчик
- 11 сент.
- 239 просмотров
2

ответа
Аналитика

+1 ещё

Простой
Какие есть эффективные средства анализа больших данных?
- 2 подписчика
- 20 авг.
- 200 просмотров
3

ответа
Автоматизация обработки текста

Простой
Существует ли инструмент (система) автоматизации форматирования текста в docx по предопределенным правилам?
- 2 подписчика
- 05 авг.
- 180 просмотров
2

ответа
Алгоритмы

+1 ещё

Средний
Как можно предиктить дату регистрации при массиве данных?
- 1 подписчик
- 03 июл.
- 181 просмотр
1

ответ
Аналитика

+1 ещё

Средний
Как быстро локализовать в логах источник изменений метрики?
- 1 подписчик
- 30 июн.
- 104 просмотра
0

ответов
Математика

+3 ещё

Средний
Как выбрать размеры интервалов для неравно интервального вариационного ряда?
- 1 подписчик
- 24 июн.
- 183 просмотра
2

ответа
Аналитика

Простой
Какие сейчас используются качественные программы для pairwise?
- 2 подписчика
- 04 мая
- 66 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Как автоматически создавать большие отчёты из множества docx файлов?
- 2 подписчика
- 18 апр.
- 456 просмотров
4

ответа
Аналитика

+1 ещё

Простой
Если ли более изящный способ вычисления суммы максимальных значений за день в ретроспективе 1 месяц?
- 5 подписчиков
- 21 мар.
- 2257 просмотров
2

ответа
Показать ещё Загружается…

Продуктовый аналитик

Outlines Tech • Москва

До 280 000 ₽

Руководитель отдела поддержки программного обеспечения

Эконика • Москва

от 170 000 до 170 000 ₽

Аналитик

Gen AI Solutions

от 150 000 до 250 000 ₽