Задать вопрос
@glu-dimaz

Какие есть эффективные средства анализа больших данных?

Требуется проводить анализы объемных .json файлов. Искать оптимальные значения по критериям, выводить средние и т.д. - наверное нейронка. GPT, deepseek, gigachat, yandex gpt - нет, они не читают объемные файлы даже в платных версиях из за ограничений использования серверных ресурсов.
  • Вопрос задан
  • 98 просмотров
Подписаться 1 Простой 1 комментарий
Пригласить эксперта
Ответы на вопрос 2
@rPman
gpt ИИ тут никаким боком, абсолютно, даже вреден.
Эффективный размер контекстного окна топовых ии - 32к токенов (тех кто стоит баксы а не десятые цента за 'диалог'), ну а обычно это 8к токенов (даже если размер контекстного окна заявлен в сотни тысяч или миллион), и даже в этом пределе точность работы 80-90%, т.е. 20% информации может быть потеряна или искажена, что совершенно не подходит для аналитики.
https://github.com/mnismt/llms-long-context-benchm...
https://fiction.live/stories/Fiction-liveBench-Feb...

В лучшем случае ИИ может работать прослойкой между общим человеческим языком и специализированным типа sql. Но даже тут создавать такую систему и главное ее тестировать, нереально сложно. Возможно, при неадекватно высоких затратах денег, программирующие агенты смогут проанализировать данные и написать готовый код для работы с ними.

json нужно читать просто какими либо библиотеками в любимом языке программирования, при очень больших данных (не влезающих в оперативную память) можно подумать о конвертации данных в реляционные базы данных (то что озвучено в вопросе подойдет) или какие либо иные, лучше подходящие под тип аналитики.
Ответ написан
Комментировать
VoidVolker
@VoidVolker
Dark side eye. А у нас печеньки! А у вас?
То, что вам надо называется "База Данных". Их есть целая куча под разные задачи - составляете список ваших задач, требований к БД и подбираете соответствующую вашим задачам БД и средства работы с ней. Далее пишите скрипт/приложение для загрузки в БД ваших данных и затем используя средства работы с БД делаете нужные вам запросы и выводите в удобном вам виде. Например делаете запрос на специализированном языке запросов SQL и выводите результат в какой-нибудь графане.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы