Анализ и обработка большого массива неструктурированных данных?

Question

sprat @sprat

Анализ и обработка большого массива неструктурированных данных?

Здравствуйте! Друг, не имеющий аккаунта на хабре, просил спросить. Цитирую буквально:

Имеется довольно большое количество неструктурированных данных, собранных из новостных лент, социальных сетей и т.д. Необходимо провести анализ этих данных с целью получения эмоционального информационного фона, а также представить, по возможности, в разрезе различных аналитик, как количественных, так и качественных.

Существуют ли какие-нибудь инструменты для проведения подобного анализа?

Вопрос задан более трёх лет назад
4980 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Data Scientist с нуля

10 месяцев

Далее
Академия Эдюсон

Аналитик данных + стажировка

6 месяцев

Далее
Бруноям

ИИ-агенты и n8n

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 3

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Карьера в IT

+1 ещё

Средний
Хочу попробовать стать системным аналитиком, с чего лучше начать и во сколько попытаться найти работу?
- 5 подписчиков
- 25 июн.
- 936 просмотров
6

ответов
Информационная безопасность

+3 ещё

Простой
Утечка кейвордов в Телеграм при посещении постороннего сайта?
- 3 подписчика
- 03 июн.
- 315 просмотров
3

ответа
IT-образование

+2 ещё

Средний
Бизнес и системный аналитик: кто это?
- 2 подписчика
- 29 мая
- 407 просмотров
3

ответа
Машинный перевод с одного языка на другой

+1 ещё

Сложный
Кто писал собственный NLP-пайплайн перевода слов?
- 1 подписчик
- 19 мая
- 88 просмотров
2

ответа
Аналитика

Средний
DAX \ Power BI как сделать меру через промежуточную таблицу?
- 2 подписчика
- 08 апр.
- 72 просмотра
1

ответ
Нейронные сети

+1 ещё

Средний
Где найти мне датасет для обучения малюсенькой LLM?
- 2 подписчика
- 07 апр.
- 245 просмотров
1

ответ
Машинное обучение

+1 ещё

Средний
Может, у кого-то есть дампы с реальными наименованиями товаров/услуг и кодами ОКПД2 для обучения NLP-модели?
- 1 подписчик
- 16 янв.
- 136 просмотров
0

ответов
Аналитика

Средний
Как структурировать работу над новым проектом в бизнес аналитике. Какая очередность у всего процесса аналитики?
- 1 подписчик
- 15 янв.
- 138 просмотров
1

ответ
Excel

+1 ещё

Средний
PowerQuery эффективность применения при работе с большим к-вом файлов?
- 2 подписчика
- 12 дек. 2025
- 388 просмотров
2

ответа
Хранение данных

+1 ещё

Сложный
Как сделать Service Structure рабочими в Tempo?
- 1 подписчик
- 06 нояб. 2025
- 89 просмотров
0

ответов
Показать ещё Загружается…

Answer 1 · 2013-03-20 13:02:05

Опыт жены, работавшей аналитиком именно по новостям говорит, что лучший инструмент — это сам аналитик. Все инструменты, которые им предлагали использовать, выдавали не всегда релевантные результаты.

Answer 2 · 2013-03-19 21:51:10

Про разрез качественных и количественных аналитик цели не понял, а касательно эмоций… Когда-то делал подобный анализ. Массив эмоциональных слов составлялся исходя из лексики конкретного языка. Далее вычислялась плотность подобных слов в тексте. Было давно, но что-то около 12-18% плотности означало, что текст излишне эмоционален.
Также делал привязку плотности к объему текста и градацию эмоциональности в зависимости от плотности.

Думаю сейчас методы шагнули вперед. Ну и по первым ссылкам в Google выпала относительно свежая дипломная работа по теме modis.ispras.ru/seminar/wp-content/uploads/2012/07/Silvestrov-thesis.pdf

Answer 3 · 2015-04-26 15:49:56

Существует целый ряд инструментов для мониторинга социальных медиа и СМИ (YouScan, Крибрум, Opiner и т.д.). В вашем случае больше подойдет сервис анализа текстовых данных Textocat API компании Textocat.

Анализ и обработка большого массива неструктурированных данных?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт