Есть задача (на python), условие которой не поняла:
посмотреть какие СМИ пишут больше про разных персон и таким образом проанализировать структуру СМИ. Или какие рубрики каких персон упоминают. Например: у Вас есть персоны, которые совместно упоминаются в текстах СМИ (например, в пределах одного абзаца). Чем больше таких упоминаний, тем сильнее связь. Дальше если у Вас только одно СМИ, то можно просто сделать community detection, если несколько, то поработать с двудольным графом
Мне не нужно решение задачи. Хочу понять что от меня требуется (возможно глупый вопрос).
Мне нужно найти какой нибудь новостной сайт (например ria.ru, на котором публикуются свежие новости). Брать новости, которые связаны с людьми (с актерами например). А что дальше то делать? Какая вообще тут "связь?": 'Чем больше таких упоминаний, тем сильнее связь'. Что такое community detection и двудольный граф? В интернете мало информации на русском языке