Спасибо, попробую. Проблема была в Updraft Plus: в бесплатной версии предусмотрена только возможность восстановления на тот же хостинг. Плагин для миграции платен.
Тогда уж Python + lxlm или Grab (grablib.org). Тут уже было обсуждение, где все более-менее сошлись на том, что lxml > Beautiful Soup, по крайней мере в скорости.
Я вроде бы не новичок в теме SMM, Big Data, Web Mining и т.д., но я не знаком ни с одним из использованных вами терминов. Что такое RTB и кто является поставщиками данных? Что такое DMP и Trading Desk?
Я бы рискнул предположить, что под схожестью/паттерном связей подразумеваются виды структурной эквивалентности (Structural, Automorphic and Regular Equivalence) или блок-модели (Blockmodels), но судя по всему это что-то гораздо более простое.