Искал парсер контента новостных сайтов, наткнулся на этот пост
habrahabr.ru/post/220983
Установил, потестил, работает отлично. Проверил 10 разных новостных сайтов, правда по одной странице.
В общем все устраивает, но есть один вопрос, как вытащить из спарсеного контента картинку новости если она есть?