Cделать полнотекстовую RSS ленту, если сайт отдаёт только краткий анонс?

Добрый день.

Я большой любитель почитать в метро RSS новости любимых сайтов. Благо софта под Андроид хватает, который умеет скачивать новости с картинками и хранить их в кеше.


Для самих rss лент я использую популярые сервисы, которые «разворачивают» статью из краткого анонса в полнотекстовую. Но они не идеальны — к новости добавляют рекламу, комментарии, теги и прочую ненужную мне лабудень :( Можно ли сделать это чисто?


Для примера беру фид NOMOBILE.RU www.nomobile.ru/rss-reviews.xml


1) В оригинале они отдают чуть более, чем ничего =)
7360a20e09f77a235400d74f9737fd4e.png


2) Сервис feedex.net/

Хорошо разворачивает, но в конце цепляет ссылки на другие статьи. Причем в огромном количестве.
3dfc9b37fc8520796a89e23bdb1e9f1a.png


3) Сервис rss-farm.ru

При попытке создать свой фид иду по инструкции (www.rss-farm.ru/docs.dev.quickstart/)


Шаг 1. Запуск DevTools


В браузере ИнтернетЭксплорер6+ переходим по ссылке rss-farm.ru/devtools_latest.zip. Через несколько секунд поле того, как вы согласитесь на запуск, должна запуститься программа DevTools. Если что-то пошло не так, то, скорее всего, вам нужно скачать .net Framework 3.5 и все заработает.


Получаю 404.
0ad79965d4a5f8d3fd3105e6b3badb93.png


4) Сервис readbox.info

В нем можно указать XPath.
8aae334594cfde5eeec2fb9d2397e4a9.png


Тем не менее удачно «выдрать» не получается. Все равно зацепляется какой-нибудь ненужный блок :(


Есть варианты?
  • Вопрос задан
  • 5525 просмотров
Решения вопроса 1
lakb
@lakb
Все украдено до нас уже сделано: feeds.rss-farm.ru/Reset2891/nomobile-reviews
Ответ написан
Пригласить эксперта
Ответы на вопрос 5
zzeneg
@zzeneg
Yahoo pipes. Не самый легкий путь, но зато все кастомизируется под себя.
Ответ написан
@1337
habrahabr.ru/blogs/p2p/123594/

Может этот топик поможет
Ответ написан
Комментировать
Kindman
@Kindman
Ну, можно еще попробовать написать простенький RSS-фильтр, который удалял бы все «вражеские» фрагменты в ленте.
Ответ написан
Комментировать
asm0dey
@asm0dey
Еще есть fivefilters.org/content-only
У них же есть self-hosted версия.
Ответ написан
Комментировать
png
@png
Путь джедая — это написать самому.

Если посмотреть на nomobile в RSS. Там тег Link.
в нем закодирована ссылка на саму статью 0L0Snomobile0Bru0Creviews0C1292490Bhtml
0B — это точка.
0С — это слеш
берем RSS, вытаскиваем ссылку, парсим страницу сайта руками. Можно регулярками, можно через DOM.
Режем лишние теги.
Результаты парсинга заливаем в новый RSS.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы