Как проще всего получить контент блога livejournal.com для парсинга?
На blogspot.com я перебирал результаты blog.com/atom.xml?redirect=false&start-index=1&max-results=500 и быстро мог выкачать сайт, а на livejournal.com похожего нет, через rss выдает только 25 последних записей
Так парсить можно, довольно просто, вырезать и убирать теги, это даже легче чем их лента.
Но там разные темы и темы меняются иногда. Лента очень тяжеловесная и она тормозит.
druzhanja: странный вопрос, парсите страницу с адресом, вырезаете все лишнее или даже свою ленту делаете, лет пять назад так и делал пока они не надоели, сам сайт тормоз, медленный.