Ответы пользователя vimvim по тегу «Компьютерные сети»

Задать вопрос

Ответы пользователя по тегу Компьютерные сети

Простенькое веб приложение-парсер

vimvim @vimvim

Обратите внимание на web-harvest.sourceforge.net/
Это Java приложение со своим небольшим функциональным языком.
Вот как выглядит пример парсинга flickr:

<?xml version="1.0" encoding="UTF-8"?>
 
<config>
    <include path="functions.xml"/>
    
    <var-def name="tags" overwrite="false">art</var-def>
    <var-def name="num" overwrite="false">1</var-def>
    
    <loop index="i" item="url">
        <list>
            <var-def name="imagelinks">    
                <call name="download-multipage-list">
                    <call-param name="pageUrl">
                          <template>http://www.flickr.com/search/?q=${tags}&m=tags</template>
                    </call-param>
                    <call-param name="nextXPath">//a[contains(., 'Next')]/@href</call-param>
                    <call-param name="itemXPath">//img[@class='pc_img']/@src</call-param>
                    <call-param name="maxloops"><template>${num}</template></call-param>
                </call>
            </var-def>
        </list>
        <body>
            <empty>
                <file action="write" path='flickr/${tags.toString().replaceAll(" ", "")}/${i}.jpg' type="binary">
                    <http url='${url.toString().replaceFirst("_m.jpg", ".jpg?v=0")}'/>
                </file>
            </empty>
        </body>
    </loop>
    
</config>

Ответ написан более трёх лет назад

Комментировать

Самые активные сегодня

VoidVolker
- 3 ответа
- 0 вопросов
Drno
- 2 ответа
- 0 вопросов
Денис Бирюков
- 2 ответа
- 0 вопросов
GavriKos
- 2 ответа
- 0 вопросов
Refguser
- 2 ответа
- 0 вопросов
Артем Житник
- 2 ответа
- 0 вопросов

Простенькое веб приложение-парсер

Войдите на сайт