Задать вопрос
Ответы пользователя по тегу Компьютерные сети
  • Простенькое веб приложение-парсер

    @vimvim
    Обратите внимание на web-harvest.sourceforge.net/
    Это Java приложение со своим небольшим функциональным языком.
    Вот как выглядит пример парсинга flickr:
    <?xml version="1.0" encoding="UTF-8"?>
     
    <config>
        <include path="functions.xml"/>
        
        <var-def name="tags" overwrite="false">art</var-def>
        <var-def name="num" overwrite="false">1</var-def>
        
        <loop index="i" item="url">
            <list>
                <var-def name="imagelinks">    
                    <call name="download-multipage-list">
                        <call-param name="pageUrl">
                              <template>http://www.flickr.com/search/?q=${tags}&m=tags</template>
                        </call-param>
                        <call-param name="nextXPath">//a[contains(., 'Next')]/@href</call-param>
                        <call-param name="itemXPath">//img[@class='pc_img']/@src</call-param>
                        <call-param name="maxloops"><template>${num}</template></call-param>
                    </call>
                </var-def>
            </list>
            <body>
                <empty>
                    <file action="write" path='flickr/${tags.toString().replaceAll(" ", "")}/${i}.jpg' type="binary">
                        <http url='${url.toString().replaceFirst("_m.jpg", ".jpg?v=0")}'/>
                    </file>
                </empty>
            </body>
        </loop>
        
    </config>
    
    Ответ написан
    Комментировать