Ответы пользователя по тегу HTML
  • Beautiful Soup, html5lib или lxml?

    @kmike
    @ur001, посмотрел еще раз код lxml, там есть много всяких регекспов, разбросанных по модулям ( github.com/lxml/lxml/blob/master/src/lxml/html/clean.py#L62 ), но я был не прав совершенно: парсинг html в lxml основан большей частью на парсинге xml.

    Т.е. lxml считает, что html — это просто невалидный xml, который можно поправить. С теоретической точки зрения предположение неверное, для парсинга html5 и xml нужны совсем разные парсеры, но на практике часто работает.
    Ответ написан
    Комментировать
  • Beautiful Soup, html5lib или lxml?

    @kmike
    У html5lib самый корректный и надежный парсер (по спецификации), но она медленная. lxml быстрее всех и парсит достаточно хорошо. Вместо SAX можно iterparse использовать, это удобнее часто, и часто быстрее.
    Ответ написан
    3 комментария
  • IDE для HTML/CSS/JavaScript

    @kmike
    JetBrains хорошие редакторы js/html/css в свои IDE встраивает, javascript в PyCharm (по крайней мере год назад) был лучше, чем в Eclipse с любыми плагинами. Все пункты кроме первого выполняются; насчет бесплатности — есть бесплатные лицензии для open source.
    Ответ написан
    3 комментария
  • Обход кэширования js/css

    @kmike
    Т.к. технологии реализации в вопросе нет, то напишу, как с этим в django. Для django есть с десяток библиотек, которые этим занимаются: djangopackages.com/grids/g/asset-managers/

    После первоначальной настройки все работает автоматически: файл поменялся => на сервере статика пересобирается, пересжимается, к собранному файлу приписывается новый unixtime и в html обновляется путь.
    Ответ написан
    Комментировать