• Какую регулярку использовать?

    trapwalker
    @trapwalker
    Программист, энтузиаст
    В большинстве случаев не стоит использовать регекспы для работы с html-разметкой. Для этого есть другие средства, например xpath-селекторы или обход дерева тегов скриптом на питоне.
    Если нужно поправить ссылки, то тут можно и регекспами, ведь ссылки, как правило, различаются внутри, часто можно по префиксу в URI понять о какой ссылке речь.
    Обратите внимание на библиотеку beautiful soup. Там есть всё необходимое для конвертации ваших статей.
    Более детальных рекомендаций не дам ввиду ограниченности примеров, которые вы привели. Надо показывать примеры как есть, ведь из-за отсутствия опыта вы опускаете важные существенные детали и подробности. Например, структуру URL в ссылках, стили и классы в тегах...
    Ответ написан
    9 комментариев