Задать вопрос

Как найти и вытащить строку из html?

Питон знаю плохо, нужна помощь. Надоело открывать исходник каждой страницы и копировать нужную строку (сотни их)

Что дано:
На одном сайте есть контент, который без подписки не скачать, но в исходниках есть ссылки на короткие превью ролики. Методом проб нашел стандартный вид для каждой ссылки, меняется только название ролика и дата.

Что готово:
Написал скрипт, который изменяет триальную ссылку на премиальную и затем скачивает.

Что нужно:
Нужно найти в исходном html строку, которая содержит _teaser.hdr.mp4 и скопировать всю строку между одинарными кавычками (либо всю строку между http:// и .mp4). Возможно ли это? Как я понимаю, нужно сначала распарсить html, затем найти и скопировать нужный string. Несколько часов гугления особо не помогли.

В идеале хочу получить следующее: запускаю скрипт, копирую в консоль ссылку из браузера, скрипт парсит исходник, копирует нужную строку, изменяет ее на премиальную и скачивает. Куда копать? Смотрел Grab и BS, но пока до истины не добрался;)
  • Вопрос задан
  • 2810 просмотров
Подписаться 4 Оценить Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы