password22
@password22

Поиск определенного фрагмента по файлам html, как сделать массивно?

Здравствуйте. Не знаю с помощью чего можно осуществить подобное, поэтому указал и php и парсер.
Есть, допустим, 20 000 страниц сайта на html. Мне нужно вытащить из них содержимое div с каким-либо классом. Как мне это сделать? Может программа какая-нибудь?
  • Вопрос задан
  • 253 просмотра
Решения вопроса 1
Kasperenysh
@Kasperenysh
Рецидив в особо острой форме))
предположим что все файлы лежат в dir1, а новые будем создавать в "имя фала/имя класса.html"
$class = 'text_text'; //какой класс ищем...

foreach (glob("dir1/*.html") as $filename) {
  $html = file_get_contents($filename);
  preg_match('<div class="'.$class.'">(.*)</div>', $html, $result);
  file_put_contents($filename.'/'.$class.'.html', $result[0]);
}

с регулярками у меня беда) но в теории код должен работать)) ну и хз как это по времени будет занимать.... более опытные ребята может подправят что-то...
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@Arthurka
1. Делаете цикл на 20000.
2. Делаем открытие папки.
3. Сверяем каждую строку на наличие нужного класса.
4. Если найдено - создаем папку и вносим данные
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы