@nalimite

Как на php организовать парсер?

Привет!
Как можно организовать на php парсер с нескольких ссылок?

Попустим, есть 6-7 ссылок, как сделать ОДНИМ СКРИПТОМ чтобы на каждый сайт по очереди заходило, и парсило все по регулярке, и попутно записывало в TXT файл то что спарсило?

Примерно вот так

<?php
$content = file_get_contents("ССЫЛКА");
preg_match_all("РЕГУЛЯРКА", $content, $matches);
$data = $matches['0'];
$data1 = implode("\n", $data);
echo $data1;
$fp = fopen ("text.txt", "w");
fwrite($fp,$data1);
fclose($fp);
?>


Только это для одного сайта, а нужно для 6-7 сайтов
  • Вопрос задан
  • 214 просмотров
Пригласить эксперта
Ответы на вопрос 2
Wolfnsex
@Wolfnsex Куратор тега PHP
Если не хочешь быть первым - не вставай в очередь!
Можно, для этого даже готовые библиотеки есть.
1. Symfony dom crawler
2. phpQuery
3. simple_html_dom

С ними будет куда проще, чем с регуляркой.
Ответ написан
Комментировать
ewgenio
@ewgenio
Всё по чуть чуть
Как можно....

Ссылочки в массив и по ним пробежаться циклом?
<?php
$urls = array('http://url1.com', 'http://url2.com', 'http://url3.com');
foreach($urls as $url) {
    $content = file_get_contents($url);
    preg_match_all("РЕГУЛЯРКА", $content, $matches);
    $data = $matches['0'];
    $data1 = implode("\n", $data);
    echo $data1;
    $fp = fopen ("text.txt", "a"); // a - перемещает указатель для записи в конец файла
    fwrite($fp,$data1);
    fclose($fp);
}
?>

А лучше наверное посмотреть на библиотеки в ответе выше, чтоб с самим парсером не мучатся.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы