Есть папка в которой очень много html файлов
Подскажите как можно массово занести все файлы в базу sql
то есть нужно в файле взять всё что есть в теге body ... body и занести в базу в таблицу text
всё что есть в keywords занести в базу в таблицу keywords
Как работает file_get_contents() Вы можете посмотреть в официальной документации.
РВ может быть таким: "#<body>([^>]+)</body>#is"
Запрос в базу самый обычный, используйте оператор INSERT.
код
$var = file_get_contents('123.html');
if (preg_match(тут код обрезается)){
$jj = $body[1]; }
$sql = mysql_query("INSERT INTO base (full_text) VALUES ('$jj')");
но теперь не могу понять как массово обработать все файлы которые в корне, сейчас обрабатывает один файл 123.html
Доброе утро.
При помощи file_get_contents() получаете содержимое отдельного файла, используя регулярные выражения выбираете содержимое определённых тегов и результат записываете в базу данных.
Роман Мирр: Ваше утверждение, что нужно использовать только HTML DOM Parser - решение через одно место.
Нужно видеть содержимое файлов, и только после анализа содержимого выбирать инструмент.
После прочтения содержимого файла с ним следует производить разбор при помощи CSS селекторов в любой из библиотек парсинга HTML.
Например, при помощи https://github.com/olamedia/nokogiri