Доброго времени суток, думаю проблема банальная, но вот что то решения никак найти не могу. Дело в том что при изменения кодировки документа методом
<?php header("Content-Type: text/html; charset=utf-8")?>
При использования поиска по строке (preg_match()) выдает непонятные символы. Если не менять кодировку то значения полученные после парсинга =="&&???:a/", в общем проблемы с кодировкой.
<?php header("Content-Type: text/html; charset=utf-8")?>
<html lang="ru">
<head>
<meta charset="UTF-8">
<title>Document</title>
<style type="text/css">
*{
font-size: 14px;
font-family: 'Times New Roman';
}
</style>
</head>
<body>
<div><a href="http://ovego.3dn.ru/"><div>Web page находим something solution</div><div>and somerthing else</div></a></div>
<?php
require_once 'simple_html_dom.php';
$data=file_get_html('http://ovego.3dn.ru/');
if($data->innertext!='' and count($data->find('div'))){
foreach($data->find('div') as $a){
$patern="Фильм"; <b>// здесь проблема в кодировке</b>
if(preg_match($patern,$a->plaintext)) {
echo $a.'Привет <br>';
}
}}
?>
<?php
?>
</body>
</html>
На страницу выводится
Warning: preg_match() [function.preg-match]: Unknown modifier '�' in Z:\home\test1.ru\www\Index.php on line 23