Есть код
<?php
header("Content-Type: text/html;charset=utf-8");
$text="Здесь некий длинный-длинный текстик";
function keyword($text,$lenkey,$kolkey){
$text=strtolower(strip_tags($text)); //удаляем тэги и все в нижний регистр
preg_match_all("/[а-яa-z]{".$lenkey.",}+/is",$text,$word);
$return = array_count_values($word[0]); //получаем слова и частоту, меняем местами ключ-значение
arsort($return);//сортируем
$return = array_slice($return, 0, $kolkey); //отрезаем верхушку массива
$return = array_keys($return);
return $return;
}
$rezult=keyword($text,4,10); // 4 - минимальное кол-во символов в ключевом слове, 10 - кол-во ключевых слов
$rezult_keyword=implode(", ",$rezult);
echo $rezult_keyword;
?>
проблема в том, что если код использовать в скрипте utf-8, то получаю "длинн�, ик, ек�, де�, некий", если же сохраняю в анси (удаляя естесно header), то все нормально.
Я понимаю, что где-то нужно прописать явно кодировку, но уже все варианты пришедшие в голову перепробовал.
ЗЫ: и да - я пробывал mb_strtolower.