Пока ничего не могу сказать про русские буквы в данных, но если база и таблицы в верной кодировке — проблем быть не должно.
Код, который ты показал не имеет смысла. Как минимум потому что будет ошибка синтаксиса.
Много лишних пробелов можно попробовать удалить так:
$str = " Lorem ipsum dolor sit amet, consectetur
adipisicing elit. Similique illum commodi sunt facere alias beatae nulla aperiam dolores, esse a delectus veniam corporis quam obcaecati accusantium aspernatur quaerat eius ipsam. ";
$str = trim($str);
$str = preg_replace('/[[:space:]][[:space:]]+/u', ' ', $str);