Привет, комрады!
Разрешите без долгого вступления, ситуация у нас следующая:
Имеются внешние источники данных, от которых прилетает разного рода информация. Даты, числа, объекты и прочую нечисть мы с легкостью разбираем, но вот как только доходит дело до строк.. Тут интереснее.
Тут несколько кругов ада. Первый - кодировки. Второй - спецсимволы и минимальная нормализация. Третий - это кириллица и.. И возникла задача по нормализации регистра строк. Сейчас на примере поясню, а если ты знаешь в какую именно сторону копнуть - то направлению буду признателен.
Итак, каждая строка - это вход, а через дефис - это то, что надо бы получить на выходе.
ПРИВЕТ МИР. - Привет мир.
привет мир - Привет мир
ПРИВЕТ МИР. Я ДОМА - Привет мир. Я дома
ЛЮБЛЮ Г.САНКТ-ПЕТЕРБУРГ - Люблю г. Санкт-Петербург
в связи с пост. от 12.12.2048 - В связи с пост. от 12.12.2048
ПОПАЛ Я ОДНАЖДЫ В ЯНАО - Попал я однажды в ЯНАО
система рхбз для мл.с-та мутко - Система РХБЗ для мл. с-та Мутко // На грани фантастики
Как, куда бы глянуть, чтоб не городить свой super_puper_case_ai_changer_by_vasya.php?