OpenStreetMap (дословно «открытая карта улиц»), сокращённо OSM — некоммерческий веб-картографический проект по созданию силами сообщества участников — пользователей Интернета подробной свободной и бесплатной географической карты мира.
/(?!=не)(маленьк(ой|ая|ий|ый|ие|ые))/ \1 /
/не(больш(ой|ая|ый|ие|ые)),?\s*а\s+/ не \1, а /
/(далеко|вовсе|отнюдь|нисколько|ничуть)\s*?не(больш(ой|ая|ый|ие|ые))/ \1 не \2 /
/не(больш(ой|ая|ый|ие|ые))(?!=,?\s*а)/ не\1 /
'header' => "Content-type: application/x-www-form-urlencoded\r\n".
"Content-Length: ".strlen(http_build_query($data))."\r\n".
"Connection: close\r\n\r\n",
1) Вы регулярки умеете читать/составлять?
2) Она расчитана на то что до нее выполняется разделение ДРУГИХ слов! (см. п.1)
3) я писал - можно ваш совместить "словарь разрывов" и регулярку по не
сначала слова разделяются те что можно разделить и только затем уже регулярки по не 2,3,4 последовательно.
PS: никто не мешает переписать регулярки, это как затравка, а не как готовое решение.
PPS: во второй регулярке последний \s+ можно заменить на \s* но тогда ИНОГДА она может неправильно отрабатывать, если прогонять ее по девственно слитному тексту , скорее всего будет некорректно обрабатывать например такие словосочетания (где после идет слово на А, а не противопоставление, например: небольшойамбар, но если амбар отделить заранее, то все корректно отработает.