Почему строка в кодировке windows-1251 не сохраняется в mysql базу с кодировкой utf8mb4?
Я загружаю txt файл на сервер, извлекаю из файла текст, пытаюсь сохранить этот текст в базу.
Я загружаю файл в кодировке windows-1251, при сохранении текста в базу возникает ошибка SQLSTATE[HY000]: General error: 1366 Incorrect string value: '\xF0\xF3\xF1\xF1\xEA\xE8...' for column 'content' at row 1
Я не совсем понимаю как вообще работать с разными кодировками.
Почему возникает ошибка? В utf-8 на символ выделяется 4 байта, в windows-1251 вроде точно меньше.
По задаче тексты могут быть на любом языке и в любой кодировке. Как можно это реализовать? Сделать поле content blob'ом?
Конвертация из одной кодировки в другую не вариант, так как кодировка текста всегда будет неизвестна.