Определение кодировки файла?

Question

Angelxalfa @Angelxalfa

PHP

Определение кодировки файла?

Здравствуйте! Столкнулся со странной ситуацией. При попытке определения кодировки файла, не зависимо от того какая она у файла в дейтсвительности, php определяеи ее как UTF-8

$file = file_get_contents('in.csv');
$encode  = mb_detect_encoding($file);
echo $encode;

При этом файл в кодировке win-1251 (проверял в notepad++) все равно определяется как UTF-8.

Почему такое происходит?

Просто я потом этот файл парсю и забиваю в базу Msql, и мне нужно привести его содержимое к определенной кодировке. Для этого:

fwrite($handle, iconv($encode, 'UTF-8', file_get_contents('in.csv')));

Но при этом если файл в UTF-8 - то все ок, а если в win-1251 - парсинг не проходит. Приходится менять на:

fwrite($handle, iconv('CP1251', 'UTF-8', file_get_contents('in.csv')));

Тогда для win-1251 проходит без проблем, для UTF-8 в базу сохраняются кракозябры вместо кирилицы...

Вопрос задан более трёх лет назад
1107 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как исправить ошибки шаблона WP?
- 1 подписчик
- 14 июл.
- 91 просмотр
1

ответ
PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 1 подписчик
- 17 июн.
- 204 просмотра
2

ответа
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 456 просмотров
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 248 просмотров
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 191 просмотр
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 154 просмотра
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2467 просмотров
8

ответов
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 344 просмотра
6

ответов
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 186 просмотров
1

ответ
PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- 25 апр.
- 252 просмотра
2

ответа
Показать ещё Загружается…

Answer 1 · 2015-03-20 17:02:29

ну, дело в том, что mb_detect_encoding не определяет язык или charset и может лишь определить явные ошибки - например, неверные последовательности для utf-8.
алсо из комментариев

If you try to use mb_detect_encoding to detect whether a string is valid UTF-8, 
use the strict mode, it is pretty worthless otherwise.

mb_detect_encoding($s, 'UTF-8', true)

Answer 2 · 2015-03-21 19:44:39

Максим Углов @Vencendor

if (preg_match('//u', $string)) { /* у вас UTF-8 */ }

иногда такое работает, от настроек может зависеть

Ответ написан более трёх лет назад

Комментировать

Определение кодировки файла?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт