Как в php определить кодировку строки?

Question

Soft_touch_plastic @Soft_touch_plastic

PHP

Как в php определить кодировку строки?

Здравствуйте, занимаюсь массовым парсингом с помощью curl, проблема в том что каждое необходимое мне слово (из title, h1 и description) я прогоняю через функцию нормализации кодировки. Проблема в том, что строки вида �� без каких-либо изменений определяются как utf-8 (mb_detect_encoding), если прогонять все слова через декодировку с windows-1251 на utf-8, то эти знаки вопроса становятся нормальным текстом, но бывшие нормальные слова превращаются в кашу. Ломаю голову как определить наличие заменяющего символа � в строке, stripos($str, '�') === false возвращает true, php их в строке не видит.

Вопрос задан более трёх лет назад
133 просмотра

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Веб-разработчик на PHP

9 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

Язык программирования PHP

1 неделя

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Простой
Как декодировать/закодировать спец символы в get запросе?
- 1 подписчик
- 8 часов назад
- 50 просмотров
1

ответ
PHP

Простой
Как вызвать curl и не ждать ответ?
- 1 подписчик
- 16 дек.
- 273 просмотра
2

ответа
PHP

Простой
Как сделать это?
- 1 подписчик
- 11 дек.
- 280 просмотров
2

ответа
PHP

+1 ещё

Простой
Как найти значение в XML?
- 2 подписчика
- 06 дек.
- 240 просмотров
1

ответ
PHP

+1 ещё

Простой
Как на PHP пушнуть в ассоциативный массив?
- 1 подписчик
- 05 дек.
- 227 просмотров
1

ответ
PHP

Простой
Проблема с PDO LIKE?
- 1 подписчик
- 04 дек.
- 175 просмотров
0

ответов
PHP

Простой
При попытке регистрации на сайте выдаёт ошибку A PHP Error was encountered. Что делать?
- 1 подписчик
- 03 дек.
- 156 просмотров
2

ответа
PHP

Простой
Как исправить include в php 8.3?
- 1 подписчик
- 02 дек.
- 321 просмотр
3

ответа
PHP

Простой
Ошибка в php, как исправить?
- 1 подписчик
- 29 нояб.
- 292 просмотра
2

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб.
- 446 просмотров
4

ответа
Показать ещё Загружается…

Fullstack-разработчик (PHP, Vue.js)

Qwintry

от 1 200 до 2 000 $

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

TeamLead PHP (Symfony)

AGIMA • Москва

от 210 000 ₽

Answer 1 · 2021-09-11 11:10:01

Кодировку не нужно угадывать
Ее нужно брать из заголовков (добавь к curl опцию -D имя_файла, куда будут помещены все заголовки запроса)

Content-Type: text/html; charset=UTF-8

и что лучше, из тега
<meta charset="utf-8">

p.s. чтобы угадать кодировку, пользуйся консольной утилитой enca, очень мощная вещь, угадывает множественные перекодирования, когда создатель накосячил (например открыть cp1251 в far в koi8 кодировке и скопировать через содержимое экрана)

Как в php определить кодировку строки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт