Google translate

Question

Tant @Tant

Google translate

Запускаем такой скриптик:

 <?php
// берём чешское слово 'Koláče' (пироги), подготавливаем к передаче через URL 
$text = urlencode('Koláče');
// формируем запрос
$query = "http://translate.google.com/translate_a/t?client=x&text={$text}&sl=cs&tl=en";
// который в итоге выглядит так: 
// http://translate.google.com/translate_a/t?client=x&text=Kol%C3%A1%C4%8De&sl=cs&tl=en


// посылаем для перевода
// этот кусок взял отсюда: 
//http://stackoverflow.com/questions/542046/php-file-get-contentsloc-fails
$curl = curl_init();
curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);
curl_setopt($curl, CURLOPT_URL, $query);
$response = curl_exec($curl);
curl_close($curl);
// но вместо него можно и проще, результат будет одинаков:
// $response = file_get_contents($query);


echo $response;
?>

в ответ получаем JSON-объект вот с такой фигнёй:

{"sentences":[{
  "trans":"Kol\u0102\u0104\u00C4 e",
  "orig":"Kol\u0102\u0104\u00C4 e",
  "translit":"",
  "src_translit":""
}],"src":"cs","server_time":2}

Обратите внимание на поле orig, каким-то неведомым образом строка 'Kol%C3%A1%C4%8De' трасформировалась в 'Kol\u0102\u0104\u00C4 e'.
А если запрос translate.google.com/translate_a/t?client=x&text=Kol%C3%A1%C4%8De&sl=cs&tl=en просто вбить в адресную строку браузера, по получим красивый правильный ответ:

{"sentences":[{
  "trans":"Pies",
  "orig":"Koláče",
  "translit":"",
  "src_translit":""
}],"src":"cs","server_time":41}

Буду премного благодарен, если кто объяснит, почему так.

Доп. информация: исходная строка в utf-8, да это и не важно, ведь после urlencode получаем только ASCII-символы. С английского переводит нормально, что логично, ведь символы дополнительно не кодируются.

Подозреваю, что браузеры отправляют какие-то «правильные» заголовки, но так ли это, а если так, то как их узнать, а главное, как их отправлять вручную?

Вопрос задан более трёх лет назад
6054 просмотра

Комментировать

Подписаться 10 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Stepik

PHP (pro)

2 недели

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Решения вопроса 1

1 комментарий

Tant @Tant Автор вопроса
mitry, спасибо, то что нужно! Навскидку добавил user-agent Оперы

curl_setopt($curl, CURLOPT_USERAGENT, " Opera/9.80 (Windows NT 6.1; U; ru) Presto/2.8.131 Version/11.10");

и получил правильный JSON, как в примере с прямым запросом.
Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Средний
Как сделать что бы переменная avatar($ank['id']); не конфликтовала с другим файлом?
- 1 подписчик
- 17 июн.
- 192 просмотра
2

ответа
Google

Простой
Сколько можно иметь аккаунтов Google в 2026 году?
- 1 подписчик
- 14 июн.
- 417 просмотров
1

ответ
Google

Простой
В Google Photo нет раздела «Люди и домашние животные» на аккаунте, как решить?
- 2 подписчика
- 10 июн.
- 204 просмотра
1

ответ
PHP

+2 ещё

Средний
Как решить проблему с smtp сервером?
- 1 подписчик
- 03 июн.
- 428 просмотров
1

ответ
PHP

Средний
Как составить регулярное выражение?
- 1 подписчик
- 31 мая
- 242 просмотра
2

ответа
PHP

+2 ещё

Простой
Как настроить php_curl для php8 под windows?
- 1 подписчик
- 28 мая
- 188 просмотров
3

ответа
PHP

Простой
При правильном вводе каптчи не прегистрируется как исправить?
- 1 подписчик
- 24 мая
- 153 просмотра
2

ответа
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2457 просмотров
8

ответов
PHP

+1 ещё

Простой
Как получить список файлов из локальной папки?
- 1 подписчик
- 11 мая
- 322 просмотра
6

ответов
PHP

+1 ещё

Простой
Как работать с Manticore Search на php?
- 1 подписчик
- 29 апр.
- 180 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2012-05-22 23:33:00

Похоже, это у гугла это зависит от User-Agent:
Можно проверить на web-sniffer.net/ Для браузеров ответ приходит в UTF-8, а для 'Web-sniffer' или пустого User-Agent: — \u-encoded

Answer 2 · 2012-05-22 23:30:10

Всё правильно, это такой формат у JSON для хранения UTF-8 символов, более того, если сделать json_decode этой строки — то всё должно встать на место.

Google translate

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт