Задать вопрос
@brainplus

Как перевести строки в json с простейшей структурой на другие языки используя нейросети или API?

Есть json с переводами строк, с простейшей структурой

{
 "key1": "translation for key1", 
 "key2": "translation for key2",
}

Нужно перевести значения из этого map ("translation for key..") с английского на другой язык, не трогая ключи, на другие языки используя нейросети (chatgpt например).

В переводимых строках возможны спецсимволы, кавычи, и может даже простейшая html разметка. Все это не должно поломаться, должен получаться валидный json на выходе.

Делать это хочется часто и для многих языков, поэтому хочется чтобы делалось из командной строки или через API.

Какой сервис или инструмент для этого посоветуете?
  • Вопрос задан
  • 1154 просмотра
Подписаться 2 Простой 1 комментарий
Пригласить эксперта
Ответы на вопрос 4
@rPman
Пишите приложение, которое перебирает элементы json и отправляет переводчику по отдельности каждое

к сожалению даже топовые gpt с некоторыми не нулевыми шансами (даже если и 1% вам не понравится) могут пропустить что то важное или додумать или изменить структуру.

Есть structured output, ты описываешь выходную структуру и gpt сгенерирует ответ строго по этому формату, как минимум этот подход позволит защититься от повреждения структуры... не думаю что описать формат твоей json будет проще чем написать приложение, которое будет разбирать json на элементы.

Переводить можно как универсальными нейронками (это перебор конечно но почему нет, особенно когда нужно контролировать неоднозначности, пилишь огромный пропт, в котором указываешь правильный перевод имен, пол каждого или способ обращения, другие особенности а затем добавляя к нему короткие текстовые строчки получаешь перевод, благодаря nv-cache длинный пропт будет кешироваться и стоить меньгше/бесплатно) а можно специализированными, публично доступна вполне терпимая от facebook m2m100 или новее nllb-200, они мелкие и приемлемо работают на процессоре
Ответ написан
Комментировать
Rsa97
@Rsa97
Для правильного вопроса надо знать половину ответа
А какой лучше знаете, тот и берите.
JSON читается и пишется практически во всех современных языках программирования. API для перевода тоже хватает, например гугловское или яндексовское. С HTML придётся бороться самостоятельно.
Только учитывайте, что многие вещи без контекста или с недостаточным контекстом переводятся неоднозначно. Например, notebook - ноутбук или записная книжка? Nail - ноготь или гвоздь?
Ответ написан
mayton2019
@mayton2019
Bigdata Engineer
Задача декомпозируется на 3 подзадачи.
1) Выбрать список строк из json
2) Перевести
3) Вставить перевод обратно.

По пункту (1), (3) есть API JSON path, Json Document или ему подобный. Почти для всех языков это уже решенная задача.

По пункту 2 лучше взять онлайн Rest API машинного перевода. Например от Google.
Ответ написан
Комментировать
@aleksdzalov1978
Отправляешь запрос "переведи в json тексте все value значения на русский язык. [текст json]" ChatGPT и получаешь ответ. Я так делаю через бота https://t.me/ChatGPTPoRusskiBot только у меня csv-файл. Работает в принципе отлично.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы