Задать вопрос
@swcalc

Как выявить языковую пару из 2-х документов?

Здравствуйте, есть 2 документа, каким образом (в теории, без кода = ) ), можно выявить, что 2 слова в английском документе равны 3 словам в русскоязычном?

Необходимы хотя бы зачатки идеи ))).
Как сверять, по символьно - бред, составление предшествующей базы?
Например hello = (привет||здравствуй||здравствуйте) и от этого отталкиваться?
  • Вопрос задан
  • 264 просмотра
Подписаться 2 Оценить 8 комментариев
Решения вопроса 1
@moozooh
Chief Technical Grammar Nazi
Если нужно хорошее коммерческое решение, то понадобится нейронная сеть, которой будут скармливаться сотни тысяч языковых пар на уровне грамотных и цельных тематических текстов с переводом на нужный язык, и длительный период обучения. Со временем она должна научиться распознавать наиболее частые для контекста смысловые эквиваленты на уровне предложений и, вероятно, типичных словосочетаний. Но думаю, то, что даже компаниям уровня Гугла, у которых есть свой веб-сервис перевода и доступ к петабайтам языковых пар, пока не под силу сделать нечто сопоставимое работе даже переводчика-любителя — хороший показатель сложности задачи.

Если ничего хорошего не нужно, то можно попробовать состряпать простенький переводчик из открытых словарей, где уже заложено большинство частоиспользуемых языковых пар на уровне слов и словосочетаний. Только это уже реализовано много кем («Промт» помните?) и абсолютно бесполезно для перевода больших объёмов текста.

Точно переводить по словам, конечно, не получится никогда, так же как нельзя пересадить корове ногу оленя и надеяться, что она от этого быстрее побежит.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы