Как определить схожесть(рерайт, уникальность) 2ух текстов на Go(Golang)?

Question

inbider @inbider

Как определить схожесть(рерайт, уникальность) 2ух текстов на Go(Golang)?

Всех приветствую!)

Господа, необходимо определить схожесть(рерайт, уникальность) двух(и более) текстов между собой. Может кто сталкивался с подобной задачей, поделитесь советами, ссылками на библиотеки.

П.С. Заранее благодарен!

Вопрос задан более трёх лет назад
800 просмотров

Комментировать

Подписаться 5 Оценить Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Linux

+1 ещё

Простой
Trace/breakpoint trap (core dumped)?
- 1 подписчик
- 22 июл.
- 323 просмотра
2

ответа
Go

Простой
Неточность формулировки в книге или же я не понимаю?
- 1 подписчик
- 21 июл.
- 238 просмотров
2

ответа
Go

Простой
Зачем for {select} оборачивать в еще один select с time.Ticker?
- 1 подписчик
- 24 июн.
- 791 просмотр
3

ответа
Go

Средний
Какие гарантии на выравнивание адреса указателя?
- 1 подписчик
- 09 июн.
- 790 просмотров
1

ответ
Go

Средний
Как поменять env переменную PATH в golang (MacOS)?
- 2 подписчика
- 01 мая
- 154 просмотра
2

ответа
Веб-разработка

+1 ещё

Простой
Почему не кэшируются страницы на клиенте?
- 1 подписчик
- 23 апр.
- 230 просмотров
2

ответа
Go

Простой
Как установить драйвер mysql для golang?
- 2 подписчика
- 21 апр.
- 507 просмотров
1

ответ
PostgreSQL

+2 ещё

Средний
Как понять сколько max соединений в pgxpool-е тебе нужно?
- 1 подписчик
- 17 апр.
- 199 просмотров
1

ответ
Go

Простой
Можно ли как то избавится от названия основного модуля при импорте Go файлов?
- 1 подписчик
- 09 апр.
- 192 просмотра
0

ответов
Go

Простой
Какой посоветуете фреймворк (с роутингом, orm и мидлваре) для Golang?
- 2 подписчика
- 03 апр.
- 581 просмотр
3

ответа
Показать ещё Загружается…

Go developer

ПСБ цифровая лаборатория • Москва

Разработчик Go

ИНГО БАНК • Москва

Go Developer (RnD)

AppMagic

До 5 000 $

Answer 1 · 2017-09-22 13:04:12

Задача оказалась довольно не тривиальной и кейсов её решения довольно много, но кому интересно копать можно начать вот отсюда: https://4gophers.ru/articles/semanticheski-analiz-...

Answer 2 · 2017-09-19 14:44:56

Для python есть difflib. Код ниже не проверял, но должно работать

from difflib import SequenceMatcher
file_1 = "text_1.txt"
file_2 = "text_2.txt"
s = SequenceMatcher(lambda x: x == " ", # пропускаем пробелы
                    file_1.read(),
                    file_2.read())
print(round(s.ratio(), 3)) # число от 0 до 1. 0 - совсем не похожи ; 1 - идентичный текст

Всё это дело на python можно легко распараллелить и т.п.

Как определить схожесть(рерайт, уникальность) 2ух текстов на Go(Golang)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт