Как объеденить текст с помощью AI?

Question

Gnifajio None @gnifajio

Совершенствуюсь каждый день

Нейронные сети

Как объеденить текст с помощью AI?

При парсинге статей часто случается что две статьи почти одинаковы или одинаковы, и в таких случаях их нужно как-то объеденить с сохранением смысла и правок.
Я думаю использовать для этого нейронные сети, но не знаю с чего мне начать.
Очень прошу помощи, т.к. в интернете я толковой информации не нашел.
Буду благодарен даже за ссылку (если материал годен для изучения)

Вопрос задан более трёх лет назад
55 просмотров

3 комментария

Подписаться 1 Средний 3 комментария

Vindicar @Vindicar

Не взлетит. Вон, яндекс пытался "объединить" коротенькие отзывы покупателей (а ведь у них здоровенная база текстов есть!), получалась фигня вида "всё прекрасно, ничего не работает, посоветую друзьям, покупать не буду".

Написано более трёх лет назад
mayton2019 @mayton2019

Я думаю что тут есть технический аспект. Символы. Слова. Токены. Сентенсы. Это решается текстовыми алгоримами. Стемминг там. Лемматизация. И есть человеческий аспект. Поэзия там. Литературные стили. Да что там. Даже по матушке послать кого-то можно так деликатно что и ни один ИИ и модератор не заметит. Десыть маму вашу я знал... сударь так и эдак.

Я думаю что тут про AI говорить рано. Можно что-то формализовать. Взять к примеру 2 статьи и вручную их слить и потом уже ставить ИИ задачу на основе того КАК оно было слито. И я думаю тут еще теории будет аж на целую диссертацию.

Написано более трёх лет назад
freeExec @freeExec

Ну вот в отрыве от человеческих статей, взять обычный код. Вот есть два файла, между ними какой-то дифф, что-то удалили, что-то добавили. Как не зная целей коммита понять, какой из них был модификация другого?

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 32 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 50 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 52 просмотра
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 50 просмотров
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 191 просмотр
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 107 просмотров
1

ответ
Нейронные сети

Простой
Flowise, как подключить эмбендингс?
- 1 подписчик
- 05 июл.
- 58 просмотров
1

ответ
Нейронные сети

Простой
Flowise error 500?
- 1 подписчик
- 04 июл.
- 70 просмотров
0

ответов
Нейронные сети

Простой
Нейросеть на ПК для обработки книжной литературы с последующей выдачей ответов по запросам?
- 1 подписчик
- 28 мая
- 198 просмотров
4

ответа
Arduino

+1 ещё

Средний
Сможет ли нейросеть написать скетч для Arduino mini мультиплексор нескольких COM портов в один?
- 2 подписчика
- 26 мая
- 321 просмотр
1

ответ
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Эксперт по транспортной сети/Сетевой инженер

НТЦ ПРОТЕЙ • Санкт-Петербург

от 200 000 ₽

Сетевой инженер

МТС • Владивосток

от 100 000 ₽

Не взлетит. Вон, яндекс пытался "объединить" коротенькие отзывы покупателей (а ведь у них здоровенная база текстов есть!), получалась фигня вида "всё прекрасно, ничего не работает, посоветую друзьям, покупать не буду".
Я думаю что тут есть технический аспект. Символы. Слова. Токены. Сентенсы. Это решается текстовыми алгоримами. Стемминг там. Лемматизация. И есть человеческий аспект. Поэзия там. Литературные стили. Да что там. Даже по матушке послать кого-то можно так деликатно что и ни один ИИ и модератор не заметит. Десыть маму вашу я знал... сударь так и эдак.

Я думаю что тут про AI говорить рано. Можно что-то формализовать. Взять к примеру 2 статьи и вручную их слить и потом уже ставить ИИ задачу на основе того КАК оно было слито. И я думаю тут еще теории будет аж на целую диссертацию.
Ну вот в отрыве от человеческих статей, взять обычный код. Вот есть два файла, между ними какой-то дифф, что-то удалили, что-то добавили. Как не зная целей коммита понять, какой из них был модификация другого?

Как объеденить текст с помощью AI?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт