Нейросеть для получения информации из документа?

Question

SPYSEL @SPYSEL

Хобби-программист. Изучаю этот многогранный мир!

Нейронные сети

Нейросеть для получения информации из документа?

Здравствуйте уважаемые товарищи программисты!
Возникла такая задача: Написать нейросеть, которая будет работать с документами(текстом) и доставать от туда ряд определенных значений(начиная от числового значения ИНН, заканчивая рядом пунктов договора) и выводить их. После достаточного времени с GPT - 4 и обычным поисковиком, после проб разных библиотек и использования разных нейронных сетей (RNN, LSTM, transformer) я не достиг результата. Может выборка маленькая(1000), может я что то не так делаю. Я бы хотел получить ответ на эти вопросы:
1. Какая библиотека должна использоваться?
2. С помощью какого метода и как правильно преобразовывать данные? (Понятный язык для нейросети)(Векторизация и токенизация))
3. Какой вид нейронной сети использовать? (RNN или LSTM например)
4. Есть ли смысл обучать нейросеть с 0 и не использовать готовые обученные модели? (BERT, ELECTRA, ALBERT)

Вопрос задан более двух лет назад
787 просмотров

6 комментариев

Подписаться 1 Средний 6 комментариев

SPYSEL @SPYSEL Автор вопроса

Justa Gain, это пример, сейчас это реализовано через регулярку, речь о том, что мне хотелось бы понять сам принцип как с этим работать, и я даже для этого выписал и выделил вопросы на которые я хотел бы получить ответ.

Написано более двух лет назад
SPYSEL @SPYSEL Автор вопроса

Justa Gain, "это что значит, ты спрашивал GPT как решить твою задачу?" задаешь ему в чате вопрос, например: какую библиотеку использовать? приведи пример кода, а почему используется это, а не то.
Насчет показать. Я вывел конкретные вопросы на которые хотел бы получить ответы, так как склонен считать, что код мой не работает должным образом, банально из за обучения токенизатора.

Написано более двух лет назад
SPYSEL @SPYSEL Автор вопроса

За предложения отредактировать мой вопрос и его теги, спасибо!

Написано более двух лет назад
kamenyuga @kamenyuga

LSTM - это и есть самый распространенный вид RNN. Нейросети не подходят для решения задачи "сделай мне все хорошо". Пока что проблема выглядит, как обычный/необычный парсинг структурированного/произвольного текста. Может, с этого стоит начать?

Написано более двух лет назад
SPYSEL @SPYSEL Автор вопроса

kamenyuga, Я вот не понимаю. Я хочу получить ответы на свои конкретные вопросы. Вы мне говорите "Нейросети не подходят для решения задачи "сделай мне все хорошо"". Так я и не прошу этого. Я хочу сам все сделать, вот и задаю вопросы, если бы все решалось обычными регулярками - парсером, я бы так и сделал и не писал сюда.

Написано более двух лет назад
mayton2019 @mayton2019

SPYSEL, если у тебя документ задан текстовым файлом (txt, rtf, doc) то его надо решать парсером как ты и делаешь.

Это самый бытстрый и детерминированный способ.

Все другие способы дают вероятностный ответ. Ну скажи какая тебе польза если реквизит достают с вероятностью? Будешь вручную все проверять?

Написано более двух лет назад

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 91 просмотр
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 86 просмотров
1

ответ
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 173 просмотра
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 303 просмотра
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 44 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 67 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 63 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Что мешает создать сугубо инженерную генеративную нейросеть?
- 1 подписчик
- 14 июл.
- 233 просмотра
3

ответа
Нейронные сети

+2 ещё

Простой
Требуется ли junior deep learning инженеру знание математики?
- 1 подписчик
- 13 июл.
- 174 просмотра
2

ответа
Показать ещё Загружается…

Middle/Senior Data Scientist (команда ИИ и аналитика)

Сбер • Москва

от 200 000 до 350 000 ₽

Стажер Моушен дизайнер для контента в соцсетях музыкального стартапа

Vocaberry

от 15 000 до 15 000 ₽

JS Fullstack Инженер (Node.js + Vue.js)

SteadyControl • Воронеж

от 100 000 до 250 000 ₽

Justa Gain, это пример, сейчас это реализовано через регулярку, речь о том, что мне хотелось бы понять сам принцип как с этим работать, и я даже для этого выписал и выделил вопросы на которые я хотел бы получить ответ.
Justa Gain, "это что значит, ты спрашивал GPT как решить твою задачу?" задаешь ему в чате вопрос, например: какую библиотеку использовать? приведи пример кода, а почему используется это, а не то.
Насчет показать. Я вывел конкретные вопросы на которые хотел бы получить ответы, так как склонен считать, что код мой не работает должным образом, банально из за обучения токенизатора.
За предложения отредактировать мой вопрос и его теги, спасибо!
LSTM - это и есть самый распространенный вид RNN. Нейросети не подходят для решения задачи "сделай мне все хорошо". Пока что проблема выглядит, как обычный/необычный парсинг структурированного/произвольного текста. Может, с этого стоит начать?
kamenyuga, Я вот не понимаю. Я хочу получить ответы на свои конкретные вопросы. Вы мне говорите "Нейросети не подходят для решения задачи "сделай мне все хорошо"". Так я и не прошу этого. Я хочу сам все сделать, вот и задаю вопросы, если бы все решалось обычными регулярками - парсером, я бы так и сделал и не писал сюда.
SPYSEL, если у тебя документ задан текстовым файлом (txt, rtf, doc) то его надо решать парсером как ты и делаешь.

Это самый бытстрый и детерминированный способ.

Все другие способы дают вероятностный ответ. Ну скажи какая тебе польза если реквизит достают с вероятностью? Будешь вручную все проверять?

Answer 1 · 2023-06-27 18:27:04

нейросеть распознающую смысл текста

на текущий момент этим занимаются Large Language Models, из открытых лучшие универсальные это opt и bloomz и они слабее даже llama но как основу их можно брать.

Языковые модели fine-tuning на примерах (буквально, размечаешь десятки-сотни пар данных: текст - ответ), и затем такую обученную сеть или комбаин (есть peft, который позволяет тюнить не веса модели а веса запроса, я слушал лекцию от яндекса, ребята там говорили что это очень выгодно по ресурсам и удобно, не трогать веса модели).

Если есть возможность и деньги, использовать chatgpt4, то она позволит простыми вопросами (почти такими же как к человеку, который решал бы твою задачу) решить задачу, еще не всем там доступен прямо ввод pdf документа но как я понял скоро будет доступен всем (кроме России само собой).

p.s. я пробовал на процессоре крутить llama и основанные на ней модели типа open assistent (не бери llm меньше 30B) для похожей задачи (объем документа ограничен 2к токенов, примерно 1.5к слов, можно многоуровневыми запросами сначала отвечать на вопросы по абзацам, а затем итоговую выжимку собирать и обрабатывать отдельным запросом), с ней работать очень сложно, ответы нужно предварительно чистить от мусора и разрабатывать условия окончания генерации (со стоп токенами там проблема) и работает на процессоре медленно (минуты на запрос) но это самое дешевое решение на текущий момент, доступное оффлайн в принципе, само собой без разрешения facebook пользоваться этим нелегально (как минимум не для исследования)

Answer 2 · 2023-06-23 19:19:23

Нейронная сети, актуальны для задач где присутствует ВАРИАТИВНОСТЬ. Вы имеете входные данные обозначим их Х вы имеете функцию которая сопоставляет эти данные с выходными данными (извлечь ИНН и другие пункты договора) обозначим их y. Так вот если вариативность отсутствует то данная задача f(X) = y, решается парсингом документа, а не нейронными сетями. Если задача имеет вид f(X) = y + E, где E это случайная ошибка, то нейронная сеть это один из возможных алгоритмов МИНИМИЗАЦИИ этой ошибки, но НЕ полного ее исключения. Так что надо иметь ввиду что 100 процентной точности не добиться. И ответить себе а допустимо ли это.

Что касается твоих вопросов, ну например пункт номер два это целый раздел в машинном обучении. Который содержит в себе несколько подпунктов. И дело это инженерное - а не вот какой то метод решит все мои проблемы. Пункт номер три обе могут быть использованы. Пункт четвертый, а потянешь с нуля. А готовые модели они решат частный кейс твоей проблемы? Откуда нам знать, с какой точностью готовые модели будут извлекать данные. Ну а первый вопрос, это всего лишь api для моделей и выбирать надо ту с которой имеешь опыт работы, какой то лучшей нет.

Нейросеть для получения информации из документа?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт