Как провести многоэтапную проверку текста через LLama3?

Question

SPICHKIN_TUT @SPICHKIN_TUT

Как провести многоэтапную проверку текста через LLama3?

Я использую локально LLama3, надо

Сделать систему, которая отдаёт модель анализируемый PDF.

Затем, обычным скриптом мы извлекаем интересующие нас числа и стоит задача его классифицировать.

Мы его классифицируем по разным категориям:

Относится ли число к (задолженности | пени | госпошлине), какая процедура относится к числу (Возврат | Взыскание), в какой части удовтеворения находится (Полностью | Частичная). Так как обычными скриптами это не выявить, наше число проходит трех этапную проверку у модели.

Модель будет отвечать всегда по разному, потому когда модель определяет (задолженности | пени | госпошлине) мы должны закодировать как 1, 2 или 3. Чтобы затем уже стандартизированно внести его в бд

Скажите такое возможно вообще?

Вопрос задан более года назад
63 просмотра

2 комментария

Подписаться 1 Простой 2 комментария

Решения вопроса 1

2 комментария

SPICHKIN_TUT @SPICHKIN_TUT Автор вопроса

А про какие классические алгоритмы идет речь?

Написано более года назад
rPman @rPman

Используя анализ относительного положения блоков текста (если блок с текстом на одном уровне по высоте с другими и текст ранее или содержит определенные фразы то текст справа считать такими то типом данных) , итеративно пробегая по всем таким правилам по всему документа, собираешь структуру с распознанными данными, затем ещё раз анализируешь по заранее заданными правилам отсутствующие данные, а также данные в документе, не попавшие в эту структуру.... Алгоритм разрабатываешь итеративно, запуская его на всю базу примеров документов, пока не распознает все

Написано более года назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Обработка естественного языка

Средний
Как создать мультипризнаковую мноклассовую модель классификации текстов?
- 3 подписчика
- 17 мая
- 1139 просмотров
0

ответов
Машинное обучение

+2 ещё

Средний
Какие виды эмбединга используется в nlp?
- 1 подписчик
- 10 мая
- 100 просмотров
1

ответ
Регулярные выражения

+2 ещё

Простой
Поиск оптимальной регулярки для бинарной классификации строк. Как?
- 1 подписчик
- 22 мар.
- 199 просмотров
1

ответ
Алгоритмы

+1 ещё

Средний
Какие есть Алгоритмы поиска синонимов?
- 3 подписчика
- 21 мар.
- 1683 просмотра
3

ответа
Машинное обучение

+1 ещё

Простой
Какой датасет лучше для обучения?
- 2 подписчика
- 17 янв.
- 183 просмотра
1

ответ
Анализ текста

Простой
Как можно определить схожесть текстов?
- 3 подписчика
- 03 янв.
- 329 просмотров
1

ответ
Анализ текста

Простой
Как проверить текст на осмысленность?
- 1 подписчик
- 21 дек. 2024
- 148 просмотров
3

ответа
Искусственный интеллект

+2 ещё

Простой
Как исправить ошибку, возникающую при загрузке модели в rust_bert без файла vocab.txt?
- 1 подписчик
- 09 нояб. 2024
- 54 просмотра
1

ответ
Обработка естественного языка

Средний
Почему модель llama предсказывает только один класс?
- 2 подписчика
- более года назад
- 148 просмотров
1

ответ
Показать ещё Загружается…

Art Director (TV, Youtube, Реклама)

SDL • Москва

от 190 000 ₽

Системный аналитик (Мои Сервисы)

Сбер • Москва

от 300 000 ₽

QA automation (C#)

Альфа-Банк • Москва

от 200 000 до 350 000 ₽

Скажите такое возможно вообще?

Возможно.

Answer 1 · 2024-07-16 05:58:29

Скорее всего выбранный инструмент подходит для задачи слабо. У llama3 выполнение инструкций на уровне 60%-70% , т.е. треть данных она будет пропускать или ещё хуже, выдумывать.

У llama3-70b (именно ее качество такое высокое, у 8b оно заметно ниже) есть ещё беда, она может ответ дать в случайном виде, не машиночитаемом, хоть и вернвм, а значит для чтения потребуется городить многоуровневую систему из того же ИИ и ручного распознавания.

Скорее всего твоя задача лучше решается предварительным анализом классическими алгоритмами.

И ещё момент, локальные сети эффективнее использовать, дообучая на своих запросах и данных (сотни и тысячи примеров), так полученная сеть будет лучше давать результат но ценой уменьшения универсальности.

Как провести многоэтапную проверку текста через LLama3?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт