user1410
@user1410
Изучаю JavaScript

Как реализовать парсинг бухгалтерского баланса и отчета о финансовых результатах, если они в виде фотографии?

Пришла в голову идея написать программу, которая на входе получает фотографию или pdf бухгалтерского отчета, распазнает его статьи и сохраняет их в базу для дальнейшего анализа. Ну например в балансе есть два основных раздела актив и пассив и там строки, скажем "Здания и сооружения: 123 456", "Вклады: 123 345", "Денежные средства: 123 456". После распознования и парсинга эти данные складываются в массив примерно так
$balance = array(
        "actives" => array(
            "Основные средства" => 123456,
            "Вклады" => 123456,
            "Денежные средства" => 123456,
        ),
        "passives" => array(
            // и т.д.
        ),
    );


Дальше эти данные будут обрабатываться/сохраняться в базу и т.д.

Вопрос в том как их распозновать, если баланс в формате картинки?
Правильно ли я понимаю, что эта задача должна решаться с помощью нейросети? Если да, то реально ли написать такую нейросеть на php? :)
  • Вопрос задан
  • 226 просмотров
Решения вопроса 1
PeterLS
@PeterLS
Программист
Есть сайты, в которых можно за определенную плату распознавать изображения. У некоторых есть подобие API.
К примеру, сайты antigate.com, captchabot.com, anti-captcha.net, wisetrend.com. (Последние 2 ссылки, там кажется можно протестировать бесплатно)
Можно еще использовать GOCR jocr.sourceforge.net
И вызвать ее из PHP:
$output = shell_exec('/usr/local/bin/gocr -i ' . escapeshellarg($image_file));

А дальше - чисто вопрос программистских навыков. Все это дело проверить регулярными выражениями, разбить в определенную структуру и записать в БД.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
nuclear_kote
@nuclear_kote
Ну для начала ocr
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы