@krakaka

Хочу парсить большое число книг < 17 века в поисках информации об исчезнувшем народе, как решить задачу?

в случае с pdf я смогу распарсить регулярками, но "книгами" конечно будут являться чаще сканы, и чаще каких-то рукописей неформатных, да на разных языках, да причем устаревших вариантах языков. вероятно понадобится компьютерное зрение, какой инструмент можно было бы выбрать для такой задачи?
  • Вопрос задан
  • 122 просмотра
Решения вопроса 2
datka
@datka
Ответ написан
Комментировать
@krakaka Автор вопроса
почитав про шрифты и стили письма, такие как "скоропись", "полуустав", понял, что задача действительно нереальна, для одного человека точно
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
samodum
@samodum
Какой вопрос - такой и ответ
Такая задача не решается автоматически, а только вручную
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы