Задать вопрос
@krakaka

Хочу парсить большое число книг < 17 века в поисках информации об исчезнувшем народе, как решить задачу?

в случае с pdf я смогу распарсить регулярками, но "книгами" конечно будут являться чаще сканы, и чаще каких-то рукописей неформатных, да на разных языках, да причем устаревших вариантах языков. вероятно понадобится компьютерное зрение, какой инструмент можно было бы выбрать для такой задачи?
  • Вопрос задан
  • 144 просмотра
Подписаться 1 Средний Комментировать
Помогут разобраться в теме Все курсы
  • OTUS
    iOS Developer
    12 месяцев
    Далее
  • AndroidSprint
    Попробуйте себя в роли разработчика за 10 дней
    1 неделя
    Далее
  • Stepik
    Парсинг на Python для начинающих
    2 недели
    Далее
Решения вопроса 2
datka
@datka
Ответ написан
Комментировать
@krakaka Автор вопроса
почитав про шрифты и стили письма, такие как "скоропись", "полуустав", понял, что задача действительно нереальна, для одного человека точно
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
samodum
@samodum
Какой вопрос - такой и ответ
Такая задача не решается автоматически, а только вручную
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы