Посоветую.
1) Возьмите elasticsearch -
https://www.elastic.co
2) в него через устанавливаете плагин "Ingest Attachment Processor Plugin" -
https://www.elastic.co/guide/en/elasticsearch/plug...
3) Закачивате в эластик свои дукументы (чтение документации приветствуется)
4) не забудьте установить kibana для просмотра элатика, изрядно помогает в разработке.
5) вот только теперь берете питон и через клиента для эластика -
https://elasticsearch-py.readthedocs.io/en/master/ или (а вот его настоятельно рекомендую)
https://elasticsearch-dsl.readthedocs.io/en/latest/ ищете в своих документах.
6) flask или aiohttp по вкусу.