Как распарсить текст python?

Всем привет! Пишу небольшого бота для личного пользования и встал вопрос.
Есть мед.техникум, в котором расписание - это pdf документ, нужно его спарсить и сделать рассылку в беседу, со вторым всё просто и разберусь, а вот с моментом разбора всего текста не могу разобраться :c
В своём техникуме писал подобное, но там всё было куда проще(у нас всё в бд хранилось)
Документ, который "парсю" -_^

Код программы
import io
import sys
 
from pdfminer.converter import TextConverter
from pdfminer.pdfinterp import PDFPageInterpreter
from pdfminer.pdfinterp import PDFResourceManager
from pdfminer.pdfpage import PDFPage
 
def extract_text_from_pdf(pdf_path):
    resource_manager = PDFResourceManager()
    fake_file_handle = io.StringIO()
    converter = TextConverter(resource_manager, fake_file_handle)
    page_interpreter = PDFPageInterpreter(resource_manager, converter)
 
    with open(pdf_path, 'rb') as fh:
        for page in PDFPage.get_pages(fh, 
                                      caching=True,
                                      check_extractable=True):
            page_interpreter.process_page(page)
 
        text = fake_file_handle.getvalue()
 
    # close open handles
    converter.close()
    fake_file_handle.close()
 
    if text:
        return text
 
if __name__ == '__main__':
    pdftext = extract_text_from_pdf('doc.pdf')
    print(pdftext)

Изображение вывода
5db4386e400c7179715137.png

Код взял в сети, рабочий, но я без понятия, как вывести расписание определённой группы по дням недели и как это всё вообще лучше организовать 0_о, хелп ми
Пытался сделать проверку на регистр букв и перед большими делать перенос + обрезая всё до нужной части строки, но это бред -_-(наверное)
  • Вопрос задан
  • 431 просмотр
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы