Я хочу извлечь текст из pdf, где текст визуально в два столбца, но библиотека pdfplumber читает его как одну строку.
я хочу чтобы сначало считало с первого столбца, а потом с другого. Как мне это сделать?
мой код
class TextPDF():
def __init__(self, name):
self.name = name
def text(self):
file = open("wb_text_shlak.txt","w")
file.close()
pdf = pdfplumber.open(self.name)
for i in range(2,14):
page = pdf.pages[i]
text = page.extract_text()
with open("wb_text_shlak.txt","a") as file:
file.write(text)
wb = TextPDF("4.pdf")
wb.text()