Дмитрий Шицков, спасибо, я вижу, что у него есть xlutils.filter и это, видимо, может позволить записать новый файл, отфильтровав первые 5 строк, но пока не могу найти нужный функционал для этого.
AWEme, Дмитрий Шицков, коллеги, не нападайте на меня так сразу) Я задаю первый вопрос на сайте.
Я попытался написать что-то своими руками - я пробовал использовать pandas изначально, но из-за того, что первые 5 строк в файле содержат объединенные ячейки, а далее структура ячеек другая, pandas не принимает таблицу в DataFrame. Я пробовал использовать openpyxl, но, если я правильно понял, то он работает с файлами .xlsx, но не с .xls. Я попробовал использовать xlrd и xlwt, но не смог подобрать функционал, чтобы получить нужный результат.
А какой код я приложу, если затрудняюсь в подборе нужного инструмента?
Написано
Войдите на сайт
Чтобы задать вопрос и получить на него квалифицированный ответ.
_locate_stream(Workbook): seen
0 5 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
20 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
2320= 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
2340 4 4 4 4 4 4 4 4 4 4 4 3 2 2 2 2 2 2 2 2
2360 2 2 2 2 2 2 2 2 2 2 2
Traceback (most recent call last):
File "test.py", line 5, in
df = pd.read_excel('file.xls')
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\util\_decorators.py", line 188, in wrapper
return func(*args, **kwargs)
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\util\_decorators.py", line 188, in wrapper
return func(*args, **kwargs)
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\io\excel.py", line 350, in read_excel
io = ExcelFile(io, engine=engine)
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\io\excel.py", line 653, in __init__
self._reader = self._engines[engine](self._io)
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\io\excel.py", line 424, in __init__
self.book = xlrd.open_workbook(filepath_or_buffer)
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\__init__.py", line 157, in open_workbook
ragged_rows=ragged_rows,
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\book.py", line 88, in open_workbook_xls
ragged_rows=ragged_rows,
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\book.py", line 636, in biff2_8_load
cd.locate_named_stream(UNICODE_LITERAL(qname))
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\compdoc.py", line 399, in locate_named_stream
d.tot_size, qname, d.DID+6)
File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\compdoc.py", line 427, in _locate_stream
raise CompDocError("%s corruption: seen[%d] == %d" % (qname, s, self.seen[s]))
xlrd.compdoc.CompDocError: Workbook corruption: seen[2] == 4