• Как удалить первые 5 строк в Excel-файле с помощью Python?

    @EgorVaganov Автор вопроса
    А в таком случае, чтобы передать файл на обработку надо использовать xlrd? У меня при попытки работать с файлом xlrd выдает ошибку

    _locate_stream(Workbook): seen
    0 5 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
    20 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
    2320= 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
    2340 4 4 4 4 4 4 4 4 4 4 4 3 2 2 2 2 2 2 2 2
    2360 2 2 2 2 2 2 2 2 2 2 2
    Traceback (most recent call last):
    File "test.py", line 5, in
    df = pd.read_excel('file.xls')
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\util\_decorators.py", line 188, in wrapper
    return func(*args, **kwargs)
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\util\_decorators.py", line 188, in wrapper
    return func(*args, **kwargs)
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\io\excel.py", line 350, in read_excel
    io = ExcelFile(io, engine=engine)
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\io\excel.py", line 653, in __init__
    self._reader = self._engines[engine](self._io)
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\io\excel.py", line 424, in __init__
    self.book = xlrd.open_workbook(filepath_or_buffer)
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\__init__.py", line 157, in open_workbook
    ragged_rows=ragged_rows,
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\book.py", line 88, in open_workbook_xls
    ragged_rows=ragged_rows,
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\book.py", line 636, in biff2_8_load
    cd.locate_named_stream(UNICODE_LITERAL(qname))
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\compdoc.py", line 399, in locate_named_stream
    d.tot_size, qname, d.DID+6)
    File "C:\Users\Егор\AppData\Local\Programs\Python\Python37\lib\site-packages\xlrd\compdoc.py", line 427, in _locate_stream
    raise CompDocError("%s corruption: seen[%d] == %d" % (qname, s, self.seen[s]))
    xlrd.compdoc.CompDocError: Workbook corruption: seen[2] == 4
  • Как удалить первые 5 строк в Excel-файле с помощью Python?

    @EgorVaganov Автор вопроса
    Дмитрий Шицков, спасибо, я вижу, что у него есть xlutils.filter и это, видимо, может позволить записать новый файл, отфильтровав первые 5 строк, но пока не могу найти нужный функционал для этого.
  • Как удалить первые 5 строк в Excel-файле с помощью Python?

    @EgorVaganov Автор вопроса
    Спасибо. А Вы могли бы помочь со строками этого кода? Не могу найти как использовать библиотеку таким образом.
  • Как удалить первые 5 строк в Excel-файле с помощью Python?

    @EgorVaganov Автор вопроса
    AWEme, Дмитрий Шицков, коллеги, не нападайте на меня так сразу) Я задаю первый вопрос на сайте.
    Я попытался написать что-то своими руками - я пробовал использовать pandas изначально, но из-за того, что первые 5 строк в файле содержат объединенные ячейки, а далее структура ячеек другая, pandas не принимает таблицу в DataFrame. Я пробовал использовать openpyxl, но, если я правильно понял, то он работает с файлами .xlsx, но не с .xls. Я попробовал использовать xlrd и xlwt, но не смог подобрать функционал, чтобы получить нужный результат.
    А какой код я приложу, если затрудняюсь в подборе нужного инструмента?