Всем привет!
Назрела следующая предыстория. Сейчас подготавливаю данные для обработки и часть спарсенных экселек фактически представляют собой файлы в формате *.mhtml. Будучи сохраненными в *.xls-формате они открываются как книги MS Excel 97-2003, но другие средства (Power Query, пакеты xlrd, pyexcel) их не распознают как эксельку. Заметил, что если зайти в подобный файл и сохранить его как файл в формате *.xlsx то проблема с форматом решается. Однако таких файлов накопилось 3240 штук и ручная обработка этой кучки станет последним, что я запомнил за летний отпуск.
Пример файла выложил по ссылке:
Клик на Яндекс-диск
И вот вопрос - как реализовать в Python автоматическое выполнение цепочки действий "Открыть файл ==> Сохранить как ... в формате *.xlsx ==> Закрыть файл"?
И такое ли решение задачи оптимальное - может есть более простые альтернативы как привести состояние файлов к корректному формату?