NewTechAudit
@NewTechAudit
Профессиональное сообщество DS и DE

Почему при работе с Polars в сочетании с OpenPyXL исчезает часть данных?

Добрый день!

При работе с Polars в сочетании с OpenPyXL простое выполнение polars.read_excel(path, engine=»openpyxl») приводит к исчезновению данных из одного столбца и к огромному перерасходу оперативной памяти. Проблема возникает, если в исходных данных большие участки столбца имеют различные типы данных. Например, 100 000 ячеек — даты и еще 100 000 — числа или строки. Polars в сочетании с OpenPyXL молчаливо съест из них 100 000 ячеек. Я не могу знать, что это будут за ячейки, хоть я и знатно покопался в исходном коде обеих библиотек, чтобы это выяснить. Никакой ошибки или предупреждения нет – часть данных просто теряется.

Может кто знает в чём причина?
  • Вопрос задан
  • 124 просмотра
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы