Задать вопрос
NewTechAudit
@NewTechAudit
Профессиональное сообщество DS и DE

Почему при работе с Polars в сочетании с OpenPyXL исчезает часть данных?

Добрый день!

При работе с Polars в сочетании с OpenPyXL простое выполнение polars.read_excel(path, engine=»openpyxl») приводит к исчезновению данных из одного столбца и к огромному перерасходу оперативной памяти. Проблема возникает, если в исходных данных большие участки столбца имеют различные типы данных. Например, 100 000 ячеек — даты и еще 100 000 — числа или строки. Polars в сочетании с OpenPyXL молчаливо съест из них 100 000 ячеек. Я не могу знать, что это будут за ячейки, хоть я и знатно покопался в исходном коде обеих библиотек, чтобы это выяснить. Никакой ошибки или предупреждения нет – часть данных просто теряется.

Может кто знает в чём причина?
  • Вопрос задан
  • 133 просмотра
Подписаться 3 Средний 1 комментарий
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
SpectrumData Екатеринбург
от 200 000 до 300 000 ₽
Greenway Global Новосибирск
от 150 000 ₽
Akronix Санкт-Петербург
от 150 000 до 200 000 ₽
22 янв. 2025, в 04:08
6000 руб./за проект
21 янв. 2025, в 23:55
20000 руб./за проект
21 янв. 2025, в 23:35
80000 руб./за проект