Как оптимизировать работу в JupyterNotebook?

Question

Иосиф Гудман @lolaevv

В процессе изучения азов JAVA

Как оптимизировать работу в JupyterNotebook?

Доброго времени суток.
Прохожу на Stepik курс по machine learning и столкнулся с довольно неприятной проблемой.
Во время подготовки данных конечный датафрейм разросся до небывалых размеров

Есть ли какая-то возможность оптимизировать использование ресурсов компьютера, а то работать невозможно. При запуске ячейки комп просто зависает. Даже для того, чтобы вывести сообщение на скриншоте компьютер довольно сильно залагал.

Комп имеет старенький intel core i3 и 8гб ddr3. Или всё-таки надо менять комплектующие?

Вопрос задан более трёх лет назад
104 просмотра

Комментировать

Подписаться 1 Средний Комментировать

Решения вопроса 2

Комментировать

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Как изменить сообщение с текстом на сообщение с картинкой для тг бота в библиотеке py telebot?
- 2 подписчика
- 5 часов назад
- 67 просмотров
2

ответа
Python

+1 ещё

Простой
Пишу телеграм бота на пайтон и вылезает ошибка KeyError: 'recipes'. Как решить?
- 1 подписчик
- 6 часов назад
- 42 просмотра
1

ответ
Python

+2 ещё

Простой
Как скрыть данные в кнопке KeyboardButton?
- 1 подписчик
- 6 часов назад
- 34 просмотра
0

ответов
Python

+1 ещё

Простой
Выбор: парсить на питоне с aiohttp, asyncio, bs4 или requests + bs4?
- 1 подписчик
- 13 часов назад
- 110 просмотров
2

ответа
IT-образование

+3 ещё

Простой
Какая есть литература полезная и понятная по Data Science на русском?
- 3 подписчика
- 13 часов назад
- 602 просмотра
1

ответ
Python

+1 ещё

Простой
Почему не срабатывает клик по элементу при открытии станицы selenium python?
- 1 подписчик
- 23 часа назад
- 40 просмотров
1

ответ
JavaScript

+1 ещё

Простой
Как подключить кошелёк к web3 сайту?
- 1 подписчик
- вчера
- 72 просмотра
1

ответ
Python

Простой
Выполнение парсинга странцы?
- 2 подписчика
- вчера
- 98 просмотров
2

ответа
Python

Простой
Как исправить ошибку?
- 1 подписчик
- вчера
- 100 просмотров
1

ответ
Python

Простой
Что не так с кодом Python?
- 1 подписчик
- 15 апр.
- 167 просмотров
1

ответ
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Настройка записи логов fastapi в Loki

17 апр. 2024, в 22:54

1000 руб./в час

Настроить замки Omnitec для отеля, 12 замков

17 апр. 2024, в 21:41

30000 руб./за проект

Дизайнер

17 апр. 2024, в 21:40

500 руб./за проект

Answer 1 · 2020-06-28 10:43:29

Первым делом посмотрите, как используется память:
df.memory_usage(deep=True)

А дальше оптимизируйте тип каждой колонки:

Для категориальных данных:
df['object'].astype('category')
user_id и days, например, должны быть int type
ну и float64 вам скорее всего тоже не нужен. Достаточно float32 , а иногда и float16

Answer 2 · 2020-06-28 12:38:03

Можно использовать популярный скрипт reduce_mem_usage например отсюда. Он проверяет переменной какого типа достаточно чтобы описать минимальное и максимальное значение в колонке и преобразует тип. Предварительно нужно преобразовать целочисленные колонки в int64. Или загуглите и найдите вариант скрипта, который лучше подойдет, в сети море подобных скриптов с небольшими вариациями, в том числе с обработкой NaN, автоматической проверкой на целочисленность данных и т.п.

Answer 3 · 2020-06-28 12:42:09

Изменил тип одной из колонок с float64 на int через df.step_id.astype(int) и использование памяти уменьшилось с 4gb+ до 3,4gb . Правда комп был абсолютно неработоспособным 15 минут, пока выполнялись операции по изменению типа столбца

Как оптимизировать работу в JupyterNotebook?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт