Тогда не подскажете, что могу делать не так?
Редис выделен в отдельный файл как
POOL = redis.ConnectionPool(host='localhost', port=6379, db=1)
r = redis.StrictRedis(connection_pool=POOL)
def set_value(key, value):
with r as redis_client:
redis_client.set(key, value)
def get_value(key):
with r as redis_client:
return redis_client.get(key)
В остальные файлы, где с ним идёт работа, я только импортирую get_value, set_value, использую их и на этом всё.
Спасибо, но решению это не помогает. Я это все читал, все пробовал. Есть даже соревнование на Kaggle - https://www.kaggle.com/competitions/anomaly-class-... - и больше 20% точности 30% реколла никто для класса-меньшинства не достиг пока что.
1) Про распределение. Целиком тренировочный датасет имеет 14 миллионов сэмплов класса 2 и 262к класса 1 и 102к класса 0. В память подобное банально не помещается, поэтому я просто каждый раз беру рандомный миллион (пробовал и 2, и 3, разница не менялась) и все сэмплы классов 1 и 0. Тест сет - это пример уже из реальной задачи из реальной жизни. Там распределение такое, и думаю, есть смысл на нем модель и оценить. Ну, собственно, а как иначе. Вот она уже - реальная задача с реальным примером - и если на нем модель проваливается, то грошь ей цена.
2) Про решаемость и оценку. Если я беру примерно одинаковое распределение на тренировочном, а затем из него же создаю тестовый, то модель вполне себе все различает, о чем говорят результаты:
mayton2019, ты про различия в тест сете и трейнинг сете? Полный трейнинг сет - это 14 миллионов экземпляров класса 2 + те же значения у классов 0 и 1. Использовать его весь я не вижу ни смысла, ни возможности: он банально не помещается в память при обучении
Большое спасибо, ваш совет помог. Вручную переустанавливал драйвера и ничего не помогало. Скачал программу Driver Booster, и она мне десятки устаревших драйверов насчитала, поставила и все заработало
Редис выделен в отдельный файл как
В остальные файлы, где с ним идёт работа, я только импортирую get_value, set_value, использую их и на этом всё.