kuraga333
@kuraga333
Программист, аналитик

Как оформить классификатор с разной структурой данных на обучении и тесте?

Я пишу свой классификатор на scikit-learn. То есть наследую sklearn.base.BaseEstimator. Но структура данных на обучении и на тесте отличаются (классифицируемый объект - спортивный матч),
  • на обучении это названия команд и набор событий, отвечающих за матч,
  • а на тесте это только названия команд.



Отмечу, что "набор событий" вообще сложно представить в виде матрицы...

Как это оформить?
UPD. Имеется ввиду: какие сигнатуры у методов должны быть, если я наследую sklearn.base.BaseEstimator?
  • Вопрос задан
  • 151 просмотр
Пригласить эксперта
Ответы на вопрос 1
@Vlad_Fedorenko
Либо не использовать при обучении признаки, которые не будут доступны в тесте, либо использовать информацию из трейна а-ля для команды 1 средняя доля выигрышей 0.67. Но тут просто переобучиться и натолкнуться на ситуацию, когда в тесте будет команда, которой не было в трейне
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы