Спасибо за такой ответ. А можете ещё дать конкретные советы по моей работе?
В данный момент я моделирую работу робота на биржах и записываю логи сделок, как если бы они случались в реальности с разной информацией о валютах.
Статистика сделок такая:
253 - прибыльные
193 - нет
то есть 56% - TRUE
44% - FALSE
Когда запускаю разные модели алгоритмов (KNN, RF, DL, AdaBoost и тд), которые в процессе тюню ГридПоиском, всегда результат максимум 59%. Т.к. я новичок, не знаю, куда двинуться, чтобы достичь лучших результатов (собираю итог не только по Accuracy, но и f1 recall, precision и тд, что выдает базовая команда отчета, они все все равно колеблются в диапазоне 55-60%).
Мысли пока такие.
1) Продолжать собирать данные. Больше данных - больше случаев - лучше обучение.
2) А дальше что?
Есть мысль, что не все колонки данных нужно на обучение подавать. Какие-то могут наоборот смутить алгоритм и запутать. Но как их определить? Не может быть так, что какому-то алгоритму какие-то колонки будут нужны, а какому-то нет? Тогда может начать с выбора алгоритма? Но опять, как подобрать, какой лучший?