как тюнить непонятно. Поэтому вопрос к специалистам: какой алгоритм лучше использовать для моей задачи, как лучше тюнить и какие показатели Accuracy считаются хорошими?
- Существует три основных видов ансамблирования алгоритмов ML (а именно так называется то, что вы хотите сделать) - стекинг, бэггинг, бустинг. И масса производных от них. (Правда - если вы хотите более тонко настраивать ансамбль, то в ход идут другие, более сложные методы, которые учитывают статистические характеристики, включая доверительные интервалы, ROC оценки конкретных алгоритмов и пытаются работать с ними - но это уже далеко от старта).
Про эти простейшие способы можно прочитать и в серьезных работах, коих немало, и в статьях для начинающих, например:
https://habr.com/ru/post/561732/
https://alexanderdyakonov.wordpress.com/2019/04/19...
arbir.ru/articles/a_4053.htm
а есть книги различной степени серьезности на эту тему:
Kunapuli Ensemble Methods for Machine Learning
Kyriakides Hands-On Ensemble Learning with Python:...
Semi Ensemble Methods in Data Mining: Improving Ac...
И вообще, сегодня уже ни одна книга по МL не выходит без раздела про ансамблирование. Ну вот просто из последнего, 2022 год издания, что под рукой
Pajankar Hands-on Machine Learning with Python: Im...
и в ней глава "CHAPTER 10 Ensemble Learning Methods"
По сути, сегодня все соревнующиеся на Kaggle и в M4 Competition - именно этим (построением ансамблей алгоритмов) занимаются, понимая, что объединение нескольких алгоритмов может дать несколько процентов выигрыша. Можете посмотреть несколько примеров где объединяют казалось бы необъединимые алгоритмы (например - статистическую оценку параметров с нейросетью). Но вот жестких подсказок тут никто не даст - для каждой задачи это эксперименты + знания, опыт и интуиция исследователя.
какие показатели Accuracy считаются хорошими -
а вот тут все намного проще. Нет понятия "хороший" или "плохой" показатель. Это не школа, где вам надо найти правильный ответ. ML вообще, и ансамблирование еще в большей мере - это процесс творческий. Какое значение получите - вот то и есть (для вас) хороший результат. Хотите больше - экспериментируйте дальше.
Ну и замечание вдогонку. Accuracy - это не единственный показатель. Не даром напридумывали еще как минимум с полдесятка характеристик эффективности моделей ML. И часто надо искать компромисс, поскольку одни алгоритмы оказываются лучше по одним показателям, а некоторые - по другим. И вам надо найти и как-то оценить, какие именно характеристики работают в вашем случае. Так что поле для деятельности открывается достаточно широкое.