Увлёкся в последнее время машинным обучением, подскажите, пожалуйста, что почитать/посмотреть на тему создания обучающей выборки (желательно на русском, но не обязательно). Гугление не помогло, скорее всего, ввиду слабой компетентности. Интересует:
1. способы создания
2. как определить необходимый объём
3. как оценить качество выборки
Если сочтёте, что хорошо бы было попутно ознакомиться чем-то, чего я тут не указал, скидывайте буду также премного благодарен.
Есть очень неплохой курс по machine learning от andrew ng, одного из основателей coursera. Курс очень полезен целиком, особенно 10 часть, "Advice for Applying Machine Learning" (там, кстати, обсуждается необходимый объём), а проблеме получения обучающей выборки посвящена эта лекция.