Есть 2 случая:
1. В реальном мире, как и в выборке есть "перекос" распределения по классам, то есть какие-то объекты встречаются заведомо реже
2. В реальном мире "перекоса" нет.
В первом случае, лучше сохранить "перекос", в втором сгенерировать больше данных