Вообще-то говоря, в каких терминах объяснять - все равно, т.к. явление переобучения - это когда ваша модель отлично работает на обучающей выборке (ну наверное, в вашем случае - отлично отделяет сигнал от шума на тех данных, на которых вы ее обучаете) и плохо, т.е. с большим количеством ошибок, - на тестовых данных. Четкой границы вообще-говоря нет. Как многое в статистике и машинном обучение - все определяется исходя из здравого смысла и семантики в терминах прикладной предметной области. Иногда, правда можно применить "полуформальные" методы, например - метод "колена" в кластерном анализе, но и там все равно за исследователем остается свобода выбора конечного решения.