Распространённые наборы данных (не текстовых) для проверки алгоритмов классификации?
Есть у меня некоторый классификатор (вариация на тему SVM-классификатора, если угодно). Я хочу оценить его точность, а также то, насколько хорошо он оценивает вероятность, что такая-то точка принадлежит к такому-то классу.
Имею спросить: а какие наборы данных считаются наиболее употребительными для оценки классификаторов? Если угодно, самыми хрестоматийными?
Особенно интересуют нетекстовые данные, ибо текстовых корпусов у меня полно и так, а хотелось бы проверить и на чём-то ещё.
Если что-то классическое — Iris dataset — классификация цветков ириса по небольшому набору параметров. Но этот сет больше игрушечный — слишком мало семплов.
Если серьезней, то MNIST digits — классификация рукописных цифр.