Поддержу автора выше. Нарисуйте линию, посчитайте сумму квадратов расстояний от ваших точек до этой линии (или средний квадрат - как вам будет угодно), поищите другие линии. Таким перебором вы рано или поздно нарисуете такую, при которой ваша ошибка будет минимальной. Такая линия будет "усреднением", аппроксимацией ваших наблюдений. Если вы в ваши точки добавите еще и класс этих точек (напр., бинарное разделение, 1 и 2). то тут вы должны не только исхитриться провести линию "усредненно", но еще и так, чтобы точки одного класса оказались с одной стороны, а точки другого - с другой. Иногда для этого добавляют еще одну размерность, в которой эти точки хорошо разделимы. Это вкратце о разделяющей поверхности и методе svm. Естественно, руками такого никто не делает, ваш sklearn давно и хорошо это умеет "из коробки".