У меня есть кустарный алгоритм K-ближайших соседей, он находит ближайших для конкретного (нового) объекта 'x' и определяет к какому классу он принадлежит. Как реализовать такой же алгоритм, но с использованием Scikit-Learn Nearest Neighbors?
def kNN(x, dataSet, labels, k):
dataSetSize = dataSet.shape[0]
diffMat = tile(x, (dataSetSize,1)) - dataSet
sqDiffMat = diffMat ** 2
sqDistances = sqDiffMat.sum(axis=1)
distances = sqDistances ** 0.5
sortedDistances = distances.argsort()
classCount = {}
for i in arange(k):
votelabel = labels[sortedDistances[i]]
classCount[votelabel] = classCount.get(votelabel,0) + 1
sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True)
return sortedClassCount[0][0]