Добрый вечер!
Помогите ответить на мой список вопросов:
- Для отображения графика, какие параметры я должен передать (в plt.scatter()), чтобы отобразить кластеры?
- К примеру, когда я обучал модель линейной регрессии, то в метод fit передавал x_train, y_train после мог предсказывать свой y на тестовых данных. А как я могу проверить насколько точно составлен конкретный кластер, ведь в метод fit я передаю только x никакие y здесь не фигурируют?
Данные брал отсюда.
Это данные с гироскопа телефона, который был закреплён на добровольцах, данные описывают 6 движений человека
(WALKING, WALKING_UPSTAIRS, WALKING_DOWNSTAIRS, SITTING, STANDING, LAYING)Подготовленные данные:Данные x_testДанные y_testКод:import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn import preprocessing
from sklearn.cluster import KMeans
from sklearn.datasets import make_blobs
from sklearn.preprocessing import Imputer
plt.figure(figsize=(12, 12))
X = pd.read_csv('X_test.csv', engine='python', sep=';', index_col=False).as_matrix()
#Нормализация данных
X = preprocessing.scale(X)
print(X)
y_pred = KMeans(n_clusters=6).fit_predict(X)
plt.subplot(221)
plt.scatter(X[:, 0], X[:, 1], c=y_pred)
plt.title("Incorrect Number of Blobs")
plt.show()