@kolomiec_artiom

Как анализировать строки в наивном байесовском классификаторе?

Добрый вечер, друзья! Создал программу, которая делает классификацию с помощью наивного байесовского классификатора. Реализую программу на python3.6

Для начала подключаю модуль:
from sklearn.naive_bayes import GaussianNB

Затем уже сам классификатор
model = GaussianNB()
model.fit(x_training, y_training)


В итоге такая ошибка:
FutureWarning: Beginning in version 0.22, arrays of bytes/strings will be converted to decimal numbers if dtype='numeric'. It is recommended that you convert the array to a float dtype before using it in scikit-learn, for example by using your_array = your_array.astype(np.float64).
FutureWarning)


Попытался вылечить таким образом:
x_training = np.array(x_training, dtype=np.complex)


Но это привело к новой ошибке:
builtins.TypeError: must be real number, not str (в этой же строке)


Есть какие-то идеи решения? Был бы очень благодарен
  • Вопрос задан
  • 92 просмотра
Пригласить эксперта
Ответы на вопрос 1
Я никогда не пользовался этим модулем и с большой вероятностью пишу ерунду, но согласно описанию отсюда надо указывать параметры в виде model.fit((массив:кол-во образцов, выборка?),(x_training или массив x_training, y_training)):
fit(X, y, sample_weight=None)[source]
Fit Gaussian Naive Bayes according to X, y
Parameters:
X : array-like, shape (n_samples, n_features)
Training vectors, where n_samples is the number of samples and n_features is the number of features.
y : array-like, shape (n_samples,)
Target values.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы