nykakdelishki
@nykakdelishki
Я Ракета , я Торпеда!

Почему при, при совмещение не равно количество строк(Хотя на тренировочных все нормально)?

Ошибка: ValueError: array length 267 does not match index length 418

История такая делал титаник, вроде все получалось, и вроде даже 83% точность (разделял тренировочные) (Знаю что мало, но я впервые этим занимался) ,но когда я решил сделать тоже самое на реальных тестовых и сравнить резы, то меня ждал провал. Почему то предикторов" сильно меньше чем пассажиров 267 на 418.

Как так вышло? И как мне это все исправить?

Код

import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import MinMaxScaler
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split
df = pd.read_csv('Data/train.csv')
df.drop('Name', axis=1,inplace=True)
df.drop('Ticket', axis=1,inplace=True)
df.drop('Cabin', axis=1,inplace=True)
df['Age'] = df['Age'].fillna(df['Age'].dropna().median())
df = df.dropna() #Удаляем строчки с NaN
df['Sex'] = LabelEncoder().fit_transform(df['Sex'])
df['Embarked'] = LabelEncoder().fit_transform(df['Embarked'])
X_df = df.drop('Survived', axis=1)
Y_df = df['Survived']
scaler = MinMaxScaler(feature_range=(0,1))
scaler.fit(X_df)
X_df_norm = scaler.transform(X_df)
X_df_norm
X_train, X_test, Y_train, Y_test = train_test_split(X_df_norm, Y_df, test_size=0.3, random_state=1)

SVC_model = SVC()
SVC_model.fit(X_train, Y_train)
SCV_predict = SVC_model.predict(X_test)

print(accuracy_score(Y_test, SCV_predict)) #0.835205 (На тестовых)

test = pd.read_csv('Data/test.csv')
test.drop('Name', axis=1,inplace=True)
test.drop('Ticket', axis=1,inplace=True)
test.drop('Cabin', axis=1,inplace=True)
test['Age'] = test['Age'].fillna(test['Age'].dropna().median())
test['Sex'] = LabelEncoder().fit_transform(test['Sex'])
test['Embarked'] = LabelEncoder().fit_transform(test['Embarked'])

result = pd.DataFrame({'PassengerId': test['PassengerId']}) #418 rows x 8 columns
result2 = pd.DataFrame({'Survived': SCV_predict}) #267 rows x 1 columns

  • Вопрос задан
  • 41 просмотр
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы