X_train[numerical_cols]=minMax_scaler.fit_transform(X_train[numerical_cols])
X_test[numerical_cols]=minMax_scaler.transform(X_test[numerical_cols])
scaler = StandardScaler()
X_train_transformed = scaler.fit_transform(X_train)
model = RandomForestClassifier(max_depth=2, random_state=0).fit(X_train_transformed, y_train)
X_test_transformed = scaler.transform(X_test)
model.predict(X_test_transformed)
Численные значения в итоге после препроцессинга обязаны оказаться все примерно в одном диапазоне числовом или нет?
soup.find('h1', class_='section_hero__title').text
Ну это не точно у меня то html вашего нету, что бы я мог точно указать. (df == '').sum()
columns = df1.columns
df2 = df2.reset_index(drop=True).T.reset_index().T
df2.columns = columns
df2.reset_index(drop=True)
columns = df1.columns
df2 = df2.reset_index(drop=True).T.reset_index(drop=True).T
df2.columns= columns
Вот это правильная организация для вашей проблемы (здесь из коробки он где надо применит transform а где надо fit_transform) в общем код верный просто для не опытного человека может выглядеть необычно, что оно выдаст по метрикам вот так? теперь мы так же можем если нужно еще каких нибудь трансфомеров добавить в наш numerical и categorical трансформеры.
Это вместо всего вашего кода весь pandas выкидываем.