Здравствуйте. Есть csv файлик, в котором
515344 строк и
90 столбцов.
Необходимо удалить из DataFrame те строки, в которых значение хотя бы одного столбца будет не равно числу.
Как я пытался решить проблему (но это сработает только для DataSeries):
df.convert_objects(convert_numeric=True).dropna()
Скачать CSV можно отсюда
Код:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score, f1_score
# Load the diabetes dataset
diabetes = datasets.load_diabetes()
df = pd.read_csv('YearPredictionMSD.txt', sep=',')