Как удалить строку, если хотя бы в одной ячейки не число?

Question

Username @dalv_happy

Python

Как удалить строку, если хотя бы в одной ячейки не число?

Здравствуйте. Есть csv файлик, в котором 515344 строк и 90 столбцов.
Необходимо удалить из DataFrame те строки, в которых значение хотя бы одного столбца будет не равно числу.

Как я пытался решить проблему (но это сработает только для DataSeries):
df.convert_objects(convert_numeric=True).dropna()
Скачать CSV можно отсюда
Код:

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score, f1_score

# Load the diabetes dataset
diabetes = datasets.load_diabetes()
df = pd.read_csv('YearPredictionMSD.txt', sep=',')

Вопрос задан более трёх лет назад
507 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

5 комментариев

Username @dalv_happy Автор вопроса

Ошибки возникли:(

Traceback (most recent call last):
  File "/home/vladislav/PycharmProjects/machine-learning/lab-2/Main.py", line 12, in <module>
    df = df[df[column].apply(lambda x: x.isnumeric())]
  File "/home/vladislav/.local/lib/python3.5/site-packages/pandas/core/series.py", line 2355, in apply
    mapped = lib.map_infer(values, f, convert=convert_dtype)
  File "pandas/_libs/src/inference.pyx", line 1574, in pandas._libs.lib.map_infer (pandas/_libs/lib.c:66645)
  File "/home/vladislav/PycharmProjects/machine-learning/lab-2/Main.py", line 12, in <lambda>
    df = df[df[column].apply(lambda x: x.isnumeric())]
AttributeError: 'int' object has no attribute 'isnumeric'

Написано более трёх лет назад

Username @dalv_happy Автор вопроса

И к сожалению не работает с дробными числами.

Написано более трёх лет назад

kzoper @kzoper

import pandas as pd
from io import StringIO
import re
data = """
col1,col2
1,2.0
2,0.5
3,2
tt,2
4,1
5,F
1,G
"""

regex = r"[^0-9\.]+"
df = pd.read_csv(StringIO(data),sep=',')

for col in df.columns:
	filter = df[col].str.contains(regex)
	df = df.drop(df[col][filter].index)

print(df)

col1 col2
0 1 2.0
1 2 0.5
2 3 2
4 4 1

Написано более трёх лет назад

Username @dalv_happy Автор вопроса
kzoper,
raise AttributeError("Can only use .str accessor with string " AttributeError: Can only use .str accessor with string values, which use np.object_ dtype in pandas

Возникает ошибка на моём csv файлике
Написано более трёх лет назад
kzoper @kzoper

Username, filter = df[col].astype('str').str.contains(regex)

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- вчера
- 77 просмотров
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 117 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 187 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 218 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 75 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 198 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 228 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 247 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 239 просмотров
1

ответ
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Answer 1 · 2017-10-29 21:01:19

import pandas as pd
from io import StringIO

data = """
col1,col2
1,3
2,5
3,2
tt,2
4,1
5,F
1,G
"""

df = pd.read_csv(StringIO(data))


for column in df:
    df = df[df[column].apply(lambda x: x.isnumeric())]
print(df)

-=-=-=--=-=
col1 col2
0 1 3
1 2 5
2 3 2
4 4 1
-=-=-=-=-=-

Answer 2 · 2017-10-29 21:00:33

чудес нет, либо построчно читайте в Панду

либо предподготавливайте файл:
1) считали csv.read() / правильный dialect в список
2) прогнали isdigit() через list comprehentions / преобразовали в float / int / decimal (хз за Панду с decimal)
3) записали с диалектом QUOTE_NONNUMERIC

Как удалить строку, если хотя бы в одной ячейки не число?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт