Задать вопрос

vldud @vldud

python

Отбор признаков из sklearn.feature_selection не работает с разреженными матрицами?

Добрый день! Выполняю отбор признаков с помощью sklearn. Возьмем для примера ANOVA - sklearn.feature_selection.f_classif. В описании аргументов функции sklearn.feature_selection.f_classif в качестве входного массива признаков значится X{array-like, sparse matrix}. Я понимаю это, как признаки, часть из которых nan.
Запуск кода

X, y = make_classification(
    n_samples=200,
    n_features=10,
    n_informative=2,
    n_redundant=8,
    n_repeated=0,
    shuffle=False,
    random_state=random_state
)
X[0][0] = np.nan
selected_features = SelectKBest(f_classif, k=2).fit_transform(X, y)

приводит к ошибке

ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

Комментирование строкиX[0][0] = np.nan ошибку устраняет, т.е. проблема именно в nan значении.

Вопрос: что имеется в виду в документации под sparse matrix и какие есть методики feature selection в sklearn или в других python библиотеках для разреженного признакового пространства?

Вопрос задан более трёх лет назад
228 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

U235U235 @U235U235

В разреженных матрицах обычно неуказаные элементы не nan, а нули.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- вчера
- 186 просмотров
0

ответов
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- вчера
- 54 просмотра
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 172 просмотра
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 175 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 124 просмотра
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 216 просмотров
0

ответов
Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 229 просмотров
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 151 просмотр
1

ответ
Python

Простой
Ошибка IndexError: string index out of range в написании реализации системы Линденмайера – от чего происходит и как исправить?
- 1 подписчик
- 27 нояб.
- 154 просмотра
1

ответ
Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- 22 нояб.
- 113 просмотров
0

ответов
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽