Задать вопрос

Матвей Nosurname @matweykai

Standart coder ; )

машинное-обучение

Как нормально выстроить Pipeline?

Я уже много раз сталкивался с проблемой создания нормального Pipeline в sklearn, и в этот раз решил спросить совета здесь. Как сделать полный Pipeline, который на вход получает сырые данные, заполняет пропуски, делит признаки на несколько колонок(Категориальные, вещественные и тд), потом отдельно обрабатывает их и склеивает данные вместе, так чтобы это можно было отдать модели. Мне бы какие-нибудь ссылки на проекты, где это присутствует.

P.S: Обычно во всех туториалах данные обрабатываются в pandas dataframe, а потом уже подаются в модель, а нормальных пайплайнов нет, поэтому я сюда и пишу : )

Вопрос задан более трёх лет назад
70 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Машинное обучение

10 месяцев

Далее
Skillbox

Профессия Machine Learning Engineer

12 месяцев

Далее
Яндекс Практикум

Инженер машинного обучения

4 месяца

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 163 просмотра
1

ответ
Машинное обучение

+1 ещё

Средний
Есть ли готовая архитектура модели, которая принимает на вход подобный формат данных?
- 3 подписчика
- 27 сент.
- 166 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент.
- 194 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
С помощью чего проанализировать данные и построить свою нейронную сеть для бана пользователей?
- 1 подписчик
- 09 сент.
- 188 просмотров
2

ответа
Нейронные сети

+1 ещё

Средний
Как повысить macro f1 в задаче классификации изображения?
- 1 подписчик
- 03 сент.
- 61 просмотр
0

ответов
Веб-разработка

+1 ещё

Простой
Какие есть ML-инструменты, которые по структуре или изображению лендинга предсказывают зоны внимания пользователей?
- 1 подписчик
- 28 авг.
- 399 просмотров
3

ответа
Видеокарты

+1 ещё

Средний
Целесообразно ли использование двух RTX 5080 для обучения нейросетей?
- 1 подписчик
- 24 авг.
- 426 просмотров
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 473 просмотра
3

ответа
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 65 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 148 просмотров
3

ответа
Показать ещё Загружается…

Web Designer (Иллюстратор)

Peppermint

от 1 600 до 2 000 $

Project менеджер / Менеджер проекта

W3Promo • Москва

от 60 000 до 100 000 ₽

Backend разработчик (Rust)

Street Falcon • Москва

от 250 000 ₽