Критерии выбора значимых признаков для SVM классификации (метод опорных векторов)?

Question

pixx @pixx

Критерии выбора значимых признаков для SVM классификации (метод опорных векторов)?

Привет, друзья!

Помогите пожалуйста советом или ссылкой.

Как правильно выбирать признаки для SVM классификации? Нужно ли при этом нормализовывать численные значения этих признаков?

Есть задача — с помощью SVM научиться отделять зерна от плевел.

У зерен есть некоторые характерные признаки по которым их можно выделять, но какие именно признаки брать?

Приведу пример. Допустим у зерна есть вес в миллиграммах. У плевла тоже есть вес, но в среднем отличный от зернового. Можно ли в качестве признака брать вес зерна или нужно брать логарифм от веса, ведь бывают очень мелкие зерна, а бывают очень крупные?

Как правильно подбирать соотношение зерен и плевел в обучающей выборке? Каким оно должно быть? 50/50? Или взятым из реальной жизни — собрали урожай зерна, взяли из него горстку и по ней сделали выборку (т.е. соотношение близко к реальному)?

Что делать если количество зерен в реальности (в обучающей выборке) относится к количеству плевел как 1/200? Портит ли это обучающую выборку?

Ведь нужно выделить именно зерна — они важны, а их как раз очень мало.

Есть ли какой-нибудь мануал из серии «SVM для чайников», где освещались бы эти вопросы простые вопросы на пальцах, без решения сложных систем уравнений?

Вопрос задан более трёх лет назад
5570 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

1C-разработчик

8 месяцев

Далее
Нетология

Python-разработчик с нуля

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Простой
Почему предсказания дерева решений не совпадает с ожиданием?
- 2 подписчика
- более года назад
- 142 просмотра
1

ответ
Python

+1 ещё

Простой
Почему Decision Tree Classifier выдает неверные ответы?
- 3 подписчика
- более года назад
- 275 просмотров
0

ответов
Машинное обучение

+2 ещё

Средний
Почему выходять такие результаты точности?
- 1 подписчик
- более года назад
- 40 просмотров
0

ответов
Python

+2 ещё

Средний
Как добавить явное условие при обучении модели AI?
- 1 подписчик
- более двух лет назад
- 134 просмотра
1

ответ
Машинное обучение

+1 ещё

Простой
Как правильно измерить inference time и FLOPs модели?
- 1 подписчик
- более двух лет назад
- 240 просмотров
0

ответов
Классификация

Простой
Как нужно собирать датасет для модели бинарной классификации?
- 1 подписчик
- более двух лет назад
- 199 просмотров
2

ответа
Node.js

+3 ещё

Простой
Какой код для классификации тестов tensorflow.js?
- 1 подписчик
- более трёх лет назад
- 130 просмотров
1

ответ
Python

+3 ещё

Простой
Как сделать выделение кластеров для бинарных изображений?
- 2 подписчика
- более трёх лет назад
- 169 просмотров
2

ответа
Нейронные сети

+2 ещё

Простой
Как создать классификатор с разными типами фич?
- 2 подписчика
- более трёх лет назад
- 90 просмотров
1

ответ
Машинное обучение

+1 ещё

Средний
Почему SVM чувствителен к масштабам признаков?
- 2 подписчика
- более трёх лет назад
- 125 просмотров
1

ответ
Показать ещё Загружается…

ML разработчик

АВ Софт • Москва

от 200 000 ₽

ML-разработчик (Machine Learning)

DevTeam.Space

от 2 000 до 4 000 $

WordPress (PHP, HTML/CSS) разработчик

Epiic

от 90 000 ₽

Answer 1 · 2010-11-15 21:00:59

Прежде всего, не нужно зацикливаться на SVM: это всего лишь один из многих методов классификации. Да, у SVM есть своя специфика (у других методов — своя), но на данном этапе Вы вполне можете использовать общие алгоритмы предобработки данных.

какие именно признаки брать?

Это называется feature selection и feature extraction.

Простыми словами, процесс выглядит так:
1. Составляем список имеющихся признаков.
2. Добавляем в него различные функции от признаков (как упомянутый логарифм от веса), комбинации разных признаков (например, длина*ширина*высота), и т.п. Что именно комбинировать и какие преобразования использовать, должно подсказать знание задачи и здравый смысл. Этот процесс относится к feature extraction.
3. Задаём функцию ошибки, то есть определяем как будет оцениваться точность классификации. Например, это может быть отношение правильно распознанных примеров к их общему количеству. Здесь полезно почитать про precision and recall.
4. Переходим на один уровень абстракции выше.
Представим эдакий чёрный ящик, внутри которого находится классификатор вместе с обучающей и тестирующей выборками. На входе ящика — двоичный вектор, указывающий, какие признаки должен использовать классификатор; на выходе — величина ошибки классификации (на тестовой выборке).

Таким образом, задача выбора признаков сводится к задаче оптимизации: нужно найти такой входной вектор, при котором выходное значение ящика (ошибка классификации) будет минимально. Можно, например, добавлять признаки по одному (начиная с тех, которые сильнее всего улучшают результат) — см. градиентный спуск. Можно использовать что-то посерьёзнее, типа генетических алгоритмов.

Нужно ли при этом нормализовывать численные значения этих признаков?

Это сильно зависит от конкретной задачи и самих признаков.

Что делать если количество зерен в реальности (в обучающей выборке) относится к количеству плевел как 1/200? Портит ли это обучающую выборку?

В общем случае, портит: если одних примеров гораздо меньше, чем других, существует риск, что классификатор «запомнит» примеры из обучающей выборки, и не сможет адекватно разпознавать другие похожие примеры (Overfitting).
К тому же, если используется простейшая функция ошибки (правильно_распознанных / размер_выборки), философски настроенный классификатор может всегда отвечать «плевел» — и в 99.5% случаев будет прав :)

Критерии выбора значимых признаков для SVM классификации (метод опорных векторов)?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт