Какие автоматические инструменты можно использовать для быстрой разметки набора данных для задачи распознавания лиц?

Question

NikitaRyabukhin @NikitaRyabukhin

Распознавание образов

Какие автоматические инструменты можно использовать для быстрой разметки набора данных для задачи распознавания лиц?

У меня проблема, я хочу обучить нейросеть распознавать лица, но данные не размечены.

Что у меня на входе: директория с изображениями лиц, в которых изображение одного и того же человека может встречаться несколько раз или не встречаться вовсе

Что я хочу получить на выходе: определенное количество каталогов, их количество должно быть равно количеству уникальных людей во входном каталоге.

Проще говоря, я хотел бы поместить изображения лиц одного и того же человека в один каталог.

Выполнение этого вручную занимает слишком много времени.

Есть ли готовые алгоритмы и решения?

Вопрос задан более двух лет назад
38 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Инженер по тестированию

8 месяцев

Далее
Skillbox

Профессия 1C-разработчик

8 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Машинное обучение

+1 ещё

Простой
Поиск по образцу. Как сделать быстрый поиск вхождения картинок-символов на большом чертеже?
- 2 подписчика
- 19 сент.
- 194 просмотра
1

ответ
Машинное обучение

+2 ещё

Средний
Как добиться распознавания текста и цифр в 99,9%?
- 1 подписчик
- 14 янв.
- 252 просмотра
3

ответа
Машинное обучение

+1 ещё

Сложный
Как генерировать описания картинок на основе их эмбеддингов (CLIP feature vector)?
- 3 подписчика
- 17 дек. 2024
- 1898 просмотров
0

ответов
Распознавание образов

Простой
Как использовать проекты с GitHub?
- 1 подписчик
- более года назад
- 347 просмотров
0

ответов
Машинное обучение

+2 ещё

Средний
Как генерировать усреднённые описания ко всему датасету картинок?
- 3 подписчика
- более года назад
- 101 просмотр
0

ответов
Распознавание образов

Сложный
Как разработать систему идентификации одного и того же автомобиля на различных сайтах объявлений?
- 3 подписчика
- более года назад
- 438 просмотров
1

ответ
Нейронные сети

+1 ещё

Средний
Нужно ли для задачи Person re-ID предварительно тренировать модель?
- 2 подписчика
- более года назад
- 154 просмотра
0

ответов
Распознавание образов

Простой
Существует ли Шазам для вещей?
- 1 подписчик
- более года назад
- 141 просмотр
2

ответа
OpenCV

+1 ещё

Простой
Как выбрать ии?
- 1 подписчик
- более года назад
- 101 просмотр
1

ответ
Распознавание образов

Простой
Какой сервис использовать для распознавания лиц и дубликатов документов по фото?
- 2 подписчика
- более года назад
- 93 просмотра
0

ответов
Показать ещё Загружается…

Мобильный разработчик (React Native / другие)

App Company

от 200 000 до 300 000 ₽

Разработчик Telegram-бота с ИИ (TypeScript / Node.js)

App Company

от 200 000 до 300 000 ₽

Координатор сервисной службы

ЛАНИТ • Омск

До 40 000 ₽

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента.
У меня проблема
Покажи свои попытки. Или на фриланс биржу.

Answer 1 · 2023-02-25 15:32:03

В любой задаче МL и в задачах распознавании визуальных образов в разных интерпретациях, при отсутствии размеченных данных теоретически существует два пути:
1. Самостоятельно, вручную разметить данные. Наверняка вам известно, что ручная разметка данных - сегодня это целое направления бизнеса. И многие фирмы (особенно преуспели в этом китайцы) зарабатывают на этом миллионы. Т.е. вы им ваш набор данных, они вам - его разметку. Погуглите, найдете куда обращаться.
2. Использовать методы кластеризации, результаты которой вам дадут перечень классов объектов (в вашем случае - уникальных участников) и разнесут ваш датасет по этим классам. Вот только сами эти алгоритмы кластеризации могут оказаться сложнее той задачи классификации, которую вы перед собой ставите. В случае объектов-лиц - на порядок сложнее. Причем качество такой кластеризации - достаточно низкое, на много ниже, чем качество ручной разметки. Что в свою очередь еще более снизит качество решения вашей основной задачи классификации объектов. Но зато - без китайцев :)
Вот как-то так.
А вариант решения - выбирать вам.

Какие автоматические инструменты можно использовать для быстрой разметки набора данных для задачи распознавания лиц?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт