Идентификация нейросетью: возможно ли добавлять объект или распознавать одновременно?

Question

peacemakerv @peacemakerv

Разработка под Android

Идентификация нейросетью: возможно ли добавлять объект или распознавать одновременно?

Привет
Вводная часть вопроса, от "чайника" в нейросетях:

Реализована система идентификации объектов, на котороых нет четких надписей, только мелкие артефакты, царапины, линии, точки
Первый этап: поиск границ объекта в кадре - факт присутствия или отсутствия. Работает отлично, достоверность 0.8...0.95
Второй этап: формирование векторов, характеризующих объект, обнаруженного на первом этапе., и их распознавание. В идеальных условиях (на фиксированном наборе кадров с камеры) - работает хорошо, с достоверностью 0.9....0.93

Но вопрос в том, что объектов, которые надо распознавать, около 400 штук, а одновременно в работе только 200. И один объект каждые сутки в произвольный момент времени - вынимается (на ремонт) и заменяется новым отремонтированным (из числа этих 400).
Т.е. все 400 вариантов объектов сейчас заранее достоверно неизвестны, их нет всех сразу в базе данных векторов.

Распознается объект путем сравнения близости векторов текущего с кадра и всех векторов в базе: самый близкий выбирается. Но тут близость векторов - очень большая, объекты сильно похожи, артефакты маленькие, и даже при пороге 0.94 - обнаруживается _несколько векторов_ от разных объектов.

Так же используется и статистика - решение принимается на основе 3-5 детекций по мажоритарности, сильно помогает снизить кол-во ошибок.

Изначально предполагалось, что алгоритм работы будет простым как 3 копейки: если объекты сильно отличаются по векторам, то новые всегда будут обнаруживаться (якобы вектор далек от уже добавленных в базу), и можно этот объект (его вектор) будет добавить в базу.
Ну, а существующие будут обнаруживаться с высокой вероятностью, т.е. одновременно можно или добавить новый объект в базу, или распознать его (и инкрементировать ему число обнаружений).

Но раз идентификация, оказывается, всегда получается вероятностной, то это значит, что ... ничего добавить и нельзя в базу на ходу, в процессе Инференса? Т.е. четко сделать вывод о том, что объект новый, точно не присутствует в базе.

Вопрос: что тут вообще в таких условиях можно сделать ? Или я что-то не понимаю с нейросетями фундаментально ...
Задача-то простая - идентифицировать объекты (все, любые возникающие перед камерой) и просто считать кол-во каждого объекта.

Или же тут в принципе невозможно добавлять и идентифицировать любой объект ОДНОВРЕМЕННО, и все они заранее должны быть в базе ?

Вопрос задан более двух лет назад
152 просмотра

Комментировать

Подписаться 3 Средний Комментировать

Пригласить эксперта

Ответы на вопрос 1

4 комментария

peacemakerv @peacemakerv Автор вопроса

Что значит "задача поставлена хреново" ? Какая задача ? Вцелом, задача формулируется так "считать колво обнаружений каждого объекта из примерно 400, возникающих перед камерой в любой момент".

Написано более двух лет назад
Dimonchik @dimonchik2013

ну так и считайте, в чем проблема-то?
вы в описании лезете в какие-то дебри: добавить, разпознать, объект новый, объект в базе....
ставить надо четко
нейронка вернула вероятность
отклассифицировали
применили
точка

Написано более двух лет назад
peacemakerv @peacemakerv Автор вопроса

Dimonchik, не понимаю вас.
Человек не может глазками запросто создать базу данных векторов объектов - нереально это все запомнить.
Камера установлена сразу на рабочей машине с объектами, т.е. "инкубатора" тестового никакого нет. Объекты крутятся по кругу.
База данных векторов изначально пустая.

Ну и т.е. _планировалось_ сразу при запуске рабочего алгоритма начать наполнять базу на первом круге, когда начнется второй круг - _предполагалось_, что объекты вместо добавления повторно в базу - начнут распознаваться (инкремент колва кругов-обнаружений).

Но получается, что нельзя одновременно или добавлять в базу или распознавать в одном алгоритме, если для распознавания используется относительный метод, т.е. сравнение со всей базой и выбор самого близкого значения из нее.

Написано более двух лет назад
Dimonchik @dimonchik2013

ну вот уже лучше, появилась декомпозиция

Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Алгоритмы

Простой
Как можно уменьшить количество комбинаций в игре крестики нолики?
- 1 подписчик
- вчера
- 106 просмотров
2

ответа
Алгоритмы

+1 ещё

Простой
Как в квантовый компьютер вводятся данные?
- 1 подписчик
- 12 авг.
- 183 просмотра
3

ответа
Анимация

+1 ещё

Простой
Существет ли AI делающая промежуточную анимацию между 2 кадрами?
- 1 подписчик
- 09 авг.
- 84 просмотра
1

ответ
Нейронные сети

Простой
Существуют ли нейросети делающие видео с персонажем по эскизу фото?
- 1 подписчик
- 08 авг.
- 81 просмотр
1

ответ
Видео

+1 ещё

Простой
Есть ли видео-нейросеть, дорисовывающая объекты к реальному видео?
- 1 подписчик
- 03 авг.
- 158 просмотров
1

ответ
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 280 просмотров
3

ответа
Нейронные сети

+2 ещё

Простой
Можно ли закешировать результат загрузки gguf модели в Forge?
- 1 подписчик
- 27 июл.
- 42 просмотра
1

ответ
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Нейронные сети

Простой
Как подключить Context7 к claude.ai?
- 1 подписчик
- 23 июл.
- 65 просмотров
0

ответов
Нейронные сети

+2 ещё

Средний
Как правильно подобрать модель, VAE и T5 чтобы запустить Flux1 gguf версию?
- 1 подписчик
- 16 июл.
- 63 просмотра
2

ответа
Показать ещё Загружается…

Разработчик бэкенда в команду коммуникационной платформы

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик в буткемп Core Infrastructure

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик бэкенда сервисов телефонии

Яндекс • Москва

от 300 000 до 490 000 ₽

Answer 1 · 2023-02-04 21:56:14

задача поставлена хреново

Ну, а существующие будут обнаруживаться с высокой вероятностью, т.е. одновременно можно или добавить новый объект в базу, или распознать его (и инкрементировать ему число обнаружений).

тут после т.е. явно не только к этому предложению относится

Т.е. все 400 вариантов объектов сейчас заранее достоверно неизвестны, их нет всех сразу в базе данных векторов.

и тут ХПЧ

вообще - нейронки это всегда вероятности (ну кроме выводов ChatGPT который пока дикий, но учится)

попробуйте декомпозировать
и не ждите чудес

Идентификация нейросетью: возможно ли добавлять объект или распознавать одновременно?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт