Задать вопрос

Ptolemy_master

Ptolemy_master @Ptolemy_master

алгоритмы

Какой подход выбрать для поиска и распознавания элементов на скриншоте?

Задача состоит в том, чтобы быстро на картинке найти элементы. Картинка - это скриншот, но на нем может быть что угодно - формы, другие картинки, иконки, фотографии. Нужно найти элементы и, если есть текст, распознать. Моменты:

- точная классификация желательная. То есть хотелось бы понять, хотя бы с какой-то вероятностью, это поле или кнопка. Определить точно границы элемента.
- если элемент содержит текст, надо определить границы элемента и сам текст
- если элемент - иконка или фотография, или какой-то графический элемент, то желательно распознать его или найти похожий (по образцу, образец существует).

Первая моя мысль была - использовать object detection, натренинировать сеть на распознавание элементов интерфейса. Но я не знаю, подходит ли это для решения данных задач, и не будет ли это, что называется, overkill (чересчур)?
Какой бы алгоритм/подход вы применили здесь?

Прим. в работе пока TensorFlow.

Вопрос задан более трёх лет назад
260 просмотров

Комментировать

Подписаться 3 Средний Комментировать

Решения вопроса 2

Arseny_Info

Арсений Кравченко @Arseny_Info

R&D engineer

А в чем overkill? Кажется, object detection и нужен.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий

DanilBaibak

Данил @DanilBaibak

Machine Learning engineer

Возможно Вы сможете найти что-то полезное для себя https://www.youtube.com/watch?v=CAYn6A1zsrw

Ответ написан более трёх лет назад

1 комментарий

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Алгоритмы

Простой
Как можно уменьшить количество комбинаций в игре крестики нолики?
- 1 подписчик
- 19 авг.
- 123 просмотра
2

ответа
Алгоритмы

+1 ещё

Простой
Как в квантовый компьютер вводятся данные?
- 1 подписчик
- 12 авг.
- 206 просмотров
3

ответа
IT-образование

+2 ещё

Средний
LLM для школьных экспериментов. Существует ли что то подходящее?
- 1 подписчик
- 03 авг.
- 286 просмотров
3

ответа
Нейронные сети

+1 ещё

Простой
Как вычисляется MSE в VAE?
- 1 подписчик
- 24 июл.
- 56 просмотров
0

ответов
Машинное обучение

+1 ещё

Простой
Reverse engineering black box ML-модели?
- 1 подписчик
- 10 июл.
- 135 просмотров
3

ответа
Алгоритмы

+1 ещё

Средний
Как можно предиктить дату регистрации при массиве данных?
- 1 подписчик
- 03 июл.
- 154 просмотра
1

ответ
Программирование

+1 ещё

Простой
Как работает регистрация и аутентификация с помощью ЭЦП?
- 1 подписчик
- 26 июн.
- 284 просмотра
3

ответа
Компьютерные сети

+1 ещё

Простой
Как построить топологию сетей (данные в FDB таблице) когда связи замкнуты в кольцо?
- 2 подписчика
- 25 июн.
- 475 просмотров
2

ответа
Алгоритмы

Средний
Какие переходы для ДП у «Гелифиш и незабудка» codeforce?
- 1 подписчик
- 12 июн.
- 92 просмотра
1

ответ
C#

+1 ещё

Простой
Почему неправильно работает Keeloq?
- 1 подписчик
- 05 июн.
- 129 просмотров
1

ответ
Показать ещё Загружается…

Разработчик в буткемп Core Infrastructure

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик бэкенда в команду коммуникационной платформы

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽