Ptolemy_master
@Ptolemy_master

Какой подход выбрать для поиска и распознавания элементов на скриншоте?

Задача состоит в том, чтобы быстро на картинке найти элементы. Картинка - это скриншот, но на нем может быть что угодно - формы, другие картинки, иконки, фотографии. Нужно найти элементы и, если есть текст, распознать. Моменты:

- точная классификация желательная. То есть хотелось бы понять, хотя бы с какой-то вероятностью, это поле или кнопка. Определить точно границы элемента.
- если элемент содержит текст, надо определить границы элемента и сам текст
- если элемент - иконка или фотография, или какой-то графический элемент, то желательно распознать его или найти похожий (по образцу, образец существует).

Первая моя мысль была - использовать object detection, натренинировать сеть на распознавание элементов интерфейса. Но я не знаю, подходит ли это для решения данных задач, и не будет ли это, что называется, overkill (чересчур)?
Какой бы алгоритм/подход вы применили здесь?

Прим. в работе пока TensorFlow.
  • Вопрос задан
  • 254 просмотра
Решения вопроса 2
Arseny_Info
@Arseny_Info
R&D engineer
А в чем overkill? Кажется, object detection и нужен.
Ответ написан
DanilBaibak
@DanilBaibak
Machine Learning engineer
Возможно Вы сможете найти что-то полезное для себя https://www.youtube.com/watch?v=CAYn6A1zsrw
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы