Как реализовать алгоритм сегментации?

Question

My1Name @My1Name

Как реализовать алгоритм сегментации?

Для выделения области на изображении в цветовом диапазоне, я использую матрицу 3x3. В позиции x,y производится выборка последующих координат (a,b,c,d), куда будет сдвинут крестик, с предварительной проверкой диапазона. То есть в первой точке (x,y) берутся цветовые параметры для a,b,c,d. А именно: Вычисляется альфа-канал и, пожалуй на этом всё.. Если например С выходит за пределы диапазона взятого в первоначальной точке (x,y), то для С делаются ещё шаги в право и проверяется, не один ли это писксель выбился с диапазона?

Программно это выглядит следующим образом: Берём параметры в позиции X,Y

private static String [] getColor(int x, int y) {
		Color color = new Color(image.getRGB(x, y));
		int red = color.getRed();
		int green = color.getGreen();
		int blue = color.getBlue();
//записывается последовательность цветов и сортируется (бессмысленная процедура)
		String R = "red#"+red, G="green#"+green, B="blue#"+blue;
		String [] colors = {R,G,B,"alpha"};
		Tools tools = new Tools();
		colors = tools.sortRGB(colors);
//считаем среднее значение светимости для 3-х цветов
		int alpha = (red+green+blue)/3;
		colors[3]=Integer.toString(alpha);
	return colors;
	}

Проверяем соответствие параметров для a,b,c,d, взятых в первоначальной точке X,Y

private static boolean colorRange(int x, int y, String [] RGB, String direction) {
		boolean range=false;
		int [] red = new int [9];
		int [] green = new int [9];
		int [] blue = new int [9];
		int pick=0;
//строим квадратик (матрицу) 3х3 (можно больше)
		int x1=x-1, x2=x+1, y1=y-1, y2=y+1;
		for (int X=x1; X<=x2; X++) {
			for (int Y=y1; Y<=y2; Y++) {
				try { 
					Color color = new Color(image.getRGB(X,Y));
					red[pick] = color.getRed();
					green[pick] = color.getGreen();
					blue [pick] = color.getBlue();
				}catch (ArrayIndexOutOfBoundsException e) {
					red[pick] = 0;
					green[pick] = 0;
					blue [pick] = 0;
				}
			pick++;
			}
		}
//считаем среднее значение для матрицы и сравниваем с параметрами точки X,Y
		int R = average(red);
		int G = average(green);
		int B = average(blue);
		int alpha = (R+B+G)/3;
		int alpha1 = Integer.parseInt(RGB[3]);
		if(alpha1-alpha<3 && alpha1-alpha>-3) {
				 return true;
		}else {
// Если вышли за диапазон, проверяем ещё пару пикселей в соответствии с направлением 
			switch (direction) {
	 		case "top" : if (y-5>0) { range=chekBorder(x,y, direction, RGB); } break;  
	 		case "left" :  if (x-5>0) { range=chekBorder(x,y, direction, RGB); } break;  
	 		case "right" : if (x+5<image.getWidth()) { range=chekBorder(x,y, direction, RGB); } break;
	 		case "bottom" : if (y+5<image.getHeight()) { range=chekBorder(x,y, direction, RGB); } break;
			}
		}
	return range;
	}

Предполагается, если пиксель вышел за диапазон, то должно быть это граница объекта:

private static boolean chekBorder(int x, int y, String direction, String [] RGB) {
		int alpha1 = Integer.parseInt(RGB[3]);
		int alpha, R,G,B;
		int var=0;
		boolean vectorX=false;
		switch (direction) {
		 case "top" : var=-1; break;  
		 case "left" : var=-1; vectorX=true; break;  
		 case "right" : var=1; vectorX=true; break;
		 case "bottom" : var=1; break;
		}
		int count=0;
		int [] point = new int [5];
//делаем 5 шагов в соответствии с направлением 
		for(int i=0;i<5;i++) {
			if(vectorX) {
				x=x+(var);
			}
			else {
				y=y+(var);
			}
		 Color color = new Color(image.getRGB(x,y));
		 R = color.getRed();
		 G = color.getGreen();
		 B = color.getBlue();
		 alpha = (R+G+B)/3;
		 if(alpha1-alpha>7 || alpha1-alpha<-7)
			 count++;
//3 подряд выходят за диапазон 
		 if(i>=2 && point[i-1]==count-1 && point[i-2]==count-2 && count>=3)
			 return false;
		point[i]=count;
		}
	return true;
	}

В результате этих манипуляций, ожидалось получить границы объекта, что позволило бы при наложении полученных рамок, при повторном проходе, выбрать объекты. Однако, метод рабочий, но подходит пожалуй лишь для детских разукрашек :) Если серьёзно, то вот результат работы этого кода (слева - оригинальное фото (с интернета); середина FloodFill с минимальным размером выбранной области >5 px; справа < 5 px):

В реальности сегментация изображения выглядит немного иначе... Что я делаю не так? Как реализовать алгоритм сегментации или как улучшить написанное?

Вопрос задан более двух лет назад
130 просмотров

1 комментарий

Подписаться 1 Средний 1 комментарий

Помогут разобраться в теме Все курсы

Яндекс Практикум

Java-разработчик

10 месяцев

Далее
Skillfactory

Профессия Java-разработчик

14 месяцев

Далее
Нетология

Java-разработчик с нуля

12 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

3 комментария

My1Name @My1Name Автор вопроса

Какой метод вы используете?

- FloodFill, и на его основе методом проб и ошибок, пытаюсь вывести "всеобъемлющее зрение" с некоторой точностью (например от 10px).

FloodFill просто выполняет заливку с допуском

Он всё заливает в соответствии с диапазоном яркости (с опцией для конкретного цвета). И получается, что (в чёрно-белом цвете) - задача ("всеобъемлющее зрение") неразрешимая?

Если же проверять на рандомных картинках, то всегда можно найти неправильную сегментацию.

В том-то и дело! Я хочу оптимизировать программу для рандомных картинок. А что она будет понимать из увиденного, это уже будет зависеть от набора шаблонов (масок).

Написано более двух лет назад
Griboks @Griboks

My1Name, "всеобъемлющее зрение" - это не алгоритмическая задача, её нельзя решить программным способом.

Написано более двух лет назад
My1Name @My1Name Автор вопроса

Griboks,
это не алгоритмическая задача

Каких сенсоров чувствительности не хватает? - Я думаю это проблема пространственной ориентации при работе с чёрно-белым изображением... Однако, в данном случае, я не пытаюсь воссоздать 3D модель изображения, а хотел всего-лишь получить одна - 2-х пиксельную рамку границ объекта, меняя диапазоны по мере смещения "скользящего окошка" и заливая участки больше 2px. К сожалению, мой подход для этой задачи оказался неправильным, но решения - судя по всему есть; ими просто никто не делится... Теперь буду пробовать по другому: Выбрать объекты по цветам; сгруппировать по оттенкам и смежным координатам. Основная проблема данного похода: Вывести коэффициент (процент) соответствия цвета. Нужно строить не 3-х цветную карту RGB, а 8-и или CMYK.

Полезные ссылки:
Цветовое пространство xyY
Формула цветового отличия

Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Java

+1 ещё

Простой
В чем моя ошибка при deploy maven?
- 1 подписчик
- вчера
- 62 просмотра
1

ответ
Java

Средний
Почему крашится сервер Minecraft Forge?
- 1 подписчик
- 13 окт.
- 112 просмотров
1

ответ
Java

+1 ещё

Простой
Как создать аннотацию, подобную Jakarta @Size?
- 2 подписчика
- 09 окт.
- 125 просмотров
0

ответов
Java

Простой
Почему способ создания String влияет на результат сравнения?
- 2 подписчика
- 27 сент.
- 249 просмотров
3

ответа
Windows

+4 ещё

Простой
Существует ли виртуальный PDF принтер со встроенным эффектом сканера?
- 4 подписчика
- 24 сент.
- 5592 просмотра
2

ответа
Программирование

+1 ещё

Простой
Апгрейда разраба с помощью нейросетки, с чего начать в 2025 году?
- 6 подписчиков
- 22 сент.
- 1326 просмотров
6

ответов
Java

+2 ещё

Простой
Какие есть варианты grpc service discovery с минимальным откликом?
- 1 подписчик
- 17 сент.
- 107 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Можно ли заменить кликанье мышью по веб-интерфейсу cli-командой?
- 3 подписчика
- 13 сент.
- 1088 просмотров
2

ответа
Java

+1 ещё

Средний
Hibernate: Почему запрос с EntityGraph не работает?
- 1 подписчик
- 10 сент.
- 96 просмотров
0

ответов
Java

+1 ещё

Простой
Java. Трудности в начинании, нормальные ли ошибки в начале?
- 1 подписчик
- 10 сент.
- 360 просмотров
3

ответа
Показать ещё Загружается…

Automation QA Engineer (Java)

ITK academy • Москва

от 90 000 ₽

Инженер по ручному тестированию

Hello, Doc!

от 80 000 ₽

Лид нагрузочного тестирования

ИНГО БАНК • Москва

До 400 000 ₽

При выборке областями более 2-х пикселей, остаются переходные пиксели (1-2) вокруг объекта. Однако, они остаются не всегда и получается рамка не замкнутая... Это важно для повторного прохода и более точной выборки.

Answer 1 · 2022-12-08 14:56:54

Ничего не понятно. Какой метод вы используете? FloodFill просто выполняет заливку с допуском, поэтому позволяет выделять только более менее однородные области. У вас же на картинке всего 3 цвета, ещё и с большим разбросом.

оригинальное фото (с интернета)

Вам необходимо собрать целевой датасет, исходя из него выбрать подходящий метод. Если же проверять на рандомных картинках, то всегда можно найти неправильную сегментацию.

Как реализовать алгоритм сегментации?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт