Как реализовать алгоритм сегментации?

Question

My1Name @My1Name

Как реализовать алгоритм сегментации?

Для выделения области на изображении в цветовом диапазоне, я использую матрицу 3x3. В позиции x,y производится выборка последующих координат (a,b,c,d), куда будет сдвинут крестик, с предварительной проверкой диапазона. То есть в первой точке (x,y) берутся цветовые параметры для a,b,c,d. А именно: Вычисляется альфа-канал и, пожалуй на этом всё.. Если например С выходит за пределы диапазона взятого в первоначальной точке (x,y), то для С делаются ещё шаги в право и проверяется, не один ли это писксель выбился с диапазона?

Программно это выглядит следующим образом: Берём параметры в позиции X,Y

private static String [] getColor(int x, int y) {
		Color color = new Color(image.getRGB(x, y));
		int red = color.getRed();
		int green = color.getGreen();
		int blue = color.getBlue();
//записывается последовательность цветов и сортируется (бессмысленная процедура)
		String R = "red#"+red, G="green#"+green, B="blue#"+blue;
		String [] colors = {R,G,B,"alpha"};
		Tools tools = new Tools();
		colors = tools.sortRGB(colors);
//считаем среднее значение светимости для 3-х цветов
		int alpha = (red+green+blue)/3;
		colors[3]=Integer.toString(alpha);
	return colors;
	}

Проверяем соответствие параметров для a,b,c,d, взятых в первоначальной точке X,Y

private static boolean colorRange(int x, int y, String [] RGB, String direction) {
		boolean range=false;
		int [] red = new int [9];
		int [] green = new int [9];
		int [] blue = new int [9];
		int pick=0;
//строим квадратик (матрицу) 3х3 (можно больше)
		int x1=x-1, x2=x+1, y1=y-1, y2=y+1;
		for (int X=x1; X<=x2; X++) {
			for (int Y=y1; Y<=y2; Y++) {
				try { 
					Color color = new Color(image.getRGB(X,Y));
					red[pick] = color.getRed();
					green[pick] = color.getGreen();
					blue [pick] = color.getBlue();
				}catch (ArrayIndexOutOfBoundsException e) {
					red[pick] = 0;
					green[pick] = 0;
					blue [pick] = 0;
				}
			pick++;
			}
		}
//считаем среднее значение для матрицы и сравниваем с параметрами точки X,Y
		int R = average(red);
		int G = average(green);
		int B = average(blue);
		int alpha = (R+B+G)/3;
		int alpha1 = Integer.parseInt(RGB[3]);
		if(alpha1-alpha<3 && alpha1-alpha>-3) {
				 return true;
		}else {
// Если вышли за диапазон, проверяем ещё пару пикселей в соответствии с направлением 
			switch (direction) {
	 		case "top" : if (y-5>0) { range=chekBorder(x,y, direction, RGB); } break;  
	 		case "left" :  if (x-5>0) { range=chekBorder(x,y, direction, RGB); } break;  
	 		case "right" : if (x+5<image.getWidth()) { range=chekBorder(x,y, direction, RGB); } break;
	 		case "bottom" : if (y+5<image.getHeight()) { range=chekBorder(x,y, direction, RGB); } break;
			}
		}
	return range;
	}

Предполагается, если пиксель вышел за диапазон, то должно быть это граница объекта:

private static boolean chekBorder(int x, int y, String direction, String [] RGB) {
		int alpha1 = Integer.parseInt(RGB[3]);
		int alpha, R,G,B;
		int var=0;
		boolean vectorX=false;
		switch (direction) {
		 case "top" : var=-1; break;  
		 case "left" : var=-1; vectorX=true; break;  
		 case "right" : var=1; vectorX=true; break;
		 case "bottom" : var=1; break;
		}
		int count=0;
		int [] point = new int [5];
//делаем 5 шагов в соответствии с направлением 
		for(int i=0;i<5;i++) {
			if(vectorX) {
				x=x+(var);
			}
			else {
				y=y+(var);
			}
		 Color color = new Color(image.getRGB(x,y));
		 R = color.getRed();
		 G = color.getGreen();
		 B = color.getBlue();
		 alpha = (R+G+B)/3;
		 if(alpha1-alpha>7 || alpha1-alpha<-7)
			 count++;
//3 подряд выходят за диапазон 
		 if(i>=2 && point[i-1]==count-1 && point[i-2]==count-2 && count>=3)
			 return false;
		point[i]=count;
		}
	return true;
	}

В результате этих манипуляций, ожидалось получить границы объекта, что позволило бы при наложении полученных рамок, при повторном проходе, выбрать объекты. Однако, метод рабочий, но подходит пожалуй лишь для детских разукрашек :) Если серьёзно, то вот результат работы этого кода (слева - оригинальное фото (с интернета); середина FloodFill с минимальным размером выбранной области >5 px; справа < 5 px):

В реальности сегментация изображения выглядит немного иначе... Что я делаю не так? Как реализовать алгоритм сегментации или как улучшить написанное?

Вопрос задан более двух лет назад
127 просмотров

1 комментарий

Подписаться 1 Средний 1 комментарий

Пригласить эксперта

Ответы на вопрос 1

3 комментария

My1Name @My1Name Автор вопроса

Какой метод вы используете?

- FloodFill, и на его основе методом проб и ошибок, пытаюсь вывести "всеобъемлющее зрение" с некоторой точностью (например от 10px).

FloodFill просто выполняет заливку с допуском

Он всё заливает в соответствии с диапазоном яркости (с опцией для конкретного цвета). И получается, что (в чёрно-белом цвете) - задача ("всеобъемлющее зрение") неразрешимая?

Если же проверять на рандомных картинках, то всегда можно найти неправильную сегментацию.

В том-то и дело! Я хочу оптимизировать программу для рандомных картинок. А что она будет понимать из увиденного, это уже будет зависеть от набора шаблонов (масок).

Написано более двух лет назад
Griboks @Griboks

My1Name, "всеобъемлющее зрение" - это не алгоритмическая задача, её нельзя решить программным способом.

Написано более двух лет назад
My1Name @My1Name Автор вопроса

Griboks,
это не алгоритмическая задача

Каких сенсоров чувствительности не хватает? - Я думаю это проблема пространственной ориентации при работе с чёрно-белым изображением... Однако, в данном случае, я не пытаюсь воссоздать 3D модель изображения, а хотел всего-лишь получить одна - 2-х пиксельную рамку границ объекта, меняя диапазоны по мере смещения "скользящего окошка" и заливая участки больше 2px. К сожалению, мой подход для этой задачи оказался неправильным, но решения - судя по всему есть; ими просто никто не делится... Теперь буду пробовать по другому: Выбрать объекты по цветам; сгруппировать по оттенкам и смежным координатам. Основная проблема данного похода: Вывести коэффициент (процент) соответствия цвета. Нужно строить не 3-х цветную карту RGB, а 8-и или CMYK.

Полезные ссылки:
Цветовое пространство xyY
Формула цветового отличия

Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Java

Средний
Я создаю сервер майнкрафт на forge с модами, но возникает проблема, с чем это может быть связано и как это решить?
- 3 подписчика
- 12 авг.
- 2593 просмотра
3

ответа
Java

Простой
Как скомпилировать Swing приложение с AOT?
- 1 подписчик
- 08 авг.
- 99 просмотров
0

ответов
Программирование

Простой
Оператор, операция, функция, процедура — что всё это значит?
- 1 подписчик
- 05 авг.
- 283 просмотра
2

ответа
Программирование

Простой
Какие есть источники, помогающие понять бизнес-логику проекта?
- 3 подписчика
- 30 июл.
- 844 просмотра
1

ответ
Android

+1 ещё

Простой
Почему постоянно переходит только в первую группу?
- 1 подписчик
- 30 июл.
- 153 просмотра
1

ответ
Java

+1 ещё

Простой
Почему Java Flight Recorder в Spring Boot не пишет в файл?
- 1 подписчик
- 25 июл.
- 73 просмотра
0

ответов
Java

+2 ещё

Простой
Как поставить OpenGL 4.x чтобы он работал в Minecraft на macOS 15 (M1)?
- 1 подписчик
- 21 июл.
- 115 просмотров
0

ответов
Программирование

Простой
Как готовиться к ВСоШ по информатике 9-11 классов/олимпиадам по программированию вообще?
- 1 подписчик
- 20 июл.
- 212 просмотров
3

ответа
Java

+1 ещё

Простой
Почему возникает deadlock?
- 1 подписчик
- 17 июл.
- 278 просмотров
1

ответ
Программирование

+1 ещё

Простой
Ответьте на вопрос по информатике?
- 1 подписчик
- 10 июл.
- 738 просмотров
3

ответа
Показать ещё Загружается…

Java-разработчик (Маркетинга AI)

Сбер • Москва

от 300 000 до 350 000 ₽

Teamlead Java

DIGITAL SECTOR • Краснодар

от 250 000 до 450 000 ₽

Java Developer

Сбер • Санкт-Петербург

До 350 000 ₽

При выборке областями более 2-х пикселей, остаются переходные пиксели (1-2) вокруг объекта. Однако, они остаются не всегда и получается рамка не замкнутая... Это важно для повторного прохода и более точной выборки.

Answer 1 · 2022-12-08 14:56:54

Ничего не понятно. Какой метод вы используете? FloodFill просто выполняет заливку с допуском, поэтому позволяет выделять только более менее однородные области. У вас же на картинке всего 3 цвета, ещё и с большим разбросом.

оригинальное фото (с интернета)

Вам необходимо собрать целевой датасет, исходя из него выбрать подходящий метод. Если же проверять на рандомных картинках, то всегда можно найти неправильную сегментацию.

Как реализовать алгоритм сегментации?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт