А какие есть алгоритмы для поиска максимального скопления точек на плоскости?

Question

VasG @VasG

Алгоритмы

А какие есть алгоритмы для поиска максимального скопления точек на плоскости?

Есть плоскость (размером ~2000х2000), на которой разбросаны точки (массив точек) с координатами [x,y]. Известно, что точно есть максимальное скопление. Его надо найти. Массив точек известен.

Единственное, что пришло в голову — просканировать всю плоскость окошком, и посмотреть, сколько в него попало точек. Где больше всего — там и скопление.
Но я точно не первый, кто столкнулся с такой задачкой, и может быть есть другие, более «скоростные» и чётко настроенные алгоритмы?

UPD
Скопление точек,- это… эээ… скопление точек… Место, в котором плотность точек максимальна.
Например, вот такая штука получается, если полученный массив отобразить графически:

Невооруженным взглядом виден максимум.
Есть ли какие-нибудь скоростные алгоритмы для его поиска?

Вопрос задан более трёх лет назад
9540 просмотров

Комментировать

Подписаться 11 Средний Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Алгоритмы и структуры данных

4 месяца

Далее
Skillbox

Алгоритмы и структуры данных для разработчиков

3 месяца

Далее
Stepik

Алгоритмы и структуры данных

1 неделя

Далее

Решения вопроса 1

2 комментария

VasG @VasG Автор вопроса

Почему-то мне кажется (если я правильно вас понял), что у такого алгоритма ошибка уже в самом подходе. Ведь плоскость достаточно большая, и, к примеру, ближе к нулю точки могут быть равномерно «размазаны» рядом с осями, и такой вектор-сканер их насобирает много-много штук. А скопление может быть далеко от осей, и при этом будет промах.
Но большое спасибо за совет!

Написано более трёх лет назад
FrostMoon @FrostMoon

Сканер идет сплошной линией по всему объекту — сначала сверху вниз (по всей ширине), потом слева направо (во всей высоте). и В данном случае (по вашему UPD) мой алгоритм таки сработал бы :)
т.к. горизонтальный сканер выбрал бы координату 200-210, а вертикальный 210-220 :)

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 17

1 комментарий

Комментировать

4 комментария

Monnoroch @Monnoroch

Еще можно не по числу точек а по цветовой корелляции: закрасить плоскость белым, а точки черным и искать самое «черное на вид» место.

Написано более трёх лет назад
Monnoroch @Monnoroch

Кстати, это интересно. Если раздуть точки достаточно сильно, то можно воспользоваться алгоритмом детекции краев и выделить самую большую определенную таким образом область.

Написано более трёх лет назад
Monnoroch @Monnoroch

Скопление точек,- это… эээ… скопление точек…

Вот именно в этом и проблема. Невозможно придумать алгоритм решения задачи без ее четкой постановки.

Написано более трёх лет назад
VasG @VasG Автор вопроса

Точки — это всё-таки квадратики, несмотря ни на что)) Поэтому идея с кругом, к сожалению, отпадает почти для любой задачи. Вариант с расстоянием быстрым, к сожалению, назвать очень тяжело… Если раздувать точки, то слишком сильно растёт погрешность вычислений.
А первый вариант — совпадает с предложенным мной.
Большое спасибо Вам за ответ))!

Написано более трёх лет назад

5 комментариев

VasG @VasG Автор вопроса

Это всего лишь графическое отображение массива…

Написано более трёх лет назад
Monnoroch @Monnoroch

Ну да, и что? Вы же можете отобразить массив графически и работать с картинкой.

Написано более трёх лет назад
VasG @VasG Автор вопроса

Но зачем??! Глупости какие-то вы стали говорить, уж извините.

Написано более трёх лет назад
Monnoroch @Monnoroch

Это же очевидно — искать визуально определимое скопление точек графически. Более того, если вы подумаете, как же вы взглядом определяете это скопление, с большой уверенностью могу сказать, что вы действуете примерно по приведенной выше схеме.

Написано более трёх лет назад
Monnoroch @Monnoroch

Более того, одно из достоинств данного подхода — он слабо зависит от числа точек. Даже чем больше точек, тем лучше.

Написано более трёх лет назад

Комментировать

6 комментариев

Monnoroch @Monnoroch

Может возникнуть проблема: представьте, что в первом квадранте у вас больше всего, но они рассеяны, а во втором меньше, чем в первом, но плотно сжаты.

Написано более трёх лет назад
Monnoroch @Monnoroch

Ой, почему-то я подумал, что вы делите на четыре, а не пополам. Но проблема не пропадает.

Написано более трёх лет назад
VasG @VasG Автор вопроса

К сожалению, такой способ был бы превосходен при равномерном распределении точек на плоскости. При неравномерном — очень велика вероятность ошибки. Кажется, ничего надёжнее сканирующего окошка здесь нет, но это и не страшно.
Спасибо за ответ))!

Написано более трёх лет назад
Sekira @Sekira

Да, вероятность ошибки есть, когда в одной половине точки расположены близко к друг другу, но их меньше, чем в другой половинке, разбросанных равномерно по всей, но количеством больше. А что за метод сканирующего окошка, что-то нигде не нашел? Это берем четырехугольник нужного размера, и считаем количество точек в нем, сдвигаем сначала по x +1, до конца, потом y +1 и x снова от начала до конца?

Написано более трёх лет назад
VasG @VasG Автор вопроса

Да, примерно также, как работает счетчик Хафа, в одноименном преобразовании.

Написано более трёх лет назад
max_mara @max_mara

А что будет если «центр» скопления прямо на границе?

Написано более трёх лет назад

1 комментарий

Комментировать

2 комментария

Комментировать

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Алгоритмы

Средний
Как создать алгоритм для ракеты в игре?
- 2 подписчика
- 30 окт. 2025
- 308 просмотров
1

ответ
Алгоритмы

Простой
Как решать алгоритмические хакатоны и учится?
- 1 подписчик
- 27 окт. 2025
- 227 просмотров
2

ответа
Базы данных

+1 ещё

Простой
Как правильно реализовать обновление порядка (поле order) в бд?
- 1 подписчик
- 19 окт. 2025
- 222 просмотра
2

ответа
Алгоритмы

Простой
Как открыть файл сжатый с помощью алгоритма Brotli на пк?
- 1 подписчик
- 19 окт. 2025
- 186 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Как решить задачку из контеста?
- 1 подписчик
- 13 окт. 2025
- 353 просмотра
1

ответ
Алгоритмы

+1 ещё

Простой
Как отконвертировать 3D-меш в наклонные треугольники?
- 2 подписчика
- 02 окт. 2025
- 187 просмотров
1

ответ
Алгоритмы

Сложный
Поиск оптимального маршрута с наимешьшим влиянием на цену в сети ethereum?
- 1 подписчик
- 29 авг. 2025
- 162 просмотра
2

ответа
Алгоритмы

Простой
Как можно еще уменьшить количество комбинаций в игре крестики нолики?
- 1 подписчик
- 22 авг. 2025
- 247 просмотров
2

ответа
Алгоритмы

Простой
Как можно уменьшить количество комбинаций в игре крестики нолики?
- 1 подписчик
- 19 авг. 2025
- 195 просмотров
2

ответа
Алгоритмы

+1 ещё

Простой
Как в квантовый компьютер вводятся данные?
- 1 подписчик
- 12 авг. 2025
- 323 просмотра
3

ответа
Показать ещё Загружается…

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

Разработчик в буткемп Core Infrastructure

Яндекс • Москва

от 300 000 до 490 000 ₽

ML-разработчик (аудио)

НТЦ ПРОТЕЙ • Санкт-Петербург

от 220 000 до 280 000 ₽

Answer 1 · 2011-12-25 23:14:53

ИМХО, для данной задачи, где не до конца ясна цель. Если есть площадь A-C по ширине, 1-3 по высоте.
Пройтись вектором-сканером по ширине А(1-3), B(1-3), C(1-3), и понять на какой отметке больше всего точек, потом так же пройтись по высоте 1(A-C), 2(A-C), 3(A-C) так же получить отметку где скопление точек плотнее. ну и пересечение 2х этих отметок и будет место максимального скопления.

Answer 2 · 2011-12-26 00:33:50

Кстати, если вам не нравятся графические эвристики — есть способ даже лучше.
А именно посчитать мат. ожидание и дисперсию вашего списка точек. Это займет линейное время, а требуемой областью скорее всего будет круг с центром в мат. ожидании и радиусом в корень из дисперсии.
Не уверен, что всегда сработает именно такая постановка — может оказаться слишком большой разброс, однако очевидным плюсом будет линейное время работы. А сложные штуки с ползающей рамкой можно применять как запасной метод на случай большой дисперсии.

Answer 3 · 2011-12-26 09:45:16

Задача сия мне попадалась неоднократно. В разных размерностях (от 1 до 6, причем шестимерное пространство было совсем не декартовым — оно описывало перемещения трехмерного пространства) и с разным числом точек, но всегда без точной формулировки. Хорошего решения я, кажется, не написал ни разу, каждый раз махал рукой и шел другим путем. Но мысли остались следующие.
1) без понятия «масштаб» задача не имеет смысла. То есть, прежде чем решать ее, надо задаться неким «размером окошка», «радиусом размытия точки», «шириной серой зоны» и т.п.
2) чаще всего этот размер заранее неизвестен. Если взять его с запасом, то результат будет правдоподобен, но неточен а если размер окажется слишком маленьким, то наоборот, найдется локальное скопление среди пустоты. Лучше всего, наверное, выбрать убывающую последовательность r1>r2>r3>r4… (например, для окна 2000х2000 это моут быть степени двойки от 128 до 8), найти квадрат со стороной r1, содержащий максимальное количество точек, в нем — квадрат со стороной r2, и т.д. В этом случае наш результат будет правдоподобен во всем диапазоне масштабов.
3) Искать границы квадратов с точностью до пикселя смысла нет. Если мы ищем квадрат NxN, то достаточно перебрать квадраты с шагом N/4 по каждой координате. Например, если мы ищем квадрат 128х128 на плоскости размером 2000х2000, то достаточно рассмотреть 3600 возможных положений этого квадрата (вершина имеет координаты от 0 до 1888 с шагом 32). Завести целочисленный массив такого размера. Каждая точка попадает в 16 квадратов (или меньше) — увеличить 16 ячеек на 1. Найти максимальную — она даст стартовый квадрат.
После этого в этом квадрате перебрать 25 квадратов 64х64, в максимальном из них 25 квадратов 32х32 и т.д.
Если r1 выбран слишком маленьким, а плоскость была слишком большой, то вместо массива (который был 60х60) можно воспользоваться каким-нибудь деревом (для экономии памяти и времени на инициализацию).
Не исключено, что имеет смысл просмотреть не одну последовательность квадратов, а несколько (выбрать 10 квадратов размером r1 с наибольшим весом, из всех квадратов со стороной r2, лежащих в них — 10 наибольших и т.д.) Но это будет писать сложнее, а сработает оно только если скопление выражено нечетко, а где-то есть разреженная туманность. Впрочем, в этой ситуации надо сразу уменьшать r1.

Answer 4 · 2011-12-26 10:53:12

Просто уменьшите всё ваше поле в 10-100 раз, с округлением координат точек до целого числа, затем пройдитесь по уменьшенному полю и найдите на какую координату поля приходится наибольшее количество точек. Если таких координат несколько, сравните эти области в оригинальном размере.

Answer 5 · 2011-12-25 23:08:16

Решение станет понятнее, если определиться с задачей. Я вот не очень понимаю, что такое скопление точек, да еще и максимальное.
1) Есть много вариантов: такой квадрат со стороной A, что в него попадает точек больше, чем в любой другой квадрат с такой же стороной.
2) То же, только с кругом и радиусом.
3) Такая точка плоскости, что сумма расстояний до всех данных точек минимальна.
И это только навскидку.

Для разных задач решения разные.

Answer 6 · 2011-12-25 23:21:30

Чтобы найти данное скопление достаточно применить к картинке фильтр усреднения цвета. Он сотрет все одинокие точки, а пятно оставит да еще и размоет, убрав шум. Искать пятно легко, много алгоритмов готовых есть. Но что вы будете делать, если явного пятна не будет?

Answer 7 · 2011-12-26 08:08:44

В <a href=«habrahabr.ru/blogs/image_processing/134352/>похожей задаче я просто пользовался медианным усреднением.
Как и говорили выше, если вычислить среднеквадратичное отклонение (но не от среднего, а от медианы), с большой надежностью (чем больше точек — тем лучше) получим что-то вроде центра тяжести, вокруг которого в круге с радиусом σ будет находиться наибольшее количество точек.

Еще вариант: как было предложено выше. Т.е. преобразовать эти точки в изображение, дискретизуя с большим шагом. Найдя „пиксель“ с наибольшей интенсивностью (количеством точек) перейти к меньшей дискретизации. Эдакая вариация дихотомии.

Есть еще вариант: построить вокруг точек выпуклые непересекающиеся оболочки максимальной площади, содержащие ровно по одной точке. Функция распределения площади оболочек от координат даст понятие распределения плотности точек. Но эта задача сложна математически, да и вряд ли нужно так усложнять, когда предыдущие способы вполне сгодятся.

Answer 8 · 2011-12-26 14:19:18

lashtal @lashtal

Вам, думаю, подойдет этот ответ:
stackoverflow.com/questions/356035/algorithm-for-detecting-clusters-of-dots

Ответ написан более трёх лет назад

Комментировать

Answer 9 · 2011-12-26 00:15:29

Делим массив на два четырехугольника, считаем в каждом, в котором больше, опять делим на два, считаем, снова делим на 2 считаем, и так сколько надо раз, пока не будет четырехугольник нужной точности. В идеале надо дойти до 1 точки, и из неё уже делать квадрат, круг или нужную фигуру, нужным размером.

Answer 10 · 2011-12-26 01:56:11

помнится еще в университета с точками этими возились. сейчас алгоритм не помню, но считали расстояния между точками и по нему определяли разбросанные. цель задачи не помню, но могу выяснить если напомните завтра днем.

Answer 11 · 2011-12-26 04:42:08

Попробуйте поиграться с DBSCAN. Если установить в нем параметр плотности достаточно большим, то алгоритм скорее всего найдет в вашем массива ровно один кластер — искомое скопление точек.

Answer 12 · 2011-12-26 08:37:25

При размерах плоскости 2000x2000 в большинстве случаев вполне можно обойтись полным перебором вашим алгоритмом (всего-то ~ 4 млн вариантов). Причем алгоритм можно сильно ускорить, если сдвигать окно сразу на несколько единиц. Например, если сдвигать окно на 5 единиц (точек), то будет всего 160 тысяч вариантов.
При больших объемах данных можно придумать итеративный алгоритм с уменьшающимися размерами окна и сдвига.

Answer 13 · 2011-12-26 14:09:31

Используйте что-то похожее на алгоритм «K ближайших соседей». Грубо говоря, для каждой точки посчитайте расстояния до k ближайших соседей, и у кого сумма этих расстояний будет меньше, те точки находятся ближе к эпицентру :) Таким образом можно найти кучку «центральных» точек.
Если делать это динамическим программированием, то будет работать не очень медленно

Answer 14 · 2011-12-26 23:15:38

А вероятностный алгоритм вам не подойдет?
А именно: если в ожидаемом окне k точек из n — выбираем случайную точку как искомую, рассматриваем окна ее содержащие.
Вероятность того, что за m попыток вы не найдете правильный ответ — ((n-k)/n)^m.

Answer 15 · 2011-12-26 23:30:59

Первое, что пришло в голову — для начала взять квадрат (0,0) — (width, height) и потом каким-то образом сдвигать границы.

Второе — нумеровать точки через рекурсию: для каждой не помеченной точки, f(i) = пометить точку номером i и вызвать себя же для всех не помеченных точек, расположенных на расстоянии < L от точки. Так мы пометим номерами все группы точек, внутри которых точки расположены друг от друга не дальше расстояния L.
Ну и потом нужно подсчитать, за каким номером больше всего точек (а можно и сразу считать).

Answer 16 · 2011-12-29 06:59:51

Заменить точки кругами (радиус выбирать по вкусу): ввести дополнительную плоскость, на которой рисовать круги. Круги рисовать не цветом, а счётчиком — если зона накрыта 1 раз, то вписать «1», если 2 раза, то «2».
Это почти что «размазать точки графическим фильтром».
А потом с дополнительной плоскости снимать готовые результаты в виде ячеек с максимальным числом перекрытий. Или детекцией краёв изображения по определённой яркости, если рассуждать в терминах графических алгоритмов.

Answer 17 · 2011-12-29 12:18:07

Выше уже написали про метод К-средних, думаю вам следует взять любой из общеизвестных методов кластеризации, там кроме К-средних есть и другие

Answer 18 · 2019-06-11 08:50:22

Алексей Джо @RxR

Алгоритм к-средних.
работает как-то так:
https://media1.giphy.com/media/12vVAGkaqHUqCQ/sour...

Ответ написан более трёх лет назад

Комментировать

А какие есть алгоритмы для поиска максимального скопления точек на плоскости?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт