Как лучше хранить список GPS-точек в PostgreSQL 9.6 с расширением postgis?

Question

SteepZero @SteepZero

PostgreSQL

Как лучше хранить список GPS-точек в PostgreSQL 9.6 с расширением postgis?

Реализуем GPS-трекинг
Думаем как хранить маршруты - набор точек
Искать по точкам не планируется, нужно только выводить их и строить кривую в определенный момент

Разошлись во мнениях с коллегой:
1. Я предлагаю хранить каждую точку отдельной записью

2. Он предлагает хранить точки массивом (или в json-формате) в одной строке. Т.е. маршрут - одна строка в базе со всеми точками
Коллега аргументирует выбор такого формата тем, что если хранить точки в отдельных записях, база вырастет очень быстро и в дальнейшем при выборке нескольких тысяч точек из нескольких миллионов записей будет занимать много времени и ударит по производительности.

У меня вообще нет никаких аргументов в защиту своего варианта кроме принципов нормализации =)

Расскажите, пжлст, какой бы вариант выбрали вы и почему

Вопрос задан более трёх лет назад
698 просмотров

3 комментария

Подписаться 1 Средний 3 комментария

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

2 комментария

Сергей П @trapwalker

А если захочется чтобы точки как будто на волнах покачивались и кружились как снежинки?
Сарказм-сарказмом, но подход спорный.
Мало ли что захочется. Когда захочется, станет ясно чего хочется. Кстати интерсекция по терками в случае миллиардов точек - это довольно неприятная задача. Точки разных треков по одной и той же дороге всё же разные геометрически.
Пересекать треки в виде поли-линий куда проще постгисовскими методами, к тому же предварительно можно быстро проверить баунд-боксами могут треки пересечься или нет.

Написано более трёх лет назад
Алексей Черемисин @leahch

Сергей Паньков, у меня база из нескольких миллионов полигонов хранится в r-tree структурах. Для r-tree работают те же самые функции поиска и нахождения, перебирать по каждому массиву точек не нужно. Сравниваются bbox в виде структор r-tree. Все очень быстро работает. Правда у меня не постгрес, но постгрес умеет в r-tree точно.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PostgreSQL

+1 ещё

Средний
Sqlx + pgx — выборка по набору пар значений столбцов без танцев с бубном?
- 1 подписчик
- 07 июл.
- 94 просмотра
1

ответ
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 354 просмотра
2

ответа
PostgreSQL

Простой
Запрос с 1 условием для выбора источника данных?
- 1 подписчик
- 08 апр.
- 172 просмотра
2

ответа
PostgreSQL

+1 ещё

Средний
Как в PostgreSQL организовать синхронизацию данных между геораспределенными копиями?
- 1 подписчик
- 25 мар.
- 334 просмотра
3

ответа
PostgreSQL

Простой
Как оптимизировать запрос с фильтром?
- 2 подписчика
- 13 мар.
- 347 просмотров
1

ответ
PostgreSQL

+1 ещё

Простой
Как работает Housekeeper в Zabbix?
- 1 подписчик
- 07 мар.
- 350 просмотров
3

ответа
PostgreSQL

+3 ещё

Средний
Как обновить PostgreSQL 1С с 12 до 18 версии на windows?
- 3 подписчика
- 11 февр.
- 805 просмотров
2

ответа
PostgreSQL

Простой
Как увидеть все запросы к postgres?
- 1 подписчик
- 15 янв.
- 319 просмотров
1

ответ
PostgreSQL

+1 ещё

Средний
Почему не запускается контейнер DB в Docker?
- 1 подписчик
- 08 янв.
- 388 просмотров
2

ответа
Linux

+4 ещё

Средний
Runtipi: как корректно переключить встроенный Postgres-контейнер на внешний Postgres (.env / runtipi-cli / docker compose)?
- 1 подписчик
- 26 дек. 2025
- 217 просмотров
0

ответов
Показать ещё Загружается…

А как ваш коллега собрался из json трека выбирать несколько точек?
На самом деле нам пока и не нужно выбирать часть точек маршрута (в рамках текущего ТЗ)
И пока сложно представить понадобится ли нам отдельная сущность "точка"
Поэтому вариант коллеги на первый взгляд кажется обоснованным
SteepZero, Так как в итоге сделали-то? Понадобилось в результате то, чего не сделали?=)

Answer 1 · 2018-11-01 20:39:55

Вы упомянули постгис, соответственно нужно использовать его формат geom через st_makeline(). Ну или geojson в постгресовских jsonb полях.
Это оптимальные варианты. Второй предпочтительнее для быстрой отдачи клиентам, а первый для фильтрации или обработки в постгисе. Так как истинный геоджсон может содержать несколько геометрий и надо писать кастомную функцию для преобразования в постгисовскую геометрию, я бы хранил и обрабатывал в постгисе, а в геоджсон или другой нужный формат преобразовывал бы опосля

Хранить точки отдельно - дрочево при достаточно большом количестве точек. Да и сами точки без трека никакой полезной информации не несут ведь.

Answer 2 · 2018-11-01 19:06:36

Ваш подход гораздо лучше, как минимум тем, что в какой-то момент наверняка захочется сделать интерсекцию по трекам, ли выбрать точки внутри полигона. А с проблемой производительности можно бороться партиционированием таблиц, например по времени начала трека. Старые партиции стирать и перекидывать в архив. Ваш вариант как минимум гораздо гибче.

Answer 3 · 2018-11-01 19:11:08

имхо виф рекурсив в купе со связкой ид, кей, парент_ид, маршрут_ид куда более удобны в обслуживании...

Answer 4 · 2020-02-03 13:09:24

Некропостит.
Ваш вопрос довольно хорошо гуглится, так что добавлю свой вариант ответа.
Ключевой момент в том, что вы делаете трекинг. Для предметной области важны следующие сущности:

Сессия - относительно непрерывный (без больших пропусков) участок траектории движения: границы сессии во времени, границы в пространстве, длительность сессии, пробег сессии, время простоя, время в движении, средняя скорость, максимальная скорость, медианная скорость.
Точка трека - сообщение от GPS-трекера:
- время,
- координаты,
- скорость,
- уровень сигналов GPS и GSM,
- уровень топлива,
- датчики дверей,
- датчики работы двигателя,
- текущая точность GPS,
- и т.д.
Маршрут - информация о траектории без детализации профиля скорости. Длина, мат-ожидания времени пути для разных ТС...
Точка маршрута.

Очевидно, что ввиду всего этого у вас никак не получится хранить точки треков в поли-линиях постгиса.
Зато можно кэшировать их агрегированную геометрию в этом формате для скорости и простоты работы. Но это самое кэширование имеет смысл только если вам эта оптимизация реально нужна (медленно отдаются треки, медленно и сложно джойнятся сессии...). Зачем делать то. что можно было бы не делать?
А на счет размера БД я бы на вашем месте и месте вашего коллеги вовсе бы не беспокоился. Сейчас хранилища дёшевы и масштабируемы, никогда не поздно чистить старые ненужные данные, Данные у вас отлично индексируются и фильтруются по времени, можно дампы старых данных сливать в холодное хранилище, вдруг приспичит когда-то сделать инфографику или болшой анализ.
Я бы пожалел отказываться от детальной инфы по точкам трека в пользу какой-то сомнительной преждевременной оптимизации.

Как лучше хранить список GPS-точек в PostgreSQL 9.6 с расширением postgis?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт