Задать вопрос

Melkij

DBA для вашего PostgreSQL?

1918

вклад
3

вопроса
2068

ответов
46%

решений

Ответы пользователя по тегу PostgreSQL

Как ограничить поиск в партиции таблицы?

Melkij

Melkij @Melkij

DBA для вашего PostgreSQL?

Перепроверил догадку

melkij=> create table events2016m11 (check (dtime >= '2016-11-01'::date AND dtime < '2016-12-01'::date)) inherits(events);
melkij=> insert into events2016m11 values ('2016-11-20');
INSERT 0 1
melkij=> explain (analyze) select * from events where dtime > '2016-12-05';
                                                   QUERY PLAN                                                   
----------------------------------------------------------------------------------------------------------------
 Append  (cost=0.00..38.25 rows=754 width=8) (actual time=0.013..0.013 rows=0 loops=1)
   ->  Seq Scan on events  (cost=0.00..0.00 rows=1 width=8) (actual time=0.004..0.004 rows=0 loops=1)
         Filter: (dtime > '2016-12-05 00:00:00+03'::timestamp with time zone)
   ->  Seq Scan on events2016m11  (cost=0.00..38.25 rows=753 width=8) (actual time=0.009..0.009 rows=0 loops=1)
         Filter: (dtime > '2016-12-05 00:00:00+03'::timestamp with time zone)
         Rows Removed by Filter: 1
 Planning time: 0.127 ms
 Execution time: 0.032 ms
(8 строк)
melkij=> drop table events2016m11 ;
DROP TABLE
melkij=> create table events2016m11 (check (dtime >= '2016-11-01'::timestamptz AND dtime < '2016-12-01'::timestamptz)) inherits(events);
CREATE TABLE
melkij=> insert into events2016m11 values ('2016-11-20');INSERT 0 1
melkij=> explain (analyze) select * from events where dtime > '2016-12-05';                                              QUERY PLAN                                              
------------------------------------------------------------------------------------------------------
 Append  (cost=0.00..0.00 rows=1 width=8) (actual time=0.004..0.004 rows=0 loops=1)
   ->  Seq Scan on events  (cost=0.00..0.00 rows=1 width=8) (actual time=0.004..0.004 rows=0 loops=1)
         Filter: (dtime > '2016-12-05 00:00:00+03'::timestamp with time zone)
 Planning time: 0.301 ms
 Execution time: 0.024 ms
(5 строк)

melkij=> show constraint_exclusion ;
 constraint_exclusion 
----------------------
 partition

Внимательнее с явным приведением типов. У планировщика достаточно работы и не всё эквивалентное он считает идентичным. К тому же timestamp with timezone и date (без времени вовсе) надо сравнивать аккуратно.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Как посмотреть существующие триггеры событий (Event Trigger, postgresql)?
Melkij @Melkij
DBA для вашего PostgreSQL?
Они прописываются в системной view pg_event_trigger
https://www.postgresql.org/docs/9.6/static/catalog...

В psql есть сокращение \dy выполняющее вот такой запрос:
SELECT evtname as "Name", evtevent as "Event", pg_catalog.pg_get_userbyid(e.evtowner) as "Owner", case evtenabled when 'O' then 'enabled' when 'R' then 'replica' when 'A' then 'always' when 'D' then 'disabled' end as "Enabled", e.evtfoid::pg_catalog.regproc as "Procedure", pg_catalog.array_to_string(array(select x from pg_catalog.unnest(evttags) as t(x)), ', ') as "Tags" FROM pg_catalog.pg_event_trigger e ORDER BY 1

Ответ написан более трёх лет назад

Комментировать
Комментировать
Как правильно написать двойное обновление?
Melkij @Melkij
DBA для вашего PostgreSQL?
Вы сильно заблуждаетесь, если думаете, что ваш cte выполняется последовательно.
The sub-statements in WITH are executed concurrently with each other and with the main query. Therefore, when using data-modifying statements in WITH, the order in which the specified updates actually happen is unpredictable. All the statements are executed with the same snapshot (see Chapter 13), so they cannot "see" one another's effects on the target tables.

https://www.postgresql.org/docs/9.6/static/queries...

Вы выполняете на одном слепке данных одних и тех строк различающиеся действия. Не надо так. Я понятий не имею, какой эффект от этого будет.
К тому же вы элементарно переписываетесь в один просто запрос
UPDATE "TABLE1" SET "Value2" = (NOT EXISTS( SELECT NULL FROM "TABLE2" WHERE "что-то" = "кое-что" ) AND NOT EXISTS( SELECT NULL FROM "TABLE3" WHERE "что-то" = "кое-что" )) WHERE "кое-что" = ANY ($1 :: INT [])

Ответ написан более трёх лет назад

Комментировать
Комментировать
На чем делать кластер postgres?

Melkij @Melkij
DBA для вашего PostgreSQL?

Для начала задаёте себе и отвечаете на вопрос "зачем?"
Потому что геморроя, проблем и граблей очень много. Бонусы - сомнительны. Основной пласт проблем - как решить, что пора переключать мастер на другой хост, а не вернётся старый мастер из-за недолгого (а то и вовсе планового) лага сети? Это организационный вопрос и автоматикой он не решается. Самое счастье с автоматикой - схлопотать split brain и получить на этом долгий и увлекательный квест "как бы разъехавшиеся данные теперь подружить воедино"
мастер-мастер = головная боль перманентно. Потому что фундаментальная CAP теорема, которую никто пока внятно не решил. Или у вас проблемы с консистентностью или с медленной из-за распределённых транзакций записью.

Автоматика для failover'а, которую я не придумал как спровоцировать на split brain - patroni. Вроде работает. Но в продакшене видел пока только однажды.

Процедуры (да и вообще запросы) имеет смысл делить:
- пишущие. Любые, какие что-то пишут в базе (включая create temporary table). Это должны роутиться строго на мастер
- читающие. Идут на реплики
- долго читающие. Идут на отдельные slow реплики, которые могут заметно отставать от мастера, но которые не будут мешать деятельности проекта

Ответ написан более трёх лет назад

4 комментария

4 комментария
Как при запросе получить в ячейке больший объем символов?

Melkij @Melkij
DBA для вашего PostgreSQL?

pg_stat_activity.query ограничен сверху конфигурационным параметром track_activity_query_size. Дефолтно 1024 байта.

PS: current_query оно называлось до postgresql 9.2, которые уже давно EOL и сам 9.2 уже EOL. Планируйте обновление.

Ответ написан более трёх лет назад

6 комментариев

6 комментариев
Ошибки при восстановлении dump?

Melkij @Melkij
DBA для вашего PostgreSQL?

Судя по всему вы делали дамп без --clean и пытаетесь восстановить в уже не пустую базу.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Какая база луче подойдет на рабочий портал?

Melkij @Melkij
DBA для вашего PostgreSQL?

Сейчас разработчики пишут портал

Вот у разработчиков и спрашивайте, какую СУБД они лучше знают. И админов своих спросите, какую СУБД те лучше знают. DBA у вас явно нет, иначе вопрос бы так не стоял.

Сам headhunter использует postgresql. Но там и своя команда админов классная, и вдобавок опытная команда DBA моих нынешних коллег, специализирующихся именно на postgresql.

Я достаточно хорошо знаю обе СУБД с точки зрения разработчика, но не умею админить mysql, так что моё мнение будет предвзятым.
Если делаете коммерческий проект - то используйте ту СУБД, которую лучше знает ваша команда. Если разработчики попрятались за своими ORM'ами и носу не заглядывают в базу - то без разницы, в таких условиях любая СУБД будет работать одинаково плохо. Если же хоть кто-то в команде понимает, что надо делать с базой - доверьте выбор ему и поинтересуйтесь о причинах выбора.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как перенести базу postgresql из нерабочей системы, если в chroot сервис не запускается?

Melkij @Melkij
DBA для вашего PostgreSQL?

Найдите, где datadir базы. Скорей всего /var/lib/postgresql/(версия базы)/main, но могла была быть перемещена, так же может стоять несколько кластеров базы и разные версии базы - в дебианах и убунтах это делается легко.

Далее установить на новой системе postgresql идентичной major версии и не ниже minor версии что была там. Какая была major версия - смотрите файлик PG_VERSION в datadir. minor версию ставьте последнюю актуальную.
Так понимаю, старая система в принципе не работает? Т.е. старая база выключена? Выключите и новую (пока пустую) базу. Проверьте, если не уверены, обе базы должна быть выключена.
Переименовываете datadir на новом сервере (вообще, можно удалить, но можно и ошибиться консолью и дропнуть не то =) )
Копируете каталог базы: rsync -a /olddatadir /newdatadir
Копируете и правите если надо конфиги из /etc/postgresql/версия_базы
Если каталог pg_tblspc/ в datadir не пуст - скопируйте и симлинки из него и все данные по этим симлинкам в аналогичные места на новой машине.
Если pg_xlog/ является симлинком - его необходимо скопировать. Можно оставить симлинком, можно содержимое перекопировать.
Пробуете запустить базу на новом месте. Смотрите в логи. Если на старом месте база не была повреждена (и ничего нужного скопировать не забыли) - то она запустится.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как мне установить ограничение-проверки на два условия?
Melkij @Melkij
DBA для вашего PostgreSQL?
Для перечислений можно использовать родной enum
melkij=> create type gender as enum('M','W'); CREATE TYPE melkij=> create table foo (f gender); CREATE TABLE melkij=> insert into foo values('M'); INSERT 0 1 melkij=> insert into foo values('F'); ОШИБКА: неверное значение для перечисления gender: "F" СТРОКА 1: insert into foo values('F'); ^ melkij=> insert into foo values(''); ОШИБКА: неверное значение для перечисления gender: "" СТРОКА 1: insert into foo values('');

И явный check не нужен и добавлять значения проще, особенно если поле используется не в одном месте базы только.

Ответ написан более трёх лет назад

Комментировать
Комментировать
Как быстро удалить большое количество строк в postgresql?
Melkij @Melkij
DBA для вашего PostgreSQL?
Безопасный подход для больших таблиц:
create unlogged table list_for_delete (id int); insert into list_for_delete values .... with to_rm as ( select id from list_for_delete limit 10000 ), rm as ( delete from list_for_delete where id in (select id from to_rm) ) delete from tablename where id in (select id from to_rm); vacuum analyze tablename; drop table list_for_delete ;

cte с delete повторять пока не будет affeted rows = 0. Смотреть на лаг репликации, добавлять задержки между запросами и увеличивать/уменьшать размер пачки в зависимости от влияния на прод.
vacuum в конце, можно после половины пройтись дополнительно. С таким-то объёмом можно руками вакуум вообще не делать и оставить автовакууму. А для таблиц побольше при массовом изменении имеет смысл.

Ответ написан более трёх лет назад

Комментировать
Комментировать
PostgreSQL 9.4.9. Текстовая колонка: какие-то значения были добавлены как string, другие как integer- может ли это привести к значения NULL?
Melkij @Melkij
DBA для вашего PostgreSQL?
Как добавляли, так и будет храниться и читаться.
postgres=# create schema garage; CREATE SCHEMA postgres=# CREATE TABLE garage.users ( car_id text COLLATE pg_catalog."default" ) WITH ( OIDS = FALSE ) TABLESPACE pg_default; CREATE TABLE postgres=# insert into garage.users values ('1'), ($$'1'$$), (null); INSERT 0 3 postgres=# select car_id, car_id is null from garage.users ; car_id | ?column? --------+---------- 1 | f '1' | f | t

Ответ написан более трёх лет назад

Комментировать
Комментировать
Чем бекапить все базы Postgres без прерывания доступа к сервису?

Melkij @Melkij
DBA для вашего PostgreSQL?

pg_basebackup
Сделает консистентную физическую копию базы. Соответственно размер бекапа примерно равен размеру кластера postgresql + накопленные за время копирования WAL.
Восстанавливаться элементарно запустив postgresql с указанием PGDATA в место где лежит результат pg_basebackup.
Им обычно реплики поднимают.

pg_dump или pg_dumpall
Логический бекап данных. Обычно не очень подходит по критерию быстро восстанавливаться т.к. при восстановлении будут перестраивать индексы, проверять fk и прочие constraint, зато как правило сильно (в пару раз без сжатия легко, со сжатием ещё больше разница) компактнее по размеру бекапа

Все из штатной поставки Postgresql. И другие способы бекапа Postgresql в основе своей опираются на них же.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как извлечь данные из JSON?
Melkij @Melkij
DBA для вашего PostgreSQL?
Если не нужен join со значениями, а только фильтр - то
where array(select (j->>'category_id')::int from jsonb_array_elements(data->'items') j) && array[1,3,5];

Можно загнать подзапрос с построением массива в immutable хранимку и повесить по ней gin или gist индекс.

Ответ написан более трёх лет назад

Комментировать
Комментировать
Как лучше сделать поиск по json ячейке?
Melkij @Melkij
DBA для вашего PostgreSQL?
Смотрим операторы: https://www.postgresql.org/docs/current/static/fun...
Печально, прямого оператора как && overlap у массивов нет.
?| text[] Do any of these array strings exist as top-level keys?

Зато тот вполне подходит. Значит, заменить json на jsonb затем запрос будет
select * from t where jsonbfield ?| array['0', '5', '7']::text[];

Если на входе удобен именно json массив, а не pg массив, то относительно просто переписывается одно в другое
select * from t where jsonbfield ?| (select array_agg(t) from json_array_elements_text('["0","5","7"]') t);

gin и gist индексы оператор ?| могут обрабатывать.

Ответ написан более трёх лет назад

Комментировать
Комментировать
Псевдо-персистентное соединение в PHP, возможно ли?

Melkij @Melkij
DBA для вашего PostgreSQL?

Используйте pgbouncer.
Лучше всего в режиме transaction пула. Тогда backend postgresql будет выдаваться соединениям от приложения только на время выполнения транзакции. Что позволяет и очень эффективно утилизировать лишь небольшое число процессов postgresql и сохранить возможность транзакционной работы. В режиме транзакций не работают prepared statements, но PDO их и так эмулирует, так что проблемой это не является.

pgbouncer легко держит тысячи открытых соединений с приложением, легко их открывает и закрывает, развлечения начинаются при попытке прокачать через баунсер с гигабит трафика (и обходится банально запуском второго баунсера тут же на другом порту). Обычно размещается на машине непосредственно с базой на 6432 порту.
И вообще-то является фактическим стандартом для инсталляций postgresql.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Автоинкремент в INSERT INTO ... ON CONFLICT?

Melkij @Melkij
DBA для вашего PostgreSQL?

Никак. Работает как задумано.

И уже при вставке идет разрыв в id.

sequence не гарантирует неразрывность. И последовательность значений тоже не гарантирует.
Гарантирует только уникальность значений.

Ответ написан более трёх лет назад

7 комментариев

7 комментариев
Как правильно делать бекапы базы Postgresql на продашн сервере?

Melkij @Melkij
DBA для вашего PostgreSQL?

Зависит от:
0) какой промежуток времени вам допустимо потерять при восстановлении
1) сколько места вы можете выделить для хранения бекапов
2) какой запас времени вы хотите сохранять для возможности восстановить данные когда-то из более далёкого прошлого

Может, на мыло тоже отправлять на всякий случай?

Как через почту пропихнуть даже мелкие бекапы в десяток гигабайт?
Или вы про совсем крошечные базы спрашиваете?

Шифровать или нет - зависит от требований к безопасности и оценке риска в случае disaster recovery не восстановить ключ шифрования.

Для хорошего point in time recovery - pg_basebackup + pg_receivexlog (archive_command только если уверены, что можете её сделать нормально). Или что-то, работающее поверх них.
Отдельный случай pitr с хранением в амазоне - см. вполне внятный wal-e
Если pitr не обязателен, то pg_dump делать. Да, лучше архивировать, сжимаются дампы весьма неплохо.

Например, политика бекапа из практики: ежедневный pg_dumpall, хранятся за 1 число каждого месяца на протяжении года плюс 8 дней предыдущих ежедневных.

Что-то ещё - регулярно пробовать восстановить и запустить базу из бекапа.

Ответ написан более трёх лет назад

2 комментария

2 комментария
Как при создании нового кластера postgres указать иное расположение хранения баз?

Melkij @Melkij
DBA для вашего PostgreSQL?

Для начала немного терминологии, чтобы явно говорить на одном языке.
Кластер postgresql - это один запущенный postgres.
Один кластер может содержать несколько именованных баз данных, но все они обслуживаются одним запущенным postgres.
На физической машине кластеров postgres может быть несколько.

А теперь - что вы хотите сделать?
* перенести директорию базы в другое место. Остановить базу, скопировать rsync'ом datadir куда надо, на старом месте сделать симлинк (datadir в конфиге в этом случае даже не надо править, если поправить пути в конфиге - то не обязателен симлинк)
* оставить одни БД в дефолтном месте, а некоторые другие - в другом, но под управлением одного кластера. Вам необходимо сделать tablespace и использовать его. При create database можно указать tablespace, который и будет считаться по-умолчанию для всех объектов этой базы (но переопределить его можно для каждого объекта)
* запустить отдельный кластер. В одно и то же место вы две базы просто не вставите. Соответствующий, и обычно обязательный, параметр в initdb плюс указать datadir в конфиге или строке запуска базы (зависит от того, как будет запускаться база и где лежать ещё конфиг). А для весьма приятного враппера в debian и ubuntu pg_createcluster параметр --datadir так же есть сразу

см. также Как правильно изменить месторасположение базы postgresql-9.2.18.rl7?

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как скопировать запросы,которые делает программа к Postgres sql?
Melkij @Melkij
DBA для вашего PostgreSQL?
Помимо log_statement = 'all' можно выставить настройку log_min_duration_statement в 0 - она тоже может логировать все запросы.

Если запросов через базу проходит много не только от необходимой программы, то и log_statement и log_min_duration_statement возможно выставить только для пользователя, от имени котрого программа выполняет запросы. Например,
alter user melkij set log_min_duration_statement = 0;

Ответ написан более трёх лет назад

1 комментарий
1 комментарий
Какие книги прочитать по лучшим практикам проектирования БД?

Melkij @Melkij
DBA для вашего PostgreSQL?

Bill Karwin SQL Antipatterns
В общем-то, в духе рефакторинга как раз: как делают часто неправильно, почему это плохо (но когда и адекватно для задачи) и как сделать лучше.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий

Самые активные сегодня

VoidVolker
- 4 ответа
- 0 вопросов
rPman
- 3 ответа
- 0 вопросов
Максим Корнеев
- 2 ответа
- 0 вопросов
Drno
- 2 ответа
- 0 вопросов
Zerg89
- 2 ответа
- 0 вопросов
Роман
- 0 ответов
- 1 вопрос