• Доп. вопрос к ответу - Это будет 2 RAID1 по 4 диска или 4 RAID1 по 2 диска, которые дальше объединены в RAID0?

    Melkij
    @Melkij
    PostgreSQL DBA
    Зависит от реализации.

    В linux raid (mdraid), например, raid10 - это особая штука. Сделать raid10 на 3 дисках? Да не вопрос, соберём и будет работать, честно гарантировать выживание массива при выпадении одного любого диска. А если хотите - можете собрать raid10 с избыточностью 3, тогда может помереть любые два диска.
    Куда какой блок при этом пишется - зависит от layout, это не просто зеркало поверх страйпа (или наоборот)

    Если говорить "по учебнику" - то для RAID10 нужно минимум 4 диска. Массив переживёт выпадение только одного любого из дисков массива. Максимальное число выпавших дисков не зависит от количества дисков в массиве. Выпадение второго диска может быть фатально. Но при большом везении RAID10 может потерять до половины дисков массива - если вы теряете только те блоки, которые массив может прочитать с другого живого диска.
    Ответ написан
    Комментировать
  • Почему процессоры без встроенной карты не быстрее процессоров со встроенной?

    Melkij
    @Melkij
    PostgreSQL DBA
    Потому что это одни и те же кристаллы. Зачем разрабатывать и производить много разных модификаций кристаллов, если можно взять один и тот же, включать/отключать некоторые блоки, заодно тем самым уменьшая общую отбраковку.

    Ведь память это же самое дешевое, что можно сделать на кристалле?

    Это как раз обычно самое дорогое - самый большой по площади регион. Больше площадь = меньше кристаллов с пластины. Больше площадь кристалла = выше риск получения брака у каждого из кристаллов. Меньше исправных кристаллов = выше стоимость каждого.
    Ответ написан
    Комментировать
  • PSQL отрезает концовки некоторых слов в to_tsvector, что делать?

    Melkij
    @Melkij
    PostgreSQL DBA
    melkij=> SELECT * from ts_debug('russian', 'дело сделать кот наконец то');
     alias |    description    |  token  |  dictionaries  |  dictionary  | lexemes 
    -------+-------------------+---------+----------------+--------------+---------
     word  | Word, all letters | дело    | {russian_stem} | russian_stem | {дел}
     blank | Space symbols     |         | {}             |              | 
     word  | Word, all letters | сделать | {russian_stem} | russian_stem | {сдела}
     blank | Space symbols     |         | {}             |              | 
     word  | Word, all letters | кот     | {russian_stem} | russian_stem | {кот}
     blank | Space symbols     |         | {}             |              | 
     word  | Word, all letters | наконец | {russian_stem} | russian_stem | {}
     blank | Space symbols     |         | {}             |              | 
     word  | Word, all letters | то      | {russian_stem} | russian_stem | {}
    (9 строк)


    lexemes text[] — the lexeme(s) produced by the dictionary that recognized the token, or NULL if none did; an empty array ({}) means it was recognized as a stop word

    https://www.postgresql.org/docs/current/textsearch...

    Там же, далее:
    melkij=> SELECT ts_lexize('russian_stem', 'наконец');
     ts_lexize 
    -----------
     {}

    ts_lexize returns an array of lexemes if the input token is known to the dictionary, or an empty array if the token is known to the dictionary but it is a stop word, or NULL if it is an unknown word.

    Используемый словарь намеренно отмечает это слово как бессмысленное слово, не используемое для поиска.

    Если вы с таким поведением не согласны, используйте другой словарь или делаете свой: https://www.postgresql.org/docs/current/textsearch...
    Ответ написан
    Комментировать
  • Почему так сделано postgresql работа с tablespace?

    Melkij
    @Melkij
    PostgreSQL DBA
    2022 год блин. Ставите весь целиком PGDATA на nvme ssd.

    Почему такие default_tablespace - потому что как бы их не сделать, всё равно сыпятся вопросы (куча вопросов) "ой а почему команда Х сделала Z, ведь логично что я хотел Y"
    Ответ написан
  • Не могу выполнить запрос к БД используя PDO. В чём проблема?

    Melkij
    @Melkij
    PostgreSQL DBA
    Как должно быть видно по тексту ошибки, ругается не PHP, а совсем даже СУБД.

    TLDR: структура запроса (например, сортировка) через prepared statements изменяться не может. Только константы в запросе.
    Ответ написан
    Комментировать
  • Как освободить пространство с LVM?

    Melkij
    @Melkij
    PostgreSQL DBA
    Если есть под рукой пустой накопитель от 82гб:
    - подключить доп диск
    - pvcreate на него на всю ёмкость
    - vgextend
    - pvmove старый_диск новый_диск
    - vgreduce
    - pvremove
    - переделываете партиции на nvme как нравится
    - повторить заново с pvcreate только теперь pvmove с временного диска обратно на nvme

    Если на время перенести некуда - то pvresize + уменьшить размер раздела, потом создать новый раздел на освободившемся месте.

    PS: доктор, я в каждой команде написал pg вместо vg, это ещё лечится?
    Ответ написан
    Комментировать
  • Как изменить формат вывода timestamp with time zone в postgresql?

    Melkij
    @Melkij
    PostgreSQL DBA
    При отсутствии явных функций форматирования даты в запросе стиль вывода timestamp задаётся настройкой datestyle. Это на выбор несколько предустановленных форматов. Для таймзоны форматирование вида здесь. Стиль USE_XSD_DATES используется в xml и json, но через datestyle его использовать невозможно, а потому минутная часть в выводе будет присутствовать только отличная от нуля.

    В целом, форматирование датывремени - это не задача запроса к базе, это задача вывода данных в конечном приложении.
    Ответ написан
    Комментировать
  • Как реализовать структуру БД и сам бэкенд для сервиса бронирования отелей с динамическими ценами?

    Melkij
    @Melkij
    PostgreSQL DBA
    Это-то динамическая? Хотите посмотреть на динамические цены - посмотрите на ценообразование некоторых авиакопаний, где цена на один и тот же рейс может ощутимо прыгать несколько раз в течении одного часа.

    Не, это вполне статичные цены у вас. А если вам дают формат "отель, категория номера, дата, цена" без дальнейшего деления - то и вовсе простой случай. Вот прямо так и импортируете в табличку id отеля, категория номера, дата, цена. Первые три поля - композитный первичный ключ.
    Запрос стоимости на отрезок времени:
    select hotel_id, category, sum(price) as total_price from hotel_prices where date between ? and ? and not on_stop_sale group by 1,2 having count(*) = количество_дней_в_диапазоне order by total_price

    (having нужен чтобы отсеять категории номеров, недоступные для продажи на весь диапазон дат)

    Ну пяток-десяток категорий номеров, немного лести про сотню отелей, на год вперёд... Вот только попробуйте заикнуться что эта кроха вырастет ну на тааак много строк что будет невероятно медленно работать.
    Ответ написан
    Комментировать
  • Есть ли какие-либо практические различия в PostgreSQL между доступом к jsonb через -> и []?

    Melkij
    @Melkij
    PostgreSQL DBA
    Начну с конца - для индексов это критично разные вещи. Планировщик даже пытаться анализировать не станет, эквивалентные это условия или нет. Если у вас есть индекс по my_column -> 'a', а в запросе вы написали "my_column"['b'] - то этот индекс использоваться не будет.

    Касательно самих двух операторов:
    -> ровесник jsonb как такового
    jsonb[element] - jsonb subscripting на языке документации - штука недавняя, лишь только прошлогодняя из pg14. Пока что нужно иметь в виду если вам может потребоваться более старая версия базы.
    По поведению отличий вроде не должно быть никаких. Оба варианта возвращают jsonb, поэтому IRL куда чаще используется ->> возвращающий текст.
    На уровне реализации оба приходят к одному и тому же getKeyJsonValueFromContainer. Вы скорее упрётесь в производительность разбора формата самого jsonb, чем заметите какую-то разницу в производительности родного оператора от type subscripting.
    Ответ написан
    Комментировать
  • Какие требования к физической репликации Postgresql 11?

    Melkij
    @Melkij
    PostgreSQL DBA
    major версия обязана совпадать, обязаны совпадать ряд флагов компиляции и некоторые настройки.

    с centos 7 на убунту 20.04 реплицировать можно, но вы гарантированно попадаете на изменение правил сортировки строк в libc: https://wiki.postgresql.org/wiki/Locale_data_changes
    Для переезда на другую ОС годится (подняли реплику, в нужный момент переключили на неё мастер и реиндексировали пострадавшие индексы), для долговременной работы уже не очень вариант.
    Ответ написан
    2 комментария
  • Роутер или коммутатор?

    Melkij
    @Melkij
    PostgreSQL DBA
    Можно если ставить коммутатор умеющий VLAN. VLAN'ами разделяете порты так чтобы кабель провайдера был в одном сегменте с микротиком и только с ним, регистратор куда ему там надо (я хз должен ли у вас он быть в локальной сети дома, в сети провайдера или в свой отдельной только для него), микротик соответственно настраиваете маршрутизировать трафик между этими vlan'ами.
    Ответ написан
    Комментировать
  • Как сделать единую реплику базы данных Postresql из трех разных мастер серверов?

    Melkij
    @Melkij
    PostgreSQL DBA
    • 3 независимых экземпляра postgresql на разных портах через потоковую репликацию. Просто, стабильно, надёжно
    • какая-то из форм логических репликаций. Приключения по сопровождению за свой счёт. Начать с pub/sub как штатный механизм
    Ответ написан
    Комментировать
  • Как проверить обьект jsonb на ilike со строкой в Postgres?

    Melkij
    @Melkij
    PostgreSQL DBA
    exists(select from jsonb_array_elements_text(col->'elements') as el where 'first-element' ilike concat('%', el, '%'))

    если я верно понял ваше описание
    Ответ написан
    Комментировать
  • Как безопасно заменить умерший винт в зеркале raid?

    Melkij
    @Melkij
    PostgreSQL DBA
    Сначала выяснить, что это за комп, какой рейд и как именно собран, какой именно из дисков отказал. Затем имея эти данные предметно выяснить как именно на этом контроллере/fakeraid/softraid восстанавливать избыточность после потери диска и на что стоит обратить внимание по пути.
    Ответ написан
    5 комментариев
  • Как построить локальную сеть?

    Melkij
    @Melkij
    PostgreSQL DBA
    Для ethernet сети из только двух хостов вообще ничего не нужно кроме собственно самих двух хостов и кабеля.
    Ответ написан
    Комментировать
  • Почему в ubuntu ошибки Unable to fetch some archives при установке пакетов?

    Melkij
    @Melkij
    PostgreSQL DBA
    impish aka Ubuntu 21.10 уже EOL и удалена из репозиториев.
    Regular releases are supported for 9 months.

    Как и задумано.

    Вероятно, вы хотели использовать LTS релиз.
    Ответ написан
    Комментировать
  • Как поменять тип данных в столбце postgresql?

    Melkij
    @Melkij
    PostgreSQL DBA
    alter table tablename alter columnname type varchar;
    Ответ написан
    Комментировать
  • Как функция index scan в postgresql понимает тип индекса?

    Melkij
    @Melkij
    PostgreSQL DBA
    Весь раздел https://www.postgresql.org/docs/current/internals.html
    за исключением разве что System Catalogs

    Узел Index Scan в плане запроса - это далеко не одна функция, а целый отдельный src/backend/executor/nodeIndexscan.c
    Ну и кучка поддерживающих конструкций, чтобы от этого был толк. Большая кучка конструкций. Очень.

    Как функция index scan в postgresql понимает тип индекса?

    А ему и не надо.
    Если планировщик выбрал index scan - значит этот index access method предоставляет совместимый интерфейс. Далее index scan согласно контракту index access method дёргает методы этого конкретного AM, и уже сам AM решает, где у него что лежит и как доставать требуемые TID по заданным условиям.

    и как именно Postgre понимает, какую функцию следует применять

    postgresql или postgres. Базы postgre не существует.
    А муками выбора о плане запроса страдает планировщик, работающий перед executor'ом. И там настоящая чёрная магия (и костыли)
    Ответ написан
    Комментировать
  • Как решить ошибку "must be superuser or replication role to start walsender"?

    Melkij
    @Melkij
    PostgreSQL DBA
    Добавьте в log_line_prefix как минимум %h, затем ищите на том хосте, кто может пытаться запустить walsender. Это может быть как физическая, так и встроенная логическая репликация.
    %u в log_line_prefix покажет каким логином этот процесс авторизовался, может навести на какие-то мысли о том что именно искать.
    Ответ написан
    1 комментарий