Задать вопрос

Melkij

DBA для вашего PostgreSQL?

1913

вклад
3

вопроса
2065

ответов
46%

решений

Комментарии

Как понять, что влияет на скорость выполнения запроса с массивом?

Melkij @Melkij

explain (analyze,buffers,verbose) лучше. И лучше с track_io_timing
Будет видно чего и как долго читали.

И смотреть какой процент строк попадает под фильтр, может индекс и не нужен, т.к. всё равно читаем почти всю таблицу.

Написано более трёх лет назад
Как запретить системе доступ к харддрайву?

Melkij @Melkij

купить hotswap корзинку и физически перетыкать диск. Это чтобы наверняка. Ну или тумблер на питание дисков врезать можно.

Написано более трёх лет назад
Как расширить файловую систему на RAID томе mdadm?

Melkij @Melkij

Да, можно. Так массив в общем-то и расширяется, наживую переписывать таблицу разделов как раз лучше не надо, но можно. Добавляемый том в массиве должен быть не меньше Used Dev Size (mdadm -D /dev/md0), больше - на здоровье. Лишнее место использоваться только до --grow --size=max никак не будет.

Написано более трёх лет назад
Как расширить файловую систему на RAID томе mdadm?

Melkij @Melkij

Для плановой замены на более большие диски вероятно лучше подойдёт вот это сочинение: https://ru.stackoverflow.com/a/637847/203622
Обычно не проблема одновременно воткнуть все 4 диска.

Написано более трёх лет назад
Как конвертировать/сохранить Unicode в UTF8?

Melkij @Melkij

См. sql-инъекции. Обновлённая версия вопроса - как раз про это и это является настоящей причиной наблюдаемого поведения.

Написано более трёх лет назад
MySQL максимальный размер varchar - 255. При создании я указал длину 9000. И поместил туда текст такой длины. И он сохранился. Почему не обрезался?

Melkij @Melkij

Также учитывайте, что текст свыше 255 символов занимает L+2 байта.

И внимание на многобайтовые кодировки.
Число в скобках у varchar - число символов. Предел же в 64 килоБАЙТа. Что далеко не всегда одно и то же. Для utf8mb4 вы гипотетически сможете записать от 16к до 65к символов - в зависимости от того, что именно пишете.

Ну и конкретно для varchar важнейшая деталь - 64кб - это не его предельный размер. Это hardcoded лимит на размер одной строки таблицы, включающий в себя все колонки этой таблицы. Невозможно иметь два varchar по 40кб

Написано более трёх лет назад
Как получить список чисел отсутвующих в базе PostgreSQL?

Melkij @Melkij

И опять вы про какую-то другую СУБД.

если есть то какого типа (уникальный, кластерный)?

primary key, btree.

есть много свободной оперативки для построения хэш таблицы.

Не учитывается планировщиком. Есть work_mem - влезаем - берём его. Нет делаем disksort. Дисковой сортировки не было. hash join вовсе не умеет temp files и всегда в памяти. Если планировщик считает, что не влезет в work_mem - то предпочитает другой план.

Написано более трёх лет назад
Как получить список чисел отсутвующих в базе PostgreSQL?

Melkij @Melkij

Руслан, вы про какую-то другую СУБД. Нет в postgresql никакого tempdb, тем более разделяемого по кластеру между пользователями в оперативке. work_mem выделяется динамически в приватной памяти каждого отдельного backend под каждый отдельный того требующий узел плана запроса.

быстрее чем с диском (хотя если диск SSD то разница не сильно большая).

О да, разница всего лишь порядками измеряется.

Выше я забыл дописать - 100% cache hit по shared buffers. С дисков не читалось ничего и not in оказался всё равно в полтора раза быстрее. Потому что миллион index lookup всё равно имеют свою цену. И это на index only scan, т.е. для проверки mvcc мы страницы таблички не поднимали.
Запрос с except у меня получается посередине по скорости. А чисто алгоритмически - сюда бы неплохо merge join встал, о чём уже упоминал. Одну табличку читать по индексу уже отсортированную, опорную последовательность мы заранее может гарантировать последовательность значений. То есть на сортировку ресурсов не тратим вовсе.

Написано более трёх лет назад
Как получить список чисел отсутвующих в базе PostgreSQL?

Melkij @Melkij

Руслан, not in на моей тестовой 9.6 с 1млн строк скатывается в hashed SubPlan и работает в полтора раза быстрее not exists nested loops. От распределения данных зависеть будет, тестировал на 0,2% пропущенных значений. И это ещё на Index Only Scan.

Быстрее может быть нарисовать merge join на plpgsql - зная, что вычитывать на самом деле надо только одну табличку прикрутить сбоку итератор и выплёвывать числа если следующий id из цикла по табличке прилетел не +1 от предыдущего. Но тоже проверять нужно, plpgsql как числодробилка ни о чём.

Написано более трёх лет назад
Как получить список чисел отсутвующих в базе PostgreSQL?

Melkij @Melkij

not exists для небольших диапазонов. Вычитывать целиком всю таблицу - смотреть план. Всё равно быстро это не будет.

Написано более трёх лет назад
Как получить список чисел отсутвующих в базе PostgreSQL?

Melkij @Melkij

По результату - да. По плану выполнения - различны.

Написано более трёх лет назад
Почему не могу выбрать пользователя в PostgreSQL?

Melkij @Melkij

Muchacho, replication - это для репликации. Вы разве настраиваете репликацию?

Написано более трёх лет назад
Сколько жетских дисков потребуется?

Melkij @Melkij

hx510b, так я вроде сразу написал: сначала требования к хранимке и бюджету, затем считать по прайсу сколько и каких дисков надо. Два диска по 10тб в зеркале вполне могут оказаться просто дешевле сами по себе, даже без учёта корзин, контроллеров и всего сопутствующего. Но если автор хочет именно дюжину дисков по 1тб - я могу только подивиться и пойти дальше.

Написано более трёх лет назад
Подойдут ли два монитора?

Melkij @Melkij

Ezhyg, ну не настолько давние же, pentium dual core с маркировкой Exxxx - это всего навсего 10 лет назад, видеоядра уже в чипсете массово были (но не во всех).

shamrockapple, да, G31 заявлено что умеет два монитора.

Написано более трёх лет назад
Почему в услугах хостинга отсутствует PostgreSQL?

Melkij @Melkij

И всё-таки postgres, не postgre.

Написано более трёх лет назад
Не могу достать много данных из базы данных?

Melkij @Melkij

Итерационно - возможно.
Итерационно для показа пользователю - да
через limit - да
offset - категорично нет. Если вы считаете, что 220к записей станет дешевле вычитывать через offset - вы не понимаете, как работает offset.

Необходимо взять последнюю полученную строку и запросить следующие 10к от неё отталкиваясь от нужного order by.

Написано более трёх лет назад
Не могу достать много данных из базы данных?

Melkij @Melkij

Смотрите реальную ошибку в логах. Если это dev машина, то удобнее будет включить вывод ошибок скриптов

Написано более трёх лет назад
Поврежден файл базы данных, кто ответственный?

Melkij @Melkij

Александр,
Ну так пусть восстановит файл из бэкапа

Например для postgresql это будет в корне неверное решение и ничего хорошего из этого не получится.
Сильно зависит от устройства конкретной СУБД, т.е. да - вопрос к DBA.

Написано более трёх лет назад
Где можно почитать подробно о API?

Melkij @Melkij

сложности со сложными условиями в следствии ограничений GET (в том числе и на длину в 255 символов).

это из какого RFC?
Интересуюсь потому, что в стандартах на http этого не находил, а лимиты сверху есть у конкретных реализаций: браузеров и веб-серверов.

Написано более трёх лет назад
Не запускается MYSQL в чем причина?

Melkij @Melkij

И что делали с базой перед этим тоже напишите.

Написано более трёх лет назад

Самые активные сегодня

CityCat4
- 5 ответов
- 0 вопросов
Drno
- 4 ответа
- 0 вопросов
bouslayeff
- 1 ответ
- 2 вопроса
Steel_Balls
- 2 ответа
- 0 вопросов
Komrus
- 2 ответа
- 0 вопросов
99insania99
- 2 ответа
- 0 вопросов