Ответы пользователя Akina по тегу «Базы данных»

Как сделать уменьшение склада в СУБД безопасными правильным?

Akina @Akina

Сетевой и системный админ, SQL-программист.

Скорее этот вопрос задан с целю, понять как правильно делать подобные простые счетчики.

Правильно - это выполнение операции в одном запросе. В вашем случае это будет

UPDATE warehouse 
SET balance = balance - 1 
WHERE product_id = 5
  AND balance > 0;

Такая одиночная форма запроса, во-первых, гарантирует, что при обновлении будет использовано строго то значение, которое прочитано (т.е. никто не влезет между чтением старого значения и записью нового), во-вторых, не даст "уйти в минус".

Если процедура не укладывается в один запрос, то выполняющие операцию запросы должны оформляться в транзакцию. С подбором правильного уровня изоляции, который исключит нежелательные интерференции и искажение данных. Есть и упрощённый способ - это использование блокировок. Но там слишком много сложностей, и слишком много надо учитывать, да и на производительности сказывается совсем не лучшим образом.

Можно (хоть и нежелательно) это делать и "на ручной тяге". Например, если вы хотите всё же использовать трёхзапросную форму, как в вопросе, то (схематично) будет что-то вроде

SET @balance = (SELECT balance FROM warehouse WHERE product_id = 5);
SET @new_balance = @balance - 1;
UPDATE warehouse 
    SET balance = @new_balance  
    WHERE product_id = 5
      AND balance = @balance;

Обратите внимание на дополнительное условие в последнем запросе. Оно проверяет, что с момента запроса старого значения и до попытки записать новое никто не внёс изменений в данные. Если же кто-то подсуетился и успел, то последний запрос обновит ноль записей, что и будет маркером, что операция корректировки баланса неудачна и надо повторить попытку (впрочем, ноль получится и в случае, если кто-то удалит запись для этого продукта - тогда никакие повторения не помогут).

Ответ написан 15 окт.

1 комментарий

Какие есть утилиты для автоматизированного проектирования БД?

Akina @Akina

Сетевой и системный админ, SQL-программист.

Какие есть утилиты для автоматизированного проектирования БД?

Зависит от того что понимать под термином "Проектирование БД".

Классически ПБД - это начальный этап создания БД, включающий описание предметной области, анализ предметной области и построение ERD диаграммы (схемы БД). И если ориентироваться на это определение, то никаких утилит автоматизированного ПБД на настоящий момент не существует в принципе.

Возможно, в какой-то близкой перспективе до этого дошагают средства ИИ, но мне как-то сомнительно.

=========================

Но, поскольку вопрос учебный, то скорее всего имеются в виду средства, которые позволяют нарисовать ERD по выполненному анализу, а потом на основе построенной диаграммы сгенерировать SQL-код создания структуры БД. Если так, то товарищи уже накидали вариантов. Впрочем, следует отметить, что в случаях, когда выполненный анализ и выбранная архитектура/реализация требует существования в БД таких типов объектов, как, например, триггеры, хранимые процедуры, эвенты и пр., ни одно из уже перечисленных средств не справится.

Но вот хрен знает, что на самом деле в мозгу у вашего препода.

Ответ написан 02 апр.

3 комментария

Когда каскадное обновление это плохо?

Akina @Akina

Сетевой и системный админ, SQL-программист.

Когда каскадное обновление это плохо?

Каскадное обновление - в большинстве случаев это... глупо.

Вспомним, что это вообще такое.

Имеется связь, реализованная внешним ключом. Некое поле (в общем случае - выражение) основной таблицы, уникально индексированное, является значением, на которое ссылается некое поле (или выражение) подчинённой таблицы (возможно, и той же самой).

По смыслу в основной таблице это поле - как минимум уникально. То есть с точностью до NULL оно является идентифицирующим - то есть если в этом поле не NULL, то определённое значение однозначно идентифицирует строго одну запись. В большинстве случаев же поле в основной таблице, на которое установлена ссылка в подчинённой таблице, вообще является первичным ключом, соответственно не может быть NULL и является истинно идентифицирующим.

Что же есть каскадное обновление? Это изменение связанного значения в подчинённой таблице, если изменяется значение основной таблицы. Ну то есть если изменяется (вспоминаем сказанное выше) значение первичного ключа или поля, объявленного уникальным. В основной таблице. Ага...

Ну то, что изменение/корректировка значения поля первичного ключа есть bad practice (читай - дурь голимая), хорошо известно, обосновано и весьма логично. Нет, реально возможны ситуации, когда такая операция оправдана и имеет смысл - но такая ситуация абсолютно всегда одноразовая, и есть составная часть административного обслуживания. А если подобная надобность возникла на уровне пользователя, в рабочем процессе - то это гарантия наличия серьёзной ошибки в проектировании БД.

Практически всё то же относится и к корректировке просто уникального поля. За исключением случая, когда выполняется каскадное изменение значения поля, которое в основной таблице получило значение NULL. То есть когда выполняемая операция по смыслу является не обновлением, а "мягким удалением" основной записи с каскадным удалением всех подчинённых. Правда, на вопрос, как отличить мягко каскадно-удалённые подчинённые записи от мягко явно-удалённых, и как определить, с какой основной записью была связана мягко удалённая подчинённая, не залезая в журнал или бэкап, ответа никто не даст. А получается, что даже в случае исключения всё делается через "универсальный интерфейс", то есть косяк в проектировании структуры имеется и в этом случае.

Резюмирую. Если каскадное обновление необходимо, оно скорее всего маскирует недостатки и ошибки проектирования. А плохо это или хорошо - прикрывать дырку костылём,- решайте сами.

Ответ написан более года назад

Комментировать

Можно ли такое реализовать с помощью MySQL?

Akina @Akina

Сетевой и системный админ, SQL-программист.

В рамках реляционной СУБД для описанной схемы есть несколько принципиально разных подходов.

Первый - одна таблица и NULL в полях, отсутствующих у конкретного типа, её описывает Сергей Соловьев, вариант 2.
Второй - использование EAV. Удобно, динамично, но проблемы с производительностью. Хотя из всех паттернов для реляционных СУБД он походу наиболее применим для фасетного поиска.
Третий - использование сериализованного формата хранения. Например, хранение свойств объекта в формате JSON. Но, поскольку требуется поиск по атрибутам, в этом случае необходимо будет использовать внешний поисковый движок, возможно, даже ориентированный на фасетный поиск, или будет ужас как медленно.

Использование MongoDB на описанном материале (буквально пара типов объектов) мне кажется не очень соответствующим решением. Хотя зависит от планируемого объёма данных.

Ответ написан более года назад

Комментировать

На сколько популярно и корректно хранить данные в столбце в виде JSON строки?

Akina @Akina

Сетевой и системный админ, SQL-программист.

На сколько популярно и корректно хранить данные в столбце в виде JSON строки?

А это зависит от того, что с этими данными делать.

Если сохранить/вернуть - да, вполне.
Если найти по фрагменту - 50/50, и зависит в основном инструментов, имеющихся в конкретной СУБД.
Если выполнить более сложную обработку (сумма, в т.ч. с накоплением, среднее, медиана и пр.) - скорее нет.
Если использовать для связывания по фрагменту - почти наверняка нет.

Ответ написан более года назад

Комментировать

Как правильно построить запрос в БД?

Akina @Akina

Сетевой и системный админ, SQL-программист.

SELECT table1.*, 
       EXISTS ( SELECT NULL
                FROM table2
                WHERE table2.table1_id = table1.id
                   AND table2.date = @needed_date
                ) AS row_exists
FROM table1

Если точная дата внутри месяца неизвестна, то

WHERE table2.date BETWEEN @needed_month_1st_day AND @needed_month_last_day

Ответ написан более двух лет назад

Комментировать

Как в базе данных хранить информацию о нескольких периодах?

Akina @Akina

Сетевой и системный админ, SQL-программист.

Ну вариант первый - это просто хранить данные за день, а всякие укрупнения считать в момент необходимости.

Вариант соответственно второй - считать все укрупнёнки в момент записи текущих данных. Удалять/чистить лучше отдельной эвент-процедурой, если старая укрупнёнка недельку полежит, никто не помрёт. Вопрос отдельных таблиц под разные укрупнёнки - только если их структура различна в зависимости от периода, иначе одна таблица и поле маркер - диапазон периода записи.

Ответ написан более двух лет назад

2 комментария

Как получать данные из формы на сайте в разные таблицы БД?

Akina @Akina

Сетевой и системный админ, SQL-программист.

При добавлении набора данных в связанные таблицы (а по большому счёту - вообще всегда) следует забыть о существовании INSERT .. VALUES и пользоваться исключительно INSERT .. SELECT. Первый запрос вставляет запись в основную таблицу, второй вставляет в зависимую, получая необходимое для связывания значение из основной по известным критериям отбора (по только что вставленным значениям, либо, в случае MySQL, из LAST_INSERT_ID).

Ответ написан более двух лет назад

Комментировать

Почему SQL запрос неправильный?

Akina @Akina

Сетевой и системный админ, SQL-программист.

SELECT good,                      -- выбрать идентификатор товара
       amount * unit_price AS `sum` -- и потраченную на него сумму
FROM Payments 
ORDER BY `sum` DESC;                -- отсортировать по убыванию суммы

Ответ написан более двух лет назад

Комментировать

"Incorrect syntax near '18'. Unclosed quotation mark after the character string ')'." что с этим делать?

Akina @Akina

Сетевой и системный админ, SQL-программист.

$" Values(N'{NAZVD.Text}', N'{SLOZHD}', '{dateTimePicker2.Value.ToString("yyyy/MM/dd")}, N'{comboBox1.SelectedValue}', N'{VIDD.Text}')";
           ^---- 1 -----^   ^--- 2 --^  ^----------------------- 3 -----------------------^                         ^-4-^           ^----- ???

Ответ написан более двух лет назад

1 комментарий

Как быстрее подсчитать пересечение в таблице?

Akina @Akina

Сетевой и системный админ, SQL-программист.

Пример реализации "влоб" (синтаксис MySQL).

Структура:

CREATE TABLE test ( word0 VARCHAR(255),
                    word1 VARCHAR(255),
                    word2 VARCHAR(255),
                    word3 VARCHAR(255)
);

Запрос:

WITH 
cte1 AS (
    SELECT *, ROW_NUMBER() OVER () identity
    FROM test
),
cte2 AS (
    SELECT word0 word, identity FROM cte1 UNION ALL
    SELECT word1 word, identity FROM cte1 UNION ALL
    SELECT word2 word, identity FROM cte1 UNION ALL
    SELECT word3 word, identity FROM cte1 
)
SELECT LEAST(t1.word, t2.word), GREATEST(t1.word, t2.word), COUNT(DISTINCT identity)
FROM cte2 t1
JOIN cte2 t2 USING( identity )
WHERE t1.word > t2.word
GROUP BY 1, 2;

DEMO fiddle

Но надо чётко понимать что на заявленных объёмах запрос умрёт навсегда, вместе с сервером.

Для того, чтобы получить хоть сколько-нибудь вменяемое время обработки, надо, во-первых, выполнить нормализацию (преобразование, которое выполняют оба CTE) в статическую проиндексированную таблицу, во-вторых, получать данные не для всего массива сразу, а для достаточно узкого набора слов.

Ответ написан более трёх лет назад

Комментировать

Как реализовать алгоритм экспайринга элементов в базе данных?

Akina @Akina

Сетевой и системный админ, SQL-программист.

По-моему, ты накрутил сверх меры. Всё решается куда проще.

Структура таблицы, максимально упрощённая:

CREATE TABLE tasks (
    id PRIMARY KEY,
    definition,
    performer_id REFERENCES performer (id)
    expired_at DATETIME
);

Взятие (параметры - id обработчика и id задачи):

UPDATE tasks
SET performer_id = @performer_idб
    expired_at  = NOW() + INTERVAL 'performing time'
WHERE ( expired_at IS NULL or expired_at < NOW() )
  AND ( id = @task_id )

То есть, задачу можно взять, если её ещё никто не брал, или если время ожидания ответа на задачу истекло. И в качестве бонуса - видно, что либо задачу никто не брал, либо кто-то брал (только последний, если таких было несколько) и прогавал сроки.

performing time может либо поставляться снаружи как параметр, либо быть свойством задачи (с соотв. полем в структуре таблицы).

Ответ написан более трёх лет назад

8 комментариев

Как выбрать дату последней транзакции (чтоб эта транзакция была 7 дней назад)?

Akina @Akina

Сетевой и системный админ, SQL-программист.

SELECT id AS servie_id,
       name AS servie_name,
       MAX(TO_TIMESTAMP(created_at))::DATE AS last_trans_date
FROM services
GROUP BY 1,2
HAVING last_trans_date <= CURRENT_DATE - INTERVAL '7 day'

Ответ написан более трёх лет назад

Комментировать

Какие ограничения несёт в себе INSERT IGNORE для секционированных таблиц?

Akina @Akina

Сетевой и системный админ, SQL-программист.

INSERT INTO может привести к ошибке. По любой причине. При этом процесс вставки прерывается, а все уже внесённые в таблицы изменения - откатываются.

INSERT IGNORE преобразует ошибку в предупреждение. При этом выполнение запроса продолжается, а запись, попытка вставки которой привела к ошибке, не вставляется.

Замечание. Дублирование - не единственное событие, которое может вызвать ошибку. Может быть ещё куча причин (CHECK constraint, SIGNAL из триггера, нарушение внешнего ключа и т.п.). Причём далеко не все типы ошибок восстановимы и могут быть проигнорированы/преобразованы в предупреждение. Если ошибка невосстановимая (как правило, это системные или внешние ошибки) - запрос прерывается по ошибке и откатывается обычным образом.

Замечание 2. Всё вышеописанное никак не пересекается с секционированием. За исключением случая, когда значение поля не соответствует диапазону ни для одной из секций. В этом случае IGNORE срабатывает штатно - ошибка преобразуется в предупреждение, проблемная запись не вставляется.

Нужно игнорировать дублирующиеся данные. Буду делать INSERT IGNORE

Кроме INSERT IGNORE INTO есть ещё два типа запросов, которые обрабатывают ошибку дублирования данных - это INSERT .. ON DUPLICATE KEY UPDATE и REPLACE INTO. Изучите их - возможно, какой-то из них лучше подходит для Вашей конкретной задачи. При этом REPLACE не поддерживает модификатор IGNORE и не может игнорировать другие ошибки.

Ответ написан более трёх лет назад

2 комментария

Войдите на сайт