Ответы пользователя TheRonCronix — Хабр Q&A

Задать вопрос

Ответы

Почему valgrind показывает утечки при работе с libcurl?

TheRonCronix @TheRonCronix

Ну, я так понимаю, что в интернете уже искали. Там сказано, что создается глобальное состояние и его тоже нужно закрывать дполнительно помимо вызова curl_easy_cleanup.

+ см исходник https://github.com/curl/curl/blob/master/lib/easy.c Там как раз и видно, что curl_easy_init еще и глобальное состояние инициализирует если оно не инициализировано.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Возможно ли простым и быстрым запросом оставить только не-NULL значения из разных строк?

TheRonCronix @TheRonCronix

На вскидку FIRST_VALUE.
Что нужно понять - как хочется выстроить зависимость между строками: как разбить на группы и какое значение взять в каждой из групп. Ведь таблица - это по-умолчанию неупорядоченое множество.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как автоматизировать выполнение sql скрипта(vertica)?
TheRonCronix @TheRonCronix
Залить csv это хорошая идея.
Эффект limit можно достичь аналитическими функциями, e.g.

select * from ( select ROW_NUMBER() OVER (PARTITION BY t.city) as limit_num, t.city t. ... from ( select city, ... from my_table m join cities c on c.city = m.city ) as t ) tt where tt.limit_num <= 1000;

Ответ написан более трёх лет назад

3 комментария
3 комментария
Как отладить запрос к Postgresql?

TheRonCronix @TheRonCronix

1. Может быть bloating таблицы из-за изменений/удалений/втавок. Давно ли делался VACUUM, настроен ли AUTOVACUUM ?
2. Для выборки малого количества строк из таблицы полезно создать b-tree index на поле, по которому происходит фильтрация.
3. Выполняется ли периодический сбор статистики на таблице командой ANALYZE ( по плану отфильтровано 3586078 строк а выбрано ~3000, а выпишете о 10 млн) ? Неверная статистика - прямой путь к неоптимальному плану выполнения.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как развернуть значения колонки таблицы в одно поле в PL/SQL?

TheRonCronix @TheRonCronix

Как вы указали listagg не подойдет из-за большой длины списка значений. По сути логика за этим такая: нет смысла показывать пользователю гигантский список значений. Обычно я делал неполный вывод с <...> в конце, если все значения не уместились в список (listagg тут не подойдет, нужна хранимка). При этом в список можно провалиться и получить уже полный список с постраничным разбиением в виде таблицы.
Если речь про автоматическую обработку приложением, то агрегация на стороне сервера, наверно, не подойдет в качестве решения. Также можно посмотреть в сторону XMLAGG или может быть уже что-то для json есть.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Зачем нужен Docker простыми словами?

TheRonCronix @TheRonCronix

Докер позволяет собрать дистрибутив-образ приложения и легко запустить его. представьте, что у вас большой кластер машин, на которых работают ваши приложения, допустим, веб-сайт с бекэндом на микросервисах. Когда одна из машин ломается или выключается для обслуживания, ваши приложения с нее можно легко перенести и запустить на другой машине.
Докер дает определенную изоляцию среды исполнения вашего приложения, что позволяет абстрагироваться от того, где именно работает ваше приложение.
Таким образом повышается доступность вашего приложения.
В конечном итоге с поддержкой контейнеризации вы можете просто загрузить ваше приложение куда-то в облако и совершенно не беспокоиться о том, не упало ли оно, что там за дистрибутив ОС стоит и все ли нужные библиотеки установлены.

Ответ написан более трёх лет назад
Как убрать начальный слэш из результата выборки?

TheRonCronix @TheRonCronix

Функцией substr

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как составить многотабличный запрос без повторений?

TheRonCronix @TheRonCronix

Если очень хочется в одном запросе, то GROUP_CONCAT можно попробовать. Можно в виде json все собрать (пост и комменты). Но вообще лучше два раздельных запроса. Врят ли вам нужно все комменты к посту выбирать, если их 1000 или больше, а GROUP_CONCAT разбить на страницы не сможет.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какие индексы добавить в таблицу базы pgsql?

TheRonCronix @TheRonCronix

1. b-tree на channel_id и start кажется удачным.
2. Стоит учитывать распредление данных, но это если понимаете, как оно влияет. А так, просто возьмите да и потестируйте свои запросы на тестовой таблице.
3. Статистику не забудьте собрать.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как организовать поиск повторяющихся значений?

TheRonCronix @TheRonCronix

Как вариант:

select distinct DocumentNodeValue, DocumentTemplateName, PatientName, d1.DocumentID, d2.DocumentID
from
(
select DocumentNodeValue, DocumentTemplateName, PatientName, d1.DocumentID, d2.DocumentID, count(*) over(partition by DocumentNodeValue) as repeatitions
from
Patient
join Course on PatientRef = PatientID
join Document d1 on CourseRef = CourseID
join Document d2 on d1.DocumentID = d2.DocumentID
join DocumentTemplate on d1.DocumentTemplateRef = DocumentTemplateID
join DocumentNode on DocumentRef = d1.DocumentID
) as tt
where tt.repeatitions > 1;

Логика такая: разбить весь массив строк на группы по значениям из DocumentNodeValue. В каждой из групп посчитать количество строк. Выдать все строки из массива с подсчитанным количеством. Взять только строки попавшие в группы, в которых насчитано более 1 строки. + distinct на ваше усмотрение.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Order by distance. Как?

TheRonCronix @TheRonCronix

Посчитать можно, для этого придется пройтись по всем строкам таблицы и для каждой из точек высчитать расстояние до вашей точки, а потом отсортировать. Но, если нужно выбрать лишь несколько ближайших точек или просто точки не слишком удаленные от заданной, то можно воспользоваться техникой bounding-box: представить, что вокруг точки куб или квадрат заданного размера и провести вычисление сначала в границах куба. Это позволит хоть как-то задействовать индексы.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Есть ли разница в вариантах записи?

TheRonCronix @TheRonCronix

В приведенных примерах никакой разницы нет.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как настроить конфигурационные файлы в докер-контейнере( как апач, к примеру)?

TheRonCronix @TheRonCronix

Посмотрите про подключение volume (аргумент -v вроде бы при запуске командой docker run). Иначе данные у вас удалятся по завршении контейнера.
А путь в образе к приложению может отличаться от стандартного, к которому вы привыкли.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как можно быстро освободить память всех переменных в структуре?

TheRonCronix @TheRonCronix

Как вариант, если известен размер всех переменных сразу, выделять на них всех память единоразово. И освобождать соответсвенно так же. Или, если известна максимальная длина массива, то выделять опять же n*max_len за один раз.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как поделить таблицу SQL на N частей и выполнить на каждой вычисления?

TheRonCronix @TheRonCronix

Даю идею (синтаксис не проверял):

select mod(rn, N) part_number,
t1.*
from
(
select t.*,
row_number() over() rn
from table as t
) as t1

N - кол-во частей, table - ваша таблица.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какие виды индексов в каких ситуация лучше использовать в СУБД Oracle?

TheRonCronix @TheRonCronix

В oracle есть b-tree индексы, bitmap-индексы, и еще спецефические (fulltext search помоему, индекс на структурированный xml и может быть еще что-то).
b-tree это сбалансированное дерево высотой обычно не более 5 уровней с логарифмической скоростью доступа. Такой индекс хорош для поиска специфической строки в большой таблице или выборки небольшого объема данных с хорошей селективностью (не слишком много строк в таблице с искомым значением) из таблицы. Область применения - OLTP нагрузки и в DWH тоже полезен.
bitmap-индекс представляет собой таблицу, у которой в заголовках столбцов искомые значения, взятые из индексируемых столбцов индексируемой таблицы, а каждая строка представляет битовую маску: если значение в индексируемой таблице есть, то 1, иначе 0. Каждая строка в битмап-таблице соответсвует одной строке в индексируемой таблице. Такой индекс используется в основном в DWH для поиска по условиям вида (t.col1 = 'A' or t.col2 = 'B') and t.col3 = 'C'. Из такого условия легко собрать битовую маску и пройтись по битмап-индексу.
Можно также заметить, что если бы мы искали по b-tree индексу с условием or нам бы пришлось искать два раза. В то же время, b-tree позволяет искать по условию с неравенством t.col1 > 123 and t.col2 < 234, т.к. дерево отсортировано.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Какой select написать, чтобы база данных зависла?

TheRonCronix @TheRonCronix

СУБД рассчитаны на то, чтобы не зависеть от клиентского приложения. В большинстве случаев, если не пул соединений используется, то под каждого клиента создается свой процесс. Можно легко завесить свой клиентский процесс, но не чужие. Однако, можно попробовать замедлить работу СУБД, влияя на разделяемые ресуры, например, вытеснить из кэша разобранные запросы путем генерации множетсва отличающихся запросов. Не факт, что сработает. Или блокировать доступ к таблице или процедуре путем ее перекомпиляции. Чтобы СУБД реально зависла, для этого нужен баг в СУБД. Но такие ситуации очень индивидуальны. На моей практике был только один такой случай, когда запрос ронял всю СУБД.
Темой атак на СУБД я не занимался, но вопрос задали интересный.

Ответ написан более трёх лет назад

2 комментария

2 комментария
Какую тему взять по информационной безопасности, чтобы можно было использовать мат. статистику (в рамках диплома)?

TheRonCronix @TheRonCronix

Детекция аномалий в логах аудита на предмет несанкционированного доступа.

Ответ написан более трёх лет назад

5 комментариев

5 комментариев
Как получить из массива 5 случайных значений без повторений и записать их в одну переменную? [JAVA]?

TheRonCronix @TheRonCronix

В цикле от 1 до 5:
{
Выбирите индекс с случайным значением от 0 до shops.length-1.
Выберите значение из shops по этому индексу и сохраните/выведите куда-либо кда вам надо.
Удалите выбранный элемент из shops.
}

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как вычислить вхождение точек в полигон?

TheRonCronix @TheRonCronix

Идея следующая.
1. Обычно, полигон, если он не выпуклый, разбивают на выпуклые (на треугольники, проще говоря). Далее, любой полигон может быть представлен как пересечение трех и более полуплоскостей (смотря соклько сторон у вашего полигона).
2. Вы можете вычислить отношение точки к направленному вектору, т.е. с какой стороны полуплоскости лежит точка: слева или справа, с учетом напрвления вектора, делящего плоскость на две полуплоскости. Т.к. полигон это пересечение полуплоскостей, то определить, попадает ли в него точка, можно убедившись, что точка лежит во всех полуплоскостях образующих полигон.
3. Согласно вышесказанному, мы можем написать функцию, которая определяет, что точка лежит справа от вектора, образующего полуплоскость. Мы представим грани полигона векторами и будем обходить полигон по часовой стрелке, так что "справа от вектора" - это всегда полуплоскость, которая "внутри полигона". Пройдясь по всем граням-векторам и убедившись, что точка лежит "справа" от них всех, мы сделаем вывод, что точка лежит внутри полигона.
4. Отношение "справа/слева" вычисляется векторным произведением (если мне помять не изменяет).

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

rPman
- 3 ответа
- 0 вопросов
VoidVolker
- 3 ответа
- 0 вопросов
SmeliyR
- 0 ответов
- 2 вопроса
Drno
- 2 ответа
- 0 вопросов
Антон Антон
- 1 ответ
- 0 вопросов
Zettabyte
- 1 ответ
- 0 вопросов