аждая строка - число размером 2гб. Ограничение памяти 500мб
На вход дается число N
Шифрование осуществляется с помощью ключа, который генерируется на основе фиксированного набора параметров операционной системы. Эта история плохо работает в случае виртуальной машины, у которой при миграции между хостами гипервизора используемые параметры могут меняться
Model name: AMD Ryzen 5 1600
Model name: (VMWare*|Intel*|AMD*)
Да. Тестовый поиск (обычно) ищет по текстовым индексам из токенов. В грубом приближении
это очищенное представление документа. Как-то сведение всех слов к основе. Стемминг. Лемматизация.
Убирание всяких предлогов и шумящих символов. В данной задаче например тело поста после
такой обработки мало чем будет отличаться от тегов этого-же поста. Вот поэтому я и предложил
соединить пост и теги в один datarow.
Я-бы хотел уйти от джойна в данной задаче. Я по сути материализовал ваш join и теперь мне его
делать не нужно. Ведь алгоритмы текстового поиска найдут все мои теги так-же точно как и соединение.
Моя идея будет более понятна если представить что и пост и теги у нас лежат в Postgresql в поле
типа JSON.
Вопрос нормализации я предлагаю оставить пока за кадром. Ведь мы обсуждаем соц-сети
где исходные данные всегда денормализованы и поэтому нам не стоит бепокоиться о том
что не было гарантировано изначально.
Вообще здесь нормализаций это некий фетишь который мы конечно можем реализовать для
себя лишь на 5 минут и затем поняв что она не нужа - снова денормализуем для текстового поиска.