Задать вопрос

mayton2019

Bigdata Engineer

1382

вклад
26

вопросов
2788

ответов
19%

решений

Комментарии

Как вставить данные в две таблицы сразу?

mayton2019 @mayton2019

Ну ты автору написал банальности. Типа Волга впадает в Каспийское море. Ты ему расскажи как ошибку обработать. Может у него конфликт ключей лезет а он не видит.

Написано более трёх лет назад
Как вставить данные в две таблицы сразу?

mayton2019 @mayton2019

Ипатьев, я не знаю ну пусть выберет что нужно.

Написано более трёх лет назад
Как вставить данные в две таблицы сразу?

mayton2019 @mayton2019

Jastin, посмотри как тут делают https://www.mysqltutorial.org/php-mysql-transaction/

Написано более трёх лет назад
Почему список не заполняется?

mayton2019 @mayton2019

По какому принципу автор разделил локальное и глобальное здесь?
def create_cube(posit,scale):

Написано более трёх лет назад
Как вставить данные в две таблицы сразу?

mayton2019 @mayton2019

Егор, давайте автора подождем.

Написано более трёх лет назад
Как объединить поиск по тегам и названию поста в MySQL?

mayton2019 @mayton2019

Ипатьев, да не переживай так сильно. Просто у тебя один уровнь видения. Это реляционки.
А у меня - и реляционки и биг-дата.

Написано более трёх лет назад
Как узнать является ли число монотонным?

mayton2019 @mayton2019 Куратор тега Java

int? String?

Написано более трёх лет назад
Как эффективно и лаконично отсортировать файл из строк не вмещающихся в память?

mayton2019 @mayton2019

Напоминает radix сорт.

Написано более трёх лет назад
Как объединить поиск по тегам и названию поста в MySQL?

mayton2019 @mayton2019

Ипатьев,

Что такое "теги == токены" я не понял совсем.
"текстовый поиск" - это, как я понимаю, полнотекстовый поиск

Да. Тестовый поиск (обычно) ищет по текстовым индексам из токенов. В грубом приближении
это очищенное представление документа. Как-то сведение всех слов к основе. Стемминг. Лемматизация.
Убирание всяких предлогов и шумящих символов. В данной задаче например тело поста после
такой обработки мало чем будет отличаться от тегов этого-же поста. Вот поэтому я и предложил
соединить пост и теги в один datarow.

Затем через джойн, по первичному ключу, точно так же мгновенно находятся нужные посты

Я-бы хотел уйти от джойна в данной задаче. Я по сути материализовал ваш join и теперь мне его
делать не нужно. Ведь алгоритмы текстового поиска найдут все мои теги так-же точно как и соединение.
Моя идея будет более понятна если представить что и пост и теги у нас лежат в Postgresql в поле
типа JSON.

Вопрос нормализации я предлагаю оставить пока за кадром. Ведь мы обсуждаем соц-сети
где исходные данные всегда денормализованы и поэтому нам не стоит бепокоиться о том
что не было гарантировано изначально.

Вообще здесь нормализаций это некий фетишь который мы конечно можем реализовать для
себя лишь на 5 минут и затем поняв что она не нужа - снова денормализуем для текстового поиска.

Написано более трёх лет назад
Как эффективно и лаконично отсортировать файл из строк не вмещающихся в память?

mayton2019 @mayton2019

Adamos, надо подумать. Может быть у нас будет несколько алгоритмов.

Написано более трёх лет назад
Как объединить поиск по тегам и названию поста в MySQL?

mayton2019 @mayton2019

Ипатьев, теги == токены. Почему нет?

Написано более трёх лет назад
Как эффективно и лаконично отсортировать файл из строк не вмещающихся в память?

mayton2019 @mayton2019

Это - частный случай. Он базируется на предположении что первые 64Кб будут полезны для сортировки.
Но они могут полностью совпадать у всех 100% строк.

Написано более трёх лет назад
Как эффективно и лаконично отсортировать файл из строк не вмещающихся в память?

mayton2019 @mayton2019

mkone112, вот кусок задания

аждая строка - число размером 2гб. Ограничение памяти 500мб

здесь КМК неважно сколько там мегабайтов. Тот кто выдал задание хотел сказать что ожидает
streamable-подход к сортировке. Тоесть ничего в эти 500 мб вы не положите. Даже одна строка не влезет.
Поэтому вы и можете расчитывать только на поточные дисковые операции.

Написано более трёх лет назад
Как объединить поиск по тегам и названию поста в MySQL?

mayton2019 @mayton2019

Ипатьев, так всегда. Хочешь хороший текстовый поиск - денормализуй. А вы что предлагаете?

Написано более трёх лет назад
Как эффективно и лаконично отсортировать файл из строк не вмещающихся в память?

mayton2019 @mayton2019

я бы разбил файл на сортированные куски и слил бы их через merge sort.

это - правильное решение. Так эта задача и решается. Учитывая что тут каждая строка больше памяти - то делаешь все операции на диске. Сравнение строк - сравнение файлов.

Написано более трёх лет назад
Как узнать является ли число монотонным?

mayton2019 @mayton2019 Куратор тега Java

davidMSK, давай вернемся к моему первому вопросу

На вход дается число N

как ты себе это понимаешь с точки зрения программирования? Входные данные - это важный вопрос.

Написано более трёх лет назад
Как узнать является ли число монотонным?

mayton2019 @mayton2019 Куратор тега Java

davidMSK, эта задача решаема только в рамках десятичной системы счисления. Как-бы мы ее не решали и какие изобретения бы не придумывали - всё сводится к разложению двоичного числа на разряды десятички. Посмотри как реализован Integer.parseInt. Вот внутри него есть то что тебе нужно.

Написано более трёх лет назад
Как узнать является ли число монотонным?

mayton2019 @mayton2019 Куратор тега Java

Можно число преобразовать строку. Тогда монтонность проще доказывается. Или если "вход" изначально строковый тогда все проще.

Написано более трёх лет назад
Как поставить уведомление об изменении числа на сайте в тг?

mayton2019 @mayton2019

Автор хочет сам написать код или ищет коробочное решение которое это сделает?

Написано более трёх лет назад
Предложения по лицензированию ПО на ВМ?

mayton2019 @mayton2019

Lil_BowlLeen, я говорю сверка лицензии должна быть толерантнее к изменениям.

Написано более трёх лет назад

Самые активные сегодня

Константин
- 3 ответа
- 0 вопросов
Вячеслав Васильев
- 2 ответа
- 0 вопросов
anon1986
- 0 ответов
- 2 вопроса
hawkyh
- 2 ответа
- 0 вопросов
vkvk
- 2 ответа
- 0 вопросов
dom12
- 0 ответов
- 1 вопрос

Войдите на сайт