Работа с большим объемом данных node mysql?

Question

Sratimon1 @Sratimon1

Работа с большим объемом данных node mysql?

Задача поставлена просто, получаем от клиента одним куском 50 000 +- номеров. Проверяем есть ли они в БД и если нету то записываем. БД будет хранить по началу 10 000 000 записей каждая примерно 200 байт. Так же клиент может запросить эти 50 000 номеров. Номер уникален.
Использую node + express база mysql. ОРМ sequelize.
Вопрос в скорости выполнения этих операций. И правильной реализации.
1) Я получаю массив объектов от пользователя далее по этому массиву делаю выборку данных из mySql, нахожу номера которых нету и записываю их в бд.
Есть ли возможность составить такой SQL если нету номера то записать его, после этого вернуть id номеров ? Или есть другие предложения как сделать это быстрее ?
2) Если держать номера в оперативе, это будет быстрее, но как это реализовать ?
Просто получить ответ от бд и записать его в переменную, но при обновлении базы надо будет снова делать выбору по все базе, информация будет часто меняться.
3) Использовать что то кроме mysql. Тогда какие варианты можете предложить ?
В идеале мне надо держать одну таблицу постоянно в оперативе т.к по ней будет основная выборка / запись данных.
4) Ваши варианты. Заказчик не чем не ограничивает. В данный момент есть VPS с i7-6700 и 32gb RAM.
P.s Изучаю web в общем 9 месяцев (была база в программирование С++, C++ qt, С#). Но с БД в таких объемах не работал. В поисковике в основном лайтовые статьи для новичков. Либо серьезные ребята объясняют серьезные вещи и я не вывожу. В общем прошу помочь , кто чем сможет.

Вопрос задан более трёх лет назад
383 просмотра

Комментировать

Подписаться 2 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Академия Эдюсон

Fullstack-разработчик на JavaScript + ИИ

11 месяцев

Далее
ProductStar × РБК

Профессия: Инженер по тестированию + ИИ

6 месяцев

Далее

Решения вопроса 1

3 комментария

Sratimon1 @Sratimon1 Автор вопроса

INSERT IGNORE очень сильно помог, спасибо. Время сократилось с 20-60 сек до 100 мили секунд.
Но теперь следующий вопрос. Мне надо получить id этих записей. И сразу проблема с выборкой данных. Каким образом можно получить 50 000 записей из бд ?
WHERE number = 5 OR number = 8 OR number = 123 пробовал вот так но
при 1 000 53.115ms
при 10 000 278.887ms
при 50 000 слишком долго или что то пошло не так (5 минут нету ответа)
Индексы по number сделал.

Написано более трёх лет назад
Александр Кузнецов @DarkRaven

Sratimon1, как получить ID можно прочитать вот тут - How can I Insert many rows into a MySQL table and .... На словах, innodb гарантирует непрерывное нарастание AutoIncrement, и получив LAST_INSERT_ID и количество строк, можно получить все ID.

INSERT IGNORE очень сильно помог, спасибо

Очень аккуратно с этой штукой, если что-то поменяется в поле, можно свежую запись потерять, оставив старую.

Каким образом можно получить 50 000 записей из бд ?

Это выгрузка? Если нужно просто получить 50000 записей - берете и читаете, лучше всего фоном. Я делал выгрузку ~ 50000 номенклатур из MySQL, но язык PHP. Строил excel. Сделал так - последовательно запускал фоновый процесс N раз, который выгружал следующие 5000 записей и строил по ним Excel. Процесс возвращал путь к файлу. Потом по полученному массиву имен файлов строил соответствующий Zip-архив с файлами и отдавал клиенту.

В вашем случае можно и не бить, запустить процесс выгрузки, тот, когда закончит, куда-то сохранит ссылку на скачивание файла. Как-то так.

Написано более трёх лет назад
Алексей Лауд @kshshe

WHERE number = 5 OR number = 8 OR number = 123

Если нельзя избавиться от индекса по number (например, сделать WHERE person_id=3), то эту конструкцию лучше заменить на
WHERE number IN (5, 8, 123)

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 2

5 комментариев

Sratimon1 @Sratimon1 Автор вопроса

Я знаю про облачные сервисы, но не в этот раз. Ну по крайней мере я надеюсь )))
Это на разбираться в API подключать это все к node переделывать уже настроенную авторизацию с регистрацией.
Лучше скажите как выбрать из бд 50 000 номеров ? ))
кроме WHERE number = 5 OR number = 8 OR number = 123 не чего в голову не пришло.
Индексацию number сделал. Но все ровно долго.
при 1 000 53.115ms
при 10 000 278.887ms отличный результат
при 50 000 не дождался почему то. Тут должно быть (1 - 1.5с )

Написано более трёх лет назад
Виталий Инчин ☢ @In4in

Быстрее только Полнотекстовый поиск https://habr.com/post/40218/

Написано более трёх лет назад
abbaboka @abbaboka

Зачем нужен полнотекстовый поиск, если в задаче поиск по полному совпадению?

Написано более трёх лет назад
Виталий Инчин ☢ @In4in

abbaboka, пере-организовать структуру для полнотекстового поиска - пособ, получить скорость более высокую, чем просто прямая выборка по заранее проиндексированым колонкам. На деле это так, хоть и лютый геморрой. Адекватное решение я предложил в ответе.

Написано более трёх лет назад
abbaboka @abbaboka

Виталий Инчин ☢,
пере-организовать структуру для полнотекстового поиска - пособ, получить скорость более высокую, чем просто прямая выборка по заранее проиндексированым колонкам

нет.
вы неверно поняли статью и задачу.
сличение с шаблоном действительно медленнее полнотекстового (хотя, кстати, полнотекстовый есть и встроенный в MySQL), но здесь не нужно сличения с шаблоном.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+2 ещё

Сложный
Как заставить библиотеку docs js нарисовать бордер при переносе таблицы?
- 1 подписчик
- 10 июл.
- 79 просмотров
1

ответ
Node.js

Простой
Как сохранить картинку на сервере, переданную пользователем на сервер node js сокетом?
- 1 подписчик
- 01 июл.
- 101 просмотр
2

ответа
JavaScript

+2 ещё

Простой
Как подстраивать размер канваса под размер страницы?
- 1 подписчик
- 01 июл.
- 111 просмотров
0

ответов
JavaScript

+2 ещё

Простой
Не работает тень + слайдер, есть варианты?
- 2 подписчика
- 21 июн.
- 196 просмотров
1

ответ
JavaScript

Средний
Значение переменной в строку или сохранение в VK?
- 1 подписчик
- 10 июн.
- 149 просмотров
2

ответа
JavaScript

+1 ещё

Сложный
Как сделать логику post запроса покупки товара, если 1 товара не хватает — отменить покупку?
- 2 подписчика
- 10 июн.
- 226 просмотров
1

ответ
JavaScript

Средний
Как правильно вывести данные из функции в див?
- 2 подписчика
- 08 июн.
- 178 просмотров
3

ответа
JavaScript

Средний
Как перемножить значения из текстовых полей?
- 2 подписчика
- 31 мая
- 398 просмотров
1

ответ
JavaScript

+2 ещё

Средний
Стоит ли переносить логику работающего онлайн-калькулятора с JS на PHP ради защиты формул от копирования?
- 3 подписчика
- 18 мая
- 2462 просмотра
8

ответов
JavaScript

Простой
Почему вместо галереи owl-gallery белое пространство?
- 1 подписчик
- 18 мая
- 102 просмотра
1

ответ
Показать ещё Загружается…

Answer 1 · 2018-09-12 06:21:42

Вы не смотрели на 13.2.5.2 INSERT ... ON DUPLICATE KEY UPDATE Syntax ?

Можно вставлять записи и на конфликте вставки будет делаться UPDATE. Для 50k записей вычислять те, которых нет без предварительной загрузки их БД, как мне известно - не самый быстрый вариант.

Еще вариант, - можно, залить из в буферную (отдельная таблица для входящих данный, каждая пачка которой характеризуется уникальным идентификатором) или временную таблицу и потом обработать их уже на уровне БД, хранимыми процедурами или просто запросами, но вряд ли будет меньше операций, чем в первом случае.

UPD. Забыл написать - можно вставлять пачками, подобным образом:

INSERT INTO table (a,b,c) VALUES (1,2,3),(4,5,6)
ON DUPLICATE KEY UPDATE c=VALUES(a)+VALUES(b);

Answer 2 · 2018-09-12 07:44:04

Виталий Инчин ☢ @In4in

°•× JavaScript Developer ^_^ ×•°

Возможно, стоит просто присмотреться присмотреться к Elastic'у

Ответ написан более трёх лет назад

5 комментариев

Answer 3 · 2018-09-12 10:26:45

Про INSERT ... ON DUPLICATE KEY UPDATE вам уже сказали. И это правильно.
Если у вас номер телефона в таблице уникальное поле и при этом не изменяемое - я бы рассмотрел вариант сделать его primary key в этой таблице.
Делать выборку по принципу select * from table where phone in (5,8,123)

Работа с большим объемом данных node mysql?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт