Как организовать высоконагруженый проэкт на ноде?

Question

Coder321 @Coder321

Как организовать высоконагруженый проэкт на ноде?

Планируется проект на ноде у которого будет примерно 2-3 тис запросов в секунду. Каждый запрос будет отдавать какой то файл. Каждая отдача файла должна записываться в лог и в итоге собираться статистика для каждого файла. Как я вижу это:
будет маасив с 60-тью вложенеми массивами, каждый вложеный массив будет соответствовать одной секунде. В каждый из этих массивов будет пушится обьект со статистикой. При достижерии 60-го элемента массив будет отправлятся на запись в бд и обнулятся.
Так как ни когда не делал столь нагруженые проекты возникло несколько вопросов:
1. Правильна ли сама задумка? Если нет, то что можете предложить?
2. Какую бд использовать?
3. Правильно ли для хранения минуты использовать массив? Все таки если за эту минуту произойдет какой то сбой, то вся статистика за эту минуту потрется.
4. Что делать с таблицей минут, ведь она будет сильно разростаться?
5. Как имитировать 2-3 тысячи запросов для тестирования?
6. И на последок, какие можете дать советы для реализации такого проекта?

P.S. Для тех кто будет писать что нода не для отдачи статики, прихоть не моя. а заказчика.
P.S. Работал только с монгой и то на базово/среднем уровне.

Вопрос задан более трёх лет назад
496 просмотров

5 комментариев

Подписаться 2 Оценить 5 комментариев

Q2W @Q2W

А почему задачу не решает nginx с парсером его логов?

Написано более трёх лет назад
Coder321 @Coder321 Автор вопроса

Q2W: как я написал в P.S. это прихоть заказчика

Написано более трёх лет назад
Q2W @Q2W

Заказчик выбирает технологии? А вы там зачем нужны?

Если серьёзно: заказчик наверняка хочет чего-то такого, что nginx + парсер логов дать не могут по его мнению.
Вот этой-то инфы нам тут и не хватает.

Написано более трёх лет назад
Coder321 @Coder321 Автор вопроса

Q2W: Не понимаю зачем советовать то о чем я и так знаю? Вопрос по конретным технологиям и там о nginx речи не идет.

Написано более трёх лет назад
Q2W @Q2W

Чтобы на основании бОльшего кол-ва данных дать более качественный ответ.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Мидл фронтенд-разработчик

5 месяцев

Далее
Javascript.ru

Курс по Node.js

5 недель

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

3 комментария

Coder321 @Coder321 Автор вопроса

Статистика будет использоваться для построения разных графиков.

Написано более трёх лет назад
Falseclock @Falseclock

Coder321: слишком узкий ответ. Как часто, для кого, с какими целями, какой разрез, какого вида графики?

Написано более трёх лет назад
Coder321 @Coder321 Автор вопроса

Falseclock: Пока что информации о этом сам не имею, но думаю будут для каждого файла будет писаться статистика:
1. Количество закачек
2. Мредняя скорость
3. Минимальная скорость
4. Максимальная скорость
5. Время максимальной активности
Так же предполагаю что стата юудет отдаваться на фронт сокетами. Должна быть возможность смотреть инфу за конкретный час, несколько часов, день, неделю, месяц. Графиков должно быть штук 5-10, по их типу пока тоже информации много не имею

Написано более трёх лет назад

3 комментария

2 комментария

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Node.js

+1 ещё

Простой
Какие есть пакеты для генерации уникальных, числовых идентификаторов длиной 10 цифр?
- 1 подписчик
- 10 нояб.
- 258 просмотров
2

ответа
Node.js

+1 ещё

Простой
Перевод бэкенда с PHP на NodeJs?
- 1 подписчик
- 26 окт.
- 427 просмотров
3

ответа
Node.js

+4 ещё

Простой
Как решить ситуацию с импортом файлов во время сборки проекта?
- 1 подписчик
- 15 окт.
- 136 просмотров
0

ответов
Node.js

Средний
Как обойти «засыпание» хостинга для cron-задач Node Js приложения?
- 1 подписчик
- 17 сент.
- 128 просмотров
0

ответов
Node.js

Простой
Почему возникает ошибка при загрузке csv?
- 1 подписчик
- 10 сент.
- 98 просмотров
2

ответа
Node.js

+4 ещё

Простой
В чем разница между selenium, playwright и puppeteer?
- 3 подписчика
- 09 сент.
- 285 просмотров
2

ответа
Node.js

+1 ещё

Простой
NODE.JS – парсинг контента. При скачивании изображений получаю битые файлы. Как поправить?
- 1 подписчик
- 08 сент.
- 131 просмотр
1

ответ
Node.js

+3 ещё

Сложный
Как считывать данные с принтеров Canon?
- 2 подписчика
- 04 сент.
- 297 просмотров
1

ответ
JavaScript

+1 ещё

Простой
Почему не работает прокси в Axios на Electon JS (в файле preload.js)?
- 1 подписчик
- 04 сент.
- 84 просмотра
0

ответов
JavaScript

+1 ещё

Простой
Отправка формы html?
- 1 подписчик
- 03 сент.
- 206 просмотров
1

ответ
Показать ещё Загружается…

Full-Stack Developer (Angular & Node.js / NestJS)

IT ATLAS • Лимассол

от 3 500 до 6 000 €

Tech Lead Vue Frontend

Icons8

от 350 000 ₽

Frontend/Fullstack-разработчик (Middle)

Mish • Москва

от 1 200 до 1 400 ₽

А почему задачу не решает nginx с парсером его логов?
Q2W: как я написал в P.S. это прихоть заказчика
Заказчик выбирает технологии? А вы там зачем нужны?

Если серьёзно: заказчик наверняка хочет чего-то такого, что nginx + парсер логов дать не могут по его мнению.
Вот этой-то инфы нам тут и не хватает.
Q2W: Не понимаю зачем советовать то о чем я и так знаю? Вопрос по конретным технологиям и там о nginx речи не идет.
Чтобы на основании бОльшего кол-ва данных дать более качественный ответ.

Answer 1 · 2017-05-20 08:31:40

Не с той стороны подошли к архитектуре. При организации БД думать нужно в первую очередь не как хранить, а как потом использовать, а метод хранения сам отрисуется.
Кто, как, при каких обстоятельствах данные будет использовать?

Answer 2 · 2017-05-20 02:33:31

Денис Букреев @denisbookreev

2-3 тысячи в секунду?
Новая заведомо успешная соц.сеть?

Ответ написан более трёх лет назад

3 комментария

Answer 3 · 2017-05-20 10:22:07

lega @lega

В минтуте не всегда 60 секунд ;-P

Ответ написан более трёх лет назад

2 комментария

Answer 4 · 2017-05-20 11:18:27

Либо вы гарантированно сохраняете события но медленно их обрабатываете либо наоборот.
Для начала не усложняйте систему - попробуйте писать в лог на каждое событие, если скорости диска будет не хватать, изменить способ хранения, последовательно исключая то что тормозит (например файловую систему, при записи в файл реально происходит несколько операций, в т.ч. в разных частях диска).
upd: 16байт записи, дешевый ssd+ntfs:7674 rec/sec, старый hdd+ntfs:425 rec/sec

У лога есть отличная особенность - он пишется линейно (само собой я пока не рассматриваю инструменты его чтения, в нагруженной системе эти задачи придется решать, разделяя нагрузки по железу), даже для HDD iops в этому случае будут оптимальными (при монопольном использовании этого диска процессом само собой), так как будет работать встроенный буфер энергонезависимой памяти жесткого диска.

Если линейной скорости диска будет не хватать (в вашем случае само собой хватит, если конечно в лог вы не пишите многомегабайтовые записи) - ставьте несколько дисков, даже без RAIDа с чередованием (его можно реализовать самому, раскидывая сообщения лога по разным дискам по своей логике).

Еще, вместо попытки все реализовать в одной машине, можно поставить несколько (важно - с независимыми источниками энергии!), тогда можно будет использовать буферизацию уже в оперативной памяти этих машин, т.е. отсылайте записи лога сразу на несколько машин, и считайте что запись записана после получения более чем несколькими из них (не обязательно всеми),.. Вот тут можно воспользоваться готовыми инструментами.

Как организовать высоконагруженый проэкт на ноде?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт