Sektantik, ты читать умеешь? Я уже молчу о том, что задача простейшая и ты не умеешь пользоваться поиском. А также ты не приложил ни единого усилия в виде жалких попыток кода. По этой причине твой вопрос вообще можно снести. Открой любой мануал по Beautiful soup, ещё раз повторяю. Готовый код тебе здесь никто писать не станет.
Это простейшая парсинг-задача. И подойдёт здесь любой мануал по работе с красивым супом (Beautiful soup. Либа такая. Ага.).
но не то что нужно
Разумеется, вы не найдёте код, который будет делать точь в точь, что вам нужно и нужно будет минимально подумать на алгоритмом серфинга, но любой нормальный мануал сложит представление о том, как это работает, а дальше дело за вашей головой. Удачи.
Kneepy, в таком случае, нет разницы на чём писать, кроме как писать на том, чем лучше владеете. Если оно вздумает "накрываться", то причиной будет не выбранный язык программирования.
Сводите кол-во запросов к минимуму. Кешируйте тем или иным образом то, что можно. Если есть тяжёлые запросы, возможно, точностью их содержания можно пренебречь в угоду производительности, закешировав на некоторое время. Сложно говорить абстракциями, чтобы что-то советовать и это лишено смысла. Здесь нужно говорить предметно, а для этого вам нужно изучить узкие места, а не базироваться на "мне кажется, что...".
Безопасность - это отдельная область знаний. Изучите самые распространённые типы атак и способы защиты от них. Простая истина – это никогда не доверять пользователю. Набор юного джентельмена – это эскейпить весь вывод html, а sql запросы, с введёнными пользователем данными, делать с использованием подготовленных выражений.
А чем nodejs принципиально отличен от php? Спрашивать ajax или react вовсе - некорректно. Сначала сделайте, чтобы просто работало. Понимание правильно и безопасно придёт года через три. Не бегите впереди паровоза.
Когда у сервера спрашивают то, чего у него нет, он отдаёт (не всегда, но, если настроен с учётом рекомендаций) 404 код ответа. При этом неважно что на нём хостится: одностраничный сайт, трёхстраничный сайт, или вовсе не сайт. Я ответил на ваш вопрос?
Владислав, написано же, что заказчику будет предпочтительнее, если парсер будет запускаться демоном, а не кроном. Не надо никакую программу-враппер для этого писать.