Как лучше делать выборку?

Question

seowin555 @seowin555

PHP

Как лучше делать выборку?

Задача следующая - нужно максимально быстро и безопасно в плане нагрузки генерировать большое количество (около 1 млн.) html файлов на лету и сохранять их на диск.

Файлы генерируются на основе шаблона и строк текста. По 30-50 строк на файл.

Вопрос: откуда лучше делать выборку этих строк (можно подряд идущих) из БД или же из txt файла, чтобы скорость выборки и генерации была наиболее высокой и от нагрузки не падал сервер?

При генерации каждого файла - идет новая выборка этих 30-50 строк.

Вопрос задан более трёх лет назад
154 просмотра

1 комментарий

Подписаться 2 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Skillbox

Веб-разработчик на PHP

9 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

Язык программирования PHP

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 4

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Простой
Как вызвать curl и не ждать ответ?
- 1 подписчик
- вчера
- 240 просмотров
2

ответа
PHP

Простой
Как сделать это?
- 1 подписчик
- 11 дек.
- 250 просмотров
2

ответа
PHP

+1 ещё

Простой
Как найти значение в XML?
- 2 подписчика
- 06 дек.
- 237 просмотров
1

ответ
PHP

+1 ещё

Простой
Как на PHP пушнуть в ассоциативный массив?
- 1 подписчик
- 05 дек.
- 219 просмотров
1

ответ
PHP

Простой
Проблема с PDO LIKE?
- 1 подписчик
- 04 дек.
- 175 просмотров
0

ответов
PHP

Простой
При попытке регистрации на сайте выдаёт ошибку A PHP Error was encountered. Что делать?
- 1 подписчик
- 03 дек.
- 153 просмотра
2

ответа
PHP

Простой
Как исправить include в php 8.3?
- 1 подписчик
- 02 дек.
- 318 просмотров
3

ответа
PHP

Простой
Ошибка в php, как исправить?
- 1 подписчик
- 29 нояб.
- 290 просмотров
2

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб.
- 443 просмотра
4

ответа
PHP

+1 ещё

Простой
Запрос на создание таблицы в clickhouse Yandex выдает ошибку 400 Bad Request, что не так с моим запросом?
- 1 подписчик
- 13 нояб.
- 266 просмотров
4

ответа
Показать ещё Загружается…

Fullstack-разработчик (PHP, Vue.js)

Qwintry

от 1 200 до 2 000 $

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

TeamLead PHP (Symfony)

AGIMA • Москва

от 210 000 ₽

Так возьмите и проверьте... нагрузка все равно будет чуть падать.. можно правда nice попробовать...

Answer 1 · 2015-11-26 19:35:34

1 млн файлов это уже плохо.
а) вы сильно нагрузите файловую систему, если неправильно распределите их. Например, в один каталог укладывать более 4к файлов убивает производительность
б) Вы исчерпаете все inode и встанет вообще всё.

Храните их в какой-нибудь nosql или в той же любимой бд.

Answer 2 · 2015-11-26 19:04:02

Если выборка строк идет по какому-то критерию из общего списка - то однозначно БД, если это просто свой набор строк для каждой страницы, то можно и из файла дергать (при условии, что для каждой страницы свой файл - это будет быстрее)

Так же, у Вас в теге стоит php, вероятно не лучшее решение, если нужно действительно быстро, посмотрите в сторону чего-либо с асинхронным IO (например node.js или go) это позволит обработке не ждать сохранения данных на диск и получения данных из БД

Answer 3 · 2015-11-26 19:07:29

Если я правильно понял то ситуация следующая:
ты хочешь создать около млн файлов в каждом по 30-50 строк. Если ты будешь в файл пихать из БД запись, то получается нужно млн запросов к БД. Если сразу их вытянуть одно выборкой, то эт тож не вариант.
Бд от такого количества запросов просто ляжет
Лучше это все в файле держать и построково считывать.

Answer 4 · 2015-11-26 19:17:43

Строки абсолютно рандомные. Единственное требования, чтобы в пределах одного файла строки не повторялись. В пределах разных файлов могут повторяться.

База или файл одна/один (не для каждой страницы свой)

------------

udp

В общем, задача сейчас больше свелась к тому, как ускорить процесс генерации.

Понял, что создавать 100500 html файлов на сервере не очень хорошая затея, решил, что лучше помещать все в SQLLite базу. И потом уже генерировать страницу на лету на основе шаблона.

Вообще, цель всего этого - генерация страниц для сайтов. Т.е. каждый сайт будет иметь 250к - 1кк страниц.

Встает вопрос, как ускорить процесс записи в SQLLite базу (для каждого сайта база своя) и не положить сервер, если за раз мы генерим, скажем, 50 сайтов.

Как я предполагаю, поочередно производить запись в лайт-базу для каждого сайта будет очень долго.

Т.е. получается такая схема:
Есть SQL база под управлением MySQL. В ней несколько таблиц. В каждой таблице 1кк-3кк строк.

Необходимо сгенерировать 50 сайтов за раз, в каждом сайте по 250к - 1 кк страниц.

Для каждой страницы идет выборка из нескольких таблиц SQL базы, текст обрабатывается и записывается в SQlLite базу каждого сайта.

Как лучше оптимизировать все это дело, чтобы и скорость была максимально возможной, и в тоже время сервер не падал?

Как лучше делать выборку?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт