Насколько быстры cms на файлах при большом количестве файлов?

Question

Ivan Petrov @bitande

PHP

PHP

Насколько быстры cms на файлах при большом количестве файлов?

Хочу сделать простую cms на json файлах. Каждый json файл это как бы отдельная запись в бд.

Насколько быстро php работает с файлами? Допустим у меня будет 10 000 или 100 000 файлов, и при выводе одной записи мне нужно будет найти один файл среди этих ста тысяч.

Насколько медленно / быстро это будет по сравнению с mysql?

Вопрос задан более трёх лет назад
307 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Веб-разработчик на PHP

9 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Stepik

Язык программирования PHP

1 неделя

Далее

Пригласить эксперта

Ответы на вопрос 3

5 комментариев

xmoonlight @xmoonlight

Почему глупо? Поясни.

Написано более трёх лет назад
SagePtr @SagePtr

xmoonlight, как минимум, отсуствие индексирования

Написано более трёх лет назад
xmoonlight @xmoonlight

SagePtr, а где про это написано, что не будет или будет индексирование?

Написано более трёх лет назад
SagePtr @SagePtr

xmoonlight, вначале вопроса)
"Хочу сделать простую cms"
Велосипедить индексы на JSON-файлах - ну такое себе в плане простоты

Написано более трёх лет назад
xmoonlight @xmoonlight

SagePtr, у меня есть база в текстовике 300к записей. По ней выборка с нужным ID-шником происходит со скоростью прямого чтения одной строки из файла. Т.к. указатель чтения сразу знает куда перемещаться.

Написано более трёх лет назад

Комментировать

7 комментариев

Sanes @Sanes

MySQL всё же проще кешировать, нежели файлы.

Написано более трёх лет назад
xmoonlight @xmoonlight

Sanes, зачем кешировать то, что не меняется?

Написано более трёх лет назад
Sanes @Sanes

xmoonlight, прочитать из ОЗУ быстрее, чем с диска.

Написано более трёх лет назад
xmoonlight @xmoonlight

Sanes, а какая разница при чтении из ОЗУ при работе с файлами или mysql?
Можно вообще смонтировать файловую структуру в ОЗУ при старте веб-сервера.
Что сложного-то здесь?

Написано более трёх лет назад
Кирилл Несмеянов @SerafimArts

Sanes, а что если я скажу, что у MySQL есть драйвер таблиц, который хранит всё в памяти? Он так и называется, MEMORY =)

Кеширование на редисе/тарантуле нужно лишь для выборки нормализованных данных. Т.е. где с десяток всяких джоинов нужно со сложными запросами. А если же данных просто очень много, то обычно переходят на Elastic/Clickhouse/Hadoop в зависимости от задач. Из практики: Для примера, обычная выборка из MySQL по PK с одним GROUP BY на ~5-6 миллионов записей в кластере из 2х машин занимала ~17 секунд. Данные о посещаемости нескольких сайтов за один-два года. После переноса оных в ClickHouse скорость возросла до ~0.5 (одна машина), а повторный запрос уже ~0.1 (походу прогрев кеша). Так что стату можно было уже строить "на горячую", без промежуточной денормализации.

Написано более трёх лет назад
Sanes @Sanes

Кирилл Несмеянов, к хранению в файлах как это относится?

Написано более трёх лет назад
Кирилл Несмеянов @SerafimArts

Sanes, это просто оффтоп на тему "кеширование не нужно". А к хранению всего в файлах относится непосредственно мой ответ к статье.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Простой
Как декодировать/закодировать спец символы в get запросе?
- 1 подписчик
- 2 часа назад
- 41 просмотр
1

ответ
PHP

Простой
Как вызвать curl и не ждать ответ?
- 1 подписчик
- 16 дек.
- 272 просмотра
2

ответа
PHP

Простой
Как сделать это?
- 1 подписчик
- 11 дек.
- 279 просмотров
2

ответа
PHP

+1 ещё

Простой
Как найти значение в XML?
- 2 подписчика
- 06 дек.
- 240 просмотров
1

ответ
PHP

+1 ещё

Простой
Как на PHP пушнуть в ассоциативный массив?
- 1 подписчик
- 05 дек.
- 225 просмотров
1

ответ
PHP

Простой
Проблема с PDO LIKE?
- 1 подписчик
- 04 дек.
- 175 просмотров
0

ответов
PHP

Простой
При попытке регистрации на сайте выдаёт ошибку A PHP Error was encountered. Что делать?
- 1 подписчик
- 03 дек.
- 154 просмотра
2

ответа
PHP

Простой
Как исправить include в php 8.3?
- 1 подписчик
- 02 дек.
- 321 просмотр
3

ответа
PHP

Простой
Ошибка в php, как исправить?
- 1 подписчик
- 29 нояб.
- 292 просмотра
2

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб.
- 446 просмотров
4

ответа
Показать ещё Загружается…

Fullstack-разработчик (PHP, Vue.js)

Qwintry

от 1 200 до 2 000 $

Веб-разработчик (PHP) в продукт из сферы FinTech

ITWORK AGENCY • Москва

До 500 000 ₽

TeamLead PHP (Symfony)

AGIMA • Москва

от 210 000 ₽

Answer 1 · 2018-08-18 23:21:27

Sanes @Sanes

При таком кол-ве файлов это будет глупо.

Ответ написан более трёх лет назад

5 комментариев

Answer 2 · 2018-08-19 05:10:16

1) Не забудьте, что все эти 10к файлов НЕ должны лежать в одной и той же директории, т.к. это сказывается на производительности а при превышении N лимита (влом гуглить циферку) всё наеб... поломается, короче. Я бы брал crc32 (самый быстрый алгоритм хеширования) от идентификатора, например "h87dg283" и складывал соответственно в "~/articles/h8/7d/g283.json".
2) При подобном хранилище поиск может быть осуществлён лишь по идентификатору записи. Т.е. что-то вроде "select * from articles where id = ?". Любые дальнейшие улучшения требуют больших накладных ресурсов. А реализация чего-то вроде поиска по записям будет физически невозможна (возможно, кончено, но писать такую шнягу придётся очень долго, а что-то вроде Sphinx к такому не прикрутить).

В остальном не вижу никаких особых проблем.

Answer 3 · 2018-08-18 23:23:09

Всё зависит от реализации структуры хранения и алгоритма поиска в этом хранилище.
Если всё сделать грамотно - это будет однозначно быстрее, чем mysql.
Но, это только разговор про чтение!
Пруф: Dokuwiki - работает без БД, на файловом хранилище.

Если Вам нужна модификация/выборка данных - лучше, всё-таки, использовать БД.

Насколько быстры cms на файлах при большом количестве файлов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт