Растет память при чтении большого json?

Question

Messi @FitTech

PHP
JSON

Растет память при чтении большого json?

Здравствуйте! Ранее писал вопрос про чтение большого файла JSON. Посоветовали использовать json stream parser, потому что сначала использовал из-за отсутствия знаний json_decode:).

При использовании парсера нагрузка упала, но что заметил, при выполнении кода, по чуть-чуть нагрузка на память всё равно растет(по 0.1%) началась задача с 2%, а дошло до 8.

Ниже приведу код который обрабатывает большой файл(всё внес в один метод для быстрого чтения тут).

Для json использовал это: https://github.com/skolodyazhnyy/json-stream

private function prepareAndSave($json, DocumentManager $documentManager)
    {
        $data = [];

        $iteration = 0;

        $savedNumber = 0;

        $fh = fopen($json, "r");

        while (!feof($fh)){
            try {
                $reader = new Reader($fh);

                $reader->enter('items', Reader::TYPE_OBJECT);

                $object = $reader->read();

                $data[] = [
                    'some_id' => $object['some_id'],
                    'some_data' => $object['some_data'],
                    'images' => isset($object['images']) ? $object['images'] : [],
                ];
            } catch (\Exception $exception) {
                continue;
            }

            $iteration++;
            // Batch_size = 2000
            if (count($data) >= self::BATCH_SIZE) {
                try {
                    $documentManager->getDocumentCollection(MyDocument::class)->batchInsert($data);
                    $iteration = 0;
                    $data = [];
                } catch (\Exception $exception) {
                    echo "Exception in saving to Mongo \r";
                    continue;
                }

                echo "Number of saved data: $savedNumber \r";
            }

            $reader->leave();
        }

        if (!empty($data)) {
            try {
                $documentManager->getDocumentCollection(MyDocument::class)->batchInsert($data);
            } catch (\Exception $exception) {
                echo "Exception in saving to Mongo at the end. \r";}
        }

        fclose($fh);
    }

С помощью профилирования определил что:

больше всего памяти берут вот эти два момента:
Ссылка на клас Tokenizer:
Метод readSymbol() берет больше всего (30 гб), потом readKeyToken() (8гб), а потом readValue() ( 4гб)
Это в отчете Memory Hogs

Вопрос задан более трёх лет назад
311 просмотров

5 комментариев

Подписаться 2 Простой 5 комментариев

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Fullstack веб-разработчик на JavaScript и PHP

20 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

3 комментария

Messi @FitTech Автор вопроса

Спасибо, не знал про него :) Сейчас пробую.

Написано более трёх лет назад
Nujabes37 @Nujabes37

Messi, Еще совет. Была похожая задача и у меня также была утечка памяти. И поэтому работу с файлом я вынес в отдельный цикл. Сейчас объясню как выглядел цикл.
1. Открыть файл
2. jsone_decode строки
3. Запись полученного массива в переменную
4. Закрытие файла
А дальше я использовал эту переменную для логики.
Можешь попробовать

Написано более трёх лет назад
Messi @FitTech Автор вопроса

Nujabes37, обновил вопрос.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+1 ещё

Простой
Как оптимально подтягивать og:img для списка статей с разных сайтов?
- 1 подписчик
- вчера
- 75 просмотров
0

ответов
PHP

+2 ещё

Простой
Как реализовать зеркало сайт Тильда?
- 1 подписчик
- 22 окт.
- 238 просмотров
0

ответов
PHP

+1 ещё

Простой
Почему перестала работать ЮКасса?
- 1 подписчик
- 19 окт.
- 301 просмотр
1

ответ
PHP

Простой
Как вычислить результат математических операций в строке?
- 1 подписчик
- 17 окт.
- 272 просмотра
3

ответа
PHP

Простой
Можно ли в PHP вкладывать однострочные комментарии // в многострочные /* */?
- 1 подписчик
- 16 окт.
- 261 просмотр
4

ответа
PHP

+1 ещё

Простой
Перестал работать php запрос к телеграмм?
- 1 подписчик
- 15 окт.
- 257 просмотров
1

ответ
PHP

+2 ещё

Простой
Как проще отправить изображение на стену канала?
- 1 подписчик
- 15 окт.
- 169 просмотров
1

ответ
PHP

Простой
Как точно работает скрипт на RoadRunner?
- 1 подписчик
- 13 окт.
- 230 просмотров
1

ответ
PHP

+1 ещё

Простой
Стоит ли использовать файловый сервер в проекте?
- 2 подписчика
- 13 окт.
- 275 просмотров
3

ответа
PHP

+1 ещё

Средний
Почему некорректно работает регулярное выражение в PHP?
- 1 подписчик
- 06 окт.
- 279 просмотров
3

ответа
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 180 000 до 250 000 ₽

PHP-разработчик (Symfony)

Мегаплан

от 160 000 ₽

Разработчик PHP/Go

ЭТП ГПБ / VESNA

До 220 000 ₽

Покажите код класса Reader и DocumentManager
Максим Федоров, https://github.com/skolodyazhnyy/json-stream/blob/...

DocumentManager от doctrine orm Mongodb
Messi, а почему такие жирные детали упустили в описании :) Надо смотреть, где течёт или доктрина или ридер
Максим Федоров, обновил вопрос, дело не в доктрине :)

Answer 1 · 2019-09-18 10:51:21

Nujabes37 @Nujabes37

:DEATH

Ты можешь подключить профилировкщик и посмотреть, что именно так нагружает систему) Советую xhprof.

Ответ написан более трёх лет назад

3 комментария

Растет память при чтении большого json?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт