Как найти узкое место в производительности скрипта?

Question

Mike Evstropov @Aroused

PHP

Как найти узкое место в производительности скрипта?

Здравствуйте.

Есть парсер, который кушает html с чужого сервера (в пределах РФ) и возвращает некоторые данные в формате json. Пока нагрузка была 40к запросов в сутки, все было здорово. Но в данный момент количество запросов значительно увеличилось. И с этого момента, время на выполнение скрипта стало доходить до 10-20 секунд!

Операции:

require библиотеки QueryPHP
запрос на другой сервер с получением 100кб кода html
инициализация класса QueryPHP
извлечение содержимого 8 элементов DOM из ответа
запрос в локальную базу данных PHP::PDO методом SELECT
вывод объекта json.

Пожалуйста помогите понять, что нужно сделать? Есть ли смысл менять тариф у хостера? Хостер говорит, что производительность в первую очередь зависит от скрипта, а не от железа, и более дорогой тариф вряд ли решит мою проблему.

Конфигурация: VPS OpenVZ / Xeon 400MHz / 512mb / RAID HDD

Статистика CloudFlare (сейчас прокси отключен)

Статистика от хостера за 1 час.

Вопрос задан более трёх лет назад
465 просмотров

Комментировать

Подписаться 1 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillfactory

Профессия Fullstack веб-разработчик на JavaScript и PHP

20 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее
Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее

Решения вопроса 3

2 комментария

3 комментария

Mike Evstropov @Aroused Автор вопроса

То есть, если бы там была одна строчка кода, к примеру echo 'hello'; , при 42к запросах в час, сервер бы отвечал так же быстро как и без нагрузки?

Написано более трёх лет назад
Алексей Уколов @alexey-m-ukolov Куратор тега PHP

Конечно, не совсем так же быстро, но всё-таки прежде, чем менять тариф нужно профилировать скрипт и смотреть в чём конкретно дело.

Написано более трёх лет назад
Mike Evstropov @Aroused Автор вопроса

Спасибо за ответы... Так и не могу подружиться с php....

Написано более трёх лет назад

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 2 подписчика
- 14 нояб.
- 278 просмотров
4

ответа
PHP

+1 ещё

Простой
Запрос на создание таблицы в clickhouse Yandex выдает ошибку 400 Bad Request, что не так с моим запросом?
- 1 подписчик
- 13 нояб.
- 209 просмотров
4

ответа
PHP

+2 ещё

Простой
Создание элемента с необычной формой и прозрачным фоном и рамкой?
- 1 подписчик
- 03 нояб.
- 185 просмотров
0

ответов
PHP

+3 ещё

Средний
Apache 2.4 и php 8.4 под windows. Почему не загружаются модули curl, openssl?
- 2 подписчика
- 01 нояб.
- 305 просмотров
3

ответа
PHP

Простой
Как объединить в один код 2 строчки $array[$key]?
- 2 подписчика
- 31 окт.
- 281 просмотр
2

ответа
PHP

+1 ещё

Простой
Как оптимально подтягивать og:img для списка статей с разных сайтов?
- 1 подписчик
- 27 окт.
- 149 просмотров
1

ответ
PHP

+2 ещё

Простой
Как реализовать зеркало сайт Тильда?
- 1 подписчик
- 22 окт.
- 321 просмотр
0

ответов
PHP

+1 ещё

Простой
Почему перестала работать ЮКасса?
- 1 подписчик
- 19 окт.
- 374 просмотра
1

ответ
PHP

Простой
Как вычислить результат математических операций в строке?
- 1 подписчик
- 17 окт.
- 302 просмотра
3

ответа
PHP

Простой
Можно ли в PHP вкладывать однострочные комментарии // в многострочные /* */?
- 1 подписчик
- 16 окт.
- 291 просмотр
4

ответа
Показать ещё Загружается…

PHP-разработчик

FoodSoul • Калининград

от 180 000 до 250 000 ₽

PHP- разработчик (Symfony)

IT-Spirit • Москва

от 230 000 до 320 000 ₽

Backend PHP developer

Office-Expert.kz

от 200 000 до 290 000 ₽

Answer 1 · 2016-03-02 17:11:07

https://blackfire.io/ - для профилирования кода.

В целом первым делом надо думать над кешированием результатов парсинга, если это возможно, а не лазать каждый раз на удаленный сервер и т.д. Подозреваю что у вас именно так, и это и сжирает 99% времени.

Answer 2 · 2016-03-02 17:10:21

Правильно вам хостер говорит, скорее всего, проблема именно в скрипте.
Ну а поскольку скрипт вы не привели, обсуждать больше нечего.
Хотя нет, можно ответить на заглавный вопрос - используйте xhprof.

Может быть, стоит заменить QueryPHP на регулярные выражения или стандартный DOMDocument. Но это несёт свои ограничения, как правило, парсить html регулярками - плохая идея.

Answer 3 · 2016-03-02 22:07:10

Раз пошла такая пьянка (не удаётся кэшировать обращения к чужому серверу), то вот возможные варианты:

1. По возможности кэшировать select из Вашей базы в memcache или куда-то ещё, чтобы каждый раз не подключаться к БД (есть не очень большая, но вероятность, что поможет);
2. Перенести скачивание и парсинг страниц стороннего сайта (а, может, и select к базе заодно) на другие виртуальные машины (может, даже в другом дата-центре, чтобы не забивать канал), балансируя нагрузку между ними (например, по результату выполнения функции mt_rand обращаться то к одной машине, то к другой, то к третьей - количество подобрать экспериментально).

Важно учесть то, что владельцам стороннего сайта большой трафик с нескольких ip может и не понравиться.

Как найти узкое место в производительности скрипта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт