Есть сайт. Работал себе до сегодняшнего дня вполне сносно. После обеда начал безбожно тупить.
100% CPU, LA > 10.
В логах ничего интересного.
Смотрю strace - и понимаю, что ничего не понимаю.
Уважаемые, будьте благодарны, поделитесь материалами на тему - как и куда, на что смотреть в strace/trace ?
слишком мало информации, сначала у вас нагрузка подскачила и вы сразу в strace полезли (смотреть системные вызовы). Непонятно, между этими штуками явно важный кусок информации пропущен.
Сергей Протько: я просто не знаю куда смотреть еще. С БД все в порядке. Профилирование (xdebug) указало уже на все узкие места, но по логам - к ним никакого отношения. Куда смотреть - я не знаю.
slow_log - практически пуст.
Салават Ситдиков: для начала смотрите на access log, включите логирование медленных запросов..... А strace нужно задействовать когда примерно хотя бы понятно куда копать. Например если медленно работают вообще все запросы, может воркеры падают часто... такое бывает периодически.
Не надо сразу лезть в дебри, strace вам ничего не даст.
Для начала посмотрите:
1) Какой процесс грузит проц (top, htop и тп.)
2) Трафик по логам http сервера отличается ли он от прежнего и от ожидаемого.
3) Трафик на сетевухах, отличается ли он от прежнего и от ожидаемого.
И только потом делайте выводы. Может просто на сайте разместили убер статью которая привлекла 100500 человек
Большое спасибо. 1, 2 - проверялось. 3 - нет.
В общем, посмотрели еще раз код, логи slow-php и вроде как нашли проблему.
Хеши форм генерировались методом crypt.
DuD: да, правда несколько релизов назад был изменен механизм проверки. И с ростом зарегистрированных пользователей - выявилась проблема. Благодарю всех