Посмотрите еще access log, что предшествовало падению, какие запросы. Возможно это натолкнет на какую-нибудь мысль.
Важно еще понимать периодичность возникновения проблемы. Связано это с количество юзеров (соотв. нехваткой ресурса) или с заходом поискового робота или с редким но «метким» вызовом какойто тяжелой функции (по переколбасу кэша, импорту большого объема данных и т.д.)