Удаление неиспользуемых файлов на хостинге

Здравствуйте. Мне дали на обслуживание несколько десятков сайтов, за всю историю над которыми работало около 10-15 человек, естественно появилось куча всякого мусора, неиспользуемые html страницы, файлы стилей, картинки и т.п. Искать вручную такие файлы очень долго. Возможно кто-нибудь подскажет как автоматизировать процесс? Заранее благодарен.
  • Вопрос задан
  • 6001 просмотр
Пригласить эксперта
Ответы на вопрос 7
@EvilX
Как вариант найти файлы, к которым не было обращения определённое время. В этом поможет find (я так понимаю, что хостинг на unix?). -exec удалит файлы.
find ./ -used кол-во_дней_тому_назад -exec rm '{}' \;
Ответ написан
butteff
@butteff
Раз в тысячу лет заправляю свитер в носки
Немного ненужного ответа:
Я думаю, что папку tmp ты можешь очистить точно, если хостинг под никсами.
Всякие логи тоже почисть и почту.
Иногда может вполне прилично освободиться места.

А всё остальное всё равно может быть хитро, но задействовано.
Тут уже надо аккуратно.
Как бы автоматизировать этот процесс подсказать уже не могу.
Ответ написан
pietrovich
@pietrovich
Сайты настолько безобразно написаны, там копипаст обычных html страниц. Никаких php и js скриптов, сплошной html и изображения.

копируете на комп. создаете в дримвивере по одному «сайту» на каждый сайт. затем просите дримвивер поискать сиротинушек (Site, Check links sitewide (Ctrl+F8) и в результатах фильтр по orphaned files)

триала для этого вполне достаточно. хоткеи в свежих версиях могут отличаться. я смотрел на старой 8-ке
работает этот метод довольно сносно. если имена файлов нигде не вычисляются динамически то должно сработать идеально.
Ответ написан
Antelle
@Antelle
Если это простой хтмл и я правильно понял задачу — можно положить сайт на апач, выкачать его целиком (например, teleport-ом) — потом напарсить по логам, что загрузилось.
Чего там нет — в топку.
Ответ написан
Можно попытаться поставить бот выкачать этот сайт с соблюдением структуры, бот только по ссылкам ходит. Потом сравнить две папки, всё что на сайте есть, а в локальной копии нет — мусор.
Ответ написан
Комментировать
eternals
@eternals
Методов решения вашей задачи в общем случае не существует. Вероятность удалить целевой контент стремится к 100%. Никакой телепорт не поможет найти разделы, на которые не ведут ссылки с других страниц, но на которые есть ссылки снаружи.
С другой стороны — сайты можно выкачать на свой комп, потом почистить (тем же методом телепорта), а если что нужное из копии восстановить.

Но наиболее грамотным является наращивание диска, т.к. сейчас это не проблемно.
Ответ написан
Комментировать
spelesto
@spelesto
Битрикс, Wordpress, веб-разработка
Кстати, можно еще проверить сайт программой Xenu's Link Sleuth (home.snafu.de/tilman/xenulink.html). Проверить, что запрашивается. Потом можно пропарсить и выявить неиспользуемые файлы.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы