Чем собрать SEO-информацию о сайте: URL, TITLE, DESCRIPTION, STATUS, H1?

Question

Леонид @easycode

не боюсь задавать глупые вопросы ))

Чем собрать SEO-информацию о сайте: URL, TITLE, DESCRIPTION, STATUS, H1?

Сеошник попросил найти инструмент с помощью которого можно было пройтись по всем страницам определенного сайта и собрать о каждой из них такую информацию: URL, TITLE, DESCRIPTION, STATUS/CODE, H1.

Говорит ранее использовал: Screaming Frog, но в этот раз он почему-то не находит более 60% страниц на сайте.

Посоветуйте аналоги для такой задачи?

Вопрос задан более трёх лет назад
83 просмотра

5 комментариев

Подписаться 1 Средний 5 комментариев

Ivan Yakushenko @kshnkvn

Вряд-ли найдёте такое ПО.
Screeming Frog может не работать в случае с теми сайтами, где информация подгружается JS'ом.
Что-бы получить гарантированный результат нужно использовать Selenium + любой язык программирования, который знаете. Если не знаете - закажите на фрилансе, не думаю что это будет стоить слишком дорого.
В принципе если подумать, то можно миксануть Selenium + обычные запросы. Типа для тех страниц где информация догружается с JS запускать Selenium и пускай собирает, там где информация сразу отдаётся - обычные запросы, что-бы быстро получить результат.

Написано более трёх лет назад
Леонид @easycode Автор вопроса

Ivan Yakushenko, спасибо за ответ. Значит начну с ковыряния в настройках: Screeming Frog, мой сеошник заверил что JS-ом на сайте ничего не подгружается...

Написано более трёх лет назад
Ivan Yakushenko @kshnkvn

Леонид, обычно все подобные скрипты работают следующим образом: заходит на страницу, собирают с неё все ссылки домен которых соответствует исходному сайту и начинают их бороздить, с каждой собирая новые ссылки.
Если где-то хоть одна ссылка, или кнопка пагинации страницы работает на JS, или подгружается с JS, чего СЕО-шник вполне мог и не заметить, то работа всего принципа сбора ссылок полностью ломается.

Написано более трёх лет назад
Леонид @easycode Автор вопроса

Ivan Yakushenko, абсолютно Вас понимаю, спасибо! Я пробежался по страницам сайта: посмотрел в код - все нужным сеошнику ссылки вполне себе стандратные (href="URL").

Написано более трёх лет назад
Леонид @easycode Автор вопроса

кто ищет тот находит:
beamusup.com
https://wildshark.co.uk/spider-tool/

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Парсинг

Средний
Вся сложность парсинга Авито. Как это сделать правильно?
- 1 подписчик
- 26 нояб.
- 179 просмотров
1

ответ
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Какую нейронку с API (чтоб оплата принималась в рублях) выбрать?
- 3 подписчика
- 22 нояб.
- 347 просмотров
3

ответа
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Как убрать артефакты на скриншотах в ShareX?
- 1 подписчик
- 21 нояб.
- 63 просмотра
1

ответ
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 2 подписчика
- 20 нояб.
- 413 просмотров
2

ответа
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Как проверить битые ссылки на YouTube канале?
- 1 подписчик
- 19 нояб.
- 109 просмотров
1

ответ
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 365 просмотров
2

ответа
Железо

+1 ещё

Простой
Как установить NZXT cam?
- 1 подписчик
- 12 нояб.
- 267 просмотров
1

ответ
Windows

+1 ещё

Простой
Какой «крутой» таймер есть в Windows?
- 2 подписчика
- 02 нояб.
- 555 просмотров
4

ответа
Программное обеспечение и интернет-сервисы

+1 ещё

Простой
Как найти прямую ссылку на TV канал?
- 2 подписчика
- 31 окт.
- 362 просмотра
4

ответа
Программное обеспечение и интернет-сервисы

Простой
Ошибка 403 при попытке логина на Codecov. Почему?
- 1 подписчик
- 22 окт.
- 84 просмотра
1

ответ
Показать ещё Загружается…

UI/UX Designer (приложение для поиска подруг)

SUMMEET

от 1 000 до 1 200 $

React Native разработчик в VSRAP

VSRAP Shop • Санкт-Петербург

от 150 000 до 220 000 ₽

Системный аналитик

Bitbanker.ru

от 240 000 ₽

Вряд-ли найдёте такое ПО.
Screeming Frog может не работать в случае с теми сайтами, где информация подгружается JS'ом.
Что-бы получить гарантированный результат нужно использовать Selenium + любой язык программирования, который знаете. Если не знаете - закажите на фрилансе, не думаю что это будет стоить слишком дорого.
В принципе если подумать, то можно миксануть Selenium + обычные запросы. Типа для тех страниц где информация догружается с JS запускать Selenium и пускай собирает, там где информация сразу отдаётся - обычные запросы, что-бы быстро получить результат.
Ivan Yakushenko, спасибо за ответ. Значит начну с ковыряния в настройках: Screeming Frog, мой сеошник заверил что JS-ом на сайте ничего не подгружается...
Леонид, обычно все подобные скрипты работают следующим образом: заходит на страницу, собирают с неё все ссылки домен которых соответствует исходному сайту и начинают их бороздить, с каждой собирая новые ссылки.
Если где-то хоть одна ссылка, или кнопка пагинации страницы работает на JS, или подгружается с JS, чего СЕО-шник вполне мог и не заметить, то работа всего принципа сбора ссылок полностью ломается.
Ivan Yakushenko, абсолютно Вас понимаю, спасибо! Я пробежался по страницам сайта: посмотрел в код - все нужным сеошнику ссылки вполне себе стандратные (href="URL").
кто ищет тот находит:
beamusup.com
https://wildshark.co.uk/spider-tool/

Answer 1 · 2020-10-19 19:57:51

Алексей Немиров @Sedov1988

Муж и отец красивой дочки.

SiteAnalizer попробуйте им.

Ответ написан более трёх лет назад

Комментировать

Чем собрать SEO-информацию о сайте: URL, TITLE, DESCRIPTION, STATUS, H1?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт