Прошу прощения, если какие то теги лишние - просто не знаю, как и на чем проще реализовать следующее.
Есть сайт, конкретно webshop, sitemap содержит все имеющиеся страницы, а всего их порядка 5000.
Мне нужно выделить из них только страницы категорий, и только на этих страницах и только в строго определённых и обозначенных css-классами элементах найти все ссылки - a href- не имеющие css-классов, т.е. не имеющие атрибута class и вынести эти ссылки в отдельный список.
У всех страниц категорий body содержит class catalog-category-view.
Искать ссылки нужно в DOM только внутри четырех классов: before-subcat, after-subcat, category-view и add-cat-info
Минимально будет достаточно вывести все такие ссылки в один файл, оптимально - выделить по страниицам и классам, в которых они будут найдены, например:
url страницы - https://mysite/category01
before-subcat:
https://mysite/ссылка
https://mysite/ссылка
after-subcat:
https://mysite/ссылка
https://mysite/ссылка
category-view:
https://mysite/ссылка
https://mysite/ссылка
add-cat-info:
https://mysite/ссылка
https://mysite/ссылка
PS. ИИ предлагает варианты на php и питоне, но что-то не работает ничего
Я же могу только на js по отдельности на каждой странице, как это автоматизировать?