Задать вопрос

Megos @Megos

scrapy

Scrapy

Как обратиться к элементу sitemap.xml через Scrapy?

Есть карта сайта:

<url>
<loc>https://www.marketingdive.com/news/mercedes-benz-CES-Web3-marketing-Superplastic/639832/</loc>
 <priority>0.55</priority>
 <news:news>
 <news:title>Mercedes-Benz reimagines iconic nodding dog ornament as virtual character</news:title>
 <news:publication>
 <news:name>Marketing Dive</news:name>
 <news:language>en</news:language>
 </news:publication>
 <news:publication_date>2023-01-06</news:publication_date>
 <news:keywords>Brand Strategy, Social Media, Video, Business</news:keywords>
 </news:news>
 <image:image>
 <image:loc>https://www.marketingdive.com/user_media/diveimage/SUPERPLASTIC_Collab_Image_1.jpg</image:loc>
 </image:image>
</url>

Пытаюсь брать из нее урлы только не старше суток с помощью такого кода:

def sitemap_filter(self, entries):
        for entry in entries:
            last_mod = datetime.strptime(entry['news:publication_date'], '%Y-%m-%d HH:MM:SS')
            days_ago_1 = datetime.today() - timedelta(days=1)
            if last_mod < days_ago_1:
                yield entry

Он работает с другими картами, где дата задана через last mod. Здесь же я почему то не могу получить news:publication_date.

Вопрос задан более двух лет назад
39 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Telegram

+1 ещё

Простой
Можно ли скрапить телеграмм?
- 1 подписчик
- 05 нояб. 2024
- 358 просмотров
1

ответ
Парсинг

+1 ещё

Простой
Как найти источник данных этого сайта?
- 1 подписчик
- более года назад
- 255 просмотров
1

ответ
HTML

+2 ещё

Простой
Как вытянуть значение из парсера на c#?
- 1 подписчик
- более года назад
- 166 просмотров
1

ответ
Scrapy

Средний
Как сделать так чтобы в scrapy, парсились дубликаты ссылок? То есть так чтобы каждая спаршенная ссылка, должна создать уникальный файл. Как?
- 1 подписчик
- более года назад
- 111 просмотров
1

ответ
Python

+1 ещё

Простой
Как в Scrapy сохранить результат в JSON при запуске из скрипта?
- 1 подписчик
- более двух лет назад
- 149 просмотров
1

ответ
Scrapy

Простой
Почему Scrapy не сохраняет результат?
- 1 подписчик
- более двух лет назад
- 53 просмотра
0

ответов
Scrapy

Простой
Как использовать несколько методов в scrapy?
- 1 подписчик
- более двух лет назад
- 90 просмотров
0

ответов
Scrapy

Простой
Почему при парсинге Озона выдает только первые 4 значения?
- 1 подписчик
- более двух лет назад
- 286 просмотров
0

ответов
WordPress

+2 ещё

Простой
Не загружается файл импорта WooCommerce?
- 1 подписчик
- более двух лет назад
- 77 просмотров
0

ответов
Показать ещё Загружается…

Data DS engineer (Sber AI)

Сбер • Москва

Администратор серверов приложений

ИТ-Холдинг Т1 • Воронеж

Сетевой инженер ЦОД

ИТ-Холдинг Т1 • Москва