Почему не сохранилась часть данных в html и json?

Question

None @robocop45

Почему не сохранилась часть данных в html и json?

Парсю сайт, ламоды. надо сохранить в html, а далее json. Я СТАРАЮСЬ СОХРАНИТЬ СРАЗУ 2 СТРАНИЦЫ САЙТА пробовал менять разные значения в поле сайта. Все рано сохраняется не все. Вот сайт,кому интересно https://www.lamoda.ru/c/5972/shoes-muzhkedy/?sitel...

мой код

import json
import requests
from bs4 import BeautifulSoup

headers ={
    "accept": "*/*",
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36" ,
  
}
def get_page(url):
    req = requests.get(url,headers = headers)
    src =req.text
    #print(src) 

    with open("lamoda5.html", "w") as file:
        file.write(src) 

    soup = BeautifulSoup(src,"lxml")

    cards = soup.find_all("a", class_="x-product-card__link x-product-card__hit-area")
    all_categories_dict ={}
   

    for card in cards:
        card_text = card.text
        card_href = "https://www.lamoda.ru/" + card.get('href')
        #print(card_href)
        all_categories_dict[card_text] = card_href
    with open ("resutllamoda1.json", "w") as file:
        json.dump (all_categories_dict, file, indent=4, ensure_ascii=False )

        

        

def main():
    get_page(url="https://www.lamoda.ru/c/5972/shoes-muzhkedy/?sitelink=topmenuM&l=4&brands=1061,1163,4035,2047,1107&is_sale=1&sort=discount")
    
    

if __name__ == "__main__":
    main()

Вопрос задан более трёх лет назад
105 просмотров

Подписаться 1 Простой

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее

Решения вопроса 1

Ваш ответ на вопрос

Вопрос закрыт для ответов и комментариев

Потому что уже есть похожий вопрос.

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 200 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 213 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 73 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 104 просмотра
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 96 просмотров
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 117 просмотров
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 463 просмотра
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 3 подписчика
- 05 мар.
- 986 просмотров
4

ответа
Python

Простой
Как запретить удаление полей класса?
- 1 подписчик
- 27 февр.
- 322 просмотра
1

ответ
Парсинг

Простой
Как спарсить Интернет Магазин?
- 1 подписчик
- 27 февр.
- 371 просмотр
4

ответа
Показать ещё Загружается…

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Python разработчик

DimaTech Ltd • Краснодар

от 140 000 до 140 000 ₽

Junior AI Automation Engineer / AI-инженер (junior)

OPENCITY • Москва

от 50 000 ₽

Answer 1 · 2022-07-26 20:38:57

Начать забавы ради считать такие вопросы что ли? Во-первых, на современных сайтах часть контента подгружается динамически JavaScript'ом, так что парсеры этих данных не видят. Во-вторых, почти все сайты от парсинга защищаются.

Почему не сохранилась часть данных в html и json?

Вопрос закрыт для ответов и комментариев

Минуточку внимания

Войдите на сайт